Google sta per lanciare Gemini Diffusion


Antonio Guadagno presenta una novità di casa Google capace di scuotere il mondo tecnologico e di agire in modo eccentrico rispetto alla concorrenza. Questo nuovo modo di operare risulta utile a scopi concreti: riduce gli sbagli, offre risposte più coerenti e vola a una velocità cinque volte superiore ai modelli classici.

Il trenino delle parole con il freno rotto

ChatGPT e i suoi colleghi vengono paragonati a un trenino autoregressivo che monta i vagoni rigorosamente da sinistra a destra: parola dopo parola, riga dopo riga. Questo sistema nasconde una trappola evidente: ogni nuova parola subisce l’influenza di quelle precedenti. Ne deriva un vero effetto valanga sul testo: se l’AI commette un errore logico iniziale, costruisce frasi sbagliate sulle fondamenta di quel primo scivolone. I modelli tradizionali, infatti, non possono tornare sui propri passi e devono procedere solo in avanti, senza mai correggere il tiro.

Incastri magici per scrittori veloci

Il funzionamento della diffusione viene descritto come un puzzle colorato: i pezzi finiscono sul tavolo alla rinfusa e trovano il loro posto poco alla volta. Il punto di partenza diventa irrilevante: il software può sistemare prima l’angolo in alto o quello in basso, in totale libertà. Gemini Diffusion crea inizialmente una bozza veloce e poi la perfeziona saltando qua e là dove serve. Questa flessibilità risulta particolarmente efficace: se l’AI inserisce un nome errato all’inizio della storia, il modello elimina lo sbaglio e ripristina l’informazione corretta senza compromettere il resto del racconto. La stessa tecnica consente di scrivere più capitoli contemporaneamente e rende l’intera operazione rapida come una saetta.

Dalla carrozza alla supercar dell’informazione

Per superare lo stallo dei software attuali serve un cambio di paradigma, paragonabile al passaggio dal cavallo all’automobile. Per triplicare la velocità occorre un motore nuovo, e la diffusione rappresenta proprio questa rivoluzione. 

Chi è curioso può iscriversi alla lista d’attesa di Google per testare Gemini Diffusion; in alternativa è disponibile Mercury, un modello a diffusione altrettanto valido e utilizzabile da subito con un account gratuito. 

Il video si chiude con una curiosa ironia: mentre il testo scopre la diffusione, il mondo delle immagini percorre la strada opposta, tornando verso l’autoregressione.