Arriva Gemini, la nuova intelligenza artificiale di Google

Intelligenza artificiale Gemini
Foto di Gerd Altmann da Pixabay

Google ha presentato un nuovo modello di intelligenza artificiale che, a suo dire, supera ChatGPT nella maggior parte dei test e mostra il “ragionamento avanzato” in più formati, inclusa la possibilità di visualizzare e correggere informazioni della vita quotidiana, come ad esempio i compiti di fisica di uno studente. Il modello, chiamato Gemini, è il primo ad essere annunciato durante il vertice globale sulla sicurezza dell’intelligenza artificiale del mese scorso, in cui le aziende tecnologiche hanno concordato di collaborare con i governi per testare sistemi avanzati prima e dopo il loro rilascio. Google ha detto che è in trattative con il neonato AI Safety Institute del Regno Unito per testare la versione più potente di Gemini, che sarà rilasciata il prossimo anno.

Google ha affermato che la versione Ultra ha sovraperformato tutti i modelli di intelligenza artificiale “all’avanguardia”, incluso il modello più potente di ChatGPT, GPT-4, in 30 test di benchmark su 32, anche nel ragionamento e nella comprensione delle immagini. Il modello Pro ha superato GPT-3.5, la tecnologia alla base della versione ad accesso gratuito di ChatGPT, in sei test su otto. Il modello è disponibile in tre versioni ed è “multimodale”, ovvero può comprendere contemporaneamente testo, audio, immagini, video e codice informatico. Gemini, che sarà integrato nei prodotti Google compreso il suo motore di ricerca, verrà rilasciato inizialmente in più di 170 paesi nei prossimi giorni sotto forma di aggiornamento del chatbot di Google, Bard. Tuttavia, l’aggiornamento Bard non verrà rilasciato nel Regno Unito e in Europa poiché Google richiede l’autorizzazione alle autorità di regolamentazione. Demis Hassabis, amministratore delegato di DeepMind, l’unità Google con sede a Londra che ha sviluppato Gemini, ha dichiarato: “È stato il progetto più complicato su cui abbiamo mai lavorato, direi l’impresa più grande. È stato uno sforzo enorme”.

Nei prossimi giorni, quindi, verranno rilasciate due versioni più piccole di Gemini, Pro e Nano. È possibile accedere al modello Pro tramite il chatbot Bard di Google e la versione Nano sarà disponibile sui telefoni cellulari che utilizzano il sistema Android di Google.
L’iterazione più potente, Ultra, è in fase di test esterno e non sarà rilasciata pubblicamente fino all’inizio del 2024, quando sarà integrata anche in una versione di Bard chiamata Bard Advanced. Google ha affermato che Ultra è stato il primo modello di intelligenza artificiale a superare gli esperti umani, con un punteggio del 90%, in un test multitasking chiamato MMLU, che copre 57 materie tra cui matematica, fisica, diritto, medicina ed etica. Ultra ora alimenterà un nuovo strumento di scrittura di codici chiamato AlphaCode2, che secondo Google potrebbe superare l’85% dei programmatori di computer umani a livello di concorrenza. Hassabis ha affermato che il modello Ultra sarà sottoposto a test esterni della “squadra rossa” – in cui gli esperti testano la sicurezza e l’incolumità di un prodotto – e Google condividerà i risultati con il governo degli Stati Uniti, in linea con un ordine esecutivo emesso da Joe Biden in ottobre.

Alla domanda se Gemini fosse stato testato in collaborazione con il governo degli Stati Uniti o del Regno Unito, come stabilito al vertice sulla sicurezza dell’intelligenza artificiale a Bletchley Park, Hassabis ha detto che Google è in trattative con il governo del Regno Unito sull’AI Safety Institute che effettua test sul modello:“Stiamo discutendo con loro come vogliamo che lo facciano”, ha detto. Non faranno parte dei test i modelli Pro e Nano, che riguardano invece i modelli più avanzati, o “di frontiera”. Sissie Hsiao, direttore generale di Bard presso Google, ha affermato che la versione Pro di Bard non sarà ancora rilasciata nel Regno Unito. Inoltre, non verrà rilasciato nello Spazio economico europeo, che comprende l’UE e la Svizzera. Ha detto: “Stiamo lavorando con le autorità di regolamentazione locali”. Google non ha specificato le questioni normative alla base dei ritardi nel Regno Unito e nell’UE. Tuttavia, Google ha indicato che le “allucinazioni”, o false risposte, sono ancora un problema con il modello. “Direi che è ancora un problema di ricerca irrisolto”, ha affermato Eli Collins, responsabile del prodotto presso Google DeepMind.

Sebbene tutte le versioni Gemini siano multimodali in termini di istruzioni che possono comprendere, le iterazioni Pro e Nano rilasciate pubblicamente questo mese possono attualmente rispondere solo in formato testo o codice. Google ha rilasciato video promozionali sulle capacità di Gemini, che mostrano il modello Ultra che comprende le risposte scritte a mano dei compiti di fisica di uno studente e fornisce suggerimenti dettagliati su come risolvere le domande, inclusa la visualizzazione delle equazioni. Altri video mostrano la versione Pro di Gemini che analizza e identifica il disegno di un’anatra e risponde correttamente a quale film una persona sta recitando in un video su smartphone – in questo caso, una versione amatoriale della famosa scena del “bullet time” in The Matrix. Collins ha affermato che la modalità più potente di Gemini ha mostrato un “ragionamento avanzato” e potrebbe mostrare “nuove capacità” – la capacità di eseguire compiti non mostrati prima dai modelli di intelligenza artificiale.

Le preoccupazioni sull’intelligenza artificiale vanno dalla disinformazione prodotta in serie alla creazione di sistemi “superintelligenti” che sfuggono al controllo umano. Alcuni esperti sono preoccupati per lo sviluppo dell’intelligenza artificiale generale, che si riferisce a un’intelligenza artificiale in grado di eseguire una serie di compiti a un livello di intelligenza umano o superiore. Alla domanda se Gemini rappresentasse un passo importante verso l’AGI (una nuova specie di intelligenza artificiale in grado di imparare, comprendere e spiegare), Hassabis ha dichiarato: “Penso che questi modelli fondazionali multimodali saranno una componente chiave dell’AGI, qualunque sia il sistema finale. Ma ci sono ancora cose che mancano, su cui stiamo ancora ricercando e innovando”.