Gemini ci ha presi in giro: i benchmark e il video sono...

Ciao Internet su Ciao Internet con Matteo Flora del 08.12.2023

Copertina del video: Gemini ci ha presi in giro: i benchmark e il video sono... #1196

I contenuti dell'Episodio #1196

In questa puntata di Ciao Internet, mi addentro nella presentazione di Gemini, il nuovo modello di linguaggio sviluppato da Google, e svelo alcune verità scomode. Nonostante l'entusiasmo iniziale per il potenziale di Gemini, ho scoperto che gran parte delle affermazioni fatte nei comunicati stampa e nei video promozionali sono, nel migliore dei casi, ingannevoli. Analizzo come Google abbia manipolato i dati e i confronti con altri modelli di intelligenza artificiale per presentare Gemini in una luce più favorevole di quanto meriti realmente. È un episodio che invita a riflettere sull'etica della comunicazione e sull'integrità aziendale nel settore tecnologico.
Ciao Internet, sono Matteo Flora, e oggi parliamo di Gemini, il nuovo large language model di Google che è stato presentato con grande clamore. Dopo aver passato un'ora a esaminare la documentazione e i materiali promozionali, mi sono accorto che c'è qualcosa che non va. Google ha esagerato, e non poco, nel presentare Gemini come una rivoluzione nel campo dei modelli di linguaggio. Molto di ciò che è stato detto è, per essere gentili, pubblicità ingannevole. Ma andiamo con ordine.

Gemini è stato annunciato come il rivale di GPT-4 di OpenAI, con Google che afferma di aver ottenuto risultati eccezionali in vari test di benchmark. Tuttavia, la realtà è ben diversa. Ci sono tre versioni di Gemini: Pro, Ultra, e una base. La versione Ultra, che viene presentata come superiore, non è ancora disponibile, e quindi non possiamo verificarne le prestazioni. Inoltre, queste versioni sono state confrontate con versioni di GPT-4 non aggiornate, creando un confronto iniquo.

Un esempio lampante riguarda i test MMLU, dove Gemini Ultra avrebbe superato GPT-4. Tuttavia, il test per Gemini usava 32 passaggi di "Chain of Thoughts", contro i 5 utilizzati per GPT-4. È come confrontare un bambino che ha ricevuto un'ora di lezione con uno che ha solo cinque minuti di spiegazione. Questo non è un confronto equo, ed è un chiaro tentativo di manipolare i risultati a favore di Gemini.

Ma non è tutto. Il video di presentazione di Gemini è, per dirla tutta, una messinscena. Le interazioni che vediamo non sono reali, ma sono state costruite utilizzando immagini e spiegazioni pre-registrate. Questo non solo inganna gli spettatori, ma è anche un esempio di come non si dovrebbe fare comunicazione tecnologica.

Google si trova chiaramente in difficoltà nel tenere il passo con OpenAI, ma questo non giustifica l'uso di tattiche ingannevoli per promuovere un prodotto non ancora all'altezza. Il problema non è tanto la tecnologia in sé, quanto l'approccio disonesto nella comunicazione dei suoi risultati.

In conclusione, è essenziale che le aziende siano trasparenti e oneste, specialmente in un campo così delicato come quello dell'intelligenza artificiale. Prendere in giro gli utenti finali, i giornalisti e gli investitori non è il modo giusto per avanzare nel settore. È fondamentale mantenere un livello di integrità che sembra, in questo caso, essere stato messo da parte.