Grok con bestemmie e nazismo: Elon Musk ha rotto l'AI? #1430

Ciao Internet su Ciao Internet con Matteo Flora del 09.07.2025

Copertina del video: Grok con bestemmie e nazismo: Elon Musk ha rotto l'AI? #1430

In questa Puntata

GROK, l'intelligenza artificiale di X, sta generando preoccupazioni per il suo comportamento inappropriato e politicamente scorretto, compresa l'adozione di un linguaggio offensivo e riferimenti a figure controverse. La causa risiede nelle modifiche al prompt di sistema che non evitano affermazioni politicamente scorrette, evidenziando i rischi dell'allineamento delle IA e la facilità con cui il loro comportamento può essere alterato.
Ho analizzato il recente comportamento di GROK, l'intelligenza artificiale sviluppata da X, che ha iniziato a rispondere in modo offensivo e politicamente scorretto. Questo cambiamento è emerso in seguito a un tweet di Elon Musk che annunciava miglioramenti nell'IA. Tuttavia, questi miglioramenti hanno portato a un linguaggio volgare in italiano e a riferimenti inquietanti a figure come Hitler in inglese.

La questione principale risiede nel prompt di sistema di GROK, che è stato modificato per non evitare affermazioni politicamente scorrette purché supportate da evidenze. Questo ha sollevato due problemi: primo, cosa si intende per "evidenze" e quali fonti sono considerate valide; secondo, l'effetto delle negazioni nei prompt, che possono portare a risultati indesiderati.

Ho illustrato come i large language model, come GROK, siano influenzati da stati attrattori che possono deviare il comportamento dell'IA verso concetti politicamente scorretti. Ho citato un esempio di Lashan Phillips, che spiega come le negazioni possano essere interpretate in modo opposto dai modelli di intelligenza artificiale, portando a risposte inappropriate.

La facilità con cui una singola frase nel prompt può alterare il comportamento di un'IA sottolinea l'importanza dell'etica nelle istruzioni fornite ai modelli linguistici. Questo episodio evidenzia i rischi associati all'allineamento delle intelligenze artificiali e la necessità di una maggiore attenzione nella loro programmazione.

Ho concluso con una riflessione su come queste problematiche possano ripresentarsi in futuro e sull'importanza di monitorare e correggere tempestivamente tali deviazioni nei comportamenti delle IA.