OpenAI ha "rubato" un milione di ore a Youtube: aveva "fame" di dati...
10.05.2024
In questa puntata di "Ciao Internet", esploro le ragioni dietro lo sviluppo di Whisper da parte di OpenAI, un avanzato software open source per la trascrizione da voce a testo. Analizzo le implicazioni di questa tecnologia nel contesto della crescente scarsità di dati testuali per l'addestramento dei modelli di intelligenza artificiale, e come Whisper possa essere stato utilizzato per raccogliere dati da piattaforme come YouTube. La discussione si sviluppa attorno alle motivazioni aziendali di OpenAI e alle sfide etiche e culturali legate alla raccolta e all'utilizzo di dati online.