Whisper, il software open source di OpenAI, emerge come uno dei più avanzati sistemi di traduzione speech-to-text disponibili oggi. La sua capacità di trasformare il parlato in testo con precisione sorprendente solleva interrogativi sul perché sia stato sviluppato. La risposta potrebbe essere meno altruistica di quanto sembri: l'obiettivo sarebbe stato trascrivere enormi quantità di contenuti video da piattaforme come YouTube, per alimentare i modelli di intelligenza artificiale che necessitano di dati sempre nuovi per migliorare.
Il CEO di YouTube ha accusato OpenAI di aver trascritto almeno un milione di ore di video, una mossa che svela la crescente scarsità di dati scritti disponibili online. Con l'evoluzione della cultura digitale verso contenuti prevalentemente audiovisivi, la necessità di convertire questi in testi diventa cruciale per lo sviluppo di modelli di linguaggio avanzati. Whisper, dunque, si presenta non solo come uno strumento di utilità pubblica, ma anche come una soluzione strategica per superare il limite della "benzina" dati indispensabile per il progresso dell'intelligenza artificiale.
La messa a disposizione di Whisper come open source suggerisce che il vero valore per OpenAI non risiede nel software stesso, ma nella capacità di raccogliere e trasformare dati per migliorare i propri modelli. Questa strategia solleva questioni etiche e legali riguardo al diritto d'autore e alla proprietà dei contenuti, ponendo nuove sfide nel panorama della tecnologia e della privacy.
In questa Puntata
Whisper di OpenAI: un sistema per trascrivere video di YouTube o un mezzo per alimentare l'intelligenza artificiale?