OpenAI cerca di tenersi buoni i giornali
La società famosa per i suoi servizi di intelligenza artificiale ha iniziato a stringere accordi milionari con Le Monde, Associated Press e altri grandi gruppi editoriali
L’azienda statunitense OpenAI, famosa per il suo sistema di intelligenza artificiale ChatGPT, ha annunciato di avere stretto un accordo con il giornale francese Le Monde e il gruppo editoriale spagnolo Promotora de Informaciones (Prisa) per l’utilizzo dei loro contenuti. Gli articoli e gli altri materiali prodotti dai due gruppi editoriali saranno impiegati per allenare i sistemi di intelligenza artificiale (AI), in modo da offrire agli utenti di ChatGPT contenuti migliori in francese e in spagnolo. L’accordo rientra in un piano più ampio di OpenAI per ridurre il rischio di iniziative legali contro l’impiego non autorizzato di materiale protetto dal diritto d’autore.
Le Monde è il giornale generalista più importante della Francia, mentre Prisa controlla alcune delle testate più diffuse e conosciute in Spagna come il quotidiano El País e le testate Cinco Días e El HuffPost, la versione spagnola del sito di informazione statunitense HuffPost (dal precedente nome Huffington Post). ChatGPT avrà accesso a tutti i contenuti dei loro archivi, che potranno essere utilizzati come punto di partenza per generare risposte testuali originali, oppure come riferimento nel caso in cui il sistema fornisca un link o una fonte alle informazioni che ha appena dato in una risposta.
Come molti altri contenuti, anche quelli negli archivi dei giornali online sono protetti dal diritto d’autore, di conseguenza possono essere utilizzati solo per farne citazioni e proporne brevi estratti. Per un impiego più ampio, soprattutto se a scopi commerciali, è necessario un permesso che renda possibile l’utilizzo dei contenuti pagando una licenza, anche se possono esserci eccezioni per chi svolge attività di studio e ricerca. Finora le società che sviluppano AI hanno sostenuto di ricadere in quest’ultimo caso: dicono che i loro sistemi sono sperimentali e che hanno bisogno di grandi quantità di dati per essere sviluppati. Alcune società, come OpenAI, sono però diventate molto ricche e potenti, di conseguenza per alcuni editori l’impiego dei loro contenuti ha smesso di rientrare in un uso equo e corretto (il cosiddetto “fair use”, come viene definito negli Stati Uniti).
Il New York Times, per esempio, alla fine del 2023 ha fatto causa a OpenAI accusandola di avere utilizzato i suoi archivi senza permesso per lo sviluppo di ChatGPT. La società ha respinto buona parte delle accuse, sostenendo di avere utilizzato i dati nell’ambito del “fair use” e ricordando che tecnicamente ChatGPT non riproduce gli stessi esatti testi conservati negli archivi online del giornale. Al tempo stesso OpenAI ha comunque iniziato a stringere accordi con alcuni editori, probabilmente per ridurre il rischio di nuove cause.
Prima di Le Monde e Prisa, OpenAI aveva concordato l’uso in licenza degli archivi di:
• Associated Press, una delle più grandi e rispettate agenzie di notizie al mondo;
• Axel Springer, grande gruppo editoriale tedesco che possiede numerose testate in Europa e non solo;
• Shutterstock, una delle più ampie librerie di immagini, video e musica per uso commerciale al mondo.
Il senso degli accordi è all’incirca sempre il medesimo: dare accesso a una grande quantità di contenuti a OpenAI senza che questa rischi cause per violazioni del diritto d’autore (oltre a ChatGPT, OpenAI sviluppa anche il sistema di intelligenza artificiale DALL•E per produrre immagini e Sora per la produzione di video).
Come per i precedenti accordi, OpenAI non ha dato informazioni su quanto abbia pagato Le Monde e Prisa per sfruttare i loro articoli e gli altri materiali digitali. A gennaio il sito di inchieste online The Information aveva segnalato che OpenAI aveva iniziato a offrire ad alcuni grandi editori tra uno e cinque milioni di dollari all’anno per avere accesso ai loro contenuti in licenza. Considerati gli accordi annunciati, la società ha per ora investito una cifra stimata fino a 20 milioni di dollari per l’iniziativa, ma questa potrebbe cambiare nei prossimi mesi. Per alcuni editori è un’offerta relativamente vantaggiosa e al tempo stesso non comporta un grande esborso per OpenAI, visto che la società ha raccolto investimenti per 11 miliardi di dollari e secondo le stime nell’ultimo anno ha prodotto ricavi intorno ai 2 miliardi di dollari.
I pagamenti per l’utilizzo dei contenuti in licenza dovrebbero ridurre i rischi di iniziative legali, ma alcuni osservatori hanno segnalato che questo approccio potrebbe danneggiare le società più piccole che stanno sperimentando sistemi di intelligenza artificiale. A differenza di OpenAI, queste non si possono permettere di spendere milioni di dollari per le licenze, di conseguenza c’è il rischio che si crei un grande svantaggio competitivo per loro del quale potrebbero beneficiare le società più grandi e ricche.
Oltre a OpenAI, che è finanziata in larga parte da Microsoft, tra i soggetti che stanno sviluppando più velocemente sistemi di intelligenza artificiale ci sono alcune delle maggiori aziende tecnologiche al mondo come Alphabet (la holding che controlla Google), Meta (che controlla Facebook e Instagram), Amazon e Apple. Non è chiaro se abbiano già avviato iniziative per stringere accordi con gli editori simili a quelli di OpenAI, ma il settore è in rapida evoluzione e soprattutto ha bisogno di grandi quantità di dati, di conseguenza le cose potrebbero cambiare in poco tempo.
I rapporti tra gli editori e le grandi aziende tecnologiche sono stati del resto altalenanti in diverse parti del mondo, con i primi che hanno accusato spesso le seconde di sfruttare i loro contenuti senza averne il diritto oppure senza un sistema equo di pagamenti e rimborsi. Alphabet ha per esempio dovuto affrontare diverse cause, avviando poi nel tempo programmi di finanziamento di iniziative giornalistiche per provare a migliorare i propri rapporti con gli editori, che anche in questo caso potrebbero chiedere garanzie sull’uso dei loro archivi per i sistemi di intelligenza artificiale.