George R. R. Martin, Jonathan Franzen e altri scrittori hanno fatto causa a OpenAI

Perché sospettano che ChatGPT sia stato addestrato anche usando i testi dei loro lavori protetti da diritto d'autore

George R. R. Martin (Jon Kopaloff/Getty Images)

Caricamento player

Diciassette autori statunitensi che appartengono alla Authors Guild, un’organizzazione professionale per scrittori, hanno denunciato la società tecnologia OpenAI perché sospettano che l’azienda abbia usato illegalmente i testi dei loro libri – protetti da diritto d’autore – per addestrare il software di intelligenza artificiale ChatGPT. Tra gli scrittori in questione alcuni sono piuttosto celebri, come George R. R. Martin, autore della serie fantasy Cronache del ghiaccio e del fuoco, da cui è stata tratta la serie tv Game of Thrones, l’autore di libri gialli a sfondo giudiziario John Grisham e Jonathan Franzen, tra i più importanti romanzieri americani contemporanei, autore di Le correzioni e Libertà.

La causa, depositata il 19 settembre presso un tribunale di New York, vuole ottenere un’ingiunzione che impedisca a OpenAI di continuare a utilizzare lavori protetti da copyright per addestrare ChatGPT. Il software infatti funziona grazie a un modello statistico “addestrato” su enormi quantità di testi scritti da esseri umani in modo da indovinare, spesso correttamente, quali siano le parole che ha senso utilizzare in un dato contesto. Il gruppo di autori chiede anche il rimborso di 150mila dollari di danni per la violazione del diritto d’autore.

OpenAI e Meta erano già state denunciate a luglio per conto di tre scrittori che accusavano le due società di aver usato illegalmente le loro opere protette da copyright. Un portavoce di OpenAI ha detto che l’azienda «ha in corso scambi produttivi con molti artisti in tutto il mondo, tra cui quelli rappresentati dalla Authors Guild, e sta collaborando per comprendere e discutere le loro preoccupazioni sull’intelligenza artificiale».

Secondo la nuova causa, tra i tantissimi testi utilizzati da OpenAI per addestrare i modelli linguistici GPT-3.5 e GPT-4, su cui si basano ChatGPT e moltissimi altri chatbot, ci sarebbero anche gli interi testi di libri caricati online sotto forma di ebook piratati. Questi libri «scritti, curati e pubblicati da persone che lo fanno di professione» secondo la causa sono «una fonte particolarmente preziosa di dati ai fini dell’addestramento di questi modelli statistici».

– Leggi anche: Da dove viene e cosa è diventata OpenAI

Una volta addestrato con questi e altri testi, ChatGPT ha dimostrato di essere in grado di generare interi racconti o storie anche piuttosto lunghe, al punto che diverse persone hanno cominciato a far scrivere libri a ChatGPT, rivendendoli poi su Amazon o anche attraverso canali più tradizionali. La Authors Guild ha citato come esempio alcuni tentativi recenti di far generare a ChatGPT gli ultimi due volumi delle Cronache del ghiaccio e del fuoco, due libri che i fan della serie attendono da più di dieci anni ma che Martin non ha ancora finito di scrivere.