OpenAI vuole che parliamo a ChatGPT come nel film “Her”

La società ha presentato una nuova evoluzione del suo sistema di intelligenza artificiale, che conversa più naturalmente a voce e vede ciò che ha intorno

Una scena di Her (Warner Bros.)
Una scena di Her (Warner Bros.)

OpenAI, la società statunitense specializzata nello sviluppo di sistemi di intelligenza artificiale, ha presentato un nuovo aggiornamento di ChatGPT, il suo prodotto più famoso e discusso dell’ultimo paio di anni. Le novità sono state annunciate nel corso di un evento online organizzato lunedì 13 maggio, preceduto da numerose anticipazioni e ipotesi compresa la possibilità che OpenAI volesse presentare un proprio motore di ricerca per fare concorrenza a Google. Durante l’evento sono state invece presentate nuove funzionalità per dialogare più facilmente con ChatGPT a voce, facendole anche analizzare ciò che si ha intorno tramite la fotocamera dello smartphone.

La nuova versione di ChatGPT è basata su GPT-4o, la più recente evoluzione del modello GPT-4 che fa funzionare il sistema di intelligenza artificiale di OpenAI. Sam Altman, il CEO della società, ha spiegato che la nuova versione è stata sviluppata per essere «multimodale», e cioè in grado di generare contenuti sulla base di indicazioni e comandi derivanti da testi, immagini e audio. L’idea è di rendere ChatGPT sempre più simile a un assistente virtuale, in modo che possa conversare naturalmente con i propri interlocutori umani, fornendo indicazioni, informazioni o contenuti di fantasia.

Le funzionalità rese possibili da GPT-4o saranno messe a disposizione di tutti, ma per chi utilizza una versione a pagamento di ChatGPT saranno disponibili alcune opzioni in più e soprattutto maggiori capacità di elaborazione delle informazioni, per ottenere risposte più velocemente. La diffusione del modello aggiornato è già in corso, ma saranno necessari alcuni giorni prima che sia disponibile per tutti e a seconda delle aree geografiche ci potrebbero essere alcune limitazioni, per esempio legate alle regole dei singoli paesi sulla privacy.

Oltre a essere disponibile sia su computer tramite browser sia su app per gli smartphone come era stato finora, ChatGPT potrà anche essere utilizzata tramite una app da installare sul proprio computer. In precedenza OpenAI aveva già fatto qualche esperimento con i comandi vocali, mettendo a disposizione della propria app per smartphone una funzione per parlare direttamente con ChatGPT, che rispondeva a voce fornendo le informazioni richieste. Il sistema non era però molto naturale e non c’erano possibilità di interazione fino a quando il sistema non aveva terminato di dare la propria risposta.

La nuova versione di ChatGPT offrirà invece un’esperienza più intuitiva e diretta, almeno secondo i responsabili di OpenAI. Nel corso della presentazione è stata mostrata la capacità dell’applicazione di interagire e di farsi interrompere da ulteriori richieste vocali, a differenza di quanto fanno solitamente gli assistenti vocali che continuano a parlare fino a quando non hanno terminato di dare la loro risposta. L’app può anche essere utilizzata per chiedere a ChatGPT di “vedere” che cosa ha intorno tramite la fotocamera dello smartphone, fornendo poi informazioni in base al riconoscimento degli oggetti e dei contesti in cui si trova.

L’esperienza è stata paragonata a quella offerta da Samantha, l’assistente virtuale di cui si innamora Theodore Twombly (Joaquin Phoenix) nel film Her, che ha una spiccata capacità di riconoscere i contesti, interpretarli e di dare risposte interagendo naturalmente con il suo interlocutore; lo stesso Altman su X ha pubblicato un post scrivendo laconicamente «Her».

In realtà la nuova versione di ChatGPT è ancora molto distante dall’offrire un’esperienza paragonabile a quella del film o di quella immaginata da altri libri e film di fantascienza, soprattutto a causa degli errori (“allucinazioni”) che i sistemi di intelligenza artificiale producono ancora quando rispondono. Il loro livello di affidabilità nel dare informazioni fattuali e verificate è ancora relativamente basso e ci si interroga da tempo sulle implicazioni e sugli effetti delle allucinazioni in particolari ambiti, come quelli dell’informazione.

OpenAI sta comunque ottenendo progressi importanti con ChatGPT e gli altri sistemi di intelligenza artificiale cui lavora, come DALL•E per la produzione di immagini e di Sora per la produzione di brevi video. La società ha grandi risorse finanziarie soprattutto grazie agli investimenti di Microsoft e di alcuni grandi clienti, che hanno scelto di sperimentare i suoi sistemi nei loro flussi di lavoro.

Secondo Bloomberg OpenAI starebbe inoltre trattando con Apple per potenziare Siri, l’assistente vocale degli iPhone, con GPT-4o e altri sistemi in modo da estendere le sue funzionalità, finora molto limitate. Tra le grandi aziende tecnologiche statunitensi, Apple è più indietro rispetto alla concorrenza nello sviluppo e nella diffusione di sistemi di intelligenza artificiale e per questo si prevede che faccia qualche annuncio importante entro la fine dell’anno, forse già a giugno nel corso della tradizionale presentazione degli aggiornamenti dei propri sistemi operativi.

– Leggi anche: E Apple che piani ha con l’intelligenza artificiale?

La concorrenza nel settore è del resto molto forte e coinvolge alcune delle aziende tecnologiche più grandi del mondo. OpenAI ha presentato le novità lunedì probabilmente per anticipare Google, che nella serata di martedì presenterà le ultime novità legate ai propri servizi. Secondo le anticipazioni, Google presenterà una versione aggiornata del proprio assistente, in modo che possa funzionare con Gemini, il suo sistema di intelligenza artificiale. L’Assistente Google, presente su Android e su molti dispositivi per la casa attraverso Google Home, non ha fatto particolari progressi negli ultimi anni ed è stato spesso motivo di frustrazione da parte di chi lo utilizza. L’aggiornamento potrebbe rendere il sistema più interattivo e utile nello svolgimento di alcuni compiti, proprio come la nuova versione di ChatGPT.