Come si riconosce un video fatto con l’intelligenza artificiale

Per ora i software più diffusi sono ancora grossolani, e osservando o controllando alcuni aspetti è facile riconoscere i cosiddetti “deepfake”

Una maschera di Hillary Clinton prodotta da una fabbrica di maschere di celebrità e politici noti in Cina, nel 2016 (REUTERS/Aly Song)

Caricamento player

I software che permettono di produrre “media sintetici” – foto, video e audio prodotti e manipolati allo scopo di fuorviare le persone o cambiare il significato di un contenuto pre-esistente – esistono ormai da anni. Se ne parla almeno dal 2017, quando per descriverli venne coniato il termine “deepfake”, unendo le parole “fake” (“finto” in inglese”) e “deep learning”, una delle tecnologie centrali che stanno alla base dei sistemi di intelligenza artificiale generativa, necessari per produrre questi media.

Fin da subito se n’è discusso con toni preoccupati, per varie ragioni. Intanto, l’origine dei deepfake è quasi sempre di natura non consensuale, dato che la maggioranza delle persone coinvolte non dà l’approvazione all’utilizzo del proprio volto o della propria voce nella creazione di questi contenuti. Per esempio lo scorso settembre in Spagna, un gruppo di ragazzini è stato accusato di aver usato l’IA per produrre immagini di nudo a partire dalle foto di compagne di scuola minorenni.

A questo si aggiungono le preoccupazioni relative all’utilizzo dei deepfake con l’obiettivo di diffondere disinformazione e propaganda politica, specie in vista delle elezioni. Nel Regno Unito, per esempio, negli ultimi mesi sono circolati molti deepfake che contenevano notizie false sul primo ministro conservatore Rishi Sunak. Negli Stati Uniti, invece, ci sono stati casi in cui gli stessi candidati alle primarie in vista delle elezioni presidenziali hanno condiviso deepfake per mettere in difficoltà gli avversari. È il caso del governatore della Florida Ron DeSantis, che ha fatto circolare un deepfake in cui si mostrava Donald Trump, suo principale avversario nelle primarie del partito Repubblicano, intento ad abbracciare Anthony Fauci, l’immunologo che aveva indirizzato le politiche sanitarie dell’amministrazione Biden durante la pandemia di Covid-19.

In Italia gli unici casi relativamente diffusi sono quelli che mostrano finte interviste in cui celebrità come Chiara Ferragni o Gerry Scotti cercano di convincere le persone a investire in criptovalute. In realtà si tratta di interviste che non sono mai avvenute, generate grazie a sistemi di intelligenza artificiale anche piuttosto rudimentali. Come ha scritto il sito Bufale un tanto al chilo, «se si guarda il labiale, se si ascolta il dialogo, è tutto ancora molto rigido. Solo chi è davvero molto ingenuo, per ora, può cascare in un video così».

Moltissime persone, però, sono ancora disabituate all’idea di dover prestare particolare attenzione ai video che guardano per assicurarsi che siano veritieri e non sintetici. Può essere utile quindi tenere a mente qualche dritta.

Intanto, usare il buonsenso

Esistono già vari casi in cui l’intelligenza artificiale viene utilizzata per creare video comici, chiaramente pensati per essere assurdi e poco credibili. Nel Regno Unito, per esempio, sono circolati moltissimi video satirici in cui personaggi politici famosi giocano insieme al videogioco Minecraft e si fanno i dispetti a vicenda: è uno scenario molto improbabile, ed è difficile che qualcuno ci creda veramente, a prescindere dalla qualità del video.

In Italia una persona che impiega spesso l’intelligenza artificiale per creare finte interviste e sketch comici che includono l’immagine di politici come Matteo Salvini o Giorgia Meloni è il comico Alessio Marzilli. I suoi video vanno normalmente in onda durante il programma satirico di La7 Propaganda Live e sono a primo sguardo relativamente credibili, nel senso che la tecnologia utilizzata è piuttosto avanzata e non è immediatamente evidente che non sia davvero Salvini o Meloni a parlare. Facendo un po’ di ricerca su chi è Marzilli e che genere di programma è Propaganda Live, però, diventa subito chiaro che i video in cui compare sono deepfake, e che le frasi al loro interno non sono davvero state pronunciate dai politici in questione.

«Fermatevi un attimo e guardate di nuovo. Pensate, prima di condividere qualcosa. Chiedetevi: questa cosa può essere successa davvero? Se non siete sicuri, non condividetela», consiglia un gruppo di giornalisti della testata tedesca Deutsche Welle specializzati nella verifica delle informazioni. «Fate un rapido controllo per vedere se riuscite a trovare la stessa storia da fonti diverse e affidabili. Spesso basta fare una breve ricerca su internet per ottenere indicazioni sulla veridicità di una storia».

Un altro consiglio è quello di inserire in un motore di ricerca una descrizione testuale del video che si sta guardando oppure fare una ricerca a partire da uno screenshot del video sospetto. In questo modo è possibile trovare maggiore contesto che confermi o al contrario smentisca la veridicità del video. I video di Propaganda Live, per esempio, hanno sempre un simbolo nell’angolo (il cosiddetto watermark) che indica il nome del programma notoriamente satirico in cui quel contenuto si inserisce.

Nel caso dei deepfake delle celebrità che fanno pubblicità alle criptovalute è necessario fare un passaggio ulteriore, però: per esempio, trovandosi davanti a un video in cui Chiara Ferragni parla con Alessandro Cattelan dei propri investimenti, basta googlare “Cattelan intervista Ferragni” per rendersi conto che, nel contesto originale, i due parlavano di tutt’altro.

Poi, conoscere i piccoli dettagli che le intelligenze artificiali fanno fatica a riprodurre

Non è sempre detto che basti fare una ricerca su Google per scoprire se un video è vero o meno, però, e certe persone preferiscono in ogni caso capirlo da sole. I sistemi di intelligenza artificiale moderni sono sempre più avanzati, e commettono sempre meno errori. Moltissimi deepfake che circolano online, però, vengono ancora creati con software gratuiti e un po’ datati, e contengono quindi molti difetti ed errori che si possono riconoscere con un po’ di attenzione. Spesso è più facile notarli se si mette in pausa il video e ci si sofferma su una singola inquadratura: lo si può fare manualmente, oppure online ci sono servizi come watchframebyframe.com.

I deepfake più grossolani si notano già dalla sproporzione tra testa e corpo, ovvero se la testa è molto più grande o più piccola del corpo, oppure se la testa si muove di continuo, ma il corpo rimane tendenzialmente fermo. È una cosa di cui ci si accorge facilmente perché provoca spesso un effetto di straniamento. Ecco un esempio:

Un’altra cosa da fare è guardare con attenzione i volti delle persone che parlano nei video. Quello che gran parte di questi software fanno, infatti, è replicare la voce e i movimenti facciali di una persona realmente esistente in modo da fargli dire o fare ciò che si vuole. I modelli statistici su cui si basano questi software, però, non sono sempre molto efficienti nel prevedere il modo in cui specifici oggetti o connotati – orecchini, occhiali, rughe, sopracciglia – si muovono nella vita reale: soffermarsi su questi dettagli, quando possibile, è quindi un ottimo punto di partenza.

Il dipartimento dedicato ai Media del Massachusetts Institute of Technology di Boston consiglia di farsi sempre una serie di domande molto pratiche quando ci si trova davanti a un video potenzialmente sospetto. Per esempio: la pelle appare troppo liscia o troppo rugosa? L’età che sembra avere la pelle delle guance è simile a quella della fronte o del contorno degli occhi? Le ombre si trovano dove vi aspettereste? Gli occhiali hanno riflessi strani? Le mani delle persone nel video hanno dita in eccesso? La forma o la posizione di un accessorio cambia molto quando la persona si muove? I capelli, la barba o i baffi sembrano realistici? E i denti? Gli orecchini sono simmetrici? La persona sbatte troppo le ciglia, o troppo poco? Lo stesso dipartimento mette anche a disposizione un sito per allenarsi a riconoscere questi piccoli dettagli: si chiama Detect Fakes. Un altro sito che aiuta a migliorare le proprie capacità di osservazione si trova qui.

Anche in questo caso il video di Chiara Ferragni e Alessandro Cattelan è un buon esempio. Se si conoscono un po’ i volti delle due persone, infatti, non è difficile notare che nel deepfake gli zigomi di Ferragni sono molto più pronunciati del normale e la fronte di Cattelan è leggermente allungata, in un modo che fa sembrare la sua faccia schiacciata verso il basso.

In alto, la finta Chiara Ferragni con gli zigomi molto pronunciati. In basso, il finto Alessandro Cattelan con la fronte più ampia del normale. (BUTAC)

Queste leggere deformazioni non sono ovviamente visibili nel video originale:

Un altro esempio utile per capire come possono essere deformati i volti nei deepfake è questo video in cui il politico britannico di estrema destra Nigel Farage gioca a Minecraft. Al di là del contesto assurdo e della qualità molto bassa del video (altro utile indicatore), ci sono vari punti in cui la mascella di Farage si muove in modo disumano: lo si vede già al secondo 00:02.

Un altro esempio ancora: nel maggio del 2024 è circolato un deepfake in cui sembrava che il portavoce del dipartimento di Stato americano Matthew Miller avesse giustificato un attacco alla città russa di Belgorod. Al suo interno, però, il colore della cravatta di Miller cambia colore, da blu a rosso, senza spiegazione.

Ha senso prestare particolare attenzione al modo in cui si muovono la bocca e il mento della persona che parla per controllare se i movimenti delle labbra sono sincronizzati con il suono che si sente nel video, e in generale per controllare che il viso si muova nello stesso modo in cui un viso si muove di norma. Anche la voce stessa della persona può dare qualche indizio sulla veridicità del video: è strano, per esempio, che qualcuno mantenga un singolo tono durante un’intera conversazione. Se si ha un po’ di tempo, è una buona idea anche cercare altri video in cui compare la stessa persona per confrontarne la voce, i gesti e le espressioni facciali per vedere se sono coerenti con quelli presenti e coincidono con quelli nel video sospetto.

In ogni caso, come ha detto al Guardian il professor Hany Farid, esperto di deepfake, i sistemi di intelligenza artificiale sono in costante miglioramento, e diventerà quindi sempre più complesso riconoscerli a occhio nudo. Per questo, dice Farid, è fondamentale «sviluppare buone abitudini nel nostro rapporto con le informazioni, unendo un po’ di buonsenso a una buona dose di scetticismo quando ci si trova di fronte ad affermazioni che ci sembrano particolarmente scandalose o improbabili».