Le intelligenze artificiali sono pessime a disegnare le mani
Nelle immagini generate dai software hanno spesso troppe dita o sono sfigurate, e c'entra come le teniamo nelle foto
Da quando sono state resi disponibili al pubblico alcuni siti semplici e gratuiti per chiedere a software di intelligenza artificiale di produrre immagini, illustrazioni e finte fotografie – come DALL•E, Midjourney e Stable Diffusion – è diventato un po’ più complesso capire se la persona di cui si sta guardando una foto esiste veramente o se è stata generata da un computer. Ci sono però dei dettagli della fisionomia umana che anche le intelligenze artificiali più sofisticate sembrano fare molta fatica a ricreare: piedi, denti, ma soprattutto mani.
In quasi tutte le foto generate da questi programmi, infatti, le persone hanno più o meno dita del dovuto, oppure mani orribilmente sfigurate, storte, inquietanti. Un esempio perfetto è questa serie di foto ottenute dallo sviluppatore Miles Zimmerman chiedendo a Midjourney di generare «una foto risalente al 2018 di alcuni ventenni felici, vestiti per una serata fuori, che si divertono a una festa in casa»:
Midjourney is getting crazy powerful—none of these are real photos, and none of the people in them exist. pic.twitter.com/XXV6RUrrAv
— Miles (@mileszim) January 13, 2023
Il fatto che le intelligenze artificiali siano pessime a disegnare le mani è ormai un fatto talmente assodato da ispirare commenti divertiti secondo cui, in futuro, le persone abituate a guardare porno generati dalle intelligenze artificiali chiederanno ai loro partner umani di aggiungere delle dita in plastica in più. Di recente, l’autore di libri per bambini Justin Boldaji ha anche scritto una brevissima storia dell’orrore su Twitter: «Mi accorsi gradualmente che nelle vecchie foto di quando ero bambino, tutti i miei parenti avevano delle dita orribilmente sfigurate».
Per capire il motivo di questi costanti errori, il giornalista Pranav Dixit di BuzzFeed ha parlato con un portavoce di Stability AI, uno dei vari siti che permettono di generare questo genere di fotografie. Per poter disegnare cose come “un cane nello stile dei Simpson” o “un ornitorinco che indossa un papillon”, l’intelligenza artificiale di Stability AI, come quelle di DALL•E o Midjourney, è stata allenata su enormi set di dati che contengono migliaia di immagini di cani, scene dei Simpson, ornitorinchi e papillon (oltre a milioni di altre cose), fino a “imparare” che alla parola “ornitorinco” corrisponde uno strano animale con il becco d’anatra e la coda di un castoro.
– Leggi anche: Come le intelligenze artificiali disegnano il mondo
Il portavoce di Stability AI ha però spiegato a BuzzFeed che, tendenzialmente, le foto e i disegni di esseri umani contenuti in questi set di dati contengono sempre dei volti, ma molto più raramente mani, piedi e sorrisi che mostrano i denti, e quindi è più difficile allenare l’intelligenza artificiale a capire quante dita dovrebbe avere la mano di una persona, e quanto lunghe o dritte dovrebbero essere queste dita.
Secondo Amelia Winger-Bearskin, artista e professoressa dell’Università della Florida che studia l’estetica dell’arte generata da intelligenze artificiali, il problema è che queste tecnologie non hanno ancora capito cos’è, in fin dei conti, “una mano”, e come si colleghi anatomicamente al corpo umano. L’IA «vede soltanto il modo in cui le mani sono rappresentate, ma le mani nelle immagini sono piuttosto articolate. Di solito sono piegate per afferrare qualcosa. Altre volte, sono strette attorno a un’altra persona». Le mani, insomma, fanno troppe cose nelle foto per essere riconosciute come un singolo elemento dall’intelligenza artificiale.
«Nelle foto, le mani sono molto raramente aperte, con le dita ben separate e visibili. Se così fosse, l’intelligenza artificiale le saprebbe riprodurre alla perfezione», dice Winger-Bearskin. Quella di imparare a disegnare una mano è, non a caso, anche una delle prime cose su cui si lavora quando ci si approccia al mestiere dell’artista, e capita spesso che nei cartoni animati i personaggi abbiano meno di cinque dita per semplificare il lavoro ai disegnatori. Secondo l’esperta, però, anche le intelligenze artificiali impareranno col tempo a riprodurre delle mani credibili, esattamente come fanno gli artisti in carne e ossa: «se vogliamo che l’intelligenza artificiale sia uno strumento utile per l’umanità, deve capire cosa vuol dire essere umani, e qual è la realtà anatomica degli esseri umani».