I robot sono diventati bravi anche a poker
Un computer ha stracciato quattro fra i migliori giocatori al mondo: la vittoria ha implicazioni che non riguardano solo il gioco
In un torneo che si è concluso lunedì 30 gennaio al casinò Rivers di Pittsburgh, negli Stati Uniti, un software installato su un computer molto potente ha sconfitto nettamente quattro dei migliori giocatori di poker al mondo. Il software (o meglio, il bot) si chiama Libratus ed è stato costruito dall’università privata Carnegie Mellon, una delle più prestigiose al mondo; nel corso di 20 giorni di partite ha vinto l’equivalente di 1,7 milioni di dollari (il torneo era una specie di esperimento scientifico, e non si giocava con soldi veri): nessuno dei suoi avversari umani – Dong Kim, Jason Les, Jimmy Chou e Daniel McAulay – è riuscito davvero a tenergli testa, e le sue prestazioni sono migliorate nel corso del torneo.
La vittoria di Libratus può sembrare una delle tante del filone uomo-contro-macchina: del resto i migliori giocatori di scacchi si confrontano da decenni con computer potentissimi, e il loro esempio è stato seguito in diversi altri tornei di giochi da tavolo. L’importanza di questo specifico torneo è data dalle regole del poker, giocato nella sua diffusa variante Texas hold ‘em: in cui cioè – al contrario degli scacchi o di “go” – il tavolo da gioco non contiene tutte le informazioni per elaborare una strategia vincente. In altre parole nel poker Texas hold ‘em ciascun giocatore deve tenere conto di moltissimi fattori che non dipendono da lui – lo stile di gioco degli avversari, la possibilità o meno che escano certe carte, la qualità di una certa mano, e così via – e di decine di informazioni che vanno continuamente rielaborate. Il fatto che un computer ci riesca con successo non era così scontato: nel 2015 un bot simile a Libratus, costruito sempre dalla Carnegie Mellon, perse un torneo organizzato con criteri simili a quello di Pittsburgh. La vittoria di Libratus è significativa e non solo per una questione di gioco: «il poker è l’ultima delle nostre preoccupazioni», ha spiegato al Guardian Roman V. Yampolskiy, che insegna intelligenza artificiale all’università di Louisville: «ora abbiamo una macchina che può battere l’uomo in diversi ambiti, da quello economico a militare».
Libratus non è il prodotto di una macchina qualsiasi: il computer di cui si serve è stato costruito apposta da un centro specializzato di Pittsburgh ed è 7.250 volte più veloce dei migliori laptop in commercio. È stato inoltre realizzato appositamente per eseguire un algoritmo che analizzi scrupolosamente sia le mosse degli avversari in tempo reale sia le partite precedenti, per trovare errori nella propria strategia e in quella degli avversari. È molto più semplice a dirsi che a farsi: Libratus ha passato tutte le notti fra una partita e l’altra a rielaborare dati, e prima di iniziare ogni partita, di mattina, aveva bisogno di un paio d’ore per tornare funzionante. Nonostante il grande sforzo di calcolo, il fatto che fosse una macchina ha dato un notevole vantaggio a Libratus. I quattro giocatori che hanno partecipato al torneo erano tenuti a giocare per undici ore al giorno, e poi passavano il resto della serata a discutere di come fare per battere Libratus. Jason Les, uno dei giocatori umani, ha detto che è stata un’esperienza «un po’ demoralizzante: quando giochi e perdi contro un umano, puoi interrompere, fare una pausa. Qui eravamo tenuti a perdere per 11 ore di fila, ogni giorno. È un’esperienza emotiva diversa, soprattutto quando non sei abituato a perdere così tanto».
Ma il vantaggio di Libratus non era solo psicologico: secondo The Verge il bot ha effettivamente migliorato la sua strategia giorno dopo giorno, dimostrando una superiore capacità di adattamento alle difficoltà e allo stile degli avversari rispetto ai giocatori umani. Nel poker, inoltre, le vittorie più consistenti si ottengono rischiando parte del proprio patrimonio: cosa che però i giocatori umani – anche i migliori – tendono a fare meno di quanto sarebbe logico, probabilmente perché una perdita cospicua è un brutto colpo per il morale e la concentrazione. Doug Polk, un giocatore di poker che nel 2015 ha sfidato il precedente bot della Carnegie Mellon, ha spiegato che «se tu hai un patrimonio di 20mila dollari e vuoi puntarne 200, è una scommessa fattibile. Ma i giocatori umani non amano farlo: pensano di rischiare troppo, per una vincita tutto sommato bassa. Le macchine non fanno questi ragionamenti: a loro interessa solamente la migliore giocata possibile».
Libratus è stato incredibilmente bravo anche a bluffare,cioè a condurre una mano fingendo di avere delle ottime carte, scommettendo molti soldi. Nel gioco del poker bluffare è considerata una specie di arte, anche perché i giocatori hanno a disposizione tutto un set di espressioni del corpo o del viso da sfruttare per comunicare qualcosa ai propri avversari. Escludendo questa componente, e basandosi solamente sulla strategia degli avversari, Libratus è riuscito a prevenire diversi bluff e a giocarne molti, ingannando i propri avversari. Per chi capisce il poker: in una mano in particolare sono uscite diverse carte basse, tre delle quali di picche. Da subito Libratus ha puntato molto forte, lasciando credere di avere le carte per fare colore (cioè cinque carte dello stesso seme). Ha puntato forte fino all’ultimo e costretto il suo avversario a chiedere più tempo per la decisione finale: alla fine ha perso – il suo avversario aveva una scala – ma è stato a un passo dal vincere moltissimo senza avere in mano praticamente niente (aveva una coppia, ma solo una era di picche). Noam Brown, uno dei dottorandi che ha collaborato alla realizzazione di Libratus, ha spiegato che secondo lui questo dimostra che in fondo il poker è un gioco basato «sulle carte e sulla probabilità», a cui anche un bot può vincere.
Le applicazioni di un algoritmo come quello usato da Libratus sono parecchie: in fondo parliamo di un bot capace in tempo reale di sopperire nella maniera più razionale possibile a un problema in cui le informazioni di base sono incomplete, cosa che potrebbe avere applicazioni nella strategia militare o finanziaria, o ancora nella sicurezza informatica: «qualsiasi campo in cui gli esseri umani sono chiamati a prendere una decisione senza avere a disposizione tutte le informazioni necessarie», ha spiegato il Guardian.
Nonostante l’algoritmo usato da Libratus non sia stato «specificamente realizzato per il poker», come ha spiegato al blog di tecnologia IEEE Spectrum uno dei suoi creatori, siamo ancora lontani dall’utilizzarlo in altri ambiti. Libratus ha disputato il torneo giocando solamente contro due giocatori per volta, perché una partita più allargata – e quindi una situazione esponenzialmente più complessa – avrebbe richiesto uno sforzo di calcolo troppo intenso.