Le intelligenze artificiali si sono prese pure il poker
Non è stato semplice, viste certe peculiarità del gioco, e non tutti sono felici che sia successo
Come molti altri giochi che stanno su un tavolo e che sono normati da regole chiare e condivise, anche il poker ha ricevuto le attenzioni di chi si occupa di sistemi di intelligenza artificiale. In particolare la sua variante Texas hold ‘em, che è stata codificata in Texas (eh già) negli anni Sessanta e che da tempo è la più popolare. Rispetto a giochi come gli scacchi, o il difficilissimo go, il Texas hold ‘em ha però alcune peculiarità: anzitutto possono giocarci in contemporanea fino a un massimo di dieci giocatori e, cosa ancora più importante, ogni giocatore e ogni intelligenza artificiale giocante è all’oscuro delle carte nelle mani di ogni avversario. Il tavolo, in altre parole, non contiene tutte le informazioni necessarie a elaborare una strategia vincente.
Nonostante queste peculiarità, anche al Texas hold ‘em è toccata una sorte simile a quella degli scacchi e del go e, come ha scritto il New York Times Magazine, «è stato conquistato dalle intelligenze artificiali». Restano comunque, più che in altri giochi, sacche di resistenza a questa conquista, e considerevoli spazi per un approccio umano.
Il Texas hold ‘em – spesso chiamato anche solo hold ‘em – prevede che all’inizio di una mano ogni giocatore riceva due carte da un mazzo da 52. Sono le cosiddette hole cards e ogni giocatore guarda le sue ma non conosce quelle degli avversari. A questo punto, in una serie di fasi successive, sono aggiunte al tavolo cinque carte comuni a tutti i giocatori, che vedendone prima tre (flop) e poi, una alla volta, le successive due (turn e river) possono decidere se puntare, vedere, rilanciare o abbandonare, lasciando in questo caso sul tavolo le precedenti puntate. Lo scopo è usare le proprie carte e le carte comuni per ottenere, secondo le regole del poker, la miglior combinazione possibile di cinque carte.
Ci sono poi varianti, termini specifici e complicazioni varie, ma il succo è che bisogna arrivare alla fine, puntata dopo puntata, e sperare in due esiti: che gli altri, non convinti dalle loro carte, abbandonino prima; o, se qualcuno è ancora in gioco, che una o due delle proprie carte garantiscano, se unite a quelle comuni, la vittoria della mano e quindi del piatto, cioè la somma di tutte le puntate fatte dai giocatori durante la mano.
Visto che il poker esiste da prima che venissero codificate le regole del Texas hold ‘em, già nella prima metà del Novecento, sull’onda degli studi e dei ragionamenti sulla teoria dei giochi, ci furono i primi tentativi di elaborare modelli efficaci volti a capire quale fosse, per ogni giocatore, una strategia ottimale di gioco. Quanto il poker potesse tornare comodo alla teoria dei giochi è ben spiegato in una frase del matematico John von Neumann, coautore – insieme con l’economista Oskar Morgenstern – del libro Theory of Games and Economic Behavior. Lamentandosi di quanto molti giochi fossero inadatti ai suoi scopi, von Neumann disse: «la vita vera è fatta di inganni, piccole bugie, è piena di momenti in cui ci chiediamo cosa gli altri pensano che io voglia fare, ed è questo che sono i giochi nella mia teoria».
Gli inganni, i bluff e le informazioni incomplete che ogni giocatore ha su tutti gli altri sono però anche quel che per decenni resero il poker un’attività parecchio umana, in cui, come ha scritto il New York Times Magazine, «anche i computer dovevano limitarsi a interpretare le giocate degli avversarsi senza sapere con certezza quali carte avessero tra le mani».
Neil Burch, un informatico che ora lavora per la società di intelligenza artificiale DeepMind e che prima aveva passato un paio di decenni studiando il poker in veste di ricercatore dell’Università dell’Alberta, ha detto al New York Times Magazine che per molto tempo i risultati furono deludenti: «Se mettevamo un bravo giocatore di poker contro a un computer e li facevamo giocare, il computer ne usciva a pezzi».
Come ha spiegato il New York Times Magazine, chi si occupa di teoria dei giochi usa, per rappresentare le varie strade che un gioco può prendere, un diagramma ad albero. «In giochi come carta-forbice-sasso, l’albero è piccolo: tre rami per carta, forbice e sasso, ognuno dei quali con tre ramificazioni per ognuna delle tre possibili mosse dell’avversario». Per il Texas hold ‘em, anche a volerne prendere una versione semplice, con due soli giocatori e con puntate e vincite predeterminate, l’albero ha 316,000,000,000,000,000 di rami, cioè 316 milioni di miliardi di rami. Nel caso di versioni ancora più complesse, ha detto Burch, i rami diventano addirittura superiori al numero di atomi nell’universo.
Nonostante i molti zeri di questi numeri, da qualche anno le intelligenze artificiali sono riuscite a conquistare anche il poker.
Informatici e ricercatori sono partiti da versioni semplificate, in cui per esempio una coppia di 9 era considerata equivalente a una coppia di 10, così da permettere alle intelligenze artificiali di prenderci la mano. Dopodiché hanno alzato il livello, soprattutto grazie a un algoritmo basato sulla counterfactual regret minimization, la minimizzazione controfattuale dei rimpianti.
In altre parole, di nuovo quelle del New York Times Magazine, «ai computer è stato detto di identificare le strategie ottimali giocando contro loro stessi miliardi di volte e prendendo nota di quali decisioni, quali strade nell’albero del gioco, erano state meno profittevoli». Era insomma stato detto loro di ricordarsi quali mosse avevano generato rimpianti, così da minimizzarli nelle mosse successive, e funzionò, come spiegato in un articolo accademico pubblicato su Science nel 2015. Tutto questo continuava però a riguardare le partite hold ‘em uno-contro-uno e con puntate prefissate.
Quell’articolo – dal titolo “L’hold ‘em limit uno contro uno è stato risolto” – forse non dice granché a molti, ma per chi giocava a poker online (un’attività già molto in voga nel 2015) fu una sorta di momento DeepBlue-batte-Kasparov. «Ricordo bene» ha detto l’ex pokerista professionista Terrence Chan «che dopo averlo letto, io e altri ci dicemmo “è stato bello finché è durato, ma ora è finita”».
– Leggi anche: Deep Blue 1 – 0 Garry Kasparov
Le cose non furono così drastiche, ma di certo diedero un bel colpo al poker online. Tra chi voleva sviluppare programmi per vincere online, e chi voleva sviluppare programmi per capire chi usava altri programmi per vincere online, ci fu un certo trambusto. E sempre nel 2016 il programmatore ed ex giocatore di poker polacco Piotrek Lopusiewicz iniziò a vendere online, per un paio di centinaia di dollari, PioSOLVER, un programma che «approssimava le soluzioni per le più complicate versioni del gioco».
Da allora, PioSOLVER è usato, assieme ad altri programmi simili, da molti giocatori professionisti e questi programmi, come ha scritto il New York Times Magazine, «hanno radicalmente trasformato il modo in cui si gioca a poker, in particolare ai suoi più alti livelli». I programmi, anche noti come solver (risolutori) sono ormai piuttosto accessibili ed è molto difficile trovare giocatori di alto livello che prima o dopo una partita non ne facciano uso, per prepararsi o per analizzare con spirito critico le proprie mani.
Uno di loro è Jason Koon, che gioca ad alti livelli dal 2006 e nella sua carriera ha accumulato decine di milioni di dollari in premi. «Nell’epoca pre-solver», ha detto, «ero un discreto giocatore, ma dal momento in cui sono arrivati i solver mi ci sono dedicato tantissimo e ho iniziato a migliorare molto, molto, molto rapidamente».
Nello specifico, Koon usa PioSOLVER per allenarsi a capire, in ogni dato momento, qual è la scelta ottimale, cioè quella che – in base alle comunque limitate informazioni a disposizione del software – offre le maggiori probabilità di riuscita.
Addirittura, i solver riescono a suggerire quali puntate è meglio fare e, in un modo tutto loro, a valutare anche se e quando può essere il caso di bluffare, comportandosi cioè in modo da far credere agli altri di avere carte che non si hanno. Durante le partite, Koon e tutti quelli che come lui usano i solver non possono ovviamente consultarli, possono tuttavia – così come fanno gli scacchisti dopo essersi allenati con i computer – provare a fare quello che, secondo la loro memoria ed esperienza, farebbe un solver.
I pokeristi devono però anche tenere a mente che i solver tendono ad agire supponendo di giocare contro altri giocatori intenti a ottimizzare le loro giocate. Semplificando un po’, può quindi capitare che giocatori inesperti o parecchio abili nel fare cose non da solver possano in una certa misura mandare in crisi i solver o chi prova a emularli. «Contro giocatori più deboli» ha scritto il New York Times Magazine «Koons a volte si discosta dal poker teoricamente perfetto, bluffando più del dovuto o scommettendo pesante quando invece l’intelligenza artificiale suggerirebbe di essere cauto per sfruttare meglio gli errori altrui».
Semplificando ancora di più, i software hanno il vantaggio di non essere emotivi, di non esaltarsi dopo molte buone mani o incupirsi dopo che gira male per un po’; ma anche, a volte, lo svantaggio di essere troppo analitici.
In certe loro versioni rapide e semplificate, i solver possono anche essere usati online: ci sono già casi di giocatori sospettati di averli usati e, nel dubbio, c’è chi ormai partecipa quasi solo a tornei dal vivo, nonostante molti siti si impegnino per evitare che succeda. Sembra tuttavia essere uno di quei casi in cui i divieti e le contromosse difficilmente potranno tenere testa alle sempre maggiori, migliori e più rapide vie per barare.
Il New York Times Magazine ha scritto inoltre che la ricerca di strategie ottimali simili a quelle dei solver ha cambiato il modo di giocare a hold ‘em ai massimi livelli, per molti versi rendendo meno importante il talento e più importante lo studio. Doug Polk, che ha praticamente smesso di giocare nel 2017, ha detto: «Penso che [i solver] abbiano tolto anima al poker: prima c’era molto spazio per la creatività, ora si tratta solo di memorizzare cose e metterle in pratica».
Per Lopusiewicz, lo sviluppatore di PioSOLVER, i solver non sono altro se non «un’arma più potente» in un contesto, basato su quello che in essenza è un gioco di probabilità, nel quale già da tempo c’era una corsa agli armamenti», per esempio con software che permettevano di analizzare e studiare ogni precedente mossa di ogni possibile avversario. Ha un’idea simile Koon, che ha detto: «I solver non ti dicono perché fanno quello che fanno, lo fanno e basta; sta a te capire il perché».
– Leggi anche: Il mondo del bridge contro un italiano