Come funzionano le previsioni di Nate Silver
Il noto giornalista e statistico americano ha spiegato i meccanismi del suo modello per le presidenziali americane, che per ora dà molto avanti Hillary Clinton
Una settimana fa il sito di news e statistica FiveThirtyEight ha pubblicato un modello per prevedere l’esito delle elezioni presidenziali statunitensi, che si terranno il prossimo 8 novembre. FiveThirtyEight ha detto che aggiornerà il grafico in continuazione, aggiungendo i risultati di nuovi sondaggi stato per stato. È probabile che il sistema statistico di FiveThirtyEight sarà il più preciso tra quelli che inizieranno a circolare nei prossimi mesi: il fondatore del sito e principale creatore del modello è Nate Silver, il giornalista e statistico che nel 2008 e nel 2012 predisse quasi esattamente il risultato delle elezioni presidenziali in ogni stato americano, anche in quelli considerati più in bilico (i cosiddetti swing states). Il sistema di Silver prevede tre diversi modelli statistici: in questo momento il modello “standard”, cioè quello che tiene conto soltanto dei sondaggi, assegna alla candidata dei Democratici Hillary Clinton il 77,6 per cento di possibilità di vincere le elezioni, contro il 22,4 per cento di Donald Trump, il candidato dei Repubblicani.
Come funziona?
Il sistema di previsioni adottato da Silver prevede tre tipi di modelli statistici: uno “standard”, che tiene conto solamente dei sondaggi, un altro “aggiustato”, che integra i sondaggi con statistiche economiche e voti precedenti di ciascuno stato, e un terzo che prevede che cosa succederebbe se si votasse oggi (e che cioè, semplificando, assegna una grandissima importanza ai sondaggi più recenti).
In passato Silver ha fatto capire che considera il modello “standard”, cioè quello che tiene conto solo dei sondaggi – per la maggior parte realizzati a livello statale – come il più affidabile. Questo modello si basa su uno specifico database che registra l’affidabilità dei vari istituti che realizzano i sondaggi – alcuni dei quali non vengono conteggiati, perché considerati troppo inaffidabili o imprecisi – e dei risultati precedenti di un sondaggio effettuato dallo stesso istituto, oltre che di quelli realizzati in contemporanea in altri stati. In realtà anche il modello “standard” tiene conto di alcune variabili di natura demografica – ad esempio, come tendono a votare gli afroamericani in South Carolina – e di storia elettorale di un singolo stato, ma in misura molto minore rispetto al modello “aggiustato”. Una delle integrazioni incluse anche nel modello standard riguarda il trend nazionale, che viene usato per “aggiornare” vecchi sondaggi. Spiega Silver: «se per esempio in un sondaggio di giugno effettuato in North Carolina Trump era dato avanti di un punto, ma da allora ha guadagnato 3 punti a livello nazionale, il modello tratterà quel vecchio sondaggio come se desse Trump avanti di 4 punti».
Il modello “aggiustato” è stato creato per tenere conto soprattutto di sei variabili economiche a livello federale (cioè in tutti gli Stati Uniti): tasso di disoccupazione, produzione industriale, stipendi, inflazione e andamento dei mercati finanziari. Il modello “aggiustato”, normalmente, tiene conto anche di elementi come la presenza di un presidente in cerca di rielezione o di una situazione economica eccezionalmente favorevole: nessuno di questi fattori è però presente nel caso delle prossime elezioni.
Già in passato Silver aveva spiegato di essere un po’ scettico nei confronti dei modelli “aggiustati”, e che mentre la scienza dei sondaggi si è in qualche modo evoluta negli ultimi anni, quella delle previsioni “aggiustate” non è riuscita a fare altrettanto da quando si è diffusa, all’inizio degli anni Novanta. Anche su FiveThirtyEight, durante le primarie Democratiche e Repubblicane, le previsioni sui singoli stati che hanno tenuto conto solamente dei sondaggi si sono rivelate leggermente più precise di quelle “aggiustate”. Nel 2000 molte previsioni che mischiavano sondaggi e altri indicatori davano per certa la vittoria di Al Gore contro George W. Bush; otto anni dopo uno di questi modelli previde che Obama avrebbe vinto di 16 punti (un distacco enorme, che poi non si è verificato), un altro che il Repubblicano John McCain avrebbe vinto di 7 punti. Nel 2012 questi modelli se la sono cavata abbastanza bene, ma anche in quel caso uno dei più importanti aveva sbagliato alla grande, prevedendo una larga vittoria del Repubblicano Mitt Romney.
Silver ha spiegato che la sua è semplice diffidenza, e che le previsioni di questo tipo rimangono utili se compilate coi dati giusti e con un campione sufficientemente ampio. Per esempio durante le primarie tenere conto della composizione demografica dell’elettorato Democratico è servito a prevedere correttamente i risultati in diversi stati: in quelli a maggioranza bianca e meno popolati solitamente ha vinto Sanders, negli stati più etnicamente variegati e abitati ha vinto Clinton. Silver ha inoltre spiegato che negli ultimi giorni il modello standard e quello “aggiustato” tenderanno comunque ad assomigliarsi, dato che ha modificato il secondo affinché assegni sempre meno peso ad altri indicatori man mano che ci si avvicinerà alle elezioni (dando per scontato che i sondaggi diventino sempre più affidabili).
Una delle novità del sistema statistico di Silver è il terzo modello, il cosiddetto “now-cast”: in pratica, preveda che si “menta” simulando l’ipotesi che si voti oggi (cosa che spinge il modello a dare grande rilevanza agli ultimi sondaggi). Attualmente, secondo il modello “now-cast”, Clinton avrebbe il 78,7 per cento di probabilità di vincere, contro il 21,3 per cento di Trump, e vincerebbe anche in diversi swing states come l’Ohio e la Pennsylvania.
Altre previsioni
Il sistema statistico di Silver non prevede solo l’esito delle elezioni a livello nazionale e nei singoli stati, ma anche tutta una serie di situazioni particolari o bizzarre che si potrebbero verificare (sempre secondo tre modelli diversi: solo sondaggi, sondaggi aggiustati e se-si-votasse-oggi). Secondo il modello “standard”, ad oggi esiste ad esempio il 4 per cento di possibilità che sia necessario un riconteggio dei voti in uno stato molto in bilico, l’81 per cento di possibilità che Clinton ottenga complessivamente più voti di Trump, e il 2,1 per cento di possibilità che Trump vinca con un margine superiore ai 10 punti.