Google non ci ha preso con l’influenza
Una ricerca su "Science" critica il sistema di analisi per prevedere l’andamento dell’influenza stagionale nel mondo, sulla base delle cose cercate dagli utenti
Sulla rivista scientifica Science dello scorso 14 marzo un gruppo di ricercatori coordinato da David Lazer della Northeastern University di Boston, Stati Uniti, ha pubblicato uno studio critico sul meccanismo di Google Flu Trends (GFT), il sistema messo online da Google per prevedere l’andamento dell’influenza stagionale in buona parte del mondo, sulla base delle ricerche effettuate in tema dai suoi utenti. Eugenia Tognotti dell’Università di Sassari spiega sulla Stampa le conclusioni della ricerca, ricordando che il semplice utilizzo dei cosiddetti “big data” – grandi quantità di dati da cui estrarre informazioni su andamenti e tendenze – in alcuni campi, come quello medico, non è sufficiente se non è combinato con sistemi più tradizionali.
E pensare che era la star del mondo Big Data, il Google Flu Trend (Gft), trionfalmente presentato nel 2008 come un prezioso strumento di salute pubblica. E lo sarebbe stato davvero se avesse mantenuto la promessa di monitorare in tempo reale i casi d’influenza sulla base dei termini di ricerca associati con quella malattia su Google: brividi, debolezza, febbre, mal di testa, tosse, mal di gola. Invece è stato un flop. Ha sovrastimato la prevalenza dell’influenza nella stagione 2012-2013 di oltre il cinquanta per cento.
E’ stato impreciso sul picco della stagione influenzale. Ancora. Da agosto 2011 a settembre 2013 ha sbagliato le previsioni relative a 100 settimane su 108. Per non parlare dell’influenza pandemica da virus H1N1, comparsa sulla scena a Pasqua, quando il Gft aveva già fatto le sue previsioni, sottovalutando la dimensione del focolaio fuori stagione. Insomma, il tentativo di inseguire i focolai di influenza in base ai termini di ricerca ha fallito l’obiettivo che s’era proposto.
Dando per certo che la prima reazione della gente colpita da influenza o sindrome influenzale è quella di cercare informazioni sul web, Gft puntava a prevedere le epidemie, contando sul fatto che da Big Data arrivasse una valanga di informazioni tali da aiutarci a fare cose che sarebbero impossibili con un volume inferiore di dati, raccolti in modo tradizionale. Come quelli forniti dall’organismo di controllo della sanità pubblica degli Stati Uniti, il Cdc (Atlanta) sulla base di visite mediche e di dati clinici e virologici.