Com’è andata la complicata vicenda dei dati sbagliati della Lombardia

Spiegato in una versione più semplice e in una più tecnica, per capire come sia stata per errore in zona rossa per una settimana

(Claudio Furlan - LaPresse)
(Claudio Furlan - LaPresse)

La vicenda della Lombardia rimasta per una settimana in zona rossa invece che in zona arancione per via di alcuni dati sbagliati è stata il caso politico degli ultimi giorni, ed è stata caratterizzata da un insistente scambio di accuse tra il governo regionale lombardo e il ministero della Salute. Se è abbastanza chiaro quale sia stato genericamente il problema coi dati, ricostruire la sequenza di errori che ha portato alla classificazione sbagliata del rischio epidemiologico è più complicato.

Al centro della vicenda ci sono dati piuttosto complessi, di cui peraltro alcuni dettagli non sono pubblici. Si possono comunque fare due ipotesi su cosa sia andato storto tecnicamente e nel dettaglio, ma entrambe hanno un punto di partenza e un esito comune: una correzione approssimativa di una vecchia e ripetuta mancanza della Regione Lombardia nella trasmissione dei dati, e un indice Rt sovrastimato per una settimana a causa di quella correzione.

La Lombardia era stata classificata come zona rossa domenica 17 gennaio, prevedendo quindi le misure più drastiche tra cui la chiusura dei negozi e il divieto sugli spostamenti non essenziali. Dopo una serie di confronti tra i tecnici dell’Istituto Superiore di Sanità e la Regione Lombardia, venerdì 22 gennaio il ministero della Salute aveva comunicato che i dati lombardi non erano corretti, e che quindi la classificazione della Lombardia era stata rivista e riportata in zona arancione. La Lombardia, quindi, è stata una settimana in area rossa per errore, con notevoli conseguenze economiche soprattutto per i commercianti.

Regione Lombardia e l’Istituto superiore di sanità danno versioni diverse su come sia avvenuto l’errore. Il governo lombardo guidato da Attilio Fontana, della Lega, aveva inizialmente incolpato il ministero e l’ISS, salvo poi sostenere che «probabilmente non è colpa di nessuno». Il ministero della Salute invece ha sempre sostenuto che l’errore sia stato della Lombardia, accusata di aver trasmesso dati sbagliati: una volta rettificati all’origine, la regione infatti è stata classificata di conseguenza, passando da rossa ad arancione.

Il problema nasce dai dati che servono per calcolare Rt, cioè l’indice che stima quanto viene trasmesso il coronavirus. Questo indice considera solo le persone che accusano sintomi, i “sintomatici”. Per calcolare l’indice Rt è importante avere il numero delle persone con sintomi e in che data hanno iniziato ad accusare i sintomi: a lungo la Lombardia non ha indicato lo stato clinico di molti dei contagiati che segnalava all’ISS. Dopo alcuni richiami, è intervenuta per sistemare questa lacuna nei dati: ma il modo in cui lo ha fatto ha comportato una sovrastima temporanea di Rt, che ha temporaneamente fatto classificare la regione come zona rossa. Dopo alcuni giorni, quando la correzione è stata sistemata, l’Rt si è abbassato di colpo, e la regione è tornata in zona arancione.

– Leggi anche: La Lombardia è stata una settimana in zona rossa per errore

(Gian Mattia D’Alberto – LaPresse)

Quali dati sono cambiati
Il 13 gennaio la Regione Lombardia aveva comunicato i dati epidemiologici relativi alla settimana tra il 4 e il 10 gennaio 2021. I casi positivi totali da inizio epidemia erano 501.902, per 419.362 dei quali era specificata la data di inizio sintomi. Di questi, 185.292 avevano l’informazione “sintomatico o non specificato”, utile per il calcolo dell’indice Rt. Gli altri 234.070 invece erano classificati con la dicitura “asintomatico o guarito/deceduto senza indicazione di stato sintomatico precedente”, quindi esclusi dal calcolo.

Il 20 gennaio, dopo cinque giorni di zona rossa, la Regione Lombardia aveva poi inviato il nuovo aggiornamento sui dati, includendo però una rettifica dei dati relativi alla settimana tra il 4 e il 10 gennaio. Con la correzione, i casi considerati per il calcolo dell’indice Rt – tra cui i sintomatici con una data di inizio sintomi – sono calati di 9.262, da 14.180 a 4.918. In questo modo l’indice Rt è passato da un valore medio di 1,4 a 0,88: è stata questa nuova stima al ribasso che ha fatto passare la Lombardia dalla zona rossa alla zona arancione.

Questa è la tabella pubblicata dall’Istituto superiore di sanità che mostra i cambiamenti

(Istituto superiore di sanità)

Non è facile capire cosa abbia portato alla rettifica. La premessa è che quando la qualità del dato è alta, cioè quando le informazioni sono tutte al loro posto, il sistema di calcolo funziona senza problemi. Quando alcune di queste informazioni mancano, invece, subentrano regole stabilite a posteriori per “aggiustare” le informazioni mancanti. Ed è quello che è successo.

Per mesi la Lombardia non ha comunicato lo stato clinico di moltissimi contagiati – cioè non ha specificato nei dati se fossero sintomatici o meno – ed è l’unica Regione che lo ha fatto in modo sistematico. Sappiamo che l’Istituto Superiore di Sanità aveva segnalato più volte questo problema, e che recentemente – tra fine dicembre e metà gennaio – i tecnici lombardi avevano deciso di fare modifiche in corsa che avevano alterato il calcolo dell’indice Rt. Questa alterazione è alla base dell’errore poi corretto con l’aggiornamento del 20 gennaio.

– Leggi anche: Ci sono nuovi parametri per decidere i colori delle regioni

In sostanza: dopo molte segnalazioni dell’ISS, alcuni dati incompleti sono stati aggiornati in modo discutibile e approssimativo da Regione Lombardia, cosa che ha comportato una sovrastima di Rt. Dopo la classificazione come zona rossa ci si è accorti del guaio, e i dati sono stati risistemati, e alla successiva valutazione del rischio epidemiologico la Lombardia è tornata in zona arancione.

Dalle ricostruzioni che ha potuto fare il Post consultando varie fonti dell’Istituto Superiore di Sanità e della Regione Lombardia, ancora su posizioni molto diverse, emergono due ipotesi tecniche, riconducibili in realtà alla stessa dinamica: una correzione retroattiva e sommaria dei dati da parte dei tecnici lombardi, per colmare la lacuna segnalata dall’ISS. Correzione che ha sballato il calcolo dell’indice Rt, che ha determinato il passaggio in zona rossa della Lombardia.

Una spiegazione più tecnica
La prima ipotesi su cosa tecnicamente sia successo si basa sulla nota pubblicata domenica 23 gennaio dall’Istituto Superiore di Sanità. Chiarisce che quando una Regione trasmette la data di inizio sintomi ma non lo stato clinico – è il caso della Lombardia – quel malato viene considerato tra i sintomatici, e contribuisce così al calcolo dell’indice Rt. Quando questo malato guarisce viene classificato tra gli asintomatici (che non contribuiscono a calcolare l’indice Rt) nonostante non sia mai stato indicato lo stato clinico. «La Lombardia ha segnalato, dall’inizio dell’epidemia fino all’ultimo periodo, una grande quantità di casi, significativamente maggiore di quella osservata in altre regioni, con una data di inizio sintomi a cui non ha associato uno stato clinico e che pertanto si è continuato a considerare inizialmente sintomatici», si legge nella nota dell’ISS.

– Leggi anche: Cosa cambia con i test rapidi antigenici

Secondo l’Istituto superiore di sanità, quello sullo stato clinico del contagiato è un dato importante, e infatti aveva inviato diverse segnalazioni ai tecnici lombardi. Marco Trivelli, direttore generale Welfare di Regione Lombardia, ha detto invece che quel campo era considerato “facoltativo”. Dopo le segnalazioni dell’Iss, secondo la ricostruzione della nota dell’istituto, i tecnici lombardi avevano provveduto a definire retroattivamente come “guariti” molti dei casi che in precedenza erano stati annotati senza uno stato clinico. Aver inserito migliaia di guariti in più e all’improvviso ha condizionato l’andamento dei contagi registrati nel tempo, alterando il calcolo dell’indice Rt. Solo con l’aggiornamento del 20 gennaio si è risolto il problema.

La seconda ipotesi si basa sulle dichiarazioni di Trivelli, e sui report di monitoraggio settimanali pubblicati dall’Istituto superiore di sanità. Analizzando i dati, si nota che il 13 gennaio c’è qualcosa di nuovo rispetto alle settimane precedenti. Molti asintomatici, più di 10mila casi, vengono classificati come sintomatici. È una modifica improvvisa dello stato clinico, che viene corretta poi nell’aggiornamento del 20 gennaio.

In questo grafico si vede la netta differenza tra le colonne blu, quelle dei casi per data di inizio sintomi.

(Twitter/Lorenzo Ruffino)

Secondo quanto ricostruito da Repubblica, l’aggiornamento era stato sollecitato a Regione Lombardia con una mail “accorata” inviata il 7 gennaio dall’Istituto superiore di sanità. Questa modifica, però, aveva comportato un innalzamento dei casi utili per calcolare l’indice Rt portando la regione in area rossa. Il 19 gennaio, Trivelli aveva chiesto un ricalcolo dell’indice Rt sulla base delle rettifiche fatte. «Con la presente, a seguito delle odierne interlocuzioni, si richiede che venga eseguito un calcolo dell’indice RTSintomi recependo le modifiche definite a livello tecnico relative al conteggio dei pazienti guariti e deceduti», si legge nella mail.

Durante la conferenza stampa di sabato scorso, Trivelli ha confermato che l’Istituto superiore di sanità aveva chiesto una modifica dei malati trasmessi senza stato clinico. «In circa il 3% dei record ci è stato chiesto di inserire un valore convenzionale di stato sintomatico. Ci è stato chiesto di optare tra sintomatico e paucisintomatico, con effetto indifferente sull’esito dell’indice Rt», ha spiegato Trivelli, suggerendo perciò che la modifica retroattiva ai dati sia stata fatta scegliendo convenzionalmente di annotare il 3 per cento dei contagiati senza stato clinico come sintomatici. A quel punto, però, con un aumento dei sintomatici è stato alterato il calcolo dell’indice Rt, che è cresciuto in modo anomalo. Il problema si è risolto solo con la rettifica del 20 gennaio.

I dubbi dei sindaci
Quest’ultima ipotesi darebbe una spiegazione anche alle segnalazioni arrivate da tanti sindaci lombardi, che dal 13 al 20 gennaio hanno notato una serie di anomalie nei dati relativi ai casi attivi nei loro comuni. In teoria i due flussi, quello che viene trasmesso all’Iss e quello comunale, dovrebbero essere ben separati. Ma i due problemi rilevati sono molto simili. La prima sindaca che si è accorta della discrepanza è Caterina Molinari, di Peschiera Borromeo, in provincia di Milano. Molinari ha notato che, dal 12 al 13 gennaio, i contagiati nel suo comune erano passati da 400 a 1.200. Dal 22 gennaio i contagiati erano poi scesi a 395 e il giorno successivo addirittura a 82. Anche il sindaco di Segrate, Paolo Micheli, ha verificato che nel suo comune i casi attivi erano passati da 504 a 102 dal 22 al 23 gennaio.

Questi dati sono stati citati anche durante la conferenza stampa dei sindaci di sette capoluoghi lombardi – Milano, Bergamo, Lecco, Brescia, Varese, Cremona e Mantova – che hanno chiesto a Regione Lombardia di rendere disponibili tutti i dati per fare chiarezza sulla vicenda.

– Leggi anche: Moratti, il Pil della Lombardia e i vaccini

Il sindaco di Bergamo Giorgio Gori ha spiegato che se i dati fossero stati disponibili agli esperti, qualcuno si sarebbe accorto ben prima dell’errore. «È possibile che questo errore non riguardi solo l’ultimo periodo, ma che si sia accumulato da ottobre», ha detto Gori. «Dobbiamo capire se questi errori hanno influito sulla zona rossa della settimana scorsa, oppure anche nei provvedimenti prima di Natale. Vogliamo tutti i dati trasmessi all’Istituto di sanità in formato open, così come quelli dei singoli comuni. È una questione di fiducia dei cittadini e trasparenza».

Il sindaco di Milano Giuseppe Sala ha detto che non si vogliono fare processi, ma correggere malfunzionamenti. «Per far funzionare le macchine amministrative serve la capacità politica e anche tecnica. Dobbiamo ripartire da un’interpretazione tecnica».

Le risposte della giunta lombarda
Regione Lombardia ha contestato tutte le note e le ricostruzioni fatte dall’Istituto superiore di sanità e dal ministero della Salute. Solo Trivelli ha provato a rispondere nel merito, senza però chiarire fino in fondo cosa è successo. Negli ultimi giorni il presidente Attilio Fontana ha sempre sostenuto che la Lombardia aveva sempre inviato dati corretti e che il problema è nell’algoritmo utilizzato per calcolare l’indice Rt. «I dati richiesti alla Lombardia sono sempre stati forniti con puntualità e secondo i parametri standard. Semmai qualcuno a Roma dovrebbe chiedersi come mai Regione Lombardia abbia dovuto segnalare il “mal funzionamento” dell’algoritmo che determina l’Rt dell’Iss», ha detto Fontana. Anche Letizia Moratti, neo assessora al Welfare, ha negato che i dati fossero sbagliati.

Il presidente della Regione Lombardia Attilio Fontana (LaPresse – Claudio Furlan)

Il presidente dell’Istituto superiore di sanità Silvio Brusaferro ha spiegato che l’algoritmo funziona allo stesso modo per tutte le regioni da 36 settimane. «Tutte le variabili che contiene, e il modo nel quale si arriva alla definizione del rischio, sono evidenti anche dal materiale fornito nel rapporto pubblico e che si trova su siti ufficiali», ha detto Brusaferro.

Fontana è poi intervenuto durante la trasmissione “Dentro i fatti” di Tgcom24: «Io non mi diverto a dire “è colpa dell’Istituto superiore”, “è colpa del ministero”, “è colpa della Regione Lombardia”: probabilmente non è colpa di nessuno», ha detto il presidente.