L’indice Rt sta diventando meno affidabile?
Il numero che mostra l'andamento dell'epidemia – e contribuisce a determinare le chiusure nelle regioni – presenta qualche problema, dovuto alla qualità dei dati utilizzati per calcolarlo
Negli ultimi giorni alcuni esperti hanno messo in dubbio l’affidabilità dei dati utilizzati per il calcolo del cosiddetto “indice Rt“: un numero entrato nel lessico indispensabile per seguire le notizie che spiegano il coronavirus, che l’Istituto superiore di sanità definisce «una grandezza fondamentale per capire l’andamento dell’epidemia».
Sempre l’Istituto Superiore di Sanità spiega cos’è: «Il numero di riproduzione netto Rt indica il numero medio di infezioni secondarie generate da una persona infetta ad una certa data». Significa che questo numero indica quante persone vengono contagiate da una sola persona, in media e in un certo arco di tempo. Se Rt è 4, per esempio, vuol dire che in media ogni infetto contagia quattro persone nel periodo considerato, e queste quattro persone ne contageranno altre quattro a testa, nel periodo successivo, se l’indice resta costante. L’indice Rt non è molto diverso dall’indice R0, un altro numero di cui si è parlato molto: se però R0 mostra quanto può essere trasmessa una malattia all’inizio dell’epidemia (da cui il valore 0), Rt misura la trasmissione dopo l’introduzione di misure per limitare il contagio.
Da qualche settimana, poi, l’indice Rt è importante anche perché determina gli scenari di progressione del virus nelle singole regioni, e quindi le misure restrittive da adottare con la zona rossa, arancione o gialla.
– Leggi anche: Il numero di cui parlano tutti
La cosa da tenere d’occhio per capire come vanno le cose è se l’indice Rt è inferiore o superiore a 1. Se si mantiene inferiore a 1 è una buona notizia: dato che ogni persona malata contagia in media meno di una persona, l’epidemia sta rallentando. Se invece l’indice continua a rimanere sopra il valore 1, significa che la trasmissione del contagio è ancora elevata. In Italia l’indice Rt è da tempo sopra 1, ma nelle ultime due settimane è sceso: da 1,72 di due settimane fa è passato a 1,43, secondo l’ultimo aggiornamento pubblicato venerdì scorso dall’Istituto Superiore di Sanità.
Un indicatore di questo tipo non è sempre assolutamente affidabile, per definizione. Se il risultato viene di solito semplificato con un singolo valore, l’indice Rt è composto infatti da tre numeri: un valore più basso e uno più alto, e una percentuale. Insieme, questi tre numeri formano quello che viene chiamato “intervallo di credibilità”. Per fare un esempio: se l’intervallo di credibilità è al 95% per un Rt compreso tra 1,45 e 1,83, significa che c’è una probabilità del 95% che l’Rt sia compreso tra questi due valori.
Inoltre, per arrivare a questi numeri servono calcoli che si basano sui dati raccolti ogni giorno dalle regioni: quanti sono i casi sintomatici e quando sono iniziati i sintomi. Se questi dati sono imperfetti o inaffidabili, diventa imperfetto o inaffidabile anche l’indice Rt.
– Leggi anche: Anche l’Abruzzo diventerà “zona rossa”
Uno dei problemi dei dati su cui si basa l’indice Rt è stato sollevato dal fisico Giorgio Parisi, presidente dell’accademia dei Lincei. In un articolo pubblicato sull’Huffington Post, Parisi scrive: «Il sistema di calcolo di Rt si basa sul numero di persone che sviluppano sintomi, ma se – per inefficienze di varia natura – questo numero non è corretto, il valore stimato di Rt diventa anch’esso un numero non corretto. Se la settimana scorsa avevamo un Rt che con il 95% di probabilità era compreso tra 1,45 e 1,83, questa settimana il valore è compreso tra 1,08 e 1,81. […] In una settimana l’ampiezza della forchetta si è raddoppiata, e questo aumento è estremamente preoccupante». L’aumento dell’intervallo – o “forchetta”, per usare un termine legato ai sondaggi – è causato da un peggioramento della qualità dei dati raccolti dalle regioni.
L’Istituto Superiore di Sanità riceve un flusso di dati più completo rispetto a quello che vediamo nel report giornaliero della Protezione Civile. Il flusso dell’ISS, infatti, ha una serie di informazioni in più: lo stato clinico dei contagiati (asintomatico, paucisintomatico, lieve, severo, critico), la data di inizio dei sintomi e la comorbidità, cioè se la persona ha più patologie.
Al momento, per vari motivi le regioni non inviano subito queste informazioni per tutti i nuovi positivi. Spesso viene inviata solo l’accertata positività al tampone, la presenza di sintomi e nient’altro: ma per calcolare l’indice Rt è molto importante avere anche la data di inizio dei sintomi. Quando le indagini epidemiologiche accumulano ritardi, l’Istituto Superiore di Sanità riceve prima i dati dei nuovi positivi, che sono i più immediati da registrare. Poi, nei giorni successivi, le informazioni degli stessi casi verranno completate inserendo anche la data di inizio dei sintomi, se è disponibile.
– Leggi anche: Quali criteri usa il governo per definire le aree rosse
Analizzando i dati pubblicati dall’Istituto Superiore di Sanità si può vedere che il rapporto tra i nuovi positivi in un certo giorno e i casi con quella data di inizio sintomi è quasi sempre costante. L’andamento degli ultimi mesi dimostra che quando i positivi crescono, anche i sintomatici riferiti alla data di inizio sintomi crescono. Dall’analisi di Parisi emerge però che nella settimana del 19 ottobre, il numero dei casi riferiti alla data di inizio sintomi smette di crescere e il divario con i casi positivi continua ad ampliarsi anche nella settimana successiva. Il divario verrà colmato solo con il passare dei giorni e l’arrivo di informazioni dalle regioni. Significa che i dati relativi ai sintomatici negli ultimi giorni di monitoraggio arrivano in ritardo, e dunque nel complesso i dati non sono consolidati.
In questi grafici di OpenCovid viene visualizzata la differenza tra il numero di casi al momento della pubblicazione del report con il calcolo dell’indice Rt, e il consolidamento dei dati nei giorni successivi.
E se guardiamo ai casi per data inizio sintomi del periodo 8-21 ottobre (quelli utilizzati per stimare Rt tanto per essere chiari) scopriamo che non sono i 63.195 utilizzati per la stima del precedente Report, ma sono diventati *almeno* 96.909.https://t.co/QgbGz7l4qS
— OpenCovid-mr (@OpencovidM) November 6, 2020
Tutti questi problemi influiscono anche sull’indice Rt, che rischia di essere sottostimato. «Si osserva complessivamente una criticità nel mantenere elevata la qualità dei dati riportati al sistema di sorveglianza integrato sia per tempestività (ritardo di notifica dei casi rapportati al sistema di sorveglianza su dati aggregati coordinati dal Ministero della Salute) sia per completezza. Come conseguenza questo può portare ad una sottostima della velocità di trasmissione e dell’incidenza», ha scritto l’ISS negli ultimi due rapporti pubblicati.
Un altro limite dei dati che servono per calcolare l’indice Rt riguarda i criteri di accesso ai tamponi. In un’intervista a Repubblica, il direttore di Ats Milano Vittorio Demicheli spiega che «con il tracciamento che è saltato l’Rt non funziona bene, potrebbe essere sottostimato». Il tracciamento a cui si riferisce è il contact tracing, cioè la capacità di individuare i positivi e soprattutto i loro contatti. In molte regioni d’Italia le Asl, o Ats, hanno dovuto rivedere i criteri di monitoraggio a causa della notevole crescita dei contagi: a Milano, per esempio, Ats ha deciso di fare il tampone solo ai sintomatici e non più ai contatti stretti, e lo stesso succede in Piemonte.
La scelta è stata dettata anche dall’allungamento dei tempi di accesso ai tamponi, che in alcuni casi vengono eseguiti fino a 10 giorni dalla segnalazione dei sintomi. L’ultimo rapporto dell’Istituto Superiore di Sanità dice che il tempo mediano tra la data di inizio dei sintomi e la diagnosi «ha oscillato tra i 4 e i 5 giorni fino a metà giugno. Da metà giugno a fine ottobre si è osservata una riduzione a 2 giorni e dal 27 ottobre si osserva nuovamente un aumento del tempo mediano che intercorre tra l’inizio dei sintomi e la diagnosi che sale a 5 giorni». Con un allungamento dei tempi di monitoraggio aumenta il rischio di non intercettare molti paucisintomatici, cioè le persone con sintomi lievi, che possono decidere di non sottoporsi al tampone senza sintomi gravi.
– Leggi anche: Che fine ha fatto il vaccino di AstraZeneca
L’ultimo problema da non sottovalutare è il numero indicato al punto 1.1 tra i 21 indicatori scelti dal ministero della salute per valutare l’andamento dell’epidemia. Questo punto indica il «numero di casi sintomatici notificati per mese, in cui è indicata la data di inizio sintomi, sul totale dei casi sintomatici notificati al sistema di sorveglianza nello stesso periodo».
Per avere un minimo livello di monitoraggio accettabile per eseguire il calcolo, il rapporto tra i casi in cui è indicata la data di inizio sintomi e i casi sintomatici non deve essere inferiore al 60%. Nelle note, il ministero e l’ISS dicono che quando l’indicatore è sotto la soglia del 60%, «il dato relativo a Rt puntuale calcolato sulla base della data di inizio sintomi è verosimilmente sottostimato». Secondo l’ultimo report, riferito alla settimana tra il 2 e l’8 novembre, ci sono tre regioni sotto soglia: Basilicata, Calabria, Valle d’Aosta. Altre sei regioni – Abruzzo, Lazio, provincia autonoma di Bolzano, Sicilia, Umbria e Veneto – hanno un peggioramento di questo dato che influisce direttamente sul calcolo dell’indice Rt.
Stefano Merler, ricercatore della fondazione Bruno Kessler che collabora con il ministero della Salute per l’analisi dei dati epidemiologici, durante una conferenza stampa organizzata dal ministero ha risposto alle critiche difendendo la credibilità dei dati, ma senza chiarire i dubbi concreti che sono stati sollevati. «Le stime di Rt dell’ultimo monitoraggio regionale sono tutto tranne che incerte», ha detto Merler. «Anche nelle regioni più incerte, come il Molise, hanno una stima con un intervallo di confidenza molto ristretto, quindi sono affidabili. Noi utilizziamo solo i dati dei casi sintomatici, ma l’andamento dell’indice Rt nel corso degli ultimi mesi è stato confermato da tutti gli indicatori più solidi, come le ospedalizzazioni».
Ieri l’Istituto Superiore di Sanità ha cercato di fare chiarezza pubblicando alcune Faq per spiegare quali dati vengono analizzati, e come.
Perché i dati utilizzati sono i più aggiornati possibili?
L’acquisizione dei dati epidemiologici sulle infezioni è affetta da una serie di ritardi, alcuni dei quali non comprimibili: in particolare, il tempo tra l’evento infettivo e lo sviluppo dei sintomi (tempo di incubazione), quello tra i sintomi e l’esecuzione del tampone, quello tra l’esecuzione del tampone e la conferma di positività, e quello tra la conferma di positività e l’inserimento nel sistema di sorveglianza integrata ISS. Il ritardo complessivo tra infezioni e loro rilevamento nel sistema di sorveglianza è valutato e aggiornato settimanalmente analizzando la stabilità del numero di casi (sintomatici o ospedalizzati) riportato a ciascuna data. Su queste valutazioni si basa la scelta della data più recente alla quale si possono considerare sufficientemente stabili le varie stime di Rt.Si noti che i possibili rallentamenti nell’effettuazione e analisi dei tamponi, conseguenti all’aumentata incidenza di infezione, impattano allo stesso modo tanto i conteggi aggregati di nuovi positivi riportati quotidianamente dal Dipartimento della Protezione Civile quanto i dati contenuti nel sistema di sorveglianza integrata.
Perché calcolare l’Rt sui soli casi sintomatici o ospedalizzati lo rende affidabile anche quando i sistemi di contact tracing sono in difficoltà?
Il metodo statistico di calcolo di Rt è robusto se viene calcolato su un numero di infezioni individuate secondo criteri sufficientemente stabili nel tempo.Regione per regione, i criteri con cui vengono individuati i casi sintomatici o i criteri con cui vengono ospedalizzati i casi più gravi sono costanti, e il numero di questo tipo di pazienti è quindi strettamente legato alla trasmissibilità del virus.
Al contrario, l’individuazione delle infezioni asintomatiche dipende molto dalla capacità di effettuare screening e contact tracing da parte dei dipartimenti di prevenzione e questa può variare nelle diverse fasi epidemiche. Ad esempio, tali capacità aumentano tipicamente quando diminuisce l’incidenza totale della malattia e quindi il carico di lavoro sul sistema sanitario. Come conseguenza, in questo contesto, un maggiore o minore aumento dei casi asintomatici nel tempo non dipende direttamente dalla trasmissibilità del virus. Per questi motivi, le stime di R0 ed Rt che forniamo non tengono conto delle infezioni asintomatiche.
Si è scelto, pertanto, di stimare la trasmissibilità di SARS-COV-2 nelle diverse regioni italiane fin da febbraio 2020 a partire dalla curva dei casi sintomatici giornalieri, in quanto meno influenzato dal cambiamento che si è verificato in Italia nelle politiche di accertamento diagnostico su soggetti asintomatici, e sui casi con storia di ospedalizzazione sulla base dei quali vengono realizzate le proiezioni dei tassi di occupazione dei posti letto nei successivi 30 giorni.