Come fa una regione a finire in zona rossa? Chiariamo i 21 indicatori

Carlo Cottarelli, Giulio Gottardo e Stefano Olivari

16 novembre 2020

L’Osservatorio CPI, in base alla documentazione ufficiale della Presidenza del Consiglio, del Ministero della Salute e dell’ISS, ha ricostruito come i celebri “21 indicatori” sono utilizzati, attraverso il misterioso “algoritmo”, per classificare le regioni italiane in gialle, arancioni e rosse, dove i tre colori corrispondono alle tre diverse intensità delle restrizioni introdotte con il DPCM 3 novembre 2020. Questa ricostruzione è necessaria perché: (i) il sistema adottato è complicato (cosa inevitabile per cercare di considerare tutti gli aspetti rilevanti); (ii) la documentazione ufficiale è dispersiva e, in diversi passaggi, di non facile lettura (questo si poteva evitare). Non sorprende quindi che ci siano stati vari appelli per una maggior trasparenza nel processo di “colorazione” delle regioni.

Due avvertenze:

• Abbiamo ricostruito i principali passi del processo, ma alcuni restano poco chiari. Li abbiamo esplicitamente segnalati. Sarebbe perciò opportuno se il Ministero della Salute producesse un documento che ufficialmente chiarisse del tutto la questione.

• Sebbene il processo per stabilire il colore di una regione sia complesso, tre indicatori sono cruciali. Il primo, di gran lunga più importante, è l’Rt (quante persone in media sono contagiate da una persona contagiata). Se l’Rt è sotto 1,25 una regione sarà automaticamente gialla a prescindere dagli altri indicatori, il che spiega perché anche regioni con situazioni ospedaliere in difficoltà e una crescita nel numero di contagiati (purché non troppo rapida, come accade se l’Rt è inferiore a 1,25) possano essere considerate gialle. Inoltre, l’Rt ha un ruolo importante anche nella determinazione del “rischio”, ovvero dell’altro aspetto – oltre all’Rt stesso – che determina il colore di una regione. Gli altri due indicatori chiave sono l’occupazione dei posti letto in Area Medica e in Terapia Intensiva, che hanno un ruolo importante nella determinazione del “rischio”.

La nota è stata ripresa da Repubblica in questo articolo del 16 novembre 2020.

* * *

I 21 indicatori

Il DM 30 aprile 2020 elenca i 21 indicatori (di cui 5 opzionali a discrezione delle regioni), le relative soglie critiche, i valori di allerta e le fonti dati da cui si ricava il rischio epidemico di una regione.

Gli indicatori sono divisi in 3 gruppi:

La “capacità di monitoraggio”, cioè la qualità dei dati e dei sistemi di sorveglianza (sei indicatori numerati da 1 a 1.6);
La “capacità di accertamento diagnostico, indagine e gestione”, cioè l’abilità del sistema di testare tempestivamente i casi sospetti (da 1 a 2.3) e di garantire risorse adeguate per il contact-tracing, l'isolamento e la quarantena (da 2.4 a 2.6);
La “trasmissibilità dei contagi e la tenuta dei servizi sanitari”, cioè quanto rapidamente si diffondono i contagi (da 1 a 3.7) e quanto i sistemi sanitari e assistenziali sono sovraccaricati (3.8 e 3.9).

I valori di questi indicatori sono raccolti “almeno settimanalmente”, attraverso il “Rapporto sul monitoraggio della pandemia” dal Ministero della Salute che determina, per ogni indicatore, se eccede o meno certe soglie di sicurezza.^[1] È un po’ come gli indicatori che avete sul cruscotto: il tachimetro vi dice se state al di sopra o al di sotto di un “limite di velocità”. Se siete al di sopra scatta l’allerta.^[2]

Qui, per darvi un’idea, un estratto dell’elenco, relativo al primo degli indicatori (Tabella 1).

L’indicatore (prima colonna) fa parte di quelli del primo gruppo (capacità di monitoraggio). Ha il numero 1.1 (seconda colonna). Si riferisce al rapporto tra il numero di casi sintomatici di cui si conosce la data d’inizio dei sintomi rispetto al totale dei casi sintomatici rilevati nella settimana in questione (terza colonna).^[3] La soglia è del 60 per cento con un trend in miglioramento (quarta colonna): al di sopra di questa soglia (a meno che non si stia peggiorando l’andamento) l’indicatore è favorevole.^[4] Al di sotto è sfavorevole. Da notare che, senza una chiara necessità, la quinta colonna riporta la stessa informazione: se si è sotto il 60 per cento l’indicatore segnala una “allerta”. La cosa è ovvia e non è chiaro perché ci sia stato bisogno di aggiungere una tale colonna. L’ultima colonna riporta la fonte dei dati.

Come è stata determinata la soglia del 60 per cento? Perché non 70 o 90 per cento? La stessa domanda vale per tutte le soglie e la risposta è simile: non si sa. In presenza di rischi sanitari (o economici, dato che approcci simili sono usati anche in economia) osservati da tempo (per esempio rischi di infarto) le soglie sono solitamente determinate attraverso processi statistici che guardano a precedenti crisi simili.^[5] Nel caso del Covid, un virus nuovo, un tale approccio non era possibile per mancanza di dati sperimentali sul passato. Probabilmente, quindi, gli esperti che hanno fissato queste soglie hanno utilizzato il loro “giudizio”, senza una precisa validazione statistica, un’imperfezione purtroppo inevitabile.

L’elenco completo degli indicatori e delle relative soglie è riportato nella Tavola 1 in Appendice.

Come si valuta il rischio

Il primo passo nell’uso di questi indicatori consiste nella “valutazione della qualità delle informazioni raccolte” utilizzando gli indicatori dall’1.1 all’1.6. Questo consente di capire se i dati disponibili siano attendibili e monitorare la diffusione. Sembrerebbe trattarsi di una specie di test di ingresso per proseguire nella valutazione. Non è chiaro però come questi sei indicatori siano combinati per valutare se la qualità delle informazioni, nel complesso, sia adeguata. Né è chiaro cosa accadrebbe se tale qualità fosse ritenuta inadeguata. Nell’ultimo rapporto settimanale, alcune regioni hanno valori insoddisfacenti per alcuni indicatori, ma questo non sembra avere avuto conseguenze sui passi successivi. In alcuni casi, tuttavia, è chiaro che la mancanza di informazioni adeguate (per esempio quelle necessarie per calcolare l’indice Rt) comportano poi, come dovrebbe essere, il fallimento del relativo test.
I restanti indicatori sono quelli fondamentali per classificare ogni regione secondo due dimensioni:

La “probabilità di infezione/trasmissione“ del virus, cioè quanto è probabile che il virus si diffonda. Questa dimensione è valutata utilizzando gli indicatori dal 3.1 al 3.7 e pare, anche se non è esplicitamente indicato, quelli dal 2.1 al 2.6.
L’“impatto” ossia “la gravità della patologia con particolare attenzione a quella osservata in soggetti con età superiore ai 50 anni” (DM 30 aprile 2020, p.5). Questa dimensione è valutata utilizzando 2 indicatori (3.8 e 3.9).

Quindi, la prima dimensione guarda a quanto si è probabile che il virus si diffonda, la seconda a quanto può essere dannosa la sua diffusione.

Entrambe le dimensioni possono assumere quattro valori: molto basso, basso, moderato, alto. Una prima classificazione delle regioni, in termini di “rischio”, avviene incrociando il valore delle due dimensioni, come indicato nella tabella (“Matrice di attribuzione del rischio”) qui sotto:

Per esempio, una regione che ha una probabilità “bassa” e un impatto “alto” è classificata come a “rischio moderato”. Una regione che ha una probabilità “alta” e impatto “moderato” è classificata come a “rischio alto”. Attenzione: non siamo ancora arrivati al colore finale di ogni regione. Prima di affrontare quest’ultimo passaggio è però necessario fare un passo indietro e vedere come i 13 indicatori relativi alla probabilità e i 2 indicatori relativi all’impatto sono utilizzati per classificare le Regioni nelle relative due dimensioni.

La combinazione avviene attraverso due “strutture decisionali ad albero” (Fig. 1 e 2, riprodotte alle pp. 11-13 del DM 30 aprile 2020).^[6] Queste due strutture ad albero sono l’ “algoritmo” con cui si combinano gli indicatori. Vediamo come funzionano cominciando dalla Fig. 1, relativa alla dimensione probabilità.

Probabilità (Fig 1)

Per individuare la probabilità della minaccia sanitaria ci si chiede, andando per ordine:

Sono segnalati nuovi casi negli ultimi 5 giorni nella Regione/PPAA?^[7] A questa domanda non sono associati indicatori specifici: basta guardare il dato grezzo riportato nelle tavole di monitoraggio dei dati.^[8] Se la risposta è negativa, la probabilità è considerata molto bassa e ci si ferma qui. Se la risposta è affermativa, si passa alla domanda successiva. Naturalmente, questa domanda era rilevante solo nel corso dell’estate passata: al momento, ovviamente, con casi registrati in tutte le regioni, la domanda diventa di fatto retorica.
C’è un aumento della trasmissione? La trasmissione è considerata in aumento se si verificano almeno 2 elementi dei 3 seguenti: (1) aumento dei casi, (2) Rt>1, (3) aumento numero di focolai o aumento della loro dimensione. Per rispondere si guardano gli indicatori 3.1, 3.2, 3.4, 3.5 e 3.6. Gli indicatori opzionali, il 3.3 e 3.7, di fatto non sono considerati. Se la trasmissione non è in aumento, la probabilità è bassa. Altrimenti si passa alla domanda successiva.
C’è evidenza di trasmissione diffusa non gestibile con misure locali (tipo “zone rosse”)? La trasmissione sembrerebbe essere considerata diffusa e non gestibile localmente se almeno 2 tra i 6 indicatori che misurano la possibilità di circoscrivere localmente il contagio (da 2.1 a 2.6) sono insoddisfacenti. Se la trasmissione è diffusa e non gestibile localmente la probabilità è alta, altrimenti è moderata.^[9]

Impatto (Fig. 2)

Passiamo alla dimensione “impatto” per valutare quanto può essere dannosa la diffusione del virus. Qui ci si chiede:

Sono segnalati nuovi casi in soggetti di più di 50 anni negli ultimi 5 giorni? Come per la domanda 1 della dimensione precedente, non si specifica un indicatore: basta guardare i dati anagrafici dei positivi raccolti da ogni regione. Se non ci sono nuovi casi in soggetti di più di 50 anni, l’impatto è molto basso. Altrimenti si passa alla domanda successiva. Nella attuale situazione di diffusa pandemia, questa domanda diventa praticamente retorica.
Vi sono segnali di sovraccarico dei servizi sanitari? Qui è necessario che i due indicatori sull’occupazione dei posti letto in terapia intensiva (3.8) e dei posti in area medica (3.9) siano sopra-soglia (non è chiaro se debbano essere entrambi sopra-soglia o se ne basti uno). In ogni caso, se non ci sono segnali di sovraccarico dei servizi sanitari, l’impatto è basso. Altrimenti si passa alla domanda successiva.
Ci sono stati nuovi focolai in luoghi che ospitano persone vulnerabili (RSA, case di cura, ospedali)? Non è chiaro quali indicatori vengano usati specificatamente per rispondere a questa domanda, anche se alcune informazioni relative all’indicatore 5 si riferiscono proprio alla diffusione del contagio alle RSA. C’è un margine di discrezionalità? Non è dato sapere. Anche qui, se ci sono stati nuovi focolai in luoghi che ospitano persone vulnerabili, l’impatto è alto. Altrimenti è moderato.

Ora che abbiamo capito come si definisce il rischio di ciascuna regione (cioè in quale casella della matrice del rischio sopra riportata si inserisce una regione), passiamo alla fase successiva.

Come si assegna il colore a una regione?

Una premessa: all’attuale stato di cose, l’Italia si trova in quello che l’ISS e il governo chiamano “Scenario 3”, ovvero una situazione in cui “molte Regioni sono classificate a rischio alto, anche se sono possibili situazioni di rischio inferiore”. Nello Scenario 3 sono previsti i cosiddetti “lockdown differenziati” tra regioni. Se si dovesse passare allo Scenario 4, le restrizioni sarebbero molto meno differenziate tra territori.

Dato lo scenario attuale, ci si attiene agli art. 2 e 3 del DPCM del 3 novembre 2020 per determinare il colore di ogni regione.^[10]Il colore di una regione, definito dalle restrizioni che a questa si applicano sulla base di tale DPCM, dipende sia dal rischio appena descritto, sia dall’Rt della regione stessa. Ricordiamo che l’Rt entrava anche come uno degli indicatori (il 3.2) per determinare la collocazione nella matrice del rischio. L’Rt (la cui stima è basta su dati disponibili con ritardo e soggetta a elevati margini di incertezza) assume, quindi, un ruolo particolarmente importante. Il Ministero della Salute e l’ISS avevano, in precedenza, indicato (anche se in modo non vincolante) un diverso criterio decisionale, per individuare il colore di una regione, un criterio che non faceva uso una seconda volta dell’Rt.^[11] In ogni caso, il colore di una regione è:

Rosso, se il rischio è alto e l’Rt maggiore di 1,5;
Arancione, se il rischio è alto e l’Rt compreso tra 1,25 e 1,5;^[12]
Giallo in tutti gli altri casi.

Per esempio, la Campania pur presentando un rischio alto (in base ai dati settimanali pubblicati) già a partire da inizio novembre dovrebbe essere passato da gialla a rossa per l’aumento dell’Rt oltre 1,5.

Si noti che, al momento, se anche una regione avesse un rischio classificato “molto basso” e un Rt ugualmente basso verrebbe comunque classificata come regione gialla, dato che le restrizioni minime introdotte dal sopra citato DPCM si applicano comunque a tutte le regioni (non esistono regioni “verdi”).

Ci sono elementi di discrezionalità nelle scelte delle chiusure?

In base a quanto detto finora, al netto di alcuni passaggi che potrebbero essere chiariti meglio, sembrerebbe che l’assegnazione dei colori alle regioni sia un processo abbastanza “automatico” e basato sui dati. Tuttavia, le ragioni dietro alcune scelte cruciali sono ignote.

Innanzitutto la definizione delle soglie dei 21 indicatori non è giustificata in modo alcuno, tantomeno è descritto il processo che le ha determinate.

Non si capisce perché nel DPCM del 3 novembre, per definire i criteri che determinano il colore di una regione, non sia stata seguita la proposta, non vincolante ma sicuramente informata, del documento congiunto Ministero della Salute – ISS. Questa proposta non si limitava a prendere in considerazione, insieme al rischio settimanale, un solo indicatore non sempre affidabile come l’Rt, ma basava il colore di ciascuna regione sull’evoluzione temporale del rischio stesso.

Infine, una recente nota dell’ISS lascia alcuni dubbi circa la discrezionalità nella valutazione di probabilità, impatto e quindi rischio.^[13] Da questa nota emergono infatti, parallelamente a quanto spiegato finora, dei “criteri” aggiuntivi (autovalutazione per la probabilità, criterio qualitativo per l’impatto, criterio di precauzione circa le segnalazioni delle regioni riguardanti la tenuta della sanità). Viene aggiunta anche una terza dimensione di rischio (la resilienza territoriale), non definita come elemento a sé stante in alcun documento precedente. Infatti, si sostiene che, “qualora si riscontrino molteplici allerte relative alla resilienza territoriale, il livello di rischio [di una regione] deve essere elevato al livello di rischio immediatamente successivo”. Tuttavia, non è fornito un ulteriore “algoritmo” (come gli alberi decisionali delle Fig. 1 e 2 o la Tabella 4) per incorporare questa valutazione nella determinazione del rischio regionale.

Appendice

^[1]Qui l’ultimo rapporto disponibile, riferito alla settimana 26 ottobre-1novembre 2020, aggiornato il 9 novembre 2020: http://www.salute.gov.it/portale/news/documenti/Epi_aggiornamenti/allegati/DATI_MONITORAGGIO_9_11_2020.pdf.

^[2] Per ora i dati disponibili sul monitoraggio riguardano solo le ultime due settimane (report n.24 e n.25). http://www.salute.gov.it/portale/nuovocoronavirus/dettaglioContenutiNuovoCoronavirus.jsp?lingua=italiano&id=5351&area=nuovoCoronavirus&menu=vuoto.

^[3]Il lettore attento avrà notato che l’indicatore si riferisce ai casi “per mese”. Non è chiaro come questa indicazione sia correlata alla periodicità settimanale del monitoraggio.

^[4] Per trend in miglioramento si intende l’andamento dell’indicatore rispetto alla settimana precedente.

^[5]Spesso si scelgono le soglie che minimizzano la somma dei due errori possibili utilizzando sistemi di indicatori SI/NO, cioè quelli, da un lato, di segnalare una crisi che non avviene (cioè di “gridare al lupo”) e, dall’altro, di non individuare per tempo una crisi che poi si verifica.

^[6]I sistemi decisionali ad albero (Classification and regression trees) sono abbastanza usati in medicina ed economia. Si veda, per esempio, per la diagnosi di attacchi cardiaci, https://www.researchgate.net/publication/261020492_Early_Diagnosis_of_Heart_Disease_Using_Classification_And_Regression_Trees; e, per valutare il rischio di crisi del debito: https://econwpa.ub.uni-muenchen.de/econ-wp/if/papers/0509/0509003.pdf.

^[7]L’acronimo PPAA si riferisce alle provincie autonome di Trento e Bolzano.

^[8] Colonna 3 della tavola a pagina 3 del Rapporto di monitoraggio. http://www.salute.gov.it/portale/news/documenti/Epi_aggiornamenti/allegati/DATI_MONITORAGGIO_9_11_2020.pdf.

^[9] Le informazioni relative a questa domanda sono dedotte dalla infografica esplicativa dell’Istituto Superiore della Sanità (ISS).Vedi: https://www.iss.it/covid-19-primo-piano/-/asset_publisher/yX1afjCDBkWH/content/id/5513288. Questa infografica genera però una certa confusione introducendo una terza dimensione, la “resilienza territoriale”, che non è nient’altro che l’insieme degli indicatori che rispondono alla domanda 3 appena sopra presentata.

^[10]Vedi http://www.governo.it/it/articolo/coronavirus-il-presidente-conte-firma-il-dpcm-del-3-novembre-2020/15617.

^[11] Il documento che contiene questo criterio, insieme ad altre proposte su come gestire i vari scenari epidemici è http://www.salute.gov.it/imgs/C_17_pagineAree_5373_16_file.pdf.

^[12] Più specificamente, a far fede è l’intervallo di confidenza al 95 per cento del valore dell’Rt.

^[13] Vedi https://www.iss.it/covid-19-primo-piano/-/asset_publisher/yX1afjCDBkWH/content/id/5513288.

Archivio Studi e analisi

Scarica il PDF

Come fa una regione a finire in zona rossa? Chiariamo i 21 indicatori (16 novembre 2020)

Come fa una regione a finire in zona rossa? Chiariamo i 21 indicatori