Pandemocrazia
DOI: 10.1401/9788815411297/c3
L’infodemia da Covid-19 ci insegna
che il «pensiero statistico» è un’esigenza reale, non fantascienza, e una vera e propria
competenza di cittadinanza democratica. Discussione e riflessione mediatiche sui numeri
della pandemia in Italia si sono caratterizzate per la vastità e varietà di voci, e per
una certa mancanza di regole e di standard. Riguardo alla comunicazione istituzionale, i
bollettini quotidiani della protezione civile congiuntamente all’Istituto Superiore di
Sanità durante la prima ondata della pandemia, sono stati successivamente sostituiti
prevalentemente da politici, dal ministro della Salute e i suoi portavoce. L’enorme
dibattito mediatico ha visto il contributo di una batteria di figure, definite
genericamente «scienziati»
[3]
ma con competenze e approcci scientifici estremamente diversificati:
virologi, infettivologi, biologi, medici-epidemiologi… fra gli altri, e in misura di
molto inferiore, biostatistici, statistici epidemiologi e metodologi. Altri Paesi hanno
fatto scelte diverse e contrarie. In Europa la Gran Bretagna ha adottato un rigido
protocollo che ha ristretto le apparizioni mediatiche essenzialmente al primo ministro,
a giornalisti specializzati in data-journalism e a un unico esperto
statistico, David Spiegelhalter, accademico popolarissimo per la sua chiarezza ed
efficacia nella comunicazione al pubblico generale di complessi concetti quantitativi.
Nel suo libro del 2019, The Art of Statistics, Spiegelhalter offre
una definizione essenziale di statistica: «usiamo la scienza statistica per rispondere
alle domande che ci poniamo quando cerchiamo di capire meglio il mondo» [Spiegelhalter
2019]. Ma cosa intendiamo per pensiero statistico e perché ne abbiamo bisogno
specialmente in tempi di infodemia? Il pensiero statistico, un concetto complesso e
articolato, coinvolge «la natura onnipresente della variabilità
¶{p. 71}[…] quando e come usare gli appropriati metodi di analisi dei
dati, sintesi numeriche e rappresentazioni grafiche […] la comprensione della natura del
campionamento, come effettuiamo l’inferenza dal campione alla popolazione […] come
utilizziamo stime e probabilità». E ancora: «riconoscere e capire l’intero processo:
dalla formulazione della domanda, alla raccolta dati, alla scelta delle analisi per
testare le ipotesi di ricerca» [Ben-Zvi e Garfield 2004, 7]. Il pensiero statistico si
fonda sulla cognizione che i dati (datum,
data) raccolti nella realtà fisica (le persone, le società) o virtuale
(Internet) sono soltanto la materia grezza per creare informazioni, cioè nuova
conoscenza, circa le complesse strutture del mondo attuale e le loro interazioni. I dati
hanno molte «facce» e natura diversa: possono essere il risultato di categorizzazioni,
di conteggi, di misure, e per questo, in genere, non esplicitano da soli l’informazione.
Il dato, ad esempio una singola categoria (favorevole, giovane…) o un singolo numero
(3,250 gr…), sebbene raccolto nella realtà, di per sé è «muto». Quanto più complessa e
variabile è la realtà in cui il dato è osservato, tanto più nascosta nel dato stesso è
l’informazione riguardo a quella realtà. Possiamo vedere la scienza statistica come la
cassetta degli attrezzi per estrarre dai dati l’informazione, per raccontare la storia
che quei dati possono raccontare, attrezzi ad hoc per la «faccia» e
la natura di quei dati.
Alla complessità e variabilità del
nostro mondo, concetto quest’ultimo che include anche differenze e disuguaglianze, si
aggiunge di norma la parzialità dei dati. I dati sono quasi sempre parziali, cioè un
campione in grado di riflettere solo una parte, in genere molto ristretta, della realtà
che ci interessa, il che porta con sé una naturale esigenza di rischiose
generalizzazioni e inferenze.
I numeri della pandemia e
l’informazione quantitativa legata al Covid-19 sono, nella quasi totalità, dati
campionari. Lo è ad esempio il dato «nuovi casi» diffuso quotidianamente, che informa
circa il numero di tamponi positivi fra quelli confermati e
registrati dalle autorità sanitarie quel giorno, tamponi eseguiti sul ristretto gruppo
di coloro che, per ragioni per lo più ignote e particolari, quel giorno si sono
sottoposti al test. Ciononostante, tale numero di «nuovi casi» è stato
¶{p. 72}(ed è) ampiamente interpretato come una stima quotidiana della
severità della pandemia in tutte le sue fasi, generalizzato all’intera popolazione
«degli Italiani», dimenticando anche le minime cautele che il pensiero comune riserva a
qualunque generalizzazione. Pensiero statistico è capacità di distinguere fra dati di
realtà «completi» e stime campionarie, è consapevolezza del rischio di errore
connaturato a qualunque stima ed ineliminabile da qualunque inferenza. L’attrezzo
ad hoc che nella metafora della cassetta degli attrezzi, offre
la scienza statistica è il controllo e la misura scientifica di questo rischio di
errore, mediante la potente teoria matematica delle probabilità. Se conosciamo solo
parte dei dati, come accade di regola con i numeri della pandemia e in particolare
nell’esempio dei «nuovi casi», è evidente il rischio di distorsione
(bias) e di grossolana approssimazione della punta
dell’iceberg, verosimilmente una sottostima molto lontana dalla realtà. Quale, allora,
l’informazione? Dove l’incremento di conoscenza dello stato della pandemia nel Paese e
del rischio per la nostra salute?
Pensiero statistico è padronanza del
fatto che possiamo misurare la probabilità dell’errore campionario
associato a qualunque stima, la sua possibile distorsione e quanto sia verosimilmente
vicina o lontana dalla verità. Ma tale misura oggettiva dell’affidabilità delle stime è
possibile se e soltanto se i dati (parziali) sono stati raccolti con un preciso metodo
di campionamento probabilistico. Ogni altro metodo per procurare un campione di dati è
non probabilistico e la qualità delle sue stime
non è oggettivamente, scientificamente quantificabile.
Asserzioni di uso comune quali «campione rappresentativo» o «campione rappresentativo
per quote di popolazione» sono confortanti e rassicurano, ma possono mascherare il
carattere non probabilistico di quel campione di dati, e nascondere
il fatto che l’errore statistico di quelle stime, anche quando calcolato automaticamente
dal computer, non ha fondamento scientifico. Rappresentatività, infatti, se in senso
letterale è caratteristica pregevole del campione, in termini scientifici non è la
caratteristica rilevante. Ciò che è importante è che il campione sia probabilistico,
cioè disegnato e selezionato casualmente, in modo non deterministico. In
¶{p. 73}tal modo la rappresentatività ne diviene il sottoprodotto, un
confacente effetto collaterale della casualizzazione, mediante la quale si sgombra il
campo da ogni distorsione e sistematicità che potrebbero derivare da scelte soggettive,
di convenienza o da selezioni ragionate. In altre parole, le stime prodotte sulla base
di qualunque campionamento non probabilistico sono di fatto
considerazioni soggettive, rispettabili come qualunque opinione, ma non scientificamente
validate.
In materia di salute pubblica e
sperimentazione scientifica, l’approccio più applicato nel mondo, Italia inclusa, è noto
come Evidence-Based Medicine, fondato su protocolli di legge e
rigorose metodologie probabilistiche, radicate nella teoria dei disegni sperimentali
casualizzati introdotta da Sir R.A. Fisher nella prima metà del Novecento [Rao 2007].
Nella lotta alla pandemia di Covid-19, le sperimentazioni mondiali che hanno portato
alla messa a punto dei vaccini approvati dall’autorità di farmaco-vigilanza italiana
sono state scientifiche, evidence-based e validate su base
probabilistica. Al contrario i numeri della pandemia in Italia, salvo eccezioni quali ad
esempio le ospedalizzazioni in terapia intensiva, sono quasi totalmente stime
campionarie, incluso il famoso indice Rt, poiché, come appare ovvio, in nessun caso è
stato possibile raggiungere e «tamponare» l’intera popolazione italiana. Si tratta,
invece, di stime basate su campioni autoformatisi, di emergenza e secondo la loro
accessibilità, in base a scelte e comportamenti individuali o in ottemperanza a
temporanei e mutabili obblighi di legge. Campioni, cioè, non
probabilistici. Se è vero che il decisore politico ha sempre dichiarato di
seguire il consiglio di esperti, scienziati e comitati tecnico-scientifici, è anche vero
che tale parere era largamente basato su questo tipo di stime, la cui distorsione e
precisione non è mai stato possibile quantificare scientificamente. Il nostro Paese non
è tutt’ora dotato di un campione probabilistico di sorveglianza per la popolazione
generale, per le scuole, per gli strati più vulnerabili della società, come testimonia
un articolo scientifico del giugno 2022 i cui autori, tutti italiani, includono due ex
presidenti Istat [Alleva et al. 2022]. Pensiero statistico è anche
la consapevolezza del diritto democratico alla trasparenza e alla riproducibilità del
processo di produzione di stime sulla ¶{p. 74}base delle quali sono
state prese difficili decisioni politiche e severe misure di salute pubblica. Dunque, il
pensiero statistico contribuisce al consolidamento dei valori democratici. Al pensiero
statistico educa un’adeguata statistical literacy.
7. Bisogni di «statistical literacy»: una storia circolare, interconnessa e multidimensionale
L’incertezza che ha permeato le
nostre vite nel tempo della pandemia caratterizza anche gran parte delle nostre
attività, decisioni e scelte. Il bisogno di rassicurazione può, almeno in parte,
spiegare la tendenza a percepire i risultati scientifici, i dati e le evidenze empiriche
come verità assolute, senza il necessario riferimento alla loro natura sperimentale,
parziale e probabilistica. La pandemia ci ha mostrato gli effetti di un tale approccio
dogmatico anziché pragmatico, che ha alimentato una certa diffidenza verso la scienza, e
in particolare il suo procedere per dubbi e ipotesi da validare o confutare. Il vivace
confronto mediatico fra esperti, intorno alla pandemia e ai suoi numeri, fra le tante
voci con differenti competenze ed approcci scientifici, è stato spesso letto come
conflittuale, contraddittorio e confondente
[4]
.
Statistical
literacy o alfabetizzazione statistica, è la capacità di riflettere
criticamente sui risultati dell’analisi statistica, forniti quale evidenza empirica a
supporto di un’affermazione [Berndt et al. 2021]. In passato
persona alfabetizzata, non analfabeta, era chi sapeva leggere, scrivere e «far di
conto». Alla luce dell’infodemia da Covid-19 tali competenze richiedono di essere
aggiornate, attualizzate e ridefinite. Il sistema dei 17 Sustainable
Development Goals esplicita numeracy fra i
target del goal 4: Ensure inclusive and equitable
quality education and promote lifelong learning opportunities for all e
per il monitoraggio dei progressi dei Paesi sottoscrittori dell’Agenda Onu 2030 prevede
l’indicatore 4.6.1 di proficiency in literacy
¶
and
numeracy. Il progetto Oecd Programme for the International
Assessment of Adult Competencies descrive numeracy
come nozione sfaccettata, articolata in due elementi principali:
numeracy competency and numerate behaviour associando con pari
importanza sia competenza sia comportamento, e infine la definisce «capacità di
accedere, utilizzare, interpretare e comunicare informazioni e concetti matematici, per
affrontare e gestire le necessità matematico-quantitative in una vasta gamma di
situazioni della vita adulta» [Oecd 2019]. All’interno di tale programma, la principale
fonte di dati per il calcolo dell’indicatore 4.6.1, è l’indagine campionaria su larga
scala Survey of Adult Skills, condotta in 40 Paesi nel mondo col
proposito di valutare «competenze cognitive e lavorative chiave per la partecipazione
sociale e la prosperità economica» [ibidem]. Il rapporto del 2019,
relativo alla terza e più recente tornata di tale indagine, stima il livello di
numeracy della popolazione italiana adulta «significativamente
al di sotto della media» dei 40 Paesi, posizionando il nostro Paese al 32° posto fra i
40 e penultimo in Europa. Il rapporto 2022 delle prove Invalsi [2022] ci informa che le
abilità matematiche dei nostri e delle nostre giovani sono in calo rispetto al periodo
pre-pandemia (2019). Il peggioramento è ancora più evidente per la coorte dell’ultimo
anno di scuola indagato (il 13°) con differenze fino a 13 punti percentuali se si
considera, complessivamente e indipendentemente dalla tipologia di scuola, la quota di
allievi e allieve che raggiungono i traguardi previsti di matematica. La crisi pandemica e il suo
dilagare, ben al di là di una mera crisi sanitaria, verso una crisi multidimensionale
(sociale, economica e finanziaria), ci pongono di fronte all’importanza di dati e
pensiero statistico per la pianificazione delle politiche e per le decisioni, e
soprattutto per la loro implementazione, monitoraggio, valutazione d’impatto e
validazione. La crisi pandemica, con la sua infodemia e i connessi rischi di
misinformazione, ci ha mostrato il pericolo di perderci in una selva
oscura di dati, e l’emergere del bisogno di una migliore attrezzatura
statistica. Anche più urgente nell’era della digitalizzazione: l’esasperata dimensione
di pubblico e velocità di diffusione offerte da media digitali e social, impongono di
trovarci sufficientemente capaci di distinguere informa
¶{p. 76}zioni
reali e «disturbate», imprecise, fuorvianti, ingannevoli e malevole. Un bisogno
circolare, che attraversa tutti gli strati della società democratica: per chi fa
informazione, per chi riceve informazione, per chi prende le decisioni, per la politica,
per la cittadinanza. Statistical literacy è competenza chiave per
essere e agire quali cittadini informati, responsabili e partecipativi, non solo
riguardo alla nostra salute ma in tutte le aree della vita, individuale e sociale.
Note
[3] Per una trattazione approfondita si rimanda al contributo di Carradore, Cerroni e Nicolaci, capitolo quarto di questo volume.
[4] Sulla «narrazione incerta» della pandemia e le «posizioni spesso opposte fra scienziati dai diversi expertise» si veda anche il contributo di Calloni in questo volume.