Marina Calloni (a cura di)
Pandemocrazia
DOI: 10.1401/9788815411297/c3
L’infodemia da Covid-19 ci insegna che il «pensiero statistico» è un’esigenza reale, non fantascienza, e una vera e propria competenza di cittadinanza democratica. Discussione e riflessione mediatiche sui numeri della pandemia in Italia si sono caratterizzate per la vastità e varietà di voci, e per una certa mancanza di regole e di standard. Riguardo alla comunicazione istituzionale, i bollettini quotidiani della protezione civile congiuntamente all’Istituto Superiore di Sanità durante la prima ondata della pandemia, sono stati successivamente sostituiti prevalentemente da politici, dal ministro della Salute e i suoi portavoce. L’enorme dibattito mediatico ha visto il contributo di una batteria di figure, definite genericamente «scienziati» [3]
ma con competenze e approcci scientifici estremamente diversificati: virologi, infettivologi, biologi, medici-epidemiologi… fra gli altri, e in misura di molto inferiore, biostatistici, statistici epidemiologi e metodologi. Altri Paesi hanno fatto scelte diverse e contrarie. In Europa la Gran Bretagna ha adottato un rigido protocollo che ha ristretto le apparizioni mediatiche essenzialmente al primo ministro, a giornalisti specializzati in data-journalism e a un unico esperto statistico, David Spiegelhalter, accademico popolarissimo per la sua chiarezza ed efficacia nella comunicazione al pubblico generale di complessi concetti quantitativi. Nel suo libro del 2019, The Art of Statistics, Spiegelhalter offre una definizione essenziale di statistica: «usiamo la scienza statistica per rispondere alle domande che ci poniamo quando cerchiamo di capire meglio il mondo» [Spiegelhalter 2019]. Ma cosa intendiamo per pensiero statistico e perché ne abbiamo bisogno specialmente in tempi di infodemia? Il pensiero statistico, un concetto complesso e articolato, coinvolge «la natura onnipresente della variabilità
{p. 71}[…] quando e come usare gli appropriati metodi di analisi dei dati, sintesi numeriche e rappresentazioni grafiche […] la comprensione della natura del campionamento, come effettuiamo l’inferenza dal campione alla popolazione […] come utilizziamo stime e probabilità». E ancora: «riconoscere e capire l’intero processo: dalla formulazione della domanda, alla raccolta dati, alla scelta delle analisi per testare le ipotesi di ricerca» [Ben-Zvi e Garfield 2004, 7]. Il pensiero statistico si fonda sulla cognizione che i dati (datum, data) raccolti nella realtà fisica (le persone, le società) o virtuale (Internet) sono soltanto la materia grezza per creare informazioni, cioè nuova conoscenza, circa le complesse strutture del mondo attuale e le loro interazioni. I dati hanno molte «facce» e natura diversa: possono essere il risultato di categorizzazioni, di conteggi, di misure, e per questo, in genere, non esplicitano da soli l’informazione. Il dato, ad esempio una singola categoria (favorevole, giovane…) o un singolo numero (3,250 gr…), sebbene raccolto nella realtà, di per sé è «muto». Quanto più complessa e variabile è la realtà in cui il dato è osservato, tanto più nascosta nel dato stesso è l’informazione riguardo a quella realtà. Possiamo vedere la scienza statistica come la cassetta degli attrezzi per estrarre dai dati l’informazione, per raccontare la storia che quei dati possono raccontare, attrezzi ad hoc per la «faccia» e la natura di quei dati.
Alla complessità e variabilità del nostro mondo, concetto quest’ultimo che include anche differenze e disuguaglianze, si aggiunge di norma la parzialità dei dati. I dati sono quasi sempre parziali, cioè un campione in grado di riflettere solo una parte, in genere molto ristretta, della realtà che ci interessa, il che porta con sé una naturale esigenza di rischiose generalizzazioni e inferenze.
I numeri della pandemia e l’informazione quantitativa legata al Covid-19 sono, nella quasi totalità, dati campionari. Lo è ad esempio il dato «nuovi casi» diffuso quotidianamente, che informa circa il numero di tamponi positivi fra quelli confermati e registrati dalle autorità sanitarie quel giorno, tamponi eseguiti sul ristretto gruppo di coloro che, per ragioni per lo più ignote e particolari, quel giorno si sono sottoposti al test. Ciononostante, tale numero di «nuovi casi» è stato {p. 72}(ed è) ampiamente interpretato come una stima quotidiana della severità della pandemia in tutte le sue fasi, generalizzato all’intera popolazione «degli Italiani», dimenticando anche le minime cautele che il pensiero comune riserva a qualunque generalizzazione. Pensiero statistico è capacità di distinguere fra dati di realtà «completi» e stime campionarie, è consapevolezza del rischio di errore connaturato a qualunque stima ed ineliminabile da qualunque inferenza. L’attrezzo ad hoc che nella metafora della cassetta degli attrezzi, offre la scienza statistica è il controllo e la misura scientifica di questo rischio di errore, mediante la potente teoria matematica delle probabilità. Se conosciamo solo parte dei dati, come accade di regola con i numeri della pandemia e in particolare nell’esempio dei «nuovi casi», è evidente il rischio di distorsione (bias) e di grossolana approssimazione della punta dell’iceberg, verosimilmente una sottostima molto lontana dalla realtà. Quale, allora, l’informazione? Dove l’incremento di conoscenza dello stato della pandemia nel Paese e del rischio per la nostra salute?
Pensiero statistico è padronanza del fatto che possiamo misurare la probabilità dell’errore campionario associato a qualunque stima, la sua possibile distorsione e quanto sia verosimilmente vicina o lontana dalla verità. Ma tale misura oggettiva dell’affidabilità delle stime è possibile se e soltanto se i dati (parziali) sono stati raccolti con un preciso metodo di campionamento probabilistico. Ogni altro metodo per procurare un campione di dati è non probabilistico e la qualità delle sue stime non è oggettivamente, scientificamente quantificabile. Asserzioni di uso comune quali «campione rappresentativo» o «campione rappresentativo per quote di popolazione» sono confortanti e rassicurano, ma possono mascherare il carattere non probabilistico di quel campione di dati, e nascondere il fatto che l’errore statistico di quelle stime, anche quando calcolato automaticamente dal computer, non ha fondamento scientifico. Rappresentatività, infatti, se in senso letterale è caratteristica pregevole del campione, in termini scientifici non è la caratteristica rilevante. Ciò che è importante è che il campione sia probabilistico, cioè disegnato e selezionato casualmente, in modo non deterministico. In {p. 73}tal modo la rappresentatività ne diviene il sottoprodotto, un confacente effetto collaterale della casualizzazione, mediante la quale si sgombra il campo da ogni distorsione e sistematicità che potrebbero derivare da scelte soggettive, di convenienza o da selezioni ragionate. In altre parole, le stime prodotte sulla base di qualunque campionamento non probabilistico sono di fatto considerazioni soggettive, rispettabili come qualunque opinione, ma non scientificamente validate.
In materia di salute pubblica e sperimentazione scientifica, l’approccio più applicato nel mondo, Italia inclusa, è noto come Evidence-Based Medicine, fondato su protocolli di legge e rigorose metodologie probabilistiche, radicate nella teoria dei disegni sperimentali casualizzati introdotta da Sir R.A. Fisher nella prima metà del Novecento [Rao 2007]. Nella lotta alla pandemia di Covid-19, le sperimentazioni mondiali che hanno portato alla messa a punto dei vaccini approvati dall’autorità di farmaco-vigilanza italiana sono state scientifiche, evidence-based e validate su base probabilistica. Al contrario i numeri della pandemia in Italia, salvo eccezioni quali ad esempio le ospedalizzazioni in terapia intensiva, sono quasi totalmente stime campionarie, incluso il famoso indice Rt, poiché, come appare ovvio, in nessun caso è stato possibile raggiungere e «tamponare» l’intera popolazione italiana. Si tratta, invece, di stime basate su campioni autoformatisi, di emergenza e secondo la loro accessibilità, in base a scelte e comportamenti individuali o in ottemperanza a temporanei e mutabili obblighi di legge. Campioni, cioè, non probabilistici. Se è vero che il decisore politico ha sempre dichiarato di seguire il consiglio di esperti, scienziati e comitati tecnico-scientifici, è anche vero che tale parere era largamente basato su questo tipo di stime, la cui distorsione e precisione non è mai stato possibile quantificare scientificamente. Il nostro Paese non è tutt’ora dotato di un campione probabilistico di sorveglianza per la popolazione generale, per le scuole, per gli strati più vulnerabili della società, come testimonia un articolo scientifico del giugno 2022 i cui autori, tutti italiani, includono due ex presidenti Istat [Alleva et al. 2022]. Pensiero statistico è anche la consapevolezza del diritto democratico alla trasparenza e alla riproducibilità del processo di produzione di stime sulla {p. 74}base delle quali sono state prese difficili decisioni politiche e severe misure di salute pubblica. Dunque, il pensiero statistico contribuisce al consolidamento dei valori democratici. Al pensiero statistico educa un’adeguata statistical literacy.

7. Bisogni di «statistical literacy»: una storia circolare, interconnessa e multidimensionale

L’incertezza che ha permeato le nostre vite nel tempo della pandemia caratterizza anche gran parte delle nostre attività, decisioni e scelte. Il bisogno di rassicurazione può, almeno in parte, spiegare la tendenza a percepire i risultati scientifici, i dati e le evidenze empiriche come verità assolute, senza il necessario riferimento alla loro natura sperimentale, parziale e probabilistica. La pandemia ci ha mostrato gli effetti di un tale approccio dogmatico anziché pragmatico, che ha alimentato una certa diffidenza verso la scienza, e in particolare il suo procedere per dubbi e ipotesi da validare o confutare. Il vivace confronto mediatico fra esperti, intorno alla pandemia e ai suoi numeri, fra le tante voci con differenti competenze ed approcci scientifici, è stato spesso letto come conflittuale, contraddittorio e confondente [4]
.
Statistical literacy o alfabetizzazione statistica, è la capacità di riflettere criticamente sui risultati dell’analisi statistica, forniti quale evidenza empirica a supporto di un’affermazione [Berndt et al. 2021]. In passato persona alfabetizzata, non analfabeta, era chi sapeva leggere, scrivere e «far di conto». Alla luce dell’infodemia da Covid-19 tali competenze richiedono di essere aggiornate, attualizzate e ridefinite. Il sistema dei 17 Sustainable Development Goals esplicita numeracy fra i target del goal 4: Ensure inclusive and equitable quality education and promote lifelong learning opportunities for all e per il monitoraggio dei progressi dei Paesi sottoscrittori dell’Agenda Onu 2030 prevede l’indicatore 4.6.1 di proficiency in literacy
and numeracy
. Il progetto Oecd Programme for the International Assessment of Adult Competencies descrive numeracy come nozione sfaccettata, articolata in due elementi principali: numeracy competency and numerate behaviour associando con pari importanza sia competenza sia comportamento, e infine la definisce «capacità di accedere, utilizzare, interpretare e comunicare informazioni e concetti matematici, per affrontare e gestire le necessità matematico-quantitative in una vasta gamma di situazioni della vita adulta» [Oecd 2019]. All’interno di tale programma, la principale fonte di dati per il calcolo dell’indicatore 4.6.1, è l’indagine campionaria su larga scala Survey of Adult Skills, condotta in 40 Paesi nel mondo col proposito di valutare «competenze cognitive e lavorative chiave per la partecipazione sociale e la prosperità economica» [ibidem]. Il rapporto del 2019, relativo alla terza e più recente tornata di tale indagine, stima il livello di numeracy della popolazione italiana adulta «significativamente al di sotto della media» dei 40 Paesi, posizionando il nostro Paese al 32° posto fra i 40 e penultimo in Europa. Il rapporto 2022 delle prove Invalsi [2022] ci informa che le abilità matematiche dei nostri e delle nostre giovani sono in calo rispetto al periodo pre-pandemia (2019). Il peggioramento è ancora più evidente per la coorte dell’ultimo anno di scuola indagato (il 13°) con differenze fino a 13 punti percentuali se si considera, complessivamente e indipendentemente dalla tipologia di scuola, la quota di allievi e allieve che raggiungono i traguardi previsti di matematica.
La crisi pandemica e il suo dilagare, ben al di là di una mera crisi sanitaria, verso una crisi multidimensionale (sociale, economica e finanziaria), ci pongono di fronte all’importanza di dati e pensiero statistico per la pianificazione delle politiche e per le decisioni, e soprattutto per la loro implementazione, monitoraggio, valutazione d’impatto e validazione. La crisi pandemica, con la sua infodemia e i connessi rischi di misinformazione, ci ha mostrato il pericolo di perderci in una selva oscura di dati, e l’emergere del bisogno di una migliore attrezzatura statistica. Anche più urgente nell’era della digitalizzazione: l’esasperata dimensione di pubblico e velocità di diffusione offerte da media digitali e social, impongono di trovarci sufficientemente capaci di distinguere informa
{p. 76}zioni reali e «disturbate», imprecise, fuorvianti, ingannevoli e malevole. Un bisogno circolare, che attraversa tutti gli strati della società democratica: per chi fa informazione, per chi riceve informazione, per chi prende le decisioni, per la politica, per la cittadinanza. Statistical literacy è competenza chiave per essere e agire quali cittadini informati, responsabili e partecipativi, non solo riguardo alla nostra salute ma in tutte le aree della vita, individuale e sociale.
Note
[3] Per una trattazione approfondita si rimanda al contributo di Carradore, Cerroni e Nicolaci, capitolo quarto di questo volume.
[4] Sulla «narrazione incerta» della pandemia e le «posizioni spesso opposte fra scienziati dai diversi expertise» si veda anche il contributo di Calloni in questo volume.