September 27, 2020

La cattiva comunicazione tecnico-scientifica

Ieri sera per caso ho sfogliato alcune pagine dell’ottimo libro di Emilio Matricciani , La Comunicazione Tecnico Scientifica (Casa Editrice Ambrosiana). In particolare il capitolo sulla visualizzazione dei risultati (tabelle e figure) che è di grande attualità anche oggi.

Le tabelle e le figure sono fondamentali per la corretta descrizione di un argomento scientifico e in tutte le volte che si voglia condensare una informazione (magari frutto di una misura) in poco spazio ad alto contenuto informativo.

Matricciani con malcelato rammarico constata come “[…] coloro che producono le figure delle pagine scientifiche o economiche, dei quotidiani, settimanali e mensili di larga diffusione, provengono dal mondo della grafica, un ambiente artistico per cultura meno abituato ad un’analisi quantitativa dei dati rispetto al mondo scientifico. Nel mondo della grafica sembra che i dati da mostrare debbano essere “abbelliti” allo scopo di renderli più interessanti e attirare l’attenzione del lettore, con la conseguenza che le figure distorcono le informazioni […] immagini che sono icone analogiche che vengono ricevute ed elaborate prima dei numeri e in modo inconscio, con meno fatica, tendono a rimanere a lungo nella mente del lettore. Soltanto i lettori di cultura tecnico-scientifica non si lasciano facilmente “traviare” dalle distorsioni, gli altri si, con la conseguenza che, alla fine, molti lettori elaborano inconsicamente grafici fortemente distorti“.

Aggiungo personalmente che spesso questi grafici sono riprodotti in maniera distorta non solo per cosciente ricerca di abbellimento, ma per imperizia, svogliatezza, sciatteria o semplicemente ignoranza.

Esempio pratico: Possiamo rappresentare graficamente gli interi da 1 a 5 con dei cerchi di diametro da 1 a 5, ed avremo una serie di figure di questo genere

Figura 1: Sequenza di cerchi con diametri proporzionali agli interi da 1 a 5

Se invece disegnamo una serie di cerchi con aree in sequenza proporzionali agli interi da 1 a 5 la serie sarà la seguente

Figura 2: Sequenza di cerchi con aree proporzionali agli interi da 1 a 5

Ora è evidente che se scegliamo una serie tipo quella di Figura 1 per definire dei valori numerici – che so – indicativi del numero di casi di un’epidemia, magari di Coronavirus, nei diversi Stati del Mondo e per coronare il tutto mediante la sciagurata scala indicata in Figura 3:

Figura 3: sequenza cerchi per indicare il numero di casi di coronavirus. Tutti i casi compresi tra quei numeri sono riportati con lo stesso cerchio

il risultato che si vedrà è quello di Figura 4, così come ci è apparso questa mattina su diversi quotidiani.

Figura 4: Stato dell’epidemia “fotografato” a livello globale al 17/02/2020 secondo la scala scelta in Figura 3

In Germania al momento in cui questo articolo viene scritto (il 17/02/2020) i casi ufficiali riportati di Coronavirus sono 16. Quindi secondo quella scelta scellerata della scala di cui sopra il “palloccone” sopra la Germania è giusto. Ma gli ideatori di questo bel grafico ad effetto non hanno considerato i più banali principi di geometria prospettica, ossia hanno usato un effetto distorsivo che sulle prime fa sembrare il numero dei casi in Germania molto simile a quello di alcune regioni della Cina (peraltro nel grafico finale tutte sovrapposte quindi inquantificabili ).

Aggiornamento 22/02/2020

A seguito dei nuovi casi identificati in Lombardia l’Italia al momento è la prima nazione d’Europa in termini di casi di Coronavirus ufficialemte identificati. Siamo arrivati a 60. Come giustamente fa notare Burioni, senza minimizzare quello che sta succedendo in Lombardia, è ovvio che l’aumento è anche dovuto al fatto che questa Regione è sotto l’occhio del ciclone : ” Se qualcosa non si cerca, non si trova. Se qualcosa si cerca, si trova. I casi saranno identificati come effetto delle nuove misure di contenimento dell’epidemia nel nostro Paese. Tracciare i contatti di chi è già positivo, infatti, avrà come inevitabile conseguenza il fatto di trovarne degli altri ma, allo stesso tempo, permetterà di proteggere un numero esponenzialmente più altro di nostri concittadini (di noi stessi!) dal rischio del contagio. “ [1]

Tornando ai numeri se usassimo ancora quella scala indicata in Figura 3, oggi la situazione di casi di infezione a livello mondiale verrebbe rappresentata come la Figura 5. Ovviamente è una rappresentazione che distorce i dati in maniera ridicola

Figura 5: Fotografia dei contagi nel mondo al 22/02/2020 usando scorrettamente la scala con diametro lineare riportata in [2]

Una scala più corretta sarebbe quella di riportare semplicemente i dati numerici ufficiali, come si vede in Figura 6 (dati del 22/02/2020 destinati ad evolvere, per consultare l’evoluzione temporale rifarsi al link originale [3]

Figura 6: numero dei contagi mondiali al 22/02/2020 riportato dalla John Hopkins Whiting School of Enginnering [3]

Se vogliamo calcolare la percentuale di popolazione rimasta infettata dal virus in Cina rispetto al numero di abitanti basta dividere il numero dei casi per la popolazione totale. Usando come dati delle popolazioni mondiali quelli indicati nel riferimento [4] otteniami

%Popolazione infettata / popolazione totale (Cina) = 0,005438%

%Popolazione infettata / popolazione totale (Italia) = 0,000099% ossia in rapporto alla cina 100 volte inferiore (il che è ovvio perché il centro del contagio è in Cina). Come dice Burioni i casi in Italia (e quindi in Europa) aumenteranno sicuramente nei prossimi giorni. Anche però chi decidesse di seguire l’andamento del Coronavirus affidandosi ai dati che sono rappresentati con scale un pelo più coerenti (come i diagrammi della JHU , rif [3]) dovrebbe però farlo tenendo presente le seguenti osservazioni.

A) Confusione delle informazioni divulgate dagli esperti in materia:

Oltre che alla distorsione dei dati effettuata dai media, e quindi dai profani, la cattiva comunicazione scientifica è figlia anche di disinformazione (a volte non voluta) ad opera degli stessi esperti in materia. E questo purtroppo è ciò che genera più sconcerto e disorientamento nel pubblico profano. Definiamo come esperto una persona con titolo di studio adeguato a parlare di quel problema scientifico e con una posizione professionale e una carriera che corrobora le sue affermazioni. Ora, se l’esperto A fa un’affermazione, e l’esperto B contraddice quell’affermazione nasce un conflitto di opinioni che se restasse sul piano accademico (quanti ne abbiamo visti all’Università!) poco male, ma in situazioni di crisi come questa con l’esposizione mediatica attuale succede il finimondo. E’ quello ad esempio che è successo (23/02/2020) per le polemiche scaturite dalle affermazioni di Maria Rita Gismondo (Direttore responsabile di microbiologia clinica, virologia e diagnostica delle bioemergenze del Sacco di Milano) che sulla sua pagina Facebook ha pubblicato questi commenti (li riportiamo in ordine cronologico dal meno recente al più recente all’ora di aggiornamento di questo post), a cui a stretto giro di posta ha risposto il dottor Roberto Burioni ( Ordinario di Microbiologia e Virologia dell’Università Vita-Salute San Raffaele, Milano)

Figura 7
Figura 8
Figura 9
Figura 10
Figura 11 (la figura che allega Burioni nel suo post è la Figura 12)
Figura 12

Da notare come entrambi gli esperti rimandino ai famosi numeri, e in buona coscienza pensiamo (noi profani) che siano in buonafede. Però restiamo sconcertati perché queste loro affermazioni sembrano diametralmente opposte. E il turbamento nasce perché pronunciate da personale qualificato e apparentemente autorevole. Purtroppo i social media se da un lato hanno liberalizzato l’accesso all’informazione fatalmente sono uno strumento inadeguato a riportare la complessità di un problema scientifico (o a volgarizzarlo per le masse). E’ notorio che Burioni considera questo virus più pericoloso dell’influenza classica perché è nuovo, perché non c’è ancora un vaccino, perché non se ne conosce veramente la mortalità effettiva, e perché il meccanismo di diffusione è ancora sotto studio e perché la sindrome influenzale non ci mette quattro o cinque settimane per scomparire mentre la prognosi delle persone che contraggono questo virus può essere anche lunga, una patologia che andrebbe forse più appropriatamente definita come una seria polmonite virale.

Purtroppo può capitare anche agli esperti di prendere una svista o peccare di omissione od essere poco precisi nel definire un dato scientifico. A quanto pare il numero di decessi a cui si riferiva la dottoressa era relativo a una media di decessi totali preso dal sistema di sorveglianza chiamato SISMG, del sito del Ministero della Salute che monitora il numero di decessi totali riportato dalle anagrafi comunali (Figura 12); totali, quindi ci viene da pensare che includa i decessi per malattie oncologiche, decessi per senescenza, decessi per incidenti stradali ed altre patologie e non solo per sintomi influenzali. In somma tutti i decessi che registra l’Anagrafe Comunale.

Il “ci viene da pensare” è d’obbligo perché anche il post di risposta di Burioni – Figura 11- non è esplicito a riguardo ai dati riportati in Figura 12 poiché non spiega esattamente come e a cosa si riferiscano i dati della Figura 12: a prima vista sembra molto chiara ma andrebbe compendiata con una didascalia esplicita che chiarisca che i dati di mortalità sono “totali” quindi non solo relativi ai casi di influenza. Burioni attribuisce un significato “implicito” ai dati della Figura 12 ma in questo caso – ossia nel momento in cui si pubblica su un social media destinato a un pubblico di non addetti a lavoro e non su una rivista scientifica dove tutti capirebbero – andrebbe usato un tono didascalico anche pesante se vogliamo per evitare ulteriori fraintendimenti. Insomma fare il classico “spiegone”.

E questo ci porta al secondo commento importante

B) Affidabilità e completezza dei Dati numerici

Tutto quello che abbiamo detto sulla rappresentazione delle tabelle ovviamente presuppone che i dati grezzi di partenza, ossia quelli numerici siano affidabili ed esaustivi e opportunamente definiti.

Per “affidabili” intendiamo che rappresentino informazioni comprovate da test standardizzati.

Per “esaustivi” intendiamo che rappresentino le informazioni statisticamente corrette per tutto il campione nazionale.

Per “ben definiti” intendiamo che il numero sia corredato di una definizione del dato stesso.

E’ ovvio che se manca affidabilità ai dati (volgarmente: se i dati sono distorti – anche involontariamente, vuoi perché sono contabilizzati male, o perché ci sono molti più casi ancora non contabilizzati, o perché i casi di guarigione sono definiti tali secondo regole non uniformi), tutta la parte relativa ai grafici crolla, per quanto bene li si voglia fare. L’affidabilità dei dati può essere anche distorta volontariamente, ma sono casi rari che farebbero la gioia dei complottisti e verrebbero smascherati, come il noto casi Schön [5]

Un dato che non sia esaustivo può anche esso trarre in inganno. L’esaustività di una misura può essere di difficile quando impossibile realizzazione pratica (se si ricerca una esaustività perfetta). Per esempio nel caso del CoronaVirus CVID-19 il dato della misura dei contagiati N in un certo paese P potrebbe definirsi esaustivo se rappresenta con certezza del 100% il numero totale dei contagiati per CVID-19 in quel paese al dato istante di misura. Ma per avere la “certezza” matematica dovremmo fare il tampone a tutti gli abitanti di quel Paese (dopo che magari sono state in quarantena). E questo è praticamente impossibile. Quindi la comparazione dei dati deve essere coerente ossia vanno confrontati dati con lo stesso livello di accuratezza. I dati dei contagiati in Iran o in Francia o in Italia hanno lo stesso livello di accuratezza e di coerenza? Lo avrebbero se tutti questi Paesi misurassero i dati con gli stessi sistemi. Ma sappiamo che per poterlo fare dovrebbero sottoporre ogni giorno tutta la popolazione al tampone (perché Burioni docet il virus appena incubato non è rilevabile al tampone). E ciò è impossibile. Ecco perché ad esempio in un Paese in cui si scopre un focolaio le misure diventano più accurate e puntuali e quindi fatalmente il numero dei “contagiati” riportato dai dati ufficiali aumenta. Ma questo le tabelle che leggiamo sui giornali (o anche quelli disegnati meglio della JHU) non lo riportano perché bisogna essere brevi, concisi e dare l’informazione in modo che sia di effetto a livello marketing.

Tornando al problema delle tabelle pubblicate in [3] al momento in cui scriviamo l’aggiornamento (23/02/2020) non è dato sapere l’affidabilità e l’esaustività dei dati Cinesi. Sui dati italiani si ha ragione di credere siano affidabili (almeno nei Comuni interessati) ma non esaustivi a livello Nazionale. Assolutamente non esaustivi i dati degli altri paesi Europei. Dire che in un Paese ci sono 130 casi accertati vuol dire quello che si scrive: accertati, ossia noti. Ma a causa dell’incubazione del virus i dati possono cambiare rapidamente. Evidentemente il numero dei casi crescerà se si andrà a scavare più a fondo (e visto lo sfogo della dottoressa Gismondo di cui sopra si capisce bene lo sforzo che si sta chiedendo al personale sanitario per fare tutti gli esami al fine di definire o no se un caso è un falso positivo). Un dato interessante, ad esempio, per rendere la statistica più comprensibile sarebbe quello di riportare il numero di analisi richieste ai laboratori specializzati. Questo ci farebbe capire il carico di lavoro attuale.

Ma non si può chiedere a chi è sul fronte di preoccuparsi troppo dell’affidabilità, della precisione, e dell’esaustività dei dati. Quindi le tabelle vanno prese con le dovute cautele (senza stare a fare troppa dietrologia complottista) e cercare di informarsi presso le fonti competenti (e in caso di conflitto come sopra verificare con altre fonti).


[1] https://www.medicalfacts.it/2020/02/22/coronavirus-aumento-casi-italia/?fbclid=IwAR3m2SxgKs3bk0RQnxjTA5eXg2lIsK1EBV80hHgpMglXb7TxCxg5pIkxkCM

[2] https://lab.gedidigital.it/repubblica/2020/esteri/coronavirus/

[3] https://gisanddata.maps.arcgis.com/apps/opsdashboard/index.html#/bda7594740fd40299423467b48e9ecf6

[4] https://it.wikipedia.org/wiki/Stati_per_popolazione

[5] https://it.wikipedia.org/wiki/Jan_Hendrik_Sch%C3%B6n

Jan Hendrik Schön [5], brillante giovane fisico tedesco nel 2000 pubblicò uno studio con dei dati che se confermati avrebbero rappresentato la seconda rivoluzione dell’elettronica dall’invenzione del transistor, ossia l’invenzione di un transistor molecolare. Purtroppo il lavoro di Schon si rivelò un falso: i suoi grafici erano stati creati artificialmente e non frutto di un esperimento. La frode venne fuori quando nessuno riuscì a riprodurre i risultati scientifici di Schon. Questo però dimostra che la comunità scientifica ha gli anticorpi (per restare in tema) per smascherare le fake news proprio perché si basa sul lavoro di diversi gruppi indipendenti che usano un metodo comune (quello del metodo scientifico).

Lascia un commento

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *


*

Questo sito usa Akismet per ridurre lo spam. Scopri come i tuoi dati vengono elaborati.