statistica medica

Qualità dei dati nella ricerca sanitaria: come evitare risultati distorti

Spesso l’origine del fallimento di una ricerca è legata alla qualità del dato usato per le elaborazioni. Spesso si traggono conclusioni usando campioni con dati non controllati, di scarsa qualità o troppo piccoli per essere rappresentativi. L’unico rimedio è una solida metodologia di costruzione e analisi dei dati

17 Mag 2022
Domenico Marino

Università Degli Studi Mediterranea di Reggio Calabria

dati sanitari

Uno dei problemi più rilevanti della statistica sanitaria è il fatto di avere a che fare con dei campioni di dati che sono troppo piccoli per poter assicurare una significatività statistica.

Un articolo pubblicato su Nature il 16 marzo 2022 con primo firmatario Scott Marek, dal titolo: “Reproducible brain-wide association studies require thousands of individuals” pone con forza numerosi interrogativi su come vengono raccolti e trattati i dati delle risonanze magnetiche che tentano di costruire una mappatura del cervello per potere rendere comprensibile il suo funzionamento.

Il nuovo Spazio Europeo dei Dati Sanitari: obiettivi e sfide della proposta Ue

Ma come vedremo in seguito questo è solo un tassello di un puzzle più grande che coinvolge la gran parte degli studi di statistica medica.

I Brain-Wide Association Studies

I Brain-Wide Association Studies (BWAS) sono degli studi che hanno come finalità l’associazione di differenze individuali nella struttura e nel funzionamento del cervello e modelli comportamentali come capacità di apprendimento e disabilità mentale. Questi BWAS si sono tipicamente basati su dimensioni del campione (la mediana del campione è 25) che vanno bene se si deve ottenere una tradizionale mappatura del cervello, ma che sono estremamente esigui per poter individuare delle associazioni riproducibili di modelli comportamentali. Infatti, gli studi che utilizzano le tecnologie neuroimaging comunemente inseriscono dei caveat per le loro conclusioni a causa della ridotta dimensione del campione. Sono ormai più di 20 anni che i ricercatori usano tecnologie di brain-imaging via via più evolute per cercare di identificare come la struttura e la funzione del cervello di una persona si collega con la sfera della salute mentale, cercando di spiegare, ad esempio, le manifestazioni di ansia, depressione e le tendenze suicide. Tuttavia, si tratta di studi costosi, l’arruolamento dei partecipanti può essere oneroso in termini di tempo e abbastanza costoso (da 600 a 2.000 dollari l’ora) e questo spiega la circostanza che la mediana dei campioni sia di circa 25 unità.

INFOGRAFICA
Manufacturing verso l’Industry 5.0: sfrutta i vantaggi della monetizzazione dei dati!
Big Data
Digital Transformation

Quali e quanti dati utilizzare per risultati

Nell’articolo di Scott Marek si dimostra che i dati rilevati con campioni di poche decine di casi non possono essere affidabili e possono dare facilmente origine a risultati distorti. Per ottenere risultati non distorti, affidabili e replicabili è necessario aumentare di parecchio la dimensione del campione. Infatti, Scott Marek e il suo gruppo hanno preso in considerazione tre dei più grandi set di dati di neuroimaging attualmente disponibili – con una dimensione totale del campione di circa 50.000 individui – per quantificare le dimensioni degli effetti BWAS e riproducibilità in funzione della dimensione del campione. Da questi big data hanno estratto dei sottogruppi più piccoli osservando che quando la numerosità del sottogruppo rimaneva elevata i risultati erano simili a quelli del set completo di dati, viceversa quando sottoinsiemi erano piccoli producevano risultati inaffidabili se confrontati con i risultati prodotti dall’intero set di dati.

La sacralità del dato negli esperimenti

Questo risultato è estremamente rilevante perché apre tutto un dibattito sulla reale scientificità di molti risultati di statistica medica ottenuti con campioni molto piccoli o con set di dati non ben costruiti. Spesso l’origine del fallimento di una ricerca è dovuto alla qualità del dato che viene usato fare le elaborazioni. Spesso con leggerezza si effettuano analisi e si traggono conclusioni utilizzando campioni con dati non controllati, o non verificati, o di scarsa qualità, o troppo piccoli per essere significativi e rappresentativi. Un database di scarsa qualità è già il primo passo verso un fallimento certo. Uno dei primi insegnamenti che viene dato ai fisici è la sacralità del dato negli esperimenti. Lo scienziato diventa il sacerdote che trasforma l’osservazione della realtà e la sua misurazione in un dato che ne deve riprodurre fedelmente le caratteristiche. Lo studio della qualità dei dati e delle condizioni di errore diventa, quindi il prerequisito di ogni ulteriore elaborazione.

Spesso nella statistica sanitaria ci sono creati database “Frankenstein” che derivavano dall’aggregazione di basi di dati diverse, non omogenee e soprattutto costituite da dati raccolti con metodologie e strumenti diversi e spesso i ricercatori medici non hanno le conoscenze e le capacità statistico-matematiche per gestire i problemi del dimensionamento del campione e della raccolta dei dati.

Il ruolo dell’intelligenza artificiale

I ricercatori vogliono acquisire velocemente e a basso costo i dati, ma questo significa spesso aggregare dati derivanti da osservazioni differenti o dati provenienti da fonti sconosciute. E l’utilizzo dell’intelligenza artificiale ha reso questo processo più diffuso e meno controllato. Andando ad esaminare un caso di diagnosi per immagini diverso, quello delle ricerche sul covid pediatrico, non si può non notare che si sono utilizzati involontariamente dei set di dati che contenevano scansioni polmonari di bambini che non avevano il covid come archetipi di casi non covid. Ma di conseguenza, l’algoritmo di Intelligenza Artificiale ha imparato a identificare i bambini, non il covid!

Conclusioni

Se vogliamo, quindi, evitare che le ricerche diano risultati distorti e/o inaffidabili dobbiamo cercare una solida metodologia di costruzione e di analisi dei dati, dobbiamo creare dei database standardizzati, dobbiamo far precedere una seria analisi sulla qualità del dato a tutte le elaborazioni e dobbiamo, infine, assicurare una significatività e una rappresentatività dei campioni. È un lavoro certosino e meno gratificante, ma necessario, perché un set di dati di scarsa qualità produce previsioni scadenti e in sanità questo si ripercuote pesantemente sui pazienti.

@RIPRODUZIONE RISERVATA

Speciale PNRR

Tutti
Analisi
PA
Salute digitale
News
Fondi
Formazione
Ecologia
Digital Economy
L'approfondimento
PNRR 2, ecco tutte le misure per cittadini e imprese: portale sommerso, codice crisi d’impresa e sismabonus, cosa cambia
Servizi digitali
PNRR e trasformazione digitale: ecco gli investimenti e le riforme previste per la digitalizzazione della PA
Legal health
Lo spazio europeo dei dati sanitari: come circoleranno le informazioni sulla salute nell’Unione Europea
Servizi digitali
PNRR e PA digitale: non dimentichiamo la dematerializzazione
Digital Healthcare transformation
La trasformazione digitale degli ospedali
Governance digitale
PA digitale, è la volta buona? Così misure e risorse del PNRR possono fare la differenza
Servizi digitali
Comuni e digitale, come usare il PNRR senza sbagliare
La survey
Pnrr e digitale accoppiata vincente per il 70% delle pmi italiane
Missione salute
Fascicolo Sanitario Elettronico alla prova del PNRR: limiti, rischi e opportunità
Servizi pubblici
PNRR: come diventeranno i siti dei comuni italiani grazie alle nuove risorse
Skill gap
PNRR, la banda ultra larga crea 20.000 nuovi posti di lavoro
Il Piano
Spazio, Colao fa il punto sul Pnrr: i progetti verso la milestone 2023
FORUMPA2022
PNRR e trasformazione digitale: rivedi i Talk di FORUM PA 2022 in collaborazione con le aziende partner
I contratti
Avio, 340 milioni dal Pnrr per i nuovi propulsori a metano
Next Generation EU
PNRR, a che punto siamo e cosa possono aspettarsi le aziende private
Incentivi
Operativo il nuovo portale del MISE con tutti i finanziamenti per le imprese
Servizi comunali
Il PNRR occasione unica per i Comuni digitali: strumenti e risorse per enti e cittadini
Healthcare data platform
PNRR dalla teoria alla pratica: tecnologie e soluzioni per l’innovazione in Sanità
Skill
Competenze digitali, partono le Reti di facilitazione
Gli obiettivi
Scuola 4.0, PNRR ultima chance: ecco come cambierà il sistema formativo
Sistema Paese
PNRR 2, è il turno della space economy
FORUM PA 2022
FORUM PA 2022: la maturità digitale dei comuni italiani rispetto al PNRR
Analisi
PNRR: dalla Ricerca all’impresa, una sfida da cogliere insieme
Innovazione
Pnrr, il Dipartimento per la Trasformazione digitale si riorganizza
FORUM PA 2022
PA verde e sostenibile: il ruolo di PNRR, PNIEC, energy management e green public procurement
Analisi
PNRR, Comuni e digitalizzazione: tutto su fondi e opportunità, in meno di 3 minuti. Guarda il video!
Rapporti
Competenze digitali e servizi automatizzati pilastri del piano Inps
Analisi
Attuazione del PNRR: il dialogo necessario tra istituzioni e società civile. Rivedi lo Scenario di FORUM PA 2022
Progetti
Pnrr, fondi per il Politecnico di Torino. Fra i progetti anche IS4Aerospace
Analisi
PNRR, Colao fa il punto sulla transizione digitale dell’Italia: «In linea con tutte le scadenze»
La Svolta
Ict, Istat “riclassifica” i professionisti. Via anche al catalogo dati sul Pnrr
Analisi
Spazio, Colao fa il punto sul Pnrr: i progetti verso la milestone 2023
FORUM PA 2022
Ecosistema territoriale sostenibile: l’Emilia Romagna tra FESR e PNRR
Il Piano
Innovazione, il Mise “centra” gli obiettivi Pnrr: attivati 17,5 miliardi
Analisi
PNRR: raggiunti gli obiettivi per il primo semestre 2022. Il punto e qualche riflessione
Analisi
PNRR: dal dialogo tra PA e società civile passa il corretto monitoraggio dei risultati, tra collaborazione e identità dei luoghi
Webinar
Comuni e PNRR: un focus sui bandi attivi o in pubblicazione
Analisi
Formazione 4.0: cos’è e come funziona il credito d’imposta
PA e Sicurezza
PA e sicurezza informatica: il ruolo dei territori di fronte alle sfide della digitalizzazione
PA e sicurezza
PNRR e servizi pubblici digitali: sfide e opportunità per Comuni e Città metropolitane
Water management
Water management in Italia: verso una transizione “smart” e “circular” 
LE RISORSE
Transizione digitale, Simest apre i fondi Pnrr alle medie imprese
Prospettive
Turismo, cultura e digital: come spendere bene le risorse del PNRR
Analisi
Smart City: quale contributo alla transizione ecologica
Decarbonizzazione
Idrogeno verde, 450 milioni € di investimenti PNRR, Cingolani firma
Unioncamere
PNRR, imprese in ritardo: ecco come le Camere di commercio possono aiutare
I fondi
Industria 4.0: solo un’impresa su tre pronta a salire sul treno Pnrr
L'approfondimento
PNRR 2, ecco tutte le misure per cittadini e imprese: portale sommerso, codice crisi d’impresa e sismabonus, cosa cambia
Servizi digitali
PNRR e trasformazione digitale: ecco gli investimenti e le riforme previste per la digitalizzazione della PA
Legal health
Lo spazio europeo dei dati sanitari: come circoleranno le informazioni sulla salute nell’Unione Europea
Servizi digitali
PNRR e PA digitale: non dimentichiamo la dematerializzazione
Digital Healthcare transformation
La trasformazione digitale degli ospedali
Governance digitale
PA digitale, è la volta buona? Così misure e risorse del PNRR possono fare la differenza
Servizi digitali
Comuni e digitale, come usare il PNRR senza sbagliare
La survey
Pnrr e digitale accoppiata vincente per il 70% delle pmi italiane
Missione salute
Fascicolo Sanitario Elettronico alla prova del PNRR: limiti, rischi e opportunità
Servizi pubblici
PNRR: come diventeranno i siti dei comuni italiani grazie alle nuove risorse
Skill gap
PNRR, la banda ultra larga crea 20.000 nuovi posti di lavoro
Il Piano
Spazio, Colao fa il punto sul Pnrr: i progetti verso la milestone 2023
FORUMPA2022
PNRR e trasformazione digitale: rivedi i Talk di FORUM PA 2022 in collaborazione con le aziende partner
I contratti
Avio, 340 milioni dal Pnrr per i nuovi propulsori a metano
Next Generation EU
PNRR, a che punto siamo e cosa possono aspettarsi le aziende private
Incentivi
Operativo il nuovo portale del MISE con tutti i finanziamenti per le imprese
Servizi comunali
Il PNRR occasione unica per i Comuni digitali: strumenti e risorse per enti e cittadini
Healthcare data platform
PNRR dalla teoria alla pratica: tecnologie e soluzioni per l’innovazione in Sanità
Skill
Competenze digitali, partono le Reti di facilitazione
Gli obiettivi
Scuola 4.0, PNRR ultima chance: ecco come cambierà il sistema formativo
Sistema Paese
PNRR 2, è il turno della space economy
FORUM PA 2022
FORUM PA 2022: la maturità digitale dei comuni italiani rispetto al PNRR
Analisi
PNRR: dalla Ricerca all’impresa, una sfida da cogliere insieme
Innovazione
Pnrr, il Dipartimento per la Trasformazione digitale si riorganizza
FORUM PA 2022
PA verde e sostenibile: il ruolo di PNRR, PNIEC, energy management e green public procurement
Analisi
PNRR, Comuni e digitalizzazione: tutto su fondi e opportunità, in meno di 3 minuti. Guarda il video!
Rapporti
Competenze digitali e servizi automatizzati pilastri del piano Inps
Analisi
Attuazione del PNRR: il dialogo necessario tra istituzioni e società civile. Rivedi lo Scenario di FORUM PA 2022
Progetti
Pnrr, fondi per il Politecnico di Torino. Fra i progetti anche IS4Aerospace
Analisi
PNRR, Colao fa il punto sulla transizione digitale dell’Italia: «In linea con tutte le scadenze»
La Svolta
Ict, Istat “riclassifica” i professionisti. Via anche al catalogo dati sul Pnrr
Analisi
Spazio, Colao fa il punto sul Pnrr: i progetti verso la milestone 2023
FORUM PA 2022
Ecosistema territoriale sostenibile: l’Emilia Romagna tra FESR e PNRR
Il Piano
Innovazione, il Mise “centra” gli obiettivi Pnrr: attivati 17,5 miliardi
Analisi
PNRR: raggiunti gli obiettivi per il primo semestre 2022. Il punto e qualche riflessione
Analisi
PNRR: dal dialogo tra PA e società civile passa il corretto monitoraggio dei risultati, tra collaborazione e identità dei luoghi
Webinar
Comuni e PNRR: un focus sui bandi attivi o in pubblicazione
Analisi
Formazione 4.0: cos’è e come funziona il credito d’imposta
PA e Sicurezza
PA e sicurezza informatica: il ruolo dei territori di fronte alle sfide della digitalizzazione
PA e sicurezza
PNRR e servizi pubblici digitali: sfide e opportunità per Comuni e Città metropolitane
Water management
Water management in Italia: verso una transizione “smart” e “circular” 
LE RISORSE
Transizione digitale, Simest apre i fondi Pnrr alle medie imprese
Prospettive
Turismo, cultura e digital: come spendere bene le risorse del PNRR
Analisi
Smart City: quale contributo alla transizione ecologica
Decarbonizzazione
Idrogeno verde, 450 milioni € di investimenti PNRR, Cingolani firma
Unioncamere
PNRR, imprese in ritardo: ecco come le Camere di commercio possono aiutare
I fondi
Industria 4.0: solo un’impresa su tre pronta a salire sul treno Pnrr

Articolo 1 di 3