Ricerca medica, così i big data sono la chiave per l'innovazione - Agenda Digitale

sanità digitale

Ricerca medica, così i big data sono la chiave per l’innovazione

I Big Data stanno ridefinendo la ricerca scientifica, anche nella medicina. I dati sanitari possono rendere efficiente la sanità digitale, ma il pre-requisito è l’interoperabilità dei dati sanitari, insieme alla condivisione. Anche per rendere le applicazioni sanitarie disponibili in tutto il mondo

09 Lug 2021
Marisa De Rosa

esperta sanità digitale, Comitato scientifico dell’associazione ASSD-Associazione Scientifica per la Sanità Digitale

I Big Data sono stati definiti, negli ultimi anni, “una fonte inestimabile di valore”, il nuovo oro, ma limitarsi a raccogliere i dati, pur sfruttando le migliori tecnologie disponibili sul mercato, non garantisce di ottenere informazioni di valore e soprattutto di estrarre conoscenza utile per progressi nella salute.

Una Sanità più equa, grazie ai dati: la nuova sfida per l’intelligenza artificiale (e la politica)

I dati sanitari sono utili solo se possono essere trasformati in informazioni significative e questo richiede set di dati di alta qualità, comunicazioni tra sistemi IT e formati di dati standard che possano essere facilmente elaborati.

I dati sanitari devono essere affidabili e per i Big Data questa sfida è ancora più difficile da affrontare: cambiano le tecnologie di gestione dei dati, cambia la velocità con la quale i dati vengono raccolti, aumentano le fonti, ma la qualità e l’integrità delle informazioni rimangono un pilastro imprescindibile per l’analisi: i dati devono essere utili e affidabili.

La sfida dei Big Data nella sanità digitale

La digitalizzazione della medicina promette grandi progressi per la salute globale, si prevede che i dati digitali trasformeranno la medicina.

Tuttavia, la maggior parte dei dati medici odierni manca di interoperabilità: i dati sono nascosti in silos isolati e in sistemi incompatibili, difficili da scambiare, analizzare e interpretare. E ciò rallenta il progresso medico, poiché le tecnologie che si basano su questi dati non possono essere utilizzate al massimo delle loro potenzialità.

WEBINAR
21 Ottobre 2021 - 12:00
3D Experience nel Manufacturing: come si evolve la progettazione e produzione?
Automotive
IoT
Big Data nella sanità digitale
Big Data nella sanità digitale

Scoprire il pieno potenziale della medicina digitale richiede un’infrastruttura dati interconnessa con interfacce veloci, affidabili e sicure, standard internazionali per lo scambio di dati, terminologie mediche che definiscano vocabolari univoci per la comunicazione di informazioni. L’interoperabilità è indispensabile per i progressi nella salute digitale e deve essere un prerequisito per la maggior parte delle innovazioni previste per la medicina futura

Clinical Data Repository innovativi

La creazione di sistemi che colleghino perfettamente la ricerca all’assistenza clinica rappresenta forse la più grande sfida di oggi.

È necessario, per questo obiettivo di lungo termine, pensare ad un ecosistema di dati più sofisticato e trovare modi per utilizzare le grandi quantità di dati esistenti in nuovi modelli innovativi, con incrocio di dati da fonti eterogenee per creare nuovo valore nei servizi sanitari e nella ricerca scientifica.

Per ottenere questo risultato dobbiamo pensare di poter analizzare e confrontare i dati in più dimensioni. Abbiamo bisogno di collegare i dati clinici ai dati ambientali per scoprire le differenze sui diversi territori sia dal punto di vista ecologico che territoriale utilizzando la geo-referenziazione, per poi collegarli con i dati socio economico sanitari per la definizione delle popolazioni.

Le fonti sono tutte presenti nei vari database regionali o nazionali e potrebbero essere facilmente collegabili ai pazienti con le tecnologie di geo-referenziazione.

Data lake, data warehouse e tutela della privacy

Si potrebbe fare un uso più ampio dei data lake, repository centralizzati che consentono di archiviare tutti i tipi di dati strutturati e non strutturati su qualsiasi scala e di eseguire tutti i tipi di analisi libere, non pianificate (real-time analytics , machine learning eccetera).

I data lake godono del vantaggio di poter archiviare senza limiti ogni tipo di dati in un ambiente di analisi, ma presentano il limite che la marea di dati disponibile non sia così facilmente interpretabile e necessiti di lunghe procedure di pre-elaborazione per renderli tali.

Molto probabilmente i data lake non sostituiranno i data warehouse, dove i dati vengono archiviati in modo organizzato, ordinato e definito con analisi strutturate, ma le due opzioni potranno essere complementari l’una all’altra, in modo tale che i dati possano essere utilizzati per una varietà di scopi e in diverse applicazioni aziendali, a seconda delle esigenze.

Il problema della protezione dei dati personali è molto rilevante nella creazione di questi grandi repository, la tecnologia può venire in aiuto a questi problemi con procedure di sicurezza (blockchain) o di data masking (pseudonimizzazione), tuttavia in questa materia è necessaria una revisione dei principi culturali connessi alla logica dell’utilizzo dei big data dei pazienti in maniera intelligente, per evitare il rischio di perdere queste grandi opportunità.

Il paziente stesso e i titolari del trattamento dovranno avere un ruolo importante nella responsabilità di questi dati.

Interoperabilità e condivisione dei dati

La medicina digitale dipende fortemente dall’interoperabilità. La gran parte della comunità di ricerca, soprattutto in tutte le aree cruciali, come ad esempio l’oncologia, riconosce nella condivisione dei dati una strategia scientifica fondamentale tanto da diventare un imperativo etico negli studi clinici.

A tale riguardo, la condivisione dei dati dovrebbe costituire un requisito per tutti i dati prodotti in area pubblica e dovrebbe essere parte integrante del lavoro ricerca-assistenza.

Purtroppo, l’odierna infrastruttura sanitaria digitale rende l’elaborazione dei dati su larga scala ancora difficile perché gli attuali sistemi IT sanitari operano con un’ampia varietà di formati di dati, specifiche personalizzate e semantica non sempre adeguata. Questa situazione è resa ancora più difficile dalla tendenza a memorizzare quantità crescenti di dati non strutturati nella convinzione che attraverso le tecniche di intelligenza artificiale si possano comunque estrarre facilmente informazioni utili; invece le difficoltà di elaborazione diventano molto complesse per la necessità di lunghe e difficoltose procedure di pulizia e pre-elaborazione dei dati.

Per fornire agli algoritmi di intelligenza artificiale e alle tecnologie dei big data input utilizzabili, l’interoperabilità dei dati sanitari è essenziale.

La più grande barriera per l’applicazione dell’intelligenza artificiale e dei big data alla medicina, non è la mancanza di tecniche di analisi, bensì la mancanza di dati adeguati ed organizzati per lo sviluppo di applicazioni di intelligenza artificiale e big data.

L‘interoperabilità tecnica assicura capacità di scambio dati di base tra i sistemi che oggi è facilmente raggiungibile, ma, per elaborare i dati ed estrarre informazioni significative, è indispensabile anche la presenza di interoperabilità sintattica – semantica ed anche organizzativa.

L‘interoperabilità sintattica specifica il formato e la struttura dei dati (XML). Lo scambio strutturato di dati sanitari è supportato da organizzazioni internazionali per lo sviluppo di standard (SDO) come HL7, IHE, o OpenEHR.

L’interoperabilità semantica è il dominio delle terminologie, nomenclature ed ontologie mediche, garantisce che il significato dei concetti medici possa essere condiviso tra i sistemi fornendo un un linguaggio comune per i termini medici (SNOMED, LOINC, IDMP eccetera).

L’interoperabilità a livello organizzativo è anche di grande importanza perché, se deve avvenire uno scambio di dati tra i sistemi IT, è necessario che le istituzioni pongano regole di interoperabilità affinché ciò si verifichi.

Interoperabilità per la condivisione di informazioni sul paziente

È molto importante che le informazioni mediche di un paziente siano sempre disponibili e complete per tutti gli operatori sanitari ma questo attualmente non è sempre possibile. Ad esempio, se il paziente si sposta da una struttura ospedaliera all’altra, soprattutto se privata o si sposta in altre regioni, i dati sono difficilmente reperibili in tempo reale.

Con la scusa della protezione dei dati personali spesso, le informazioni non sono accessibili neanche tra reparti dello stesso ospedale con rischi per i pazienti in caso di ritardo nel reperimento di informazioni cruciali che portano inevitabilmente ad inefficienze nell’assistenza.

Sarebbe molto importante avere un sistema ampiamente diffuso di FSE e cartelle cliniche elettroniche interoperabili. La realtà è che queste soluzioni molto spesso sono proprietarie e non parlano tra loro e spesso i medici, non solo hanno difficoltà e ostacoli nel reperire le informazioni, ma spesso devono inserire nel sistema informazioni sul paziente già presenti in altri sistemi.

Tutti noi, come utenti, abbiamo avuto esperienze di questo genere quando ci vengono richiesti i nostri dati per integrare informazioni carenti o non presenti nel sistema utilizzato. E soprattutto tutto questo porta a costi inutili e inutile spreco di tempo per i medici che potrebbe essere invece dedicato ai pazienti.

Sarebbe importante far entrare anche i pazienti (patient empowerment) in modo attivo in questo processo soprattutto per la disponibilità, l’integrazione ed il controllo dei loro dati. Ci sono già molti progetti avviati in questo settore che potranno anche aiutare i pazienti a gestire la propria salute in modo sempre più attivo.

Interoperabilità per la ricerca scientifica e Real Worl Data

L’utilizzo di formati interoperabili per i dati del mondo reale, Real World Data (RWD), dati relativi allo stato di salute dei pazienti raccolti di routine nella pratica clinica o, sempre più spesso, tramite app mobili nella vita quotidiana dei pazienti, apre varie opportunità per i ricercatori.

La digitalizzazione della medicina e l’enorme potenziamento delle capacità di calcolo hanno reso oggi possibile raccogliere dati sanitari elettronicamente, in grande quantità, molto velocemente e nel momento stesso in cui la prestazione viene erogata. È quindi possibile utilizzare i dati relativi a grandi numeri di soggetti rappresentativi della popolazione reale per descrivere l’impatto dell’assistenza, per predire i risultati e la risposta ai vari trattamenti a costi relativamente bassi, perché prodotti nella routine quotidiana e non raccolti soltanto con studi ad hoc.

I Real World Data (RWD) sono raccolti nella pratica clinica di routine attraverso una serie di fonti come le cartelle cliniche elettroniche, flussi amministrativi relativi alle ospedalizzazioni, alle prescrizioni di farmaci o alle prestazioni ambulatoriali, registri di farmaci e malattie, dati raccolti da altre fonti come i dispositivi mobili e tele-assistenza.

L’uso nella ricerca dei RWD rappresenta un grandissimo e importante cambiamento. La statunitense Food and Drag Administration (FDA), l’omologa dell’europea EMA e dell’italiana AIFA, per immettere un farmaco sul mercato si basa su costosissimi studi clinici randomizzati con design molto rigidi, popolazioni estremamente selezionate e che richiedono tempi molto lunghi per produrre risultati (time to market), ma dal 2018, nel quadro per il programma FDA-Real World Evidence, è stato ammesso anche l’uso dei dati RWD per supportare il processo normativo decisionale alla base della valutazione d’efficacia di un prodotto farmaceutico.

Negli ultimi anni, le prove del mondo reale (Real World Evidence, RWD) sono state sempre più utilizzate per valutare con maggior efficacia i nuovi farmaci in arrivo sul mercato come un’opportunità unica per accelerare lo sviluppo di nuove terapie e per valutare sia la sicurezza che l’efficacia di questi trattamenti su fonti di dati già esistenti, in quanto usati nella normale pratica clinica.

Se i dati del mondo reale sono interoperabili, possono essere facilmente utilizzati per studi osservazionali su larga scala a livello regionale, nazionale o globale. Tali studi possono affrontare questioni epidemiologiche e problemi di salute pubblica, fornendo, ad esempio, informazioni aggiornate sulla prevalenza e l’incidenza della malattia, i percorsi di trattamento tipici dei pazienti.

I dati del mondo reale sono inoltre preziosi per l’intelligenza artificiale e i metodi di apprendimento.

Permettono di trovare modelli e correlazioni in set di dati ad alta dimensionalità che possono aiutare i ricercatori ad individuare nuove ipotesi di ricerca che possono successivamente essere studiate in modo più mirato in studi clinici controllati (questi studi controllati rimarranno sempre importanti per escludere bias e per identificare relazioni causali).

Più in generale, se i dati sanitari sono strutturati secondo standard internazionali, i dati sono molto più facili da analizzare e si riducono gli sforzi necessari per la preparazione dei dati all’analisi, permettendo di accelerare il processo di ricerca.

Allo stesso modo, i dati interoperabili possono garantire che un’analisi venga eseguita su diverse fonti di dati, utilizzando dati provenienti da diverse istituzioni o Paesi. Questo aspetto è molto importante per la ricerca scientifica dove è spesso necessario unire più gruppi di ricerca multidisciplinari per raggiungere un’analisi significativa e per passare i risultati nella pratica clinica.

In sintesi, l’interoperabilità può generare nuove conoscenze mediche, rendendo possibile un’analisi più efficiente delle fonti di dati esistenti, promuovere pratiche mediche basate sull’evidenza ed accelerare la loro implementazione nelle politiche di salute pubblica.

Vantaggi per la cooperazione inter-istituzionale e internazionale

Come accennato in precedenza, lo scambio di dati sanitari tra diversi sistemi IT è particolarmente importante quando i dati a disposizione sono scarsi o quando sono necessari set di dati molto ampi, come nella ricerca sulle malattie rare, nella medicina di precisione o nello sviluppo di nuovi farmaci.

Nel caso delle malattie rare, ad esempio, il numero di pazienti è spesso così piccolo che, per comprendere meglio queste malattie e migliorare la diagnosi e il trattamento, è fondamentale lo scambio di dati fra le istituzioni.

Reti nazionali e internazionali come la Undiagnosed Diseases Network (UDN) negli Stati Uniti o le reti di riferimento europee (ERN) puntano già a migliorare la collaborazione tra i medici e ricercatori che curano le malattie rare. L’adozione di formati di dati e terminologie standard come la nomenclatura delle malattie rare di Orphanet sono strumenti essenziali per aiutare a coordinare gli sforzi internazionali per ottimizzare la ricerca e l’assistenza in questo settore.

Lo scambio di dati sanitari a livello internazionale è inoltre essenziale per affrontare in modo più efficace i problemi sanitari globali. Abbiamo fatto esperienza di queste carenze proprio con la tragica ed inaspettata pandemia globale COVID-19 che ci ha colpito.

Purtroppo in questo contesto, abbiamo intuito l’importanza dei dati e della loro interoperabilità per prevenire, comprendere meglio e con rapidità un fenomeno.

Se le informazioni possono essere facilmente condivise e confrontate attraverso i confini e le organizzazioni, è possibile implementare sistemi di sorveglianza efficaci che consentono un monitoraggio accurato dei movimenti globali delle malattie. Le epidemie possono quindi essere individuate precocemente cercando di prevenire un’ulteriore diffusione.

Interoperabilità e condivisione per rendere le applicazioni sanitarie disponibili in tutto il mondo

È importante sottolineare che la condivisione dei dati con sistemi sanitari interoperabili facilitano non solo lo scambio di dati, ma anche lo scambio di esperienze, conoscenze, algoritmi, standard, applicazioni e tecnologie.

In questo modo le applicazioni sanitarie sviluppate potrebbero essere messe a disposizione di pazienti, medici e ricercatori di tutto il mondo.

La vasta diffusione di smartphone e app mobili può ulteriormente contribuire alla diffusione della tecnologia sanitaria digitale e aiutare a rendere le tecnologie sanitarie accessibili a livello globale migliorando l’assistenza sanitaria e promuovendo la cooperazione internazionale nei Paesi economicamente più svantaggiati.

L’interoperabilità richiede uno sforzo collaborativo multidisciplinare di diverse professionalità ed è importante che diventi un argomento di primo piano per arrivare ad un’infrastruttura sanitaria digitale interconnessa in grado di migliorare la salute e il benessere dei pazienti a livello globale.

In questa era di generazione di big data, lo sviluppo di un ecosistema nazionale di dati della salute che semplifichi la condivisione dei dati deve essere una priorità importante che richiede una guida a livello nazionale.

In Italia la Commissione Colao ha indicato proprio di questo:

“(…) Un investimento significativo sulla digitalizzazione della sanità (…) lo sviluppo di una piattaforma pubblica che integri telemedicina, home-care e nuove tecnologie di acquisizione dei dati sanitari.

Dati per statistica e ricerca scientifica. Rimuovere gli ostacoli all’utilizzazione di dati amministrativi, censimenti, survey eccetera, ai fini di ricerca scientifica, introducendo il concetto di utilità sociale del trattamento dei dati a fianco delle garanzie di privacy dei cittadini.

Piano di digital health nazionale. Sviluppare un Ecosistema Digitale Salute a livello nazionale, che connetta tutti gli attori della filiera”.

Monitoraggio sanitario nazionale

Sviluppare una strategia e un’architettura di gestione dei dati sanitari a livello nazionale, garantisce la disponibilità di dati omogenei, di buona qualità e in tempo reale.

Questo è un problema molto sentito anche a livello internazionale ed europeo. La creazione di un European Health data space è una delle azioni centrali promosse dalla Commissione europea nell’ambito della UE Data Strategy.

Bibliografia

-Real-World Evidence in United States regulatory decisions nov 13 2020

By: Aishani Patel, PharmD; Trent McLaughlin, BSc(Pharm), PhD
-Nat. Rev. Drug Discov. 15, 670–671; 2016).

Future Cancer research priorities in the USA. A Lancet Oncology Commission

vol 18 nov 2017
-Why digital medicine depends on interoperability
Moritz Lehne, Julian Sass
Digital Medicine vol 2 article n 79 (2019)
Khozin, S., Kim, G. & Pazdur, R. From big data to smart data: FDA’s INFORMED initiative. Nat Rev Drug Discov 16, 306 (2017). https://doi.org/10.1038/nrd.2017.26

Osservatorio ARNO – Cineca

ASSD libro bianco- La sanità che vorremmo dopo la pandemia-ottobre 2020

@RIPRODUZIONE RISERVATA

Articolo 1 di 4