IDEAH[1] – Integrated Database for Environment And Health – L’Organizzazione Mondiale della Sanità e l’Unione Europea hanno inserito tra le loro priorità il miglioramento della qualità ambientale e della salute, con l’obiettivo di prevenire le malattie causate da fattori ambientali.

L’integrazione di dati ambientali e sanitari per la prevenzione

Per raggiungere questo scopo, è fondamentale disporre a livello nazionale di indicatori affidabili sulla qualità ambientale e di dati epidemiologici.

In Italia, il Piano Nazionale della Prevenzione 2020-2025 ha l’obiettivo di sviluppare linee guida e azioni per agevolare l’integrazione e la collaborazione tra il Sistema Sanitario Nazionale (SSN) e il Sistema Nazionale per la Prevenzione della Salute dai rischi ambientali.

In questo quadro si inserisce il progetto IDEAH, che risponde alla crescente esigenza di unire dati sanitari e ambientali, a livello nazionale, in un unico sistema centralizzato e che permetterà la loro analisi congiunta. IDEAH è parte del Sistema Nazionale Prevenzione Salute dai rischi ambientali e climatici (SNPS), istituito dal Decreto-legge 30 aprile 2022, n. 36, con l’obiettivo di migliorare e armonizzare le politiche di prevenzione, controllo e cura delle malattie connesse ai rischi ambientali e climatici.

Il progetto IDEAH, promosso dall’Istituto Superiore di Sanità (ISS), punta a rafforzare le capacità del SSN attraverso azioni intersettoriali, seguendo il principio della “salute in tutte le politiche“. Questo approccio è essenziale per garantire una sanità più sicura, equa e vicina alle persone.

IDEAH si presenterà come un data lakehouse[2] in grado di raccogliere e integrare informazioni eterogenee, promuovendo una visione unitaria tra dati sanitari e ambientali. La sua struttura innovativa consentirà analisi approfondite e l’interazione tra sistemi sanitari e ambientali a livello regionale, provinciale e nazionale, contribuendo così al raggiungimento degli obiettivi del Piano Nazionale della Prevenzione 2020-2025.

L’architettura avanzata di IDEAH migliorerà l’accessibilità ai dati, facilitando la gestione dei rischi ambientali e sanitari, e permetterà risposte rapide e coordinate. Inoltre, la piattaforma supporterà l’analisi epidemiologica e lo sviluppo di modelli predittivi, promuovendo l’uso sostenibile dei dati per la ricerca, la pianificazione delle politiche sanitarie e il monitoraggio continuo degli impatti ambientali sulla salute.

IDEAH si propone come un’iniziativa ambiziosa destinata a diventare un punto di riferimento autorevole e innovativo sia a livello nazionale che europeo, grazie alla solidità del suo impianto metodologico, alla qualità delle competenze coinvolte e alla rilevanza degli obiettivi perseguiti.

Selezione e qualità delle fonti di dati

Per costruire un sistema integrato e affidabile, è stata effettuata, innanzitutto, un’accurata selezione delle fonti di dati ambientali e sanitari. Questo processo ha previsto una valutazione approfondita delle caratteristiche, della qualità, della copertura temporale e spaziale e della validità dei dati. L’obiettivo principale era identificare le fonti più rilevanti per studiare la relazione tra ambiente e salute, assegnando priorità alle esposizioni e agli esiti ritenuti maggiormente significativi. Parallelamente, sono state esaminate la disponibilità e la completezza dei flussi di dati sanitari a livello nazionale, tenendo conto della loro copertura spaziale e temporale, della validità e delle eventuali restrizioni legate alla privatezza dei dati.

La selezione delle fonti è stata condotta con grande attenzione, garantendo che i dati fossero rilevanti per il progetto, completi e accessibili. I criteri di selezione hanno incluso la granularità spaziale e temporale, la frequenza di aggiornamento, la profondità storica e la numerosità dei campioni, con particolare attenzione alla capacità di supportare correlazioni significative tra fattori ambientali e sanitari.

Fonti ambientali e monitoraggio satellitare

In totale, sono 40 le fonti di dati sulle esposizioni ambientali individuate. Queste includono sia indicatori terrestri che satellitari, relativi all’inquinamento dell’aria e del suolo e ad altri fattori ambientali. Tra queste fonti, figurano anche avanzati sistemi satellitari europei come il progetto Copernicus[3], che offre dati ad accesso libero su vari parametri ambientali. In particolare, le missioni Sentinel-2 e Sentinel-5P saranno fondamentali per monitorare l’uso del suolo e gli inquinanti atmosferici. La missione Sentinel-2 fornirà immagini multispettrali ad alta risoluzione, mentre Sentinel-5P raccoglierà dati giornalieri su inquinanti come Biossido d’azoto, Biossido di zolfo, Ozono, Metano e Monossido di Carbonio. Inoltre, IDEAH utilizzerà i dati del Copernicus Atmosphere Monitoring Service (CAMS) per monitorare aerosol e gas serra, garantendo un controllo continuo e aggiornato delle condizioni atmosferiche e dei loro effetti sulla salute.

Dati sanitari e protezione delle informazioni

Riguardo ai dati sanitari, con il supporto del Ministero della salute, IDEAH integrerà diverse fonti, tra cui, ad esempio, indicatori sulla mortalità, emergenze sanitarie, schede di dimissione ospedaliera, ricoveri ospedalieri e certificati di assistenza al parto. Per tali dati, in conformità con il Decreto 7 dicembre 2016, n. 262 sulle procedure di interconnessione dei sistemi informativi sanitari a livello nazionale, il sistema IDEAH garantirà la sicurezza tramite approcci avanzati di anonimizzazione e semi-anonimizzazione dei dati.

Verranno inoltre implementati sistemi di autenticazione forte per garantire un accesso sicuro e conforme alle normative vigenti, assicurando la confidenzialità, l’integrità e la disponibilità delle informazioni.

Accesso sicuro e profilazione degli utenti

La schermata principale della piattaforma, accessibile dopo l’autenticazione, presenta una home page intuitiva e ben organizzata, che facilita la navigazione tra le diverse funzionalità (Fig. 1).

L’accesso alla piattaforma IDEAH avverrà tramite autenticazione SPID, garantendo un elevato standard di sicurezza e protezione dei dati personali (Fig. 2). Durante la fase di iscrizione, agli utenti sarà richiesto di fornire informazioni dettagliate riguardo al proprio ruolo professionale, all’ambito di ricerca e alle finalità per cui intendono utilizzare la piattaforma (Fig. 3).

Le informazioni saranno necessarie per costruire un profilo utente completo, che verrà successivamente analizzato e valutato da un team di esperti. Tale analisi consentirà di assegnare al ricercatore un livello di accesso e un’area tematica specifica, determinando quali dataset potranno essere consultati e utilizzati, e con quale granularità (Fig. 4).

Questa gestione degli accessi permetterà di garantire la riservatezza e il rispetto delle normative privacy.

Dashboard interattiva e personalizzazione dei dati

Dopo aver effettuato l’accesso, l’utente si troverà di fronte a una dashboard interattiva, pensata per facilitare l’esplorazione e l’analisi dei dataset disponibili (Fig. 5). La dashboard sarà configurabile in base alle esigenze dell’utente, offrendo una serie di filtri per personalizzare la ricerca e la visualizzazione dei dati. I criteri di filtraggio includeranno parametri come: la tipologia di dati, la copertura spaziale e temporale e il livello di accesso assegnato.

Oltre alla consultazione, la dashboard offrirà strumenti avanzati per l’estrazione di sottoinsiemi di dati, permettendo di selezionare intervalli temporali o aree geografiche specifiche.

Sarà possibile visualizzare i dati utilizzando grafici dinamici e mappe interattive, per un’analisi più immediata e intuitiva. Successivamente, sarà possibile scegliere il proprio ambiente di elaborazione dei dati tra diversi linguaggi di programmazione, come Python o R (Fig. 6).

Qualora si preferisca, sarà inoltre possibile importare container preconfigurati con ambienti di lavoro già ottimizzati. Un’ulteriore funzione della dashboard sarà la gestione delle librerie e degli strumenti di analisi. Gli utenti potranno selezionare le librerie da utilizzare direttamente dall’interfaccia o caricare file di configurazione (ad esempio, requirements.txt) per impostare l’ambiente di sviluppo secondo le proprie necessità.

Figura 5: Dashboard dei Dataset

Figura 6: Dashboard Ambiente di Sviluppo

Ambiente di sviluppo integrato per l’analisi dei dati

L’ambiente di sviluppo della piattaforma sarà ispirato a Jupyter Lab (Fig. 7). L’ambiente sarà preconfigurato con le librerie selezionate in fase di accesso e presenterà un riepilogo dei dataframes importati, permettendo agli utenti di visualizzare in modo sintetico le informazioni principali su cui intendono lavorare. Gli utenti avranno la possibilità di importare ed eseguire codice preesistente tramite container, con un’area dedicata alla visualizzazione dei risultati in tempo reale. Questa funzionalità sarà particolarmente utile per i ricercatori che utilizzano script consolidati o algoritmi personalizzati. L’ambiente IDEAH sarà inoltre integrato con pacchetti statistici, offrendo un’interfaccia compatibile per l’analisi statistica avanzata. Inoltre, sarà possibile utilizzare strumenti di visualizzazione per creare report interattivi e dashboard personalizzate.

Figura 7: Ambiente di Sviluppo

Grazie a queste caratteristiche, la piattaforma IDEAH offrirà un ambiente flessibile e completo, capace di adattarsi alle esigenze di ricerca e analisi dei dati ambientali e sanitari, garantendo al contempo sicurezza e gestione ottimale degli accessi.

