l’approfondimento

Gemelli digitali della società, una nuova leva per la sanità pubblica

Dati sintetici e IA agentica rendono possibile costruire gemelli digitali della società per simulare domanda sanitaria, accesso alle cure e impatto delle politiche pubbliche. Il loro valore cresce dove privacy, vincoli normativi e bisogni invisibili impediscono di usare bene i dati reali

Pubblicato il 3 apr 2026

Fabrizio Davide

ISTAT

Massimo Fedeli

Direttore de Dipartimento per lo sviluppo di metodi e tecnologie per la produzione e diffusione dell’informazione statistica

Pietro Torre

Istat

assistenti virtuali nella PA professioni del futuro stagility

Chiedi all'AI

Riassumi questo articolo

Approfondisci con altre fonti

La trasformazione digitale dell’assistenza sanitaria sta rapidamente evolvendo da una disciplina di analisi retrospettiva, che esamina ciò che è accaduto, a una di simulazione prospettica, che prevede ciò che accadrà. Al centro di questo cambiamento c’è la convergenza di due potenti tecnologie: i dati sintetici e l’intelligenza artificiale agentica.

Insieme, consentono la creazione di “gemelli digitali” ad alta fedeltà di intere popolazioni: simulazioni dinamiche e viventi in cui milioni di agenti autonomi vivono, invecchiano, si ammalano e cercano cure, rispecchiando i comportamenti complessi delle società umane reali.

Gemelli digitali, cure reali: il futuro della medicina personalizzata

Questo salto tecnologico affronta un paradosso fondamentale nell’innovazione sanitaria moderna. Da un lato, l’ottimizzazione dei sistemi sanitari richiede dati granulari a livello individuale per comprendere le sfumature della domanda e dell’offerta, il comportamento dei pazienti e le inefficienze nascoste nell’erogazione delle cure. Dall’altro lato, gli imperativi etici e normativi per proteggere la privacy dei pazienti non sono mai stati così forti. I dati del mondo reale, carichi di informazioni personali sensibili, sono sempre più difficili da condividere, analizzare e utilizzare per l’addestramento di modelli avanzati di IA a causa di quadri normativi come il Regolamento generale sulla protezione dei dati (GDPR) e Health Insurance Portability and Accountability Act (HIPAA).[1]

In questo contesto vincolato, i dati sintetici emergono non solo come un sostituto, ma come un’alternativa superiore per applicazioni specifiche. Generando set di dati artificiali statisticamente identici alle popolazioni reali ma privi di qualsiasi informazione privata, possiamo addestrare popolazioni di agenti di IA per simulare scenari politici complessi. Possiamo chiederci: “Cosa succede ai tempi di attesa del pronto soccorso se introduciamo un ticket di 25 euro per le visite non urgenti?” oppure “La creazione di un nuovo centro sanitario in questo quartiere ridurrà effettivamente le chiamate di emergenza al 112 da parte degli anziani o le barriere alla mobilità lo renderanno inaccessibile?”.[3]

Questo rapporto fornisce un’analisi esaustiva di questo paradigma. Esplora le pressioni normative che spingono all’adozione dei dati sintetici, le metodologie per generare popolazioni realistiche da statistiche grossolane e l’architettura dell’IA agentica. Applica poi questi concetti a due casi di studio critici: la verifica delle politiche finanziarie nell’assistenza di emergenza e la pianificazione della localizzazione per le fasce demografiche vulnerabili, prima di concludere con un esame di come queste simulazioni rivelino la domanda latente e le inefficienze del sistema che l’analisi tradizionale spesso trascura.

Indice degli argomenti

Il panorama normativo, l’imperativo della privacy

L’utilizzo dei dati reali dei pazienti per lo sviluppo dell’IA è indissolubilmente legato a una complessa rete di quadri giuridici ed etici. Queste normative, pur essendo essenziali per la tutela delle libertà civili, creano notevoli attriti per l’innovazione basata sui dati. Comprendere questi vincoli è il primo passo per apprezzare la necessità dei dati sintetici.

Nell’Unione Europea, il GDPR stabilisce uno standard rigoroso per il trattamento dei dati che mette fondamentalmente in discussione l’etica dei big data dell’IA moderna. Sebbene l’IA non sia esplicitamente oggetto del GDPR, i principi fondamentali del regolamento, in particolare la limitazione delle finalità e la minimizzazione dei dati, creano ostacoli per gli sviluppatori di IA.[1]

La limitazione delle finalità impone che i dati raccolti per uno scopo specifico (ad esempio, l’assistenza clinica) non possano essere trattati per uno scopo diverso e incompatibile (ad esempio, l’addestramento di un modello di una IA commerciale) senza una base giuridica approvata. Ciò limita la capacità dei sistemi sanitari di riutilizzare i loro vasti archivi di cartelle cliniche dei pazienti per test di simulazione o analisi per politiche sanitarie.[1]

La minimizzazione dei dati richiede che vengano trattati solo i dati strettamente necessari per un compito specifico. I moderni modelli di IA, in particolare i modelli linguistici di grandi dimensioni (LLM) e i sistemi di deep learning, prosperano in maniera inversa: richiedono set di dati massicci, diversificati e spesso ridondanti per apprendere modelli robusti e casi limite. Esiste una tensione intrinseca tra la natura affamata di dati dell’IA e i requisiti minimalisti del GDPR.[1]

Inoltre, il GDPR garantisce alle persone il diritto di non essere soggette a una decisione basata esclusivamente sul trattamento automatizzato (articolo 22). Ciò ha profonde implicazioni per i sistemi di IA agentica che potrebbero autonomamente smistare i pazienti o allocare le risorse. Se un agente di IA decide che un paziente non ha diritto a un appuntamento urgente sulla base di dati reali, tale decisione è soggetta a controllo legale più stringente. Le simulazioni sintetiche consentono agli sviluppatori di testare questi framework decisionali automatizzati in un ambiente privo di conseguenze legali e sociali, garantendo che siano equi e spiegabili prima di essere implementati nel mondo reale.[1]

La legge dell’UE sull’IA e i sistemi ad alto rischio

La legge sull’intelligenza artificiale recentemente introdotta dall’UE rappresenta la prima normativa completa al mondo in materia di IA, che classifica i sistemi in base alla gravità del rischio. Le applicazioni di IA nel settore sanitario rientrano solitamente nelle categorie “ad alto rischio”, che comportano obblighi rigorosi in materia di governance dei dati, trasparenza e accuratezza.[2]

La legge impone che i set di dati utilizzati per l’addestramento, la convalida e il collaudo siano pertinenti, rappresentativi e privi di errori. L’utilizzo di dati reali, spesso disordinati, distorti e incompleti, può diventare un problema. Inoltre, la legge impone obblighi di trasparenza, richiedendo agli sviluppatori di spiegare come funziona un modello. Ciò è notoriamente difficile con i modelli “black box” addestrati su dati privati che non possono essere verificati da terzi a causa della riservatezza. I dati sintetici offrono una soluzione: poiché i dati sono artificiali, possono essere condivisi apertamente con le autorità di regolamentazione e i revisori, consentendo una completa trasparenza su come il modello è stato addestrato e convalidato.[6]

HIPAA e la sfida della de-identificazione

Negli Stati Uniti, HIPAA (Health Insurance Portability and Accountability Act) protegge le informazioni sanitarie protette. Sebbene HIPAA consenta l’uso di dati anonimizzati, i due metodi approvati, Safe Harbor ed Expert Determination, presentano limitazioni significative per la simulazione ad alta fedeltà.[2]

Il metodo Safe Harbor richiede la rimozione di 18 identificatori specifici, tra cui tutte le suddivisioni geografiche più piccole di uno stato (ad eccezione delle prime tre cifre del codice postale) e tutti gli elementi relativi alle date (ad eccezione dell’anno). La rimozione della granularità geospaziale e temporale distrugge l’utilità dei dati per la pianificazione della posizione o la simulazione operativa. Non è possibile simulare il tempo di percorrenza di un paziente anziano verso una clinica specifica se si conosce solo il suo stato di residenza. Non è possibile modellare il picco stagionale dei casi di influenza al pronto soccorso se non è possibile utilizzare le date di ricovero.[7] La privacy è mantenuta ma al costo di perdere la capacità di simulare la realtà con cui una PA può prendere decisioni migliori per la collettività.

Il metodo della determinazione da parte di esperti consente di ottenere dati più granulari, se un esperto di statistica certifica che il rischio di re-identificazione è “molto basso”. Tuttavia, con l’aumentare delle capacità dell’IA, aumenta anche il rischio di re-identificazione. Alcuni studi hanno dimostrato che l’IA è in grado di incrociare dati sanitari sparsi e anonimizzati con database pubblici (come le liste elettorali o i social media) per re-identificare gli individui con una precisione allarmante. Questo “effetto mosaico” rende l’anonimizzazione tradizionale sempre più obsoleta.[1]

L’onere di conformità sull’innovazione

L’affidamento ai dati reali impone un pesante onere di conformità all’innovazione sanitaria. I progetti di ricerca possono subire ritardi di mesi o anni mentre vengono condotte valutazioni d’impatto sulla protezione dei dati (DPIA), i comitati etici esaminano le proposte e vengono negoziati accordi di condivisione dei dati tra istituzioni isolate. Questa frammentazione spesso impedisce la creazione di set di dati integrati che tracciano il percorso di un paziente attraverso l’assistenza primaria, i servizi sociali e l’assistenza di emergenza. Di conseguenza, le inefficienze sistemiche che i responsabili politici devono comprendere rimangono nascoste nelle lacune tra i vari insieme di dati.[8]

I dati sintetici aggirano questo ostacolo. Poiché i record sintetici non si riferiscono a persone fisiche identificabili, in molti contesti possono non rientrare nell’ambito di applicazione del GDPR o del HIPAA. Ciò consente la creazione di set di dati sintetici “open” che possono essere condivisi liberamente oltre i confini e tra le istituzioni, accelerando lo sviluppo di applicazioni di IA agentica.[9]

Dati sintetici, il motore della simulazione

I dati sintetici non sono semplicemente dati anonimizzati o crittografati: sono informazioni generate artificialmente per preservare le proprietà statistiche, le relazioni e la struttura dei dati reali.[10] Un set di dati sintetici di alta qualità preserva le distribuzioni di probabilità congiunte dei dati originali. Se il 20% dei pazienti diabetici nella popolazione reale soffre anche di ipertensione e vive in quartieri a basso reddito, la popolazione sintetica dovrebbe riflettere esattamente queste correlazioni, anche se nessun singolo paziente sintetico corrisponde a un essere umano reale.[12]

Dalle statistiche generali ai singoli agenti

Un requisito fondamentale per la simulazione sanitaria è la capacità di generare popolazioni dettagliate a livello individuale a partire da dati aggregati relativamente grossolani, come tabelle censuarie o statistiche sanitarie regionali. Questo processo, spesso denominato sintesi della popolazione, è alla base della modellizzazione basata su agenti.[13]

Adattamento proporzionale iterativo (IPF)

L’Iterative Proportional Fitting (IPF) è la tecnica standard utilizzata per creare popolazioni sintetiche statiche a partire dai dati censuari. Essa affronta il problema della ricostruzione di una micro-popolazione (individui e famiglie) che soddisfi i vincoli macroeconomici noti (totali marginali).

L’IPF funziona prelevando un campione seme di dati disaggregati (ad esempio, un piccolo sondaggio che mostra la relazione dettagliata tra età, reddito e dimensione del nucleo familiare) e una serie di tabelle marginali dal censimento (ad esempio, popolazione totale per fascia d’età per ciascuna zona; nucleo familiare totale per reddito per ciascuna zona). L’algoritmo regola in modo iterativo i pesi delle famiglie seme fino a quando non si aggregano in modo da corrispondere ai marginali censiti noti per ogni zona geografica.[13]

Ciò consente ai ricercatori di creare una popolazione sintetica in cui ogni nucleo familiare è un “punto sulla mappa”, a cui vengono assegnati attributi specifici quali la dimensione del nucleo familiare, il possesso di un’auto e l’età. Questa granularità spaziale è fondamentale per le simulazioni di pianificazione della localizzazione, in cui la distanza tra l’abitazione di un paziente e un centro sanitario è una variabile primaria.[16]

Approcci di deep learning, GAN e VAE

Sebbene l’IPF sia eccellente per i dati demografici, ha difficoltà con le relazioni non lineari e ad alta dimensionalità che si trovano in cartelle cliniche complesse. Per generare storie cliniche sintetiche, i ricercatori ricorrono ad architetture di deep learning come le reti generative avversarie (GAN) e gli autoencoder variazionali (VAE).[12]

Una GAN è costituita da due reti neurali che competono in un gioco a somma zero. Il generatore crea cartelle cliniche false a partire dal rumore casuale. Il discriminatore cerca di distinguere queste cartelle false dai dati reali. Durante l’addestramento, il generatore impara a produrre dati così realistici che il discriminatore non è in grado di distinguerli. Le GAN sono particolarmente efficaci nel catturare strutture latenti complesse, come le sottili correlazioni tra comorbilità multiple, aderenza alla terapia farmacologica e risultati di laboratorio.[12]

I VAE imparano invece a comprimere i dati di input in uno spazio latente a dimensione inferiore (una rappresentazione matematica semplificata delle caratteristiche essenziali dei dati) e poi a ricostruirli. Campionando da questo spazio latente, è possibile generare nuovi punti dati sintetici che seguono la stessa distribuzione dei dati originali. I VAE sono spesso utilizzati quando l’obiettivo è quello di generare diverse varianti dei profili dei pazienti per sottoporre a stress test un modello di IA.[12]

Modelli linguistici di grandi dimensioni e generazione strutturata (Synthea)

Un approccio ibrido prevede l’utilizzo di sistemi strutturati basati su regole e potenziati da modelli linguistici di grandi dimensioni (LLM).

Synthea è un importante generatore open source di pazienti sintetici che modella la storia clinica dei pazienti sintetici dalla nascita alla morte. A differenza dei GAN che apprendono dai modelli di dati, Synthea utilizza moduli (macchine a stati finiti) per simulare la progressione della malattia sulla base di linee guida cliniche e statistiche epidemiologiche (ad esempio, la progressione del diabete di tipo 2 in base ai livelli di HbA1c).[19]

Le recenti innovazioni prevedono l’utilizzo di LLM (come GPT o Claude) per accelerare lo sviluppo di questi moduli. Un LLM, che agisce come un esperto medico, può redigere la logica di come un paziente simulato che passa da uno stato sano a uno prediabetico sulla base dei fattori di rischio, traducendo efficacemente i libri di testo di medicina in codice eseguibile. Ciò consente la rapida creazione di set di dati sintetici per malattie rare o scenari specifici in cui i dati reali sono scarsi. Un LLM può generare un profilo della malattia che riassume le statistiche mediche rilevanti e poi convertirlo nella struttura JSON richiesta da Synthea, riducendo significativamente il tempo necessario per costruire simulazioni complesse.[21]

Opportunità per le applicazioni di IA

L’uso dei dati sintetici offre, quindi, tre vantaggi strategici per lo sviluppo dell’IA nel settore sanitario.

Garanzia della privacy: i dati sintetici rompono il legame tra dati e individui, consentendo l’addestramento di modelli di IA su dati granulari senza violare le leggi sulla privacy.[9]

Affrontare la scarsità e la distorsione dei dati: i dati del mondo reale sono spesso sbilanciati. I gruppi minoritari o gli eventi avversi rari sono sottorappresentati. La generazione di dati sintetici può sovra-campionare queste classi minoritarie, creando set di dati equilibrati che migliorano l’equità e la robustezza dei modelli di IA. Ciò è fondamentale per garantire che gli agenti di IA non imparino a discriminare le popolazioni sottorappresentate.[9]

Simulazione controfattuale: i dati reali catturano solo ciò che è accaduto. I dati sintetici possono catturare ciò che potrebbe accadere. Possiamo generare popolazioni per il 2030, con diverse strutture demografiche (ad esempio, una popolazione più anziana) per testare le politiche sanitarie future. Questa capacità predittiva è essenziale per la pianificazione strategica a lungo termine.[4]

IA agentica: dai dati passivi agli agenti attivi

Per simulare le dinamiche della domanda e dell’offerta nel settore sanitario, dobbiamo andare oltre i set di dati statici e i modelli predittivi. Abbiamo bisogno dell’IA agentica, ovvero sistemi autonomi in grado di percepire, ragionare, agire e adattarsi al contesto in cui si trovano.

Definizione di IA agentica

Mentre la tradizionale IA predittiva si chiede “Qual è la probabilità che questo paziente venga ricoverato nuovamente?”, l’IA agentica si chiede “Quali azioni posso intraprendere per prevenire questo ricovero e come posso adattarmi se il mio primo tentativo fallisce?”.[23]

L’IA agentica si riferisce a sistemi in grado di riprodurre: percezione, percependo l’ambiente in cui agisce (ad esempio, un paziente simulato che si rende conto di provare dolore o che legge un avviso di salute pubblica); ragionamento, analizzando la situazione sulla base delle condizioni in cui si trova (ad esempio, “Ho bisogno di cure, ma non posso permettermi un medico privato”); azione, eseguendo un atto risolutivo (ad esempio, chiamare un medico di base, recarsi al pronto soccorso o ricorrere all’automedicazione) e adattamento, imparando dal risultato (ad esempio, “Il medico di base era al completo; la prossima volta, se vedrò troppa fila, andrò alla guardia medica o al pronto soccorso”).[25]

Nelle simulazioni sanitarie, utilizziamo tipicamente sistemi multi-agente, in cui migliaia o addirittura milioni di questi agenti interagiscono all’interno di un ambiente sintetico che rappresenta una città o una regione.[23]

L’architettura di un agente sanitario

Per simulare in modo realistico il comportamento dei pazienti, il “Patient Agent” deve essere psicologicamente e sociologicamente plausibile. Andiamo oltre le semplici regole “if-then” per arrivare a sofisticate architetture cognitive come i framework Belief-Desire-Intention (BDI) o Reinforcement Learning (RL).

Attributi e profili degli agenti

Ogni agente nella popolazione sintetica viene inizializzato con un profilo specifico, derivato dal processo di generazione dei dati sintetici.

Attributi statici: età, sesso, etnia, livello di istruzione.

Attributi dinamici: stato di salute (ad es. sano, infetto, in fase di guarigione), livello di stress, situazione finanziaria.

Fenotipi comportamentali: avversione al rischio (ad es. ansioso o stoico), fiducia nel sistema, alfabetizzazione digitale.[17]

Motori di ragionamento IA, BDI e apprendimento per rinforzo

Adesso presentiamo brevemente due motori di ragionamento IA (AI reasoning engine) che si utilizzano in questo ambito.

Nell’architettura Convinzione-Desiderio-Intenzione (Belief-Desire-Intention) un agente ha delle convinzioni sul mondo (ad esempio, “Il pronto soccorso è gratuito”, “I medici di base sono spesso occupati perché ce ne sono pochi”), dei desideri (ad esempio, “Ridurre il dolore”, “Risparmiare denaro”) e delle intenzioni (ad esempio, “Recarsi in ospedale”). L’agente riflette per elaborare un piano che soddisfi i suoi desideri, tenendo conto delle sue convinzioni.[26]

Nell’apprendimento per rinforzo (Reinforcement Learning), gli agenti utilizzano algoritmi del tipo Proximal Policy Optimization (PPO) per apprendere strategie ottimali nel tempo. Un agente potrebbe imparare attraverso ripetuti episodi di simulazione che chiamare un medico di base nei fine settimana è inutile, visto che non lavorano, e ricorrere automaticamente alla guardia medica in prima istanza, imitando il fenomeno reale dell’utilizzo del servizio. Ciò consente alla simulazione di catturare comportamenti emergenti che non sono esplicitamente programmati.[27]

Componente	Funzione nella simulazione sanitaria	Esempio
Profilo (Attributi)	Lo stato statico e dinamico dell’agente.	Età: 78 anni, Mobilità: bassa, Condizione: Broncopneumopatia Cronica Ostruttiva, Reddito: pensione statale.
Memoria	Memorizza interazioni ed esperienze passate.	“L’ultima volta che sono andato al pronto soccorso ho aspettato sei ore”
Ragionamento	Decompone obiettivi di alto livello in azioni.	Obiettivo: cercare aiuto per la mancanza di respiro. Piano: cercare aiuto fra le persone vicine, se non rispondono chiamare il 112.
Vantaggi	Determina l’utilità delle diverse azioni.	Pronto soccorso = beneficio salute – (sforzo del viaggio + costo finanziario)

Il livello di orchestrazione

In una simulazione, il livello di orchestrazione gestisce l’ambiente (il gemello digitale del sistema sanitario). Tiene traccia della disponibilità delle risorse (posti letto negli ospedali, appuntamenti dal medico di base), gestisce il trascorrere del tempo e applica le leggi fisiche del mondo (ad esempio, i tempi di percorrenza basati sui dati sul traffico).[29]

Questo livello consente la modellazione basata su agenti, in cui il comportamento aggregato del sistema (ad esempio, tempi di attesa totali, tassi di infezione) emerge dalle interazioni bottom-up dei singoli agenti.[31]

Primo caso di studio, il ticket di 25 euro per i codici bianchi al pronto soccorso

Una delle applicazioni più potenti dell’IA agentica sui dati sintetici è la possibilità di testare politiche controverse in un ambiente privo di rischi. Un esempio calzante è la proposta di introdurre un costo finanziario per le visite non urgenti al pronto soccorso, spesso oggetto di dibattito in sistemi come il Servizio Sanitario Nazionale italiano (SSN), dove già esiste un sistema di ticket con delle esenzioni per le fasce più deboli della popolazione.

Il contesto politico, domanda indotta dall’offerta e dal sovraffollamento

I reparti di pronto soccorso sono spesso sovraffollati da pazienti con condizioni di bassa gravità (categorie di triage bianco). I dirigenti sanitari ipotizzano spesso che ciò sia dovuto al rischio morale: poiché il servizio è gratuito, i pazienti ne abusano per disturbi minori che potrebbero essere trattati nell’assistenza primaria. La soluzione proposta è un disincentivo finanziario: un ticket di 25 euro per le visite ritenute non urgenti.[3]

Tuttavia, l’attuazione di questa misura nella realtà è politicamente rischiosa ed eticamente complessa. La tariffa scoraggia un uso frivolo o impedisce ai poveri di cercare le cure necessarie? Si limita a spostare il collo di bottiglia sui medici di base? La simulazione fornisce alcune risposte.

Simulazione dello scenario con l’IA agentica

Utilizzando una popolazione sintetica e l’IA agentica, possiamo modellare questo scenario con elevata precisione.

Configurazione, la popolazione sintetica

Generiamo una popolazione sintetica che rappresenta una specifica area di utenza (ad esempio, una città di 200.000 abitanti).

Dati demografici: i dati del censimento forniscono informazioni su età, sesso e composizione del nucleo familiare.

Condizione socioeconomica: ai nuclei familiari vengono assegnati livelli di reddito, fondamentali per modellare la sensibilità al costo del ticket.

Stato di salute: utilizzando i tassi di prevalenza, agli agenti vengono assegnate delle condizioni (ad esempio, il 5% soffre di asma, il 15% di ansia).

Fenotipi comportamentali: agli agenti vengono assegnati delle tipologie di paziente in base alla loro avversione al rischio e condizione (ad esempio, stoico, ansioso, indigente).[17]

Ragionamento dell’agente, la funzione di utilità

Quando un agente avverte un sintomo (ad esempio, lieve dolore toracico), calcola l’utilità delle diverse azioni. L’introduzione del ticket di 25 euro altera questo calcolo. La funzione di utilità potrebbe essere simile alla seguente:

Utilità azione = (Beneficio percepito per la salute) – (Costo in termini di tempo + Costo finanziario + Sforzo)

In uno scenario senza ticket, che diremo scenario A, l’agente confronta l’attesa di 4 ore al pronto soccorso (costo in termini di tempo) con l’attesa di 3 giorni per un medico di base. Se l’agente è ansioso (attribuisce grande importanza alla risoluzione immediata del problema), l’utilità del pronto soccorso supera il tempo di attesa.

In uno scenario in cui si introduce i ticket di 25 euro, che diremo scenario B, si possono verificare almeno 2 casi. Un caso è un’agente ad alto reddito: i 25€ sono trascurabili rispetto al loro reddito. Rimanendo alta l’utilità dell’azione il comportamento rimane invariato. Un altro caso è un agente a basso reddito: i 25€ rappresentano una significativa penalità di utilità, per cui, essendo scesa l’utilità dell’azione sotto il livello dell’autocura o dell’attesa del medico di base, l’agente non va al pronto soccorso.

Esecuzione della simulazione e osservazione dei risultati

Impostiamo la simulazione affinché duri un anno virtuale. Gli agenti si ammalano in modo stocastico in base ai loro profili sanitari. Il modello tiene traccia delle loro decisioni. Si potrebbe osservare un calo quantificabile delle visite al pronto soccorso. Il modello potrebbe prevedere una riduzione del 15% delle visite con il codice bianco.[34]

Monitoriamo anche le code dei medici di base nella simulazione. Poiché gli agenti a basso reddito evitano il pronto soccorso, la domanda di medici di base aumenta. Se la capacità dei medici di base non viene aumentata, il costo, in termini di tempo, per accedere ai medici di base aumenta, spingendo potenzialmente gli agenti a tornare al pronto soccorso (accettando il ticket) o a rifiutare completamente le cure.[35]

È fondamentale sottolineare che la simulazione tiene traccia degli agenti che necessitavano di cure urgenti ma hanno erroneamente giudicato la loro condizione come non urgente e sono rimasti a casa per evitare il ticket. Possiamo calcolare il tasso di eventi avversi (ad esempio, angina non gestita che si trasforma in infarto) causati da questa politica sanitaria. Ciò rivela l’impatto sull’equità determinato da questa scelta: funziona come strumento di gestione della domanda o come tassa regressiva sui poveri?[36]

Nota: i valori vanno letti solo come output di scenario. Dipendono da ipotesi sulla sensibilità al prezzo, sulla capacità della medicina generale e sulla calibrazione della baseline; il punto focale non è il “15%”, ma il fatto che il modello consente di osservare effetti di sostituzione verso altri canali di cura.

Approfondimenti, razionalità piena vs limitata

Le simulazioni basate su agenti spesso rivelano che gli esseri umani non sono perfettamente razionali. L’intelligenza artificiale basata su agenti prova a catturare la razionalità limitata: gli agenti potrebbero pagare le 25 euro semplicemente perché si fidano dell’ospedale più che del medico di base, indipendentemente dal costo, o perché sono confusi dalle regole di triage. Le simulazioni che incorporano questi fattori psicologici (fiducia, paura, abitudine) forniscono previsioni molto più accurate rispetto ai semplici modelli economici.[38]

Secondo caso di studio, pianificazione della localizzazione delle strutture sanitarie e accessibilità per gli anziani

Il secondo caso di studio che presentiamo è la pianificazione della localizzazione per ottimizzare della collocazione fisica delle strutture sanitarie. La pianificazione tradizionale utilizza spesso modelli gravitazionali o semplici analisi di buffer. Facendo ciò non tiene conto dell’eterogeneità della mobilità e del complesso processo decisionale delle popolazioni vulnerabili.[4]

La sfida, accessibilità contro vicinanza

Una clinica situata a 5 km di distanza può essere accessibile per un trentenne che possiede un’auto ma di fatto inaccessibile per un ottantacinquenne che non possiede un’auto, è fragile e non dispone di una linea diretta di autobus. La domanda specifica per la simulazione è, se collocassimo un nuovo centro sanitario in una determinata posizione, gli anziani del quartiere riuscirebbero ad accedervi o continuerebbero a chiamare il 112 per il trasporto?[40]

Modellizzazione della vulnerabilità, lo scenario degli anziani senza auto

In questa simulazione, la popolazione sintetica è arricchita con attributi di mobilità dettagliati, derivati da indagini sui trasporti e dati sanitari.[17]

Attributi sulla mobilità per gli agenti

Si elencano gli attributi aggiuntivi, rispetto al paragrafo 4.2.1, da fornire agli agenti per effettuare la simulazione.

Accesso all’auto: binario (sì/no). Elevata correlazione con reddito ed età.

Indice di fragilità: determina la velocità di deambulazione e la distanza massima percorribile (ad esempio, “Non in grado di camminare per più di 200 m”).

Rete sociale: l’agente ha qualche persona nelle vicinanze che può accompagnarlo in auto.

Alfabetizzazione digitale: è in grado di prenotare un’auto tramite un’app o di utilizzare un sistema di prenotazione online (CUP)?

La logica decisionale, andare o chiamare?

Quando si presenta un’esigenza sanitaria (ad esempio, un improvviso capogiro), l’agente anziano valuta le opzioni disponibili in base ai propri vincoli.

Opzione 1: recarsi autonomamente al nuovo centro sanitario

Requisito: spostarsi.

Logica dei vincoli: se (Auto=No) & (Distanza_Fermata_Autobus > 300m) & (Fragilità=Elevata) allora (Spostarsi = Impossibile).

Risultato: l’agente non può accedere al centro.

Opzione 2: chiamare il 112

Requisito: accesso al telefono (alta disponibilità).

Limitazione: minima (il tempo che l’ambulanza arrivi al paziente).

Risultato: l’agente chiama il numero delle emergenze.

Risultati della simulazione, “Mobility Circle Collapse”

La simulazione rivela un fenomeno denominato “Mobility Circle Collapse” (collasso del cerchio della mobilità). Per gli agenti vulnerabili, l’area di servizio di una struttura non è un cerchio perfetto su una mappa, ma una rete frammentata e irregolare che dipende dagli orari degli autobus, dalla qualità della pavimentazione e dal terreno.[39]

La simulazione potrebbe mostrare che, anche se il nuovo centro è geograficamente più vicino, non vi è alcuna riduzione delle chiamate al 112 per la fascia demografica target perché non è stata affrontata la barriera dell’ultimo miglio (raggiungere a piedi la fermata dell’autobus).

La simulazione consente ai pianificatori di testare anche le politiche di trasporto a misura di anziano, oltre al nuovo edificio. Si può simulare il funzionamento di un servizio di bus navetta dedicato. Gli agenti aggiornano il loro ragionamento: (Navetta disponibile = Vero) quindi (Viaggio = Possibile), per cui diventa possibile andare al centro sanitario. La simulazione può prevedere quindi quantitativamente il calo delle chiamate al numero di emergenza derivante dal servizio navetta ben progettato, identificando quindi il servizio di trasporto, e non la posizione dell’edificio, come il punto chiave per l’efficienza del sistema.[39]

Caratterizzazione della domanda latente e delle inefficienze del sistema

Forse la capacità più profonda delle simulazioni di IA agentica è quella di rendere visibile l’invisibile. La pianificazione sanitaria tradizionale si basa sulla domanda espressa: dati derivati dagli appuntamenti fissati, dai ricoveri al pronto soccorso e dalle liste d’attesa. Questi dati soffrono di un bias di sopravvivenza, in quanto catturano solo coloro che sono riusciti ad accedere al sistema. Trascurano invece la domanda latente: le persone che avevano bisogno di cure ma non le hanno cercate, non hanno potuto accedervi, sono state respinte o hanno rinunciato.[41]

Definizione della domanda latente

La domanda latente può essere classificata in tre tipi, tutti modellabili in un ambiente sintetico: domanda scoraggiata, pazienti che vedono una lunga lista d’attesa o costi elevati e decidono che non ne vale la pena, domanda inaccessibile, l’anziano che fisicamente non è in grado di raggiungere la struttura sanitaria e quindi non compare mai nei dati, e infine domanda rifiutata, pazienti che rifiutano attivamente il trattamento a causa di stigma, paura o mancanza di fiducia.[43]

L’IA agentica come rilevatore di bisogni insoddisfatti

Poiché le simulazioni con dati sintetici modellano l’insorgenza della malattia (il livello biologico) separatamente dal trattamento della malattia (il livello dei servizi), è possibile calcolare matematicamente il divario tra bisogno e cura.

Il tasso di bisogni insoddisfatti (UNR) diventa una metrica utile perché separa bisogno e accesso: usiamo questa fonte come giustificazione della metrica e come ponte verso la lettura delle inefficienze “invisibili” nei soli dati di utilizzo.[28] Si calcola come segue:

UNR = 1 – [(Agenti che ricevono assistenza) / (Agenti che necessitano di assistenza)]

In una specifica simulazione ci si può imbattere nel seguente caso.

1. Livello biologico, l’agente sviluppa una depressione clinica (quindi necessita di aiuto).

2. Livello cognitivo: l’agente valuta la possibilità di cercare aiuto.

3. Livello barriera: due sotto casi, a) l’agente ha uno stigma elevato per cui decide di non cercare aiuto specialistico; b) l’agente cerca di prenotare, ma non ci sono posti disponibili, per cui rinuncia.

Il risultato è che nel suo mondo l’agente è invisibile. Nella simulazione, viene contrassegnato come un bisogno insoddisfatto. Aggregando questi dati all’intera popolazione, emerge il vero peso della malattia che il sistema non riesce ad affrontare.

Modellizzazione del rifiuto del trattamento

Possiamo modellare in modo esplicito le dinamiche psicologiche del rifiuto delle cure. Agli agenti possono essere assegnati punteggi di fiducia e paura in base al loro profilo demografico e alle esperienze passate.

Si può immaginare una nuova campagna di vaccinazione o un’iniziativa per la salute mentale.

Gli agenti comunicano all’interno della simulazione (simulando il passaparola). Se un agente, con un’elevata influenza sociale e una bassa fiducia, parla negativamente del servizio, gli agenti circostanti aggiorneranno le loro convinzioni e potrebbero passare a uno stato di rifiuto delle cure.

Questo può aiutare a caratterizzare le inefficienze del sistema. La simulazione potrebbe rivelare che aumentare l’offerta (costruendo più cliniche) è inutile perché la domanda latente è guidata dalla sfiducia, non dalla mancanza di capacità. Il modello suggerirebbe che l’intervento necessario è l’educazione sanitaria della comunità e non gli investimenti nelle infrastrutture.[39]

Conclusioni

La convergenza tra intelligenza artificiale agentica e dati sintetici rappresenta un cambiamento importante nel modo in cui possiamo pianificare e gestire sistemi complessi. In questa prospettiva, l’idea di una “saggezza delle masse dell’IA” (Wisdom of AI Crowds) funziona come metafora operativa: non sostituisce evidenze e responsabilità, ma indica un nuovo modo di esplorare politiche e vincoli, andando oltre ai classici sondaggi o ai dati retrospettivi, attraverso simulazioni su larga scala di popolazioni e comportamenti.[45]

Costruendo popolazioni sintetiche ad alta fedeltà a partire da dati statistici grossolani, possiamo rispettare le normative GDPR e HIPAA. Possiamo addestrare agenti autonomi a rispecchiare i comportamenti complessi e spesso irrazionali dei pazienti reali, dall’anziano bloccato senza mezzi di trasporto alla persona ansiosa che deve decidere se pagare 25 euro per una visita al pronto soccorso. Queste simulazioni ci consentono di scoprire la parte inesplorata dell’assistenza sanitaria: la domanda latente e i bisogni insoddisfatti che affliggono i nostri sistemi ma rimangono invisibili alle analisi tradizionali.

Man mano che andiamo avanti, questi gemelli digitali della società diventeranno strumenti indispensabili per i responsabili politici. Offrono un rifugio sicuro per la sperimentazione, consentendoci di testare le nostre idee più audaci e identificare le nostre inefficienze più profonde senza mai mettere a rischio un paziente reale. In questo modo, promettono un futuro in cui i sistemi sanitari non saranno solo reattivi nei confronti dei malati, ma progettati in modo proattivo per i vivi.

Tabella della terminologia principale

Termine	Definizione	Contesto
Dati sintetici	Dati generati artificialmente che preservano le proprietà statistiche dei dati reali.	Usato per aggirare i vincoli GDPR/HIPAA.
IA agentica	Sistemi di IA capaci di simulare percezione, ragionamento e azione autonomi.	Simula le decisioni dei pazienti.
Domanda latente	Necessità di servizi che non sono contenuti nei dati di utilizzo.	Identificato misurando il divario tra la malattia e l’accesso alla cura dell’agente.
Domanda indotta dall’offerta	L’uso del servizio è determinato dalla disponibilità piuttosto che dal bisogno medico.	Un fattore di rischio nella costruzione di nuovi centri diagnostici.
Crollo del cerchio di mobilità	La riduzione delle aree accessibili per le popolazioni vulnerabili.	Utilizzato nella pianificazione per il posizionamento delle strutture per anziani.
Tasso di bisogni non soddisfatti	La percentuale di agenti che necessitano di cure e che non le ricevono.	Una metrica primaria dell’inefficienza del sistema.
IPF (Iterative Proportional Fitting)	Adattamento proporzionale iterativo.	Un metodo statistico per creare popolazioni sintetiche a partire dai dati del censimento.
Architettura BDI (Belief-Desire-Intention)	Credenza-Desiderio-Intenzione.	Un modello cognitivo utilizzato per gli agenti di IA per simulare il ragionamento.

Bibliografia

European Journal of Political Science Studies – ISSN 2601-2766
https://oapub.org/soc/index.php/EJPSS/article/download/2096/2667

The impact of the General Data Protection Regulation (GDPR)
https://www.europarl.europa.eu/RegData/etudes/STUD/2020/641530/EPRS_STU(2020)641530_EN.pdf

AI Compliance in 2026: Definition, Standards, and Frameworks
https://www.wiz.io/academy/ai-security/ai-compliance

Evaluation of fast track strategies using agent-based simulation
https://www.researchgate.net/publication/273694711_Evaluation_of_fast_track_strategies_using_agent-based_simulation_modeling_to_reduce_waiting_time_in_a_hospital_emergency_department

Agent-Based Simulation to Inform Planning Strategies for Welfare
https://www.jasss.org/19/4/5.html

AI Regulations: Global Compliance & Business Impact – WitnessAI
https://witness.ai/blog/ai-regulations/

EU AI Act: All You Need to Know in 2025 – DPO Consulting
https://www.dpo-consulting.com/blog/eu-ai-act

Evaluating the Impact of Data Protection Compliance on AI
https://www.researchgate.net/publication/386012969_Evaluating_the_Impact_of_Data_Protection_Compliance_on_AI_Development_and_Deployment_in_the_US_Health_sector

Data Privacy & AI Regulations in Europe: A SaaS Perspective
https://www.clicdata.com/blog/impact-of-data-privacy-and-ai-regulations-for-saas-companies/

The power of synthetic data to drive accurate AI and data models
https://www.catchpoint.com/blog/the-power-of-synthetic-data-to-drive-accurate-ai-and-data-models

Exploring Synthetic Data for Artificial Intelligence and Autonomous
https://unidir.org/wp-content/uploads/2023/11/UNIDIR_Exploring_Synthetic_Data_for_Artificial_Intelligence_and_Autonomous_Systems_A_Primer.pdf

Introducing the Synthetic Data Generator – Build Datasets with
https://huggingface.co/blog/synthetic-data-generator

A Systematic Review of Synthetic Data Generation Techniques
https://www.mdpi.com/2079-9292/13/17/3509

Generating synthetic population for simulating the spatiotemporal
https://pmc.ncbi.nlm.nih.gov/articles/PMC10890746/

Generating population synthesis using a diffusion model
https://informs-sim.org/wsc23papers/247.pdf

Generating Synthetic Population – arXiv,
https://arxiv.org/html/2209.09961v2

Using Generative Adversarial Networks to Assist Synthetic,
https://par.nsf.gov/servlets/purl/10409331

Towards inclusive urban planning: an elderly-focused agent
https://www.researchgate.net/publication/370444965_Towards_inclusive_urban_planning_an_elderly-focused_agent-based_model_of_West_Midlands

Using Generative Adversarial Networks to Assist Synthetic
https://ieeexplore.ieee.org/document/9859422

Leveraging generative AI to enhance Synthea model development
https://pmc.ncbi.nlm.nih.gov/articles/PMC12772637/

Simulation of a machine learning enabled learning health system
https://pmc.ncbi.nlm.nih.gov/articles/PMC9606301/

How AI Learned to Create Realistic Disease Models
https://medium.com/@kramermark/how-ai-learned-to-create-realistic-disease-models-f8f9f57a64e0

Leveraging Generative AI to Enhance Synthea Module Development
https://arxiv.org/pdf/2507.21123

How Agentic AI is Transforming the Pharma Industry
https://www.datategy.net/2025/03/05/how-agentic-ai-is-transforming-the-pharma-industry/

From assistant to collaborator: The power of agentic AI in healthcare
https://diagnostics.roche.com/global/en/healthcare-transformers/article/agentic-ai-in-healthcare.html

Agentic AI: A Comprehensive Survey of Technologies, Applications
https://ieeexplore.ieee.org/iel8/6287639/10820123/11071266.pdf

The Rise of Agentic AI: A Review of Definitions, Frameworks
https://www.mdpi.com/1999-5903/17/9/404

Reinforcement Learning as the Defining Leap in Healthcare AI
https://arxiv.org/pdf/2508.21101

AI-Driven Policy Testing for Mental Health Crisis Response
https://www.researchgate.net/publication/392535199_AI-Driven_Policy_Testing_for_Mental_Health_Crisis_Response_An_Agent-Based_Modelling_and_Reinforcement_Learning_Approach

Agentic AI Explained
https://c3.ai/blog/agentic-ai-explained/

From prompt to platform: an agentic AI workflow for healthcare
https://www.researchgate.net/publication/391823318_From_prompt_to_platform_an_agentic_AI_workflow_for_healthcare_simulation_scenario_design

Agent-Based Modeling in Public Health: Current Applications
https://pmc.ncbi.nlm.nih.gov/articles/PMC5937544/

Modelling Granular Process Flow Information to Reduce Bottlenecks
https://pmc.ncbi.nlm.nih.gov/articles/PMC9140672/

NHS reform: What does offering GPs £20 every time they consult
https://www.consultantconnect.org.uk/nhs-reform-20-for-gps/

DEMAND AND CAPACITY MODELLING OF ACUTE SERVICES
https://uhra.herts.ac.uk/id/eprint/16893/1/14113244%20Ordu%20Muhammed%20Final%20Version%20of%20PhD%20Submission.pdf

An agent-based simulation model to evaluate alternative
https://www.researchgate.net/publication/311339709_An_agent-based_simulation_model_to_evaluate_alternative_co-payment_scenarios_for_contributing_to_health_systems_financing

CovSyn: an agent-based model for synthesizing COVID-19 course
https://www.medrxiv.org/content/10.1101/2025.05.17.25327820v1.full-text

Generating synthetic multidimensional molecular time series data
https://pmc.ncbi.nlm.nih.gov/articles/PMC12342025/

Les soins non programmés et le recours aux urgences hospitalières,
https://www.irdes.fr/documentation/syntheses/les-soins-non-programmes-et-le-recours-aux-urgences-hospitalieres-dans-les-pays-de-l-ocde.pdf

Agent-based modeling of health resources for older adults
https://www.researchgate.net/publication/397919464_Agent-based_modeling_of_health_resources_for_older_adults_accessibility_equity_and_last-mile_solutions_in_Fuzhou_China

Emergency exit layout planning using optimization and agent-based
https://d-nb.info/1316186539/34

CHE Research Paper 169 – University of York
https://www.york.ac.uk/media/che/documents/papers/researchpapers/CHERP169_drivers_health_care_expenditure_final_report.pdf

Transportation Planning Implications of Automated/Connected
https://rosap.ntl.bts.gov/view/dot/32218/dot_32218_DS1.pdf

Volume 12 • Issue 1 • January 2024 – Bezmialem Science
https://www.bezmialemscience.org/pdf/bd1986e1-0bc1-4f4d-af66-3a184850a065/issues/2024-012-001.pdf

From the Inside Out: – Home | Unc Inc Cloud
https://cdn.uncinc.cloud/kncv-tuberculosis/production/public/2025-04/From-the-Inside-out-stigma-compressed.pdf

@RIPRODUZIONE RISERVATA

Fabrizio Davide

ISTAT

Seguimi su

Massimo Fedeli

Direttore de Dipartimento per lo sviluppo di metodi e tecnologie per la produzione e diffusione dell’informazione statistica

Pietro Torre

Istat

Seguimi su

@RIPRODUZIONE RISERVATA

Fabrizio Davide

ISTAT

Seguimi su

Massimo Fedeli

Direttore de Dipartimento per lo sviluppo di metodi e tecnologie per la produzione e diffusione dell’informazione statistica

Pietro Torre

Istat

Seguimi su

0 Commenti

Più recenti

Più votati

Inline Feedback

Vedi tutti i commenti

Argomenti

Canali

Sanità digitale

Gemelli digitali della società, una nuova leva per la sanità pubblica

Il panorama normativo, l’imperativo della privacy

Il Regolamento generale sulla protezione dei dati (GDPR)

La legge dell’UE sull’IA e i sistemi ad alto rischio

HIPAA e la sfida della de-identificazione

L’onere di conformità sull’innovazione

Dati sintetici, il motore della simulazione

Dalle statistiche generali ai singoli agenti

Adattamento proporzionale iterativo (IPF)

Approcci di deep learning, GAN e VAE

Modelli linguistici di grandi dimensioni e generazione strutturata (Synthea)

Opportunità per le applicazioni di IA

IA agentica: dai dati passivi agli agenti attivi

Definizione di IA agentica

L’architettura di un agente sanitario

Attributi e profili degli agenti

Motori di ragionamento IA, BDI e apprendimento per rinforzo

Il livello di orchestrazione

Primo caso di studio, il ticket di 25 euro per i codici bianchi al pronto soccorso

Il contesto politico, domanda indotta dall’offerta e dal sovraffollamento

Simulazione dello scenario con l’IA agentica

Configurazione, la popolazione sintetica

Ragionamento dell’agente, la funzione di utilità

Esecuzione della simulazione e osservazione dei risultati

Approfondimenti, razionalità piena vs limitata

Secondo caso di studio, pianificazione della localizzazione delle strutture sanitarie e accessibilità per gli anziani

La sfida, accessibilità contro vicinanza

Modellizzazione della vulnerabilità, lo scenario degli anziani senza auto

Attributi sulla mobilità per gli agenti

La logica decisionale, andare o chiamare?

Risultati della simulazione, “Mobility Circle Collapse”

Caratterizzazione della domanda latente e delle inefficienze del sistema

Definizione della domanda latente

L’IA agentica come rilevatore di bisogni insoddisfatti

Modellizzazione del rifiuto del trattamento

Conclusioni

Bibliografia

Fabrizio Davide

ISTAT

Massimo Fedeli

Direttore de Dipartimento per lo sviluppo di metodi e tecnologie per la produzione e diffusione dell’informazione statistica

Pietro Torre

Istat

Fabrizio Davide

ISTAT

Massimo Fedeli

Direttore de Dipartimento per lo sviluppo di metodi e tecnologie per la produzione e diffusione dell’informazione statistica

Pietro Torre

Istat

InnovAttori

Competitività europea e sovranità, cosa manca davvero alle startup Ue

Come l’AI porta il caffè sulle nostre tavole al tempo della guerra

Smart home, l’AI accelera la transizione green: ma occhio alla sicurezza

Robotica avanzata: la strategia italiana per competere con Cina e Usa

Industria metalmeccanica, se il consulente è la GenAI: il caso Co.Me.T

Articoli correlati

Codice Rss

Codice Rss