l'approfondimento

Ground truth e supervisione: così l’AI in sanità diventa affidabile

L’intelligenza artificiale in sanità può generare valore solo se resta ancorata alla realtà clinica e alla supervisione del medico. Dalla costruzione dei dataset alla governance organizzativa, la qualità delle decisioni dipende dall’equilibrio tra automazione, spiegabilità e responsabilità umana

Pubblicato il 9 apr 2026

Sergio Cuschera

AI for Healthcare & Industry 4.0 – MADE Competence Center Industria 4.0

sanità digitale italiana carenza medici SSN dati sintetici in sanità sanità digitale post-PNRR; L'AI nella gastroenterologia ed endoscopia digestiva: la sfida tra intelligenza naturale ed artificiale; privacy dati sanitari; MioDottore value-based healthcare sanità data-driven

Chiedi all'AI

Riassumi questo articolo

Approfondisci con altre fonti

L’intelligenza artificiale in sanità sta riscrivendo profondamente il perimetro d’azione del professionista sanitario.
Il primo concetto da presidiare è quello della ground truth ovvero la “verità di base”.

Come l’AI sta cambiando la sanità (e perché fa ancora paura)

Indice degli argomenti

Perché l’intelligenza artificiale in sanità parte dalla ground truth

Non è un fattore statico o puramente tecnologico, ma è intrinsecamente legato alla competenza e all’esperienza del medico e destinato ad aggiungersi al giuramento di Ippocrate.
Questa verità deve essere pervasiva e accompagnare l’intero ciclo di vita della soluzione AI, garantendo che l’algoritmo non perda mai il contatto con la realtà clinica.

Tutto ha inizio con una etichettatura esperta del dataset di training della soluzione AI.
Il dato grezzo viene trasformato in informazione grazie anche al supporto di materiale clinico validato e certificato.

Costruire dataset di training e validazione corretti significa, ad esempio, evitare che un algoritmo diagnostico sovrarappresenti una specifica etnia o che sia condizionato da variabili socio-economiche o strumentali che potrebbero distorcere il risultato finale.

Dalla validazione clinica ai rischi operativi

Una volta costruito il modello, l’attenzione si sposta sulla verifica della sua robustezza e validazione. Non basta che l’AI funzioni in laboratorio; deve dimostrare di reggere l’impatto con la variabilità del mondo reale.
In questa fase, l’integrazione di evidenze derivanti da studi randomizzati si rivela estremamente utile per fornire al modello una base scientifica solida e comparare l’efficacia clinica della soluzione AI con quella tradizionale.
Come evidenziato da una recente scoping review pubblicata su The Lancet Digital Health (Randomised controlled trials evaluating artificial intelligence in clinical practice: a scoping review), l’adozione di studi randomizzati controllati (RCT) è oggi il principale metodo per colmare il gap tra le performance teoriche del software e il reale beneficio clinico.
Solo partendo da queste fondamenta è possibile procedere a un’indagine meticolosa per identificare e mitigare le principali disfunzioni che possono colpire una soluzione AI.

I principali rischi da presidiare

Le soluzioni più avanzate in commercio nascono da collaborazioni rigorose con rinomate istituzioni accademiche proprio per presidiare rischi quali, ad esempio:

• Bias algoritmici: distorsioni in cui il modello favorisce o penalizza determinati gruppi (per etnia, genere o variabili socio-economiche), spesso a causa di dataset di addestramento non rappresentativi della reale popolazione di pazienti a cui la soluzione viene applicata nella realtà.

• Data Drift (deriva dei dati): la perdita di aderenza dell’algoritmo alla realtà clinica nel tempo. Accade quando i dati reali cambiano rispetto a quelli di addestramento (es. nuovi protocolli o evoluzioni demografiche), rendendo le previsioni progressivamente meno accurate.

• Compiacenza da automazione: una disfunzione nel rapporto uomo-macchina che porta il professionista a fidarsi acriticamente dell’output del software, riducendo la vigilanza e il senso critico necessari per validare la decisione finale.

• Carenza di generalizzabilità: l’incapacità di un modello, pur eccellente nel contesto in cui è stato creato, di replicare le stesse performance in strutture sanitarie diverse per dotazione tecnologica o casistica clinica.

Come rendere affidabile l’intelligenza artificiale in sanità

Presidiare queste variabili significa garantire che l’innovazione non resti un esercizio teorico, ma diventi uno strumento robusto e sicuro lungo tutta la catena del valore.
Per far sì che questo accada, è indispensabile adottare un approccio human-in-the-loop (HITL) che non si limiti alla sola progettazione, ma supervisioni ogni fase fino all’utilizzo finale.

La supervisione umana durante l’utilizzo della soluzione

Come evidenziato da uno studio pubblicato su The Lancet Digital Health (“Human-AI Teaming in Clinical Settings: A Socio-Technical Systems Perspective” del settembre 2024), l’IA deve essere intesa come parte di un sistema socio-tecnico complesso, dove il successo non dipende solo dall’accuratezza dell’algoritmo, ma dall’evoluzione del cosiddetto ‘Human-AI Teaming‘.
In questa prospettiva, l’interazione sinergica tra il team clinico e la macchina diventa l’unico vero garante della sicurezza. Per la leadership sanitaria, questo significa che la responsabilità non termina con l’acquisto della tecnologia, ma evolve nella creazione di un ambiente organizzativo capace di valorizzare questa collaborazione durante l’utilizzo, trasformando l’IA da strumento isolato a partner operativo.

La supervisione umana è il baluardo principale, ad esempio, per il contrasto alle allucinazioni: il medico deve essere in grado di intercettare quegli output che, pur apparendo verosimili, sono privi di fondamento clinico. Il medico detiene la responsabilità di queste decisioni e la sua “data literacy” deve essere in grado di sfidare i suggerimenti dell’algoritmo.
Per supportarlo in questo compito di vigilanza, la tecnologia deve scardinare il dogma della cosiddetta ‘black box‘ (scatola nera): quell’opacità algoritmica che rende difficile comprendere la logica dietro un suggerimento diagnostico.
Superare questo ostacolo significa adottare sistemi che integrino la spiegabilità nativa, ad esempio attraverso le heatmap (mappe di calore). Queste rappresentazioni grafiche, sovrapponendo al referto medico un overlay cromatico che evidenzia le aree di interesse per l’algoritmo, permettono al medico di decodificare visivamente il processo decisionale della macchina, rendendo l’intero percorso clinico trasparente e, soprattutto, verificabile.

Quando l’intelligenza artificiale in sanità diventa governance

Tuttavia, la trasparenza tecnologica è solo una parte dell’equazione. La vera sfida per la leadership risiede nel comprendere che l’adozione dell’IA non è l’inserimento di un nuovo software, ma una metamorfosi del modello operativo della struttura sanitaria.
La ground truth clinica, per generare valore reale, deve necessariamente dialogare con la governance aziendale. Questo implica il superamento dei silos dipartimentali: il medico garante deve operare all’interno di un ecosistema dove ingegneri clinici, data scientist e manager di funzione presidiano insieme gli aspetti tecnici e organizzativi, evolvendo verso una struttura di leadership unitaria e multidisciplinare.
L’attuale scenario dei dispositivi potenziati dall’IA conferma che la partita non si gioca solo sul campo dell’accuratezza clinica, ma su quello della fiducia e della visione strategica.
Dobbiamo estendere la cultura della supervisione lungo l’intera catena del valore, garantendo che l’innovazione sia integrata in modo etico e coerente in ogni punto di contatto del percorso di cura. Solo così l’intelligenza artificiale cesserà di essere una promessa tecnologica per diventare un pilastro della crescita sostenibil della sanità moderna.

Autonomia delegata e responsabilità strategica

Non solo, in questo contesto di cooperazione, emerge di recente la necessità di definire nuovi protocolli di governance basati sul concetto di ‘autonomia delegata‘, un tema che è stato centrale nel dibattito scientifico del 2025.
Non si tratta di una delega incondizionata, ma di un processo dinamico in cui la leadership definisce criteri chiari di intervento in base alla criticità del compito e al contesto operativo. Stabilire dove l’algoritmo possa agire con maggiore indipendenza e dove, invece, la supervisione umana debba restare assoluta è una decisione strategica, non tecnica.
Solo attraverso una chiara mappatura delle responsabilità e una cultura della trasparenza, è possibile bilanciare l’efficienza dell’automazione con l’imprescindibile vigilanza etica e clinica del professionista.

@RIPRODUZIONE RISERVATA

Sergio Cuschera

AI for Healthcare & Industry 4.0 – MADE Competence Center Industria 4.0

Professionista con oltre 20 anni di esperienza commerciale in aziende MedTech di primo piano (J&J, Medline, Stryker), con gestione di business unit fino a €35M e team fino a 70 persone. Quando l’AI ha iniziato a trasformare il settore, ha approfondito il tema presso IESE Business School e Stanford School of Medicine, portando poi questa expertise nel campo della sanità italiana. Oggi opera all’intersezione tra consulenza tecnologica per le aziende Lifescience (MADE – Politecnico di Milano), strategia nazionale per l’AI in ambito medico (ENIA, SIIAM), docenza universitaria (Bocconi, UniMi, Tor Vergata, UniTO), divulgazione su riviste specializzate e un prossimo libro per Minerva Medica.

Seguimi su