Uno studio basato su big data, pubblicato sul numero di luglio di Lancet Digital Health, tenta di confrontare direttamente le prestazioni di un’IA nello screening del tumore al seno con le sue prestazioni che ottiene quando viene utilizzata per assistere un medico. L’obiettivo di questo studio è verificare se gli algoritmi di intelligenza artificiale possano contribuire a migliorare la diagnostica precoce, migliorando anche la prognosi della malattia, individuando i tumori in una fase ancora o precoce o riuscendo meglio a diagnosticare quelli che sfuggono ai medici.
La verifica di ciò potrebbe limitare il carico sui reparti permettendo ai sanitari di visitare un numero più elevato di pazienti e, nei luoghi dove c’è una grave carenza di specialisti, riuscire a garantire ugualmente un servizio di qualità in tempi ridotti riducendo le liste d’attesa.
IA, così la computer vision aiuta i medici a identificare il tumore al seno
Lo studio di Lancet Digital Health
Lo studio pubblicato da Lancet Digital Health è basato sul software prodotto da una startup tedesca, Vara, che viene regolarmente usato in molti ospedali tedeschi. L’algoritmo è stato addestrato con i dati di più di 350.000 mammografie ed è stato testato all’interno di due diversi processi per poterne capire le effettive capacità.
In un primo caso è l’intelligenza artificiale ad analizzare autonomamente le mammografie, mentre nel secondo caso le viene chiesto di distinguere le mammografie che possono destare preoccupazione da quelle normali, lasciando, poi, ai medici il compito di fare la diagnosi definitiva, senza però conoscere in anticipo il giudizio negativo dato dall’algoritmo. Nello stesso tempo vengono individuate anche quelle mammografie sulle quali i medici non avevano lanciato segnali di pericolo e che invece sono state individuate all’IA come potenzialmente pericolose.
Nello studio si sono esaminate mammografie sulle quali era stata già formulata una prima diagnosi. L’obiettivo, quindi, è stato quello di confrontare le prestazioni dell’algoritmo di intelligenza artificiale rispetto a quelle dei sanitari nella riduzione degli errori di prima e di seconda specie nelle diagnosi.
I vantaggi dell’intelligenza artificiale nella diagnostica dei tumori
Il risultato di questo esperimento ha dimostrato che il connubio fra intelligenza artificiale e competenze mediche migliora la capacità di individuare le forme tumorali, permettendo allo stesso tempo un importante snellimento del lavoro che deriva dal fatto di non dover analizzare con cura le mammografie che vengono ritenute normali. Nella valutazione complessiva va anche tenuto conto del fatto che normalmente i sanitari non riescono d’individuare in almeno il 10% dei casi dalla sola mammografia dei tumori che esistono, ma alla fine la ricerca ha anche evidenziato che l’intelligenza artificiale da sola è meno efficiente dei sanitari umani e, quindi, non ne è un valido sostituto.
L’intelligenza artificiale ha sicuramente una maggiore capacità di classificazione delle immagini rispetto all’essere umano e questo nella diagnostica per immagini può essere un notevole punto di forza, ma nella diagnosi di un tumore la mammografia è solo uno degli elementi da analizzare. L’algoritmo ha una maggiore capacità di individuare dettagli e indizi nella mammografia, ma il set conoscitivo rimane ancora parziale.
AI e radiomica per la classificazione di tumori alla mammella: le prospettive
I risultati della ricerca pubblicata su Lancet Digital Health ci ripropongono con forza il tema più generale della valutazione della capacità diagnostica dell’IA in medicina. L’eccessivo ottimismo sulle capacità quasi taumaturgiche dell’intelligenza artificiale può, infatti, portare fuori strada quando si tratta di studiare applicazioni nuove e, in campo sanitario, può condurre ad errori che poi impattano pesantemente sui pazienti.
L’IA in medicina e la sacralità del dato
Per governare correttamente le capacità predittive dell’intelligenza artificiale non si può prescindere dai dati. La lezione che qualunque studente del primo anno di fisica deve imparare, se vuole continuare con profitto il suo corso ed avere una buona probabilità di raggiungere la laurea, è la sacralità del dato. È il dato dell’esperimento il materiale che può supportare tutte le successive considerazioni e se il dato non è buono tutto il castello che si costruisce sopra cade con facilità. La facilità di uso dello strumento può trarre in inganno e far pensare che basti avere grandi quantità di dati per raggiungere attraverso il deep learning un buon risultato. È la potenza dello strumento a trarre in inganno e a far credere che l’intelligenza artificiale assomigli ad una scatoletta in cui basti inserire dei dati per ricavare un buon risultato. Questa falsa credenza si è molto diffusa nella comunità scientifica, soprattutto in campo medico, durante la pandemia di Covid 19. Un caso eclatante di fallimento si è verificato quando
si sono utilizzati involontariamente dei set di dati che contenevano scansioni polmonari di bambini che non avevano covid come archetipi di casi non covid. Ma di conseguenza, l’algoritmo di Intelligenza artificiale ha imparato a identificare i bambini, non il covid!
Tornando al nostro caso, uno dei motivi di errore è legato alla circostanza che le IA addestrate a individuare il cancro sono per lo più addestrate su scansioni del seno sane, e pertanto possono essere facilmente soggette a creare falsi positivi.
Conclusioni
Se vogliamo, quindi, evitare il fallimento dei modelli di AI dobbiamo cercare una solida metodologia di costruzione e di analisi dei dati, dobbiamo creare dei database standardizzati e dobbiamo far precedere una seria analisi sulla qualità del dato alla costruzione degli algoritmi. È un lavoro certosino e meno gratificante, ma necessario, perché un set di dati di scarsa qualità produce previsioni scadenti e in sanità questo si ripercuote pesantemente sui pazienti. Tuttavia, se l’intelligenza artificiale, ad oggi, non può essere considerata un valido sostituto dei radiologi, nelle situazioni in cui vi è carenza di radiologi, cosa che potrebbe riguardare più del 60% della popolazione mondiale, potrebbe essere un utile ausilio per ridurre il carico di lavoro dei sanitari, aiutandoli a concentrarsi maggiormente sui casi sospetti.