Covid-19 ovvero il flop degli algoritmi di previsione: ecco perché

Per fare previsioni sul Covid-19 l’IA è fuori gioco: occorre una scienza che entri nel merito del fenomeno e dei suoi meccanismi. La maggioranza dei modelli oggi proposti per tentare profezie sulla pandemia sono diretta derivazione dell’epidemiologia matematica. Ma anche in questo caso, con esiti deludenti. Ecco perché

Sono in tanti durante questi giorni ad anelare profezie riguardo il Covid-19. Tra questi, politici gravati dalla responsabilità di decisioni delicate, medici, imprenditori, e tanta gente in attesa di una piena ripresa della loro vita sociale.

Ma di fronte alla pressante domanda di previsioni circa il futuro evolversi della pandemia, la scienza pare lasciare piuttosto delusi e l’intelligenza artificiale sembra, per i motivi che vedremo di seguito, fuori gioco.

Cerchiamo allora di rintracciare cosa sia disponibile – l’epidemiologia matematica, ad esempio – e di capire perché sia comunque effettivamente poco.

Indice degli argomenti

L’esigenza di prevedere il futuro

A prescindere dall’emergenza attuale, prevedere il futuro è un’esigenza umana prepotente, e in qualche misura questo genere di capacità è fondamentale in ogni organismo vivente. Il prevedere riguarda un’ampia gamma di tempi futuri. L’abilità di colpire la palla da tennis lanciata dall’avversario richiede prevedere la sua traiettoria nei prossimi centesimi di secondo.

Per molti animali – uomo compreso – interpretare le emozioni di un conspecifico permette di fare previsioni sul suo atteggiamento nei prossimi secondi, se aggressivo, amichevole o indifferente. Una delle previsioni più’ importanti per l’uomo alla scala di alcune ore è l’andamento del tempo meteorologico, per decidere se iniziare attività che ne sono dipendenti. Il cervello è un formidabile strumento di previsione, ma ben calibrato ad imparare predizioni su scale di tempi ridotte, che corrispondono alle esigenze di decidere in fretta le proprie azioni.

Già faccende che riguardano il futuro in termini di ore e giorni, come nel caso meteorologico, sono fuori portata. E’ da molto tempo che, nel mestiere di profetizzare, gli scienziati dovrebbero aver preso il posto di maghi, indovini e altri ciarlatani. Il condizionale è d’obbligo, purtroppo oroscopi e imposture del genere sono dure a morire.

Le (difficili) previsioni sul covid-19

La circostanza principale che rende ardua la previsione dell’epidemia si può cogliere immediatamente dall’esempio di previsione da parte del nostro cervello fatto sopra. Le previsioni sulla traiettoria della pallina da tennis da parte di una persona alle prime armi sarà molto imprecisa, col risultato di non riuscire a coordinare la propria risposta, anche se l’avversario gioca lentamente. Viceversa, il cervello di un giocatore professionista realizza una previsione nel futuro tanto accurata da consentirgli di intercettare con precisione palle che viaggiano a duecento chilometri all’ora. I circuiti neurali riescono in questa straordinaria impresa predittiva avendo affinato le proprie connessioni, sull’esperienza di milioni di casi di traiettorie percepite. Fortunatamente per il genere umano, ma sfortunatamente per i modelli predittivi, non sono disponibili milioni di esempi di pandemie da influenza.

Il modo con cui il cervello diventa gradualmente profeta, riguardo il futuro prossimo di qualche categoria di eventi, ha una qualche somiglianza con il modo di funzionare della moderna IA (Intelligenza Artificiale), in particolare riesce ad ottenere prestazioni interessanti, talvolta straordinarie, solamente laddove sia possibile fare un gran numero di esperienze. Quindi, per il motivo appena detto, prevedere l’andamento del Covid-19 le risulta decisamente poco congeniale.

IA a parte, la scienza in grado di fare previsioni non segue affatto le orme del nostro cervello. Tornando alla pallina da tennis, la sua traiettoria futura viene agevolmente predetta tramite le leggi della fisica, da cui sono derivabili equazioni differenziali, risolvibili con opportuni metodi matematici, implementabili da computer. Un procedimento non solo agli antipodi rispetto a come il cervello risolve la faccenda, ma anche ben poco comprensibile, se non per i pochi umani con una solida formazione in fisica, matematica ed informatica.

Sono l’IA, risolvo problemi

Uno dei motivi che rende particolarmente appetibili gli strumenti dell’IA, è che risolvono problemi senza nessuna necessità di conoscere il dominio a cui appartengono tali problemi, e le leggi che lo governano. Gli algoritmi IA di previsione vendite, quelli che consentono di ottimizzare la logistica di organizzazioni come Amazon, ignorano qualunque nozione di marketing, altrettanto i modelli IA di previsioni di borsa ignorano qualunque fondamento di economia. Possono farlo grazie alla disponibilità di svariate milioni di casi passati su cui gli algoritmi fanno esperienza.

Se per il Covid-19 l’IA resta fuori gioco, allora per fare previsioni occorre una scienza che entri nel merito del fenomeno e dei suoi meccanismi, e proprio questo sta succedendo. La maggioranza dei modelli che vengono oggi proposti per tentare profezie sulla pandemia sono una diretta derivazione dell’epidemiologia matematica, così come si sviluppò agli inizi del secolo scorso in Inghilterra.

La nascita dell’epidemiologia matematica

Le problematiche sanitarie dell’impero anglo-indiano avevano promosso l’istituzione dell’Indian Medical Service, che nell’800 divenne un’eccellenza nell’ambito delle malattie infettive, con principale esponente Ronald Ross, la cui scoperta dei meccanismi di trasmissione della malaria gli guadagnò il premio Nobel. Nel 1900 lavorò sotto le sua guida l’appena laureato Anderson McKendrick, nella campagna antimalarica in Sierra Leone. McKendrick condivideva con Ross una duplice passione verso lo studio delle malattie e verso la matematica, disciplina ben poco frequentata dai medici. Pertanto Ross e McKendrick erano costretti al ruolo dei pionieri, mancando in medicina la poderosa dotazione di formule matematiche, con cui è possibile descrivere la maggior parte dei fenomeni, per esempio, in fisica o in chimica. Fu proprio da quest’ultima che Ross prese a prestito una legge, nota come azione di massa, che dice come la variazione nel tempo di una certa reazione chimica, possa essere messa in relazione col prodotto del quantitativo totale di alcuni composti, elevati ad esponenti opportuni. In altre parole, si può far finta che la miriade di molecole che interagiscono durante una reazione chimica, hanno un azione globale in cui non ha importanza andare a inseguirle individualmente, conta solamente quante sono, per ogni categoria.

L’idea di Ross, e dopo di McKendrick, è che si può far finta che anche gli uomini siano come le molecole, e quel che conti sia solamente il loro conteggio in opportune categorie, come infetti o non infetti per la malattia in esame. Il prestito della legge di azione di massa dalla chimica condusse prima Ross e poi McKendrick a dei tentativi di formulazioni matematiche di epidemie di malaria. Purtroppo per McKendrick le malattie dei paesi anglo-indiani non furono solamente oggetto di studio, nel 1920 si ammalò di sprue tropicale e dovette quindi ritirarsi in Inghilterra, dove assunse il ruolo di coordinatore del Royal College of Physicians Laboratory ad Edimburgo. Qui ebbe come collaboratore un biochimico vero e proprio, William Kermack, e insieme pubblicarono nel 1927 una formulazione matematica particolarmente sofisticata, di valore generale per qualunque malattia contagiosa, che viene oggi considerata la pietra miliare dell’epidemiologia matematica.

Per un lungo tempo più che una pietra queste formulazioni rimasero un mattone indigesto per i medici, con le venti e più pagine di ardua matematica. Occorre attendere mezzo secolo perché un altro inglese, Roy Anderson, producesse nel 1979 una versione semplificata e maneggevole del modello di Kermack e McKendrick. Anderson è uno zoologo, e applicò il modello alla previsione della rabbia nelle volpi, all’afta epizootica nei bovini, per poi passare negli anni ’80 anche ad infezioni umane, principalmente l’AIDS.

I primi impieghi effettivi del modello SIR

Fu verso la fine del secolo scorso che quindi il modello trovò impiego effettivo, grazie anche alla disponibilità di migliori strumenti per la soluzione delle equazioni differenziali che richiede, e divenne conosciuto sotto l’acronimo SIR. Le lettere sono iniziali dei compartimenti in cui viene idealmente divisa la popolazione: Susceptible, Infected e Removed. Per ciascun compartimento, le lettere indicano semplicemente il numero di individui che ne fanno parte, quindi S è il numero di individui ancora non infetti, ma suscettibili ad esserlo, I il numero di infetti, mentre R è il numero di persone che hanno contratto la malattia, ma per varie possibili ragioni non sono più in grado di infettare altri, perché in stretta quarantena, oppure perché hanno acquisito immunità, o infine perché deceduti.

La chiave di volta del modello è la semplice formulazione dell’aumento nel tempo degli infetti come prodotto di S per I, ridotto di un certo coefficiente.

Retaggio della chimica: la legge di azione di massa. Si considerano tutti i suscettibili da un lato, e tutti gli infetti dall’altro, come masse omogenee che interagiscono, dando luogo ad altri infetti con una certa proporzionalità fissa. Vi è poi un’altra equazione che esprime la variazione in negativo del numero I di infetti nel tempo, per via degli R, che ne sono una frazione fissata da un altro coefficiente. In definitiva quindi un modello SIR per una certa epidemia viene fissato da soli due parametri, che possono essere stimati facendo combaciare l’andamento predetto del modello con i dati disponibili.

La parsimonia di parametri non finisce qui, dal rapporto di questi due coefficienti, moltiplicato per il numero dei suscettibili ad inizio contagio, si ottiene un numero unico, noto come numero di riproduzione di base, che da solo dice molto su come si comporta un’infezione, lo si può interpretare come il numero medio di persone che un individuo infetto può contagiare, durante l’intero decorso della sua malattia. Val la pena sottolineare l’abissale differenza tra SIR e i modelli di IA, proprio riguardo il numero di parametri in gioco: solamente due per il SIR, migliaia o anche milioni in un modello IA. Va chiarito, ad onor del vero, che il SIR come appena raccontato è un caso limite semplificato delle equazioni di McKendrick e Kermack, i quali non mantenevano fissi quei due coefficienti di cui si è parlato, ma li consideravano variabili in funzione del progredire della malattia in ogni individuo. La soluzione delle equazioni era pertanto decisamente più complessa, e anche per questo fu ben poco praticata, lasciando il posto all’essenziale SIR qui descritto.

La discreta popolarità del modello SIR trova testimonianza nella prima stagione della famosa serie televisiva Numb3rs. Il terzo episodio, Vectors, racconta di una misteriosa epidemia virale a Los Angeles, su cui indaga Charlie Eppes, il genio matematico della serie, che con il suo sofisticato modello SIR riesce a simulare in modo preciso la diffusione del contagio. In realtà in questo episodio il modello non viene adoperato per predire il futuro, quanto invece per muoversi a ritroso nel tempo ed individuale il punto del primo contagio, una sorta di caccia al “paziente zero” che si era tentata anche dalle nostre parti, all’inizio del contagio in Lombardia. Ma senza disporre di Charlie.

Il modello S(E)IR e il Covid-19

Fuori dalla finzione, SIR è stato finora protagonista dei tentativi di predizione del futuro di Covid-19. Il primo in assoluto lo ha realizzato Jianhong Wu con il suo gruppo di ricerca alla York University in Canada. Di origine cinese, Wu è un matematico, direttore del laboratorio di matematica industriale e applicata a York, e tra gli attuali massimi esperti mondiali di modellazione epidemiologica.

Il suo modello è un SEIR, dove agli abituali comparti di popolazione S R e I se è aggiunto E (Exposed). Si considera che non tutti i suscettibili facciano effettivamente parte di quelli contagiabili, ma solo un loro sottoinsieme esposto. Gli altri? Sono potenzialmente suscettibili, ma di fatto non contagiabili per vari possibili motivi: quarantena preventiva, adozione di protezioni sicure motivate dal loro lavoro e via dicendo. Il modello fu pronto per il 29 gennaio, e i suoi parametri furono assestati sui dati in Cina fino al 23 gennaio, verificando come riusciva a prevedere il futuro fino al 29 gennaio. Piuttosto bene, e pur con molta cautela gli autori si sbilanciarono nel profetizzare un crollo dei contagi entro due settimane, se fossero state mantenute le misure restrittive. Due settimane dopo invece, il 5 febbraio, l’epidemia in Cina era ancora in piena fase espansiva. Pochi giorni dopo gli stessi autori pubblicarono un aggiornamento, tenendo conto che l’introduzione delle misure di contenimento dal 23 gennaio avrebbero sicuramente influenzato quella manciata di coefficienti su cui si basa il modello SEIR, stavolta anziché dall’inizio dell’epidemia lo fecero partire proprio dal 23 gennaio, usando i dati fino al primo febbraio. Stavolta la previsione rimase più vaga, con un “ the epidemic will peak soon”.

La Cina è il paese che ha più investito in IA negli ultimi anni, e l’emergenza Covid-19 ne ha subito beneficiato, con l’approntamento del reparto ospedaliero dedicato ai malati di questo virus a gestione interamente robotizzata, a Whuan. Risultava pertanto davvero deludente non poterne far uso dell’IA anche come strumento di predizione del contagio nei giorni a venire.

Ci ha provato un personaggio di elevata statura scientifica, Nanshan Zhong, con un interessante tentativo di coniugare SIR e modelli deep learning, che costituiscono la punta di eccellenza dell’attuale IA. Zhong è pneumologo di fama mondiale, formatosi ad Edimburgo, direttore dell’istituto di malattie polmonari di Guangzhou, uno dei principali esperti sulla SARS (Severe Acute Respiratory Syndrome) che ha afflitto la Cina nel 2002-2003, e di cui pare lui stesso ne fu colpito. L’incertezza deriva dalla sua scelta personale di non divulgare il suo stato di malattia, per evitare il possibile panico innescato dalla notizia che l’uomo a capo della lotta contro il virus ne fosse vittima, si curò a casa e tornò dopo poco a lavorare in ospedale.

Il modello epidemiologico tradizionale di Zhong e del suo gruppo di ricerca è un SEIR come nel lavoro di Wu e collaboratori, con i parametri affinati sui dati in Cina dall’inizio dell’epidemia fino al 9 febbraio.

La predizione nel futuro è stata poi affidata all’IA, con il tipo di rete neurale più idonea a scrutare cos’è successo nel passato per fare profezie, denominata LSTM (Long-Short Term Memory). Questo modello neurale è il cuore di ogni applicazione di IA per il processamento del linguaggio naturale, dal riconoscimento del parlato alla traduzione automatica. Infatti il linguaggio è essenzialmente una sequenza di eventi nel tempo: suoni o parole scritte. Per inciso, anche quel gran profeta che è il nostro cervello opera in modo simile quando ha a che fare con il linguaggio. Nessuno dei lettori di quest’articolo si metterà mai a leggerlo parola per parola, ma da un paio ad inizio frase prova ad indovinare il senso complessivo della stessa, salvo dare qualche aggiustamento se individua parole che non quadrano con la prima predizione. Lo stesso succede quando si ascolta qualcuno che parla. In questo caso il vantaggio di fare previsioni è puramente di economia cognitiva, nel tirare ad indovinare si fa molta meno fatica che ad analizzare davvero ogni suono, convertirlo in parole, e comporre intere frasi da comprendere.

Dunque Zhong ha individuato, correttamente, in LSTM il miglior candidato di IA per prevedere come procede l’epidemia, ma rimane il punto critico detto all’inizio: per far funzionare il deep learning occorre preliminarmente sottoporlo ad un gran numero di esperienze. Infatti LSTM ha successo nel linguaggio naturale perché esistono corpora con milioni di frasi, così come il nostro cervello diventa abile predittore del senso delle conversazioni solo dopo qualche anno, dopo la nascita, di immersione in ambienti dove si parla. Zhong ha ovviato in qualche modo alla carenza di esperienze sfruttando proprio la SARS. Ha impiegato il tradizionale modello SEIR per ricavare dai dati attuali quei pochi coefficienti cui cui lavora, e ha poi sfruttato il database di dati della vecchia SARS (2002-2003), a lui fin troppo ben nota, per addestrare il modello LSTM. Non ha impiegato quei dati tali e quali, ma trasformati in modo da corrispondere ai parametri epidemiologici dell’attuale epidemia, catturati dal modello SEIR. La sua previsione è stata piuttosto pessimistica riguardo i tempi, prevedendo una continua lenta discesa fino ad aprile, mentre come noto il contagio si è arrestato completamente già prima di metà marzo; ma ottimistica sul numero di casi, che non avrebbe dovuto superare i 60.000.

Ci si è soffermati sui modelli dei gruppi di ricerca di Wu e di Zhong per la loro autorevolezza, ma non sono certamente gli unici, il SIR di McKendrick e Kermack sta vivendo una nuova giovinezza, portando bene i suoi novantatre anni. Comprensibilmente i modelli successivi non si sono limitati alla Cina. Per esempio il gruppo di ricerca informatica della South China Normal University, con Choujun Zhan primo ricercatore, ha elaborato modelli SEIR adattati ai dati di Cina, Corea del Sud, Iran ed Italia, usando i dati reali fino al 6 marzo. Per l’Italia il modello è stato decisamente ottimista, prevedendo per esempio per la Lombardia il picco al 15 marzo e un rapido calo fino a pochi casi ad inizio aprile, profezia non molto diversa per Piemonte ed Emilia Romagna, solamente per la Basilicata veniva prevista una discesa meno rapida, e numeri di infetti maggiori di quelli che si sono poi verificati.

Conclusioni

Se si è in più riprese spiegato il motivo per cui l’IA rimane ai margini nel proferire profezie sul COVID-19, rimane comunque deludente anche la poca affidabilità di un modello, come il SIR, che parte proprio dal meccanismo essenziale di trasmissione dell’infezione. Abbiamo vari casi di modelli che non derivano dall’IA, ma predicono il futuro in modo ammirevole, tramite la formulazione matematica delle leggi che regolano il fenomeno in esame. Esemplare è il caso della meteorologia. I modelli contemporanei producono previsioni di una precisione ammirevole, anche su tempi molto lunghi. Ne beneficiano tutti per pianificare le loro attività (meno in questo periodo) o anche per la sola eterna curiosità di vedere come andrà il tempo, ma è meno evidente per i non addetti ai lavori che senza la disponibilità di previsioni meteorologiche sarebbero impossibili sia la navigazione marittima che quella aerea. Eppure le leggi che regolano l’atmosfera e la sua interazione con mari e terra sono incommensurabilmente più complesse rispetto alla interazioni tra persone che vanno contagiandosi virus. Da quando esistono, i modelli di previsione atmosferica globale sono i principali clienti dei supercomputer più potenti esistenti. Di contro un modello SIR per i dati di Cina o Italia può funzionare su un computer casalingo.

Si può meglio comprendere perché la meteorologia ammetta profezie e il Covid-19 no, prendendo un altro esempio di predizione che sarebbe tanto benvenuta ma non è mai stata realizzata: i terremoti. Qui anzitutto ritorna l’elemento critico già detto: la mancanza di un numero adeguato di esperienze. Mentre l’atmosfera offre ogni attimo in ogni angolo del globo esempi di come si comporta, sia terremoti che pandemie avvengono molto di rado. Ma c’è un altro aspetto che accomuna i due fenomeni orfani di profezie. Mentre l’atmosfera si presta ad essere misurata in ogni suo aspetto, con i satelliti geostazionari, i radar meteorologici, le stazioni di rilevamento a terra, e altri sofisticati strumenti di sondaggio verticale, i terremoti si generano per meccanismi che avvengono in profondità, dove la possibilità di scrutare in dettaglio quel che succede è preclusa. Si può solo misurare il suo effetto. Anche per le epidemie, è difficile avere misure sulle singole interazioni tra le persone, i dati a disposizione sono solo il loro effetto.

C’è da aspettarsi che sull’onda dell’attuale pandemia si rinnovino gli sforzi di ricerca, sia in IA che in epidemiologia matematica, per migliori strumenti di profezia, ma la rarità di questi eventi rimarrà l’elemento più critico. D’altra parte, che rimangano molto, davvero molto rari, ce lo si augura.