l'analisi

Conosciamo meglio le proteine grazie all’intelligenza artificiale DeepMind: perché è una scoperta enorme

Deepmind, una succursale di Google e l’istituto EBI (European Bioinformatics Institute hanno annunciato la creazione di una banca dati contenente la predizione della struttura di 350 mila proteine, quasi il doppio delle strutture di proteine a noi note. Ecco le implicazioni di un’enorme risultato

02 Ago 2021
Thomas Vaccari

Università degli Studi di Milano DBS- Dipartimento di Bioscienze

Alpha fold DeepMind Proteine

L’intelligenza artificiale sta sempre più velocemente rivoluzionando il nostro sapere e la nostra percezione del mondo.

La scorsa settimana l’AI (artificial intelligence) ha contribuito ad un epocale passo avanti nel campo della determinazione della struttura delle proteine.

Deepmind, una succursale di Google e l’istituto EBI (European Bioinformatics Institute hanno annunciato la creazione di una banca dati contenente la predizione della struttura di 350 mila proteine, quasi il doppio delle strutture di proteine a noi note che sono il risultato di 60 anni di ricerca. 

Deepmind predice la struttura delle proteine, perché è importante

Può sembrare un dettaglio da addetti ai lavori ma in realtà è un’evento che Ewan Birney (Twitter @ewanbirney), il noto bioinformatico che dirige l’EBI, ha equiparato alla pubblicazione del genoma umano che ci ha introdotto nell’ultimo ventennio nell’era della genomica. Per comprendere origini e implicazioni di quanto è successo occorre fare un passo indietro e rispolverare qualche nozione fondamentale di biologia.

Evento ibrido
Approcci, strumenti e soluzioni efficaci per un mondo del lavoro sempre più phygital
Risorse Umane/Organizzazione
Smart working

Un problema da risolvere anche con l’AI

Paradossalmente, pur conoscendo da anni la forma dei singoli aminoacidi e il modo in cui si legano a formare catene proteiche, non è un compito affatto facile desumere il modo in cui la catena si può ripiegare (fold) per costruire l’origami che corrisponde alla struttura finale.

Manualmente, un ricercatore può impiegare tutti gli anni del proprio dottorato per ricostruire il folding di una sola proteina.

Questo perché le proteine possono essere formate da catene che vanno da poche decine a migliaia di aminoacidi, arrangiati un combinazioni diverse, tali per cui si stima che ogni organismo possa produrre dalla decina al centinaio di migliaia di proteine diverse. Data questa complessità, predire la struttura di una proteina pur conoscendo la sequenza di aminoacidi che la compone si è rivelato un compito immane. Anche sapendo gli spazi che un aminoacido può occupare rispetto ai suoi vicini è le leggi chimico-fisiche che governano il ripiegamento. Infatti, per determinare la struttura delle proteine si sono sviluppati negli anni metodi fisici quali la cristallografia a raggi X o la crio-microscopia elettronica.

Queste tecniche hanno faticosamente prodotto una fotografia di quasi duecentomila proteine che sono state analizzate in più di mezzo secolo di esperimenti. Ognuno di questi esperimenti necessita di anni di lavoro ed è limitato dal raggiungimento di condizioni sperimentali che favoriscano la determinazione della struttura

. Da qualche giorno AlphaFold2, l’algoritmo di DeepMind predice la struttura delle proteine con circa il 90% di accuratezza.  Lo fa – in stile Google –  con un click, precisamente qui. I biologi di gran parte del mondo, non solo quelli che si occupano di strutture delle proteine, si stanno divertendo come bambini a vedere la forma delle proteine di loro interesse, chi stupefatto che la predizione ricalchi effettivamente l’esperimento non ancora pubblicato, chi scettico perchè  AlphaFold2 non sembra averci visto bene.

AlphaFold 2, i vantaggi medici dall’intelligenza artificiale che rivoluziona lo studio delle proteine

La ricerca Deepmind sulle proteine

Come hanno lavorato i ricercatori DeepMind per raggiungere un obbiettivo che per più di 50 anni è stato il sacro Graal della biologia strutturale? Più o meno dallo stesso punto di anni fa quando gli algoritmi “nonni” di AlphaFold2, hanno preso a battere i più bravi giocatori di scacchi al mondo, fino ad arrivare ad un presente dove nessun umano si sognerebbe di battere un computer a scacchi. Sono partiti definendo un set di obbiettivi per l’intelligenza artificiale, con una chiara idea di un successo o di una sconfitta.

Il successo era predire correttamente la struttura delle proteine già determinate sperimentalmente, da anni presenti in una banca dati open access chiamata PDB (Protein Data Bank consultabile da https://www.rcsb.org/). Dopodiché hanno permesso all’algoritmo di autoevolversi avendo accesso a tutti i dati di PDB e a tutti i dati di milioni di proteine di cui si conosce la sequenza. Questo processo iterativo, oggi alla base di molta della moderna AI, ha prodotto la magia. Il termine magia qui non è scelto a caso, ma piuttosto sottolinea il fatto che non sia del tutto chiaro ai ricercatori di DeepMind come l’algoritmo proceda per generare le predizioni. Si sa è che usa solo la conoscenza a cui gli si è dato accesso. E’ cieco per esempio a parti delle proteine che non derivano dalla catena aminoacidica, come per esempio quelle che contengono ioni o co-fattori necessari al funzionamento di una particolare proteina.

Gli stessi ricercatori di DeepMind hanno presentato mesi fa lo studio che valida l’efficacia dell’algoritmo, che è stato infine pubblicato pochi giorni fa su Nature. Ora, insieme alla comunità scientifica, stanno imparando come l’algoritmo raggiunga delle predizioni cosi accurate, nella speranza di derivare principi utili per comprendere come le proteine si ripieghino durante la loro formazione. Nonostante l’accuratezza, neanche AlphaFold2 è perfetto. Funziona molto bene per parti della struttura delle proteine che sono molto strutturate, mentre non è accurato laddove una parte di particolare proteina sia estesa, molto flessibile o non particolarmente strutturata.

Le implicazioni future

Il rilascio di AlphaFold2 e del database per utilizzarlo sviluppato da EBI, come è successo per il genoma umano, non è però un punto di arrivo ma piuttosto un punto di partenza. Si cercherà di migliorare la capacità di predire le parti “difficili” di una proteina e di integrare la banca con sempre più predizioni, per ora limitate alle proteine umane e dei sistemi genetici modello, ovvero gli organismi che studiamo più frequentemente in laboratorio.

I limiti ora sono più nella nostra immaginazione di come usare l’algoritmo. Esistono per esempio varianti di sequenze di proteine che sono dovute alla naturale diversità tra gli individui (i polimorfismi) o che sono dovute a malattie come nel caso dei difetti congeniti o dei tumori. Come queste varianti alterino la forma di una proteina è ancora in gran parte oscuro ma molto importante per determinare la funzione residua di una proteina o la suscettibilità ad un farmaco di un malato.

Potranno i nipoti di  AlphaFold2 aiutare a predire tutto ciò e chissà quant’altro? Predirà delle strutture che non sono state ancora osservate sperimentalmente? E’ difficile dirlo, ma di certo è chiaro che questi moderni oracoli ci permetteranno di progredire nella nostra conoscenza dei viventi.

Infine, la vicenda di AlphaFold2 marca un nuovo modello alla base di una scoperta. Come in passato, i successi del gruppo di DeepMind, si basano sul lavoro di biologia di base fatto da precedenti generazioni di ricercatori, sostenuti dalle nostre tasse e da una buona dose di mecenatismo. Ma anche da anni di investimenti immani nello sviluppo, a scopi principalmente commerciali, di AI. Chiaramente, per vedere oltre lo steccato anche AlphaFold2 ha dovuto sedersi sulle spalle di molti giganti, pubblici e privati, che lo hanno preceduto.

Non è chiaro perché Alphabet, il conglomerato che raggruppa Google e Deepmind, abbia voluto investire parecchie risorse nella risoluzione di un quesito che, seppur epocale, è solo uno tra le molte grandi sfide della biologia moderna. E’ chiarissimo quanto minimo sia stato l’investimento, rispetto a quelli fatti a scopi commerciali, soprattutto in luce dei potenziali ritorni futuri.

Rimane sicuramente importantissimo che EBI, che fa parte del network di laboratori EMBL (European Molecular Biology Laboratory) finanziati da molti stati europei, abbia insistito che le predizioni fossero tutte ad accesso libero (open access).

Cosi ogni ricercatore potrà farsi una sua idea e DeepMind potrà usarla per migliorare ulteriormente gli algoritmi. Solo così la conoscenza generata sarà veramente un patrimonio dell’umanità. Senza distrarsi troppo a meravigliarsi di come un prodotto dell’uomo ne superi l’intuizione e immagini un mondo che sempre più corrisponde al reale.

Che sia un nuovo paradigma per accelerare le conoscenze in un epoca di poche e instabili risorse dedicate al progresso?

WEBINAR
13 Ottobre 2022 - 12:00
PA digitale: qual è lo strumento chiave per accelerare l’innovazione?
Risorse Umane/Organizzazione
Pubblica Amministrazione
@RIPRODUZIONE RISERVATA

Speciale PNRR

Tutti
Incentivi
PA
Sostemibilità
Analisi
Formazione
Salute digitale
Sicurezza
Sostenibilità
Digital Economy
Formazione
Trasferimento tecnologico, il Mise mette sul piatto 7,5 milioni
Strategie
PSN e Strategia Cloud Italia: a che punto siamo e come supportare la PA in questo percorso
Dispersione idrica
Siccità: AI e analisi dei dati possono ridurre gli sprechi d’acqua. Ecco gli interventi necessari
PNRR
Cloud, firmato il contratto per l’avvio di lavori del Polo strategico
Formazione
Competenze digitali, stanziati 48 milioni per gli Istituti tecnologici superiori
Iniziative
Digitalizzazione delle reti idriche: oltre 600 milioni per 21 progetti
Competenze e competitività
PNRR, così i fondi UE possono rilanciare la ricerca e l’Università
Finanziamenti
PNRR, si sbloccano i fondi per l’agrisolare
Sanità post-pandemica
PNRR, Missione Salute: a che punto siamo e cosa resta da fare
Strategie
Sovranità e autonomia tecnologica nazionale: come avviare un processo virtuoso e sostenibile
La relazione
Pnrr e PA digitale, l’alert della Corte dei conti su execution e capacità di spesa
L'editoriale
Elezioni 2022, la sfida digitale ai margini del dibattito politico
Strategie
Digitale, il monito di I-Com: “Senza riforme Pnrr inefficace”
Transizione digitale
Pnrr: arrivano 321 milioni per cloud dei Comuni, spazio e mobilità innovativa
L'analisi I-COM
Il PNRR alla prova delle elezioni: come usare bene le risorse e centrare gli obiettivi digitali
Cineca
Quantum computing, una svolta per la ricerca: lo scenario europeo e i progetti in corso
L'indice europeo
Desi, l’Italia scala due posizioni grazie a fibra e 5G. Ma è (ancora) allarme competenze
L'approfondimento
PNRR 2, ecco tutte le misure per cittadini e imprese: portale sommerso, codice crisi d’impresa e sismabonus, cosa cambia
Servizi digitali
PNRR e trasformazione digitale: ecco gli investimenti e le riforme previste per la digitalizzazione della PA
Legal health
Lo spazio europeo dei dati sanitari: come circoleranno le informazioni sulla salute nell’Unione Europea
Servizi digitali
PNRR e PA digitale: non dimentichiamo la dematerializzazione
Digital Healthcare transformation
La trasformazione digitale degli ospedali
Governance digitale
PA digitale, è la volta buona? Così misure e risorse del PNRR possono fare la differenza
Servizi digitali
Comuni e digitale, come usare il PNRR senza sbagliare
La survey
Pnrr e digitale accoppiata vincente per il 70% delle pmi italiane
Missione salute
Fascicolo Sanitario Elettronico alla prova del PNRR: limiti, rischi e opportunità
Servizi pubblici
PNRR: come diventeranno i siti dei comuni italiani grazie alle nuove risorse
Skill gap
PNRR, la banda ultra larga crea 20.000 nuovi posti di lavoro
Il Piano
Spazio, Colao fa il punto sul Pnrr: i progetti verso la milestone 2023
FORUMPA2022
PNRR e trasformazione digitale: rivedi i Talk di FORUM PA 2022 in collaborazione con le aziende partner
I contratti
Avio, 340 milioni dal Pnrr per i nuovi propulsori a metano
Next Generation EU
PNRR, a che punto siamo e cosa possono aspettarsi le aziende private
Fondi
Operativo il nuovo portale del MISE con tutti i finanziamenti per le imprese
Servizi comunali
Il PNRR occasione unica per i Comuni digitali: strumenti e risorse per enti e cittadini
Healthcare data platform
PNRR dalla teoria alla pratica: tecnologie e soluzioni per l’innovazione in Sanità
Skill
Competenze digitali, partono le Reti di facilitazione
Gli obiettivi
Scuola 4.0, PNRR ultima chance: ecco come cambierà il sistema formativo
Sistema Paese
PNRR 2, è il turno della space economy
FORUM PA 2022
FORUM PA 2022: la maturità digitale dei comuni italiani rispetto al PNRR
Analisi
PNRR: dalla Ricerca all’impresa, una sfida da cogliere insieme
Innovazione
Pnrr, il Dipartimento per la Trasformazione digitale si riorganizza
FORUM PA 2022
PA verde e sostenibile: il ruolo di PNRR, PNIEC, energy management e green public procurement
Analisi
PNRR, Comuni e digitalizzazione: tutto su fondi e opportunità, in meno di 3 minuti. Guarda il video!
Rapporti
Competenze digitali e servizi automatizzati pilastri del piano Inps
Analisi
Attuazione del PNRR: il dialogo necessario tra istituzioni e società civile. Rivedi lo Scenario di FORUM PA 2022
Progetti
Pnrr, fondi per il Politecnico di Torino. Fra i progetti anche IS4Aerospace
Analisi
PNRR, Colao fa il punto sulla transizione digitale dell’Italia: «In linea con tutte le scadenze»
La Svolta
Ict, Istat “riclassifica” i professionisti. Via anche al catalogo dati sul Pnrr
Analisi
Spazio, Colao fa il punto sul Pnrr: i progetti verso la milestone 2023
FORUM PA 2022
Ecosistema territoriale sostenibile: l’Emilia Romagna tra FESR e PNRR
Il Piano
Innovazione, il Mise “centra” gli obiettivi Pnrr: attivati 17,5 miliardi
Analisi
PNRR: raggiunti gli obiettivi per il primo semestre 2022. Il punto e qualche riflessione
Analisi
PNRR: dal dialogo tra PA e società civile passa il corretto monitoraggio dei risultati, tra collaborazione e identità dei luoghi
Webinar
Comuni e PNRR: un focus sui bandi attivi o in pubblicazione
Analisi
Formazione 4.0: cos’è e come funziona il credito d’imposta
PA e Sicurezza
PA e sicurezza informatica: il ruolo dei territori di fronte alle sfide della digitalizzazione
PA e sicurezza
PNRR e servizi pubblici digitali: sfide e opportunità per Comuni e Città metropolitane
Water management
Water management in Italia: verso una transizione “smart” e “circular” 
LE RISORSE
Transizione digitale, Simest apre i fondi Pnrr alle medie imprese
Prospettive
Turismo, cultura e digital: come spendere bene le risorse del PNRR
Analisi
Smart City: quale contributo alla transizione ecologica
Decarbonizzazione
Idrogeno verde, 450 milioni € di investimenti PNRR, Cingolani firma
Unioncamere
PNRR, imprese in ritardo: ecco come le Camere di commercio possono aiutare
I fondi
Industria 4.0: solo un’impresa su tre pronta a salire sul treno Pnrr
Formazione
Trasferimento tecnologico, il Mise mette sul piatto 7,5 milioni
Strategie
PSN e Strategia Cloud Italia: a che punto siamo e come supportare la PA in questo percorso
Dispersione idrica
Siccità: AI e analisi dei dati possono ridurre gli sprechi d’acqua. Ecco gli interventi necessari
PNRR
Cloud, firmato il contratto per l’avvio di lavori del Polo strategico
Formazione
Competenze digitali, stanziati 48 milioni per gli Istituti tecnologici superiori
Iniziative
Digitalizzazione delle reti idriche: oltre 600 milioni per 21 progetti
Competenze e competitività
PNRR, così i fondi UE possono rilanciare la ricerca e l’Università
Finanziamenti
PNRR, si sbloccano i fondi per l’agrisolare
Sanità post-pandemica
PNRR, Missione Salute: a che punto siamo e cosa resta da fare
Strategie
Sovranità e autonomia tecnologica nazionale: come avviare un processo virtuoso e sostenibile
La relazione
Pnrr e PA digitale, l’alert della Corte dei conti su execution e capacità di spesa
L'editoriale
Elezioni 2022, la sfida digitale ai margini del dibattito politico
Strategie
Digitale, il monito di I-Com: “Senza riforme Pnrr inefficace”
Transizione digitale
Pnrr: arrivano 321 milioni per cloud dei Comuni, spazio e mobilità innovativa
L'analisi I-COM
Il PNRR alla prova delle elezioni: come usare bene le risorse e centrare gli obiettivi digitali
Cineca
Quantum computing, una svolta per la ricerca: lo scenario europeo e i progetti in corso
L'indice europeo
Desi, l’Italia scala due posizioni grazie a fibra e 5G. Ma è (ancora) allarme competenze
L'approfondimento
PNRR 2, ecco tutte le misure per cittadini e imprese: portale sommerso, codice crisi d’impresa e sismabonus, cosa cambia
Servizi digitali
PNRR e trasformazione digitale: ecco gli investimenti e le riforme previste per la digitalizzazione della PA
Legal health
Lo spazio europeo dei dati sanitari: come circoleranno le informazioni sulla salute nell’Unione Europea
Servizi digitali
PNRR e PA digitale: non dimentichiamo la dematerializzazione
Digital Healthcare transformation
La trasformazione digitale degli ospedali
Governance digitale
PA digitale, è la volta buona? Così misure e risorse del PNRR possono fare la differenza
Servizi digitali
Comuni e digitale, come usare il PNRR senza sbagliare
La survey
Pnrr e digitale accoppiata vincente per il 70% delle pmi italiane
Missione salute
Fascicolo Sanitario Elettronico alla prova del PNRR: limiti, rischi e opportunità
Servizi pubblici
PNRR: come diventeranno i siti dei comuni italiani grazie alle nuove risorse
Skill gap
PNRR, la banda ultra larga crea 20.000 nuovi posti di lavoro
Il Piano
Spazio, Colao fa il punto sul Pnrr: i progetti verso la milestone 2023
FORUMPA2022
PNRR e trasformazione digitale: rivedi i Talk di FORUM PA 2022 in collaborazione con le aziende partner
I contratti
Avio, 340 milioni dal Pnrr per i nuovi propulsori a metano
Next Generation EU
PNRR, a che punto siamo e cosa possono aspettarsi le aziende private
Fondi
Operativo il nuovo portale del MISE con tutti i finanziamenti per le imprese
Servizi comunali
Il PNRR occasione unica per i Comuni digitali: strumenti e risorse per enti e cittadini
Healthcare data platform
PNRR dalla teoria alla pratica: tecnologie e soluzioni per l’innovazione in Sanità
Skill
Competenze digitali, partono le Reti di facilitazione
Gli obiettivi
Scuola 4.0, PNRR ultima chance: ecco come cambierà il sistema formativo
Sistema Paese
PNRR 2, è il turno della space economy
FORUM PA 2022
FORUM PA 2022: la maturità digitale dei comuni italiani rispetto al PNRR
Analisi
PNRR: dalla Ricerca all’impresa, una sfida da cogliere insieme
Innovazione
Pnrr, il Dipartimento per la Trasformazione digitale si riorganizza
FORUM PA 2022
PA verde e sostenibile: il ruolo di PNRR, PNIEC, energy management e green public procurement
Analisi
PNRR, Comuni e digitalizzazione: tutto su fondi e opportunità, in meno di 3 minuti. Guarda il video!
Rapporti
Competenze digitali e servizi automatizzati pilastri del piano Inps
Analisi
Attuazione del PNRR: il dialogo necessario tra istituzioni e società civile. Rivedi lo Scenario di FORUM PA 2022
Progetti
Pnrr, fondi per il Politecnico di Torino. Fra i progetti anche IS4Aerospace
Analisi
PNRR, Colao fa il punto sulla transizione digitale dell’Italia: «In linea con tutte le scadenze»
La Svolta
Ict, Istat “riclassifica” i professionisti. Via anche al catalogo dati sul Pnrr
Analisi
Spazio, Colao fa il punto sul Pnrr: i progetti verso la milestone 2023
FORUM PA 2022
Ecosistema territoriale sostenibile: l’Emilia Romagna tra FESR e PNRR
Il Piano
Innovazione, il Mise “centra” gli obiettivi Pnrr: attivati 17,5 miliardi
Analisi
PNRR: raggiunti gli obiettivi per il primo semestre 2022. Il punto e qualche riflessione
Analisi
PNRR: dal dialogo tra PA e società civile passa il corretto monitoraggio dei risultati, tra collaborazione e identità dei luoghi
Webinar
Comuni e PNRR: un focus sui bandi attivi o in pubblicazione
Analisi
Formazione 4.0: cos’è e come funziona il credito d’imposta
PA e Sicurezza
PA e sicurezza informatica: il ruolo dei territori di fronte alle sfide della digitalizzazione
PA e sicurezza
PNRR e servizi pubblici digitali: sfide e opportunità per Comuni e Città metropolitane
Water management
Water management in Italia: verso una transizione “smart” e “circular” 
LE RISORSE
Transizione digitale, Simest apre i fondi Pnrr alle medie imprese
Prospettive
Turismo, cultura e digital: come spendere bene le risorse del PNRR
Analisi
Smart City: quale contributo alla transizione ecologica
Decarbonizzazione
Idrogeno verde, 450 milioni € di investimenti PNRR, Cingolani firma
Unioncamere
PNRR, imprese in ritardo: ecco come le Camere di commercio possono aiutare
I fondi
Industria 4.0: solo un’impresa su tre pronta a salire sul treno Pnrr

Articolo 1 di 4