Folding delle proteine

Alphafold 2, così l’intelligenza artificiale ci aiuta a risolvere le sfide della biologia

La previsione del folding proteico significa predire la funzione di nuove proteine e capire il malfunzionamento di altre che sono alla base di diverse malattie come nella malattia neurologiche (Alzheimer, Huntington e Parkinson) e in molti tipi di tumore. Come funziona il sistema Alphafold 2 di Deepmind

Pubblicato il 07 Gen 2021

Pietro Veglianese

PhD presso IRCCS-Istituto di Ricerche Farmacologiche Mario Negri

Folding delle proteine, in verde quelle sperimentalmente rilevate e in blu quelle predette dall'AI

Alphafold 2, l’ultimo sistema di intelligenza artificiale sviluppato da DeepMind, di proprietà di Google, ha compiuto un balzo enorme nel risolvere una delle più grandi sfide della biologia: determinare la forma 3D di una proteina dalla sua sequenza di amminoacidi.

Il sistema potrebbe essere in grado di fornire almeno per una grande classe di proteine la struttura tridimensionale con una precisione abbastanza elevata per essere in grado di aprire il campo della biologia strutturale di diversi ordini di grandezza.

La previsione del folding proteico significa infatti predire anche la funzione di nuove proteine e capire il malfunzionamento di altre che sono alla base di diverse malattie come nella malattia neurologiche (Alzheimer, Huntington e Parkinson) e in molti tipi di tumore.

Vediamo come nasce il progetto Alphafold 2 e perché è importante.

Il folding delle proteine, perché è importante

Le proteine rappresentano gli elementi costitutivi di base della vita poiché sono ciò che permette alla cellula di funzionare. Una proteina è essenzialmente una catena di aminoacidi. Ogni aminoacido, ne sono stati classificati 20, ha una determinata struttura. Sappiamo che le proteine possono essere costituite da decine di migliaia di questi aminoacidi disposti in catena. Quello che succede una volta che si è costituita questa catena di amminoacidi (struttura primaria) è che si ripiega creando delle curve la quali fanno assumere una peculiare forma nello spazio (struttura secondaria). Il modo in cui si ripiega può formare delle torsioni detta ad alfa elica oppure foglietti beta ripiegato mediante la formazione di legami intramolecolari. Questo meccanismo di ripiegamento tradotto inglese viene definito “folding”. Il folding non è solo un ripiegamento della proteina, ma ne determina anche la funzione. Da qui nasce l’enorme interesse nel conoscere come gli amminoacidi si dispongono in una struttura spaziale.

Le prime strutture complete di proteine furono determinate, a partire dagli anni ’50, utilizzando una tecnica in cui i fasci di raggi X vengono sparati su proteine cristallizzate e la luce diffratta tradotta nelle coordinate atomiche di una proteina REF.

La cristallografia a raggi X

La cristallografia a raggi X ha prodotto la maggior parte delle strutture proteiche che conosciamo oggi, presenta però diversi limiti nella sua applicazione. È molto costosa e prevede tempi molti lunghi: si parla di circa un anno per identificare il folding di una proteina. È per questo motivo che ad ora si conoscono solo 170.000 strutture nella forma tridimensionale. Negli ultimi anni, anche la microscopia crioelettronica è diventata uno strumento utile per molti laboratori di biologia strutturale perché in grado anche di studiare il folding proteico REF ma il suo contributo rimane ancora nella fase iniziale. Nuove strategie sono state pensate per migliorare la capacità di investigare la forma delle proteine nello spazio mediante tecniche di valutazione in silico.

I primi tentativi risalgono agli anni ’80 e ’90, ma la capacità computazionale di quel periodo non ha permesso di ottenere grossi risultati. Questo non ha fermato la ricerca che ha rinnovato la sua sfida negli ultimi anni impegnando notevolmente gli studiosi, perché capire come la struttura della proteina è ripiegata rimane un’importante risultato con un enorme significato in ambito biologico.

I contest internazionali e gli algoritmi applicati da Alphafold 2

Da qui l’iniziativa di proporre dei contest internazionali per confrontare le capacità computazionali di diversi gruppi di cui il più famoso è il Critical Assessment of Protein Structure Prediction (CASP) che mette a confronto attraverso una sfida a punteggio il miglior avanzamento nel campo della predizione delle strutture 3D delle proteine. Ed è in questa sfida internazionale che si è distinto l’approccio computazionale di Alphafold2 sviluppato dalla Deepmind Fig. 1, un team di scienziati, ingegneri, esperti di machine learning supportati da Google, che lavorano insieme per far progredire l’AI in diversi ambiti.

FIG.1 CASP contest negli anni

Gli algoritmi applicati da Alphafold 2 per predire il ripiegamento delle proteine hanno risolto le strutture proteiche con una velocita ed una precisione prima inimmaginabili. In alcuni casi, le previsioni della struttura di AlphaFold2 erano indistinguibili da quelle determinate utilizzando metodi sperimentali di riferimento come la cristallografia a raggi X.

Alphafold 2, come ci siamo arrivati

Questa storia inizia però qualche anno prima con la versione iniziale di Alphafold 1 presentata nel CASP del 2018, dove ha ottenuto la massima precisione nella predizione tra i partecipanti. Successivamente, il risultato con le specifiche della strategia è stato pubblicato sulla prestigiosa rivista Nature, ispirando altri lavori e implementazioni open source.

La strategia applicata per Alphafold 1 è possibile riassumerla attraverso due stadi in cui opera l’algoritmo. La prima parte è in sostanza definibile come un processo di machine learning (Fig.2), ed è la parte più importante per far predire all’algoritmo alcune caratteristiche fondamentali della sequenza amminoacidica come la probabile distanza tra gli amminoacidi attraverso metodiche di convolution neuronal networks.

FIG.2 ALPHAFOLD 1 primo stadio di valutazione

Per arrivare a questo risultato il sistema sottocampiona di volta in volta una ristretta sequenza di amminoacidi valutando da database delle proteine disponibili quali potenziali interazioni sono più probabili data la sequenza primaria, per poi ottenere una matrice completa di interazione tra gli amminoacidi sull’intera proteina.

Il secondo stadio prevede la modellazione mediante parametrizzazione con gli angoli di torsione predetti nel primo stadio (Fig.3), da qui è possibile ottenere la struttura nello spazio della proteina.

FIG.3 ALPHAFOLD 1 secondo stadio di valutazione

Per riassumere in parole più semplici, si parte da una sequenza lineare di amminoacidi per definire una probabile distanza di interazione degli aminoacidi applicando passaggi successivi in cui vengono valutati potenziali angoli di torsione, dopo aver imparato da migliaia di combinazioni possibile già conosciute per altre proteine, per arrivare a predire e modellare il folding della proteina dall’esperienza acquisita del sistema computazionale in esame.

Come è stato “addestrato” Alphafold 2

Invece dell’ultima versione di Alphafold 2 presentata all’ultimo contest del 2020 non si conoscono i dettagli che verranno a breve pubblicati. Quello che è stato riferito dal gruppo di Deepmind è lo sviluppo di un sistema di rete neurale basato su uno schema di lavoro mostrato in Fig.4.

FIG.4 ALPHAFOLD2 flusso di lavoro

Il sistema è stato addestrato con dati disponibili pubblicamente costituiti da circa 170.000 strutture proteiche da database di sequenze proteiche a cui è state aggiunta una valutazione di sequenze evolutivamente correlate della proteina analizzate attraverso un allineamento di sequenze multiple (MSA), partendo dal presupposto che gli amminoacidi fondamentali nel folding e nella funzione sono preservati nelle diverse specie e risultano essere più rilevanti. Per fare questo il sistema utilizza circa 16 TPUv3 processori di AI di Google (approssimativamente equivalenti a ~ 100-200 GPU). Ripetendo in continuo questo processo, il sistema è stato in grado di predire strutture altamente accurate nel giro di pochi giorni.

Conclusioni

Alphafold 2 permetterà di indentificare funzioni sconosciute di geni che le hanno codificate. Sarà possibile anche disegnare proteine in grado di ricostituire la funzione fisiologica di proteine compromesse oppure proporre meccanismi di rigenerazione tissutale mediante proteine preassemblate. L’interpretazione del folding proteico può avere quindi un enorme vantaggio per le scienze della vita e la medicina accelerando notevolmente gli sforzi per comprendere gli elementi costitutivi delle cellule, e consentire la scoperta di nuove funzioni e terapie in tempi più rapidi.

Valuta la qualità di questo articolo

La tua opinione è importante per noi!

Speciale PNRR

Tutti
Incentivi
Salute digitale
Formazione
Analisi
Sostenibilità
PA
Sostemibilità
Sicurezza
Digital Economy
CODICE STARTUP
Imprenditoria femminile: come attingere ai fondi per le donne che fanno impresa
DECRETI
PNRR e Fascicolo Sanitario Elettronico: investimenti per oltre 600 milioni
IL DOCUMENTO
Competenze digitali, ecco il nuovo piano operativo nazionale
STRUMENTI
Da Istat e RGS gli indicatori per misurare la sostenibilità nel PNRR
STRATEGIE
PNRR – Piano nazionale di Ripresa e Resilienza: cos’è e novità
FONDI
Pnrr, ok della Ue alla seconda rata da 21 miliardi: focus su 5G e banda ultralarga
GREEN ENERGY
Energia pulita: Banca Sella finanzia i progetti green incentivati dal PNRR
TECNOLOGIA SOLIDALE
Due buone notizie digitali: 500 milioni per gli ITS e l’inizio dell’intranet veloce in scuole e ospedali
INNOVAZIONE
Competenze digitali e InPA cruciali per raggiungere gli obiettivi del Pnrr
STRATEGIE
PA digitale 2026, come gestire i fondi PNRR in 5 fasi: ecco la proposta
ANALISI
Value-based healthcare: le esperienze in Italia e il ruolo del PNRR
Strategie
Accordi per l’innovazione, per le imprese altri 250 milioni
Strategie
PNRR, opportunità e sfide per le smart city
Strategie
Brevetti, il Mise mette sul piatto 8,5 milioni
Strategie
PNRR e opere pubbliche, la grande sfida per i Comuni e perché bisogna pensare digitale
Formazione
Trasferimento tecnologico, il Mise mette sul piatto 7,5 milioni
Strategie
PSN e Strategia Cloud Italia: a che punto siamo e come supportare la PA in questo percorso
Dispersione idrica
Siccità: AI e analisi dei dati possono ridurre gli sprechi d’acqua. Ecco gli interventi necessari
PNRR
Cloud, firmato il contratto per l’avvio di lavori del Polo strategico
Formazione
Competenze digitali, stanziati 48 milioni per gli Istituti tecnologici superiori
Iniziative
Digitalizzazione delle reti idriche: oltre 600 milioni per 21 progetti
Competenze e competitività
PNRR, così i fondi UE possono rilanciare la ricerca e l’Università
Finanziamenti
PNRR, si sbloccano i fondi per l’agrisolare
Sanità post-pandemica
PNRR, Missione Salute: a che punto siamo e cosa resta da fare
Strategie
Sovranità e autonomia tecnologica nazionale: come avviare un processo virtuoso e sostenibile
La relazione
Pnrr e PA digitale, l’alert della Corte dei conti su execution e capacità di spesa
L'editoriale
Elezioni 2022, la sfida digitale ai margini del dibattito politico
Strategie
Digitale, il monito di I-Com: “Senza riforme Pnrr inefficace”
Transizione digitale
Pnrr: arrivano 321 milioni per cloud dei Comuni, spazio e mobilità innovativa
L'analisi I-COM
Il PNRR alla prova delle elezioni: come usare bene le risorse e centrare gli obiettivi digitali
Cineca
Quantum computing, una svolta per la ricerca: lo scenario europeo e i progetti in corso
L'indice europeo
Desi, l’Italia scala due posizioni grazie a fibra e 5G. Ma è (ancora) allarme competenze
L'approfondimento
PNRR 2, ecco tutte le misure per cittadini e imprese: portale sommerso, codice crisi d’impresa e sismabonus, cosa cambia
Servizi digitali
PNRR e trasformazione digitale: ecco gli investimenti e le riforme previste per la digitalizzazione della PA
Legal health
Lo spazio europeo dei dati sanitari: come circoleranno le informazioni sulla salute nell’Unione Europea
Servizi digitali
PNRR e PA digitale: non dimentichiamo la dematerializzazione
Digital Healthcare transformation
La trasformazione digitale degli ospedali
Governance digitale
PA digitale, è la volta buona? Così misure e risorse del PNRR possono fare la differenza
Servizi digitali
Comuni e digitale, come usare il PNRR senza sbagliare
La survey
Pnrr e digitale accoppiata vincente per il 70% delle pmi italiane
Missione salute
Fascicolo Sanitario Elettronico alla prova del PNRR: limiti, rischi e opportunità
Servizi pubblici
PNRR: come diventeranno i siti dei comuni italiani grazie alle nuove risorse
Skill gap
PNRR, la banda ultra larga crea 20.000 nuovi posti di lavoro
Il Piano
Spazio, Colao fa il punto sul Pnrr: i progetti verso la milestone 2023
FORUMPA2022
PNRR e trasformazione digitale: rivedi i Talk di FORUM PA 2022 in collaborazione con le aziende partner
I contratti
Avio, 340 milioni dal Pnrr per i nuovi propulsori a metano
Next Generation EU
PNRR, a che punto siamo e cosa possono aspettarsi le aziende private
Fondi
Operativo il nuovo portale del MISE con tutti i finanziamenti per le imprese
Servizi comunali
Il PNRR occasione unica per i Comuni digitali: strumenti e risorse per enti e cittadini
Healthcare data platform
PNRR dalla teoria alla pratica: tecnologie e soluzioni per l’innovazione in Sanità
Skill
Competenze digitali, partono le Reti di facilitazione
Gli obiettivi
Scuola 4.0, PNRR ultima chance: ecco come cambierà il sistema formativo
Sistema Paese
PNRR 2, è il turno della space economy
FORUM PA 2022
FORUM PA 2022: la maturità digitale dei comuni italiani rispetto al PNRR
Analisi
PNRR: dalla Ricerca all’impresa, una sfida da cogliere insieme
Innovazione
Pnrr, il Dipartimento per la Trasformazione digitale si riorganizza
FORUM PA 2022
PA verde e sostenibile: il ruolo di PNRR, PNIEC, energy management e green public procurement
Analisi
PNRR, Comuni e digitalizzazione: tutto su fondi e opportunità, in meno di 3 minuti. Guarda il video!
Rapporti
Competenze digitali e servizi automatizzati pilastri del piano Inps
Analisi
Attuazione del PNRR: il dialogo necessario tra istituzioni e società civile. Rivedi lo Scenario di FORUM PA 2022
Progetti
Pnrr, fondi per il Politecnico di Torino. Fra i progetti anche IS4Aerospace
Analisi
PNRR, Colao fa il punto sulla transizione digitale dell’Italia: «In linea con tutte le scadenze»
La Svolta
Ict, Istat “riclassifica” i professionisti. Via anche al catalogo dati sul Pnrr
Analisi
Spazio, Colao fa il punto sul Pnrr: i progetti verso la milestone 2023
FORUM PA 2022
Ecosistema territoriale sostenibile: l’Emilia Romagna tra FESR e PNRR
Il Piano
Innovazione, il Mise “centra” gli obiettivi Pnrr: attivati 17,5 miliardi
Analisi
PNRR: raggiunti gli obiettivi per il primo semestre 2022. Il punto e qualche riflessione
Analisi
PNRR: dal dialogo tra PA e società civile passa il corretto monitoraggio dei risultati, tra collaborazione e identità dei luoghi
Webinar
Comuni e PNRR: un focus sui bandi attivi o in pubblicazione
Analisi
Formazione 4.0: cos’è e come funziona il credito d’imposta
PA e Sicurezza
PA e sicurezza informatica: il ruolo dei territori di fronte alle sfide della digitalizzazione
PA e sicurezza
PNRR e servizi pubblici digitali: sfide e opportunità per Comuni e Città metropolitane
Water management
Water management in Italia: verso una transizione “smart” e “circular” 
LE RISORSE
Transizione digitale, Simest apre i fondi Pnrr alle medie imprese
Prospettive
Turismo, cultura e digital: come spendere bene le risorse del PNRR
Analisi
Smart City: quale contributo alla transizione ecologica
Decarbonizzazione
Idrogeno verde, 450 milioni € di investimenti PNRR, Cingolani firma
Unioncamere
PNRR, imprese in ritardo: ecco come le Camere di commercio possono aiutare
I fondi
Industria 4.0: solo un’impresa su tre pronta a salire sul treno Pnrr
CODICE STARTUP
Imprenditoria femminile: come attingere ai fondi per le donne che fanno impresa
DECRETI
PNRR e Fascicolo Sanitario Elettronico: investimenti per oltre 600 milioni
IL DOCUMENTO
Competenze digitali, ecco il nuovo piano operativo nazionale
STRUMENTI
Da Istat e RGS gli indicatori per misurare la sostenibilità nel PNRR
STRATEGIE
PNRR – Piano nazionale di Ripresa e Resilienza: cos’è e novità
FONDI
Pnrr, ok della Ue alla seconda rata da 21 miliardi: focus su 5G e banda ultralarga
GREEN ENERGY
Energia pulita: Banca Sella finanzia i progetti green incentivati dal PNRR
TECNOLOGIA SOLIDALE
Due buone notizie digitali: 500 milioni per gli ITS e l’inizio dell’intranet veloce in scuole e ospedali
INNOVAZIONE
Competenze digitali e InPA cruciali per raggiungere gli obiettivi del Pnrr
STRATEGIE
PA digitale 2026, come gestire i fondi PNRR in 5 fasi: ecco la proposta
ANALISI
Value-based healthcare: le esperienze in Italia e il ruolo del PNRR
Strategie
Accordi per l’innovazione, per le imprese altri 250 milioni
Strategie
PNRR, opportunità e sfide per le smart city
Strategie
Brevetti, il Mise mette sul piatto 8,5 milioni
Strategie
PNRR e opere pubbliche, la grande sfida per i Comuni e perché bisogna pensare digitale
Formazione
Trasferimento tecnologico, il Mise mette sul piatto 7,5 milioni
Strategie
PSN e Strategia Cloud Italia: a che punto siamo e come supportare la PA in questo percorso
Dispersione idrica
Siccità: AI e analisi dei dati possono ridurre gli sprechi d’acqua. Ecco gli interventi necessari
PNRR
Cloud, firmato il contratto per l’avvio di lavori del Polo strategico
Formazione
Competenze digitali, stanziati 48 milioni per gli Istituti tecnologici superiori
Iniziative
Digitalizzazione delle reti idriche: oltre 600 milioni per 21 progetti
Competenze e competitività
PNRR, così i fondi UE possono rilanciare la ricerca e l’Università
Finanziamenti
PNRR, si sbloccano i fondi per l’agrisolare
Sanità post-pandemica
PNRR, Missione Salute: a che punto siamo e cosa resta da fare
Strategie
Sovranità e autonomia tecnologica nazionale: come avviare un processo virtuoso e sostenibile
La relazione
Pnrr e PA digitale, l’alert della Corte dei conti su execution e capacità di spesa
L'editoriale
Elezioni 2022, la sfida digitale ai margini del dibattito politico
Strategie
Digitale, il monito di I-Com: “Senza riforme Pnrr inefficace”
Transizione digitale
Pnrr: arrivano 321 milioni per cloud dei Comuni, spazio e mobilità innovativa
L'analisi I-COM
Il PNRR alla prova delle elezioni: come usare bene le risorse e centrare gli obiettivi digitali
Cineca
Quantum computing, una svolta per la ricerca: lo scenario europeo e i progetti in corso
L'indice europeo
Desi, l’Italia scala due posizioni grazie a fibra e 5G. Ma è (ancora) allarme competenze
L'approfondimento
PNRR 2, ecco tutte le misure per cittadini e imprese: portale sommerso, codice crisi d’impresa e sismabonus, cosa cambia
Servizi digitali
PNRR e trasformazione digitale: ecco gli investimenti e le riforme previste per la digitalizzazione della PA
Legal health
Lo spazio europeo dei dati sanitari: come circoleranno le informazioni sulla salute nell’Unione Europea
Servizi digitali
PNRR e PA digitale: non dimentichiamo la dematerializzazione
Digital Healthcare transformation
La trasformazione digitale degli ospedali
Governance digitale
PA digitale, è la volta buona? Così misure e risorse del PNRR possono fare la differenza
Servizi digitali
Comuni e digitale, come usare il PNRR senza sbagliare
La survey
Pnrr e digitale accoppiata vincente per il 70% delle pmi italiane
Missione salute
Fascicolo Sanitario Elettronico alla prova del PNRR: limiti, rischi e opportunità
Servizi pubblici
PNRR: come diventeranno i siti dei comuni italiani grazie alle nuove risorse
Skill gap
PNRR, la banda ultra larga crea 20.000 nuovi posti di lavoro
Il Piano
Spazio, Colao fa il punto sul Pnrr: i progetti verso la milestone 2023
FORUMPA2022
PNRR e trasformazione digitale: rivedi i Talk di FORUM PA 2022 in collaborazione con le aziende partner
I contratti
Avio, 340 milioni dal Pnrr per i nuovi propulsori a metano
Next Generation EU
PNRR, a che punto siamo e cosa possono aspettarsi le aziende private
Fondi
Operativo il nuovo portale del MISE con tutti i finanziamenti per le imprese
Servizi comunali
Il PNRR occasione unica per i Comuni digitali: strumenti e risorse per enti e cittadini
Healthcare data platform
PNRR dalla teoria alla pratica: tecnologie e soluzioni per l’innovazione in Sanità
Skill
Competenze digitali, partono le Reti di facilitazione
Gli obiettivi
Scuola 4.0, PNRR ultima chance: ecco come cambierà il sistema formativo
Sistema Paese
PNRR 2, è il turno della space economy
FORUM PA 2022
FORUM PA 2022: la maturità digitale dei comuni italiani rispetto al PNRR
Analisi
PNRR: dalla Ricerca all’impresa, una sfida da cogliere insieme
Innovazione
Pnrr, il Dipartimento per la Trasformazione digitale si riorganizza
FORUM PA 2022
PA verde e sostenibile: il ruolo di PNRR, PNIEC, energy management e green public procurement
Analisi
PNRR, Comuni e digitalizzazione: tutto su fondi e opportunità, in meno di 3 minuti. Guarda il video!
Rapporti
Competenze digitali e servizi automatizzati pilastri del piano Inps
Analisi
Attuazione del PNRR: il dialogo necessario tra istituzioni e società civile. Rivedi lo Scenario di FORUM PA 2022
Progetti
Pnrr, fondi per il Politecnico di Torino. Fra i progetti anche IS4Aerospace
Analisi
PNRR, Colao fa il punto sulla transizione digitale dell’Italia: «In linea con tutte le scadenze»
La Svolta
Ict, Istat “riclassifica” i professionisti. Via anche al catalogo dati sul Pnrr
Analisi
Spazio, Colao fa il punto sul Pnrr: i progetti verso la milestone 2023
FORUM PA 2022
Ecosistema territoriale sostenibile: l’Emilia Romagna tra FESR e PNRR
Il Piano
Innovazione, il Mise “centra” gli obiettivi Pnrr: attivati 17,5 miliardi
Analisi
PNRR: raggiunti gli obiettivi per il primo semestre 2022. Il punto e qualche riflessione
Analisi
PNRR: dal dialogo tra PA e società civile passa il corretto monitoraggio dei risultati, tra collaborazione e identità dei luoghi
Webinar
Comuni e PNRR: un focus sui bandi attivi o in pubblicazione
Analisi
Formazione 4.0: cos’è e come funziona il credito d’imposta
PA e Sicurezza
PA e sicurezza informatica: il ruolo dei territori di fronte alle sfide della digitalizzazione
PA e sicurezza
PNRR e servizi pubblici digitali: sfide e opportunità per Comuni e Città metropolitane
Water management
Water management in Italia: verso una transizione “smart” e “circular” 
LE RISORSE
Transizione digitale, Simest apre i fondi Pnrr alle medie imprese
Prospettive
Turismo, cultura e digital: come spendere bene le risorse del PNRR
Analisi
Smart City: quale contributo alla transizione ecologica
Decarbonizzazione
Idrogeno verde, 450 milioni € di investimenti PNRR, Cingolani firma
Unioncamere
PNRR, imprese in ritardo: ecco come le Camere di commercio possono aiutare
I fondi
Industria 4.0: solo un’impresa su tre pronta a salire sul treno Pnrr

Articoli correlati