non solo GPU

Acceleratori di intelligenza artificiale: cosa sono, le differenze, quali usare



Indirizzo copiato

Le GPU sono dei processori general purpose in grado di accelerare sia l’apprendimento che l’inferenza di reti neurali, ma non sono gli unici acceleratori disponibili sul mercato: ci sono anche gli acceleratori come le TPU di Google e Trainium di AWS. Quali sono le differenze

Pubblicato il 6 ott 2023

Antonio Cisternino

Università di Pisa



ChatGPT nei robot sociali: nuovi orizzonti di interazione ed empowerment umano

L’esecuzione di modelli di intelligenza artificiale richiede sempre più capacità di calcolo, basti pensare che quando leggiamo che GPT3.5 è un modello con 175 miliardi di parametri stiamo parlando del numero di connessioni della rete neurale e che potrebbero dover essere “attivati” in presenza di un particolare input.

Le reti neurali richiedono infatti la capacità di eseguire operazioni di algebra lineare su grandi moli di dati, ed un’esecuzione sequenziale comporterebbe tempi di esecuzione lunghissimi.

È un fatto noto che le GPU possono accelerare sia l’apprendimento che l’inferenza (ovverosia l’abilità di usare il modello a partire da un particolare input) di reti neurali, ma non sono gli unici acceleratori disponibili sul mercato: Google TPU, AWS Trainium e Inferentia, Intel Gaudì 2 e il nuovissimo Intel Core Ultra offrono alternative alle GPU. Ma quali sono le differenze tra questi acceleratori?

Investire in calcolo

È notizia di questi giorni l’investimento di Amazon Web Services (AWS) in Anthropic al fine di offrire il modello LLM Claude 2 nel proprio cloud. Nel comunicato le due aziende parlano dei benefici che gli acceleratori Trainium e Inferentia di AWS porteranno nell’esecuzione del modello. Si tratta di un accordo analogo a quello fatto tra Microsoft e OpenAI che in parte è stato supportato dall’uso del cloud Azure per l’esecuzione dei modelli di OpenAI per cui Microsoft detiene l’esclusiva per l’esecuzione nel proprio cloud.

Allo stesso tempo l’amministratore delegato di Intel, Pat Gelsinger, ha annunciato dal palco di Intel Innovate 2023 l’avvento dell’”AI PC” basato sul processore Intel Core Ultra in uscita il 14 dicembre e che ha al suo interno ha una NPU, ovverosia una Neural Processing Unit, per consentire l’esecuzione di modelli di intelligenza artificiale locali senza dover necessariamente ricorrere a servizi on-line. Sempre nello stesso evento sono state annunciate le ultime novità degli acceleratori Gaudì per supportare apprendimento ed inferenza nei server.

Quali acceleratori di intelligenza artificiale usare?

Innanzitutto, è bene sottolineare che c’è una grande differenza tra una GPU come quelle di nVidia, AMD o Intel e gli altri acceleratori. Le GPU sono dei processori general purpose orientati all’esecuzione di computazioni SIMD (Single Instruction Multiple Data). Si tratta di processori che assomigliano molto alle CPU nella complessità, ma si caratterizzano per questa capacità di poter eseguire la stessa operazione su molti dati in un singolo ciclo, capacità molto importante nell’implementazione di algoritmi di algebra lineare.

Sono molte le tipologie di computazione che beneficiano delle GPU dovendo processare grandi matrici di dati, e tra queste troviamo sicuramente le Deep Neural Networks (DNN), alla base degli odierni modelli di intelligenza artificiale, ma non sono le uniche possibili per l’accelerazione.

Al contrario gli acceleratori come le TPU di Google e Trainium di AWS sono chip decisamente più semplici disegnati per accelerare il calcolo tensoriale usato per la realizzazione delle DNN. Data la minore complessità di questi chip i costi sono inferiori e sono stati spesso messi in competizione con le GPU per il loro costo ridotto nonostante siano decisamente meno flessibili delle GPU. Analoghe considerazioni possono essere fatte per Intel Gaudì che offre 24 TPC, acceleratori per il calcolo tensoriale.

Immagine che contiene testo, schermata, Carattere, numeroDescrizione generata automaticamente

Non è un caso che Intel confronti le performance nell’apprendimento di alcune reti neurali di riferimento come ResNet50 rispetto a delle GPU (le A100 sono le schede di penultima generazione di nVidia che ha recentemente reso disponibili le H100). Ovviamente la flessibilità delle GPU spesso esibiscono prestazioni differenti in applicazioni reali proprio grazie alla propria flessibilità rispetto agli acceleratori tensoriali.

Immagine che contiene testo, schermata, schermo, softwareDescrizione generata automaticamente

È anche una questione di software

Sia che le GPU che gli acceleratori tensoriali richiedono che le applicazioni siano scritte usandone le proprie istruzioni. L’affermarsi della libreria CUDA di nVidia ha consentito un dominio all’azienda californiana anche grazie ai grandi investimenti fatti a partire dal 2006 per accelerazione di applicazioni di calcolo intensivo. Non è quindi un caso che le GPU di nVidia sono quelle più supportate dai vari framework di AI come ad esempio TensorFlow e PyTorch. Sono stati questi framework, prevalentemente realizzati in Python, a far sì che il linguaggio di programmazione fosse il più utilizzato in questo ambito e non è un caso che i vendor abbiano collaborato con gli sviluppatori di questi framework open source per assicurare che fossero in grado di usare gli acceleratori tensoriali e non solo le GPU. Intel ha addirittura sviluppato un ecosistema open source, One API, disegnato per scrivere programmi di calcolo intensivo capaci di eseguire usando più acceleratori incluse le GPU e gli acceleratori di terze parti.

Nonostante non vi sia ancora un’indagine formale sembra che la commissione Europea stia indagando possibili pratiche sleali da parte del gigante che domina il mercato con oltre l’80% di quota.

Apprendimento vs. inferenza

La flessibilità dei modelli LLM e più in generale di AI generativa, unitamente ai costi sostanziali necessari per poter effettuare un apprendimento partendo dai dati, rendono l’addestramento di una rete neurale complessa un compito che solo in pochi possono svolgere (un apprendimento di ChatGPT 3.5 si stima essere costato oltre 4 milioni di dollari). È inevitabile quindi che l’attenzione si sposterà in parte dai sistemi capaci di accelerare l’apprendimento a sistemi ottimizzati per l’inferenza (ovverosia l’esecuzione del modello appreso). È in questo contesto che va letta la mossa di Intel di integrare nella nuova CPU una Neural Processing Unit, ovverosia un chip specializzato per l’inferenza (analogo a Inferentia di AWS anche se non si hanno molte informazioni sul suo design). C’è da aspettarsi che si tratti di un trend appena iniziato, anche perché la messa in esecuzione di un modello pre-addestrato è molto più facile da industrializzare rendendo molto più semplice l’integrazione dell’AI in sistemi esistenti. Inoltre, l’inferenza richiede molte meno risorse computazionali rispetto a quelle necessarie nella fase di apprendimento, consentendo di utilizzare chip più specializzati e a più basso consumo per questa fase dell’esecuzione del sistema.

Conclusioni

Nonostante il marketing cerchi di convincerci del contrario le GPU e le tensor unit sono acceleratori diversi nel loro funzionamento e anche nel costo. Se qualcuno, ad esempio, si rendesse conto che un’ottimizzazione algoritmica possa accelerare significativamente il processo di apprendimento allora è più probabile che questa sia implementabile per una GPU che per un’unità di calcolo tensoriale. Allo stesso tempo essendo acceleratori specializzati possono offrire ottime prestazioni su casi specifici e non vanno ignorati quando si realizza un cluster di calcolo scientifico orientato all’esecuzione di questi modelli.

Va però detto che i grandi operatori cloud mettono a disposizione acceleratori fornendo solo le librerie di programmazione e scarsi dettagli sulla loro implementazione e funzionamento e possono rappresentare, almeno in parte, una forma di lock-in visto che il codice da eseguire dipende dal dispositivo.

Vedremo cosa accadrà nei prossimi mesi, soprattutto con la diffusione dei primi AI PC capaci di eseguire modelli interamente locali. Un fatto è però certo, questi acceleratori sono qui per rimanere, e svolgeranno un ruolo centrale nell’abbattimento dei costi dell’AI, un aspetto sempre più importante visto che si è reso necessario introdurre licenze specifiche per Microsoft Copilot e Google Duet al fine di superare il modello flat a cui ci ha abituato Internet a partire dalla seconda metà degli anni Novanta.

Speciale PNRR

Tutti
Incentivi
Salute digitale
Formazione
Analisi
Sostenibilità
PA
Sostemibilità
Sicurezza
Digital Economy
CODICE STARTUP
Imprenditoria femminile: come attingere ai fondi per le donne che fanno impresa
DECRETI
PNRR e Fascicolo Sanitario Elettronico: investimenti per oltre 600 milioni
IL DOCUMENTO
Competenze digitali, ecco il nuovo piano operativo nazionale
STRUMENTI
Da Istat e RGS gli indicatori per misurare la sostenibilità nel PNRR
STRATEGIE
PNRR – Piano nazionale di Ripresa e Resilienza: cos’è e novità
FONDI
Pnrr, ok della Ue alla seconda rata da 21 miliardi: focus su 5G e banda ultralarga
GREEN ENERGY
Energia pulita: Banca Sella finanzia i progetti green incentivati dal PNRR
TECNOLOGIA SOLIDALE
Due buone notizie digitali: 500 milioni per gli ITS e l’inizio dell’intranet veloce in scuole e ospedali
INNOVAZIONE
Competenze digitali e InPA cruciali per raggiungere gli obiettivi del Pnrr
STRATEGIE
PA digitale 2026, come gestire i fondi PNRR in 5 fasi: ecco la proposta
ANALISI
Value-based healthcare: le esperienze in Italia e il ruolo del PNRR
Strategie
Accordi per l’innovazione, per le imprese altri 250 milioni
Strategie
PNRR, opportunità e sfide per le smart city
Strategie
Brevetti, il Mise mette sul piatto 8,5 milioni
Strategie
PNRR e opere pubbliche, la grande sfida per i Comuni e perché bisogna pensare digitale
Formazione
Trasferimento tecnologico, il Mise mette sul piatto 7,5 milioni
Strategie
PSN e Strategia Cloud Italia: a che punto siamo e come supportare la PA in questo percorso
Dispersione idrica
Siccità: AI e analisi dei dati possono ridurre gli sprechi d’acqua. Ecco gli interventi necessari
PNRR
Cloud, firmato il contratto per l’avvio di lavori del Polo strategico
Formazione
Competenze digitali, stanziati 48 milioni per gli Istituti tecnologici superiori
Iniziative
Digitalizzazione delle reti idriche: oltre 600 milioni per 21 progetti
Competenze e competitività
PNRR, così i fondi UE possono rilanciare la ricerca e l’Università
Finanziamenti
PNRR, si sbloccano i fondi per l’agrisolare
Sanità post-pandemica
PNRR, Missione Salute: a che punto siamo e cosa resta da fare
Strategie
Sovranità e autonomia tecnologica nazionale: come avviare un processo virtuoso e sostenibile
La relazione
Pnrr e PA digitale, l’alert della Corte dei conti su execution e capacità di spesa
L'editoriale
Elezioni 2022, la sfida digitale ai margini del dibattito politico
Strategie
Digitale, il monito di I-Com: “Senza riforme Pnrr inefficace”
Transizione digitale
Pnrr: arrivano 321 milioni per cloud dei Comuni, spazio e mobilità innovativa
L'analisi I-COM
Il PNRR alla prova delle elezioni: come usare bene le risorse e centrare gli obiettivi digitali
Cineca
Quantum computing, una svolta per la ricerca: lo scenario europeo e i progetti in corso
L'indice europeo
Desi, l’Italia scala due posizioni grazie a fibra e 5G. Ma è (ancora) allarme competenze
L'approfondimento
PNRR 2, ecco tutte le misure per cittadini e imprese: portale sommerso, codice crisi d’impresa e sismabonus, cosa cambia
Servizi digitali
PNRR e trasformazione digitale: ecco gli investimenti e le riforme previste per la digitalizzazione della PA
Legal health
Lo spazio europeo dei dati sanitari: come circoleranno le informazioni sulla salute nell’Unione Europea
Servizi digitali
PNRR e PA digitale: non dimentichiamo la dematerializzazione
Digital Healthcare transformation
La trasformazione digitale degli ospedali
Governance digitale
PA digitale, è la volta buona? Così misure e risorse del PNRR possono fare la differenza
Servizi digitali
Comuni e digitale, come usare il PNRR senza sbagliare
La survey
Pnrr e digitale accoppiata vincente per il 70% delle pmi italiane
Missione salute
Fascicolo Sanitario Elettronico alla prova del PNRR: limiti, rischi e opportunità
Servizi pubblici
PNRR: come diventeranno i siti dei comuni italiani grazie alle nuove risorse
Skill gap
PNRR, la banda ultra larga crea 20.000 nuovi posti di lavoro
Il Piano
Spazio, Colao fa il punto sul Pnrr: i progetti verso la milestone 2023
FORUMPA2022
PNRR e trasformazione digitale: rivedi i Talk di FORUM PA 2022 in collaborazione con le aziende partner
I contratti
Avio, 340 milioni dal Pnrr per i nuovi propulsori a metano
Next Generation EU
PNRR, a che punto siamo e cosa possono aspettarsi le aziende private
Fondi
Operativo il nuovo portale del MISE con tutti i finanziamenti per le imprese
Servizi comunali
Il PNRR occasione unica per i Comuni digitali: strumenti e risorse per enti e cittadini
Healthcare data platform
PNRR dalla teoria alla pratica: tecnologie e soluzioni per l’innovazione in Sanità
Skill
Competenze digitali, partono le Reti di facilitazione
Gli obiettivi
Scuola 4.0, PNRR ultima chance: ecco come cambierà il sistema formativo
Sistema Paese
PNRR 2, è il turno della space economy
FORUM PA 2022
FORUM PA 2022: la maturità digitale dei comuni italiani rispetto al PNRR
Analisi
PNRR: dalla Ricerca all’impresa, una sfida da cogliere insieme
Innovazione
Pnrr, il Dipartimento per la Trasformazione digitale si riorganizza
FORUM PA 2022
PA verde e sostenibile: il ruolo di PNRR, PNIEC, energy management e green public procurement
Analisi
PNRR, Comuni e digitalizzazione: tutto su fondi e opportunità, in meno di 3 minuti. Guarda il video!
Rapporti
Competenze digitali e servizi automatizzati pilastri del piano Inps
Analisi
Attuazione del PNRR: il dialogo necessario tra istituzioni e società civile. Rivedi lo Scenario di FORUM PA 2022
Progetti
Pnrr, fondi per il Politecnico di Torino. Fra i progetti anche IS4Aerospace
Analisi
PNRR, Colao fa il punto sulla transizione digitale dell’Italia: «In linea con tutte le scadenze»
La Svolta
Ict, Istat “riclassifica” i professionisti. Via anche al catalogo dati sul Pnrr
Analisi
Spazio, Colao fa il punto sul Pnrr: i progetti verso la milestone 2023
FORUM PA 2022
Ecosistema territoriale sostenibile: l’Emilia Romagna tra FESR e PNRR
Il Piano
Innovazione, il Mise “centra” gli obiettivi Pnrr: attivati 17,5 miliardi
Analisi
PNRR: raggiunti gli obiettivi per il primo semestre 2022. Il punto e qualche riflessione
Analisi
PNRR: dal dialogo tra PA e società civile passa il corretto monitoraggio dei risultati, tra collaborazione e identità dei luoghi
Webinar
Comuni e PNRR: un focus sui bandi attivi o in pubblicazione
Analisi
Formazione 4.0: cos’è e come funziona il credito d’imposta
PA e Sicurezza
PA e sicurezza informatica: il ruolo dei territori di fronte alle sfide della digitalizzazione
PA e sicurezza
PNRR e servizi pubblici digitali: sfide e opportunità per Comuni e Città metropolitane
Water management
Water management in Italia: verso una transizione “smart” e “circular” 
LE RISORSE
Transizione digitale, Simest apre i fondi Pnrr alle medie imprese
Prospettive
Turismo, cultura e digital: come spendere bene le risorse del PNRR
Analisi
Smart City: quale contributo alla transizione ecologica
Decarbonizzazione
Idrogeno verde, 450 milioni € di investimenti PNRR, Cingolani firma
Unioncamere
PNRR, imprese in ritardo: ecco come le Camere di commercio possono aiutare
I fondi
Industria 4.0: solo un’impresa su tre pronta a salire sul treno Pnrr
CODICE STARTUP
Imprenditoria femminile: come attingere ai fondi per le donne che fanno impresa
DECRETI
PNRR e Fascicolo Sanitario Elettronico: investimenti per oltre 600 milioni
IL DOCUMENTO
Competenze digitali, ecco il nuovo piano operativo nazionale
STRUMENTI
Da Istat e RGS gli indicatori per misurare la sostenibilità nel PNRR
STRATEGIE
PNRR – Piano nazionale di Ripresa e Resilienza: cos’è e novità
FONDI
Pnrr, ok della Ue alla seconda rata da 21 miliardi: focus su 5G e banda ultralarga
GREEN ENERGY
Energia pulita: Banca Sella finanzia i progetti green incentivati dal PNRR
TECNOLOGIA SOLIDALE
Due buone notizie digitali: 500 milioni per gli ITS e l’inizio dell’intranet veloce in scuole e ospedali
INNOVAZIONE
Competenze digitali e InPA cruciali per raggiungere gli obiettivi del Pnrr
STRATEGIE
PA digitale 2026, come gestire i fondi PNRR in 5 fasi: ecco la proposta
ANALISI
Value-based healthcare: le esperienze in Italia e il ruolo del PNRR
Strategie
Accordi per l’innovazione, per le imprese altri 250 milioni
Strategie
PNRR, opportunità e sfide per le smart city
Strategie
Brevetti, il Mise mette sul piatto 8,5 milioni
Strategie
PNRR e opere pubbliche, la grande sfida per i Comuni e perché bisogna pensare digitale
Formazione
Trasferimento tecnologico, il Mise mette sul piatto 7,5 milioni
Strategie
PSN e Strategia Cloud Italia: a che punto siamo e come supportare la PA in questo percorso
Dispersione idrica
Siccità: AI e analisi dei dati possono ridurre gli sprechi d’acqua. Ecco gli interventi necessari
PNRR
Cloud, firmato il contratto per l’avvio di lavori del Polo strategico
Formazione
Competenze digitali, stanziati 48 milioni per gli Istituti tecnologici superiori
Iniziative
Digitalizzazione delle reti idriche: oltre 600 milioni per 21 progetti
Competenze e competitività
PNRR, così i fondi UE possono rilanciare la ricerca e l’Università
Finanziamenti
PNRR, si sbloccano i fondi per l’agrisolare
Sanità post-pandemica
PNRR, Missione Salute: a che punto siamo e cosa resta da fare
Strategie
Sovranità e autonomia tecnologica nazionale: come avviare un processo virtuoso e sostenibile
La relazione
Pnrr e PA digitale, l’alert della Corte dei conti su execution e capacità di spesa
L'editoriale
Elezioni 2022, la sfida digitale ai margini del dibattito politico
Strategie
Digitale, il monito di I-Com: “Senza riforme Pnrr inefficace”
Transizione digitale
Pnrr: arrivano 321 milioni per cloud dei Comuni, spazio e mobilità innovativa
L'analisi I-COM
Il PNRR alla prova delle elezioni: come usare bene le risorse e centrare gli obiettivi digitali
Cineca
Quantum computing, una svolta per la ricerca: lo scenario europeo e i progetti in corso
L'indice europeo
Desi, l’Italia scala due posizioni grazie a fibra e 5G. Ma è (ancora) allarme competenze
L'approfondimento
PNRR 2, ecco tutte le misure per cittadini e imprese: portale sommerso, codice crisi d’impresa e sismabonus, cosa cambia
Servizi digitali
PNRR e trasformazione digitale: ecco gli investimenti e le riforme previste per la digitalizzazione della PA
Legal health
Lo spazio europeo dei dati sanitari: come circoleranno le informazioni sulla salute nell’Unione Europea
Servizi digitali
PNRR e PA digitale: non dimentichiamo la dematerializzazione
Digital Healthcare transformation
La trasformazione digitale degli ospedali
Governance digitale
PA digitale, è la volta buona? Così misure e risorse del PNRR possono fare la differenza
Servizi digitali
Comuni e digitale, come usare il PNRR senza sbagliare
La survey
Pnrr e digitale accoppiata vincente per il 70% delle pmi italiane
Missione salute
Fascicolo Sanitario Elettronico alla prova del PNRR: limiti, rischi e opportunità
Servizi pubblici
PNRR: come diventeranno i siti dei comuni italiani grazie alle nuove risorse
Skill gap
PNRR, la banda ultra larga crea 20.000 nuovi posti di lavoro
Il Piano
Spazio, Colao fa il punto sul Pnrr: i progetti verso la milestone 2023
FORUMPA2022
PNRR e trasformazione digitale: rivedi i Talk di FORUM PA 2022 in collaborazione con le aziende partner
I contratti
Avio, 340 milioni dal Pnrr per i nuovi propulsori a metano
Next Generation EU
PNRR, a che punto siamo e cosa possono aspettarsi le aziende private
Fondi
Operativo il nuovo portale del MISE con tutti i finanziamenti per le imprese
Servizi comunali
Il PNRR occasione unica per i Comuni digitali: strumenti e risorse per enti e cittadini
Healthcare data platform
PNRR dalla teoria alla pratica: tecnologie e soluzioni per l’innovazione in Sanità
Skill
Competenze digitali, partono le Reti di facilitazione
Gli obiettivi
Scuola 4.0, PNRR ultima chance: ecco come cambierà il sistema formativo
Sistema Paese
PNRR 2, è il turno della space economy
FORUM PA 2022
FORUM PA 2022: la maturità digitale dei comuni italiani rispetto al PNRR
Analisi
PNRR: dalla Ricerca all’impresa, una sfida da cogliere insieme
Innovazione
Pnrr, il Dipartimento per la Trasformazione digitale si riorganizza
FORUM PA 2022
PA verde e sostenibile: il ruolo di PNRR, PNIEC, energy management e green public procurement
Analisi
PNRR, Comuni e digitalizzazione: tutto su fondi e opportunità, in meno di 3 minuti. Guarda il video!
Rapporti
Competenze digitali e servizi automatizzati pilastri del piano Inps
Analisi
Attuazione del PNRR: il dialogo necessario tra istituzioni e società civile. Rivedi lo Scenario di FORUM PA 2022
Progetti
Pnrr, fondi per il Politecnico di Torino. Fra i progetti anche IS4Aerospace
Analisi
PNRR, Colao fa il punto sulla transizione digitale dell’Italia: «In linea con tutte le scadenze»
La Svolta
Ict, Istat “riclassifica” i professionisti. Via anche al catalogo dati sul Pnrr
Analisi
Spazio, Colao fa il punto sul Pnrr: i progetti verso la milestone 2023
FORUM PA 2022
Ecosistema territoriale sostenibile: l’Emilia Romagna tra FESR e PNRR
Il Piano
Innovazione, il Mise “centra” gli obiettivi Pnrr: attivati 17,5 miliardi
Analisi
PNRR: raggiunti gli obiettivi per il primo semestre 2022. Il punto e qualche riflessione
Analisi
PNRR: dal dialogo tra PA e società civile passa il corretto monitoraggio dei risultati, tra collaborazione e identità dei luoghi
Webinar
Comuni e PNRR: un focus sui bandi attivi o in pubblicazione
Analisi
Formazione 4.0: cos’è e come funziona il credito d’imposta
PA e Sicurezza
PA e sicurezza informatica: il ruolo dei territori di fronte alle sfide della digitalizzazione
PA e sicurezza
PNRR e servizi pubblici digitali: sfide e opportunità per Comuni e Città metropolitane
Water management
Water management in Italia: verso una transizione “smart” e “circular” 
LE RISORSE
Transizione digitale, Simest apre i fondi Pnrr alle medie imprese
Prospettive
Turismo, cultura e digital: come spendere bene le risorse del PNRR
Analisi
Smart City: quale contributo alla transizione ecologica
Decarbonizzazione
Idrogeno verde, 450 milioni € di investimenti PNRR, Cingolani firma
Unioncamere
PNRR, imprese in ritardo: ecco come le Camere di commercio possono aiutare
I fondi
Industria 4.0: solo un’impresa su tre pronta a salire sul treno Pnrr

Articoli correlati

Articolo 1 di 4