Il calcolo costituisce uno dei tre elementi della triade dell’Intelligenza Artificiale, insieme ad algoritmi e dati. Le grandi infrastrutture di calcolo, i supercomputer, sono diventate di fatto asset strategici per ciascun paese. Governare il supercalcolo per l’IA di frontiera può significare gestire la governance dell’IA.
La strategia europea per il supercalcolo: l’impresa comune EURO HPC JU
È tanto vero che tutto l’occidente è alle prese con il consolidamento o l’avanzamento della propria posizione di competitività nel contesto globale della potenza di calcolo. L’Europa, attraverso l’impresa comune EURO HPC JU (European High Performance Computing Joint Undertaking), ha individuato le prime 7 factory per l’intelligenza artificiale che saranno lanciate nel 2025. Il budget complessivo a favore di queste piattaforme è pari a 2,1 miliardi di euro. Sono coinvolti 15 Stati membri, tra cui l’Italia con il progetto IT4LIAAI factory, e due paesi partecipanti all’EURO HPC. L’obiettivo è quello di creare un “continente AI”, attraverso lo sviluppo del super calcolo funzionale ai sistemi di IA d’avanguardia, la produzione di microprocessori e la valorizzazione dei talenti. Questo risultato aggiorna la geografia dei supercomputer abilitati all’IA, guidata fino a oggi, in termini di exaflop, da El Capitan, Frontier e Aurora, tutti e tre costruiti da Hewlett Packard Enterprise (HPE), ed alloggiati negli Stati Uniti.
Infrastrutture di supercalcolo e competitività
Fatto salvo l’incipit, la sintesi rappresentata in questo articolo prova a dimostrare se e come la presenza di infrastrutture di supercalcolo si può tradurre in un vantaggio competitivo per il Paese ospitante.
Gli elementi a favore di una tesi positiva si possono riassumere nella capacità delle istituzioni e/o organizzazioni di incidere nei tempi e con i risultati, design-training-miglioramento-sviluppo di sistemi di IA avanzati, in materia di regolamentazione, allocazione delle risorse, e scelta dei guard-rail da adottare.
La conformità di calcolo di un supercomputer a una normativa è molto più semplice di quella di un chip per inferenza posizionato su un dispositivo mobile. Difatti l’accesso alla stessa infrastruttura o l’uso di dati pubblici per l’addestramento degli algoritmi, unitamente alla tracciabilità dei sistemi di IA, rientrano nelle facoltà del soggetto gestore che di fatto risponde a obblighi di legge.
Le aziende che possiedono la potenza di calcolo
Inoltre oggi la potenza del calcolo è posseduta da tre grandi organizzazioni private, principalmente Amazon (tramite Amazon Web Services), Microsoft (tramite Azure) e Google (tramite Google Cloud Platform). Il modello di business da loro adottato verso altri operatori come Hugging Face sono partnership di collaborazione.
Gli hyperscalers determinano quali set di servizi o di prodotti basati sull’IA arrivano alla fase di sviluppo. Non è utopico prevedere una compravendita calmierata dei diritti di accesso per startup, mondo accademico o altri operatori, un po’ sulla falsariga dei crediti di carbonio, oppure pensare a politiche di cooperazione multistato, Nord-Sud del Mondo, per consentire l’uso delle infrastrutture e lo scambio dei talenti tra più paesi.
Una catena del valore molto segmentata
Nel contenitore dell’antitesi va censita la difficoltà di gestire lo stock o comunque prevedere i flussi dei chip necessari per l’addestramento di grandi modelli di IA, soprattutto quelli di frontiera. Questa catena del valore è molto segmentata, dalla localizzazione delle materie prime, passando per il design e la produzione dei macchinari per la manifattura, alla produzione, il potere di approvvigionamento e utilizzo è concentrato su poche aziende, come NDIVIA per le GPU specializzate (unità di elaborazione grafica).
Difatti sia gli Stati Uniti che l’Europa si sono affrettati a pianificare risorse finanziarie, misure di sicurezza per l’approvvigionamento, un sistema di monitoraggio dell’uso e un meccanismo di risposta per anticipare l’adozione di misure emergenziali in caso di crisi.
Oltre al problema della anelasticità della fornitura dei chips, va introdotto il tema della scalabilità socio-economica dei modelli di IA e delle relative prestazioni, direttamente proporzionata se si è in presenza di grandi infrastrutture hardware – cluster di chip, rete ad alta banda, sistemi di raffreddamento – e ampie risorse di dati, asimmetrica rispetto invece alla distribuzione/diffusione dei modelli o di gestione a valle delle operazioni, per esempio nelle interazioni con chatbot o altri agenti.
Conclusioni
Gli investimenti nella capacità di supercalcolo per l’IA di una nazione, l’allocazione dei cluster o la gestione dei flussi dei dati, insieme alla destinazione d’uso dei supercomputer verso lo sviluppo dei modelli di frontiera dell’IA per usi socialmente condivisi, possono condurre o aiutare gli Stati a realizzare uno sviluppo tecnologico differenziale.
Simultaneamente la federazione di tutte le infrastrutture pubbliche in un’unica piattaforma, complementare, fino alla sua realizzazione, al CERN per l’IA, potrebbe impegnare reciprocamente i governi nella scelta della tipologia di applicazioni da realizzare e nelle relative tempistiche di avanzamento, trasformando ciascun modello di frontiera “benevolo” in bene pubblico.