La straordinaria e inarrestabile ascesa dell’Intelligenza Artificiale vede consumarsi “sullo sfondo” continue schermaglie tra le due superpotenze tecnologiche dei presenti Anni Venti: Stati Uniti e Cina.

E ove avessimo pensato che tale tecnologia si sarebbe sviluppata solo al di qua e al di là dell’Atlantico avremmo commesso un terribile errore. Il gigante asiatico sta, infatti, puntando a dominare il mondo dell’intelligenza artificiale globale con modelli funzionali che, in tale realtà, sono già molto popolari e stanno tenendo il passo a – e quasi superando – quelli statunitensi in termini di prestazioni.

IA: le opposte visioni geopolitiche di Usa e Cina

Non possiamo negare che l’Intelligenza Artificiale sia diventata l’ultimo terreno di scontro tra Stati Uniti e Cina, tecnologia che entrambi i paesi considerano strategica per la sopravvivenza delle due opposte visioni geopolitiche. Non è, tra l’altro, un segreto che, nel timore che tale tecnologia possa minacciare la sicurezza nazionale a stelle e strisce, Washington continui a limitare l’accesso di Pechino ai chip di ultima generazione progettati per migliorare le prestazioni dei modelli di Intelligenza Artificiale.

Così facendo, quasi traendone le conclusioni, con un approccio che potremmo definire “autarchico”, la Repubblica Popolare si avvia a perseguire un proprio approccio per aumentare l’attrattiva e le prestazioni dei propri modelli di Intelligenza Artificiale, affidandosi anche alla tecnologia open-source e sviluppando un proprio software e chip superveloci. In maniera del tutto (o quasi) svincolata dal supporto oltre Pacifico.

L’avanzata della Cina sul fronte dei large language model open-source e open-weight

Come alcune delle principali aziende statunitensi del settore, le aziende cinesi del settore dell’Intelligenza Artificiale stanno sviluppando i cosiddetti modelli linguistici di grandi dimensioni, o LLM (Large Language Model), che vengono addestrati su enormi quantità di dati e sono alla base di applicazioni come i chatbot. Tuttavia, a differenza dei modelli della statunitense OpenAI, che alimentano il popolarissimo ChatGPT, molte aziende tech cinesi stanno sviluppando modelli linguistici di grandi dimensioni open-source e open-weight, che gli sviluppatori possono scaricare e utilizzare gratuitamente e senza stringenti requisiti di licenza da parte dell’inventore. A differenza dei modelli open-source che sono “totalmente aperti”, i modelli open-weight sono caratterizzati dall’avere “in chiaro” solo i parametri appresi ovvero quelli che definiscono il comportamento del modello stesso ma mantengono proprietari i dati di addestramento, gli algoritmi e l’architettura del modello stesso[1].

Qwen, l’IA di Alibaba

Su Hugging Face, repository di modelli linguistici di grandi dimensioni dell’omonima società americana che sviluppa strumenti di calcolo per la creazione di applicazioni che utilizzano l’apprendimento automatico, i LLM cinesi sono i più scaricati. Tra questi vi è Qwen, una “popolare famiglia” di modelli di Intelligenza Artificiale creata dal gigante cinese dell’e-commerce Alibaba. Il suo successo è dovuto principalmente alle sue eccezionali prestazioni nei parametri di riferimento della concorrenza. Qwen ha un modello di licenza “altamente favorevole”, il che significa che può essere utilizzato dalle aziende senza la necessità di apportare costosi “adattamenti legali”. Qwen, inoltre, è disponibile in varie dimensioni (o parametri, come vengono chiamati nel mondo dei modelli linguistici di grandi dimensioni). I modelli a parametri grandi sono più potenti ma hanno costi di calcolo più elevati, mentre quelli più piccoli sono più economici da eseguire.[2]

Deepseek, l’IA cinese che compete con OpenAI e Llama

Anche DeepSeek, una start-up cinese, ha fatto di recente scalpore nella “lotta internazionale” in materia di Intelligenza Artificiale. Con il suo ultimo modello chiamato “DeepSeek-R1” l’azienda di Pechino ha dichiarato alcune settimane fa che il suo ultimo modello può competere con l’ultimo modello di casa OpenAI, il trasformatore generativo pre-addestrato “o1”, ossia con un modello progettato per ragionare o risolvere compiti più complessi. Inoltre DeepSeek (e altri competitor cinesi) sostiene che i suoi modelli possono competere in diverse funzioni con altre offerte open-source del mercato come Llama di Meta, ma anche con LLM “chiusi” come quelli di OpenAI. Ma al di là delle dichiarazioni dell’azienda di Pechino, è innegabile considerare che nell’ultimo anno abbiamo assistito all’ascesa di “contributi cinesi” open source all’Intelligenza Artificiale con prestazioni davvero elevate e bassi costi di servizio.

L’open source di una qualsiasi tecnologia ha diversi scopi, tra cui quello di promuovere l’innovazione grazie all’accesso di un maggior numero di sviluppatori e di creare una comunità attorno a un prodotto. E, sia chiaro, non sono solo le aziende cinesi ad aver lanciato LLM open-source sul mercato. Anche Meta e la start-up europea Mistral (con sede in Francia) hanno versioni open-source dei modelli di Intelligenza Artificiale. Ma con l’industria tecnologica nel mirino della battaglia geopolitica tra Washington e Pechino, i modelli linguistici di grandi dimensioni open-source offrono alle aziende cinesi un altro vantaggio: permettere ai loro modelli di essere utilizzati a livello globale. È possibile, infatti, ipotizzare che le aziende cinesi vorrebbero vedere i loro modelli utilizzati al di fuori della Cina, un modo per le aziende del gigante asiatico di diventare attori globali nello spazio dell’Intelligenza Artificiale.

La posta in gioco per la costruzione di un LLM dominante

E mentre in questo momento storico l’attenzione si concentra sui modelli di Intelligenza Artificiale, in parallelo si discute anche su quali applicazioni verranno costruite su di essi e su chi dominerà questo panorama internet globale in futuro. Se si parte dal presupposto che questi modelli di Intelligenza Artificiale “di frontiera” sono ormai una merce di scambio, si tratta di capire a cosa serviranno questi modelli. Possiamo ipotizzare, per esempio, che possano servire ad accelerare la scienza e la tecnologia ingegneristica. Gli attuali modelli di Intelligenza Artificiale sono stati paragonati ai sistemi operativi, come Microsoft Windows, Google, Android e iOS di Apple, con il potenziale di dominare il loro mercato, come queste aziende fanno con gli smartphone, i tablet e i PC. E se ciò fosse vero, la posta in gioco per la costruzione di un LLM dominante è più alta che mai. I futuri modelli di business cinesi si baseranno sull’adesione degli sviluppatori ai loro ecosistemi, sullo sviluppo di nuove applicazioni basate sui modelli linguistici di grandi dimensioni e sull’attrazione di utenti e dati da cui generare successivamente profitti attraverso vari mezzi, tra cui quello di indirizzare tali utenti a utilizzare i servizi cloud di Pechino.

La partita a scacchi dei semiconduttori

I modelli di Intelligenza Artificiale vengono addestrati su grandi quantità di dati e richiedono enormi quantità di potenza di calcolo. Attualmente, Nvidia è il principale progettista dei chip necessari a questo scopo, noti come unità di elaborazione grafica (GPU o Graphics Processing Unit)[3]. La maggior parte delle aziende leader nel settore dell’Intelligenza Artificiale sta addestrando i propri sistemi sui chip più performanti di Nvidia, ma non in Cina. Nell’ultimo anno, gli Stati Uniti hanno aumentato le restrizioni all’esportazione di semiconduttori avanzati e di apparecchiature per la produzione di chip in Cina. Ciò significa che i chip all’avanguardia di Nvidia non possono essere esportati in Cina, costringendo il colosso americano a creare semiconduttori “conformi alle sanzioni” (quindi meno performanti) per poterli esportare a Pechino. Nonostante queste limitazioni, tuttavia, le aziende cinesi sono riuscite comunque a lanciare modelli avanzati di Intelligenza Artificiale. Peraltro, le principali piattaforme tecnologiche cinesi hanno attualmente accesso alla potenza di calcolo sufficiente per continuare a migliorare i loro modelli. Questo perché hanno accumulato un gran numero di GPU Nvidia e stanno sfruttando anche le GPU nazionali di Huawei e di altre aziende.

In effetti, le aziende cinesi hanno intensificato gli sforzi per creare valide alternative a Nvidia. Huawei è stata uno dei principali attori nel perseguire questo obiettivo in Cina, mentre aziende come Baidu e Alibaba hanno investito nella progettazione di semiconduttori. Tuttavia, il divario in termini di calcolo hardware avanzato si accentuerà nel tempo, in particolare l’anno prossimo, quando Nvidia presenterà i suoi sistemi basati su Blackwell, la cui esportazione in Cina è limitata. La Cina ha sistematicamente investito e fatto crescere l’intero insieme di infrastrutture nazionali al di fuori di Nvidia con chip di Intelligenza Artificiale ad alte prestazioni di aziende come Baidu; e il fatto che i chip Nvidia siano vietati o meno in Cina non impedirà al gigante asiatico di investire e costruire la propria infrastruttura per costruire e addestrare modelli di Intelligenza Artificiale “a prova di America”.[4]

