La Cina sta affrontando un paradosso che sa di crisi tecnologica: nonostante il successo nella creazione di modelli di IA all’avanguardia, fatica a gestirli su vasta scala a causa della carenza di chip per l’inferenza.
Le restrizioni statunitensi hanno reso i data center cinesi un collo di bottiglia, causando rallentamenti e limitando la crescita del settore.
In risposta, il Paese sta adottando una strategia multi-livello che include la formazione di alleanze industriali, un’enfasi sull’efficienza dei modelli e la spinta verso un ecosistema open source nazionale. L’escalation geopolitica, con la convocazione di Nvidia da parte delle autorità cinesi per i rischi di sicurezza, dimostra che la battaglia non riguarda solo l’hardware, ma anche la sovranità tecnologica, spingendo la Cina verso una sempre maggiore autonomia.
Indice degli argomenti
I limiti del boom AI della Cina
Questo vincolo sta limitando la capacità dei laboratori di far funzionare i loro sistemi su vasta scala, causando rallentamenti, limiti di utilizzo e interruzioni di connessione. È un paradosso tecnologico che definisce la posizione attuale della Cina nel settore: il Paese è in grado di addestrare giganti dell’IA, ma fa fatica a gestirli in modo efficiente per l’uso quotidiano.
Qualche segnale lo si può vedere in questi giorni, chiaro a chiunque sta usando il nuovo modello AI cinese dai server dei fondatori, Kimi K2. Segnali di lentezza. Il confronto con Chatgpt è impietoso.
I valori economici in gioco
Questa crisi non è solo un problema tecnico legato all’hardware, ma è il risultato di una complessa interazione tra geopolitica, regolamentazione e strategia industriale. Dopo un periodo di stagnazione nel 2023, il settore cinese dell’IA ha iniziato a riprendersi con una rapidità impressionante, sostenuto da una massiccia iniezione di capitale statale, come il nuovo fondo da 60 miliardi di yuan (circa 8,2 miliardi di dollari) lanciato a gennaio 2025. I dati ufficiali della Cyberspace Administration of China (CAC) confermano questa crescita, con il settore principale che ha raggiunto quasi 600 miliardi di yuan (circa 84 miliardi di dollari) nel 2024. Il Paese ha registrato oltre 600 milioni di utenti per servizi di IA generativa, con diverse applicazioni che superano i 30 milioni di utenti attivi giornalieri. Nonostante questo boom di utilizzo, il problema dell’inferenza rimane il “tallone d’Achille”, come dimostrano i casi di Moonshot AI, che ha definito il proprio modello Kimi K2 “LENTISSIMO”, e di DeepSeek, che ha ritardato il lancio del suo ultimo modello per evitare problemi simili.
Il contrasto con gli Stati Uniti è netto e illumina le sfide e le opportunità di entrambi i Paesi. Mentre Washington fatica a trovare un consenso normativo, la Cina sta consolidando una strategia di sviluppo chiara e coordinata. La dedizione all’efficienza, l’uso intelligente dell’open source e la produzione nazionale di chip sono le contromisure che il Dragone sta adottando per superare le barriere, in una corsa tecnologica che non si vince solo con l’innovazione, ma anche con la capacità di adattamento e resilienza.
La fragilità dell’ecosistema cinese dell’IA: dalla paralisi istituzionale alla riconfigurazione strategica
Solo un anno fa, il settore dell’IA in Cina sembrava in profonda difficoltà. Dopo i rigorosi lockdown dovuti alla pandemia e un’intensa repressione dei giganti tecnologici, il 2023 è stato caratterizzato da stagnazione, sviluppo cauto e un diffuso senso di paralisi istituzionale. L’ambiguità normativa e la pressione politica avevano frenato le ambizioni anche delle aziende più promettenti. In netto contrasto, le aziende americane, supportate da un ambiente di innovazione aperta e da un immenso capitale privato, hanno fatto passi da gigante con solidi modelli di base e nuove applicazioni commerciali.
A metà del 2024, il quadro è cambiato radicalmente. Le aziende cinesi si sono riprese non tanto aggirando le normative, ma riconfigurando il loro rapporto con lo Stato e sfruttando gli strumenti istituzionali per ricostruire lo slancio. Sebbene il quadro giuridico sia rimasto in gran parte intatto, l’applicazione delle norme è diventata più sfumata e prevedibile. Questo cambiamento è stato guidato dall’emergere di nuove istituzioni di intermediazione come la Beijing Academy of Artificial Intelligence e la China Academy of Information and Communications Technology (CAICT). Queste entità hanno agito da ponte tra lo Stato e il settore privato, canalizzando il feedback, allineando le aspettative e garantendo una prevedibilità normativa che ha permesso a startup come DeepSeek e Moonshot AI di prosperare. Inoltre, un cambiamento fondamentale è stato il riorientamento del controllo normativo, che si è spostato dalle fasi iniziali di sviluppo, come l’acquisizione dei dati e l’addestramento dei modelli, alla conformità a livello applicativo, consentendo alle aziende di concentrarsi sulla creazione di modelli di uso generale con meno ostacoli.
L’inferenza: il cuore del problema che minaccia la crescita
Mentre la Cina ha dimostrato una notevole abilità nell’addestramento di modelli di intelligenza artificiale, la vera battaglia si combatte sul fronte dell’inferenza. Per comprendere appieno perché le restrizioni sui chip stanno avendo un impatto così devastante sui data center cinesi, è essenziale chiarire la distinzione tra le due fasi cruciali del ciclo di vita di un modello: l’addestramento e l’inferenza.
- L’Addestramento (Training) è il processo computazionalmente intensivo in cui un modello di IA viene “istruito”. Viene alimentato con enormi quantità di dati, come miliardi di parole o immagini, per imparare a riconoscere schemi e relazioni complesse. Questo processo richiede cluster di GPU massicci e costosi, ed è un’operazione che avviene una sola volta, o al massimo, di rado, per creare una nuova versione del modello.
- L’Inferenza (Inference), al contrario, è la fase operativa e di utilizzo del modello. È ciò che accade ogni volta che un utente interagisce con un’IA. Quando si digita una domanda a un chatbot, il modello esegue un’operazione di inferenza per generare una risposta. Questo processo si ripete milioni, se non miliardi, di volte al giorno per ogni servizio AI, rendendolo il vero punto critico per l’infrastruttura di un data center.
Le esigenze hardware per l’inferenza sono drasticamente diverse da quelle per l’addestramento. I chip dedicati all’inferenza devono bilanciare perfettamente potenza di calcolo, efficienza energetica e una bassa latenza per elaborare le richieste il più rapidamente possibile.
Fino ad aprile, il chip H20 di Nvidia era la soluzione preferita in Cina per questo scopo. Ironia della sorte, l’H20 era stato ideato per conformarsi a una precedente serie di normative che ne limitavano la potenza per l’addestramento, finendo per risultare perfetto per i carichi di lavoro di inferenza. La perdita di accesso a questo chip ha quindi creato un vuoto difficile da colmare e ha chiaramente dimostrato l’efficacia dei controlli americani nel breve termine.
Trump ha revocato il divieto sulle esportazioni di H20, sostenendo che sarebbe meglio per l’IA cinese affidarsi alle aziende americane per tutte le proprie esigenze tecnologiche, compresa l’inferenza, piuttosto che sviluppare una capacità interna equivalente.
A breve termine, però, cambierà poco. Le limitazioni di fornitura di Nvidia stessa le impediranno di soddisfare la domanda di chip del Paese almeno fino all’ultimo trimestre dell’anno.
E poi Trump è sempre con il piede sul freno verso la Cina. Il suo piano d’azione sull’IA, pubblicato all’inizio di luglio, ha raddoppiato alcuni controlli sui chip, sottolineando che negare agli avversari l’accesso al “calcolo avanzato dell’IA” è una questione sia di competizione geostrategica che di sicurezza nazionale, e chiedendo approcci innovativi per far rispettare i controlli sulle esportazioni.
Strategie di sopravvivenza: la risposta integrata cinese, dall’hardware al software
Di fronte a questa sfida, l’industria cinese ha adottato diverse strategie, in parte illustrate dalle dinamiche recenti del settore, annunciate in concomitanza con la World Artificial Intelligence Conference (WAIC) di Shanghai.
- Verso un ecosistema integrato. Le nuove alleanze e la produzione nazionale. Per accelerare la standardizzazione e ridurre la frammentazione, sono state lanciate due nuove alleanze strategiche. La Model-Chip Ecosystem Innovation Alliance, in particolare, riunisce sviluppatori di modelli linguistici di grandi dimensioni (LLM) come StepFun con produttori di chip AI come Biren, Huawei, Enflame e Moore Threads. Il loro obiettivo dichiarato è quello di collegare hardware, framework e LLM sotto interfacce comuni, in modo che i modelli possano essere eseguiti sugli acceleratori cinesi con un attrito minimo, riducendo la dipendenza dal silicio statunitense. Come ha affermato Zhao Lidong, CEO di Enflame, “Si tratta di un ecosistema innovativo che collega l’intera catena tecnologica, dai chip ai modelli fino alle infrastrutture”. Un’altra iniziativa, il Comitato AI della Camera di Commercio Generale di Shanghai, si concentra sull’impiego dell’IA nella produzione e nei servizi, fungendo da ponte tra gli sviluppatori di modelli e gli utenti industriali.
A testimonianza di questi sforzi, i progressi sull’hardware nazionale continuano. Durante il WAIC, Huawei ha presentato CloudMatrix 384, un armadio server che raggruppa 384 chip Ascend 910C. Secondo il rapporto di SemiAnalysis, questo sistema supera il cluster GB200 NVL72 di Nvidia su alcune metriche selezionate, compensando le prestazioni per chip più deboli grazie a un design di sistema denso. Allo stesso modo, Metax ha presentato un “supernodo” C550 a 128 chip progettato per le implementazioni di data center con raffreddamento a liquido.
Questo approccio ha già dato i suoi frutti: il nuovo modello di ragionamento multimodale Step 3, presentato da Jieyuexingchen, ha dimostrato un’efficienza di inferenza sui chip nazionali superiore del 300% rispetto a DeepSeek-R1. Ciò è stato possibile grazie a una nuova architettura, la Multi-Matrix Factorization Attention (MFA), che riduce del 93,7% l’uso della cache, rendendo il modello intrinsecamente più compatibile con l’hardware cinese. L’obiettivo è superare il divario tecnico e di ecosistema, con i fondatori dell’alleanza che sperano di “ottenere alcuni progetti per la prossima generazione di chip relativamente prima del loro lancio sul mercato”. - Efficienza come nuova frontiera e il ruolo dell’open source. La mancanza di hardware potente ha spinto la Cina a innovare sul piano software. L’impatto delle restrizioni non ha colpito tutte le aziende in egual misura. Mentre DeepSeek e Moonshot AI hanno dovuto affrontare rallentamenti e ritardi, giganti consolidati come Alibaba stanno focalizzando i loro sforzi su modelli intrinsecamente più efficienti, sfruttando la loro vasta infrastruttura cloud. L’ultimo modello della sua famiglia Qwen 3, di dimensioni inferiori rispetto a Kimi K2, ne è un esempio lampante. Questa tendenza è evidente anche nei nuovi prodotti presentati al WAIC, come gli Quark AI Glasses di Alibaba, con supporto del codice QR Alipay tramite il modello Qwen. La Cina sta anche raddoppiando gli sforzi nello sviluppo open source: ModelScope è diventato il più grande archivio di modelli di intelligenza artificiale in Cina, ospitando oltre 70.000 modelli e servendo 16 milioni di sviluppatori in tutto il mondo.
- Contrabbando e produzione nazionale. Le aziende cinesi hanno trovato diversi modi per aggirare le restrizioni americane. È stato documentato che chip vietati per un valore di 1 miliardo di dollari sono entrati nel Paese da aprile, alimentando un mercato grigio che, seppur rischioso, permette di mantenere in funzione i data center più critici. Allo stesso tempo, la produzione nazionale di chip da parte di aziende come Huawei, con i suoi chip Ascend, sta lentamente colmando il divario. Sebbene la produzione sia ancora limitata in volumi, per certi aspetti si avvicina all’offerta di fascia alta di Nvidia. La Cina è impegnata a risolvere le “difficoltà sia dalla dimensione morbida che da quella dura” nella produzione di chip, come dimostra il cluster di chip “Feixing-2” di iFlytek e Huawei e il super-nodo presentato da Huawei a Shanghai. Oltre a ciò, la conferenza ha visto anche diversi debutti di software per i consumatori, come il Hunyuan3D World Model 1.0 di Tencent e un toolkit di Baidu che clona la voce e i gesti di un presentatore.
- Il ruolo di Shanghai nella collaborazione soft-hardware. Shanghai sta emergendo come il fulcro di questa nuova strategia. Le aziende di Shanghai rappresentano metà dell’alleanza Modello-Core, riflettendo la costante enfasi della città sull’integrazione di software e hardware. Con la presenza di importanti fabbriche di wafer come SMIC e un ecosistema di packaging avanzato nel delta del fiume Yangtze, Shanghai offre un ambiente ideale per le aziende produttrici di GPU. Questo si unisce a un fiorente ecosistema applicativo, supportato da iniziative come Shanghai Modulo Space, il più grande incubatore di IA al mondo.
I rischi del modello cinese: capitale statale e inefficienza
Nonostante la resilienza dimostrata, il modello di sviluppo cinese non è privo di rischi. Sebbene il governo stia iniettando massicciamente capitale nel settore, come dimostra il fondo da 60 miliardi di yuan lanciato a gennaio 2025, gli investitori esperti avvertono privatamente che un eccessivo capitale statale potrebbe introdurre inefficienze e rallentare l’innovazione a lungo termine. La storia suggerisce che i momenti di successo in Cina spesso precedono la ricentralizzazione e un controllo più stringente, che potrebbe soffocare la creatività.
Il rallentamento economico generale del Paese solleva inoltre seri interrogativi sulla sostenibilità futura di questo sistema di scienza e tecnologia guidato dallo Stato. Il successo di aziende come DeepSeek è visto non solo come una conquista tecnologica, ma anche come un simbolo di resilienza nazionale, ma i rischi legati alla censura, al controllo dei dati e alla moderazione dei contenuti non sono mai lontani dalla superficie. Il prossimo capitolo di questa corsa non sarà determinato solo dall’accuratezza del modello o dal successo commerciale, ma dipenderà dalla fiducia, dalla legittimità e dalla capacità di gestire la complessità oltre confine.
Conclusioni: la geopolitica, i rischi e il futuro dell’IA cinese
In questo scenario, la politica si è trasformata in un vero e proprio campo di battaglia. L’amministrazione Trump ha inviato segnali contrastanti. Il suo piano d’azione per l’IA ha intensificato i controlli su alcuni chip, ma ha poi revocato il divieto sulle esportazioni di chip H20 di Nvidia, sostenendo che sarebbe meglio per l’IA cinese affidarsi alle aziende americane piuttosto che sviluppare una capacità nazionale equivalente. Questo approccio rivela una profonda divisione strategica a Washington.
Tuttavia, il 31 luglio 2025, questa complessa dinamica geopolitica ha trovato una dimostrazione concreta e immediata quando la Cyberspace Administration of China (CAC) ha convocato ufficialmente Nvidia. L’autorità di regolamentazione cinese ha chiesto spiegazioni e prove riguardanti i rischi di sicurezza dei chip H20. La mossa della CAC è arrivata in risposta a crescenti timori, alimentati da recenti proposte di legislatori statunitensi come il senatore Tom Cotton e il deputato Bill Foster. Cotton ha proposto un disegno di legge che richiederebbe “meccanismi di verifica della posizione” per i chip soggetti a restrizioni, mentre Foster ha confermato che la tecnologia per tracciare e persino “spegnere da remoto” i chip dopo la vendita è matura ed è già integrata in molti prodotti Nvidia. Questa escalation dimostra che, per la Cina, l’accesso a un chip non è sufficiente se questo implica la potenziale perdita di sovranità sui dati e sulla sicurezza nazionale.
In questo contesto, l’America si trova di fronte a un compromesso strategico cruciale: può limitare l’industria cinese del software per l’intelligenza artificiale oggi a discapito del rafforzamento della sua industria hardware nel lungo termine, o viceversa. L’idea che i controlli attuali abbiano prodotto conseguenze negative e indesiderate sta guadagnando terreno. Esperti come Michael Frank, membro del think tank 2430, sostengono che le sanzioni hanno accelerato l’innovazione e lo sviluppo di un ecosistema alternativo in Cina in un modo che persino il governo non sarebbe riuscito a gestire da solo. Il divieto ha rafforzato l’incentivo commerciale dei produttori di chip cinesi a recuperare terreno. Questo porta a una tesi sostenuta anche da David Sacks, consigliere di Trump per l’IA, secondo cui consentire l’esportazione di chip renderebbe la Cina dipendente dall’ecosistema tecnologico americano, scoraggiando la creazione di alternative.
Nel breve termine, un simile allentamento sarà una magra consolazione per la Cina, poiché i vincoli di fornitura di Nvidia impediranno all’azienda di soddisfare la domanda del Paese almeno fino all’ultimo trimestre dell’anno. Di conseguenza, la Cina continuerà a dare priorità allo sviluppo di modelli più efficienti e alla costruzione di un’infrastruttura di calcolo nazionale. Se le esportazioni americane riprenderanno a pieno ritmo, il settore dell’IA cinese potrebbe finalmente iniziare il 2026 con molta meno costrizione. Nel frattempo, la dedizione all’efficienza e l’uso intelligente dell’open source rimarranno i pilastri della sua crescita in un contesto di restrizioni persistenti.














