l’analisi

Ecco la lezione cinese Deepseek al mondo: che succede ora



Indirizzo copiato

DeepSeek sfida il dominio Usa nell’IA, con un approccio basato su capacità umane e modelli a basso costo che mina il valore di infrastrutture e processori esistenti. Il mercato diventa così più competitivo e le leadership che sembravano consolidate tremano

Pubblicato il 4 feb 2025

Mario Dal Co

Economista e manager, già direttore dell’Agenzia per l’innovazione



DeepSeek

Fino ad oggi l’America credeva fermamente e investiva generosamente nell’intelligenza artificiale. Pensando che AI fosse la frontiera della tecnologia capace di irradiarsi nei più diversi campi applicativi, credeva che gli investimenti avrebbero reso elevati profitti.

Crede tuttora, in modo assolutamente bipartisan a livello politico, che AI sia il bastione dove la fortezza America difenderà la propria supremazia tecnologica, tenendo così a bada le aspirazioni della Cina in campo economico, tecnologico e della sicurezza. Come Sam Altman ha spiegato fin dall’inizio, AI è questione di “processori, dati, soldi”[1].

Se l’America ha tutte e tre queste risorse, e le ha, allora il gioco è fatto.

Gli annunci che hanno scombussolato le certezze Usa sull’AI

Vediamo ora in estrema sintesi come gli annunci recenti hanno messo a soqquadro queste certezze, ridefinendo sia le aspettative degli investitori relativamente al futuro di AI, sia l’agenda politica:

  • 9 ottobre 2024, Demis Hassabis, John Jumper e David Baker ottengono il premio Nobel per la chimica con il sistema di intelligenza artificiale AlphaFold basato su Deep Mind di Google, che prevede la struttura tridimensionale delle proteine a partire dalla sequenza degli amminoacidi[2];
  • alla fine di ottobre Apple introduce Apple Intelligent per editare i test con la prospettiva di sviluppi in altri campi;
  • dicembre 2024, DeepSeek rilascia Deep Seek -V3, un modello open source capace di integrare testi e immagini, dimostrando la propria superiorità nei confronti di diversi modelli;
  • sempre in dicembre OpenAI lancia il modello Sora testo-video;
  • 20 gennaio 2025, DeepSeek-R1, il modello capace di “ragionare” raggiunge livelli comparabili a quelli di ChatGPT;
  • 21 gennaio, il presidente Donald Trump, appena preso servizio all’ufficio ovale, annuncia in conferenza stampa convocata con Sam Altman, Larry Ellison, Masayoshi Son, che le loro aziende, rispettivamente OpenAI, Oracle e Soft Bank, investiranno 500 miliardi di dollari nelle infrastrutture AI;
  • 22 gennaio, Elon Musk dichiara che “quelli oggi non hanno i soldi, SoftBank ha disponibili meno di 10 miliardi. Le mie fonti sono autorevoli”[3].

I punti chiave della rivoluzione Deepseek

In particolare ecco la lezione che si è appresa in queste ore:

Modelli di ragionamento più accessibili ed economici


DeepSeek ha dimostrato che è possibile costruire modelli di linguaggio capaci di ragionamento (come R1) a costi molto inferiori rispetto alle soluzioni tradizionali. Il fatto che R1 sia stato rilasciato gratuitamente e abbia ottenuto prestazioni paragonabili a quelle dei modelli top statunitensi segna un punto di svolta nella competitività globale.

Innovazioni nel processo di training

  • Automazione del reinforcement learning: DeepSeek ha sostituito il tradizionale fine-tuning supervisionato e il reinforcement learning con feedback umano (RLHF) con un processo di reinforcement learning completamente automatizzato. Questo approccio riduce drasticamente il bisogno di lavoro umano, soprattutto per compiti come la matematica e la programmazione.
  • Nuovo algoritmo GRPO: L’introduzione di tecniche come il Group Relative Policy Optimization ha permesso di ottimizzare il processo di assegnazione dei punteggi alle possibili risposte, riducendo ulteriormente i costi di training.
  • Multi-token prediction: La capacità del modello di prevedere intere sequenze di parole anziché una sola parola alla volta ha migliorato l’efficienza e la precisione, simulando in qualche modo il modo in cui gli esseri umani completano le frasi.

Efficienza energetica e costi operativi

Anche se il training di DeepSeek è stato progettato per essere energeticamente efficiente, il metodo di “chain-of-thought” usato per l’inference – che scompone problemi complessi in passaggi logici – comporta un consumo maggiore di energia. Questo solleva un dibattito importante: vale la pena aumentare il dispendio energetico per ottenere risposte più articolate e accurate? La risposta dipende dal contesto d’uso (ad esempio, la ricerca scientifica versus applicazioni di minore impatto).

Implicazioni sul mercato globale e sulla trasparenza

  • Concorrenza internazionale: Il successo di DeepSeek ha scosso l’industria tecnologica statunitense, mettendo in luce la necessità per gli USA di rivedere la propria strategia competitiva nel campo dell’AI, anche dal punto di vista della gestione e distribuzione dei chip avanzati.
  • Open source e trasparenza: Rilasciando in maniera aperta i dettagli tecnici e il codice, DeepSeek ha alimentato il dibattito sulla trasparenza nella ricerca AI. Da un lato, l’open source può accelerare l’innovazione e favorire la collaborazione globale; dall’altro, solleva preoccupazioni in merito alla sicurezza e all’eventuale cattivo uso di tecnologie avanzate.

Riduzione della dipendenza dal lavoro umano

Automatizzando gran parte del processo di reinforcement learning, DeepSeek ha mostrato che è possibile ridurre la necessità di feedback umano per compiti specifici. Ciò non solo abbassa i costi, ma apre la strada a sviluppi più rapidi e scalabili, benché rimanga ancora il bisogno di input umano per settori meno strutturati e più creativi.

Implicazioni per il futuro dell’AI

Il caso DeepSeek suggerisce che, con una base di modelli pre-addestrati sufficientemente robusti, è possibile “estrarre” capacità di ragionamento senza processi di training estensivi e costosi.

Questo potrebbe portare a una proliferazione di modelli gratuiti e altamente performanti, modificando l’equilibrio competitivo e l’ecosistema dell’AI a livello globale.

Le accuse degli Usa a DeepSeek

Nel pentolone AI ribollono ricette e ingredienti diversi. DeepSeek, su cui l’animosità americana si sta addensando, viene accusata di copiare ChatGPT che sarebbe utilizzato come “insegnante” dal modello “studente” DeepSeek, risparmiando molta attività di training, molta energia, molta capacità di calcolo. I cinesi “distillano” dal modello più ampio quello che serve ad addestrare il modello più limitato.

Ritorna la tradizionale accusa rivolta alla Cina, di copiare e di aggirare le sanzioni[4]. Capacità su cui la Cina dimostra di avere un eccellente controllo, anche perché la pratica di istruire modelli più semplici per allenare modelli ridotti, è comune a tutti coloro che sviluppano AI[5].

Anche sulla validità dei benchmark, vengono sollevate obiezioni, che secondo alcuni osservatori si concentrano non sui risultati tecnici, ma sugli interventi censori relativi alle posizioni politiche sulle quali il Partito e il governo non vogliono che si entri nel merito (Tien An Men, taiwan, Covid etc) [6].

Secondo altri, invece, la differenza nella qualità dei risultati tra ChatGPT e DeepSeek è, in realtà, molto maggiore di quanto verrebbe dichiarato dalla stessa DeepSeek[7]. La tradizionale obiezione, del tutto lecita e valida, che le risposte di DeepSeek siano evasive su fatti che hanno risvolti anche lontanamente politici, sembra il tentativo di sancire che la distanza tra Stati Uniti e Cina non si sarebbe ridotta quanto i primi annunci hanno fatto credere. Si tratta, con ogni probabilità, di una posizione consolatoria.

Infine, sia Meta sia Microsoft sostengono la qualità dei propri investimenti in AI “Investire in importanti infrastrutture darà un vantaggio nel tempo” ha detto Marc Zuckerberg che ha postato 75 miliardi di dollari di investimenti di Meta per il 2025 in AI. Analoga posizione ha tenuto Satia Nadella che ha postato 80 miliardi. Certo la differenza con i costi dichiarati da Deep Seek (6 milioni di dollari) suona come un forte segnale di allarme per gli investitori[8].

Gli effetti dei dazi Usa sul business di Nvidia

Riconosciuto tutto ciò, rimane il fatto indiscutibile che gli annunci cinesi hanno portato il download di DeepSeek al primo posto in App Store, e che essi, uniti al controcanto di Musk, hanno fatto perdere alla borsa circa il doppio della cifra annunciata da Trump con Stargate, mettendo in difficoltà non solo il presidente e il suo progetto, ma la stessa Nvidia e l’intero settore che investe in AI. Nvidia rappresenta il vero scrigno di AI, poiché è l’azienda che fino ad oggi ha lucrato margini di guadagno colossali sui processori grafici ad alte prestazioni divenuti indispensabili per l’allenamento e l’inferenza dei modelli AI. Nvidia, che già considerava le sanzioni verso la Cina un danno alla sua posizione di mercato, dovrà subire altre restrizioni al commercio anche indiretto con la Cina.

Soldi, processori, ingegneri: la filosofia alla base di DeepSeek

Per molti aspetti, il modello di sviluppo di DeepSeek è completamente diverso da quello di OpenAi e degli altri dipartimenti di AI cresciuti all’interno di Big Tech. Liang Wefeng, fondatore dell’azienda, ha studiato ad Hanzhou, capitale dello Zhejiang. Hanzhou è la patria di Alibaba, fulcro dello sviluppo dei servizi online cinesi. Per capire l’attitudine di questo imprenditore, è bene ricordare che il paper tecnico di presentazione di Deep Seek-R1 porta la firma di 200 ricercatori, con 18 autori chiave.

Collaborazione e lavoro in team

Ciò significa una attenzione alla collaborazione e una notevole capacità di lavoro di team. “I nostri ruoli tecnici principali sono occupati per lo più da neolaureati o da coloro che hanno uno o due anni di esperienza lavorativa”, perché l’azienda privilegia le capacità sull’esperienza.

“Quando ChatGPT è stata proposta al pubblico, l’intera industria cinese mancava della confidenza sufficiente a perseguire innovazioni di frontiera” ha detto Liang Wefeng, aggiungendo: “L’innovazione prende corpo con la confidenza – e noi spesso la incontriamo più di frequente tra i giovani”[9].

Tra questi, uno dei nomi emergenti è Luo Fuli, che non è un ingenere ma una linguista computazionale che si è affermata nel team di Deep Seek-V2, il modello di linguaggio allagato “economico”. Ora è stata assunta dal laboratorio di intelligenza artificiale di Xiaomi[10]. L’intelligenza artificiale cinese si estende ai prodotti di consumo.

Originalità e innovazione

La riduzione della distanza tra Stati Uniti e Cina, nella visione di Liang Wefeng, è a portata di mano: “AI in Cina non può stare sempre all’inseguimento. Diciamo che la distanza è di uno o due anni con gli Stati Uniti, ma la vera distanza è tra originalità e innovazione (..) negli ultimi trent’anni l’industria tecnologica cinese ha solo puntato a fare soldi, ignorando l’innovazione. Ma l’innovazione non è solo guidata dal business, ha bisogno di curiosità e della voglia di creare”[11]. Sembra di sentire i fondatori della aziende Big Tech all’inizio della loro straordinaria carriera. Lo spirito è lo stesso: spirito di umiltà e voglia di conquista.

Le innovazioni di DeepSeek e gli effetti sulle Big Tech

Se prendiamo la filosofia di Sam Altman: chips, dati e soldi, troviamo che la filosofia di DeepSeek è completamente diversa: la risorsa chiave sono le capacità umane, mentre la tecnologia, le risorse finanziarie, i dati, divengono variabili dipendenti, che possono essere aggredite in modo efficace da soluzioni innovative. In questo modo si riducono le esigenze di calcolo (ed aggirando così gli embarghi), i consumi di energia e l’uso della potenza di elaborazione, (riducendo i costi), ottimizzando la struttura del modello in modo da consentire una risposta più elaborata, frutto di una interazione più “intelligente” tra le diverse parti del modello, soprattutto nella fase inferenziale.

Alcuni osservatori immaginano che alla lunga queste innovazioni introdotte da DeepSeek finiranno per giovare anche a Big Tech, poiché renderanno meno costosa e meno dipendente da NVIDIA tutta la catena del valore, con prospettiva di vendere i servizi di AI ad un pubblico più vasto perché i costi si sono ridotti.

Gli effetti sulle quotazioni

Ma buona parte degli asset che rappresentano gli investimenti fatti fino ad ora in AI dovranno essere svalutati, i prezzi dei processori più avanzati dovranno ridursi, dal momento che non sono più indispensabili, e questo avrà riflessi importanti sulle quotazioni. Tra le più colpite ci sarà NVIDIA, i cui chip di punta si rivelano non strettamente necessari e quindi subirà maggiormente la concorrenza degli altri fornitori. Ma anche Google potrebbe incontrare non pochi problemi: modelli a basso costo potrebbero rendere il ricorso al motore di ricerca molto meno esteso di quanto oggi sia: buona parte della ricerca sarebbe risultato dell’intervista al modello AI.

La sfida lanciata dalla Cina verrà raccolta anche da altri: l’India, in particolare, penserà che l’altra sponda, quella dell’intelligenza artificiale, sia più raggiungibile con i mezzi a disposizione, se il fiume di denaro da superare non è più così ampio, come si credeva[12].

L’esplosione delle AI: verso un mercato più competitivo

L’intelligenza artificiale è esplosa in diverse direzioni: modelli diversificati per livello e per specializzazione verticale, modelli open source che di per sé proliferano soluzioni innovative seriali, costi che si abbassano, valori di borsa che si adeguano, nuovi protagonisti che appaiono.

Ci saranno molte e diverse intelligenza artificiali, in competizione e in sinergia tra loro. Il mercato diventerà molto più competitivo nel procedere di questo anno sorprendente.

La forza bruta, che Trump voleva sfoggiare con Stargate si è subito sgonfiata e sappiamo che il presidente la aveva deliberatamente gonfiata proprio per esibire una enorme forza.

Gli equilibri internazionali ne risulteranno alterati, quelli interni agli Stati Uniti, ed in particolare all’amministrazione Trump, sono già compromessi dallo scontro tra Musk e Altman e tra il primo e il Presidente.

Note


[1]) Parmy Olson, DeepSeek’s ‘Open AI’ Should Terrify Sam Altman, Bloomberg, January 30, 2025.

[2]) Ewen Callaway, Chemistry Nobel goes to developers of AlphaFold AI that predicts protein structures, Nature, October 9th, 2024.

[3]) Steve Holland, Trevor Hunnicutt, Nandita Bose, Stephen Coates (ed.), Trump waves off criticism from Elon Musk on AI announcement, Reuters, January 24, 2025.

[4]) Joshua Robinson, DeepSeek Probed by US Over Possible Nvidia Chip Purchases, Bloomberg, January 31, 2025.

[5])Ben Thompson, DeepSeek FAQ, January 27, 2025.

[6])Tobias Mann, China’s DeepSeek just dropped a free challenger to OpenAI’s o1 – here’s how to use it on your PC, The Register, January 26, 2025.

[7]) Reuters, DeepSeek’s chatbot achieves 17% accuracy, trails Western rivals in NewsGuard audit, January 29, 2025.

[8]) Aditya Soni, Deborah Mary Sophia, Microsoft, Meta back big AI spending despite DeepSeek’s low costs, Reuters, January 30, 2025.

[9]) Paul Mozur, Who Is the Founder of the A.I. Start-Up DeepSeek? The New York Times, January 29, 2025.

[10]) Criptopolitan, Incontra Luo Fuli: l’esperta di intelligenza artificiale dietro il modello open source di DeepSeek e la tecnologia MLA, Binance Square, January 29, 2025, https://www.binance.com/it/square/post/19594232679266

[11]) Eduardo Baptista, Who is Liang Wenfeng, the founder of DeepSeek? Reuters, January 28, 2025.

[12]) Anhui Bhatia, Liang Wenfeng: The force behind Chinese AI startup DeepSeek that has made US tech giants nervous and put India on edge, The Indian Express, January 30, 2025.

EU Stories - La coesione innova l'Italia

Tutti
Iniziative
Analisi
Social
Video
Agevolazioni
A febbraio l’apertura dello sportello Mini Contratti di Sviluppo
Quadri regolamentari
Nuovi Orientamenti sull’uso delle opzioni semplificate di costo
Coesione
Nuovo Bauhaus Europeo (NEB): i premi che celebrano innovazione e creatività
Dossier
Pubblicato il long form PO FESR 14-20 della Regione Sicilia
Iniziative
400 milioni per sostenere lo sviluppo delle tecnologie critiche nel Mezzogiorno
Formazione
“Gian Maria Volonté”: dalle aule al mondo del lavoro, focus sui tirocini della Scuola d’Arte Cinematografica
TRANSIZIONE ENERGETICA
Il ruolo del finanziamento BEI per lo sviluppo del fotovoltaico in Sicilia
Formazione
“Gian Maria Volonté”: dalla nascita ai progetti futuri, focus sulla Scuola d’Arte Cinematografica. Intervista al coordinatore Antonio Medici
MedTech
Dalla specializzazione intelligente di BionIT Labs una innovazione bionica per la disabilità
Finanza sostenibile
BEI e E-Distribuzione: investimenti per la sostenibilità energetica
Professioni
Servono competenze adeguate per gestire al meglio i fondi europei
Master
Come formare nuove professionalità per governare e gestire al meglio i fondi europei?
Programmazione UE
Assunzioni per le politiche di coesione: prossimi passi e aspettative dal concorso nazionale. Il podcast “CapCoe. La coesione riparte dalle persone”
innovazione sociale
Rigenerazione urbana: il quartiere diventa un hub dell’innovazione. La best practice di San Giovanni a Teduccio
Programmazione europ
Fondi Europei: la spinta dietro ai Tecnopoli dell’Emilia-Romagna. L’esempio del Tecnopolo di Modena
Interventi
Riccardo Monaco e le politiche di coesione per il Sud
Iniziative
Implementare correttamente i costi standard, l'esperienza AdG
Finanziamenti
Decarbonizzazione, 4,8 miliardi di euro per progetti cleantech
Formazione
Le politiche di Coesione UE, un corso gratuito online per professionisti e giornalisti
Interviste
L’ecosistema della ricerca e dell’innovazione dell’Emilia-Romagna
Interviste
La ricerca e l'innovazione in Campania: l'ecosistema digitale
Iniziative
Settimana europea delle regioni e città: un passo avanti verso la coesione
Iniziative
Al via il progetto COINS
Eventi
Un nuovo sguardo sulla politica di coesione dell'UE
Iniziative
EuroPCom 2024: innovazione e strategia nella comunicazione pubblica europea
Iniziative
Parte la campagna di comunicazione COINS
Interviste
Marco De Giorgi (PCM): “Come comunicare le politiche di coesione”
Analisi
La politica di coesione europea: motore della transizione digitale in Italia
Politiche UE
Il dibattito sul futuro della Politica di Coesione
Mobilità Sostenibile
L’impatto dei fondi di coesione sul territorio: un’esperienza di monitoraggio civico
Iniziative
Digital transformation, l’Emilia-Romagna rilancia sulle comunità tematiche
Politiche ue
Fondi Coesione 2021-27: la “capacitazione amministrativa” aiuta a spenderli bene
Finanziamenti
Da BEI e Banca Sella 200 milioni di euro per sostenere l’innovazione di PMI e Mid-cap italiane
Analisi
Politiche di coesione Ue, il bilancio: cosa ci dice la relazione 2024
Politiche UE
Innovazione locale con i fondi di coesione: progetti di successo in Italia
Agevolazioni
A febbraio l’apertura dello sportello Mini Contratti di Sviluppo
Quadri regolamentari
Nuovi Orientamenti sull’uso delle opzioni semplificate di costo
Coesione
Nuovo Bauhaus Europeo (NEB): i premi che celebrano innovazione e creatività
Dossier
Pubblicato il long form PO FESR 14-20 della Regione Sicilia
Iniziative
400 milioni per sostenere lo sviluppo delle tecnologie critiche nel Mezzogiorno
Formazione
“Gian Maria Volonté”: dalle aule al mondo del lavoro, focus sui tirocini della Scuola d’Arte Cinematografica
TRANSIZIONE ENERGETICA
Il ruolo del finanziamento BEI per lo sviluppo del fotovoltaico in Sicilia
Formazione
“Gian Maria Volonté”: dalla nascita ai progetti futuri, focus sulla Scuola d’Arte Cinematografica. Intervista al coordinatore Antonio Medici
MedTech
Dalla specializzazione intelligente di BionIT Labs una innovazione bionica per la disabilità
Finanza sostenibile
BEI e E-Distribuzione: investimenti per la sostenibilità energetica
Professioni
Servono competenze adeguate per gestire al meglio i fondi europei
Master
Come formare nuove professionalità per governare e gestire al meglio i fondi europei?
Programmazione UE
Assunzioni per le politiche di coesione: prossimi passi e aspettative dal concorso nazionale. Il podcast “CapCoe. La coesione riparte dalle persone”
innovazione sociale
Rigenerazione urbana: il quartiere diventa un hub dell’innovazione. La best practice di San Giovanni a Teduccio
Programmazione europ
Fondi Europei: la spinta dietro ai Tecnopoli dell’Emilia-Romagna. L’esempio del Tecnopolo di Modena
Interventi
Riccardo Monaco e le politiche di coesione per il Sud
Iniziative
Implementare correttamente i costi standard, l'esperienza AdG
Finanziamenti
Decarbonizzazione, 4,8 miliardi di euro per progetti cleantech
Formazione
Le politiche di Coesione UE, un corso gratuito online per professionisti e giornalisti
Interviste
L’ecosistema della ricerca e dell’innovazione dell’Emilia-Romagna
Interviste
La ricerca e l'innovazione in Campania: l'ecosistema digitale
Iniziative
Settimana europea delle regioni e città: un passo avanti verso la coesione
Iniziative
Al via il progetto COINS
Eventi
Un nuovo sguardo sulla politica di coesione dell'UE
Iniziative
EuroPCom 2024: innovazione e strategia nella comunicazione pubblica europea
Iniziative
Parte la campagna di comunicazione COINS
Interviste
Marco De Giorgi (PCM): “Come comunicare le politiche di coesione”
Analisi
La politica di coesione europea: motore della transizione digitale in Italia
Politiche UE
Il dibattito sul futuro della Politica di Coesione
Mobilità Sostenibile
L’impatto dei fondi di coesione sul territorio: un’esperienza di monitoraggio civico
Iniziative
Digital transformation, l’Emilia-Romagna rilancia sulle comunità tematiche
Politiche ue
Fondi Coesione 2021-27: la “capacitazione amministrativa” aiuta a spenderli bene
Finanziamenti
Da BEI e Banca Sella 200 milioni di euro per sostenere l’innovazione di PMI e Mid-cap italiane
Analisi
Politiche di coesione Ue, il bilancio: cosa ci dice la relazione 2024
Politiche UE
Innovazione locale con i fondi di coesione: progetti di successo in Italia

Articoli correlati

Articolo 1 di 4