II gruppi cinesi di intelligenza artificiale hanno superato i rivali statunitensi nella generazione video, aziende come ByteDance e Kuaishou stanno addestrando i propri modelli su vaste librerie di video brevi, sfruttando un vantaggio competitivo che i concorrenti americani non possono replicare: la proprietà diretta di piattaforme con centinaia di milioni di utenti attivi, TikTok, Douyin, Kwai e i dati che queste generano. Il video, a differenza del testo, non si può raccogliere facilmente tramite scraping su larga scala.
Chi possiede le piattaforme possiede i dati di addestramento. La divergenza è netta. OpenAI, Google e Anthropic continuano a dominare i modelli linguistici di grandi dimensioni e ambiti come il coding, ma i loro strumenti di generazione video restano indietro rispetto alle proposte cinesi in termini di qualità e usabilità, secondo sviluppatori e classifiche d’uso indipendenti.
“La maggior parte dei modelli americani che abbiamo provato non è molto buona nella generazione video”, ha dichiarato al FT Ben Chiang, fondatore di Director AI, una startup che produce contenuti generati dall’AI. Director AI utilizza principalmente Kling di Kuaishou, alternandolo con Seedance 2.0 di ByteDance e Hailuo della startup MiniMax.
Indice degli argomenti
Il mercato enterprise misura il sorpasso
Il segnale più eloquente arriva dal mercato enterprise. Vincent Yang, CEO di Firework, che fornisce infrastruttura video per siti di e-commerce, ha detto che prima i video erano imbarazzanti e robotici.
Ora siamo al punto in cui non si riesce a distinguere se è AI o umano. Un suo cliente, un retailer, ha chiesto la produzione di 100.000 video per le pagine prodotto, una scala impensabile senza AI, oggi realizzabile a costi accessibili.
Ventidue mesi dal test alla quotazione: la cronostoria
Per comprendere la velocità del sorpasso è utile ricostruire la sequenza degli eventi, dal primo modello cinese accessibile al pubblico alla situazione attuale.
Il punto di partenza è giugno 2024, quando Kuaishou lancia Kling 1.0. È il primo modello text-to-video generativo accessibile al pubblico. Sora di OpenAI, che aveva fatto scalpore con una demo a febbraio 2024, resta chiuso. Il giornalista Zeyi Yang del MIT Technology Review è tra i primi a testarlo e ne descrive i limiti, non capisce l’inglese, i movimenti hanno artefatti, le figure umane sono incoerenti, ma il dato politicamente rilevante è che Kuaishou apre le porte mentre OpenAI le tiene chiuse. Tra la fine del 2024 e il 2025 l’ecosistema cinese matura rapidamente: Kling arriva alla versione 2.0 con controllo della camera e coerenza dei personaggi, ByteDance debutta con Seedance 1.0 a giugno 2025, la versione 1.5 introduce già la generazione congiunta audio-video, una capacità che i modelli occidentali ancora non offrono nativamente. Il tutto alimentato dai dati proprietari di TikTok/Douyin e Kwai, ciascuno con oltre 600 milioni di utenti attivi.
Il momento di svolta è febbraio 2026. Il 9 febbraio ByteDance rilascia la pre-release di Seedance 2.0 e l’impatto si misura non in like ma in capitalizzazione di borsa: secondo Bloomberg, COL Group tocca il tetto giornaliero del +20%, Shanghai Film e Perfect World salgono del 10%, il CSI 300 chiude a +1,63%. I mercati finanziari scommettono sulla video generation prima ancora che il modello sia disponibile globalmente. Il 12 febbraio arriva il lancio ufficiale su Jimeng AI: nel giro di ore i video generati diventano virali, Tom Cruise contro Brad Pitt, i personaggi di Friends come lontre, Will Smith contro un mostro di spaghetti. La consulenza svizzera CTOL lo definisce superiore a Sora 2 e Veo 3.1. Un dettaglio che passa relativamente inosservato è che Seedance 2.0 non applica alcun watermark, a differenza di Sora 2 e Veo 3.1 che marcano i propri output.
La reazione di Hollywood è fulminea: il 13 febbraio, un giorno dopo il lancio, Disney invia una cease-and-desist; seguono Paramount/Skydance per Star Trek, South Park e Dora the Explorer, e SAG-AFTRA si schiera contro. ByteDance dichiara il 16 febbraio di rispettare la proprietà intellettuale e promette salvaguardie. Ma nello stesso mese il contrappunto americano è impietoso: “On This Day… 1776” di Darren Aronofsky per Time, il prodotto AI-video USA più visibile, viene stroncato dal Guardian, volti da Polar Express, bocche fuori sincrono, voci ancora affidate ad attori umani. Il gap tra i due ecosistemi è evidente e non è solo tecnico.
A marzo la situazione si complica su entrambi i fronti. ByteDance congela il rollout globale di Seedance 2.0 sotto pressione legale e politica, i senatori Blackburn e Welch chiedono la chiusura totale del servizio. Ma il colpo più pesante arriva dal fronte americano: OpenAI dismette Sora per costi computazionali insostenibili. Il modello che nel febbraio 2024 aveva inaugurato l’era della generazione video AI cessa di esistere proprio mentre i cinesi dominano le classifiche.
Ad aprile ByteDance rilancia con una strategia biforcata: Seedance 2.0 torna disponibile globalmente, ma gli IP statunitensi restano bloccati. L’Europa, l’Asia e il Sud America diventano i mercati di espansione, con la distribuzione consumer affidata a CapCut e i suoi 800 milioni di utenti, mentre per i clienti enterprise USA selezionati l’accesso richiede impegni da circa 2 milioni di dollari. A maggio Kuaishou annuncia di esplorare lo spin-off di Kling e una possibile quotazione separata. Seedance 2.0 è primo su Arena e Artificial Analysis. Dal test di Zeyi Yang su un modello che non capiva l’inglese alla valutazione di uno spin-off miliardario sono passati ventidue mesi.
Tre vantaggi strutturali cinesi
Il sorpasso non è il frutto di un singolo modello superiore, ma di tre vantaggi sistemici che si rafforzano reciprocamente.
Dati di addestramento
Il primo è il possesso dei dati di addestramento. ByteDance e Kuaishou gestiscono alcune delle piattaforme di video brevi più grandi al mondo. Questo offre un vantaggio nell’addestramento che è strutturalmente diverso da quello di Google, che pure dispone di YouTube: i dati di TikTok e Kwai sono nativamente corti, ad alta densità di azione e ottimizzati per il coinvolgimento, esattamente il tipo di materiale su cui si addestrano i modelli di generazione video. Google può attingere a YouTube, il suo modello Veo 3 è competitivo, ma applica più salvaguardie e limitazioni agli sviluppatori.
Asimmetria regolatoria
Il secondo vantaggio è l’asimmetria regolatoria. I modelli cinesi operano con restrizioni sui contenuti più blande rispetto ai concorrenti americani. Diversi sviluppatori e creatori hanno dichiarato che le minori limitazioni rendono i modelli cinesi più facili da usare nella pratica: gli strumenti statunitensi finiscono costantemente in errore, negando richieste per violazione dei termini d’uso senza ulteriori spiegazioni. L’assenza di watermark su Seedance 2.0, in un momento in cui sia OpenAI sia Google marcano i propri output è un indicatore preciso di questa asimmetria.
Accesso e distribuzione
Il terzo è il modello di accesso e distribuzione. Per i creatori individuali, le piattaforme cinesi sono più economiche e flessibili, con sistemi in abbonamento o a consumo che consentono sperimentazione rapida. La distribuzione via CapCut, un’app già installata su centinaia di milioni di dispositivi, offre una penetrazione consumer che nessun concorrente occidentale può eguagliare, è il modello TikTok applicato alla distribuzione della tecnologia generativa.
Il rovescio della medaglia: copyright e deepfake
Il vantaggio competitivo cinese ha un costo. L’escalation legale che ha seguito il lancio di Seedance 2.0, Disney, Paramount, SAG-AFTRA, i senatori americani, segnala che il modello di sviluppo ha dei limiti. ByteDance ha dovuto congelare il lancio globale, implementare un protocollo di addestramento su dati certificati e rinunciare al mercato statunitense diretto.
Ma sarebbe un errore inquadrare il problema come Cina irresponsabile contro Occidente responsabile. L’assenza di watermark su Seedance è preoccupante, ma l’ecosistema occidentale non offre garanzie migliori. Su X, il chatbot Grok di xAI è stato usato per generare milioni di immagini che spogliavano persone reali, in gran parte donne e minori. L’Unione Europea ha aperto un’indagine su X ai sensi del Digital Services Act, ma i contenuti erano già stati prodotti e distribuiti su scala industriale. Il problema di fondo è strutturale: la capacità tecnica di generare video indistinguibili dal reale ha superato la capacità normativa di governarne l’uso, su entrambe le sponde del Pacifico.
Cosa significa per l’Europa
La strategia biforcata di ByteDance colloca l’Europa in una posizione peculiare. Dopo il blocco degli IP statunitensi, i mercati EMEA e APAC sono diventati il terreno di espansione principale per Seedance 2.0. L’Europa è, di fatto, il primo mercato occidentale per la video generation cinese un ruolo che nessuno a Bruxelles aveva previsto e per il quale non esiste un quadro regolatorio specifico. L’AI Act europeo affronta i sistemi di AI ad alto rischio, ma la generazione video per uso pubblicitario o creativo non rientra in quella categoria. Il Digital Services Act impone obblighi di trasparenza sulle piattaforme, ma CapCut potrebbe sfuggire alla classificazione di piattaforma di dimensione molto grande pur distribuendo una tecnologia generativa di massa. Il risultato è un vuoto, la tecnologia più avanzata di generazione video al mondo arriva in Europa attraverso un’app di editing, senza le protezioni che si applicherebbero a una piattaforma social. Sul piano industriale la generazione video AI sta già trasformando la pubblicità e l’e-commerce. Quando un retailer chiede 100.000 video per le proprie pagine prodotto, non sta sperimentando, sta ridefinendo la catena del valore della comunicazione commerciale. L’Europa non ha un proprio modello di generazione video competitivo, non ha le piattaforme proprietarie che alimentano quelli cinesi e si trova nella posizione di mercato di sbocco per una tecnologia sviluppata altrove, esattamente come è accaduto con i social media.
Da Kling 1.0 che non capiva l’inglese a Seedance 2.0 che ridisegna il mercato pubblicitario globale: ventidue mesi. La velocità di questo ciclo è essa stessa il messaggio. Chi si occupa di regolazione, di politica industriale o semplicemente di capire dove sta andando l’AI non può permettersi di ragionare su tempi più lunghi di quelli che la tecnologia impone.












