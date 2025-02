E se il “miracolo” DeepSeek fosse basato su un grande furto ai danni di OpenAI?

Il tema è fondamentale: la possibile violazione della proprietà intellettuale di OpenAI da parte della società cinese emergente nel settore AI.

Architettura DeepSeek e fonti del modello

Abbiamo chiesto direttamente all’applicazione di DeepSeek su quale architettura si basi e quali siano le fonti del suo modello. La risposta ufficiale è stata che il modello si fonda su un’architettura proprietaria sviluppata internamente, senza derivazioni da GPT-4 o altri modelli di terze parti. Tuttavia, alla richiesta di fornire fonti verificabili a supporto di tale affermazione, risponde “mi dispiace ma non ho accesso a fonti esterne o documenti specifici per confermare dettagli tecnici o legali relativi a DeepSeek-V3 e che le informazioni fornite si basano sui dati con cui sono stato addestrato e sulle indicazioni generali relative a DeepSeek”.

Ed è proprio questo il nodo della disputa tra OpenAI e la società DeepSeek, che ha acceso un dibattito fondamentale sui profili di proprietà intellettuale legati all’intelligenza artificiale.

Proprietà intellettuale e AI: la controversia OpenAI-DeepSeek

Il cuore della controversia ruota attorno all’accusa secondo cui DeepSeek avrebbe utilizzato modelli di OpenAI, come ChatGPT, per sviluppare il proprio chatbot attraverso una tecnica che è nota come “distillazione“. Questo processo prevede l’addestramento di un modello più semplice (“studente”) per replicare il comportamento di un modello più avanzato (“insegnante”), con l’obiettivo di ottenere un sistema efficiente mantenendo prestazioni e capacità simili.

Il problema emerge quando il modello “insegnante” è protetto dal diritto d’autore: l’utilizzo non autorizzato potrebbe costituire una violazione della proprietà intellettuale. La domanda fondamentale, dunque, è: la distillazione è lecita? Attualmente, non esiste una risposta chiara nel diritto del copyright o nella giurisprudenza. Se da un lato si potrebbe argomentare che un modello AI possa essere protetto e che il suo utilizzo non autorizzato ai fini di addestramento configuri una violazione, dall’altro il concetto di “Fair Use” negli Stati Uniti e le eccezioni previste dal diritto d’autore europeo potrebbero offrire una difesa legale.

I termini d’uso di OpenAI

A livello “contrattuale” poi si legge chiaramente che negli stessi Termini d’Uso di Open AI viene espressamente previsto che è vietato l’utilizzo degli output per sviluppare modelli concorrenti, estrarre automaticamente o in modo programmatico dati o output, nonché è vietata la cosiddetta pratica di reverse engineering dei propri sistemi.

Tuttavia, se anche OpenAI riuscisse a dimostrare che DeepSeek ha riprodotto il comportamento di ChatGPT accedendo direttamente al codice sorgente, ai pesi della rete neurale o estraendo dati per addestrare il proprio sistema, non è detto che ognuna di queste condotte costituirebbe singolarmente violazione di copyright.

La questione dell’addestramento dei modelli AI su dati coperti da copyright

Questo centrale interrogativo è tra l’altro collegato alla parallela questione dell’addestramento dei modelli AI tramite utilizzo di dati e contenuti di soggetti terzi tutelati da copyright, di cui la stessa OpenAI è parte in causa in molteplici contenziosi pendenti davanti ai tribunali americani instaurati da giornalisti e autori contro il colosso USA riguardanti l’estrazione di testi protetti senza autorizzazione. E nei quali, tra l’altro, la teoria del fair use costituisce la base della difesa legale.

Inoltre, a livello europeo, nel caso di utilizzo di contenuti di terzi si inserisce il tema relativo all’eccezione per il Text and Data Mining, introdotta dalla Direttiva 2019/790 sul diritto d’autore nel mercato unico digitale, che consente agli sviluppatori di intelligenza artificiale di estrarre dati da contenuti protetti da copyright a determinate condizioni, specialmente per finalità di ricerca – ove tuttavia tale diritto non sia espressamente negato dagli autori tramite opt out.

L’introduzione del modello DeepSeek R1, un “reasoning model” che genera risposte simulando il ragionamento umano, riapre inoltre il dibattito sulla tutelabilità degli output generati dall’AI. Attualmente, molte legislazioni richiedono che un’opera sia frutto dell’ingegno umano per godere di protezione autoriale. Se DeepSeek generasse contenuti autonomamente, senza un reale apporto creativo umano, rimarrebbe aperta la questione sulla loro tutelabilità e su quanto l’intervento umano debba essere rilevante per conferire tutela.

DeepSeek e sicurezza del segreto commerciale

Un altro punto critico (comune ad altri modelli AI) riguarda il fatto che DeepSeek offre un modello AI gratuito e scaricabile in locale dalle PMI. Se le aziende utilizzassero DeepSeek per elaborare dati interni sensibili, potrebbe emergere un serio rischio per la protezione dei segreti commerciali. Se il modello raccogliesse e riutilizzasse tali dati per migliorare il proprio sistema, le imprese potrebbero perdere il controllo sui loro asset strategici, con possibili implicazioni legali per la tutela delle informazioni riservate e del know-how aziendale.

Il quadro normativo applicabile ai sistemi di intelligenza artificiale

Un ulteriore aspetto riguarda il quadro normativo applicabile ai sistemi di intelligenza artificiale. L’AI Act al momento fornisce poche indicazioni sulle violazioni del diritto d’autore e sulla tutelabilità delle opere generate dall’AI, rendendo necessarie future normative ad hoc. In Italia, il DDL attualmente in discussione prevede l’obbligo per i contenuti generati da intelligenza artificiale di includere un “elemento o segni identificativo AI” per indicarne chiaramente l’origine automatizzata. Questa normativa, ancora bloccata al Senato, potrebbe rendere complesso il tentativo di ottenere una tutela come opera creativa, scontrandosi con l’obbligo di trasparenza sul processo di realizzazione tramite AI.

I punti di criticità non finiscono qui: il fatto che il software sia open source riapre l’eterna discussione tra innovazione tecnologica e tutela degli investimenti e sicurezza, il dubbio che DeepSeek possa essere controllato dal Governo cinese e che si possano porre tematiche di censura e bias o, ancora, le implicazioni relative alla tutela delle privacy, su cui il Garante ha già aperto un’istruttoria.

La disputa tra Deepseek e Open AI vista da Deepseek e OpenAI

Abbiamo anche chiesto a entrambi i sistemi AI di darci la loro opinione proprio sulla disputa tra Deepseek e OpenAI[1].

ChatGPT offre un’analisi articolata, considerando le implicazioni legali, strategiche e geopolitiche della controversia, lasciando spazio all’ipotesi che OpenAI possa anche cercare di difendere la propria posizione di mercato. DeepSeek, invece, si mantiene su un approccio distaccato e puramente descrittivo, evitando qualsiasi presa di posizione e sottolineando la necessità di un’analisi tecnica e legale più approfondita per poter fornire una risposta, quindi, in questo caso, senza alcuna interpretazione critica.

Questa differenza riflette due filosofie opposte: da un lato, un’AI che interpreta il contesto e valuta scenari possibili; dall’altro, un modello che si attiene a un approccio rigorosamente neutrale. Ma quale ruolo dovrebbe avere un’intelligenza artificiale? Essere un’analista capace di ipotizzare scenari, o un narratore imparziale?

Un banco di prova per il futuro dell’intelligenza artificiale

La querelle tra OpenAI e DeepSeek non è solo una battaglia legale: è un banco di prova per il futuro dell’intelligenza artificiale e della proprietà intellettuale nell’era dell’innovazione tecnologica, ma dovremmo attendere gli sviluppi nelle aule di tribunale per capire chi avrà la meglio e ottenere delle risposte sulla liceità o meno delle attività di addestramento di modelli AI con contenuti, modelli o algoritmi altrui.

Note

[1] Il prompt usato è: “Dimmi in un paragrafo secondo la tua opinione chi ha ragione tra DeepSeek e Open Ai su violazione IP e se DeepSeek ha copiato il modello di Open AI“.