L’11 novembre 2025 i Giudici tedeschi di Monaco di Baviera hanno pronunciato una sentenza della quale, forse, si è parlato meno di quanto si sarebbe dovuto.
La sintesi della decisione è questa: OpenAI ha violato le regole europee e tedesche sul diritto d’autore utilizzando, per addestrare i propri algoritmi, le parole delle canzoni i cui diritti sono gestiti dalla GEMA, l’equivalente delle nostre SIAE e Soundreef e, altrettanto, ha fatto inserendo estratti delle stesse canzoni nelle risposte che il suo chatbot ha dato agli utenti.
Indice degli argomenti
Diritto d’autore sulla musica e AI: stop e risarcimenti dopo la decisione tedesca
La conseguenza è che la società leader del mercato mondiale dell’intelligenza artificiale generativa deve cessare l’utilizzo dei contenuti in questione e dovrà risarcire alla GEMA e, attraverso quest’ultima, agli autori titolari dei diritti i danni generati dall’illegittima riproduzione del repertorio.
La Sentenza non è ancora definitiva e, quindi, OpenAI potrebbe impugnarla – e, verosimilmente, in difetto di un accordo, lo farà – ma il ragionamento dei Giudici tedeschi è logico, lineare, rigoroso e se i giudizi fossero materia da bookmakers i più scommetterebbero, probabilmente, sulla conferma della decisione di primo grado.
E qui è importante scendere un gradino nella direzione del merito della decisione.
Diritto d’autore e AI: il nodo del text and data mining in Europa
La questione dell’utilizzabilità di materiale protetto da diritto d’autore per l’addestramento degli algoritmi alla stregua della disciplina europea – diversa da quella americana alla luce della quale pure esiste analogo dibattito- è, infatti, discussa da tempo, non solo e non tanto nel dominio della musica ma anche in quello della letteratura, dell’informazione, delle arti figurative.
Il nodo centrale di tale questione generalmente è se lo scraping, la pesca a strascico di contenuti anche protetti dal diritto d’autore alla quale le fabbriche degli algoritmi hanno proceduto e procedono per addestrare i propri modelli possa considerarsi legittimo o meno alla stregua di quanto previsto dagli articoli 3 e 4 della Direttiva (UE) 2019/790 del Parlamento europeo e del Consiglio del 17 aprile 2019 sul diritto d’autore e sui diritti connessi nel mercato unico digitale e che modifica le direttive 96/9/CE e 2001/29/CE, la c.d. Direttiva DSM, Digital Single Market.
In particolare, l’articolo 4, prevede tra l’altro, che: “Gli Stati membri dispongono un’eccezione o una limitazione ai diritti di cui all’articolo 5, lettera a), e all’articolo 7, paragrafo 1, della direttiva 96/9/CE, all’articolo 2 della direttiva 2001/29/CE, all’articolo 4, paragrafo 1, lettere a) e b), della direttiva 2009/24/CE e all’articolo 15, paragrafo 1, della presente direttiva per le riproduzioni e le estrazioni effettuate da opere o altri materiali cui si abbia legalmente accesso ai fini dell’estrazione di testo e di dati” e che “le riproduzioni e le estrazioni effettuate a norma del paragrafo 1 possono essere conservate per il tempo necessario ai fini dell’estrazione di testo e di dati”.
E aggiunge poi che “3. L’eccezione o la limitazione di cui al paragrafo 1 si applica a condizione che l’utilizzo delle opere e di altri materiali di cui a tale paragrafo non sia stato espressamente riservato dai titolari dei diritti in modo appropriato, ad esempio attraverso strumenti che consentano lettura automatizzata in caso di contenuti resi pubblicamente disponibili online.”.
L’eccezione in questione è quella della quale, ad esempio, si avvalgono i motori di ricerca per la lettura e l’indicizzazione dei contenuti online.
Che questa applicazione pensata e introdotta nell’ordinamento europeo quando i servizi basati sull’intelligenza artificiale generativa non esistevano sia applicabile anche all’attività delle grandi fabbriche globali degli algoritmi è, appunto, questione complessa e, allo stato, dibattuta e, sostanzialmente, irrisolta.
Così tanto complessa che nel dibattito che ha portato all’approvazione dell’AI Act si ritenne di accantonarla per evitare di bloccare l’intera discussione e che oggi è ritornata in auge nell’ambito dei lavori preparatori del c.d. Digital Omnibus.
Le zone grigie: accesso legittimo, scraping e termini d’uso
Prospettive di riforma lontane a venire a parte, gli aspetti più dibattuti hanno sin qui riguardato oltre al principio stesso di consentire ex lege uno sfruttamento di altrui opere dell’ingegno a imprese che, una volta sfruttato il patrimonio in questione, finiscono con il far concorrenza ai titolari dei diritti e all’intera industria creativa, le modalità attraverso le quali i titolari dei diritti potrebbero e dovrebbero opporsi all’utilizzo delle proprie opere per l’addestramento degli algoritmi e cosa debba intendersi quando la norma subordina l’efficacia dell’eccezione alla circostanza che l’accesso, per finalità di data mining, ovvero quello realizzato a mezzo scraping, sia legittimo.
In questa discussione, tanto per intendersi, ci si chiede ad esempio se lo scraping di musica o di video realizzato accedendo a piattaforme i cui termini d’uso lo vietano possa o non possa considerarsi legittimo.
La questione, appunto, è, allo stato, irrisolta.
Diritto d’autore e AI: l’attesa per la Corte di Giustizia UE
Una svolta, o almeno un importante giro di boa in attesa di un eventuale nuovo intervento legislativo è atteso quando la Corte di Giustizia dell’Unione europea si pronuncerà su una questione pregiudiziale rimessale dai Giudici ungheresi proprio a proposito di questa questione.
Il caso, arrivato nei mesi scorsi a Lussemburgo è questo: C-250/25, Like Company.
Queste le questioni pregiudiziali sulle quali la Corte dovrà pronunciarsi:
1. Se l’articolo 15, paragrafo 1, della direttiva (UE) 2019/790 del Parlamento europeo e del Consiglio, del 17 aprile 2019 [, sul diritto d’autore e sui diritti connessi nel mercato unico digitale e che modifica le direttive 96/9/CE e 2001/29/CE], e l’articolo 3, paragrafo 2, della direttiva 2001/29/CE del Parlamento europeo e del Consiglio, del 22 maggio 2001, sull’armonizzazione di taluni aspetti del diritto d’autore e dei diritti connessi nella società dell’informazione, debbano essere interpretati nel senso che costituisce una comunicazione al pubblico la visualizzazione, nelle risposte di un chatbot basato su un LLM, di un testo in parte identico al contenuto di siti web di editori di pubblicazioni di carattere giornalistico, con un’estensione tale da essere già protetto in virtù dell’articolo 15 della direttiva 2019/790. In caso di risposta affermativa, se sia rilevante la circostanza che si tratti del risultato di un processo in cui il chatbot prevede la parola successiva basandosi esclusivamente su modelli osservati.
- Se l’articolo 15, paragrafo 1, della direttiva 2019/790 e l’articolo 2 della direttiva 2001/29 debbano essere interpretati nel senso che costituisce una riproduzione il processo di addestramento di un chatbot basato su un LLM costruito in base all’osservazione e al filtraggio per motivi, circostanza che permette all’LLM di imparare a riconoscere i modelli linguistici.
- In caso di risposta affermativa alla seconda questione pregiudiziale, se tale riproduzione di opere legalmente accessibili rientri nell’eccezione prevista dall’articolo 4 della direttiva 2019/790, che garantisce il libero utilizzo ai fini dell’estrazione di testo e di dati.
- Se l’articolo 15, paragrafo 1, della direttiva 2019/790 e l’articolo 2 della direttiva 2001/29 debbano essere interpretati nel senso che costituisce una riproduzione da parte del fornitore del servizio di chatbot la circostanza che, quando gli utenti impartiscono a un chatbot basato su un LLM un’istruzione coincidente con il testo contenuto in una pubblicazione di carattere giornalistico, o che fa riferimento a tale testo, il chatbot generi successivamente la sua risposta basandosi sull’istruzione fornita dall’utente, risposta in cui viene visualizzato in tutto o in parte il contenuto di una pubblicazione di carattere giornalistico.”
Singole questioni a parte, la sostanza è chiara: la Corte di Giustizia nello sciogliere i nodi messi sul suo tavolo dai giudici ungheresi potrebbe mettere letteralmente fuori legge gran parte di quanto è sin qui stato fatto dalle fabbriche di algoritmi con i contenuti degli editori di giornali e non solo.
Sarebbe un autentico terremoto che difficilmente potrebbe non far tremare le gambe a chi ha fagocitato contenuti che, senza permesso, forse, non avrebbe potuto fagocitare e che, come se non bastasse, allo stato detta tecnica, difficilmente può smettere di usare dalla sera alla mattina come un qualsiasi giudice europeo potrebbe ordinargli di fare.
Ma questo scenario, appunto, è prossimo venturo ma non imminente.
La sentenza di Monaco e la “fase 2”: cosa non copre l’eccezione TDM
Frattanto, invece, ed è la ragione che la rende particolarmente interessante, la decisione resa nei mesi scorsi dai giudici di Monaco, propone un passo in avanti significativo, anzi, si potrebbe dire, un salto della questione della portata dell’eccezione del text e del data mining.
I giudici tedeschi, infatti, nella sostanza, hanno messo nero su bianco di ritenere che l’eccezione per il text & data mining – quella dell’art. 4 della Direttiva DSM per intenderci – anche laddove applicabile non legittimerebbe in nessun caso un fenomeno che, invece, si realizza nella digestione da parte degli algoritmi delle opere protette da diritto d’autore ovvero la loro permanenza, sebbene in forma destrutturata, nei ventri degli algoritmi medesimi e men che meno la riproduzione delle medesime opere nelle risposte date agli utenti.
Queste forme di utilizzazione delle parole delle canzoni sulle quali la GEMA ha rivendicato, nei confronti di OpenAI, i diritti dei propri mandanti, secondo il Tribunale di Monaco, in assenza di un’esplicita autorizzazione e, eventualmente, del pagamento di un compenso sarebbero semplicemente illecite alla stregua di qualsiasi altra forma di sfruttamento commerciale di un altrui opera dell’ingegno.
Basta leggere pochi passaggi della Sentenza per comprenderne la portata: “Modelli linguistici come quelli in questione rientrano generalmente nell’ambito delle limitazioni relative al text e data mining. Le normative coprono le riproduzioni necessarie durante la compilazione del corpus di dati nella Fase 1 (so), ma non ulteriori riproduzioni all’interno del modello nella Fase 2. Se, come nel caso di specie, l’addestramento nella Fase 2 comporta non solo l’estrazione di informazioni dai dati di addestramento, ma anche la riproduzione di opere, ciò non costituisce text e data mining. Sebbene le limitazioni si applichino generalmente all’addestramento dei modelli, le riproduzioni all’interno del modello non sono coperte da tali limitazioni, in quanto non servono esclusivamente a preparare il text e data mining.
[…] La riproduzione dei testi delle canzoni contestate nei modelli non costituisce estrazione di testo e dati. Nei modelli linguistici, il text e data mining mira a valutare informazioni quali regole sintattiche astratte, termini comuni e relazioni semantiche (Spindler/Schuster/Kaesling/Pesch, 5a ed. 2025 iE, UrhG § 44b Rn. 18). Vengono valutati anche livelli di espressione come la scelta delle parole, l’intervallo di espressione e le ripetizioni (Kuschel/Rostam, ZUM 2025, 71, 73). Queste informazioni provenienti dai dati di training possono essere trasformate in parametri del modello.
La memorizzazione dei testi delle canzoni in questione, tuttavia, va oltre tale analisi e non si limita quindi a un’analisi di testo e dati. I testi delle canzoni, in quanto dati di training, non sono stati semplicemente analizzati, ma completamente incorporati nei parametri del modello, il che a sua volta viola i diritti di sfruttamento dei titolari del copyright.
La riproduzione del testo della canzone in discussione nel modello della Fase 2 non è coperta dalle limitazioni di text e data mining della Sezione 44b della Legge tedesca sul diritto d’autore (UrhG) o dell’Articolo 4 della Direttiva DSM.
Le copie effettuate durante il processo di memorizzazione del modello non sono state create allo scopo di generare il set di dati di training e quindi non sono state effettuate durante la Fase 1, in cui non sono stati interessati i diritti di sfruttamento dei titolari del copyright. Sono state invece effettuate in aggiunta durante l’addestramento del modello nella Fase 2. Il presupposto del text and data mining e le relative limitazioni, ovvero che la valutazione automatizzata di semplici informazioni non violi alcun diritto di sfruttamento, non si applica in questo caso. Al contrario, le copie effettuate all’interno del modello violano i diritti di sfruttamento dei titolari del copyright. Tale violazione non rientra nelle limitazioni previste dall’articolo 44b della legge tedesca sul diritto d’autore (UrhG).”.
Difficile scriverlo in modo più chiaro specie considerata la complessità tecnica del processo preso in considerazione.
Output dei chatbot e responsabilità: perché non basta chiamare in causa l’utente
E analoga e, anzi, forse, maggiore, è la chiarezza dei Giudici tedeschi a proposito della circostanza che egualmente illecita deve considerarsi la riproduzione di estratti dei testi delle canzoni i cui diritti d’autore sono gestiti dalla GEMA da parte di OpenAI nelle risposte ai prompt degli utenti.
Ecco un altro estratto della decisione: “Contrariamente a quanto sostenuto dal convenuto, la messa a disposizione di un’opera al pubblico non dipende dall’esistenza di una registrazione fisica o di una versione dell’opera che possa essere resa disponibile per il recupero da parte dell’utente. L’esecuzione pubblica riguarda lo sfruttamento immateriale di un’opera. L’opinione del convenuto secondo cui l’esecuzione pubblica richiede la congruenza tra il contenuto reso disponibile e il contenuto effettivamente riprodotto è altrettanto poco convincente. Tale requisito non è soddisfatto nei modelli in questione a causa degli elementi casuali che possono influenzare i risultati. Poiché la mera possibilità di recupero è sufficiente per l’atto dell’esecuzione, eventuali deviazioni nella riproduzione sono irrilevanti, soprattutto perché i risultati in questione, come spiegato, non mantengono una distanza sufficiente dal testo della canzone in questione.
Inoltre, gli imputati riproducono il testo della canzone in questione negli output. Le violazioni del copyright causate dagli output sono attribuibili a cause sistemiche; la progettazione del contenuto degli output è da attribuire agli imputati in qualità di operatori dei modelli. Gli imputati hanno utilizzato il testo della canzone in questione come dati di training per i loro modelli, hanno preparato il set di training e hanno eseguito il training, con conseguente memorizzazione dei dati di training. Gli imputati sono anche responsabili dell’architettura dei loro modelli. I prompt che hanno portato agli output nell’Allegato 2 sono stati semplicemente progettati e non hanno predeterminato alcun contenuto. Contrariamente a quanto sostenuto dagli imputati, dati tali prompt aperti, la violazione del copyright causata dagli output non può essere attribuita all’utente.
Gli imputati commettono direttamente l’atto di riproduzione. Essi stessi mettono l’opera a disposizione del pubblico e non agiscono semplicemente come intermediari, ad esempio fornendo l’infrastruttura necessaria a terzi per riprodurla. Poiché gli imputati sono responsabili del contenuto dei loro modelli e tale contenuto viene riprodotto tramite semplici prompt, le loro attività non possono essere paragonate a quelle degli operatori di piattaforme di hosting o dei fornitori di hardware o software.”.
Punto e a capo.
Diritto d’autore e AI: la domanda finale sui “giganti” e il conto in arrivo
Ora se le cose stanno così e, per la verità, almeno così – ovvero così a prescindere dalla questione dei limiti all’applicabilità dell’eccezione per il text e data mining – sembrano stare la domanda da porsi è: possibile che servizi progettati, sviluppati e gestiti da un comparto industriale miliardario che sta letteralmente riscrivendo il modo in cui miliardi di persone vivono e lavorano siano basati su un gigantesco furto proprietà, ancorché intellettuale, altrui?
Magari non accadrà mai o, magari, si ma che accadrebbe se OpenAI – ma solo perché è il primo soggetto trascinato davanti ai giudici tedeschi perché l’intera industria del settore utilizza verosimilmente lo stesso approccio – venisse effettivamente obbligato, come i giudici gli hanno già ordinato di fare in relazione alle opere oggetto di contestazione, a interrompere ogni forma di utilizzo di contenuti protetti da diritto d’autore in assenza di esplicita autorizzazione degli autori?
L’industria dell’intelligenza artificiale generativa e i suoi investitori sono pronti a questa eventualità o, semplicemente, scommettono sulla circostanza che anche in caso di accertata e diffusa illiceità manifesta nessuno li fermerà per davvero?
L’impressione è che siamo davanti a giganti dalle gambe d’argilla e che quei diritti travolti e ignorati nella fase di progettazione e sviluppo per far prima, per risparmiar denari, per disporre di soluzioni più potenti, prima o poi, busseranno alle porte di quei giganti presentando il conto, in nome e per conto di milioni di persone e di altri comparti industriali, a cominciare da quello editoriale e quello creativo sin qui cannibalizzati dal comparto dell’industria dei diversamente intelligenti.


















