La tutela dei diritti d’autore nell’era dell’intelligenza artificiale è diventata oggetto di importanti controversie legali internazionali, come dimostra la recente causa intentata da autori ed editori francesi contro Meta Platforms. Le implicazioni giuridiche, tecnologiche ed economiche di questo conflitto sono profonde e potenzialmente rivoluzionarie.
Indice degli argomenti
Intelligenza artificiale e violazione dei diritti d’autore
Nel mese di marzo 2025 è stata data notizia dell’avvio di una causa – radicata di fronte al tribunale di Parigi – che vede opposti, da una parte, le associazioni maggiormente rappresentative degli autori e editori francesi (SNE, SNAC, SGDL) e dall’altra, il gigante “Big Tech” statunitense, Meta Platforms Inc., società che dall’anno 2023 ha sviluppato i modelli di intelligenza artificiale generativa denominati “LLAMA”, acronimo che sta per “Large Language Model Meta AI”.
La controversia, in cui per la prima volta autori e editori si sono uniti per fronteggiare un problema comune, riguarda la richiesta del riconoscimento giudiziale del compenso spettante ai titolari a fronte dell’utilizzazione delle opere letterarie i cui diritti esclusivi di utilizzazione economica verrebbero abusivamente e massivamente violati da Meta[1] per addestrare i propri modelli di IA[2].
Si tratta di una vicenda in cui agli atti di appropriazione abusiva dei contenuti degli autori francesi, Meta affiancherebbe la pubblicazione di testi scritti dai suoi modelli di intelligenza artificiale nello stile peculiare dei singoli scrittori, in tal modo realizzando opere che costituiscono il plagio di quelle proprie dei creatori dei testi originali, arricchendosi in tal modo sul lavoro altrui.
Le differenze normative tra Europa e Stati Uniti nel contesto dell’intelligenza artificiale
I temi posti di fronte ai tribunali d’oltralpe dalle associazioni autorali non sono nuovi rispetto a quelli oggetto delle cause pendenti davanti ai giudici negli Stati Uniti[3], ma la diversità fra le norme vigenti, non solo in materia di diritto d’autore, che informano il sistema giuridico della Francia (come Stato membro dell’Unione Europea) e quelle applicabili negli Stati Uniti, pongono sin da subito all’attenzione degli esperti una serie di interrogativi e di argomenti che assumono un rilievo significativo nell’ambito dell’inarrestabile globalizzazione delle tecnologie digitali.
La difesa di Meta e la dottrina del fair-use nell’intelligenza artificiale
Alcuni spunti di riflessione che ci permettono di comprendere quali siano gli aspetti di maggiore rilievo cui facciamo riferimento e che saranno in seguito presi in esame, sono stati posti all’attenzione dei giuristi dalle argomentazioni svolte dalla difesa di Meta Platforms Inc., proprio nella class-action che vede contrapposte l’impresa di Menlo Park e gli autori Richard Kadrey et al., pendente di fronte alla Divisione di San Francisco della District Court della California del Nord[4].
L’atto depositato il 24 marzo 2025 dai legali di Meta fornisce, in un documento di 53 pagine, una panoramica delle sentenze rese nel tempo dai giudici statunitensi che avvalorerebbero la tesi della legittimità dell’operato di Meta, la quale avrebbe sì riprodotto i dataset contenenti le opere degli attori, ma lo avrebbe fatto lecitamente nell’esercizio di un fair use trasformativo e non per violare i diritti d’autore spettanti agli scrittori ricorrenti.[5]
Nel dare per assodato che l’operato dei modelli di intelligenza artificiale sviluppati da Meta risponda a tutte le quattro condizioni poste dalla legge (rectius: dai precedenti giurisprudenziali in materia) affinché ricorra un uso legittimo delle opere altrui[6], i legali della società hanno spiegato che “la copia di testi tratti da Internet, comprese le opere letterarie protette dal diritto d’autore, al fine di sviluppare e addestrare “Large Language Models” (LLM) capaci di generare una stupefacente serie di contenuti nuovi e non illeciti costituisce fair-use in base alla legge statunitense sul Copyright”.[7]
Di tal guisa – sostiene la convenuta – non esistendo un mercato di sbocco costituito dai modelli di intelligenza artificiale per le opere letterarie degli autori ricorrenti e dovendosi escludere che la riproduzione dei medesimi testi possa assolvere alla funzione svolta dalla lettura diretta dei libri da parte dei destinatari finali, in un contesto altamente trasformativo dei contenuti originali, l’operato di Meta si porrebbe nella piena liceità voluta dalla dottrina del fair-use, il cui dettato andrebbe letto tenendo in considerazione i significativi mutamenti intervenuti di recente in ambito tecnologico[8].
Le accuse contro Meta sull’uso illegittimo delle opere per l’intelligenza artificiale
La presa di posizione di Meta fa seguito alle vicende processuali del 9 gennaio 2025, oltre a porsi in replica alla “Motion for Partial Summary Judgment” che i ricorrenti (Kadrey e altri) avevano depositato il 10 marzo 2025, ribadendo che Meta aveva violato i diritti d’autore appropriandosi, nella consapevolezza dell’illecito da parte dei vertici aziendali, di svariati terabyte di opere protette, rimuovendo le inerenti informazioni sul regime dei diritti, oltre che acquisendo i contenuti da fonti pirata, incluse le piattaforme di file-sharing.
Un massivo rastrellamento di opere dell’ingegno, di proprietà non solo dei ricorrenti, tale da giustificare – secondo la tesi dei ricorrenti – l’emissione da parte del giudice di un provvedimento che riconosca la violazione dei diritti degli autori in base al § 106 del Titolo 17 dello U.S. Code. Inoltre – a dire degli attori – la fattispecie del “fair-use” non potrebbe essere invocata qualora la riproduzione avvenga per il tramite di copie di opere abusivamente riprodotte (cioè, frutto di pirateria audiovisiva), in quanto l’uso “trasformativo” presupporrebbe che l’opera derivata provenga da un originale e non da una copia contraffatta.
Il dibattito sul fair-use nell’intelligenza artificiale secondo i sostenitori di Meta
Gli atti giudiziari delle due parti sono stati seguiti, nel corso dei mesi di marzo e di aprile 2025, dalla produzione in causa di una serie di documenti a supporto delle tesi dell’una o dell’altra parte, in termini tecnici gli “Amicus Curiae Briefs”, i quali, seppure prevalentemente previsti nei codici del rito dei paesi di “Common Law”, affondano le loro radici nel diritto romano[9].
Fra gli atti a sostegno delle tesi di Meta circa la sussistenza delle condizioni stabilite per l’esercizio del fair-use vi è quello depositato il 3 aprile 2025 dalla “Electronic Frontier Foundation”[10], un ente che notoriamente non ha mai nascosto le proprie inclinazioni a sfavore di una tutela efficace del diritto d’autore. In questo frangente, il sostegno della E.E.F. a Meta è stato espresso evidenziando che non rileverebbe, in un giudizio riguardante la libera utilizzazione dei contenuti protetti altrui, la provenienza lecita o illecita delle opere tutelate utilizzate per addestrare i modelli di intelligenza artificiale, in quanto ciò che dovrebbe essere considerato è il fatto che gli sviluppatori dei modelli di IA devono disporre di dataset massivi e di elevata qualità e, nel compiere tale esame, i giudici dovrebbero valutare le norme sul diritto d’autore “in maniera tale da non frustrare la creatività che la legge stessa intende promuovere”, secondo quanto recita un inciso della sentenza della Corte suprema statunitense nel caso Warhol dell’anno 2023[11].
Anche un gruppo di quattro professori universitari[12], esperti del settore tecnologico e del diritto d’autore, hanno preso posizione in questo giudizio nel ruolo di “Amici Curiae” nell’interesse di Meta Platforms Inc., con un atto di 18 pagine depositato il 31 marzo 2025 che, nella sostanza, sostiene che le attività di copia svolte per l’addestramento dei modelli di intelligenza artificiale avrebbero natura meramente interna e sarebbero rivolte alla creazione di nuove conoscenze, tanto da configurare un uso trasformativo delle opere oggetto di acquisizione, circostanza che sarebbe fortemente favorita dalla dottrina del fair-use. In tal modo, attraverso la copia, il pubblico verrebbe beneficiato dalla creazione di una nuova forma espressiva. Di tal guisa, secondo questi esperti, il mercato cui si rivolge il prodotto derivante dall’uso trasformativo delle opere non ricadrebbe nell’ambito dell’esclusiva degli autori; allo stesso modo non rientrerebbe nei loro diritti il previo consenso o l’autorizzazione a un impiego non espressivo delle opere quando esso sia attuato all’interno della fase di sviluppo dei modelli di intelligenza artificiale.
Le argomentazioni contrarie al fair-use per l’intelligenza artificiale
Di opposto avviso circa la valenza giuridica delle deduzioni svolte da Meta in merito alla legittimità del proprio operato nell’utilizzazione delle opere oggetto di causa, è la Copyright Alliance[13] la quale, nel suo “Brief as Amicus Curiae” dell’11 aprile 2025, evidenzia che non vi sarebbe un uso trasformativo dei libri degli autori ricorrenti da parte dell’impresa di Menlo Park e, anche nella denegata ipotesi in cui tale uso fosse da considerare trasformativo, esso non potrebbe prevenire l’analisi che deve essere svolta avuto riguardo alla sussistenza del fair-use, indagine che deve avvenire sulla scorta della giurisprudenza della sentenza Warhol, la quale supererebbe e avrebbe altresì modificato le precedenti linee interpretative delle Corti statunitensi.
Il ragionamento seguito dalla Copyright Alliance nel proprio parere – che sembra replicare alle tesi dei professori “amici” di Meta di cui supponiamo, per la tempistica redazionale, non potesse avere conoscenza – si basa sul fatto che Meta avrebbe copiato l’intero compendio di contenuti (protetti o non protetti dal diritto d’autore) disponibile su Internet, inclusi i siti web pirata, senza che essa sia stata capace di giustificare tale operazione sotto il profilo giuridico.
Ciò che deve essere preso in esame – sostiene la Copyright Alliance – è il fatto che, anche se la copia delle opere in sé ha una funzione differente rispetto a quella dei libri, l’output generato dai modelli di intelligenza artificiale assolve il medesimo scopo del loro contenuto. Questo principio sorregge il ragionamento della Corte suprema nel caso Warhol, dovendosi prendere in considerazione la finalità di una utilizzazione e non un’analisi che si soffermi a un passaggio intermedio dell’impiego del contenuto protetto. In tal senso – afferma la Copyright Alliance – la finalità dello sfruttamento dell’opera va considerato in relazione agli effetti che esso produce sull’opera stessa e sulla creatività in generale.
Ciò a maggior ragione vale – ad opinione degli “amici” dei ricorrenti – quando l’output del modello di intelligenza artificiale assolve il medesimo scopo, ponendosi in concorrenza con l’opera che è stata ingerita dal sistema.
La provenienza dei contenuti utilizzati per addestrare l’intelligenza artificiale
In questa sede, in cui si porta all’attenzione dei lettori un esame di estrema sintesi dei fatti processuali in oggetto, allo scopo di valutare le possibili implicazioni che la decisione di una controversia importante potrà comportare per i soggetti coinvolti e per i moltissimi loro aventi causa, ci limitiamo ad esaminare per par condicio nell’illustrazione dei fatti, il “Brief as Amicus Curiae” depositato agli atti del giudizio l’11 aprile 2025 dalla “International Association of Scientific, Technical, Medical Publishers” (STM) a sostegno delle tesi dei ricorrenti[14].
Nel suo documento, la STM ha focalizzato una parte rilevante dell’analisi al tema della provenienza dei contenuti sviluppati da Meta per i propri modelli di IA denominati LLAMA. Essa ha quindi evidenziato che molti dei siti web da cui sono stati tratti i contenuti utilizzati per addestrare i modelli di cui sopra sono stati oggetto di ripetute sentenze di condanna per violazione dei diritti, anche d’autore, commessi per il tramite della loro diffusione sulla rete Internet. Alcuni di tali siti web sarebbero stati altresì oggetto di attività investigative dell’FBI e del Dipartimento per la Giustizia statunitense, anche per il reato spionaggio. La STM, nell’osservare che Meta avrebbe usato i file di BitTorrent al fine di scaricare dalla Rete centinaia di terabyte di opere protette dal diritto d’autore, in esse incluse le piattaforme Z-Library, LibGen, Sci-Hub, Internet Archive e Anna’s Archive, rileva che – a suo avviso – ogni singolo atto di pirateria vada considerato ex se, escludendosi quindi un giudizio collettivo sulle violazioni commesse da Meta.
In conclusione, STM considera necessario, nel valutare la ricorrenza o meno del fair-use in questa causa, il fatto che il giudice accerti e dichiari che i contenuti utilizzati per addestrare i suoi modelli di IA siano formati in maniera massiva da materiale abusivo e, conseguentemente, egli si orienti sfavorevolmente sulla asserita ricorrenza di un legittimo uso trasformativo delle opere letterarie in questione da parte di Meta.
L‘impatto globale della controversia sull’intelligenza artificiale e diritto d’autore
Da quanto abbiamo brevemente esposto, è agevole dedurre che l”udienza del 1° maggio 2025 e le successive che eventualmente seguissero prima della decisione sul Summary Judgment chiesto da entrambe le parti nella causa fra Kadrey e Meta, potrà incidere notevolmente sul futuro del diritto d’autore a livello globale e su quello dei sistemi di intelligenza artificiale.
Le questioni che emergono da questa controversia – e dalle altre tuttora pendenti – non si limitano peraltro al contesto statunitense in cui esse si svolgono. Vi sono numerosi effetti che potrebbero derivare dalla prevalenza dell’una o dell’altra posizione, avuto riguardo ai diritti, non solo d’autore, che sono stati oggetto di attività di raccolta massiva (c.d. harvesting) da parte di Meta.
Certamente, come asseriscono in giudizio gli autori francesi che hanno condotto Meta di fronte al tribunale di Parigi, vi sono migliaia di opere di autori appartenenti all’Unione Europea i cui diritti sono stati violati, oppure non violati, se dovesse prevalere la tesi del fair-use.
E, in quest’ultimo caso, quale effetto può produrre – in linea di diritto e a livello planetario – la decisione dei giudici statunitensi ove essa stabilisca la liceità dell’appropriazione di milioni di opere protette da parte di Meta (o di altra analoga impresa) al fine di addestrare i modelli di intelligenza artificiale? In tale contesto, c’è poi da chiedersi quale reale applicazione possano trovare le norme comunitarie sulla remunerazione adeguata e proporzionata degli autori, al pari di tutte le ulteriori disposizioni che vi fanno da corollario e che sono confluite negli ordinamenti europei in base alle Direttive comunitarie e, segnatamente, alla Direttiva EU/790/2019[15].
Ci dobbiamo anche domandare, se e in che misura, l’attività trasformativa delle opere utilizzate per addestrare i modelli di IA, che è provato siano spesso rigurgitate in brani di sostanziale identità all’originale, possa essere compatibile con le disposizioni degli articoli 4, 18 e 20 della Legge Autore italiana, norme che garantiscono agli autori il diritto esclusivo di modificare o di estrapolare le loro opere, in tutto o in parte.
In un mercato, quello degli apparati di intelligenza artificiale, controllato prevalentemente dagli Stati Uniti, assente in Europa, in via di crescita in Cina, oltre a chiederci come potranno dirimersi le controversie fra titolari dei diritti dell’Unione Europea e le imprese d’oltre oceano se il fair-use dovesse travolgere le norme sul copyright, dovremmo comprendere se il sistema giuridico comunitario potrà trovare applicazione e in quale misura, per la tutela degli aventi diritto in base alle norme adottate in ogni singolo Stato unionista.
Si tratta di questioni complesse che non si possono risolvere limitando gli interventi con il riconoscimento e l’accettazione di somme di denaro erogate a titolo di corrispettivo per il danno emergente o il lucro cessante causato ai titolari dei diritti, ma di problemi seri ed urgenti che devono essere affrontati nelle sedi istituzionali per trovare soluzioni compatibili con la salvaguardia dell’intero comparto del diritto d’autore.
Note
[1] Secondo quanto affermato dai delegati degli autori francesi, questa sarebbe la prima di numerose ulteriori controversie che autori e editori francesi intendono avviare nei confronti delle altre imprese che sfruttano contenuti protetti per i loro sistemi di intelligenza artificiale.
[2] Il tema dell’equa remunerazione per gli editori dei giornali, a fronte dell’utilizzo degli snippet degli articoli da essi pubblicati, si era in passato già posto a seguito dell’intervento dell’Autorità Garante della Concorrenza francese nei confronti dell’impresa Google Inc., come illustrato in questo articolo: https://www.primaonline.it/2020/04/29/305922/le-regole-francesi-dopo-le-sanzioni-a-google-e-lobbligo-a-negoziare-con-gli-editori/
Di analoga ampiezza e di altrettanta complessità è parsa, sin dal lancio nel mercato internazionale di “Google AI Overview” un sistema di intelligenza artificiale che completa le risposte ai quesiti posti dagli utenti nelle materie di loro interesse attraverso la visualizzazione di “suggerimenti” forniti direttamente dal sistema, in tal modo ponendo problemi di coesistenza fra gli editori di giornali on-line e search engine. Sul punto, anche con il riferimento alle controversie avviate negli USA dagli editori dei giornali nei confronti dei detentori dei sistemi di IA si può leggere questo articolo:
[3] Una visione d’insieme delle principali questioni afferenti alla materia è stata riportata qui: https://www.agendadigitale.eu/mercati-digitali/fair-use-nellera-dellai-il-caso-meta-e-il-futuro-del-diritto-dautore-digitale/
[4] Si tratta della causa No. 3:23-cv-03417-VC-TSH, nel corso della quale, il 24 marzo 2025, la convenuta Meta Platforms Inc. ha depositato al giudice un’istanza recante: (1) Notice of Motion and Motion for Partial Summary Judgment; and (2) Opposition to Plaintiffs’ Motion for Partial Summary Judgment.
Per una sintesi del contenzioso in argomento precedente la data sopra ricordata, si può leggere questo articolo: https://www.agendadigitale.eu/mercati-digitali/fair-use-nellera-dellai-il-caso-meta-e-il-futuro-del-diritto-dautore-digitale/
[5] L’affermazione è riportata a pag. 16 alinea 10 dell’atto in argomento. Essa va ovviamente letta nel contesto dell’intero ragionamento svolto dai legali di Meta.
[6] Si è in altra occasione osservato che negli Stati Uniti il giudice, nel valutare la sussistenza o meno del “fair-use” nell’utilizzazione da parte di taluno di un’opera altrui, deve prendere in considerazione quattro elementi: a) la finalità e la tipologia dell’impiego; b) la natura dell’opera tutelata (opera figurativa, fotografia, filmato, testo letterario o altro); c) la porzione dell’opera che viene utilizzata; d) l’effetto dell’utilizzazione sul mercato cui l’opera tutelata è destinato. Questi concetti vengono applicati con molta flessibilità dai giudici statunitensi. Qui il brano da cui si è tratto questo riferimento: https://www.agendadigitale.eu/mercati-digitali/le-opere-creative-dellia-gli-esiti-del-confronto-fra-copyright-e-diritto-dautore/
[7] Così a pagina 13 alinea 10 della memoria depositata da Meta il 24 marzo 2025 nella causa contro Richard Kadrey et al. Una affermazione analoga è riportata a pagina 13 alinea 26 del medesimo atto, dove i legali di Meta scrivono testualmente: “Meta non mette in discussione il fatto di avere copiato i dataset che contengono le opere degli attori per addestrare LLAMA. Ma tale copia è la quintessenza del fair-use – non una violazione dei diritti altrui”. Questa affermazione è stata ripresa dalla società Anthropic PCB nella causa avviata il 19 agosto 2024 da alcuni autori e giornalisti (fra i quali vi è Andrea Bartz, autrice di libri thriller). Nel corso del giudizio pendente di fronte alla Corte del Northern District della California, Distretto di San Francisco, Anthropic dichiara nel suo atto del 27 marzo 2025 che il suo sistema di IA denominato “Claude” rappresenti legittimo esercizio del fair-use, non essendo possibile – a suo avviso e fra l’altro – creare i dataset necessari per addestrare i modelli di IA attraverso accordi di licenza con i titolari dei diritti (pagg. 17 e 18).
[8] La spiegazione delle dinamiche che muovono le imprese statunitensi nell’ambito dell’intelligenza artificiale è stata affrontata in questo pezzo: https://www.agendadigitale.eu/cultura-digitale/ai-e-diritto-dautore-un-dilemma-giuridico-contemporaneo/
[9] L’istituto giuridico in questione ha qualche similarità con il nostro intervento “ad adiuvandum” o adesivo dipendente nel processo civile (art. 105, secondo comma, c.p.c.), in quanto le parti che supportano uno dei contendenti non possono proporre domande nuove o fare valere diritti propri. Di particolare interesse in proposito è stata la recente introduzione (22 luglio 2021) di un articolo 6 (in precedenza 4-ter) in seno alle “Norme integrative per i giudizi davanti alla Corte costituzionale”, il quale definisce gli “Amici curiae” come “formazioni sociali senza scopo di lucro e i soggetti istituzionali, portatori di interessi collettivi o diffusi attinenti alla questione di costituzionalità“. Questi soggetti possono presentare alla Corte costituzionale opinioni scritte nel termine di venti giorni dalla pubblicazione della decisione di rimessione o di fissazione dell’udienza, senza però assumere la qualità di parte nel giudizio. Si veda il relativo testo qui: https://www.cortecostituzionale.it/documenti/download/pdf/Norme_integrative_2021.pdf
[10] Questo è quanto riporta Wikipedia circa l’attività della E.E.F.: “L’Electronic Frontier Foundation (EFF) è un’organizzazione internazionale americana senza scopo di lucro per la tutela dei diritti digitali con sede a San Francisco, California. È stata fondata nel 1990 per promuovere le libertà civili di Internet.
Fornisce fondi per la difesa legale in tribunale, presenta memorie di amicus curiae, difende individui e nuove tecnologie da quelle che considera minacce legali abusive, si impegna a denunciare gli abusi governativi, fornisce consulenza al governo e ai tribunali, organizza azioni politiche e mailing di massa, sostiene alcune nuove tecnologie che ritiene preservino le libertà personali e le libertà civili online, gestisce un database e siti web di notizie e informazioni correlate, monitora e contesta potenziali leggi che ritiene possano violare le libertà personali e il fair use, e favorisce la predisposizione di un elenco di quelli che considera brevetti abusivi con l’intento di contrastare la validità di quelli che ritiene non validi.
[11] Il seguente articolo illustra con chiarezza i punti principali della sentenza Warhol: https://www.agendadigitale.eu/cultura-digitale/fair-use-diritto-dautore-e-ia-gli-effetti-della-sentenza-warhol-goldsmith/
[12] Si tratta dei seguenti docenti universitari statunitensi: Matthew Sag, Zahr K. Said, Jessica Silbey, Rebecca Tushnet
[13] La Copyright Alliance è stata fondata nell’anno 2007. Secondo quanto riporta Wikipedia, “i membri istituzionali della Copyright Alliance includono oltre sessanta organizzazioni di categoria, associazioni, sindacati, aziende e corporazioni, che rappresentano milioni di singoli creatori. La Copyright Alliance collabora direttamente con e rappresenta oltre ventitremila creativi e piccole imprese. Le industrie creative rappresentate includono scrittori, compositori, artisti discografici, giornalisti, documentaristi, registi, grafici, artisti visivi, fotografi, autori, sviluppatori di software e numerosi altri generi di creativi”.
[14] Da Wikipedia: “L’Associazione Internazionale degli Editori Scientifici, Tecnici e Medici (STM), nota in breve con le iniziali dell’ultima parte della sua denominazione, è un’associazione commerciale internazionale organizzata e gestita a beneficio degli editori accademici, scientifici, tecnici, medici e professionisti. Fu concepita come Gruppo STM alla Fiera del Libro di Francoforte del 1969, in seguito alle discussioni svoltesi durante la riunione del 1968 dell’Associazione Internazionale degli Editori. Assunse il suo nome attuale e fu registrata ad Amsterdam come fondazione nel 1994”.
[15] Nel senso del riconoscimento di una remunerazione separata, commisurata ai ricavi derivanti dallo sfruttamento delle opere attraverso la loro riproduzione e diffusione, ha statuito il Tribunale di Roma, Sez. XIX, con la Sentenza 11706/2022. Il giudice ha proceduto ad una accurata applicazione dell’art. 107 LDA e dell’art. 18 della Direttiva DSM.