“AI is the first technology that is challenging what we thought belonged only to us – creativity” (“L’intelligenza artificiale è la prima tecnologia che sta sfidando ciò che pensavamo appartenesse solo a noi: la creatività”). Così ha dichiarato il membro del Parlamento europeo Dragos Tudorache durante i mesi di lavoro quale co-rapporteur (insieme al collega Brando Benifei) sulla proposta di regolamento europeo sull’intelligenza artificiale (il futuro “AI Act”)[1].
Detta affermazione esprime bene la preoccupazione generale di fronte alla disponibilità sul mercato di sistemi di IA generativa, quali ChatGPT, Midjourney, Stable Diffusion, Dall-E o MusicGen, e all’utilizzo massiccio che gli stessi compiono, a monte, e quali dati per analisi e/o auto-addestramento, di tutto e/o parte di opere e materiali protetti da diritti di autore e/o diritti connessi (collettivamente “diritti IP”), al fine di generare o assistere nel generare, in base a prompt e, a valle, contenuti in cui l’apporto creativo umano (per il momento ancora necessario per la tutela autorale) è tutto da verificare.
I sistemi di IA generativa secondo la bozza europarlamentare di AI Act
Nella propria seduta plenaria del 14 giugno scorso, il Parlamento europeo ha approvato la propria posizione negoziale sulla proposta di AI Act, inserendovi proprio alcune regole sui sistemi di IA generativa. In particolare, la bozza parlamentare dell’AI Act definisce i sistemi di IA generativa come sistemi di IA (contenenti o trasformati da modelli di base) “destinati espressamente a generare, con diversi livelli di autonomia, contenuti quali testi complessi, immagini, audio o video”[2] e assoggetta i loro fornitori a determinati obblighi di trasparenza e di garanzia, incluso riguardo ai dati protetti da diritti IP utilizzati.[3] Al contempo, la medesima bozza tiene espressamente ferma la normativa comunitaria in materia di diritti IP, inclusa la direttiva Infosoc 2001/29/CE e la direttiva DSM (UE) 2019/790[4], chiarendo che il futuro AI Act non dovrà pregiudicare la sua applicazione.
I sistemi di IA Generativa a monte: l’eccezione di ETD per scopi diversi dalla ricerca scientifica
Per poter generare contenuti, i sistemi di IA generativa svolgono operazioni di accesso (spesso mediante web scraping), raccolta, memorizzazione e auto-addestramento in relazione a opere e materiali protetti da diritti IP e ai dati estratti dagli stessi.
Al fine di incoraggiare l’innovazione tecnologica, anche nello sviluppo di sistemi di IA, e di favorire una maggiore certezza giuridica nella gestione da parte degli utilizzatori delle attività di estrazione e analisi di grandi quantità di dati fuori da un contesto di ricerca scientifica[5], la direttiva DSM (UE) 2019/790 ha introdotto, al suo articolo 4, un’eccezione obbligatoria ai diritti IP per le riproduzioni ed estrazioni da opere e altri materiali protetti (specialmente banche dati) effettuate da qualsivoglia soggetto privato o pubblico al fine di estrarre testi e dati, anche per scopi commerciali e di lucro, prevedendo altresì la facoltà di conservare le copie e gli estratti realizzati per il tempo necessario al completamento di dette operazioni (l’ “Eccezione di ETD”). Detta Eccezione di ETD è stata recepita nel nostro ordinamento dall’articolo 70quater della legge n. 633 del 22.4.1941 (la “LDA”).
L’Eccezione di ETD è applicabile:
- sul presupposto che l’utilizzatore abbia accesso legittimo alle opere o ai materiali oggetto di riproduzione ed estrazione;
- purché la conservazione delle copie ed estratti di tali opere e materiali perduri solo per il tempo necessario all’espletamento delle operazioni di estrazione di testo e di dati;
- sempre a condizione che non sia stata espressa (la direttiva DSM (UE) 2019/790 richiede “in modo appropriato”, ma tale inciso è stato ignorato dal legislatore italiano) alcuna riserva sull’utilizzo delle opere e dei materiali da parte dei titolari di diritti IP (cd. “opting out”).
I titolari di diritti IP hanno dunque la facoltà, esercitabile con modalità e in forme idonee, di prevenire l’applicazione dell’Eccezione di ETD. Si badi che, nell’ipotesi di contenuti resi pubblicamente disponibili online, detta riserva dovrà essere resa intellegibile attraverso mezzi di lettura automatizzata.
La previsione di un limite temporale per la memorizzazione e archiviazione di copie ed estratti di opere e materiali protetti strettamente correlato alla tempistica delle operazioni di estrazione di testi e dati dagli stessi suscita alcune perplessità rispetto alle funzioni di auto-addestramento tipiche dei sistemi di IA generativa.
Si è discusso se dette operazioni di auto-addestramento rientrino nella nozione di estrazione di testi e dati, definita dall’articolo 2, numero 2) della direttiva DSM (UE) 2019/790 (e dall’articolo 70ter della LDA) come “qualsiasi tecnica di analisi automatizzata volta ad analizzare testi e dati in formato digitale avente lo scopo di generare informazioni […]” e siano quindi consentite ai sensi dell’Eccezione di ETD.
Considerato che è improbabile che un’operazione di auto-addestramento del sistema di IA generativa prescinda da una alimentazione costante e da una “tecnica di analisi automatizzata” di testi e dati allo scopo di generare nuovi contenuti, si dovrebbe ragionevolmente concludere che le operazioni di auto-addestramento siano qualificabili come estrazione di testi e dati e coperte dall’Eccezione di ETD; con la conseguenza ulteriore che la conservazione delle copie e degli estratti di opere e materiali protetti deve ritenersi ammissibile fintanto che sia funzionale al sistema di IA generativa per il suo auto-addestramento.
Ci si chiede, inoltre, se i nuovi obblighi, previsti nella attuale formulazione dell’AI Act a carico dei fornitori di modelli di base di sistemi di IA generativa e che richiedono attività di analisi e verifica o informative sulle operazioni di auto-addestramento, non creino ulteriori difficoltà applicative della limitazione temporale sopra citata. Si pensi, in particolare, all’obbligo di sviluppare e addestrare (con continuità) modelli di base di sistemi di IA generativa implementando garanzie contro la generazione di contenuti che violano il diritto dell’Unione, inclusi i diritti IP, oppure all’obbligo di documentare e mettere a disposizione del pubblico una sintesi (aggiornabile) sufficientemente dettagliata dell’uso dei dati protetti da diritti IP a fini di auto-addestramento del sistema di IA generativa.
I sistemi di IA generativa a valle: il sampling
Il cosiddetto sampling o campionamento, originariamente tipico del campo musicale, consiste nel prelievo e nel riutilizzo, manipolativo o meno, di un campione o di un estratto di una registrazione fono/videografica preesistente (e dell’opera musicale, visiva e/o audiovisiva sottostante) in altra registrazione fono/videografica (e altra opera musicale, visiva e/o audiovisiva sottostante).
La Corte di Giustizia dell’Unione Europea (“CGUE”) ha affrontato la questione del sampling musicale nel 2019, nella causa Pelham / Metall auf Metall, che per anni aveva contrapposto i produttori musicali e cd. sampler Pelham ai membri del gruppo Kraftwerk per l’utilizzo di due secondi della registrazione fonografica di questi ultimi.[6]
In quell’occasione, la Corte ha chiarito che il sampling possa, a certe condizioni, prescindere dal consenso dell’avente diritto IP sulla registrazione campionata ed essere lecito:
- da un lato, in conseguenza dell’operatività di una delle eccezioni ai diritti IP previste dall’articolo 5 della direttiva Infosoc 2001/29/CE e, nella specie, dell’eccezione di citazione prevista dalla lettera d) del comma 3 della norma citata (e in Italia, in via generale, dall’articolo 70 della LDA), ma esclusivamente a condizione che la nuova registrazione che citi il campione sonoro (e la parte di opera musicale sottostante) sia capace di instaurare un rapporto di dialogo e di interazione, anche in chiave di critica o di discussione e persino in termini di appropriazione puramente illustrativa, con la registrazione preesistente (e l’opera musicale sottostante) dalla quale è stato prelevato il campione citato, il quale deve conseguentemente e giocoforza essere riconoscibile nella nuova registrazione e quindi utilizzato senza modifiche sostanziali;
- d’altro lato, in ragione della libertà delle arti, a sua volta specie del più ampio genere della libertà di espressione, come tutelata dalla Carta dei Diritti Fondamentali dell’Unione Europea[7] (la “Carta”), ma soltanto nel caso l’estratto sonoro campionato sia stato modificato in maniera tale da non essere più riconoscibile all’ascolto della nuova registrazione che lo contiene, costituendo la riconoscibilità del campione presupposto necessario della sua illecita riproduzione.
In altre parole, il campionamento che, ancorché modifichi il breve estratto campionato, consenta che quest’ultimo rimanga riconoscibile all’orecchio dell’ascoltatore della nuova registrazione costituisce contraffazione (se non addirittura plagio-contraffazione) della registrazione campionata.
La decisione della CGUE nella causa Pelham ha una portata applicativa più ampia rispetto al solo sampling musicale. Nella stessa vengono infatti confermati e in certa misura ampliati ratio, principi e regole interpretativi delle eccezioni ai diritti IP già affermati in altri casi di utilizzo appropriativo di parte di opere e materiali protetti preesistenti[8]: da un lato, in considerazione della necessità di garantire una uniformità applicativa dell’acquis di diritto IP europeo; d’altro lato, in ragione della natura autonoma di diritto dell’Unione (non passibile di varianti nazionali interpretative confliggenti con quella europea), di ciascuna nozione prevista in disposizioni di direttive europee in materia di diritti IP e/o della Carta che, pur non offrendone apposita definizione, non rimandino al diritto nazionale, inclusa la nozione europea di citazione ai sensi dell’articolo 5, comma 3, lettera d) della direttiva Infosoc 2001/29/CE[9].
Le conclusioni della CGUE nella causa Pelham diventano quindi rilevanti per valutare, in assenza di consenso da parte degli aventi diritto IP, la liceità di contenuti generati dai sistemi di IA generativa che incorporino non solo campioni sonori, video e/o audiovisivi protetti, ma più in generale qualsiasi parte di opera e/o materiale, anche visiva/o e/o testuale, protetta/o[10]. Tutte le volte che gli elementi preesistenti siano riconoscibili nel contenuto generato dai sistemi di IA generativa, il loro utilizzo sarà illecito a meno che non possa trovare applicazione una eccezione ai diritti di IP, compresa l’eccezione di citazione. Viceversa, ogni qualvolta gli elementi preesistenti protetti incorporati nei contenuti generati dai sistemi di IA generativa siano stati modificati al punto dal diventare non identificabili, non potrà concretizzarsi alcuna loro illecita riproduzione.
I sistemi di IA generativa a valle: il pastiche
In forza dell’articolo 17, comma 7 della direttiva DSM (UE) 2019/790 (come attuato dall’articolo 102nonies della LDA) le eccezioni facoltative di citazione, parodia, caricatura e pastiche ai diritti IP di cui all’articolo 5, comma 3, lettere d) e k) della direttiva Infosoc 2001/29/CE sono diventate obbligatorie con riferimento ai contenuti generati da utenti e caricati su piattaforme di condivisione. Le eccezioni di citazione, parodia e caricatura erano già previste, in via generale, dall’art. 70 della LDA. L’articolo 102nonies della LDA ha invece introdotto espressamente nel nostro ordinamento l’eccezione di pastiche.
Con le sentenze menzionate al precedente punto 3 e la sentenza nella causa Deckmyn[11], la CGUE si è pronunciata sulle eccezioni e sulle nozioni europee di citazione e di parodia. Nessuna pronuncia europea è invece stata ancora resa al fine di chiarire la nozione europea di pastiche.
Il significato della nozione di pastiche utile a determinare la portata dell’eccezione relativa va dunque ricercato in base al significato abituale del termine nel linguaggio corrente e tenendo conto degli obiettivi della norma nel quale lo stesso è inserito. Secondo le definizioni offerte da diversi vocabolari e da un interessante studio tedesco sull’accezione di pastiche[12], quest’ultimo dovrebbe essere inteso come un artefatto, in qualsiasi forma, che costituisce composizione (o, appunto, pasticcio) di elementi o parti di opere e/o materiali preesistenti riconoscibili, intellettualmente o esteticamente distinta dagli stessi in quanto frutto di un processo trasformativo che ne muti il significato semantico oppure la forma espressiva. Alcuni esempi di potenziali pastiche sono i collage, i mash-up e i meme.
Alla luce della definizione proposta e al pari della citazione e della parodia, il pastiche sembra dunque ragionevolmente richiedere una dialettica intellettuale con l’opera o il materiale protetta/o utilizzata/o, che deve necessariamente essere identificabile. Diversamente dalla citazione, il pastiche pare invece presupporre un utilizzo necessariamente trasformativo degli elementi protetti preesistenti. Infine, per distinguersi dalla parodia, come definita a livello europeo, il pastiche sembra esigere un processo trasformativo degli elementi protetti preesistenti diverso da quello prettamente a fine umoristico o canzonatorio.
Allo stato attuale, la definizione di pastiche appena proposta diventa rilevante per valutare, sempre in assenza di autorizzazione da parte dei titolari di diritti IP, la liceità non di tutti gli output dei sistemi di IA generativa che appaiano come pastiche, ma soltanto di quelli che siano poi disseminati sulle piattaforme di condivisione (così come previsto dalla direttiva DSM (UE) 2019/790 e dall’articolo 102nonies della LDA).
Conclusioni
La sfida posta dai sistemi di IA generativa (a monte e a valle) all’attuale regime di protezione della creatività umana e a un costante ed equilibrato bilanciamento tra i diritti IP relativi a opere e materiali protetti utilizzati dai sistemi di IA generativa e le eccezioni ai medesimi diritti IP comprese nell’acquis comunitario e/o i diritti fondamentali garantiti dalla Carta, quali la libertà di espressione, finirà per essere affrontata dai tribunali europei, caso per caso e alla luce del futuro AI Act.
Note
[1] Proposta di regolamento del Parlamento europeo e del Consiglio che stabilisce regole armonizzate sull’intelligenza artificiale (legge sull’intelligenza artificiale) e modifica alcuni atti legislativi dell’unione COM(2021)206 final del 21.4.2021.
[2] Si veda l’articolo 28ter, comma 4 del testo italiano P9_TA (2023)0236 degli Emendamenti del Parlamento europeo, approvati il 14 giugno 2023 alla proposta di regolamento del Parlamento europeo e del Consiglio che stabilisce regole armonizzate sull’intelligenza artificiale (legge sull’intelligenza artificiale) e modifica alcuni atti legislativi dell’Unione (COM(2021)0206 – C9-0146/2021 – 2021/0106(COD))
[3] Si vedano l’articolo 28ter, comma 4 e 52, commi 1, 3 e 3bis del testo parlamentare citato alla precedente nota 2.
[4] Si vedano il considerando 28bis, il considerando 60nonies, l’articolo 5, comma 1bis e l’articolo 28ter, comma 4 del testo parlamentare citato alla precedente nota 2.
[5] L’estrazione di testi e dati per fini di ricerca scientifica è regolata dall’articolo 3 della direttiva DSM (UE) 2019/790.
[6] Sentenza della Grande Sezione della CGUE del 29.7.2019 nella causa C‑476/17, Pelham GmbH e a. contro Ralf Hütter e Florian Schneider-Esleben.
[7] Carta dei Diritti Fondamentali dell’Unione Europea (2016/C 202/02).
[8] Si vedano la sentenza della Grande Sezione della CGUE del 29.7.2019 nella causa C-469/17, Funke Medien NRW GmbH contro Bundesrepublik Deutschland; la sentenza della Grande Sezione della CGUE del 29.7.2019 nella causa C-516/17, Spiegel Online GmbH contro Volker Beck; la sentenza della Grande Sezione della CGUE del 3.9.2014 nella causa C-201/13, Johan Deckmyn e Vrijheidsfonds VZW contro Helena Vandersteen e a.; la sentenza della Terza Camera della CGUE del 21.10.2010 nella causa C-467/08, Padawan SL contro Sociedad General de Autores y Editores de Espana (SGAE).
[9] Sul punto, si vedano i §§ da 67 a 73 della sentenza citata alla nota 5 e il § 76 delle conclusioni dell’Avvocato Generale Spuznar presentate nella causa stessa il 12.12.2018, nel quale si legge che “In secondo luogo, le nozioni utilizzate nelle disposizioni della direttiva 2001/29 sono nozioni autonome del diritto dell’Unione, che non rinviano alla normativa degli Stati membri. È questo in particolare il caso della nozione di «riproduzione» ai sensi dell’articolo 2 di tale direttiva. È altresì il caso delle nozioni che definiscono le differenti eccezioni e limitazioni ai diritti esclusivi disciplinati dalla direttiva 2001/29, in particolare la nozione di «parodia» utilizzata all’articolo 5, paragrafo 3, lettera k), della direttiva in parola. Lo stesso vale per quanto concerne la nozione di «citazione» ai sensi dell’articolo 5, paragrafo 3, lettera d), di detta direttiva.”
[10] Sul punto si veda anche la sentenza della Quarta Sezione della CGUE del 16.7.2009 nella causa C-5/08, Infopaq International A/S contro Danske Dagblades Forening.
[11] Sentenza della Grande Sezione della CGUE del 3.9.2014 nella causa C-201/13, Johan Deckmyn e Vrijheidsfonds VZW contro Helena Vandersteen e a.
[12] Si veda Till Keutzer, “The Pastiche in Copyright Law – Expert opinion on a copyright-specific definition of pastiche according to sec. 51A German Copyright Act [URHG)”, Gesellschaft Fur Freiheitsrechte e.V., 5.9.2022