Consiglio UE

AI Act e copyright, il compromesso della presidenza spagnola: le regole

Abbiamo letto l’ultimo testo AI Act. L’estrazione di testo e di dati deve essere consentito sul materiale cui l’utilizzatore abbia legittimo accesso, purché il titolare dei diritti non si sia riservato di non consentirne l’uso da parte di terzi anche attraverso misure tecnologiche di protezione. Ecco conseguenze e problemi di queste disposizioni

Pubblicato il 4 dic 2023

Aggiungi tra i preferiti su Google

Luciano Daffarra

C-Lex Studio Legale

Chiedi all'AI

Riassumi questo articolo

Approfondisci con altre fonti

La presidenza spagnola del Consiglio d’Europa ha proposto un compromesso per risolvere i nodi dell’IA Act e al momento sembra il solo possibile, in vista del trilogo del 6 dicembre (leggi qui il documento).

Agendadigitale.eu ha potuto leggerlo. Titolo, “Proposta di regolamento del Parlamento europeo e del Consiglio, che stabilisce norme armonizzate sull’intelligenza artificiale che modifica alcuni atti legislativi dell’Unione”. Se ne parlerà al trilogo, quindi, ossia al confronto fra i rappresentanti del Parlamento, del Consiglio e della Commissione europei sul tema del sopra ricordato Regolamento[1] Ai Act.

Tra l’altro, il compromesso riapre al punto 5 dell’allegato II, il tema degli “obblighi di sostegno alle azioni a tutela del diritto d’autore”.

Scorza: “AI Act è a rischio, ecco le regole che servono “

Indice degli argomenti

Diritto d’autore nell’ultimo testo dell’AI Act (compromesso della presidenza)

Si tratta di una questione quella della difesa del diritto d’autore nel contesto dei sistemi di IA che l’Unione Europea, dopo un periodo iniziale in cui aveva caldeggiato, con la Risoluzione del 16 febbraio 2017[2], l’introduzione di norme volte a conferire alla materia l’“elevato livello di protezione della proprietà intellettuale” voluto sia dalle Direttive Copyright (2001/29/CE) e DSM (EU/2019/790), che da una costante linea di giudizio della Corte di Giustizia, aveva di fatto accantonato.

Invero, la proposta di Regolamento presentata il 21 aprile 2021 dalla Commissione Europea per l’approvazione della “legge sull’intelligenza artificiale”[3] riporta la parola “diritti d’autore” una sola volta nelle 69 fitte pagine in cui si articola.

Tale termine è presente al par. 1.1, il quale fa riferimento a una nota che conduce a quanto stabilito dalla Risoluzione del Parlamento Europeo del 20 ottobre 2020, recante raccomandazioni alla Commissione sul quadro normativo in tema di sistemi di intelligenza artificiale. Anche in tale atto di indirizzo il tema del diritto d’autore appare del tutto trascurato[4].

In tal senso si può affermare che, se non si fosse approvato l’emendamento n. 399 durante la sessione finale di voto al Parlamento Europeo del 14 giugno 2023, che ha introdotto nel testo della proposta di Regolamento un nuovo art. 28 b),[5] il diritto d’autore non sarebbe stato preso in considerazione nell’acquis communautaire di un settore di fondamentale importanza per il futuro economico e sociale del mondo, quello dell’intelligenza artificiale.

Se è vero, poi, che la classificazione dei sistemi di IA, identificati dal documento della presidenza del Consiglio d’Europa come ad “alto rischio”, include quegli apparati che effettuano un trattamento massivo e privo di consenso – sia in fase di test, che dopo l’autorizzazione all’impiego dei “foundation models” – dei dati personali anche biometrici degli utenti, tale strumento non è esaustivo dei molti problemi che l’utilizzazione di questa tecnologia comporta.

Anche l’intento di prevenire la raccolta indiscriminata di immagini facciali e di banche di dati che consentono il riconoscimento dei volti, al fine di assicurare trasparenza nell’uso dei sistemi informatici che sono mossi da sistemi di intelligenza artificiale, seppure tale proposito inserito nel “trilogo” si dovesse risolvere in veri e propri divieti vincolanti, esso non pare sufficiente ed esaustivo dei limiti da porre all’impiego dei contenuti protetti in seno ai motori di intelligenza artificiale.

Risulta infatti ampiamente provato che, nel paese che ad oggi ha sviluppato e resi disponibili apparati di IA capaci di soddisfare le esigenze degli utenti, gli Stati Uniti d’America, siano pendenti numerose controversie riguardanti la violazione dei diritti d’autore[6] commesse a danno dei titolari delle opere utilizzate per esercitare i motori di IA e che il loro esito – ove legittimasse l’appropriazione dei dati da parte delle imprese che sviluppano questa nuova tecnologia – potrebbe fortemente compromettere la difesa di autori, editori e produttori, mettendo a repentaglio i ricavi di un intero settore della cultura, dell’entertainment e del lavoro subordinato (si pensi agli sceneggiatori e ai doppiatori”)[7].

Ora, se è vero, come è stato rilevato al par. 5 del già citato documento del 17 ottobre 2023, che la Direttiva EU/2019/790 sul diritto d’autore nel mercato unico dell’Unione Europea[8] prevede già che i titolari dei diritti possano rinunciare alla propria esclusiva sui contenuti utilizzati per l’addestramento dei “foundation models” (c.d. eccezione “Text and Data Mining” o “estrazione di testo e di dati”), tale affermazione non implica la sussistenza attuale di previsioni che garantiscano una licenza obbligatoria a favore dei soggetti che effettuano test per l’implementazione degli apparati di IA.

Su questo punto va osservato che la Direttiva DSM, ai recital n. 5) e n. 8)[9] nell’asserire che l’estrazione di testo e di dati [10] permette l’elaborazione di un gran numero di informazioni ai fini dell’acquisizione di nuove conoscenze e della rilevazione di nuove tendenze, potendo quindi arrecare beneficio alla comunità della ricerca sostenendo l’innovazione, intende sicuramente fare riferimento all’utilizzazione dei c.d. “big data” attraverso i sistemi di intelligenza artificiale. Tale circostanza, ad avviso di chi scrive, non può tradire il contenuto delle norme e dei principi regolatori del diritto d’autore in questo contesto.

Invero, le disposizioni di riferimento della Direttiva DSM richiamate in sede di “trilogo” per la regolamentazione del settore dell’IA sono riferite alle estrazioni di testo e di dati riguardano “le riproduzioni e le estrazioni effettuate da opere o altri materiali cui si abbia legalmente accesso”.

Tali atti di riproduzione e di utilizzazione possono essere compiuti anche da soggetti privati (cioè fuori dai casi che sono regolati dall’art. 3 della Direttiva e riguardano gli organismi di ricerca e gli istituti di tutela del patrimonio culturale), a condizione che l’utilizzo delle opere e di altri materiali “non sia stato espressamente riservato dai titolari dei diritti in modo appropriato, ad esempio attraverso strumenti che consentano lettura automatizzata in caso di contenuti resi pubblicamente disponibili online per il tempo necessario ai fini dell’estrazione di testo e di dati” (art. 4 della Direttiva).

Questa eccezione non può quindi trascendere la parte dispositiva del provvedimento comunitario anche se l’estrazione di dati avvenga per le finalità evidenziate al recital n. 18) e cioè “per lo sviluppo di nuove applicazioni e tecnologie” ovvero per “l’analisi di grandi quantità di dati”.

La volontà del legislatore è chiara: l’estrazione di testo e di dati deve essere consentito sul materiale cui l’utilizzatore abbia legittimo accesso, purché il titolare dei diritti non si sia riservato di non consentirne l’uso da parte di terzi e ciò abbia fatto anche attraverso l’applicazione alle opere di misure tecnologiche di protezione.

Il confronto con le norme italiane

La situazione non pare diversa se riguardata sotto il profilo delle norme nazionali vigenti in materia. L’art. 70-ter della Legge Autore, nel definire il significato e l’ampiezza dei termini “organismi di ricerca” e “istituti di tutela del patrimonio culturale” (commi 3 e 4) precisa altresì al comma 4 che tali estrazioni non possano avvenire per scopo di lucro, dovendo perseguire un interesse pubblico di uno degli stati membri dell’UE.

I soggetti sopra indicati, aventi titolo a svolgere le attività di estrazione dei dati senza obbligo di un’apposita licenza hanno altresì il diritto di “effettuare la comunicazione al pubblico degli esiti della ricerca ove espressi in nuove opere originali”.

In questo caso ci troviamo di fronte a regole che si giustificano solo ed esclusivamente in quanto riferite a enti che svolgono una funzione squisitamente di interesse pubblico, lontane da usi commerciali o scopo di lucro.

Per quanto concerne tutti gli enti diversi da quelli di cui all’art. 70-ter, la legge – al successivo art. 70-quater – stabilisce al comma 1 che “sono consentite le riproduzioni e le estrazioni da opere o da altri materiali contenuti in reti o in banche di dati cui si ha legittimamente accesso ai fini dell’estrazione di testo e di dati. L’estrazione di testo e di dati è consentita quando l’utilizzo delle opere e degli altri materiali non è stato espressamente riservato dai titolari del diritto d’autore e dei diritti connessi nonché dai titolari delle banche dati.” Al comma 2, la stessa norma precisa che “le riproduzioni e le estrazioni eseguite ai sensi del comma 1 possono essere conservate solo per il tempo necessario ai fini dell’estrazione di testo e di dati”.

Di conseguenza, le limitazioni imposte dalle norme comunitarie e interne dei paesi dell’UE non consentono, né lo potrebbero alla stregua dei trattati internazionali in materia di diritto d’autore, un’interpretazione differente da quella per cui, da un lato, le misure tecnologiche di protezione[11] non sono necessarie per la riserva dei diritti da parte del titolare dei dati che vengono estratti[12] e, dall’altro, l’accesso a tali dati debba essere legittimo, non potendo quindi avvenire rimuovendo o aggirando le misure tecnologiche di protezione eventualmente applicate sui contenuti dal titolare dei diritti. Inoltre, l’estrazione deve avvenire per un tempo limitato e non può permanere indeterminatamente nella memoria degli apparati di intelligenza artificiale.

Le notazioni appena svolte devono essere corredate da un’ulteriore riflessione. Se nell’indicare la fonte dei contenuti protetti ai quali viene consentito l’uso ai motori di IA, ci riferiamo ai c.d. “big data”, dobbiamo quindi ipotizzare che l’estrazione di testo e di dati debba principalmente riguardare le banche di dati rientranti fra quelle di cui all’art. 102-bis della Legge Autore, con esclusione quindi di quelle composte da opere protette di cui all’art. 2, punto 9) della medesima normativa.

Che cosa dovranno fare le aziende per il training con l’IA

Sulla scorta di tali considerazioni, chi accede o vuole effettuare un’estrazione o un reimpiego di una parte sostanziale della banca di dati di cui sia titolare il costitutore, dovrebbe rispettare le disposizioni che lo obbligano a utilizzare una “parte non sostanziale” dell’intero compendio e ad astenersi dal compiere “operazioni che siano in contrasto con la normale gestione della banca di dati o che arrechino un ingiustificato pregiudizio al costitutore della banca di dati”.

Ritenendo, invece, che l’eccezione di cui all’art. 70-quater L.A. consenta a un’impresa operante sul mercato dell’IA di utilizzare il contenuto delle banche di dati senza l’autorizzazione espressa dei rispettivi titolari, le limitazioni imposte dalla legge (e dalla Direttiva 96/9/CE dell’11 marzo 1996 nel testo vigente) si dovrebbero considerare derogate, non senza suscitare perplessità negli esperti della materia. Non diverso è il punto che concerne l’acquisizione dei materiali disponibili sulla rete.

Le perplessità degli esperti: i nodi dell’AI act nel copyright

L’intera questione che viene qui affrontata si complica notevolmente se pensiamo che l’utilizzazione dei dati e dei testi estratti per il reimpiego, va a sviluppare nuove tecnologie e, segnatamente, quella dei motori di intelligenza artificiale senza che se ne conoscano a fondo tutte le implicazioni, così come vuole il documento posto all’attenzione dei partecipanti al “trilogo” sul Regolamento di armonizzazione in materia.

Nell’esprimere queste preoccupazioni, si osserva poi che il training e la stessa attuazione pratica dei modelli su cui si fonda il funzionamento dei servizi di IA non risulta privo di problemi apparenti.

Secondo quanto emerge dall’esame degli atti delle cause più significative pendenti di fronte alle Corti statunitensi nella materia in questione, alcuni degli apparati di IA più utilizzati negli Stati Uniti, svolgono un’attività massiccia di scraping, cioè una raccolta indiscriminata di contenuti di numerose banche di dati e di siti web, senza l’osservanza dei diritti d’autore che insistono su di esse.

Scorza: “Dati pescati a strascico dall’intelligenza artificiale, perché la nostra indagine”

Fra i materiali collazionati nell’ambito di questa sorta di “pesca a strascico”, vi sarebbero anche quelli riprodotti su alcuni siti web che mettono a disposizione del pubblico contenuti oggetto di atti di pirateria, ovvero copie illegittime di libri e di altre opere protette che vengono impiegate per “allenare” i sistemi di IA[13].

Di questo fatto sembra che i delegati delle istituzioni comunitarie siano consapevoli, atteso che fra i punti più rilevanti dell’atto discusso e sviluppato in seno alla presidenza del Consiglio d’Europa, oltre a quello che abbiamo visto riguardare gli aspetti normativi che consentirebbero l’accesso ai contenuti protetti in base alle norme della Direttiva DSM, ve n’è un ulteriore che è stato evidenziato dagli estensori della bozza.

Tale passaggio dell’atto comunitario indica che la normativa europea sull’intelligenza artificiale dovrebbe dotarsi di disposizioni che facilitano l’applicazione delle norme sul diritto d’autore già nel contesto dei “foundation models”, imponendo ai fornitori dei servizi di IA di dimostrare di avere adottato misure adeguate a garantire che i loro modelli ricevano una formazione conforme alla normativa dell’Unione Europea sul diritto d’autore, in particolare rispettando la rinuncia all’eccezione sull’estrazione di testo e di dati.

Inoltre, i fornitori dei “foundation models” dovrebbero rendere disponibile al pubblico una sintesi sufficientemente dettagliata dei contenuti utilizzati per la formazione dei loro apparati di IA oltre a dare informazioni sulle loro politiche di gestione degli aspetti legati al diritto d’autore.

Queste prescrizioni, seppure opportune per non dire necessarie, non sembrano facilmente coniugabili con il sistema giuridico di common law che regola l’utilizzazione dei contenuti protetti nel paese di origine dei più importanti apparati di IA oggi esistenti, in distonia rispetto ai principi di civil law che connotano molti dei paesi aderenti all’Unione Europea[14].

Di fatto, l’utilizzazione dei contenuti protetti per testare gli apparati di IA sarebbe legittima, secondo la tesi coltivata dai loro produttori, in quanto tale impiego – asseritamente transeunte e limitato a riproduzioni effimere – rientrerebbe nell’ambito del c.d. Fair-use.

Fermo restando che deve essere oggetto di analisi caso per caso la modalità con cui vengono acquisiti e trattati i contenuti acquisiti dai gestori dei sistemi di IA, è opportuno affrontare l’esito di un recente caso deciso negli Stati Uniti per comprendere quali siano le linee di tendenza sulla materia, nella consapevolezza che ogni controversia può presentare problemi e questioni diverse e di maggiore o minore articolazione e complessità.

I casi legali negli Stati Uniti

Prendendo in esame l’esito della class-action che l’attrice e scrittrice Sarah Silverman e lo scrittore Richard Kadrey avevano instaurato, assieme a molti altri, nei confronti del gruppo Meta[15], lamentando che la piattaforma “LLaMA”, da esso detenuta, si addestrerebbe acquisendo banche di dati provenienti da differenti fonti contenenti opere letterarie attribuibili agli attori di questa causa, ci rendiamo conto di quanto il tema oggetto della medesima controversia possa incidere anche nel contesto giuridico europeo.

Il giudice Vince Chhabria del Northern District of California, con ordinanza di rigetto delle domande degli scrittori emessa in data 20 novembre 2023, ha anzitutto evidenziato che Meta si è difesa adeguatamente su tutte le questioni sollevate dalle parti attrici, eccezione fatta per quella riguardante la copia non autorizzata dei libri degli autori in questione, per i fini del training della piattaforma “LLaMA”, che rimane aperta.

I punti sulla base dei quali il giudice ha espresso il rigetto del ricorso dei ricorrenti sono i seguenti:

Circa il fatto che i modelli linguistici della piattaforma “LLaMA” sono essi stessi opere derivate in violazione dei diritti altrui perché essi non possono funzionare senza le informazioni espressive estratte dai libri degli attori, questa tesi è stata rigettata in quanto un’opera derivata è di per se stessa “un’opera basata su una o più opere preesistenti” in qualsiasi forma essa possa essere trasformata o adattata, come precisa il Titolo 17 dell’U.S.C. al § 101. Non c’è quindi modo di intendere che i “founding models” di “LLaMA” siano stati costruiti in base all’adattamento di uno qualsiasi dei libri dei ricorrenti.
L’ulteriore tesi sostenuta dai ricorrenti per cui: a) ogni output dei modelli linguistici “LLaMA” costituirebbe un’opera derivata da altre creazioni in violazione dei diritti degli autori e b) gli utenti che sottopongono le loro query a “LLaMA” ricevono un output dai modelli linguistici della piattaforma, tanto che tale risultato costituirebbe un atto di violazione vicaria del copyright derivando dall’utilizzo di opere altrui, sarebbe anch’essa destituita di fondamento. Secondo il giudice, dal momento che il ricorso non offre alcuna prova della circostanza dell’impiego delle opere dei ricorrenti avuto riguardo agli output del sistema e nemmeno l’evidenza di alcun atto di trasformazione o di adattamento dei libri degli attori, non esiste in atti alcuna prova plausibile di violazione dei diritti degli autori, né può esservi a tale titolo alcuna responsabilità vicaria dei gestori degli apparati di IA[16].
Inoltre, la Corte afferma che gli attori in giudizio hanno torto nel sostenere che, poiché i loro libri sono stati duplicati per intero come parte del processo di formazione del sistema di IA denominato “LLaMA”, non vi sarebbe la necessità di allegare alcuna prova della somiglianza tra i risultati derivati da “LLaMA” e i loro libri, essendo tale prova necessaria per sostanziare un’azione giudiziaria basata sulla violazione dei diritti connessi all’opera originale. Secondo il magistrato giudicante, gli attori avrebbero invece dovuto dimostrare che i risultati delle richieste rivolte alla piattaforma di IA incorporano in qualche forma una parte dei libri degli attori[17].

Fermo restando che rimane ancora in discussione, nella vicenda sopra delineata, se vi sia stata o meno da parte di Meta la realizzazione di una copia non autorizzata delle opere dei ricorrenti, la strada che questo giudizio indica a coloro i quali intendano fare valere la violazione dei propri diritti di autore sulle opere derivate dai sistemi di IA appare irta di ostacoli, soprattutto sotto il profilo dell’onus probandi, in particolare avuto riguardo alla somiglianza delle opere che, ovviamente, gli algoritmi di IA sono in grado di alterare, tanto da rendere irriconoscibili le effettive derivazioni dei contenuti sfruttati.

Trattandosi di una prima decisione che reca una chiara motivazione a supporto della reiezione delle domande dei ricorrenti nella class-action, non è certo che la linea interpretativa assunta dalla Corte del Northern District della California sarà seguita da altri giudici. Questo potremo sapere solo man mano che le diverse cause pendenti andranno a decisione.

Nel frattempo, nuove class-action in materia di IA vengono instaurate di fronte alle Corti statunitensi: il 21 novembre 2023, lo scrittore e giornalista del New York Times, Julian Sancton ha convenuto di fronte alla Corte di New York (Southern District) OPEN AI e Microsoft (socio investitore nell’impresa), dimostrando che la sua opera “Madhouse at the End of the Earth” è stata incamerata fra quelle utilizzate per addestrare ChatGPT e le piattaforme collegate.

Anche in questo caso, dalla lettura del ricorso con domanda di attribuzione del processo alla giuria, gli attori non portano al giudice la probatio diabolica dell’estrapolazione dei contenuti delle opere per cui è causa per inserirne parti o brani in altre opere derivative. Come osserva in atti il ricorrente, “OPEN AI ha reso più difficile determinare se un particolare libro sia presente nell’ambito di quelli utilizzati per addestrare l’apparato di IA, sacrificando in tal modo i titolari dei diritti al fine di coprire le proprie azioni.[18]”

Non possiamo sapere se le domande svolte dai ricorrenti troveranno un diverso trattamento da parte dei giudici di New York, rispetto a quelli di San Francisco, ma possiamo arguire che le domande svolte per la violazione dei diritti d’autore e per l’accertamento della responsabilità vicaria dei resistenti dovranno essere vagliate ulteriormente.

In questo contesto, si ripropone il tema che incombe su tutte le vicende giudiziarie statunitensi che coinvolgono titolari dei diritti e gestori dei sistemi di IA: la scriminante del “Fair-use” nello sfruttamento delle copie dei contenuti digitali utilizzati per il test e lo stesso funzionamento degli apparati di IA e dei “founding models” su cui essi si basano.

A seguito della sentenza della Corte Suprema degli Stati Uniti nella causa che ha visto convenuta la Andy Warhol Foundation contro la fotografa Goldsmith[19] dovrebbe essere più arduo sostenere che l’uso delle opere altrui per fare da carburante per i motori di IA, costituisca un uso consentito dall’interpretazione delle norme sul diritto d’autore.

Infatti, la prova che deve essere portata in giudizio da chi asserisce di avvalersi del “Fair-use” in una elaborazione creativa è quella secondo cui il nuovo utilizzo trasformativo dell’opera altrui debba dare vita a un contenuto differente, in modo sostanziale, rispetto a quello dell’opera originale, elemento questo che – a sommesso avviso di chi scrive – non sussiste quando si realizzano opere derivate che diventano – ad esempio – “sequel”, “prequel”, ”remake”, “paraquel”, “circumquel”, “inquel”, “spin-off” o “format” della creazione originale – come abbiamo visto accadere nei casi degli scrittori parti della class-action avviata nei confronti di EleutherAI Institute, Meta, Bloomberg e Microsoft[20].

Note

[1] Il documento del Consiglio d’Europa è stato solo parzialmente pubblicato il 10 novembre 2023 qui: https://data.consilium.europa.eu/doc/document/ST-13921-2023-INIT/en/pdf

La parte rimanente del testo del documento di cui sopra non risulta accessibile al pubblico, ma di esso viene offerto nel presente articolo una sintesi.

[2] Per un esame cursorio sulle norme comunitarie europee in materia di intelligenza artificiale, si trovano spunti qui: https://www.agendadigitale.eu/cultura-digitale/diritto-dautore-quali-tutele-per-le-opere-dellintelligenza-artificiale-approcci-e-possibili-soluzioni/

[3] Per il testo in lingua italiana del progetto di regolamento in questione: https://eur-lex.europa.eu/legal-content/IT/TXT/HTML/?uri=CELEX:52021PC0206

[4] I riferimenti alla tutela della cultura e dell’istruzione sono riportati ai paragrafi 117 e seguenti di questo atto: https://www.europarl.europa.eu/doceo/document/TA-9-2020-0275_IT.html#title1

[5] Si riporta il collegamento ipertestuale al Regolamento votato il 14/06/2023 dal Parlamento Europeo https://www.europarl.europa.eu/doceo/document/TA-9-2023-0236_EN.pdf

[6] Sul punto, fatto salvo quanto si dirà infra, si legga: https://www.agendadigitale.eu/mercati-digitali/le-opere-creative-dellia-gli-esiti-del-confronto-fra-copyright-e-diritto-dautore/

[7] Per un breve esame della questione, si rimanda a questo lavoro: https://www.agendadigitale.eu/cultura-digitale/robot-doppiatori-e-voce-come-dato-personale-quali-tutele-nel-nuovo-scenario-audiovisivo/

[8] Testo in lingua italiana: https://eur-lex.europa.eu/legal-content/IT/TXT/HTML/?uri=CELEX:32019L0790

[9] La prima parte del considerando n. 5 recita: “Nei settori della ricerca, dell’innovazione, dell’istruzione e della conservazione del patrimonio culturale, le tecnologie digitali consentono nuovi tipi di utilizzi non chiaramente contemplati dalle vigenti norme dell’Unione sulle eccezioni e sulle limitazioni. Inoltre, la natura facoltativa delle eccezioni e delle limitazioni di cui alle direttive 96/9/CE, 2001/29/CE e 2009/24/CE in questi settori può avere un impatto negativo sul funzionamento del mercato interno. Ciò riguarda in particolare gli utilizzi transfrontalieri, sempre più importanti nell’ambiente digitale” (…).

Questo il testo del considerando n. 8 della Direttiva in argomento: “Le nuove tecnologie consentono un’analisi computazionale automatizzata delle informazioni in formato digitale, quali testi, suoni, immagini o dati, generalmente nota come «estrazione di testo e di dati». L’estrazione di testo e di dati permette l’elaborazione di un gran numero di informazioni ai fini dell’acquisizione di nuove conoscenze e della rilevazione di nuove tendenze. È tuttavia ampiamente riconosciuto che le tecnologie di estrazione di testo e di dati, peraltro assai diffuse in tutta l’economia digitale, possono arrecare beneficio in particolare alla comunità di ricerca e, in tal modo, sostenere l’innovazione. A beneficiare di dette tecnologie sono le università e altri organismi di ricerca, nonché gli istituti di tutela del patrimonio culturale, poiché potrebbero svolgere ricerca nel contesto della loro attività principale. Nell’Unione, tuttavia, tali organismi e istituti si trovano di fronte a incertezza giuridica quanto alla misura in cui possono estrarre testo e dati da un determinato contenuto. In alcuni casi, l’estrazione di testo e di dati può riguardare atti protetti dal diritto d’autore dal diritto sui generis sulle banche dati, o entrambi, in particolare la riproduzione di opere o altro materiale, l’estrazione di contenuti da una banca dati o entrambi, come avviene ad esempio quando i dati vengono normalizzati nel processo di estrazione di testo e di dati. Se non sussistono eccezioni né limitazioni è richiesta un’apposita autorizzazione ai titolari dei diritti”.

[10] Il significato del termine “Text and Data Mining” è così illustrato https://it.wikipedia.org/wiki/Data_mining

[11] Art. 102-quater L.A.

[12] L’inserimento di informazioni circa il regime dei diritti o Digital Rights Management appare un sistema congruo ai sensi dell’art. 102-quinquies, comma 2, in particolare.

[13] Le controversie in questione includono: la class-action in corso dal 19 settembre 2023 di fronte alla Corte Distrettuale del Distretto Sud di New York che vede contrapposti noti autori di opere letterarie (ci sono anche John Grisham e Scott Turow) e la società che possiede il motore di intelligenza artificiale Chat-GPT appartenente al gruppo OPEN AI. Gli attori lamentano la creazione di opere derivate dai loro scritti, in alcuni casi veri e propri sequel con la presenza degli stessi protagonisti delle loro opere letterarie; la seconda causa in questione è un’altra class-action intentata da alcuni autori di fronte allo stesso tribunale di New York in precedenza menzionato il 17 ottobre 2023 nei confronti dell’EleutherAI Institute, oltre che verso Meta, Bloomberg e Microsoft, imprese che gestiscono i rispettivi apparati di intelligenza artificiale. Anche in questo caso, molteplici opere letterarie incamerate negli apparati di IA sarebbero, da un lato, di provenienza illecita in quanto estratti da siti web contraffattivi e, dall’altro, genererebbero opere derivate da quelle originali trasformate con l’impiego degli algoritmi di IA.

[14] L’argomento della differenza fra il Fair-use e le nostre eccezioni e limitazioni è stato in precedenza affrontato nel documento raggiungibile nella nota n. 6 ed è affrontato ulteriormente nel documento di cui alla nota 19.

[15] Anche questa causa è stata brevemente tratteggiata nella sua fase iniziale nell’articolo di cui alla nota n. 6 ed è affrontato ulteriormente nel documento di cui alla nota 19.

[16] Il giudice sul punto richiama la decisione Perfect 10, Inc. v. Amazon.com, Inc., 508 F.3d 1146, 1169 (9° Cir. 2007).

[17] Su questo punto, il giudice ha richiamato, fra le altre, le decisioni Litchfield v. Spielberg, 736 F.2d 1352, 1357 (9th Cir. 1984); v. anche Andersen c. Stability AI Ltd., n. 23-CV-00201-OMS, 2023 WL 7132064, a *7-8 (N.D. Cal. 30 ottobre 2023), nonché la dottrina Nimmer sul diritto di riproduzione.

[18] Testuale, a pag. 10 del ricorso § 33.

[19] Un approfondimento del tema è rinvenibile qui: https://www.agendadigitale.eu/cultura-digitale/fair-use-diritto-dautore-e-ia-gli-effetti-della-sentenza-warhol-goldsmith/

[20] In nota 13. La causa è stata radicata il 17 ottobre 2023 di fronte alla SDNY, dagli autori Mike Huckabee, Relevate Group, David Kinnaman, Tsh Oxenreider, Lysa Terkeurst, e John Blase.

@RIPRODUZIONE RISERVATA