La rapida evoluzione degli strumenti di intelligenza artificiale registrata negli ultimi anni ha inciso profondamente sull’esigenza di reperire quanti più dati possibile per l’addestramento di sistemi di IA sempre più sofisticati.
Tale esigenza, tuttavia, si è scontrata spesso con l’esigenza, altrettanto rilevante, di garantire tutele adeguate ai titolari dei diritti di autore relativi ai testi utilizzati per l’attività di addestramento in questione. In questo scenario in continua trasformazione, si inseriscono numerosi casi giudiziari che contribuiscono a definire i confini giuridici della materia.
È di questi giorni, per esempio, la notizia secondo cui le scrittrici Molly Tanzer e Jennifer Gilmore avrebbero promosso innanzi al Tribunale di San Francisco una class action contro la società di cloud computing Salesforce Inc., asseritamente responsabile dell’utilizzo non autorizzato di migliaia di testi coperti da diritto d’autore per l’addestramento di XGen, vale a dire del modello di intelligenza artificiale per l’elaborazione del linguaggio sviluppato dalla stessa Salesforce.
Indice degli argomenti
Fair use e intelligenza artificiale nei modelli linguistici
Stando alle notizie di cronaca, l’obiettivo principale dell’azione legale incardinata dalle due scrittrici sarebbe la condanna della società convenuta al risarcimento dei danni subiti dai titolari dei diritti d’autore violati e la distruzione dei modelli addestrati con i testi illegittimamente acquisiti. In altri termini, la controversia non riguarda soltanto un presunto illecito, ma tocca questioni sistemiche che potrebbero influenzare l’intero settore, contribuendo a chiarire le responsabilità delle imprese che sviluppano modelli linguistici di grandi dimensioni.
Le rivendicazioni degli autori nell’era dell’IA generativa
La tesi difensiva sostenuta dalle due scrittrici, secondo cui l’addestramento dei modelli linguistici con opere coperte da copyright necessiterebbe in ogni caso di autorizzazione, ricalca quella adottata in giudizi analoghi da altri titolari di diritti d’autore. Infatti, si tratta di una posizione che, negli ultimi mesi, è stata supportata anche da altri gruppi di autori preoccupati per l’impatto dell’IA generativa sui modelli tradizionali di sfruttamento economico delle opere creative.
Il ruolo del fair use e intelligenza artificiale nel caso Salesforce
È troppo presto per fare pronostici sull’esito della causa. Tuttavia, proprio in considerazione dei precedenti in materia, è verosimile ritenere che l’autorità giudiziaria statunitense farà ricorso anche in questo caso alla dottrina del fair use, secondo cui, in presenza di determinate circostanze, deve ritenersi consentito il libero uso di opere protette da copyright, al fine di realizzare un giusto bilanciamento tra il carattere esclusivo dei diritti autoriali e il bisogno di garantire l’accesso pubblico all’informazione e ai materiali dotati di carattere creativo.
Tale approccio, già impiegato in contenziosi legati alle tecnologie digitali del passato, potrebbe rivelarsi fondamentale anche in relazione ai moderni modelli di IA.
I quattro fattori del fair use nel Copyright Act
Nello specifico, secondo l’Articolo 107 del Copyright Act statunitense, che di tale dottrina costituisce il manifesto, l’utilizzo di un’opera protetta da copyright per scopi quali critica, commento, cronaca, insegnamento, studio o ricerca, non costituisce violazione del diritto d’autore, purché tale utilizzo possa considerarsi fair alla luce di una valutazione caso per caso che tenga conto dei seguenti fattori: la natura dell’opera protetta da copyright; lo scopo, commerciale o non commerciale, dell’uso che dell’opera viene fatto; la quantità e la rilevanza della parte utilizzata in relazione all’opera tutelata considerata nel suo complesso; l’effetto dell’uso sul mercato o sul valore dell’opera.
Applicazione pratica del fair use ai dataset di training
Implicando valutazioni caso per caso, la dottrina del fair use presenta il vantaggio di poter essere applicata in modo dinamico, vale a dire anche con riferimento a tecnologie emergenti come i modelli linguistici. Del resto, come anticipato, è proprio su tale dottrina che si sono fondati alcuni provvedimenti resi dall’autorità giudiziaria statunitense in casi simili a quello che vede coinvolta Salesforce.
In tali casi, i giudici hanno ritenuto che, ricorrendo determinate circostanze, possano essere considerati legittimi, per esempio, l’uso di opere protette, nel caso in cui il fine non sia la produzione di copie delle opere originali, ma appunto l’estrazione di pattern per l’addestramento di modelli linguistici, configurandosi in tal caso un’ipotesi di uso trasformativo dell’opera originaria; la digitalizzazione di opere cartacee regolarmente acquistate, quando tale attività sia effettuata per motivi di spazio o ricerca interna e, quindi, non implicando la creazione di nuove copie delle opere digitalizzate a fini di condivisione o distribuzione, non impatti sul mercato di riferimento; l’uso di opere protette da copyright, quando i sistemi utilizzati non siano in grado di generare porzioni significative delle opere medesime o quando l’utilizzo non arrechi danni economici ai titolari dei diritti.
Prospettive future per fair use e intelligenza artificiale
Alla luce di quanto osservato, dunque, è verosimile ritenere che anche il Tribunale di San Francisco deciderà dopo aver valutato se nel caso di specie sia configurabile o meno, a vantaggio di Salesforce Inc., la scriminante del fair use.
Tuttavia, indipendentemente dagli sviluppi del contenzioso in questione, l’auspicio è che il suo avvio possa contribuire all’accelerazione dei processi per l’adozione di norme federali sulla gestione dei dati per l’IA e indurre le imprese che utilizzano materiali protetti da diritto d’autore per l’addestramento di sistemi di intelligenza artificiale a ottenere autorizzazioni esplicite per i dataset di addestramento e a negoziare con i titolari dei diritti le dovute royalties. Tale evoluzione normativa, se realizzata, potrebbe conferire maggiore chiarezza ai rapporti tra industria tecnologica e settore creativo.
In definitiva, in un momento storico quale quello attuale in cui il rapporto tra innovazione tecnologica e tutela dei diritti autoriali è in corso di definizione, casi come quello appena esaminato hanno il potenziale di influenzare non solo gli orientamenti giurisprudenziali e i trend normativi, ma anche le strategie commerciali e le policy di trasparenza delle principali aziende del settore.












