Nei giorni scorsi è stata presentata, in una riunione plenaria con gli stakeholder, la prima bozza del General-Purpose AI Code of Practice.
Come è noto, uno degli obiettivi dell’AI Act è quello di creare condizioni di parità nel mercato interno. A tal fine sono essenziali le disposizioni dell’articolo 53 della legge sull’AI per quanto riguarda l’utilizzo di contenuti protetti dal diritto d’autore.
IA e rispetto delle norme sul diritto d’autore
È importante, infatti, riconoscere che gli sviluppatori di intelligenza artificiale devono:
- rispettare le norme sul diritto d’autore esistenti lungo tutta la catena del valore, in qualunque formato;
- fornire dettagli sufficienti sui contenuti utilizzati per la formazione, per consentire ai titolari dei diritti di esercitare e far rispettare i propri diritti nella pratica.
Criticità dell‘attuale bozza del Codice di condotta
Il progetto di codice mostra sicuramente dei progressi verso un’attuazione significativa di questi punti. Tuttavia, la bozza presentata è ancora sbilanciata a favore degli interessi delle piattaforme di intelligenza artificiale rispetto a quelli dei titolari dei diritti, che tali misure intendono tutelare. Senza un approccio più solido alle misure, il Codice rischia di compromettere gli obiettivi della legge sull’AI e di rendere le disposizioni inefficaci nella pratica.
La situazione attuale e i rischi per i creatori
La situazione attuale, come noto, è molto complessa. Immaginiamo che il lavoro di una vita, un lavoro che è la fonte sostentamento di autori e artisti, venga rubato. Peggio ancora: immaginiamo che coloro che si sono impossessati di questo lavoro lo utilizzino per costruire un business multimiliardario che utilizza il risultato della creatività degli autori per creare contenuti alla velocità della luce senza sosta, “prodotti” che competono direttamente contro gli stessi autori le cui opere sono state saccheggiate.
Violazioni su larga scala
È esattamente quello che sta succedendo oggi. Gli sviluppatori di intelligenza artificiale (AI) “rastrellano” Internet, aspirando ogni pezzetto di contenuto online – musica, film, libri, fotografia, articoli, codici informatici – indipendentemente dai termini di servizio o dalla legalità del sito web di origine. Laddove ogni altra azienda nel mondo deve ottenere delle licenze per utilizzare contenuti protetti da copyright per costruire la propria attività, le società di intelligenza artificiale più grandi e meglio finanziate hanno scelto di ignorare la legge, il tutto in una corsa per accaparrarsi il mercato.
L‘uso dei contenuti protetti per addestrare algoritmi AI
La sottrazione non autorizzata del contenuto è una cosa, ma il danno è aggravato dal fatto che gli sviluppatori utilizzano il contenuto per “addestrare” i propri algoritmi di intelligenza artificiale, producendo potenzialmente “output” che derivano, imitano o ripetono alla lettera il contenuto su cui sono stati addestrati. Questi risultati continuano a inondare il mercato con contenuti realizzati da macchine che competono direttamente con i contenuti creati dall’uomo su cui si basano.
Violazioni delle leggi internazionali
Si tratta di una palese violazione delle leggi di quasi tutte le nazioni che vietano la riproduzione illecita, proteggono la proprietà intellettuale e garantiscono una concorrenza leale. Ma sta accadendo su vasta scala e a una velocità vertiginosa, ponendo una minaccia esistenziale per intere industrie e settori lavorativi.
Aspetti chiave del codice di condotta
Tornando alla bozza di codice in fase di elaborazione vale la pena di commentare alcuni aspetti chiave.
Trasparenza (articolo 53, paragrafo 1, lettere a) e b))
Sulle Misure 1 e 2: fornire informazioni sui dati utilizzati per la formazione è importante per comprendere e interrogarsi su cosa e come i dati sono stati utilizzati. Questo è l’unico modo per garantire che l’output dei modelli di intelligenza artificiale non venga generato utilizzando contenuti illegali o illeciti, che si tratti di violazioni dei diritti sulla privacy o dei diritti di proprietà intellettuale. È inoltre importante consentire all’Ufficio AI di svolgere il proprio compito di supervisione del rispetto della legge sull’AI da parte dei fornitori di GPAI.
Norme relative al diritto d’autore (articolo 53, paragrafo 1, lettera c))
Sulla misura 3 (mettere in atto una politica sul copyright):
La misura 3 proposta include alcune azioni utili che i fornitori del modello GPAI dovranno intraprendere per dimostrare il rispetto degli obblighi della legge sull’AI. Altrettanto importante è il riconoscimento che il rispetto della legge sull’AI e del Codice di condotta non eliminerà la responsabilità ai sensi delle norme sul diritto d’autore (vale a dire, non è previsto alcun approdo sicuro in materia di copyright mediante il rispetto della legge sull’AI o del Codice di condotta). Tuttavia, deve ancora essere migliorato nei seguenti aspetti cruciali:
- È necessario un riconoscimento più chiaro del fatto che il diritto d’autore può essere rispettato da:
- Ottenere l’autorizzazione per l’uso dei contenuti: il modo migliore per sviluppare un mercato sostenibile e fiorente; oppure
- Utilizzo della tecnologia esistente per evitare l’uso di contenuti protetti da copyright: le applicazioni ACR esistenti disponibili in commercio possono e sono già state utilizzate dai fornitori di intelligenza artificiale per rimuovere i contenuti protetti da copyright dai set di dati.
- Dovrebbe essere ancora più chiaro che i fornitori non devono poter eludere le norme trasferendo a terzi la responsabilità di rispettare gli obblighi previsti dalla legge sull’AI. L’importanza di ciò è stata dimostrata dal set di dati LAION 5B utilizzato da molti sviluppatori di intelligenza artificiale e che si è rivelato includere quantità significative di contenuti illegali, dal materiale che viola il diritto d’autore al materiale pedopornografico.
- Ultimo ma non meno importante, le misure volte a evitare la creazione di prodotti contraffatti dovrebbero applicarsi a tutti i servizi, indipendentemente dalle loro dimensioni, poiché il danno causato da PMI indisciplinate può essere altrettanto grande.
Misura 4 (Rispetto dei limiti dell’eccezione TDM)
- L’attenzione posta su robots.txt è preoccupante. I crawler devono rispettare robots.txt, ma robots.txt presenta molti difetti riconosciuti, solo uno dei quali è che i contenuti delle case discografiche sono disponibili su Internet su più servizi di terze parti che non controllano. Pertanto, i titolari dei diritti hanno dovuto – e sono liberi di farlo – riservarsi i propri diritti con altri mezzi. Ciò include termini e condizioni a livello di sito, archivi pubblici di riserve di diritti e dichiarazioni pubbliche. Le applicazioni ACR possono essere distribuite per verificare se un set di dati contiene materiale per il quale sono stati riservati i diritti. Garantire il rispetto di queste altre misure efficaci è essenziale per far funzionare il sistema dell’UE.
- Il Codice deve chiarire che l’impiego di crawler non pregiudica e non limita in alcun modo altre misure che i firmatari dovrebbero adottare per garantire il rispetto delle riserve di diritti.
Misura 5 (Trasparenza)
La lingua corrente è generalmente utile. Allo stesso tempo, resta da vedere come questo sarà integrato dal modello dell’Ufficio AI che stabilirà cosa dovrebbe essere incluso quando si divulga il riepilogo sufficientemente dettagliato del contenuto utilizzato per la formazione ai sensi dell’articolo 53, paragrafo 1, lettera d), del Legge sull’AI.
Necessità di un quadro sostenibile
Come si vede, la strada per definire un quadro sostenibile affinché il settore dei contenuti possa approfittare al meglio delle opportunità connesse con l’AI generativa, è ancora lunga e articolata.
L’appello dei creatori ai politici e alla società
È tempo che la politica si renda conto di quanto sia fondamentale garantire la protezione dei diritti di proprietà intellettuale nel mondo dell’AI generativa. La nostra società merita di meglio e la nostra umanità lo richiede. Recentemente, oltre 36.000 creatori si sono uniti per firmare una lettera aperta a sostegno di una semplice dichiarazione:
“L’uso senza licenza di opere creative per la formazione dell’intelligenza artificiale generativa rappresenta una grave e ingiusta minaccia ai mezzi di sussistenza delle persone dietro tali opere e non deve essere consentito”.
L’elenco dei firmatari continua a crescere, ma affinché queste parole abbiano un impatto, i politici devono ascoltare l’appello. Il tempo è essenziale e i nostri leader devono agire: è tempo di difendere ciò che è giusto e giusto. È giunto il momento di garantire la protezione di creatori da un vero e proprio furto su larga scala e da una concorrenza sleale.