La pirateria libraria non è più soltanto un danno per editori e autori: oggi alimenta anche i sistemi di intelligenza artificiale, trasformandosi in una filiera globale dei dati illegali.
Indice degli argomenti
Il caso Anna’s Archive e il nuovo fronte del copyright digitale
Il caso Anna’s Archive, finito al centro di nuove azioni giudiziarie negli Stati Uniti, mostra con chiarezza come milioni di libri e articoli scientifici possano essere sfruttati non solo per la distribuzione abusiva, ma anche per l’addestramento dei modelli generativi. Sullo sfondo si apre così uno scontro sempre più duro tra tutela del copyright, sviluppo tecnologico e nuovi equilibri del mercato digitale.
Il ricorso delle case editrici USA
Il ricorso presentato il 6 marzo 2026 presso la United States District Court for the Southern District of New York da tredici delle principali case editrici statunitensi (tra cui Apress Media, Elsevier, Macmillan, HarperCollins, Wiley, Pearson, Hachette, Simon & Schuster) contro Anna’s Archive, evidenzia come il fenomeno delle c.d. “shadow libraries” abbia raggiunto proporzioni globali, offrendo al pubblico oltre 63 milioni di libri e 95 milioni di articoli scientifici[1], per un totale di circa 1 petabyte di dati illegittimamente riprodotti[2].
La piattaforma Anna’s Archive, che si definisce “la più grande biblioteca ombra del mondo”, opera attraverso molteplici domini e utilizza protocolli di condivisione peer-to-peer (BitTorrent) e IPFS per la distribuzione massiva di contenuti protetti dal diritto d’autore[3].
Come la pirateria libraria diventa infrastruttura per l’IA
Particolarmente allarmante è la circostanza, documentata nel ricorso degli editori statunitensi, che Anna’s Archive abbia stretto accordi commerciali con alcuni sviluppatori di sistemi di intelligenza artificiale, offrendo accesso ad alta velocità all’intera collezione di opere abusivamente riprodotte e diffuse su tale piattaforma digitale a fronte del versamento di una “donazione” pari alla somma di 200.000,00 dollari USA, alle imprese interessate all’addestramento dei loro “Large Language Models” (LLM) attraverso i contenuti del database abusivo.
Questo comportamento illecito conferma quanto già evidenziato dalla letteratura giuridica e dalle indagini giudiziarie: le piattaforme di pirateria digitale non si limitano alla distribuzione di contenuti ai consumatori finali, ma costituiscono vere e proprie infrastrutture per l’industria dell’IA, alimentando un mercato illecito di dati per l’addestramento di modelli generativi[4].
La posizione del governo degli Stati Uniti su questo tema è inequivocabile: come affermato dal Senatore Josh Hawley durante la riunione della sottocommissione Giustizia del 16 luglio 2025, “l’udienza di oggi riguarda il più grande furto di proprietà intellettuale nella storia americana… Le aziende di IA stanno addestrando i loro modelli su materiale rubato, punto e basta”.
Il fronte giudiziario degli editori statunitensi
Lo schieramento giudiziario dei ricorrenti, tutti membri dell’Association of American Publishers, ente esponenziale che li rappresenta nelle questioni legali e di public policy, si traduce nella richiesta di un provvedimento d’urgenza permanente nei confronti di Anna’s Archive e di tutti i soggetti collegati direttamente o indirettamente a tale piattaforma digitale, fondata sulla violazione diretta delle norme sul copyright, come regolate dal Titolo 17 dello U.S. Code § 101 e seguenti[5].
Questa azione legale non è peraltro isolata: essa si pone in linea di continuità con la recente ordinanza della stessa Corte di New York, la quale il 20 gennaio 2026 ha emesso una misura interinale d’urgenza contro Anna’s Archive, ordinando ai gestori della libreria pirata di interrompere la distribuzione di file musicali e dati presumibilmente prelevati dalla piattaforma digitale Spotify.
Il ricorso ex parte contro Anna’s Archive
L’ordinanza in argomento è stata emessa a seguito del ricorso Ex Parte depositato dalla Atlantic Recording Corporation e da altre etichette discografiche il 2 gennaio 2026 innanzi il Tribunale Distrettuale Sud di New York, nel quale i ricorrenti affermano che Anna’s Archive gestisce un'”attività pirata” che estrae illegalmente dati, inclusi milioni di libri, documenti e file musicali, vendendone a terzi l’accesso a fronte del versamento di somme in criptovalute, cioè a scopo di lucro.
Il giudice Jed S. Rakoff – nella contumacia della resistente che non è comparsa all’udienza del 16 gennaio 2026, né ha depositato difese – ha concesso il provvedimento d’urgenza ai ricorrenti per la violazione del diritto d’autore commessa da Anna’s Archive attraverso la riproduzione illecita delle registrazioni musicali oggetto di causa, vietando agli anonimi amministratori della piattaforma digitale qualsiasi atto di utilizzazione degli stessi brani, incluso l’utilizzo di file BitTorrent per la condivisione dei contenuti abusivamente acquisiti e imponendo ai Registrar dei nomi di dominio associati al sito web in questione di sospenderne la registrazione. Inoltre, il Giudice ha imposto ai CDN, inclusa Cloudflare Inc., e agli altri fornitori di servizi on-line di cessare di fornire il proprio supporto al sito web oggetto delle domande di inibitoria[6].
Il tribunale ha ritenuto che la mancata concessione dell’ingiunzione avrebbe causato un danno immediato e irreparabile alle etichette discografiche e alla stessa piattaforma digitale Spotify a causa dell’enorme portata delle violazioni commesse.
Perché la pirateria libraria si estende oltre il web
I fatti sopra brevemente illustrati sono l’evidenza che la pirateria, libraria, audiovisiva o musicale si sta trasferendo, massicciamente, dal web ormai esteso all’intero globo che è ormai infestato da triliardi di copie abusive di opere tutelate, agli stessi sistemi di intelligenza artificiale che sono necessari per lo sviluppo di nuove tecnologie, da impiegare nell’attività industriale, commerciale e bellica[7].
Di fronte al diffondersi di queste nuove forme di utilizzo abusivo delle opere tutelate al fine di creare i dataset che alimentano i modelli di intelligenza artificiale non esistono ancora norme di legge in vigore che siano mirate a contrastare queste iniziative illegali, dovendosi fare ricorso ai rimedi civili che riguardano le cause pendenti o concluse fra i titolari dei diritti e i gestori dei modelli di intelligenza artificiale[8].
Le ragioni del vuoto normativo negli Stati Uniti
Negli Stati Uniti, le ragioni di tale carenza sono riconducibili a diversi fattori: anzitutto la velocità tecnologica che impedisce al legislatore di stare al passo con l’evolversi della tecnologia; l’evidente presenza di interessi contrastanti fra le Big Tech e l’Industria dell’Entertainment; il ricorso da parte degli sviluppatori dei sistemi di intelligenza artificiale alla dottrina del “Fair use” che costituisce la loro difesa principale di fronte alle contestazioni giudiziali dei Rightsholder.
Non mancano peraltro le proposte di legge che riguardano le nuove fattispecie criminali nell’ambito digitale.
La pirateria libraria nelle proposte legislative federali
Fra di esse, va ricordato il testo di legge bipartisan presentato dai Senatori Thom Tillis, Chris Coons, Marsha Blackburn e Adam Schiff per fronteggiare la pirateria commerciale su larga scala proveniente dall’estero che reca il titolo di “Block Bad Electronic Art and Recording Distributors (Block BEARD) Act” del mese di luglio 2025. Il documento, presentato in bozza per la discussione e per il sostegno politico da parte del maggiore numero possibile di operatori, mira a conferire alle Corti federali statunitensi il potere di affrontare la pirateria proveniente dai siti web collocati all’estero, senza pregiudicare la tutela del diritto d’autore prevista dal Digital Millennium Copyright Act[9].
Si tratta di una serie di norme emendative del Titolo 17 dello U.S. Code, Chapter 5, Section 502, che sono in parte assimilabili a quelle implementate in Italia dall’Ag.Com. per fronteggiare la pirateria digitale in ambito amministrativo. Il procedimento che si vuole istituire prevede la presentazione da parte del titolare dei diritti d’autore di un’istanza alla Corte Distrettuale con la prova del danno causatogli dal sito web estero, il quale deve risultare primariamente progettato per violare il copyright, dovendo essere altresì diretto intenzionalmente a promuovere la pirateria digitale per scopo commerciale.
Il meccanismo di oscuramento dei siti esteri
Una volta che il titolare dei diritti abbia ottenuto dal tribunale la designazione del sito preso di mira quale “Foreign Digital Piracy Site”, sul presupposto di avere in precedenza tentato inutilmente di avviare un’azione legale nei confronti del gestore del sito web che deve essere basato al di fuori degli U.S.A., lo stesso Rightsholder può rivolgersi al fornitore dei servizi statunitense affinché questi adotti misure ragionevoli per oscurare l’accesso al sito pirata da parte degli utenti nazionali, senza alcun obbligo da parte sua di svolgere accertamenti sulle violazioni commesse dai gestori del servizio illecito. Questi ultimi hanno facoltà di ricorrere contro il provvedimento di oscuramento entro i 21 giorni successivi al blocco. I costi ragionevoli della disabilitazione dell’accesso al web fanno carico al titolare dei diritti.
Il caso dei deepfake e delle repliche digitali
Se, come abbiamo visto, la lotta alla pirateria rimane una priorità per il Congresso, negli Stati Uniti si stanno esaminando anche alcune disposizioni che riguardano il contrasto dei c.d. “Deepfake”, cioè norme specifiche volte a tutelare i diritti alla voce e alle sembianze visive delle persone, che sono l’oggetto del “NO FAKES Act” del 2025[10].
Si tratta di un insieme di disposizioni dirette ad impedire la creazione delle c.d. “Digital Replicas” generate dai sistemi di intelligenza artificiale, cioè quelle rappresentazioni altamente realistiche e facilmente identificabili, come la voce o la sembianza visiva di una persona, quando esse sono incorporate in una registrazione del suono o in una fissazione visiva, anche senza suono.
Oltre a vietare la creazione di strumenti progettati specificamente per produrre repliche digitali abusive (audio, video, immagini fotografiche) o la loro distribuzione e disseminazione pubblica, la normativa vuole introdurre un nuovo diritto personale d’autore denominato “Digital Replication Right”.
Il nuovo diritto di replica digitale
Si tratta di un diritto legato all’identità della persona e di esso quest’ultima ha la facoltà di autorizzare o meno l’uso in licenza, trattandosi comunque di una potestà non cedibile in vita dell’individuo, che ha una durata corrispondente all’intera esistenza dell’individuo e che, successivamente ad essa, gode di ulteriore protezione per un periodo variabile fra i 10 e i 70 anni, a determinate condizioni stabilite dalla norma. Tale diritto connesso può essere registrato dall’individuo presso il Copyright Office di Washington D.C.
La normativa in fieri prevede anche che la licenza dei diritti di replica da parte della persona interessata possa durare fino a cinque anni e che tale trasferimento temporaneo dei diritti debba essere approvato dal Tribunale.
Come la pirateria libraria incontra le resistenze politiche
Circa la reazione pubblica all’esame di queste proposte di legge, va sottolineato che entrambe sono oggetto di accese discussioni a livello politico in quanto molti critici, fra cui le Big Tech e le loro associazioni più rappresentative, reclamano che le nuove norme limitano le libertà fondamentali dell’individuo, fra cui i diritti costituzionali di free speech previsti dal Primo Emendamento. Si tratta di un atteggiamento impeditivo del progresso normativo degli Stati Uniti che rischia di determinare un grave allentamento delle misure necessarie alla difesa di valori fondamentali su cui si fonda ancor oggi il sistema economico mondiale.
L’intelligenza artificiale come strumento di contrasto
Riprendendo in conclusione il tema della pirateria da cui siamo partiti, è comune opinione che l’intelligenza artificiale possa rappresentare – oltre che un serio problema per la tutela dei diritti d’autore – anche una risorsa fondamentale per il contrasto a tale crimine, offrendo nuovi spazi operativi e strategici.
L’utilizzo degli algoritmi sviluppati in tale ambito può rivelarsi di ausilio all’identificazione e al monitoraggio dei contenuti abusivi immessi sulle reti di comunicazione elettronica, attraverso l’analisi dei big data. Gli strumenti di intelligenza artificiale possono inoltre essere impiegati per valutare i comportamenti degli utilizzatori dei contenuti pirata e per studiare e attuare modelli di protezione delle opere protette, attraverso l’adozione di misure tecnologiche di protezione e di identificazione della provenienza dei diritti.
Tuttavia, queste attività implicano una valutazione del rischio di violazione dei diritti alla privacy dei soggetti che saranno oggetto di indagine, richiedendo l’adozione delle misure previste dalla legge e la collaborazione di tutti gli operatori con gli organi investigativi a tal fine abilitati.
Note
[1] Nel caso Bartz c. Anthropic AI il giudice del Summary Judgment ha stabilito che Anthropic avrebbe scaricato, nell’anno 2021, 196.640 copie di libri da una biblioteca pirata denominata “Book3” e nel mese di giugno 2021 avrebbe utilizzato il protocollo “Bit Torrent” per copiare attraverso il peer-to-peer un’altra biblioteca pirata, la “Library Genesis”, più nota come LibGen, da cui l’azienda di San Francisco avrebbe incamerato circa cinque milioni di copie di opere protette. Nel mese di luglio dell’anno 2022, Anthropic avrebbe aggiunto altri due milioni di opere letterarie provenienti da un sito “specchio” della biblioteca on-line “Z-Library”, cioè da una copia della stessa ospitata da un diverso server, denominato “Pirate Library Mirror” o Pi.Li.Mi. cui fa riferimento lo stesso complaint degli editori statunitensi oggetto del presente brano. Sul punto, sopra riprodotto, si veda il seguente articolo: https://www.agendadigitale.eu/mercati-digitali/ai-la-causa-anthropic-e-uno-smacco-per-il-diritto-dautore-e-lue/
[2] Un petabyte (PB) equivale a 1.000 terabyte (TB) o 1 milione di gigabyte (GB), ovvero, più precisamente, 1024 TB in unità di misura binarie. Avuto riguardo ai contenuti che un petabyte è in grado di archiviare esso equivale a circa 1 quadrilione di byte, in grado di memorizzare circa 500 miliardi di pagine di testo, 250 milioni di brani musicali o 13,3 anni di trasmissione video in alta definizione.
[3] Numerose sono le analogie fra il caso che vede contrapposti gli editori statunitensi e Anna’s Archive. Nel caso portato all’esame del Tribunale di Milano dagli editori librari e da alcune imprese del settore audiovisivo, conclusosi con la Sentenza n. 7066/2022 del 12 settembre 2022, RG n. 30185/2019, Rep. n. 9516/2022, il Giudice ha – fra le varie misure adottate – accertato che i convenuti, hanno violato il diritto d’autore e connesso di comunicazione al pubblico (artt. 16 e 78 ter, lett. d) Legge Autore oltre ad avere concorso nella violazione del diritto d’autore e connesso di riproduzione (Artt. 13 e 78 ter, lett. a) della Legge Autore). Il Tribunale ha quindi emesso l’ordine di rimozione dalla piattaforma digitale convenuta dei file torrent e delle schede bibliografiche relativi alle opere pubblicate di proprietà degli editori, produttori e distributori rappresentati in giudizio, con divieto di ripetere ulteriormente l’illecito, e con il divieto di mettere a disposizione, con qualsiasi mezzo e in qualsiasi forma tali materiali come pure le informazioni idonee al loro reperimento in rete.
[4] Su questo tema le preoccupazioni degli editori sia dell’editoria giornalistica che libraria italiana si riflettono in iniziative volte a impedire l’appropriazione abusiva dei loro contenuti, come qui descritto: https://www.agendadigitale.eu/mercati-digitali/ai-come-tutelare-la-sussistenza-degli-editori/
Di recente, l’A.I.E. (Associazione Italiana Editori) ha affrontato questo argomento in un convegno (qui il link: https://www.aie.it/Cosafacciamo/Antipirateria/Lapiraterianell%E2%80%99editorialibrariaaitempidell%E2%80%99IntelligenzaArtificiale.aspx) e ha successivamente chiesto al Governo che vengano introdotte nuove norme a tutela delle opere letterarie.
[6] Il fatto che i CDN (Content Delivery Network) vengono utilizzati molto di frequente da parte di taluni siti web per impedire l’identificazione dei gestori dei siti pirata è oggetto di numerosi contenziosi e di discussione in Italia. Sul punto si trovano spiegazioni del problema e spunti per comprenderne l’ampiezza e complessità in questi articoli:
Avuto specifico riguardo al CDN Cloudflare, l’Ag.Com., con la Delibera 333/25/CONS del 29 dicembre 2025, ha ingiunto al service provider statunitense di versare all’authority la somma di € 14.247.698,56 entro 30 giorni dalla notifica, fatta salva la facoltà per la stessa Cloudflare Inc. di impugnare il provvedimento di fronte al TAR del Lazio che ha competenza in materia.
Le ragioni alla base della decisione dell’Ag.Com. di cui si dà qui sintetica informazione sono riconducibili all’inottemperanza da parte dell’ISP statunitense alla determina di rimozione/disabilitazione di numerosi siti web pirata che erano stati soggetti a ordine cautelare della medesima Autorità ai sensi del Regolamento in materia di tutela del diritto d’autore sulle reti di comunicazione elettronica (Delibera 680/13/CONS e successive modifiche). La ratio dei provvedimenti adottati nei confronti di Cloudflare Inc. si fonda sul fatto che molti dei siti pirata oggetto di determina di blocco avrebbero utilizzato i servizi on-line della società di San Francisco per diffondere illecitamente opere tutelate dal diritto d’autore e diritti connessi, incluse le trasmissioni delle partite di calcio live.
Alla data di scrittura di questo articolo risulta che Cloudflare Inc. abbia impugnato di fronte al Tribunale Amministrativo competente la Delibera Ag.Com. sopra indicata lamentando che il Piracy Shield (qui: https://www.agendadigitale.eu/mercati-digitali/pirateria-digitale-italia-e-usa-uniti-nella-guerra-allo-streaming-illegale/), cioè l’apparato che consente il blocco dei siti web pirata che danno l’accesso abusivo degli utenti agli eventi e alle opere audiovisive live, sarebbe contra legem in quanto la decisione di blocco sarebbe non trasparente in base alle norme della Direttiva DSA e non passerebbe attraverso il controllo giudiziario diretto.
[7] Negli anni recenti il crimine della pirateria digitale si è espanso orizzontalmente su tutte le aree in cui la riproduzione illecita di opere e il loro sfruttamento potesse generare guadagni illeciti, portandosi nei tempi più recenti nel segmento delle piattaforme digitali le quali hanno radicalmente trasformato le modalità di accesso ai contenuti audiovisivi, superando il modello tradizionale dei palinsesti televisivi e offrendo agli utenti una vasta libreria di titoli on-demand sempre disponibili. Questa rivoluzione mediatica ha portato a una richiesta crescente di prodotto personalizzato, con librerie che mettono a disposizione storie sempre più attuali e “tagliate su misura” per soddisfare le inclinazioni individuali degli spettatori. L’evoluzione ha riguardato anche la qualità audio e video, con l’affermarsi degli effetti speciali anche 3D, della realtà aumentata e dell’interattività, tutti servizi essenziali offerti ai fruitori.
Tuttavia, questa trasformazione tecnologica non ha ridimensionato la piaga della pirateria audiovisiva, la quale ha preso di mira la visualizzazione dei contenuti più appetibili per il pubblico, gli eventi “live” (in particolare sport e concerti musicali). Sull’argomento si può leggere questo articolo: https://www.agendadigitale.eu/mercati-digitali/pirateria-digitale-italia-e-usa-uniti-nella-guerra-allo-streaming-illegale/
[8] Fino al mese di dicembre dell’anno 2025 risultavano pendenti di fronte alle Corti Distrettuali statunitensi venti cause avviate dagli editori nei confronti delle piattaforme digitali di intelligenza artificiale, mentre allo stesso momento erano stati conclusi trentacinque accordi transattivi fra le testate giornalistiche e le medesime imprese proprietarie di apparati di IA per i diritti sui contenuti delle pubblicazioni.
[9] Il testo attualmente in discussione pubblica fuori dall’Aula del congresso USA contiene notevoli migliorie rispetto al precedente disegno di legge Foreign Anti-Digital Piracy Act (FADPA) H.R.791, di cui si può trovare una sintesi nell’articolo richiamato alla nota N. 7.
[10] Qui si trova il testo del disegno di legge H.R.2794 introdotto dalla Repubblicana Maria Elvira Salazar, della Florida il 9 aprile 2025, attualmente all’esame della Commissione Giustizia della House of Representatives: https://www.congress.gov/bill/119th-congress/house-bill/2794/all-actions Il medesimo progetto di legge è stato presentato al Senato del Congresso USA sotto il N. S. 1367 (NO FAKES ACT of 2025) dal Sen. Christpher A. Coons, di seguito collegato: https://www.congress.gov/bill/119th-congress/senate-bill/1367











