Lo scorso 5 novembre 2021 è stato approvato il decreto di recepimento della Direttiva Copyright 2019/790/UE. Il d.lgs. 177/2021 – in vigore dal 12 dicembre 2021 – modifica la legge sul diritto d’autore, introducendo nella legislazione nazionale importanti novità.

Esaminiamo quindi di seguito, l’introduzione nella legge sul diritto d’autore dei nuovi articoli 70-ter e 70-quater, l. 633/1941 (di seguito anche “Legge Autore”), i quali recepiscono l’eccezione di Text and Data Mining (TDM), di cui agli articoli 3 e 4 della Direttiva.

Le tecnologie di Text and Data Mining, una definizione

Le tecnologie di Text and Data Mining – estrazione di testo e di dati – sono definite dal legislatore europeo come “qualsiasi tecnica di analisi automatizzata volta ad analizzare testi e dati in formato digitale avente lo scopo di generare informazioni inclusi, a titolo non esaustivo, modelli, tendenze e correlazioni”. Tale tecnica altro non è che una tra le tecnologie automatizzate in grado di elaborare un gran numero di informazioni in tempi minimi, e fornire l’output richiesto, altrimenti inaccessibile per l’uomo. È ampiamente riconosciuto – come evidenziato al considerando 8 della Direttiva – che tali tecniche sono idonee ad arrecare beneficio, in particolar modo, alla comunità scientifica, sostenendo l’innovazione.

Il TDM è per l’appunto una tecnica automatizzata di ricerca che processa, tramite dei specifici software tools, dei dati in formato digitale. A tal fine, inizialmente viene inserito un input che potrà consistere in un contenuto complesso, un dato singolo, ovvero un insieme di dati raccolti in una banca dati. Una volta individuato il materiale di partenza, lo stesso verrà processato per essere trasformato in un formato comprensibile al tool (pre-processing); il dato così ottenuto potrà eventualmente essere caricato su una piattaforma digitale e successivamente un algoritmo si occuperà di analizzare e combinare i dati, fornendo un output. Tale pratica è funzionale non solo ad estrarre dati, ma pure a modificare, ipoteticamente, il materiale di partenza.

È evidente che tale sfruttamento degli input è, in certi casi, in contrasto con le prerogative autorali di sia di chi possa vantare un diritto d’autore sui contenuti processati dalla macchina, sia di chi vanti un diritto c.d. sui generis sulla banca dati da cui gli stessi sono estratti, e ciò determina un’incertezza giuridica rispetto alla misura in cui si possono estrarre testo e dati da un determinato contenuto.

Tale incertezza ha determinato l’esigenza di introdurre nel diritto comunitario – con gli articoli 3 e 4 della Direttiva Copyright – una nuova eccezione di estrazione di testo e di dati.

TDM e i rapporti con il diritto d’autore

Prima di procedere ad illustrare le novità normative, sembra doveroso inquadrare, più nello specifico, il problema al fine di comprendere i cambiamenti imminenti.

Nell’ambito della dottrina del diritto d’autore è dibattuto l’ambito in cui sia consentita l’elaborazione creativa dell’informazione e/o dell’opera protetta. Pertanto, limitare l’utilizzo del dato in sé stesso, è da qualcuno considerata una violazione del diritto di espressione. Altri interpreti ancora hanno sostenuto che il diritto esclusivo di riproduzione, proprio dell’autore, non è intaccato dal processo di estrazione, in ragione del fatto che il diritto di riproduzione riguarda l’opera e la sua valenza comunicativa, non i dati di cui è composta. In realtà il legislatore europeo si dimostra di altro avviso, sostenendo che, nel processo di elaborazione dei dati, l’assenza di un’autorizzazione da parte dell’autore dell’opera da cui sono estratti, può condurre ad una violazione del diritto autorale. Tecnicamente, infatti, l’estrazione potrà avvenire tramite una riproduzione, giustificata dalla necessità di copiare il dato e conservarlo, prerogative queste riservate all’autore dell’opera da cui il dato è estratto. Altre volte, invece, non si incorre in tale violazione perché l’estrazione parte da informazioni o dati che non sono protetti ai sensi del diritto d’autore o ancora perché l’estrazione non comporta alcuna riproduzione, ma si tratta di ipotesi, quest’ultime, residuali.

Nel caso in cui, dunque, i materiali processati siano coperti dal diritto d’autore o siano contenuti in una banca dati, ciascuna fase del processo di TDM è idonea ad integrare una lesione dei diritti esclusivi dell’avente diritto, per violazione dei diritti di riproduzione ed elaborazione dell’opera o di estrazione, spettante al costitutore di una banca dati.

Giunti a questo punto, occorre valutare se, per ovviare a tale problematica, si potrebbe ricorrere alle eccezioni e limitazioni al diritto d’autore. Queste trovano la loro ragion d’essere all’articolo 9 della Convenzione di Berna che introduce il c.d. principio del “three-step-test”. Ai sensi di tale principio le eccezioni sono concesse solo quando (i) la legislazione dello stato consenta la libera riproduzione in alcuni casi specifici, (ii) nei limiti in cui la riproduzione esentata non confligga con il normale sfruttamento economico dell’opera e (iii) ciò non pregiudichi ingiustificatamente i legittimi interessi dell’autore.

Tale criterio di ammissibilità delle eccezioni e limitazioni ha guidato l’introduzione delle stesse fungendo da parametro di legittimità. Ma, pur volendo adottare le eccezioni e limitazioni al diritto d’autore già esistenti, le stesse difficilmente potrebbero trovare applicazione con riguardo al TDM, in ragione delle sue intrinseche caratteristiche.

Ciò perché, da un lato le eccezioni esistenti sono eccessivamente circostanziate e, dall’altro, perché applicabili su base volontaria dagli Stati membri, che quindi potrebbero diversamente recepire la Convenzione. Inoltre, anche quando i ricercatori hanno accesso ai materiali, spesso questi sono licenziati con l’esclusione dell’estrazione di testo e di dati, penalizzando la ricerca a livello europeo e dunque penalizzando la crescita dell’Unione nel suo complesso. Per queste ragioni è sorta l’esigenza di introdurre una nuova eccezione che tenga conto del funzionamento del nuovo ambiente digitale.

Lo scenario in Usa

D’altronde anche altre esperienze oltreoceano hanno fornito la base di partenza per l’elaborazione dell’eccezione. Si pensi, ad esempio, agli Stati Uniti che hanno liberalizzato l’estrazione di testo e di dati, facendola rientrare nel fair use. Con la decisione Author Guild vs. Google infatti è stato riconosciuto il carattere trasformativo dell’uso di opere altrui, nello specifico opere letterarie, che Google ha fatto con la sua massiva operazione di digitalizzazione nell’ambito del progetto “Google Books”. Questo, oltre a digitalizzare, e dunque rendere accessibili online senza il permesso dei titolari, innumerevoli opere letterarie, consente di analizzare i testi con strumenti di TDM. Con specifico riguardo a quest’ultima attività, è stato riconosciuto che, trasformando i libri in dati, Google avrebbe consentito un utilizzo degli stessi per fini di ricerca scientifica che precedentemente non sarebbe stato possibile, realizzando un uso “trasformativo” dell’opera, da libro a dato per scopo di ricerca scientifica, rientrando nei criteri del fair use. Ciò, senza però ledere il normale sfruttamento dell’opera originaria, perché l’attività di estrazione in sé stessa difficilmente può incidere negativamente sull’utilizzazione economica da parte dell’autore dell’opera, ossia la vendita dell’opera letteraria, in quanto l’attività di estrazione non inciderebbe sul valore di comunicazione dell’opera stessa. Con tale decisione si è dunque riconosciuto il valore della protezione autorale come tutela sull’espressione creativa dei dati, che non si estende sulle informazioni singolarmente intese che possono essere estratte dall’opera tutelata.

Un approfondimento degli articoli 3 e 4 della Direttiva

L’eccezione per finalità di estrazione di testo e di dati è disciplinata dagli articoli 3 e 4 della Direttiva Copyright, i quali limitano il diritto esclusivo di riproduzione dell’autore dell’opera e/o della banca dati; il diritto di estrazione e/o reimpiego del costitutore della banca dati; e il nuovo diritto sulle pubblicazioni di carattere giornalistico, introdotto dalla stessa Direttiva all’articolo 15.

Più specificamente, l’articolo 3 prevede un’eccezione di TDM effettuata per scopi di ricerca scientifica per destinatari ben determinati, quali organismi di ricerca scientifica e istituti di tutela del patrimonio culturale. L’articolo 4, invece, introduce la stessa eccezione per ogni forma di TDM effettuata da soggetti e con finalità diverse da quelle di cui all’articolo 3.

Oltre che per i destinatari e le finalità, le due disposizioni differiscono per i tempi di conservazione dei dati cui si ha accesso e per la possibilità di prevedere un opt-out a tale eccezione in sede contrattuale: ammessa ai sensi dell’articolo 4, inammissibile ai sensi dell’articolo 3. Le due norme però sono accumunate dal fatto che l’eccezione delineata, in entrambi i casi, può operare unicamente quando i soggetti interessati abbiano legalmente accesso alle opere/dati.

Iniziando dall’articolo 3, è interessante notare quanto sia effettivamente ristretto l’ambito di applicazione dell’eccezione. I destinatari infatti sono unicamente due tipologie di soggetti: gli organismi di ricerca scientifica e gli istituti di tutela del patrimonio culturale. Con riguardo a questi ultimi, emerge che essi devono essere accessibili al pubblico, includendo, ipoteticamente, enti sia pubblici che privati, non includendo alcun riferimento all’assenza di finalità lucrative. Rispetto poi alla pertinenza tra le opere oggetto dell’estrazione e l’attività svolta dall’ente, il Considerando 13 sembra escludere tale requisito.

Maggiori restrizioni sono previste per gli organismi di ricerca. Sono esclusi dall’ambito di applicazione gli organismi che non abbiano una natura pubblica e che perseguano una finalità lucrativa. Balza agli occhi pure l’esclusione, da tale applicazione, dei ricercatori in quanto singoli e che svolgano attività di ricerca in forma indipendente, realizzando una ingiustificata penalizzazione. La finalità a cui dunque la ricerca deve tendere, nel caso di organismi di ricerca, deve consistere o nell’assenza dello scopo di lucro o nella finalità di interesse pubblico. Queste costituiscono condizioni essenziali ma non sufficienti; infatti si aggiunge un ulteriore requisito relativo ai partenariati pubblico-privati, per i quali è centrale la necessità di evitare che le imprese che possano esercitare una “influenza determinante” sull’organismo possano “accedere su base preferenziale ai risultati della ricerca”. Con ciò la nuova disciplina (cfr. art. 70-ter, comma 5, Legge Autore) mira ad escludere che soggetti privati, quali le imprese, accedano ai risultati della ricerca, anzi sono incoraggiate forme di partenariato pubblico-privato, ma intende evitare che tali soggetti privati beneficino dell’eccezione in forza di una influenza determinante. Quest’ultima difetta di una definizione, ma in via interpretativa per essa si intende una situazione di controllo o di partecipazione al capitale, anche nella forma di dotazione degli strumenti tecnologici, dell’ente pubblico che effettua la ricerca.

Il punto più complesso, che l’articolo 3 affronta, concerne i rapporti tra le tecniche di TDM e la disciplina delle misure tecnologiche di protezione, qualora sia necessario memorizzare i risultati della ricerca e la loro conservazione e/o comunicazione a terze parti per verificare i risultati della stessa. Il punto è affrontato ai commi 2 e 3 dell’articolo in argomento, in cui si ammette la possibilità di conservare tali dati nel rispetto dei principi di proporzionalità e di necessità di verifica della ricerca scientifica, non limitando oltremodo l’eccezione, assicurando al contempo l’applicazione di misure di sicurezza idonee a preservare i dati e le opere.

Per non vanificare la ricerca svolta, sarebbe irragionevole non consentire la verifica dei risultati anche inter pares. Tale possibilità è concessa ai sensi dell’articolo 5, paragrafo 3, lettera a) della Direttiva 2001/29/CE, ma si ricorda il carattere facoltativo dell’eccezione, insufficiente quindi a produrre effetti transnazionali. Il problema di una tale verifica consiste nel fatto che, per analizzare i risultati ad opera di terze parti, si dovrebbe poter avere accesso ai dati di partenza, realizzando una comunicazione al pubblico dei dati o delle opere protette dal diritto d’autore e l’ulteriore necessità di svolgere tale verifica con differenti strumenti di TDM. Si potrebbe allora riconoscere che, qualora il “verificatore” sia uno dei soggetti legittimati dall’articolo 3, il problema potrebbe non porsi, anche se l’eccezione in argomento riguarda segnatamente la riproduzione e i diritti del costitutore di una banca dati, non anche la comunicazione o la distribuzione di un opera protetta; inoltre l’eccezione si applica solamente con riferimento alle opere cui il ricercatore abbia avuto accesso legale (il verificatore in questo caso); quindi se chi abbia compiuto la ricerca iniziale non sia autorizzato a comunicare i dati, tale possibilità di verifica sarebbe in origine viziata.

Le potenzialità del TDM non riguardano solamente la ricerca scientifica, ma sono tecniche utilizzabili a trecentosessanta gradi per analizzare grandi quantità di dati in diversi settori della vita e per finalità diverse. Questa consapevolezza ha giustificato l’introduzione del successivo articolo 4, che introduce l’eccezione di testo ed estrazione di dati indipendentemente dalla ricerca scientifica, e dallo scopo commerciale, incoraggiando gli autori a concedere l’autorizzazione all’estrazione di materiali protetti di cui soggetti terzi siano venuti legittimamente in possesso, anche semplicemente messi a disposizione in internet, tramite strumenti machine readable. Tale eventualità, come anticipato, è però derogabile in sede contrattuale e pertanto l’eccezione di cui all’articolo 4 non risulta essere obbligatoria, contrariamente a quella di cui all’articolo 3. L’articolo 4 quindi sembrerebbe di applicazione residuale rispetto al precedente articolo, palesando così il velato obiettivo di riservare l’eccezione di TDM agli organismi pubblici che eseguano ricerca scientifica e solo in via secondaria “incoraggiare l’innovazione nel settore privato”.

In ultimo, nonostante anche nel settore privato potrebbe essere utile conservare i dati ai fini di verifica della ricerca effettuale, il legislatore sembra riporre una minore fiducia nei soggetti privati e dispone che i dati siano conservati per un tempo strettamente necessario ai fini dell’estrazione. Tale impostazione è mantenuta pure in sede di recepimento nazionale, come si vedrà in seguito, ledendo di fatto la giusta necessità di rendere i risultati ottenuti il più possibile verificabili e falsificabili.

Il recepimento in Italia

Come anticipato, la Direttiva Copyright dopo un lungo iter è oramai stata recepita in Italia con il d.lgs. 177/2021.

L’articolo 1 del decreto introduce gli articoli 70-ter e 70-quater della legge italiana sul diritto d’autore, la l. 633/1941, prevedendo per la prima volta una simile eccezione nell’ordinamento italiano, con la sicura conseguenza di incentivare la ricerca e l’innovazione.

In sede di recepimento sono stati acquisiti i due articoli 3 e 4 nella formulazione adottata dal legislatore europeo, mancando quindi l’occasione di introdurre dei correttivi “nazionali” che avrebbero esteso l’ambito di applicazione delle norme europee.

In primo luogo si rileva, ancora una volta, l’esclusione dei ricercatori in quanto singoli, tra i beneficiari della norma. Inoltre, una significativa mancanza emerge con riferimento alla necessità di cui al Considerando 18 di rendere accessibile l’eccezione in argomento ai materiali online, attraverso l’uso di strumenti che consentano una lettura automatizzata, inclusi i metadati e i termini e le condizioni di un sito web o di un servizio; ciò, infatti, concorrerebbe ad estendere la possibilità di TDM online, ma la previsione non è contemplata dal diritto interno.

Come anticipato al paragrafo precedente, il recepimento poteva essere un’occasione di modifica dei tempi di conservazione di cui all’articolo 4, comma 2; per esempio, fornendo una interpretazione estensiva del criterio del “tempo necessario”, manchevole nel d.lgs.

Conclusioni

È stato ritenuto che l’introduzione dell’eccezione di TDM si è resa necessaria per colmare il gap rispetto ad altri ordinamenti che da tempo hanno concesso libertà nell’utilizzo del Text and Data Mining e permettere all’Europa di progredire nella ricerca e nello sviluppo. L’eccezione di cui in argomento ha anche permesso di acquisire una maggiore certezza e armonia tra le norme interne dei singoli Stati membri, facilitando la cooperazione transnazionale e il funzionamento del Mercato Unico Digitale (Digital Single Market).

È fuor di dubbio, però, che l’intervento possegga delle limitazioni alla piena liberalizzazione dell’estrazione di testo e dati. Ad impedirne il più completo sviluppo è la possibilità, secondo alcuni, di derogarvi ai sensi dell’articolo 4, creando un significativo impedimento alla competitività delle imprese commerciali private nel settore della ricerca e dell’analisi computazionale dei dati, il cui agire potrebbe essere limitato da una disposizione dell’autore che decida di non concedere effettivamente tale eccezione.

Inoltre, per disporre dei dati è necessario essere autorizzati sulla base di una politica di accesso aperto o di accordi contrattuali – quali abbonamenti, tra i titolari dei diritti e gli organismi di ricerca o gli istituti di tutela del patrimonio culturale – o mediante altri mezzi legali. Un simile requisito restringe l’ambito di applicazione della norma a favore di quei soggetti che, quando le opere protette non siano in pubblico dominio, possano concludere accordi di licenza. Ciò limiterebbe l’accesso agli stessi da parte di quegli operatori del mercato, come le start-up, che non posseggono le risorse per accedervi.

I beneficiari di tale intervento, dunque, sono gli enti e le organizzazioni che svolgono una ricerca “pura”: per essi la volontà dell’autore non è più un limite, al contrario dei privati per cui è possibile avere accesso ai dati remunerando i titolari dei diritti per un uso di cui tutta la comunità può beneficiare. È certamente una differenza significativa di trattamento, che potrà ledere i piccoli operatori del mercato, intralciando inevitabilmente il progresso. Senza volere, in questa sede, esprimere giudizi lapidari, non sembra potersi ignorare il fatto che ciò a cui si chiede l’accesso, giova ripeterlo, consiste in dati, il cui trattamento non incide sul valore dell’opera nel suo complesso. Questa consapevolezza, forse, potrebbe giustificare un minore protezionismo nei confronti degli autori e dunque il progressivo abbandono di una impostazione che considera il diritto d’autore uno ius excludendi alios; progredendo magari verso una visione più vicina al fair use americano e ammettendo usi realmente non interferenti con l’opera originaria.

Il serio rischio che si pone è la realizzazione di ciò che è stato definito la “tragedy of the anticommons”, un’espressione coniata da Michelman, il quale ha definito il fenomeno come «un tipo di proprietà in cui tutti i soggetti hanno un diritto di esclusiva sul bene e nessuno, di conseguenza, ha il privilegio di utilizzare il bene se non autorizzato da altri». Tale evento realizza l’utilizzo subottimale di una risorsa comune a causa del veto esercitato sulla stessa da due o più soggetti che detengano più diritti in capo alla stessa.

In un tale quadro, certamente costellato di criticità, sembra opportuno però non dimenticare che l’intervento, analizzato nel corso della trattazione, costituisce certamente un tassello aggiuntivo nel più generale progetto della scienza aperta e nel rapporto tra diritti esclusivi e uso automatizzato. Infatti, è ormai riconosciuto che l’innovazione digitale, dovuta alla combinazione di Big Data, Cloud Computing, tecnologie mobili e Social Media, costituisce il motore del cambiamento e l’opportunità per l’Europa di crescere. All’interno di questo cluster tecnologico, i Big Data migliorano notevolmente le capacità decisionali e, in definitiva, le performance organizzative. Sfruttare l’innovazione basata sui dati, resa possibile dalle tecnologie dei Big Data, è quindi un potente generatore di valore e costituisce un vantaggio reale per l’economia europea nel suo insieme.

