La Copyright Infrastructure è l’infrastruttura per il diritto d’autore: realizzarla è un intervento chiave per il futuro delle industrie culturali e dell’economia. E, a cascata, per la cultura del Paese.

Le attività immateriali sono i pilastri dell’economia odierna: lo ricorda, in apertura, il Piano d’azione sulla proprietà intellettuale della Commissione Europea per sostenere la ripresa e la resilienza dell’UE.

Le industrie ad alta intensità di diritti di proprietà intellettuale attualmente rappresentano quasi il 45% del PIL europeo e contribuiscono direttamente alla creazione di quasi il 30% di tutti i posti di lavoro. Tra queste sono comprese le industrie culturali di vari settori, che poggiano sul diritto d’autore.

Per realizzare la Copyright Infrastructure sono necessari innovazione, ricerca e sviluppo, una linea strategica chiara e investimenti che ne supportino l’implementazione.

Copyright Infrastructure: una cornice condivisa per la gestione dei diritti d’autore

L’idea alla base della copyright infrastructure è semplice: far sì che la gestione dei diritti in era digitale funzioni come Internet. Verrebbe da dire: informazioni e servizi sui diritti d’autore devono essere raggiungibili “in un click”, se questa espressione non fosse di per sé riduttiva, in quanto discriminerebbe uno degli agenti principali in questa partita, le macchine.

Nel mondo digitale, infatti, le tecnologie devono fornire soluzioni necessariamente fruibili non solo dagli esseri umani ma anche dalle macchine, secondo protocolli e standard da esse interpretabili.

Per navigare sul web, tutte le macchine utilizzano protocolli e standard tecnologici (DNS, TCP/IP, html) per trasmettere dati e visualizzare informazioni su browser, anche se ogni sito viene creato con sistemi differenti e risiede su server differenti: allo stesso modo, l’accesso a informazioni su diritti e licenze dovrebbe avvenire utilizzando una cornice tecnologica di alto livello condivisa, fatta di protocolli, architetture e standard aperti, mentre i servizi, le informazioni e le stesse licenze sono gestiti dai sistemi differenti e distribuiti.

Questa è la copyright infrastructure: aperta, distribuita, plurale e volontaria.

L’idea non è completamente nuova (il che è un bene, benché possa sembrare un controsenso parlando di innovazione) e poggia sui risultati di iniziative, progetti e ricerche di oltre un decennio, a cui l’Italia e il nucleo di ricerca e sviluppo dell’AIE hanno partecipato attivamente, da ARROW e FORWARD alla Linked Content Coalition, dal Copyright Hub a RDI Rights Data Integration fino ad ARDITO.

Copyright Infrastructure: perché il momento è adesso

Se l’idea non è nuova, perché questa accelerazione e urgenza proprio ora? Le ragioni sono fondamentalmente due.

La prima ragione, di natura non tecnologica, è il contesto legislativo fornito dalla Direttiva Copyright del 2019.

Fino a questo momento, le iniziative di innovazione nel campo della gestione dei diritti si erano principalmente concentrate sull’elaborazione di soluzioni tecnologiche per affrontare di volta in volta problemi o sfide particolari, legati a un aspetto specifico della gestione dei diritti o a un solo settore dell’industria dei contenuti. Soluzioni utilissime, ma di natura parziale e spesso tra loro scollegate. Di contro, quando le iniziative avevano respiro più ampio, cross-settoriale, con una visione tecnologica d’insieme per i dati sui diritti, si sono spesso rivelate in anticipo sui tempi, proponendo possibili soluzioni a esigenze che ancora non erano manifeste o completamente comprese.

La Direttiva Copyright ha posto sotto gli occhi di tutti l’esigenza di un approccio diverso e di un contenitore comune in cui le differenti iniziative possano convivere ed essere collegate in modo coerente e armonico.

Il caso del rapporto tra titolari dei diritti e piattaforme social offre l’esempio più facile da spiegare, ma la copyright infrastructure porterebbe benefici e semplificherebbe tutte le operazioni in cui è necessario recuperare informazioni sui diritti o anche solo riconoscere contenuti.

Immaginiamo di essere una piattaforma che, secondo l’art. 17 della Direttiva, deve mettere in atto i massimi sforzi, secondo elevati standard di diligenza professionale di settore, per identificare contenuti protetti dai diritti d’autore, al fine di pubblicarli, se ha ottenuto una licenza da parte del titolare, o impedirne il caricamento, se il titolare così ha indicato e ha fornito le informazioni che ne rendano possibile l’identificazione.

Al momento le strade percorribili sono due:

a) che la piattaforma utilizzi, o costruisca, il proprio sistema proprietario, a cui i molteplici titolari dei diritti si devono adattare. Una via efficace dal punto di vista di ciascuna piattaforma (il Content ID di Google ne è l’esempio più conosciuto), ma una soluzione proprietaria, come tale governata unicamente dalle logiche di business del suo “proprietario”.

b) che la piattaforma utilizzi le molteplici soluzioni, tecniche o meno, adottate dai titolari dei diritti, sapendo ex ante per ogni contenuto quale soluzione sia a disposizione. Una via complicata per le piattaforme, che rischia di escludere le soluzioni meno rappresentative, sia dal lato piattaforme sia dal lato produttori di contenuti, favorendo la concentrazione.

La copyright infrastructure offre una terza via: la possibilità che tutti gli operatori, ovvero creatori e utilizzatori, incluse le piattaforme, possano connettersi e riconoscere i contenuti, senza doverli necessariamente fornire alla piattaforma, per ottenere le informazioni rilevanti e necessarie sulle condizioni di utilizzo, comprese le informazioni su come ottenere una licenza.

La seconda ragione dell’accelerazione necessaria è tecnologica: l’avvento di tecnologie che per loro natura sembrano essere promettenti per costruire in questa direzione. Il riferimento è ovviamente al mondo blockchain, identificatore di nuova generazione di distribuiti, non-fungible token (NTF), identità digitali con un pizzico di intelligenza artificiale.

Senza voler entrare nello specifico, ciò che caratterizza queste tecnologie è:

la loro natura distribuita , particolarmente adatta ad abilitare la pluralità delle soluzioni e dei servizi fornendo un metodo di accesso condiviso (evitando quindi la tentazione di risolvere il problema attraverso la creazione di nuovi servizi o database centralizzati) e che consente di mantenere separata la gestione delle informazioni sui diritti dalla gestione dei diritti stessa (come, per esempio, la fornitura di licenze);

la loro natura orientata alla macchina , ovvero la possibilità di orchestrare in maniera automatizzata i processi e i flussi di informazioni, dando realtà alla celebre espressione di Charles Clark: "La risposta alla macchina è nella macchina";

la loro natura trasparente, aperta e verificabile che consente di demandare parzialmente alla tecnologia stessa aspetti chiave quali l'identificazione, il riconoscimento di contenuti, la costruzione di fiducia tra le parti.

Chiaramente non è tutto oro quello che luccica, né basta una blockchain, dei token e qualche algoritmo per risolvere tutti i problemi. Né le soluzioni sono lì, pronte per essere utilizzate. Ci sono sviluppi da fare e nodi importanti da sciogliere, primo fra tutti quello della governance e dell’origine della fiducia sulle informazioni reperibili in rete, problema non certo esclusivo delle informazioni sui diritti d’autore.

Però la direzione è promettente e per questo è importante che le industrie culturali facciano un’attenta riflessione su quello che queste tecnologie possono offrire in base alle specifiche esigenze e casi d’uso, analizzando la corrispondenza tra requisiti e funzionalità. Questo per poter da un lato capire e selezionare le soluzioni e le tecnologie più adatte all’obiettivo e dall’altro poter intervenire attivamente nel processo di sviluppo tecnologico e nella definizione delle soluzioni.

Copyright Infrastructure: quale identificatore gestirà i processi?

Prendiamo ad esempio le discussioni in merito allo sviluppo e utilizzo di identificatori di nuova generazione che nel nostro caso devono essere in grado di orchestrare nella copyright infrastructure i processi e gli scambi di dati alla base della gestione dei diritti.

Il più promettente per le industrie culturali, dal nostro punto di vista, è l’International Standard Content Code (ISCC), un identificatore generato dal contenuto stesso.

Applicando una combinazione di algoritmi e tecniche di hashing, da ciascun contenuto viene estratto “il suo DNA” che viene reso sottoforma di un vero e proprio identificatore, con una propria sintassi standard e semantica condivisa. Contenuti identici produrranno ISCC identici, contenuti simili produrranno ISCC in cui parte della stringa è identica e parte differente, il che abilita anche analisi di similarità.

L’insieme delle sue caratteristiche consente di fare confronti tra contenuti utilizzando il solo identificatore, senza analizzare l’intero contenuto.

L’ISCC inoltre è un identificatore non proprietario e può essere utilizzato da tutti gli operatori, senza barriere all’ingresso.

Infine, e questa è forse la vera opportunità, le specifiche sono aperte e gli sviluppatori possono lavorare con le diverse industrie culturali per adattare algoritmi e tecniche ai reali bisogni, in termini di tipologie di contenuti (testo, video, immagine, audio, multimedia), granularità dell’identificazione (singola immagine in un testo, frammenti di video, parti di testo) e relazioni di somiglianza.

Il fatto poi che l’ISCC sia stato progettato (“by-design”) per funzionare al meglio su blockchain, rende possibile il confronto distribuito tra identificatori (e dunque tra contenuti), tenendo traccia immutabile dei soggetti coinvolti.

Riprendendo l’esempio dell’art. 17, immaginiamo l’ISCC come un Content ID non proprietario, basato su algoritmi trasparenti alla cui definizione hanno partecipato anche le industrie culturali, un Content ID utilizzabile da tutti senza necessità di avere entrambi i contenuti da confrontare.

Poi colleghiamo l’identificatore in modo automatico a informazioni su titolarità di diritti e a licenze interpretabili dalle macchine.

Ecco un’applicazione della terza via. E non solo nel contesto dell’art. 17, ma in tutti i casi in cui sia necessaria la comunicazione tra le parti con oggetto contenuti e diritti. E nemmeno solo nel contesto della Direttiva, ma anche a supporto di qualsiasi sistema di gestione dei diritti, o di sistemi e azioni antipirateria, o di individuazione di fake news, o di collegamento tra identificatori di beni culturali e informazioni autorevoli sugli stessi e luoghi in cui sono conservati.

Conclusioni: la tecnologia come alleato per uno strumento necessario

La copyright infrastructure non è solo tecnologia: occorre tenere in considerazioni aspetti legali, di business, di governance, di visione della società. Tuttavia, riflettere su cosa la tecnologia possa o non possa fare può essere d’aiuto ad affrontare anche questi temi in maniera pragmatica.

Sotto questo profilo, la tecnologia non deve essere vista come un qualcosa a esclusivo appannaggio delle Big Tech, ma anche come un alleato di tutti i creatori e titolari di diritti delle industrie dei contenuti. La copyright infrastructure diventa così lo strumento (tecnologico) che supporta sia titolari di diritti sia utilizzatori di contenuti a lavorare in sicurezza, in un mercato aperto, giusto e sostenibile per tutti.

Certo, fare innovazione e proporre soluzioni di larga scala, necessariamente di dimensione transnazionale, può essere più difficile per le industrie dei contenuti che per le Big Tech, ma questo non può e non deve essere un motivo per rinunciare, piuttosto un incentivo per le imprese a fare sistema e per i governi a sostenere, con gli strumenti a disposizione ora e nei prossimi anni, queste innovazioni, tassello essenziale per il rilancio, la ripresa e la sostenibilità di un comparto economico imprescindibile per la società della conoscenza.

È una visione ambiziosa sulla quale in AIE stiamo lavorando e che abbiamo intenzione di portare avanti, in collaborazione con le altre associazioni di categoria del comparto culturale, con un progetto ampio e di filiera per contribuire alla costruzione della copyright infrastructure.

Il PNRR potrebbe essere il luogo giusto per sostenere questo tipo di innovazione, come già detto su queste pagine. Speriamo non sia invece un’occasione sprecata.

