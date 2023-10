Agid ha da poco rilasciato il documento “Linee Guida recanti regole tecniche per l’apertura dei dati e il riutilizzo dell’informazione del settore pubblico”, a seguito del recepimento della Direttiva UE 2019/1024 sugli Open Data.

Il documento sostituisce il precedente del 2014. Si tratta di un importante passo avanti verso l’utilizzo di standard e formati aperti per la circolazione dei dati pubblici, ma ora occorre lavorare anche sul fronte della “cultura”.

Perché le linee guida

Secondo la Direttiva Ue, la costruzione di un mercato unico dei dati e di un’economia basata sugli stessi è un obiettivo strategico dell’Unione Europea, per agevolare la circolazione dei dati a beneficio di tutti, amministrazioni pubbliche, imprese, ricercatori e cittadini.

Negli ultimi anni, la quantità di dati disponibili, a partire da quelli pubblici, la raccolta e la produzione di nuove tipologie di dati, e l’evoluzione delle tecnologie per l’analisi, lo sfruttamento e l’elaborazione dei dati, come l’apprendimento automatico, l’intelligenza artificiale e l’internet delle cose, sono cresciuti in modo esponenziale, e hanno reso necessaria la redazione di un nuovo documento che tenesse in considerazione tutto questo.

Le Linee Guida si applicano a tutti i dati pubblici e tutti i documenti contenenti dati pubblici detenuti da pubbliche amministrazioni, organismi di diritto pubblico e imprese pubbliche e private; ai dati e ai documenti i cui diritti di proprietà intellettuale sono detenuti dalle biblioteche, comprese quelle universitarie, i musei e gli archivi, solo se il loro riutilizzo è autorizzato; ai dati della ricerca; ai dati territoriali; e ai documenti già diffusi per il riutilizzo alla data di entrata in vigore delle indicazioni del Decreto.

I dati della ricerca devono rispettare i requisiti di reperibilità, accessibilità, interoperabilità e riutilizzabilità che rappresentano i 4 principi del framework FAIR (Findable, Accessible, Interoperable, Reusable).

Come devono essere messi a disposizione i dati pubblici

Ovviamente, ci sono anche dei casi in cui le Linee Guida non vengono applicate, come per esempio tutti i documenti o le loro parti che riguardano la protezione dei dati personali, in conformità con la disciplina legislativa in materia, la libertà e la segretezza della corrispondenza, e gli interessi economici e commerciali di una persona fisica o giuridica.

I dati pubblici che rientrano nell’ambito di applicazione delle Linee Guida devono essere messi a disposizione per il riutilizzo a fini commerciali e non commerciali:

in formato leggibile meccanicamente , strutturato in modo tale da consentire alle applicazioni software di individuare, riconoscere ed estrarre facilmente i dati in base alla loro struttura interna;

, strutturato in modo tale da consentire alle applicazioni software di individuare, riconoscere ed estrarre facilmente i dati in base alla loro struttura interna; in formato aperto, pubblico, documentato esaustivamente e neutro rispetto agli strumenti tecnologici necessari per la fruizione dei dati stessi;

rispetto agli strumenti tecnologici necessari per la fruizione dei dati stessi; in modalità accessibile attraverso le tecnologie dell’informazione e della comunicazione;

attraverso le tecnologie dell’informazione e della comunicazione; gratuitamente o con costi marginali per la riproduzione, messa a disposizione e divulgazione dei documenti, nonché per l’anonimizzazione di dati personali o per le misure adottate per proteggere le informazioni commerciali di tipo riservato;

per la riproduzione, messa a disposizione e divulgazione dei documenti, nonché per l’anonimizzazione di dati personali o per le misure adottate per proteggere le informazioni commerciali di tipo riservato; secondo i termini di licenze standard , disponibili in formato digitale;

, disponibili in formato digitale; provvisti dei relativi metadati.

I formati da prediligere

L’Allegato A delle Linee Guida riporta il modello a 5 stelle per i dati aperti, e l’Allegato B descrive i formati più comuni. I dati devono essere resi disponibili in formato aperto e leggibile meccanicamente con un livello di almeno 3 stelle, nella classificazione fornita dall’allegato A: il formato da preferire è RDF (Resource Description Framework), l’unico con quattro stelle, seguito da XML, JSON e CSV con tre stelle, tutti leggibili meccanicamente, e infine da ODS e XMLS, leggibili meccanicamente in modo solo parziale.

Qui bisogna fare una distinzione, perché l’Allegato A descrive il formato XLSX come non proprietario, mentre nella realtà la versione non proprietaria (o Strict) di XLSX di fatto non esiste se non sulla carta, mentre la totalità dei file XLSX che si trovano in circolazione appartiene alla versione XLSX Transitional, la versione proprietaria (anche secondo ISO/IEC).

Tra l’altro, facendo riferimento al requisito dell’interoperabilità, le Linee Guida affermano che dati e metadati devono poter essere combinati in modo trasparente con altri dati e/o strumenti, per cui devono essere conformi ai formati e agli standard riconosciuti. Il fatto che i file XLSX non rispettino lo standard ISO/IEC a cui fanno riferimento, e quindi non siano conformi alla descrizione, rende di fatto impossibile una corretta interoperabilità, se non autoriferita (ovvero, i file sono interoperabili solo con il software che li ha creati).

Forse è solo un caso, ma l’Allegato B – che descrive i formati più comuni – tra i formati aperti per i documenti include solo ODF (Open Document Format), di cui ODS è parte come formato di descrizione dei dati tabellari (o fogli elettronici), oltre a PDF e Akoma Ntoso, standard OASIS che non conosco.

L’importanza dell’interoperabilità

Le Linee Guida si concludono con un Allegato C, che contiene un riepilogo dei requisiti e delle raccomandazioni. Sulla base della mia esperienza con la pubblica amministrazione, e non solo in Italia, sarebbe opportuno che i responsabili ICT degli enti pubblici stampassero queste poche pagine e le tenessero in evidenza nel proprio ufficio, perché troppe volte ho visto condividere dati proprietari come se fossero aperti e interoperabili.

Infatti, non basta che i dati siano facili da reperire, perché sono disponibili online sul sito dell’ente, e che siano liberamente accessibili. L’interoperabilità è un fattore fondamentale che viene quasi sempre sottovalutato, per cui la coerenza dei formati con gli standard di riferimento viene affidata alle dichiarazioni dei vendor, che ovviamente non hanno alcun interesse a rivelare le incompatibilità, che sono dettate dalle strategie commerciali.

Conclusioni

Troppo spesso, sui siti della pubblica amministrazione, e non solo in Italia, troviamo dati e informazioni condivisi solamente in formato DOCX e XLSX, il cui riutilizzo “forza” l’acquisto di una licenza di Microsoft Office in quanto il file originale è stato costruito così male – perché l’utente non è stato formato – da non essere interoperabile con nessun altro software.

In questo senso, le “Linee Guida recanti regole tecniche per l’apertura dei dati e il riutilizzo dell’informazione del settore pubblico” sono un passo in avanti, ma non bastano senza un impegno specifico nella direzione della crescita culturale degli operatori, e quindi senza una formazione tesa a creare una conoscenza degli standard e dei formati aperti, e delle loro caratteristiche.