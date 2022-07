Si attendono in questi giorni i risultati della consultazione pubblica delle “Linee Guida recanti regole tecniche per l’attuazione del decreto legislativo 24 gennaio 2006, n. 36 e s.m.i. relativo all’apertura dei dati e al riutilizzo dell’informazione del settore pubblico”.

Il contesto di riferimento è quello della creazione di un mercato unico europeo dei dati, di cui i dati pubblici costituiscono un pezzo di rilievo. Le linee guida vanno così a definire le regole tecniche necessarie all’implementazione delle norme introdotte dal decreto. n. 200/2021, che rappresenta a sua volta il recepimento della Direttiva (UE) 2019/1024, quella che viene comunemente chiamata “direttiva Open Data”.

A cosa servono le linee guida open data

È importante sottolineare come le linee guida si applicano ai documenti contenenti dati pubblici che rientrano nella disponibilità delle pubbliche amministrazioni, degli organismi di diritto pubblico e delle imprese pubbliche e private. In quest’ultimo caso vengono coinvolte le imprese private che gestiscono servizi di pubblico interesse, come ad esempio le aziende private di trasporto pubblico.

Dati dinamici

In particolare, si fa riferimento alle categorie di dati indicate dalla Direttiva e dal Decreto e cioè i dati dinamici, i dati della ricerca e quelli ad elevato valore. Ricordiamo che i dati dinamici sono dati che cambiano continuamente nel tempo. Come, ad esempio, i dati relativi alla posizione in tempo reale dei mezzi di trasporto pubblico, ai dati in tempo reale relativi al traffico, ai parcheggi e in generale a tutti quei dati generati dalla Smart City. Sono in sostanza quei dati che vengono generati in modo automatico da sensori. Questi dati devono essere resi disponibili tramite API, e a questo proposito la guida indica anche le modalità con cui devono essere progettata e costruite.

Le API, infatti, dovranno essere conformi alle “Linee Guida sull’interoperabilità tecnica delle Pubbliche Amministrazioni” e le “Linee Guida Tecnologie e standard per la sicurezza dell’interoperabilità tramite API dei sistemi informatici”, adottate con la Determinazione di AgID n. 547/2021.

Dati della ricerca finanziata con fondi pubblici

Per quanto riguarda i dati della ricerca, sono da prendere in considerazione quelli che rappresentano il risultato delle attività di ricerca finanziata con soldi pubblici. Si tratta di statistiche, risultati di esperimenti, misurazioni, osservazioni risultanti dall’indagine sul campo, risultati di indagini, immagini e registrazioni di interviste come già riportato nella direttiva Open Data.

Non si fa riferimento esplicito ai microdati ma in questo elenco possiamo trovare sia dati elaborati, ad esempio le statistiche, ma anche dati elementari come possono essere le misurazioni o i dati relativi alle singole osservazioni di indagini sul campo. L’aspetto positivo è che tutto ciò viene collocato in un contesto più ampio che è quello relativo al Programma nazionale per la ricerca (PNR). In particolare il “Piano nazionale per la scienza aperta” (in corso di definizione) e il “Piano nazionale per le Infrastrutture di Ricerca” che sono parti integranti del PNR e che andranno a costituire il framework di riferimento per l’Open Science nel nostro Paese.

Dati ad alto valore

Ho già parlato in passato della direttiva Open Data (2019/1024) e in particolare dei dati ad alto valore. Sono dataset che sono ritenuti strategici per poter generare “servizi, applicazioni a valore aggiunto e nuovi posti di lavoro”.

Sono dati che possono avere alte potenzialità in ambito sociale, economico, ambientale, nonché nella creazione di servizi innovativi. Sono soprattutto dati che hanno ampie potenzialità di riuso, specie da parte delle PMI. Sono dati che la Commissione Europea ha individuato come dati che appartenenti alle seguenti categorie tematiche: dati geospaziali, dati relativi all’osservazione della terra e all’ambiente, dati meteorologici, dati statistici, dati relativi alle imprese e alla proprietà delle imprese, dati relativi alla mobilità. I dettagli su quali dovranno essere e come dovranno essere fatti i dataset di ogni categoria tematica saranno resi noti una volta completati i lavori per definirli, lavori questi tutt’ora in corso. In ogni caso, gli High Value Dataset dovranno essere resi disponibili via API oltre che come “bulk” download. E tranne che per i dati geografici (dove si fa riferimento allo standard INSPIRE), i set di dati dovranno essere corredati da una accurata documentazione online che deve contenere la definizione della struttura e della semantica dei dati.

Dati interoperabili disponibili in tutta l’Ue

L’obiettivo che si vuole raggiungere è quello di rendere disponibili le stesse tipologie di dati per tutti i Paesi membri. Abbiamo visto infatti che le possibilità di riuso di un dato sono fortemente limitate quando quel dato è disponibile solo per una limitata porzione di territorio. Lo stesso dato, quando invece diventa disponibile, ad esempio, per tutti i Paesi UE diventa riusabile non soltanto a livello nazionale, ma anche a livello europeo, dando la possibilità all’intero sistema delle imprese dell’Unione di generare servizi a valore aggiunto.

Ricordiamo che come riportato in uno studio dal titolo “The economic impact of Open Data” realizzato qualche tempo fa, le dimensioni potenziali del mercato europeo relativo agli Open Data potrebbero arrivare fino a 200-330 miliardi di euro nel 2025, impiegando e quindi dando lavoro a quasi due milioni di persone.

Il valore dei dati lo si ottiene mettendoli assieme e questo vuol dire rendere i dati interoperabili tra loro. Ma per poterli mettere assieme diventa importante adottare standard di riferimento per i metadati. Un primo standard (DCAT-AP_IT, definito nelle “Linee guida per i cataloghi dati”) consente di definire quelli che sono i metadati descrittivi associati al singolo dataset.

Sono i metadati che servono per associare ad un dataset tutta quella serie di metainformazioni necessarie all’alimentazione del Catalogo Nazionale Dati e di conseguenza dell’”European Data Portal”.

La semantica dei dati

Ma la parte decisamente più strategica riguarda come dovrà essere opportuno modellare i singoli dataset prima del loro rilascio. Lo scorso 30 giugno è stato rilasciato il “Catalogo Nazionale della Semantica dei Dati”. È un progetto che ha visto la collaborazione tra il Dipartimento della Trasformazione Digitale e l’Istat. Quest’ultima, in qualità di Ente attuatore, ha portato a termine nei tempi previsti il primo obiettivo della Missione 1, Componente 1, Subinvestimento 1.3.1 del PNRR. L’obiettivo è quello di fornire standard comuni di riferimento per l’armonizzazione dei dati tra amministrazioni pubbliche in modo da favorirne la comprensione, lo scambio e l’interoperabilità.

Un primo passo importante che parte dal lavoro fatto da Agid negli anni scorsi con il progetto OntoPiA. E che dovrà spingere le tante amministrazioni che pubblicano dati aperti a rivedere profondamente i propri processi di pubblicazione dati. Dati che, quando possibile, dovranno basarsi proprio sulle ontologie e i vocabolari controllati del Catalogo.

La regola da seguire sarà infatti quella di “esaminare modelli dati, ontologie e vocabolari controllati esistenti per verificare se i concetti hanno già entità, proprietà e, ove presenti, URI ampiamente adottati, specie se in ambito europeo. Solo in caso contrario, l’ente che pubblica i dati può definire e pubblicare il proprio modello dati, ontologia o vocabolario controllato al fine di definire concetti che non sono stati specificati altrove”.

