I dati aperti della pubblica amministrazione (Open Government Data, OGD) sono una risorsa incredibile per promuovere la trasparenza, l’innovazione e la partecipazione pubblica, consentendo ai cittadini di monitorare e valutare le prestazioni delle istituzioni e stimolando la crescita economica e lo sviluppo attraverso nuove applicazioni e servizi basati sui dati.
Nonostante queste premesse, l’apertura legale e tecnica dei dati non basta a garantire un riutilizzo efficace e prolifico, al contrario, la mancanza di informazioni di alta qualità può compromettere non solo il riutilizzo dei dati, ma anche l’uso dei portali istituzionali, vanificando i vantaggi attesi in termini di trasparenza. Inoltre, il divario digitale può aggravare le disuguaglianze, poiché non tutti i cittadini hanno lo stesso accesso alla tecnologia o le competenze necessarie per utilizzare efficacemente i dati aperti. Uno studio del dipartimento di sociologia dell’Università Bicocca di Milano si concentra sull’analisi delle tendenze di utilizzo dei dataset OGD in Italia, indagando il livello di consultazione dei dati pubblici e le ragioni alla base della loro fruizione.
Indice degli argomenti
Open government data, gli obiettivi della ricerca di Università Bicocca
La ricerca è guidata da due domande principali: quali sono le tendenze di utilizzo degli OGD nei portali regionali e comunali italiani, e quali fattori ne influenzano l’accesso e l’interesse da parte degli utenti? L’obiettivo è comprendere quale sia il livello d’interesse intorno a questi dati, identificando eventuali disallineamenti tra l’offerta di dati e la domanda da parte di cittadini, ricercatori, istituzioni ecc. in tal senso, l’analisi si concentra su un campione di portali OGD regionali e comunali italiani, selezionati per la loro rilevanza ma soprattutto accessibilità, al fine di evidenziare differenze territoriali e criticità infrastrutturali che possano ostacolare l’uso dei dati.
Il progetto Open Government Data (OGD)del dipartimento di sociologia dell’università di Milano-Bicocca nasce con l’intento di valorizzare i dati aperti prodotti dalla pubblica amministrazione come risorsa strategica per la ricerca scientifica, la trasparenza e l’innovazione sociale. L’obiettivo finale è quello di rendere questi dati non solo maggiormente accessibili, ma anche comprensibili e utili per studiosi, cittadini e istituzioni, promuovendone un uso consapevole a supporto delle politiche pubbliche e stimolare al contempo la partecipazione civica. Tuttavia, per quanto il potenziale degli open data sia largamente riconosciuto, nella pratica il loro utilizzo rimane spesso limitato da ostacoli concreti legati a problemi di accessibilità, frammentarietà dei portali e una documentazione poco chiara.
Partendo da queste premesse, il progetto si è anche interrogato su come e quanto i dati pubblici vengano effettivamente utilizzati e sul ruolo della qualità dei metadati nella loro effettiva fruizione. Da queste riflessioni è nato un lavoro di ricerca che, analizzando i portali OGD di alcune realtà regionali e comunali italiani, ha evidenziato due aspetti centrali: l’utilizzo generalmente basso dei dataset e una marcata eterogeneità tra le regioni e i comuni analizzati, con differenze significative tra Nord, Centro e Sud Italia. Questo studio, ancora in fase esplorativa, rappresenta uno dei molteplici esiti del progetto e conferma la necessità di intervenire sulle banche dati pubbliche affinché possano realmente sostenere una società orientata a decisioni basate sui dati.
Iniziative, benefici e portali open government data
Le iniziative open data si sono diffuse globalmente grazie al progresso tecnologico e alla crescente domanda di trasparenza da parte dei cittadini. Tra le principali iniziative internazionali figurano l’Open Government Partnership (OGP), nata nel 2011, che sostiene governi trasparenti e partecipativi, e la G8 Open Data Charter del 2013, che stabilisce principi fondamentali come “open by default” e l’usabilità dei dati pubblici. A livello nazionale, gli Stati Uniti hanno avviato Data.gov nel 2009, seguiti dal Regno Unito con il proprio portale nel 2010, influenzando anche l’Unione Europea che ha sviluppato l’European Data Portal per favorire l’uso dei dati tra stati membri. Lo scopo di tali iniziative è massimizzare il valore dei dati pubblici per promuovere crescita economica, innovazione e miglioramento dei servizi pubblici.
I benefici derivanti dall’apertura dei dati pubblici sono molteplici e si articolano su tre livelli principali: politico-sociale, economico e tecnico-operativo. (Janssen et al. 2012) Sul piano politico-sociale, i dati aperti aumentano la trasparenza e la responsabilità delle istituzioni, mentre in quello economico, rappresentano una risorsa per l’innovazione: secondo uno studio McKinsey, l’OGD potrebbe generare un valore economico annuo superiore ai 3 trilioni di dollari (Manyika et al. 2013).
I nodi da sciogliere
Tuttavia, uno dei problemi principali emerge nel momento in cui le amministrazioni tendono a misurare il successo delle proprie politiche open data sulla base della quantità di dataset pubblicati, piuttosto che sulla qualità degli stessi o sull’effettivo riutilizzo da parte degli utenti. Una logica che lascia perplessi entrambi i soggetti coinvolti: da un lato, gli utenti dei portali si trovano disorientati di fronte a un’elevata mole di dati speso privi di contesto, categorizzazione e descrizione, interrogandosi sulla reale utilità e affidabilità delle informazioni. Dall’altro, le amministrazioni percepiscono uno scarso interesse da parte dell’utenza, mettendo in discussione la necessità stessa di pubblicazione e la fiducia nel programma. Nonostante queste sfide, la continua evoluzione delle iniziative sui dati aperti riflette un impegno più ampio a promuovere la trasparenza, l’innovazione e l’empowerment dei cittadini nell’era digitale. (Janssen et al. 2012)
In questo contesto, i portali open data hanno il compito di rendere i dati accessibili, navigabili e comprensibili tramite interfacce intuitive e strumenti come ricerche filtrate, descrizioni, visualizzazioni e API. Un aspetto centrale è quindi la qualità di dati e metadati da intendersi in chiave multidimensionale in quanto include aspetti quali correttezza, completezza, rilevanza, disponibilità e coerenza. (Batini et al. 2009) Numerosi studi hanno evidenziato come la scarsa qualità di dati e metadati ostacoli significativamente l’accesso e l’effettivo riutilizzo dei dati aperti (Neumaier et al. 2016; Quarati 2023; Zuiderwijk et al. 2012).
Selezione dei portali e metriche di utilizzo
Il primo obiettivo operativo è identificare le tendenze nell’utilizzo dei portali e dei dataset. Il metodo più usato per misurare la domanda di dati da parte degli utenti si basa su due parametri: il numero di visualizzazioni e download dei dataset. Per “visualizzazioni” (parametro considerato nella ricerca) si intende il numero totale di volte in cui la pagina web di un dataset è stata caricata nel browser, indicatore dell’interesse iniziale verso i dati. (Ubaldi 2013) Le visualizzazioni possono certamente aiutare a misurare l’impatto delle iniziative OGD, ma non sono esaustive. Infatti, diversi portali governativi incoraggiano altre forme di utilizzo degli OGD attraverso la fornitura di strumenti di analisi dei dati, l’implementazione di servizi per i cittadini o report basati sugli OGD. Il portale lombardo, ad esempio, segnala milioni di chiamate API l’anno, suggerendo un utilizzo più ampio non catturato da questo parametro. Nonostante i limiti, il numero di visualizzazioni totali fornisce una base solida per comprendere la domanda e l’uso dei dati pubblici identificando i più popolari e potenzialmente più rilevanti.
Disponibilità di dataset nei portali regionali
L’analisi si è inizialmente focalizzata sui portali regionali, esaminandone struttura e fattibilità, con l’intento di estendere l’esame ad alcune città selezionate. In tal senso, è stata condotta una fase di ricognizione preliminare per identificare le regioni dotate di un portale open data autonomo e successivamente, in giugno 2024, è stato rilevato il numero totale di dataset disponibili e le relative visualizzazioni tramite interrogazione API.

Il grafico dei dataset per regione (fig. 1) mostra una disparità significativa tra le regioni del nord e del sud Italia, offrendo spunti di riflessione sulle dinamiche di sviluppo e implementazione delle iniziative di Open Government Data. Le regioni dell’Italia centro-settentrionale, come Toscana, Trentino-Alto Adige, Lombardia, Emilia-Romagna e Marche, salvo poche eccezioni come la Val d’Aosta, mostrano una disponibilità di dataset più elevata rispetto a molte regioni dell’Italia centro-meridionale; un fenomeno che può essere attribuito a diversi fattori economici e sociali. Storicamente, le regioni settentrionali sono più sviluppate dal punto di vista tecnologico, infrastrutturale e con una cultura dell’innovazione più radicata.
Il caso di Regione Toscana
Tuttavia, maggiore disponibilità di dataset non implica un’elevata qualità dei dati, al contrario, Il caso del portale open data della Regione Toscana è emblematico. A fronte di una notevole quantità di dataset pubblicati (oltre 13.000), emergono criticità significative: più di 6.000 dataset sono etichettati con codici numerici come “000000” o “120000” e privi di descrizione dei tag, mentre oltre 7.000 dataset sono associati al consorzio Lamma (laboratorio di monitoraggio e modellistica ambientale) che pubblica dataset utili ma molto tecnici e altamente granulari, poco accessibili ai meno esperti. Si avverte la mancanza di una sorta di “narrativa” o di casi d’uso concreti che possano guidare l’utente nella comprensione e nell’utilizzo dei dataset, i quali risultano attualmente pubblicati più per utenti esperti che semplici cittadini. Questo rappresenta un esempio di come i dati, pur essendo tecnicamente aperti, non siano fruibili per chiunque nella loro immediatezza. Per ampliare il pubblico e valorizzare il potenziale degli OGD è importante affiancare strategie di mediazione, semplificazione e una comunicazione più orientata agli utenti. Queste problematiche toscane non sono però un caso isolato: analisi simili su altri portali regionali mostrano come, anche in presenza di grandi volumi di dati, la qualità dell’informazione e l’organizzazione dei contenuti siano spesso carenti.
La situazione nel Centro-Sud
La situazione si aggrava nel Centro-Sud, dove le amministrazioni regionali, infatti, sembrano riflettere priorità politiche diverse, verosimilmente concentrate su altre questioni socioeconomiche che limitano l’attenzione e gli investimenti nell’Open Data. Nonostante tali differenze, è opportuno sottolineare che alcune regioni del Sud, come Calabria e Puglia, rappresentino esempi virtuosi di portali OGD: pur non disponendo di grandi quantità di dati, si distinguono per funzionalità e qualità.
Questa analisi esplorativa suggerisce che la quantità di dataset pubblicati non riflette necessariamente la qualità delle informazioni veicolate. Inoltre, nonostante direttive italiane ed europee invitino regioni e comuni a pubblicare dati aperti, sorprende come alcuni enti non dispongano nemmeno di un’infrastruttura dedicata, mentre persistono significative disparità nella disponibilità e qualità dei set di dati tra le regioni. Queste disparità possono indicare problemi di attuazione e conformità, evidenziando la necessità di maggiore impegno e sostegno per uniformare l’accesso e l’uso dei dati pubblici a livello nazionale.
Analisi per capoluoghi

Un discorso analogo a quello delle regioni può essere applicato ai capoluoghi (fig.2) dove si riscontra una significativa disparità tra Nord e Sud, con alcune eccezioni come Palermo, che dispone di molti dati nonostante la sua controparte regionale non ne sia ben provvista. Generalmente invece, la scarsità di portali dedicati dipende dal fatto che queste città tendono a fornire informazioni e set di dati utili direttamente alle regioni, piuttosto che gestire un portale autonomo.
Tale approccio risulta limitante poiché un portale specifico per capoluogo offrirebbe un livello di dettaglio diverso, più mirato, rappresentando così un’opportunità non ancora colta. Innanzitutto, un portale comunale permetterebbe di pubblicare dati a un livello di dettaglio più vicino alla vita quotidiana dei cittadini, riguardanti ad esempio la mobilità urbana, la qualità dell’aria nei quartieri, la gestione dei rifiuti o i bilanci partecipativi. Questo tipo di informazione, se veicolata esclusivamente a livello regionale, rischia di perdersi o di non essere adeguatamente valorizzata. In secondo luogo, aumenterebbe la trasparenza dell’amministrazione locale, facilitando il controllo civico e stimolando una partecipazione più attiva e consapevole della cittadinanza. L’accesso diretto ai dati comunali potrebbe incentivare forme di innovazione civica e il coinvolgimento delle comunità in processi decisionali basati su evidenze.
Infine, sul piano tecnico e organizzativo, un portale comunale garantirebbe maggiore autonomia nella gestione dei dati, aggiornamenti tempestivi, standard più adatti al contesto urbano e collaborazioni con attori locali (università, startup o associazioni); renderebbe l’accesso ai dati pubblici più semplice e fruibile anche per il cittadino medio, il quale non dispone di competenze tecniche avanzate, contrastando il digital divide. I portali regionali, seppur completi, tendono a raccogliere grandi quantità di informazioni eterogenee, spesso mal catalogate o comunque poco intuitive da esplorare, causando confusione e scoraggiando l’uso. Un portale comunale, invece, potrebbe essere progettato con un’interfaccia più user-friendly, focalizzata sulle esigenze informative locali e quotidiane dei cittadini, con categorizzazione chiara e filtri più pertinenti. In questo modo, il portale diventerebbe non solo uno strumento per esperti o sviluppatori, ma anche un mezzo concreto per avvicinare la cittadinanza alla cultura dei dati aperti, promuovendo trasparenza, fiducia istituzionale e partecipazione civica. Tuttavia, la creazione e gestione di portali comunali richiede investimenti per lo sviluppo e il mantenimento delle piattaforme, personale qualificato, formazione continua etc., fattori che rappresentano sfide significative per comuni con risorse limitate, rendendo necessario un supporto istituzionale e una pianificazione strategica.
Le limitazioni tecniche
Nel presente studio è stata posta particolare attenzione a rappresentare le disparità tra Nord, Centro e Sud Italia, selezionando solo alcune regioni e città significative che garantissero un accesso agevole ai dati, tramite API funzionanti e con funzionalità di visualizzazione disponibili. Per questo motivo, non tutte le realtà territoriali sono state incluse, proprio perché molte non offrivano un accesso efficace o presentavano limitazioni tecniche che ne avrebbero compromesso la rappresentatività. Infatti, un ulteriore elemento critico riguarda le limitazioni nell’accesso ai dati: molti portali non garantiscono un facile accesso tramite API, risultando spesso soggetti a restrizioni e mancando di funzionalità chiare per le metriche di visualizzazione dei dataset, limitando uso e conoscenza da parte degli utenti. Sebbene quasi la metà dei portali (45%) fornisca informazioni dirette tramite API sulle visualizzazioni e i download, una quota consistente (35%) non fornisce alcun dato di utilizzo e un’altra parte (15%) presenta problemi di disponibilità o accesso ai dataset stessi. Il 5% offre dati in formato documentale mostrando una varietà di approcci che contribuiscono alla confusione già ipotizzata prima.
Questa selezione ha permesso di restituire un quadro realistico delle condizioni infrastrutturali, culturali e normative che influenzano l’uso e l’impatto degli open data, evidenziando come tali fattori varino significativamente tra le diverse realtà italiane.
Utilizzo dei dataset OGD in Italia: le disparità
L’analisi condotta sui portali regionali ha esaminato la distribuzione delle visualizzazioni dei dataset, suddividendo gli accessi in cinque intervalli non lineari: da 0 a 9, da 10 a 99, da 100 a 999, da 1.000 a 9.999 e oltre 10.000; una suddivisione che ha permesso di evidenziare le tendenze di utilizzo dei dati aperti a livello territoriale. È opportuno sottolineare una premessa: per la regione Puglia, le informazioni sull’utilizzo sono state estratte da un documento fornito dal sito, anziché tramite API, poiché il portale adotta un metodo di raggruppamento delle visualizzazioni basato sulle aree di riferimento più consultate. Ciò non riflette accuratamente la distribuzione complessiva, ma è stato incluso per completezza.

Dalla lavorazione complessiva dei dati emerge che nessuno dei portali presenta una distribuzione normale delle visualizzazioni, ovvero non si riscontra una diffusione uniforme o equilibrata nell’utilizzo delle risorse disponibili: pochi dataset riscuotono interesse mentre la maggior parte resta poco consultata. In particolare, sono pochi i dataset che superano la soglia delle 1.000 visualizzazioni, suggerendo un possibile disallineamento tra domande e offerta o difficoltà nell’accesso e fruizione dei dati stessi.
Solo in alcune realtà, come Lazio e Lombardia, si registrano casi sporadici di dataset con un numero di visualizzazioni superiori alle 10.000, testimonianza di un utilizzo più rilevante e di una maggiore attenzione o interesse verso specifici ambiti di dati. La situazione in Toscana appare più omogenea, con una distribuzione uniforme delle visualizzazioni, tuttavia, il numero elevato di dataset (13.000) comporta una dispersione dell’interesse, con gran parte dei dati poco visualizzati forse a causa di duplicazioni, categorizzazioni inadeguate, scarso rilievo o bassa qualità, con il risultato che molte risorse vengono pubblicate ma solo poche riescono a catalizzare l’attenzione degli utenti.
Lazio e Lombardia si distinguono per un utilizzo elevato, con una buona distribuzione di interesse sui dataset disponibili. La Lombardia si distingue particolarmente, in quanto adotta il portale Socrata (invece di CKAN), pubblica oltre 5.000 dataset (contro i 400 del Lazio) e presenta una distribuzione d’interesse più ampia. Tuttavia, anche in questo caso prevale una forte polarizzazione, con pochi dataset molto popolari che alzano la media, mentre la maggior parte resta poco consultata: è come se un paio di “hit” musicali raccogliessero la quasi totalità degli ascolti, ma poi il resto delle tracce avesse un pubblico limitato.
In Marche e Toscana la media delle visualizzazioni è più bassa: il 75% dei dataset riceve meno di 37 e 74 visualizzazioni rispettivamente, segnalando un interesse limitato. Il Trentino presenta una distribuzione meno dispersa, con valori di visualizzazione relativamente vicini alla media, ma anche in questo contesto emergono picchi isolati (fino a 6.169 visualizzazioni per singolo dataset), indice di un interesse selettivo verso contenuti specifici.

Le differenze nelle città
Anche nelle città si osservano dinamiche simili, ma con alcune differenze sostanziali. Torino e Firenze si distinguono per un buon numero di dataset con oltre 1.000 visualizzazioni, dimostrando un uso efficace. (queste città pubblicano anche un numero significativo di dataset sui propri portali, fig. 2)
Milano, pur avendo una distribuzione piuttosto omogenea dei suoi dataset, presenta un gran numero di elementi che vengono visualizzati da 0 a 99 volte: nonostante la disponibilità di molti dataset, molti di essi non riescono a catturare l’interesse degli utenti. Ciononostante, c’è un picco significativo verso il valore medio delle visualizzazioni, il che implica segnali positivi relativamente ad alcuni dataset che vengono consultati regolarmente e mostrano un buon indice di utilizzo.
Nel sud Italia la situazione cambia: città come Bari e Messina pubblicano meno dataset rispetto a Milano e rivelano un utilizzo decisamente scarso, con la maggior parte dei dataset nelle fasce più basse, probabilmente a causa di una minore rilevanza o accessibilità dei dati. Un caso particolarmente rilevante è quello di Matera che, pur essendo una città di piccole dimensioni, pubblica un numero significativo di dataset (circa 250, Roma ad es.ne pubblica circa 350). Matera si distingue per un buon livello medio e omogeneo di visualizzazioni per dataset, suggerendo che, rispetto ad altre città con un’offerta simile o maggiore, i suoi dataset sono percepiti come più utili o pertinenti dagli utenti. La combinazione tra numero elevato di dataset (per una realtà così piccola) e un interesse concreto da parte della comunità, indica una gestione attenta e una strategia efficace di comunicazione e valorizzazione degli open data. Questo caso dimostra che non è tanto il numero di dataset a fare la differenza, quanto che i dataset siano ben organizzati e rilevanti per gli utenti concentrandosi su standard di alta qualità, accessibilità e utilità, favorendo una maggiore fruizione e un possibile impatto positivo sull’innovazione e sulla trasparenza.
In conclusione, il sottoutilizzo dei dataset e le disparità territoriali suggeriscono la necessità di interventi mirati per migliorare l’accessibilità, la pertinenza e la qualità dei dati. Possibili studi futuri dovrebbero esplorare barriere specifiche e strategie per incrementare l’interesse degli utenti, integrando analisi qualitative e ampliando il campo d’osservazione per una maggiore rappresentatività.
Bibliografia
Batini, Carlo, Cinzia Cappiello, Chiara Francalanci, and Andrea Maurino. 2009. ‘Methodologies for Data Quality Assessment and Improvement’. ACM Computing Surveys 41(3):1–52. doi:10.1145/1541880.1541883.
Janssen, Marijn, Yannis Charalabidis, and Anneke Zuiderwijk. 2012. ‘Benefits, Adoption Barriers and Myths of Open Data and Open Government’. Information Systems Management 29(4):258–68. doi:10.1080/10580530.2012.716740.
Manyika, James, Michael Chui, Farrell, and Steve Van Kuiken. 2013. ‘Open Data: Unlocking Innovation and Performance with Liquid Information’.
Neumaier, Sebastian, Jürgen Umbrich, and Axel Polleres. 2016. ‘Automated Quality Assessment of Metadata across Open Data Portals’. Journal of Data and Information Quality 8(1):1–29.
Quarati, Alfonso. 2023. ‘Open Government Data: Usage Trends and Metadata Quality’. Journal of Information Science 49(4):887–910. doi:10.1177/01655515211027775.
Ubaldi, Barbara. 2013. Open Government Data: Towards Empirical Analysis of Open Government Data Initiatives. Vol. 22. OECD Working Papers on Public Governance. 22. doi:10.1787/5k46bj4f03s7-en.
Zuiderwijk, Anneke, Marijn Janssen, Sunil Choenni, Ronald Meijer, and Roexsana Sheikh Alibaks. 2012. ‘Socio-Technical Impediments of Open Data’. 10(2).














