Negli ultimi anni, il dibattito sugli Open Government Data1 ha progressivamente superato una concezione centrata sulla mera pubblicazione dei dataset, spostando l’attenzione verso le condizioni sociali, tecniche e istituzionali che rendono possibile il loro effettivo riuso. In questa prospettiva, il dato aperto non è semplicemente un’informazione resa disponibile in formato accessibile, ma il risultato di un insieme di processi che coinvolgono attori eterogenei, infrastrutture digitali, regole di governance, competenze e forme di intermediazione.
Indice degli argomenti
Gli ecosistemi di dati
La letteratura sugli ecosistemi di dati, nonostante la varietà di definizioni proposte, converge su una serie di caratteristiche fondamentali: l’esistenza di una rete, la presenza di una piattaforma e l’attivazione di processi di connessione e collaborazione tra attori eterogenei. Più specificamente, gli ecosistemi sono composti da reti informali ma strutturate che includono sviluppatori, amministrazioni pubbliche, aziende, intermediari e fornitori di infrastrutture, tutti impegnati nella produzione e nell’estrazione di valore. Le piattaforme – quali portali di dati, API, standard e infrastrutture tecniche – consentono l’interazione, il coordinamento e la generazione di servizi e applicazioni. Allo stesso tempo, gli ecosistemi sono ambienti dinamici in cui gli attori co-evolvono attraverso un’interazione continua tra diversi ambiti di competenza (Adner, 2017; Gawer & Cusumano, 2014).
Da questa prospettiva, gli ecosistemi di dati – compresi quelli basati sui Dati Aperti della Pubblica Amministrazione (OGD) – non possono essere intesi come una semplice raccolta di set di dati, né come una catena di approvvigionamento lineare in cui i dati vengono prodotti, pubblicati e riutilizzati. Piuttosto, essi sono concettualizzati in modo più accurato come sistemi socio-tecnici composti da attori eterogenei, ruoli differenziati, infrastrutture, accordi di governance e relazioni dinamiche all’interno delle quali dati, conoscenza, valore e controllo circolano oltre i confini organizzativi (Kitchin, 2021; Reggi & Dawes, 2022). All’interno di queste configurazioni, i dati vengono prodotti, convalidati, pubblicati, trasformati, interpretati, riutilizzati e, in alcuni casi, reintrodotti nel sistema attraverso circuiti di retroazione. Un ecosistema di dati può anche intersecarsi con altri ecosistemi – come gli ecosistemi software – rendendo i suoi confini intrinsecamente sfumati, sovrapposti e dipendenti dal contesto.
Possiamo, quindi, definire un ecosistema di dati come un insieme di reti interconnesse composte da attori autonomi che, direttamente o indirettamente, producono, consumano o forniscono dati e risorse correlate quali software, servizi e infrastrutture. Ciascun attore svolge uno o più ruoli ed è collegato agli altri attraverso relazioni di collaborazione, competizione e interdipendenza che contribuiscono all’evoluzione e all’autoregolamentazione del sistema. In questa prospettiva, l’ecosistema non coincide né con il set di dati né con la piattaforma che lo ospita, ma con l’insieme di relazioni, infrastrutture e meccanismi di governance che rendono possibile la produzione, la circolazione e l’uso dei dati.
Apertura dei dati e generazione di valore
Questa prospettiva invita a una ridefinizione fondamentale di come dovrebbero essere intesi i dati aperti. Gran parte della letteratura sugli OGD ha trattato l’apertura come una condizione normativa e legale. I dati dovrebbero essere accessibili, riutilizzabili, leggibili e senza restrizioni. Sebbene ciò rimanga essenziale, non è sufficiente a spiegare come i dati generino valore. I dati non diventano effettivamente aperti solo in virtù del loro status giuridico, ma solo all’interno di ecosistemi che ne consentono l’accesso, l’interpretazione e il riutilizzo (Janssen et al., 2012; Zuiderwijk & Janssen, 2014). L’apertura, in altre parole, non è una proprietà intrinseca dei set di dati, ma una condizione emergente plasmata dalle infrastrutture, dagli accordi di governance e dalle capacità degli attori.
Ciò porta a un cambiamento concettuale cruciale. L’ecosistema – non il set di dati – costituisce il vero punto di arrivo e il reale valore aggiunto dei dati aperti. L’apertura dovrebbe, quindi, essere intesa come una condizione necessaria, ma non sufficiente, mentre l’ecosistema rappresenta il meccanismo di generazione di valore. I dati non hanno alcun valore intrinseco se considerati isolatamente; il valore emerge piuttosto in modo relazionale attraverso le interazioni tra gli attori che li producono, convalidano, governano, traducono, diffondono, interpretano e riutilizzano all’interno di specifici accordi socio-tecnici. Il valore aggiunto dei dati aperti risiede, quindi, meno nell’atto formale della pubblicazione, quanto nella densità e nella qualità delle connessioni che essa rende possibili come complementarità tra attori, forme ricorsive di feedback, adattamento ai diversi contesti d’uso e forme distribuite di innovazione e responsabilità (Dawes et al., 2016; Reggi & Dawes, 2016).
Da questa prospettiva, gli ecosistemi di dati aperti sono definiti non solo dagli attori e dalle infrastrutture, ma anche dalla circolazione di flussi multipli. Questi includono flussi di dati (che riguardano il movimento del dato dalla produzione alla pubblicazione e al riuso), flussi di conoscenza (la trasformazione del dato in informazione intelligibile attraverso validazione, classificazione, visualizzazione e contestualizzazione), flussi di valore (riguarda gli esiti generati: trasparenza ambientale, supporto alla pianificazione, informazione civica, ricerca, data journalism e accountability), flussi di feedback (utenti che influenzano i fornitori di dati attraverso canali di contatto e funzioni che possono sostenere forme di retroazione) e flussi di controllo (le regole, gli standard, le procedure e le decisioni che definiscono cosa viene pubblicato, in quale forma e con quali condizioni di accesso (Safarov et al., 2017; Reggi & Dawes, 2022).
Il valore non è immediato o intrinseco, ma distribuito, mediato e spesso indiretto, emergendo attraverso processi di trasformazione e ricombinazione di tutto l’ecosistema. L’ecosistema è, inoltre, multistrato, collegando un livello di dati (dati grezzi), un livello di informazioni (dati elaborati e interpretati) e un livello di valore (applicazioni, servizi, decisioni). È proprio attraverso le connessioni tra questi livelli che i dati acquisiscono produttività sociale e istituzionale.
Ruoli, funzioni e asimmetrie negli ecosistemi
Sebbene la letteratura riconosca ampiamente la natura relazionale degli ecosistemi di dati, spesso rimane analiticamente poco sviluppata per quanto riguarda la differenziazione dei ruoli. Gli attori sono tipicamente raggruppati in categorie generali – quali amministrazioni, utenti, imprese e società civile – senza che venga pienamente analizzata la diversità delle funzioni che svolgono. Tuttavia, gli ecosistemi sono caratterizzati da differenziazione funzionale e interdipendenza, e il valore emerge attraverso combinazioni di ruoli complementari. piuttosto che attraverso l’agire di attori isolati (Adner, 2017; van Schalkwyk et al., 2016). Nessun attore può generare valore da solo. Il valore emerge invece dall’interazione tra produttori di dati, attori della governance e della regolamentazione, facilitatori infrastrutturali, intermediari che traducono e contestualizzano i dati, riutilizzatori per scopi civici, scientifici o economici, e attori che reimmettono nel sistema correzioni, richieste o nuove esigenze informative. È importante sottolineare che questi ruoli non corrispondono perfettamente ai tipi organizzativi. Un singolo attore può svolgere più ruoli e più attori possono condividere funzioni simili. Una pubblica amministrazione può essere sia produttrice che fornitrice; un’azienda può essere sia utente che sviluppatrice di servizi; un attore civico può impegnarsi in attività di advocacy, analisi, traduzione e diffusione. Questa fluidità rafforza la necessità di una comprensione funzionale degli ecosistemi piuttosto che meramente organizzativa. Allo stesso tempo, gli ecosistemi non sono spazi neutri. Sono strutturati da accordi di governance, infrastrutture e asimmetrie di potere. Standard, modelli di licenza, regole di accesso, piattaforme e requisiti di interoperabilità non si limitano a sostenere la circolazione, la modellano, la rendono possibile e la limitano. L’accesso ai dati non garantisce la capacità di interpretarli, riutilizzarli o estrarne valore. Di conseguenza, gli ecosistemi sono caratterizzati da una partecipazione diseguale e da distribuzioni asimmetriche di potere, in cui alcuni attori definiscono standard e infrastrutture, mentre altri rimangono dipendenti da essi (Kassen, 2018; van Schalkwyk et al., 2016). Qualsiasi teoria degli ecosistemi di dati che non distingua chiaramente i ruoli rischia di sottovalutare non solo la pluralità delle funzioni coinvolte, ma anche la distribuzione ineguale del potere e della produzione di valore all’interno dell’ecosistema.
In questo senso, la nozione di ecosistema è analiticamente produttiva solo se va oltre una rappresentazione genericamente relazionale. In questo senso il concetto di ecosistema è utile perché ci permette di superare una visione lineare dei dati come qualcosa di semplicemente prodotto e poi riutilizzato; ma per essere veramente efficace dal punto di vista analitico, deve essere accompagnato da una distinzione più precisa dei ruoli e delle posizioni occupate dai diversi attori. Altrimenti, si corre il rischio di enfatizzare la cooperazione, la connessione e la coevoluzione senza cogliere adeguatamente il fatto che l’ecosistema è anche uno spazio di specializzazione funzionale, di dipendenze reciproche asimmetriche e di capacità disuguali di plasmare la forma, la circolazione e il valore dei dati. Per questo motivo, è utile distinguere almeno tra attori che producono dati; attori che garantiscono la governance e la regolamentazione; attori che rendono possibile la distribuzione infrastrutturale; attori che promuovono la traduzione cognitiva e l’accessibilità; attori che riutilizzano i dati per scopi civici, scientifici o di mercato; e attori che contribuiscono ai processi di feedback segnalando errori, lacune o nuove esigenze di informazione. Una tale articolazione permette di leggere gli ecosistemi dei dati non semplicemente come ambienti di connessione, ma come configurazioni in cui il valore dei dati dipende dalla combinazione – spesso diseguale – di diverse funzioni. In questa prospettiva, l’ecosistema non è semplicemente un mezzo o una fase intermedia nel processo dei dati aperti. È il risultato costruttivo delle politiche sui dati aperti e il luogo chiave in cui il valore viene generato, distribuito e anche contestato.
Il presente contributo applica tale prospettiva al caso del dataset sulla qualità dell’aria pubblicato nel portale Open Data di Regione Lombardia tra i dataset ambientali. Il dataset è stato trattato non come semplice inventario informativo, ma come traccia empirica di un ecosistema di dati. L’obiettivo del contributo è duplice. Da un lato, ricostruire gli attori, i ruoli, le infrastrutture e i flussi che compongono l’ecosistema lombardo della qualità dell’aria. Dall’altro, contribuire teoricamente al dibattito sugli ecosistemi di open data, mostrando che l’apertura del dato deve essere intesa come una proprietà relazionale ed emergente, non come una caratteristica intrinseca del dataset.
L’ecosistema lombardo della qualità dell’aria
L’analisi prende in considerazione il dataset sulla qualità dell’aria presente nel portale Open Data di Regione Lombardia. Il dataset è stato scelto tra i 572 dataset ambientali pubblicati sul portale regionale, con attenzione ai dataset che negli ultimi sei mesi hanno registrato maggiori visualizzazioni e download. Il dataset è stato analizzato non soltanto nei suoi contenuti informativi, ma come punto di accesso a una rete più ampia di attori, infrastrutture e pratiche. In tal senso, il dataset è stato decostruito sulla base di una griglia articolata che ha permesso di ricostruire gli attori coinvolti e i loro rispettivi ruoli, le interdipendenze, i confini, le dinamiche evolutive, la struttura multilivello, le disuguaglianze e le asimmetrie di potere.
Questa scelta metodologica consente di usare il dataset come “traccia empirica” dell’ecosistema. Il punto non è soltanto descrivere il contenuto dei dati ambientali, ma ricostruire il sistema di relazioni che li rende disponibili, affidabili, interpretabili e riutilizzabili. Ne deriva un approccio qualitativo e relazionale, orientato a comprendere il ciclo sociale e tecnico del dato più che a misurarne esclusivamente le proprietà quantitative.
Il caso lombardo della qualità dell’aria si configura come un ecosistema di dati articolato attorno a una cornice di governance regionale, a piattaforme di pubblicazione e coordinamento, a soggetti di intermediazione e rielaborazione locale, e, infine, a una pluralità di utenti e riutilizzatori.
ARPA Lombardia, Regione e portale Open Data
L’attore tecnico centrale è ARPA Lombardia, che presidia la rete delle stazioni di monitoraggio e produce le misure sulle concentrazioni dei fattori inquinanti. ARPA non agisce soltanto come produttore primario del dato, ma anche come validatore tecnico-scientifico. La sua funzione è cruciale perché attribuisce affidabilità alle misurazioni e consente ad altri attori istituzionali e sociali di utilizzarle come base conoscitiva. Nel caso delle emissioni, inoltre, ARPA svolge anche un ruolo di integrazione e organizzazione della conoscenza attraverso il sistema inventariale INEMAR, nel quale il dato non coincide più con la singola misura, ma con una base informativa costruita per territorio, settore emissivo e combustibile.
Accanto ad ARPA si colloca Regione Lombardia, che svolge una funzione di orchestrazione istituzionale. La Regione non coincide con il produttore diretto del dato, ma definisce la cornice normativa, organizzativa e programmatica entro cui i dati ambientali vengono riconosciuti come risorsa pubblica, resi disponibili e valorizzati. Il suo ruolo è, quindi, quello di connettere il livello tecnico-scientifico con quello della politica pubblica, dell’amministrazione e della circolazione istituzionale dell’informazione.
Un terzo nodo fondamentale è Open Data Lombardia, che non può essere interpretato come un semplice repository. Il portale regionale svolge una funzione infrastrutturale: rende pubblici i dati, li classifica, li documenta, li rende scaricabili e potenzialmente riusabili. Inoltre, attraverso strumenti per sviluppatori, segnalazione di casi d’uso, suggerimento di dataset e funzioni di contatto, la piattaforma contribuisce a organizzare le relazioni tra fornitori e potenziali riutilizzatori. In questo senso, la piattaforma è insieme dispositivo tecnico e spazio di coordinamento ecosistemico.
Sul piano infrastrutturale, la Fig.1 mette in luce anche il ruolo di ARIA S.p.A., attore meno visibile ma rilevante come supporto all’infrastruttura digitale regionale. Questo aspetto è importante perché mostra che gli ecosistemi di dati non sono composti solo dagli attori che producono o usano direttamente i dati, ma anche da soggetti che rendono possibile la loro pubblicazione, manutenzione e circolazione.
Dalla Fig.1 emerge anche il ruolo degli attori di intermediazione. Ne è un esempio l’uso da parte del Comune di Milano (AMAT) dei dati standardizzati e validati da ARPA per redigere il report di monitoraggio quotidiano sulla qualità dell’aria del Comune di Milano. Per costruire l’output informativo focalizzato su scala urbana, AMAT non trasferisce semplicemente il dato da una piattaforma all’altra, ma lo seleziona, lo riorganizza e lo contestualizza. In questo modo, il dato regionale viene trasformato in una risorsa informativa locale, più immediatamente leggibile e utilizzabile da cittadini, decisori politici e altri attori urbani. In questo processo è interessante osservare la posizione ibrida del Comune di Milano: non produce il dato primario, ma lo riusa istituzionalmente e lo rende disponibile attraverso il proprio portale. Esso agisce, dunque, sia come riutilizzatore sia come publisher locale, mostrando come il riuso istituzionale non coincida con una semplice consultazione del dato, ma con la sua trasformazione in una nuova risorsa informativa.

Fig.1 Ecosistema lombardo dei dati sulla qualità dell’aria
Ruoli, interdipendenze e flussi
L’analisi del caso suggerisce che la distinzione tradizionale dicotomica tra data provider e data user è insufficiente. Gli attori dell’ecosistema occupano posizioni differenziate e spesso sovrapposte. ARPA è produttore, validatore e organizzatore della conoscenza. Regione Lombardia è orchestratore istituzionale; Open Data Lombardia è infrastruttura di pubblicazione e coordinamento; ARIA S.p.A. è abilitatore tecnico; AMAT è intermediario e traduttore; il Comune di Milano è riutilizzatore e publisher locale; cittadini, ricercatori, giornalisti, consulenti e decisori sono utenti e riutilizzatori con bisogni e capacità molto diverse. Questa articolazione mostra che il valore del dato non viene creato da un singolo attore. Al contrario, esso emerge dall’interdipendenza tra funzioni. Il produttore tecnico ha bisogno della piattaforma per rendere visibile il dato; la piattaforma deve essere popolata con dati affidabili e documentati; gli intermediari necessitano di dati validati da rielaborare; gli utenti finali hanno bisogno di traduzioni e contestualizzazioni; e, infine, i decisori orientano le loro scelte amministrative e politiche sulla base di basi di dati organizzate.
I flussi di feedback, infine, appaiono come una dimensione teoricamente rilevante, ma empiricamente più debole. Il portale regionale offre canali di contatto e funzioni che possono sostenere forme di retroazione, processi che non sono sempre direttamente osservabili. Questo aspetto merita attenzione. Un ecosistema può prevedere la possibilità di feedback senza che esso diventi una forma stabile e influente di co-governance.
Apertura, intermediazione e asimmetrie di potere
Il caso lombardo conferma che l’apertura del dato è una condizione più complessa della semplice disponibilità online. Un dataset può essere scaricabile e formalmente aperto, ma la sua effettiva utilizzabilità dipende da metadati, affidabilità, competenze, interfacce, strumenti e soggetti intermediari.
Nel caso analizzato, AMAT e il Comune di Milano riducono la distanza tra dato tecnico e informazione pubblica. Essi non sono meri canali di trasmissione, ma attori che selezionano, riorganizzano e ricontestualizzano. Questo conferma che l’intermediazione è una componente costitutiva dell’ecosistema, non un elemento accessorio. Senza intermediari, il dato rischierebbe di restare disponibile ma poco socialmente utilizzabile.
Tuttavia, l’ecosistema non è privo di asimmetrie. La Fig.1 mostra che l’accesso non elimina le differenze di risorse e capacità. Alcuni attori controllano la produzione, la validazione, gli standard e le infrastrutture; altri possono soltanto accedere ai dati già configurati da altri. I cittadini, pur essendo formalmente inclusi, non dispongono necessariamente delle competenze tecniche e cognitive per trasformare il dato in conoscenza o in capacità di intervento. Al contrario, attori istituzionali, tecnici e professionali dispongono di maggiore potere nel definire la forma, il significato e il valore del dato.
Da questo punto di vista, l’ecosistema lombardo appare formalmente aperto, ma sostanzialmente stratificato. L’apertura consente l’accesso, ma non distribuisce automaticamente capacità interpretativa, influenza decisionale o valore. Questo ultimo aspetto permette di collegare il caso empirico a una questione più ampia: le infrastrutture non sono mai neutrali, perché incorporano standard, classificazioni, priorità e forme di controllo.
Verso una prospettiva ecosistemica: il valore della rete oltre il dataset
Il principale risultato dell’analisi è che il dataset sulla qualità dell’aria non può essere letto come oggetto isolato. Esso è piuttosto la manifestazione visibile di un ecosistema più ampio, composto da attori, regole, infrastrutture e pratiche. La pubblicazione sul portale regionale è solo un momento del ciclo del dato. La fase iniziale coincide con la produzione, la misurazione, la validazione e l’organizzazione dei dati; successivamente vi sono interpretazione, rielaborazione, riuso e potenziale feedback.
Questa lettura consente di formulare tre considerazioni teoriche.
La prima è che l’apertura è una proprietà emergente. Un dato è effettivamente aperto non solo quando è pubblicato, ma quando l’ecosistema consente a una pluralità di attori di accedervi, comprenderlo e riutilizzarlo. L’apertura dipende, dunque, dalla qualità dell’infrastruttura, dalla chiarezza dei metadati, dalla presenza di intermediari e dalla capacità degli utenti di trasformare il dato in conoscenza.
La seconda è che gli ecosistemi di dati sono policentrici, ma asimmetrici. Essi coinvolgono molti attori, ma non tutti hanno lo stesso potere. Alcuni nodi sono più centrali perché controllano produzione, validazione, standard e pubblicazione; altri sono periferici perché dipendono dalle forme in cui il dato viene reso disponibile.
La terza è che l’ecosistema è multiscalare. Nel caso lombardo, il dato nasce a livello regionale, viene organizzato in infrastrutture regionali, può essere integrato in sistemi specialistici come INEMAR e viene poi rielaborato a scala urbana da AMAT e dal Comune di Milano. Questa circolazione tra scale diverse mostra che il valore del dato cambia in base al contesto di uso.
L’analisi del dataset sulla qualità dell’aria di Regione Lombardia mostra chiaramente che gli ecosistemi di open data non coincidono con la semplice pubblicazione di dati aperti. Essi sono configurazioni sociotecniche nelle quali attori eterogenei, infrastrutture, regole, competenze e pratiche di riuso interagiscono in modo dinamico.
Il contributo del caso alla letteratura consiste nel mostrare che l’apertura deve essere studiata non come attributo del dataset, ma come esito di una rete di relazioni. Ciò implica spostare l’attenzione dalla domanda “il dato è aperto?” alla domanda “quali condizioni rendono questo dato effettivamente accessibile, interpretabile e riusabile, e per chi?”. Questa seconda questione consente di far emergere non solo le opportunità offerte dagli Open Data, ma anche i limiti, le disuguaglianze e le asimmetrie che attraversano gli ecosistemi.
In conclusione, il caso lombardo della qualità dell’aria mostra che gli Open Data sono tanto più efficaci quanto più l’ecosistema che li sostiene è capace di connettere produzione affidabile, infrastrutture robuste, intermediazione cognitiva, governance trasparente e possibilità reali di riuso. Al tempo stesso, ci ricorda che l’accesso formale non equivale a partecipazione sostanziale: l’apertura dei dati rimane una promessa incompiuta se non è accompagnata da capacità, mediazioni e forme di redistribuzione del potere conoscitivo.
Bibliografia
Adner, R. (2017). Ecosystem as structure: An actionable construct for strategy. Journal of Management, 43(1), 39–58. https://doi.org/10.1177/0149206316678451
Dawes, S. S., Vidiasova, L., & Parkhimovich, O. (2016). Planning and designing open government data programs: An ecosystem approach. Government Information Quarterly, 33(1), 15–27. https://doi.org/10.1016/j.giq.2016.01.003
Gawer, A., & Cusumano, M. A. (2014). Industry platforms and ecosystem innovation. Journal of Product Innovation Management, 31(3), 417–433. https://doi.org/10.1111/jpim.12105
Janssen, M., Charalabidis, Y., & Zuiderwijk, A. (2012). Benefits, adoption barriers and myths of open data and open government. Information Systems Management, 29(4), 258–268. https://doi.org/10.1080/10580530.2012.716740
Kassen, M. (2018). Open data and its institutional ecosystems: A comparative cross-jurisdictional analysis of open data platforms. Canadian Public Administration, 61(1), 109–129. https://doi.org/10.1111/capa.12260
Kitchin, R. (2021). Data Lives: How Data Are Made and Shape Our World. Bristol University Press. (Nota: Le fonti contengono solo la versione del 2014).
Reggi, L., & Dawes, S. S. (2022). Creating open government data ecosystems: Network relations among governments, user communities, NGOs and the media. Government Information Quarterly, 39(1), 101675. https://doi.org/10.1016/j.giq.2022.101675
Safarov, I., Meijer, A., & Grimmelikhuijsen, S. (2017). Utilization of open government data: A systematic literature review of types, conditions, effects and users. Information Polity, 22(1), 1–24. https://doi.org/10.3233/IP-170412
van Schalkwyk, F., Cañares, M., Chattapdhyay, S., & Andrason, A. (2016). Open data intermediaries in developing countries. The Journal of Community Informatics, 12(2), 9–25. https://doi.org/10.15353/joci.v12i2.3219
Zuiderwijk, A., & Janssen, M. (2014). Open data policies, their implementation and impact: A framework for comparison. Government Information Quarterly, 31(1), 17–29. https://doi.org/10.1016/j.giq.2013.04.003












