lo studio

Open data contro la corruzione: (solo) un Comune su due è virtuoso

L’Italia è un’eccellenza internazionale per la pubblicazione dei dati sui contratti pubblici. Tuttavia, come mostra il Report Synapta sulla qualità dei dati relativi ai contratti di acquisto dei comuni italiani, molte PA hanno potuto continuare per anni a pubblicare dati di bassa qualità. C’è, insomma, molto lavoro da fare

27 Gen 2020
Federico Morando

CEO and co-founder at Synapta, independent researcher

Sofia Rosati

Data Quality Analyst at Synapta

Silvia Sanna

Responsabile Comunicazione a Synapta

dati data big data data scraping

Le Pubbliche Amministrazioni italiane spendono ogni anno circa 150 miliardi di euro per l’acquisto di servizi e forniture e per l’esecuzione di lavori e hanno l’obbligo di pubblicare online i dati che riguardano questi affidamenti.

I contratti pubblici stipulati ogni anno rappresentano l’8,5% del PIL Italiano o, se si considerassero solo gli acquisti intermedi di beni e servizi, circa il 5,5%. Oltre al significativo impatto sull’economia nazionale, il procurement pubblico è strategico per l’impatto che può avere sull’innovazione del Paese, come ricordato spesso da policy maker e ricercatori (di recente, ad esempio, nel rapporto Italia digitale: la “macchina” è pronta a correre? dell’Osservatorio Agenda Digitale del Politecnico di Milano).

L’obbligo di pubblicare i dati relativi ai contratti pubblici è sancito dalla Legge Anticorruzione (Legge n. 190/2012), che obbliga le Pubbliche Amministrazioni a pubblicare nei propri siti web istituzionali una serie di dati, tra i quali: l’oggetto del contratto; l’elenco degli operatori invitati a presentare offerte; l’aggiudicatario; l’importo di aggiudicazione; i tempi di completamento dell’opera e servizio o fornitura.

La pubblicazione è prevista entro il 31 gennaio di ogni anno e l’adempimento viene vigilato dall’Autorità Nazionale Anticorruzione (ANAC)

Data la rilevanza dei fenomeni economici descritti da questi dati, e le potenzialità di monitoraggio civico che abilitano, abbiamo condotto una ricerca sulla qualità degli open data pubblicati da oltre settemila comuni italiani dal 2012 al 2018, studiando in particolare la completezza, coerenza e precisione dei dati.

Ma cosa significa che un dato è di qualità?

Verso la qualità dei dati

Con dati puliti o di qualità ci si riferisce a dati che sono privi di errori, standardizzati in un formato unico per ogni campo in modo tale che si possano confrontare fra loro e che siano coerenti rispetto al loro significato e al resto dei dati e, grazie alla mancanza di errori, è possibile condurre analisi affidabili.

WHITEPAPER
DATI: fonte imprescindibile per le aziende! PROTEGGILI e mantienili CONFORMI alle regole
Big Data
Sicurezza

Per individuare i diversi aspetti della qualità dei dati abbiamo usato come riferimento lo standard ISO/IEC 25024 Measurement of data quality e, dopo aver analizzato le numerose metriche possibili, abbiamo selezionato quelle che potevano essere calcolate automaticamente e sulla base dei dati pubblicati dalle PA italiane, identificato le seguenti dimensioni della qualità:

  • Completezza: un dato è completo se è popolato rispetto a tutte le entità per cui è richiesta la compilazione (semplificando, non ci sono celle non compilate);
  • Coerenza: un dato è detto coerente se ha attributi che non hanno contraddizioni tra di loro (il valore di una cella non contraddice quanto indicato in un’altra);
  • Precisione: un dato è preciso quando ha attributi esatti o se è nel giusto formato (es., se è previsto che il separatore per i decimali sia la virgola e siano presenti due cifre decimali, si usa quella e non il punto e vi sono sempre e solo due cifre dopo la virgola).

I risultati della ricerca

Per ognuno dei campi oggetto di pubblicazione (oggetto del contratto, aggiudicatario, etc.) e per ciascuna delle dimensioni di qualità del dato applicabili, abbiamo calcolato un punteggio. Ad esempio, per la completezza, più sono i campi che mancano, più è basso il “punteggio” relativo, ovvero l’Indice di completezza.

Per riassumere ulteriormente l’analisi, abbiamo infine calcolato una media pesata (rimandiamo al report per ulteriori dettagli) di tutti i punteggi delle singole categorie, ottenendo un Indice della qualità complessiva del contratto: 1 è il massimo ed è associato ad un contratto perfettamente compilato (dal punto di vista degli indicatori che abbiamo misurato in modo automatico), mentre 0 è il minimo; empiricamente, possiamo affermare che già per valori attorno allo 0,5-0,6 la comprensibilità del contratto risulta quasi del tutto compromessa anche per un essere umano che legga con attenzione i dati in esame.

La buona notizia è che la distribuzione della qualità dei contratti dei Comuni italiani è concentrata su valori alti dell’Indice di qualità e ciò sta a significare che generalmente le Pubbliche Amministrazioni pubblicano bene i dati. Infatti dividendo il totale di 7.663 Comuni fra quelli che pubblicano in media contratti di qualità alta (ovvero che passano sostanzialmente tutti i nostri check automatici), media (ovvero presenta errori, ma è ancora leggibile) e bassa (dove i contratti sono incomprensibili e la loro pubblicazione è sostanzialmente inutile o addirittura fuorviante), risulta che un Comune su due (50,74%) è virtuoso e che i casi di pubblicazioni veramente scadenti sono solo il 3,95%.

Un’ipotesi che si potrebbe avanzare per spiegare la presenza di dati di bassa qualità è che la pubblicazione per la Legge Anticorruzione sia percepita come una pura formalità da alcune Pubbliche Amministrazioni: è probabile che nessuno rilegga neppure questi dati (perché se lo facesse si renderebbe conto del fatto che sono incomprensibili). E quando il dato non ha uno scopo, che sia di analisi o mera consultazione, si perde la necessità di mantenerlo, aggiornarlo o pulirlo, creando quindi un circolo vizioso che rende i dati meno utili.

Le 12 città maggiori

Per entrare ulteriormente nel dettaglio sulla questione della completezza dei dati, e per mostrare quanto possa essere variegato il quadro a riguardo, abbiamo scelto a titolo di esempio le 12 maggiori città italiane per popolazione.

Analizzando il numero medio di contratti pro capite si può notare una blanda correlazione fra il numero di contratti stipulati e il numero di abitanti di un Comune. All’estremo inferiore si notano le anomalie del Comune di Palermo e di quelli di Napoli, Torino e Catania: è possibile che alcuni di questi enti non abbiano pubblicato tutti i loro dati.

Viceversa, il Comune di Verona e il Comune di Firenze hanno un valore pro capite molto superiore alla media: per entrambi si nota che nel periodo di questo studio vengono stipulati molti contratti riguardanti lavori di edilizia pubblica. In ogni caso è complesso stimare la copertura dei contratti pubblicati rispetto al totale di quelli effettivamente stipulati, poiché mancano dati ufficiali di sintesi sul numero di CIG (e dunque contratti) effettivamente utilizzati da ciascun ente.

La variabilità dell’indice di completezza complessiva dei contratti di questi enti è piuttosto grande: approfondendo, si nota anche che ciò è spesso dovuto a specifici campi che uno dei comuni pubblica particolarmente male.

Ad esempio, guardando il dettaglio dei grafici dei singoli Comuni si nota che il Comune di Palermo non pubblica le date e gli importi e il Comune di Bologna non pubblica le date, ed è per questo che occupano gli ultimi posti nella classifica (anche se Bologna si comporta molto bene rispetto ad altre tipologie di informazioni).

In classifica questi enti sono preceduti dal Comune di Genova, che pubblica l’importo liquidato meno della metà delle volte, e l’importo concordato solo il 67% sul totale. È sempre poi il Comune di Palermo che pubblica l’oggetto con minor frequenza fra tutte le città, infatti è mancante circa una volta su 10 (in questi casi, sostanzialmente non si sa nulla di comprensibile rispetto a cosa il comune abbia effettivamente comprato). La procedura di scelta del contraente e l’oggetto sono le informazioni più presenti. Complessivamente è Venezia che pubblica i contratti più completi, anche se insieme a Catania e Palermo compila il CIG (il codice univoco, identificativo delle singole procedure) solo 3 volte su 4 (e si tratta di un’omissione che può non saltare all’occhio ad un essere umano che legga i dati, ma grave rispetto alle possibilità di incrociare questi dati con altre banche dati, siccome il CIG è spesso la chiave per identificare in modo automatico un contratto). Sono però Genova e Napoli a pubblicare meno quest’ultimo dato: la prima delle due città lo compila il 58% delle volte sul totale, mentre la seconda il 40%.

Trasparenza amministrativa: bene, ma non benissimo

Anche se abbiamo sottolineato alcune lacune rispetto alla pubblicazione dei dati sui contratti pubblici, ci pare giusto concludere ricordando che l’Italia è un’eccellenza a livello internazionale per quel che riguarda la pubblicazione dei dati sui contratti pubblici. Infatti, nel 2018 la Banca Dati Nazionale dei Contratti Pubblici (BDNCP) dell’Autorità Nazionale Anticorruzione si è classificata al primo posto nella competizione Better Governance through Procurement Digitalization 2018 – categoria National Contract Register, alla quale hanno partecipato i principali registri dei contratti pubblici europei.

In media, noi stessi abbiamo potuto rilevare una buona qualità dei dati pubblicati (la qualità del 60% dei singoli contratti analizzati risulta quasi perfetta). Tuttavia, il report a cui abbiamo lavorato e che potete leggere in formato integrale mostra, e noi riteniamo sia grave, che un numero non trascurabile di PA abbia potuto continuare per anni a pubblicare dati di bassa qualità.

Per bassa qualità intendiamo dati pubblicati così male da vanificare del tutto la possibilità di comprendere a quale contratto pubblico quei dati si riferiscano. Inoltre, i loro errori possono compromettere la potenzialità di fare analisi affidabili sui dati perché vengono inevitabilmente alterati i valori di sintesi: un singolo contratto erroneamente valorizzato ad un miliardo di euro può alterare il valore medio di un’intera provincia o regione.

Insomma, bene, ma resta molto lavoro da fare, e ci piacerebbe che questa nostra analisi fosse uno stimolo a continuare a migliorare lungo la strada della trasparenza amministrativa, mettendo a disposizione di tutti dati pubblici di qualità, che tra l’altro abilitano riutilizzi orientati al monitoraggio civico, ma anche attività di analisi per la razionalizzazione della spesa e la business intelligence.

INFOGRAFICA
Industry 5.0, guida per CFO: come valorizzare i dati di produzione
Big Data
Manifatturiero/Produzione
@RIPRODUZIONE RISERVATA

Speciale PNRR

Tutti
Incentivi
PA
Sostemibilità
Analisi
Formazione
Salute digitale
Sicurezza
Sostenibilità
Digital Economy
Formazione
Trasferimento tecnologico, il Mise mette sul piatto 7,5 milioni
Strategie
PSN e Strategia Cloud Italia: a che punto siamo e come supportare la PA in questo percorso
Dispersione idrica
Siccità: AI e analisi dei dati possono ridurre gli sprechi d’acqua. Ecco gli interventi necessari
PNRR
Cloud, firmato il contratto per l’avvio di lavori del Polo strategico
Formazione
Competenze digitali, stanziati 48 milioni per gli Istituti tecnologici superiori
Iniziative
Digitalizzazione delle reti idriche: oltre 600 milioni per 21 progetti
Competenze e competitività
PNRR, così i fondi UE possono rilanciare la ricerca e l’Università
Finanziamenti
PNRR, si sbloccano i fondi per l’agrisolare
Sanità post-pandemica
PNRR, Missione Salute: a che punto siamo e cosa resta da fare
Strategie
Sovranità e autonomia tecnologica nazionale: come avviare un processo virtuoso e sostenibile
La relazione
Pnrr e PA digitale, l’alert della Corte dei conti su execution e capacità di spesa
L'editoriale
Elezioni 2022, la sfida digitale ai margini del dibattito politico
Strategie
Digitale, il monito di I-Com: “Senza riforme Pnrr inefficace”
Transizione digitale
Pnrr: arrivano 321 milioni per cloud dei Comuni, spazio e mobilità innovativa
L'analisi I-COM
Il PNRR alla prova delle elezioni: come usare bene le risorse e centrare gli obiettivi digitali
Cineca
Quantum computing, una svolta per la ricerca: lo scenario europeo e i progetti in corso
L'indice europeo
Desi, l’Italia scala due posizioni grazie a fibra e 5G. Ma è (ancora) allarme competenze
L'approfondimento
PNRR 2, ecco tutte le misure per cittadini e imprese: portale sommerso, codice crisi d’impresa e sismabonus, cosa cambia
Servizi digitali
PNRR e trasformazione digitale: ecco gli investimenti e le riforme previste per la digitalizzazione della PA
Legal health
Lo spazio europeo dei dati sanitari: come circoleranno le informazioni sulla salute nell’Unione Europea
Servizi digitali
PNRR e PA digitale: non dimentichiamo la dematerializzazione
Digital Healthcare transformation
La trasformazione digitale degli ospedali
Governance digitale
PA digitale, è la volta buona? Così misure e risorse del PNRR possono fare la differenza
Servizi digitali
Comuni e digitale, come usare il PNRR senza sbagliare
La survey
Pnrr e digitale accoppiata vincente per il 70% delle pmi italiane
Missione salute
Fascicolo Sanitario Elettronico alla prova del PNRR: limiti, rischi e opportunità
Servizi pubblici
PNRR: come diventeranno i siti dei comuni italiani grazie alle nuove risorse
Skill gap
PNRR, la banda ultra larga crea 20.000 nuovi posti di lavoro
Il Piano
Spazio, Colao fa il punto sul Pnrr: i progetti verso la milestone 2023
FORUMPA2022
PNRR e trasformazione digitale: rivedi i Talk di FORUM PA 2022 in collaborazione con le aziende partner
I contratti
Avio, 340 milioni dal Pnrr per i nuovi propulsori a metano
Next Generation EU
PNRR, a che punto siamo e cosa possono aspettarsi le aziende private
Fondi
Operativo il nuovo portale del MISE con tutti i finanziamenti per le imprese
Servizi comunali
Il PNRR occasione unica per i Comuni digitali: strumenti e risorse per enti e cittadini
Healthcare data platform
PNRR dalla teoria alla pratica: tecnologie e soluzioni per l’innovazione in Sanità
Skill
Competenze digitali, partono le Reti di facilitazione
Gli obiettivi
Scuola 4.0, PNRR ultima chance: ecco come cambierà il sistema formativo
Sistema Paese
PNRR 2, è il turno della space economy
FORUM PA 2022
FORUM PA 2022: la maturità digitale dei comuni italiani rispetto al PNRR
Analisi
PNRR: dalla Ricerca all’impresa, una sfida da cogliere insieme
Innovazione
Pnrr, il Dipartimento per la Trasformazione digitale si riorganizza
FORUM PA 2022
PA verde e sostenibile: il ruolo di PNRR, PNIEC, energy management e green public procurement
Analisi
PNRR, Comuni e digitalizzazione: tutto su fondi e opportunità, in meno di 3 minuti. Guarda il video!
Rapporti
Competenze digitali e servizi automatizzati pilastri del piano Inps
Analisi
Attuazione del PNRR: il dialogo necessario tra istituzioni e società civile. Rivedi lo Scenario di FORUM PA 2022
Progetti
Pnrr, fondi per il Politecnico di Torino. Fra i progetti anche IS4Aerospace
Analisi
PNRR, Colao fa il punto sulla transizione digitale dell’Italia: «In linea con tutte le scadenze»
La Svolta
Ict, Istat “riclassifica” i professionisti. Via anche al catalogo dati sul Pnrr
Analisi
Spazio, Colao fa il punto sul Pnrr: i progetti verso la milestone 2023
FORUM PA 2022
Ecosistema territoriale sostenibile: l’Emilia Romagna tra FESR e PNRR
Il Piano
Innovazione, il Mise “centra” gli obiettivi Pnrr: attivati 17,5 miliardi
Analisi
PNRR: raggiunti gli obiettivi per il primo semestre 2022. Il punto e qualche riflessione
Analisi
PNRR: dal dialogo tra PA e società civile passa il corretto monitoraggio dei risultati, tra collaborazione e identità dei luoghi
Webinar
Comuni e PNRR: un focus sui bandi attivi o in pubblicazione
Analisi
Formazione 4.0: cos’è e come funziona il credito d’imposta
PA e Sicurezza
PA e sicurezza informatica: il ruolo dei territori di fronte alle sfide della digitalizzazione
PA e sicurezza
PNRR e servizi pubblici digitali: sfide e opportunità per Comuni e Città metropolitane
Water management
Water management in Italia: verso una transizione “smart” e “circular” 
LE RISORSE
Transizione digitale, Simest apre i fondi Pnrr alle medie imprese
Prospettive
Turismo, cultura e digital: come spendere bene le risorse del PNRR
Analisi
Smart City: quale contributo alla transizione ecologica
Decarbonizzazione
Idrogeno verde, 450 milioni € di investimenti PNRR, Cingolani firma
Unioncamere
PNRR, imprese in ritardo: ecco come le Camere di commercio possono aiutare
I fondi
Industria 4.0: solo un’impresa su tre pronta a salire sul treno Pnrr
Formazione
Trasferimento tecnologico, il Mise mette sul piatto 7,5 milioni
Strategie
PSN e Strategia Cloud Italia: a che punto siamo e come supportare la PA in questo percorso
Dispersione idrica
Siccità: AI e analisi dei dati possono ridurre gli sprechi d’acqua. Ecco gli interventi necessari
PNRR
Cloud, firmato il contratto per l’avvio di lavori del Polo strategico
Formazione
Competenze digitali, stanziati 48 milioni per gli Istituti tecnologici superiori
Iniziative
Digitalizzazione delle reti idriche: oltre 600 milioni per 21 progetti
Competenze e competitività
PNRR, così i fondi UE possono rilanciare la ricerca e l’Università
Finanziamenti
PNRR, si sbloccano i fondi per l’agrisolare
Sanità post-pandemica
PNRR, Missione Salute: a che punto siamo e cosa resta da fare
Strategie
Sovranità e autonomia tecnologica nazionale: come avviare un processo virtuoso e sostenibile
La relazione
Pnrr e PA digitale, l’alert della Corte dei conti su execution e capacità di spesa
L'editoriale
Elezioni 2022, la sfida digitale ai margini del dibattito politico
Strategie
Digitale, il monito di I-Com: “Senza riforme Pnrr inefficace”
Transizione digitale
Pnrr: arrivano 321 milioni per cloud dei Comuni, spazio e mobilità innovativa
L'analisi I-COM
Il PNRR alla prova delle elezioni: come usare bene le risorse e centrare gli obiettivi digitali
Cineca
Quantum computing, una svolta per la ricerca: lo scenario europeo e i progetti in corso
L'indice europeo
Desi, l’Italia scala due posizioni grazie a fibra e 5G. Ma è (ancora) allarme competenze
L'approfondimento
PNRR 2, ecco tutte le misure per cittadini e imprese: portale sommerso, codice crisi d’impresa e sismabonus, cosa cambia
Servizi digitali
PNRR e trasformazione digitale: ecco gli investimenti e le riforme previste per la digitalizzazione della PA
Legal health
Lo spazio europeo dei dati sanitari: come circoleranno le informazioni sulla salute nell’Unione Europea
Servizi digitali
PNRR e PA digitale: non dimentichiamo la dematerializzazione
Digital Healthcare transformation
La trasformazione digitale degli ospedali
Governance digitale
PA digitale, è la volta buona? Così misure e risorse del PNRR possono fare la differenza
Servizi digitali
Comuni e digitale, come usare il PNRR senza sbagliare
La survey
Pnrr e digitale accoppiata vincente per il 70% delle pmi italiane
Missione salute
Fascicolo Sanitario Elettronico alla prova del PNRR: limiti, rischi e opportunità
Servizi pubblici
PNRR: come diventeranno i siti dei comuni italiani grazie alle nuove risorse
Skill gap
PNRR, la banda ultra larga crea 20.000 nuovi posti di lavoro
Il Piano
Spazio, Colao fa il punto sul Pnrr: i progetti verso la milestone 2023
FORUMPA2022
PNRR e trasformazione digitale: rivedi i Talk di FORUM PA 2022 in collaborazione con le aziende partner
I contratti
Avio, 340 milioni dal Pnrr per i nuovi propulsori a metano
Next Generation EU
PNRR, a che punto siamo e cosa possono aspettarsi le aziende private
Fondi
Operativo il nuovo portale del MISE con tutti i finanziamenti per le imprese
Servizi comunali
Il PNRR occasione unica per i Comuni digitali: strumenti e risorse per enti e cittadini
Healthcare data platform
PNRR dalla teoria alla pratica: tecnologie e soluzioni per l’innovazione in Sanità
Skill
Competenze digitali, partono le Reti di facilitazione
Gli obiettivi
Scuola 4.0, PNRR ultima chance: ecco come cambierà il sistema formativo
Sistema Paese
PNRR 2, è il turno della space economy
FORUM PA 2022
FORUM PA 2022: la maturità digitale dei comuni italiani rispetto al PNRR
Analisi
PNRR: dalla Ricerca all’impresa, una sfida da cogliere insieme
Innovazione
Pnrr, il Dipartimento per la Trasformazione digitale si riorganizza
FORUM PA 2022
PA verde e sostenibile: il ruolo di PNRR, PNIEC, energy management e green public procurement
Analisi
PNRR, Comuni e digitalizzazione: tutto su fondi e opportunità, in meno di 3 minuti. Guarda il video!
Rapporti
Competenze digitali e servizi automatizzati pilastri del piano Inps
Analisi
Attuazione del PNRR: il dialogo necessario tra istituzioni e società civile. Rivedi lo Scenario di FORUM PA 2022
Progetti
Pnrr, fondi per il Politecnico di Torino. Fra i progetti anche IS4Aerospace
Analisi
PNRR, Colao fa il punto sulla transizione digitale dell’Italia: «In linea con tutte le scadenze»
La Svolta
Ict, Istat “riclassifica” i professionisti. Via anche al catalogo dati sul Pnrr
Analisi
Spazio, Colao fa il punto sul Pnrr: i progetti verso la milestone 2023
FORUM PA 2022
Ecosistema territoriale sostenibile: l’Emilia Romagna tra FESR e PNRR
Il Piano
Innovazione, il Mise “centra” gli obiettivi Pnrr: attivati 17,5 miliardi
Analisi
PNRR: raggiunti gli obiettivi per il primo semestre 2022. Il punto e qualche riflessione
Analisi
PNRR: dal dialogo tra PA e società civile passa il corretto monitoraggio dei risultati, tra collaborazione e identità dei luoghi
Webinar
Comuni e PNRR: un focus sui bandi attivi o in pubblicazione
Analisi
Formazione 4.0: cos’è e come funziona il credito d’imposta
PA e Sicurezza
PA e sicurezza informatica: il ruolo dei territori di fronte alle sfide della digitalizzazione
PA e sicurezza
PNRR e servizi pubblici digitali: sfide e opportunità per Comuni e Città metropolitane
Water management
Water management in Italia: verso una transizione “smart” e “circular” 
LE RISORSE
Transizione digitale, Simest apre i fondi Pnrr alle medie imprese
Prospettive
Turismo, cultura e digital: come spendere bene le risorse del PNRR
Analisi
Smart City: quale contributo alla transizione ecologica
Decarbonizzazione
Idrogeno verde, 450 milioni € di investimenti PNRR, Cingolani firma
Unioncamere
PNRR, imprese in ritardo: ecco come le Camere di commercio possono aiutare
I fondi
Industria 4.0: solo un’impresa su tre pronta a salire sul treno Pnrr

Articoli correlati

LinkedIn

Twitter

Whatsapp

Facebook

Link