Questo sito web utilizza cookie tecnici e, previo Suo consenso, cookie di profilazione, nostri e di terze parti. Chiudendo questo banner, scorrendo questa pagina o cliccando qualunque suo elemento acconsente all'uso dei cookie. Leggi la nostra Cookie Policy per esteso.OK

lo studio

Open data contro la corruzione: (solo) un Comune su due è virtuoso

L’Italia è un’eccellenza internazionale per la pubblicazione dei dati sui contratti pubblici. Tuttavia, come mostra il Report Synapta sulla qualità dei dati relativi ai contratti di acquisto dei comuni italiani, molte PA hanno potuto continuare per anni a pubblicare dati di bassa qualità. C’è, insomma, molto lavoro da fare

27 Gen 2020
Federico Morando

CEO and co-founder at Synapta, independent researcher

Sofia Rosati

Data Quality Analyst at Synapta

Silvia Sanna

Responsabile Comunicazione a Synapta


Le Pubbliche Amministrazioni italiane spendono ogni anno circa 150 miliardi di euro per l’acquisto di servizi e forniture e per l’esecuzione di lavori e hanno l’obbligo di pubblicare online i dati che riguardano questi affidamenti.

I contratti pubblici stipulati ogni anno rappresentano l’8,5% del PIL Italiano o, se si considerassero solo gli acquisti intermedi di beni e servizi, circa il 5,5%. Oltre al significativo impatto sull’economia nazionale, il procurement pubblico è strategico per l’impatto che può avere sull’innovazione del Paese, come ricordato spesso da policy maker e ricercatori (di recente, ad esempio, nel rapporto Italia digitale: la “macchina” è pronta a correre? dell’Osservatorio Agenda Digitale del Politecnico di Milano).

L’obbligo di pubblicare i dati relativi ai contratti pubblici è sancito dalla Legge Anticorruzione (Legge n. 190/2012), che obbliga le Pubbliche Amministrazioni a pubblicare nei propri siti web istituzionali una serie di dati, tra i quali: l’oggetto del contratto; l’elenco degli operatori invitati a presentare offerte; l’aggiudicatario; l’importo di aggiudicazione; i tempi di completamento dell’opera e servizio o fornitura.

La pubblicazione è prevista entro il 31 gennaio di ogni anno e l’adempimento viene vigilato dall’Autorità Nazionale Anticorruzione (ANAC)

Data la rilevanza dei fenomeni economici descritti da questi dati, e le potenzialità di monitoraggio civico che abilitano, abbiamo condotto una ricerca sulla qualità degli open data pubblicati da oltre settemila comuni italiani dal 2012 al 2018, studiando in particolare la completezza, coerenza e precisione dei dati.

Ma cosa significa che un dato è di qualità?

Verso la qualità dei dati

Con dati puliti o di qualità ci si riferisce a dati che sono privi di errori, standardizzati in un formato unico per ogni campo in modo tale che si possano confrontare fra loro e che siano coerenti rispetto al loro significato e al resto dei dati e, grazie alla mancanza di errori, è possibile condurre analisi affidabili.

Per individuare i diversi aspetti della qualità dei dati abbiamo usato come riferimento lo standard ISO/IEC 25024 Measurement of data quality e, dopo aver analizzato le numerose metriche possibili, abbiamo selezionato quelle che potevano essere calcolate automaticamente e sulla base dei dati pubblicati dalle PA italiane, identificato le seguenti dimensioni della qualità:

  • Completezza: un dato è completo se è popolato rispetto a tutte le entità per cui è richiesta la compilazione (semplificando, non ci sono celle non compilate);
  • Coerenza: un dato è detto coerente se ha attributi che non hanno contraddizioni tra di loro (il valore di una cella non contraddice quanto indicato in un’altra);
  • Precisione: un dato è preciso quando ha attributi esatti o se è nel giusto formato (es., se è previsto che il separatore per i decimali sia la virgola e siano presenti due cifre decimali, si usa quella e non il punto e vi sono sempre e solo due cifre dopo la virgola).

I risultati della ricerca

Per ognuno dei campi oggetto di pubblicazione (oggetto del contratto, aggiudicatario, etc.) e per ciascuna delle dimensioni di qualità del dato applicabili, abbiamo calcolato un punteggio. Ad esempio, per la completezza, più sono i campi che mancano, più è basso il “punteggio” relativo, ovvero l’Indice di completezza.

WHITEPAPER
Data Strategy: quali sono le 3 fasi principali del processo di relazione con il cliente?
Big Data
Big Data

Per riassumere ulteriormente l’analisi, abbiamo infine calcolato una media pesata (rimandiamo al report per ulteriori dettagli) di tutti i punteggi delle singole categorie, ottenendo un Indice della qualità complessiva del contratto: 1 è il massimo ed è associato ad un contratto perfettamente compilato (dal punto di vista degli indicatori che abbiamo misurato in modo automatico), mentre 0 è il minimo; empiricamente, possiamo affermare che già per valori attorno allo 0,5-0,6 la comprensibilità del contratto risulta quasi del tutto compromessa anche per un essere umano che legga con attenzione i dati in esame.

La buona notizia è che la distribuzione della qualità dei contratti dei Comuni italiani è concentrata su valori alti dell’Indice di qualità e ciò sta a significare che generalmente le Pubbliche Amministrazioni pubblicano bene i dati. Infatti dividendo il totale di 7.663 Comuni fra quelli che pubblicano in media contratti di qualità alta (ovvero che passano sostanzialmente tutti i nostri check automatici), media (ovvero presenta errori, ma è ancora leggibile) e bassa (dove i contratti sono incomprensibili e la loro pubblicazione è sostanzialmente inutile o addirittura fuorviante), risulta che un Comune su due (50,74%) è virtuoso e che i casi di pubblicazioni veramente scadenti sono solo il 3,95%.

Un’ipotesi che si potrebbe avanzare per spiegare la presenza di dati di bassa qualità è che la pubblicazione per la Legge Anticorruzione sia percepita come una pura formalità da alcune Pubbliche Amministrazioni: è probabile che nessuno rilegga neppure questi dati (perché se lo facesse si renderebbe conto del fatto che sono incomprensibili). E quando il dato non ha uno scopo, che sia di analisi o mera consultazione, si perde la necessità di mantenerlo, aggiornarlo o pulirlo, creando quindi un circolo vizioso che rende i dati meno utili.

Le 12 città maggiori

Per entrare ulteriormente nel dettaglio sulla questione della completezza dei dati, e per mostrare quanto possa essere variegato il quadro a riguardo, abbiamo scelto a titolo di esempio le 12 maggiori città italiane per popolazione.

Analizzando il numero medio di contratti pro capite si può notare una blanda correlazione fra il numero di contratti stipulati e il numero di abitanti di un Comune. All’estremo inferiore si notano le anomalie del Comune di Palermo e di quelli di Napoli, Torino e Catania: è possibile che alcuni di questi enti non abbiano pubblicato tutti i loro dati.

Viceversa, il Comune di Verona e il Comune di Firenze hanno un valore pro capite molto superiore alla media: per entrambi si nota che nel periodo di questo studio vengono stipulati molti contratti riguardanti lavori di edilizia pubblica. In ogni caso è complesso stimare la copertura dei contratti pubblicati rispetto al totale di quelli effettivamente stipulati, poiché mancano dati ufficiali di sintesi sul numero di CIG (e dunque contratti) effettivamente utilizzati da ciascun ente.

La variabilità dell’indice di completezza complessiva dei contratti di questi enti è piuttosto grande: approfondendo, si nota anche che ciò è spesso dovuto a specifici campi che uno dei comuni pubblica particolarmente male.

Ad esempio, guardando il dettaglio dei grafici dei singoli Comuni si nota che il Comune di Palermo non pubblica le date e gli importi e il Comune di Bologna non pubblica le date, ed è per questo che occupano gli ultimi posti nella classifica (anche se Bologna si comporta molto bene rispetto ad altre tipologie di informazioni).

In classifica questi enti sono preceduti dal Comune di Genova, che pubblica l’importo liquidato meno della metà delle volte, e l’importo concordato solo il 67% sul totale. È sempre poi il Comune di Palermo che pubblica l’oggetto con minor frequenza fra tutte le città, infatti è mancante circa una volta su 10 (in questi casi, sostanzialmente non si sa nulla di comprensibile rispetto a cosa il comune abbia effettivamente comprato). La procedura di scelta del contraente e l’oggetto sono le informazioni più presenti. Complessivamente è Venezia che pubblica i contratti più completi, anche se insieme a Catania e Palermo compila il CIG (il codice univoco, identificativo delle singole procedure) solo 3 volte su 4 (e si tratta di un’omissione che può non saltare all’occhio ad un essere umano che legga i dati, ma grave rispetto alle possibilità di incrociare questi dati con altre banche dati, siccome il CIG è spesso la chiave per identificare in modo automatico un contratto). Sono però Genova e Napoli a pubblicare meno quest’ultimo dato: la prima delle due città lo compila il 58% delle volte sul totale, mentre la seconda il 40%.

Trasparenza amministrativa: bene, ma non benissimo

Anche se abbiamo sottolineato alcune lacune rispetto alla pubblicazione dei dati sui contratti pubblici, ci pare giusto concludere ricordando che l’Italia è un’eccellenza a livello internazionale per quel che riguarda la pubblicazione dei dati sui contratti pubblici. Infatti, nel 2018 la Banca Dati Nazionale dei Contratti Pubblici (BDNCP) dell’Autorità Nazionale Anticorruzione si è classificata al primo posto nella competizione Better Governance through Procurement Digitalization 2018 – categoria National Contract Register, alla quale hanno partecipato i principali registri dei contratti pubblici europei.

In media, noi stessi abbiamo potuto rilevare una buona qualità dei dati pubblicati (la qualità del 60% dei singoli contratti analizzati risulta quasi perfetta). Tuttavia, il report a cui abbiamo lavorato e che potete leggere in formato integrale mostra, e noi riteniamo sia grave, che un numero non trascurabile di PA abbia potuto continuare per anni a pubblicare dati di bassa qualità.

Per bassa qualità intendiamo dati pubblicati così male da vanificare del tutto la possibilità di comprendere a quale contratto pubblico quei dati si riferiscano. Inoltre, i loro errori possono compromettere la potenzialità di fare analisi affidabili sui dati perché vengono inevitabilmente alterati i valori di sintesi: un singolo contratto erroneamente valorizzato ad un miliardo di euro può alterare il valore medio di un’intera provincia o regione.

Digital event, 29 aprile
Data Scientist: quali sono le competenze giuste? E quali gli attuali ambiti di applicazione?
Big Data
Big Data

Insomma, bene, ma resta molto lavoro da fare, e ci piacerebbe che questa nostra analisi fosse uno stimolo a continuare a migliorare lungo la strada della trasparenza amministrativa, mettendo a disposizione di tutti dati pubblici di qualità, che tra l’altro abilitano riutilizzi orientati al monitoraggio civico, ma anche attività di analisi per la razionalizzazione della spesa e la business intelligence.

@RIPRODUZIONE RISERVATA

Articolo 1 di 3