Open Data, le PA deludono gli imprenditori, "bassa la qualità dei dati"

Il sondaggio

C'è un forte disorientamento fra i potenziali utilizzatori di dati, in primis le aziende che hanno bisogno di dati qualitativamente impeccabili per poter sviluppare analisi e applicazioni. Forse questo è uno dei motivi per cui ancora non si sviluppa un vero e proprio mercato indotto dai dati aperti e dunque una conseguente crescita del settore ICT. Ecco quattro esperienze di avanguardie "deluse"

di Gianluigi Cogo, Regione Veneto

In prossimità dell’appuntamento di Smart city exhibition che quest’anno propone un payoff per "opendatari" dal palato fine: ‘Conoscere, Collaborare e Realizzare nelle Città dei Dati’ e in concomitanza con un seminario che dovrò tenere in Regione Lazio nell’ambito dell’Accademia Open Data , ho voluto approfondire il tema dell’Open Data 4 business che, fra l’altro, mi è propedeutico per una serie di Progetti Europei ai quali professionalmente sto accedendo e che sono ispirati da precedenti esperienze in ambito UE, nonchè suggestionati da un altro payoff che ben si adatta al tema dei dati per il business, ovvero ‘less quantity, more quality’.

Per fare ciò ho volutamente ingaggiato un gruppo di amici fra qui pochi che ad oggi in Italia cercano di fare dell’opendataro una professione remunerativa.

L’elenco degli intervistati, ovviamente, non è esauriente ma offre uno spaccato su questo contesto che già abbiamo immaginato alcuni anni fa come uno di quelli più futuribili e profittevoli.

Qui non voglio confondere idee e contesti diversi, sia chiaro dunque che lascerò fuori il tema dei Big Data rispetto al quale molti analisti di business ipotizzano una forte crescita sopprattutto rispetto alla domanda di professionalità legate alla data analysis.

Ricordo ancora, nell’ormai lontano 2011, quando l’allora Primo Ministro del governo UK in una lettera ai suoi ministri si espresse in modo chiarissimo sul tema dello sviluppo applicativo, e dunque di business, legato alla diffusione del paradigma e della pratica Open Data  con questa netta affermazione: ‘Ci rendiamo anche conto che la trasparenza può essere un volano importante per lo sviluppo economico, grazie alla disponibilità di dati aperti che favoriscono la creazione di nuovi servizi e applicazioni di valore’.

Fu molto chiaro allora il monito che ci invitava tutti ad impegnarci su due fronti. Il primo la ricerca costante e direi ossessiva di trasparenza a tutti i costi (open by default) e il successivo indirizzamento di questo valore e di questa pratica verso la costruzione di applicazioni utili a migliorare la vita.

Nella stessa lettera, per chi avrà la curiosità e la pazienza di leggerla, si indicava come presupposto fondamentale allo sviluppo di servizi applicativi e dunque alla crescita economica indotta da questi, la pratica cosiddetta dell‘Improving data quality che, come avremo modo di percepire dalle interviste, è ancora poco applicata in Italia.

Nel nostro paese, al netto di una normativa ancora frammentata che tende a sfumare il concetto di obbligo di apertura dei dati in opportunità, abbiamo assistito alla corsa per l’esposizione sui portali pubblici di Open Data di enormi quantità di dataset, spesso non supportati da un attività di curation e molto spesso, purtroppo, non aggiornati e mantenuti.

La corsa all’esserci e a dimostrarsi sensibili al tema senza capirne le essenziali potenzialità, sta causando disorientamento fra i potenziali utilizzatori di dati, in primis le aziende che hanno bisogno di dati qualitativamente impeccabili per poter sviluppare analisi e applicazioni.

Forse questo è uno dei motivi per cui ancora non si sviluppa un vero e proprio mercato indotto dai dati aperti e dunque una conseguente crescita del settore ICT che, invece, avrebbe tanto bisogno di svilupparsi al ritmo di altri paesi europei come ad esempio l’UK. Ma lasciamo che siano i protagonisti a raccontarci le esperienze e a fornirci le ricette giuste.

 

 

Gli intervistati:

 

●     Luca Corsato di Opensensordata è un opendataro movimentista con grande attenzione al mondo della cultura e delle arti

 

●     Andrea Nelson Mauro di Dataninja è uno dei primi data scientist italiani, con un orientato al data-journalism e un grande amore per le community, infatti è tra gli animatori di Spaghetti Open Data

 

●     Vittorio Alvino di Depp è anche presidente di Openpolis, un opendataro con forti interessi sociali e politici

 

●     Lorenzo Modena di Openmove, si definisce più inventore che opendataro, ma con i dati ci costruisce servizi di pubblica utilità

 

●     Matteo Brunati di SpazioDati è un opendataro della prima ora e fra i primi ad avventurarsi nel mondo del business open data. Attualmente è corrispondente per l'Italia della ePSI Platform e reviewer per l'Italia della prossima edizione dell'Open Data Barometer.

 

●     Alessio Dragoni di Sciamlab e' un ingegnere del software con esperienza decennale nel campo dell'Enterprise Software e un lungo elenco di progetti di successo nel territorio EMEA.

 

L’intervista:

 

A) Hai un azienda, sei titolare o lavori per un azienda che elabora, sfrutta o analizza Open Data? Se sì, qual’è il nome dell’azienda e cosa fate in concreto?


Luca Corsato: sono amministratore unico e socio di Opensensorsdata:. Facciamo progettazione e strategia su e con Open Data. Usiamo i dati aperti per fare analisi interna e per aiutare i clienti ad elaborare strategie di condivisione.


Andrea Nelson Mauro: In Dataninja lavoriamo con i dati, ma non con gli Open Data.


Vittorio Alvino: In Depp sviluppiamo servizi per l’OpenGovernment. In pratica applicazioni web che rendano accessibili per i cittadini e le imprese i dati della PA. I progetti più conosciuti son quelli legati all’ Associazione Openpolis per la quale curiamo le piattaforme web.


Lorenzo Modena: OpenMove è una soluzione innovativa per la smart mobility, con una spiccata impronta che guarda in direzione della multimodalità, ovvero l’integrazione intelligente di mezzi di trasporto sinergici e sostenibili. La piattaforma è ottimizzata per i tre diversi attori dell’ecosistema della mobilità: utenti, società di trasporto e attività commerciali.

Gli utenti trovano la miglior combinazione di viaggio e possono comodamente pagare da smartphone al miglior prezzo garantito, senza più code al tabaccaio o la caccia al tesoro al parchimetro. OpenMove permette loro di avere a disposizione tutti i mezzi di trasporto nel palmo di una mano, potendo quindi abbracciare una mobilità multimodale e sostenibile.

Per le Pubbliche Amministrazioni è tradizionalmente laborioso e costoso dotarsi dell'infrastruttura necessaria per mettere in piedi un sistema di bigliettazione elettronica. OpenMove garantisce ai gestori del trasporto - pubblico ma anche privato - una soluzione chiavi in mano, facilissima da utilizzare e senza costi di implementazione. Grazie alla piattaforma di backoffice è facile pianificare la mobilità, elaborare statistiche e gestire la contabilità, mentre il personale di controllo avrà in dotazione un’app dedicata per verificare i biglietti emessi.

OpenMove coinvolge inoltre attivamente il terzo attore dello scenario della mobilità: le attività commerciali possono organizzare in autonomia vere e proprie campagne pubblicitaria per promuovere prodotti, servizi ed eventi a clienti profilati e geolocalizzati. OpenMove naturalmente non condivide i dati degli utenti con terzi e non invia nessuna notifica invasiva; agli utenti sono mostrate offerte accuratamente selezionate che li soddisfino per vicinanza, sconto e gusti personali, dando loro la possibilità di incrementare il credito bonus per viaggiare gratis.

 

 

Matteo Brunati: Lavoro come community manager per SpazioDati, una startup trentina che, utilizzando tecnologie legate al mondo Big Data e Semantic Web ed un pizzico di Machine Learning, sviluppa due diversi prodotti fortemente basati sui dati, che spesso possono essere anche disponibili come Open Data.

Dandelion API è una piattaforma che offre diverse API di “text analytics”, che funzionano molto bene anche su testi brevi come quelli provenienti dai Social Media. Il motore semantico sfrutta Wikipedia come fonte di Open Community Data per alimentare il knowledge graph sottostante, e permette di essere differenzianti rispetto ad attori che usano tecnologie NLP (Natural Language Processing).

Il motore semantico infatti, usa la topologia di questo grafo per capire il contesto di un contenuto testuale, e riesce a distinguere se la parola “Lira” sia la moneta o lo strumento musicale, ad esempio.

Questo grafo di conoscenza può essere alimentato da ulteriori dati per specializzare il dominio di conoscenza, ed ovviamente tra le fonti possibili ci sono anche gli Open Data, se di necessaria qualità.

Atoka è un servizio di Lead Generation B2B, frutto di una partnership strategica tra Cerved e SpazioDati. che permette azioni di Sales e Marketing Intelligence sul mercato italiano.

Anche in questo caso, eventuali fonti Open Data che aumentino il contesto informativo sulle aziende sono di assoluta rilevanza, perchè riescono a migliorare l'utilità del servizio verso i clienti.

SpazioDati partecipa a diversi progetti europei per proseguire il lavoro di ricerca e di innovazione sul tema dei dati, come il progetto Fusepool P3 che sta sviluppando uno strumento maggiormente user friendly per pubblicare Linked Open Data, a vantaggio della Pubblica Amministrazione.

Un ulteriore progetto europeo in cui siamo coinvolti è proDataMarket, che ha l'obiettivo di aumentare la trasparenza e l'efficienza del mercato immobiliare, usando pesantemente sia Open Government Data che Open Community Data a livello europeo, assieme a partner di alto livello come Cerved ed ISTAT.

Nell'abilitare le filiere sui dati, SpazioDati mantiene il nodo italiano di DBpedia, la versione machine-readable di Wikipedia.

Per finire, SpazioDati è stata partner tecnologico di Telecom Italia per entrambe le edizioni del Big Data Challenge, mettendo a disposizione la piattaforma di distribuzione dei dati, che ha permesso ai partecipanti di scaricarli sia in forma bulk, che attraverso l'interrogazione via data API.

In questo contesto, assieme alla Fondazione Bruno Kessler quale nodo italiano dell'Open Data Institute (ODI), SpazioDati ha rilasciato i i Big Data dell'edizione 2014 come Open Data, un caso abbastanza unico al mondo per quanto riguarda dati provenienti dal mondo delle aziende di telecomunicazione.

Alessio Dragoni: SciamLab è una società di ingegneria fondata alla fine del 2013 con sede a Roma. La società è una startup in rapida crescita specializzata in moderne soluzioni di gestione di dati complessi e nell'automazione e ottimizzazione dei processi di business. La società è organizzata di tre unità multidisciplinari che collaborano per creare prodotti e fornire servizi innovativi ai propri clienti. DataLab è l'unita che ha rilasciato Amaca® una innovativa piattaforma per la ricerca dei contenuti e l'arricchimento di basi dati (Content Discovery and Data Enrichment) basata su tecnologie BigData che oggi è alla base di diverse implementazioni di successo in Italia nel campo dei dati aperti (Open Data). OpenLab, l'unità specializzata sul settore pubblico ed in particolare nella gestione dei dati pubblici (Public Sector Information). Nell'estate del 2014 viene avviata la terza unità SmartLab con sede a Berlino, Germania e presenza a Varsavia, Polonia dove il team ha costruito Triduino® una versatile piattaforma per la gestione di dati ambientali che risolve alcune sfide importanti del settore delle  Internet of Things dalla disseminazione e gestione di complesse reti di sensori alla analisi dei flussi dei dati in movimento

 

B) Come giudichi in termini generali la qualità offerta dalle PA nei dati esposti a catalogo sui portali di Open Data?

 

Luca Corsato: Confusamente discreta ma senza nessuna strategia interna. La prima condivisione deve avvenire tra uffici e quindi internamente, invece accade il contrario. A questo punto interveniamo per scoprire dati che molto spesso la PA detiene, pubblica ma non usa o sa di avere. I portali Open Data sono inutili per i cittadini e le imprese ma possono essere ottimi strumenti di condivisione interna: quando saranno tali, allora le imprese arriveranno.


Andrea Nelson Mauro: Disorganizzata (ogni PA agisce per conto suo). Quasi per nulla interessante (ci forniscono il numero di colonnine e rastrelliere, ma non i dati sulla differenziata). Quasi inusabile. L'unica azienda che usa Open Data che mi viene in mente è Moovit, l'app sui trasporti pubblici.


Vittorio Alvino: Ampiamente insufficiente. Molte Pubbliche Amministrazioni sono largamente inadempienti anche rispetto agli obblighi di legge. la

Lorenzo Modena: La nostra linfa è costituita dagli Open Data sul trasporto pubblico, ovvero dalle informazioni su fermate, corse, servizio e tariffe. Lo standard de facto è rappresentato dal fomato GTFS, che OpenMove implementa nativamente: ciò significa che ovunque le Pubbliche Amministrazioni espongano questo dato, possiamo implementare la nostra soluzione letteralmente in 10 minuti.

Per la nostra esperienza in Trentino, la qualità dei dati sul trasporto pubblico è buona; sempre più realtà italiane stanno rilasciando i dati aperti in questo formato, ma c’è ancora molta strada per una vera e propria standardizzazione.


Matteo Brunati: La qualità dei dati esposti è mediamente bassa, salvo casi eccezionali.

La problematica maggiore è la mancanza di copertura a livello nazionale, che per modelli di business che necessitano di scalare diventa una debolezza strutturale.

La maggior parte dei dati non risponde a quei requisiti di immediatezza e documentazione necessari a risultare davvero interessanti per un uso massiccio da parte delle aziende.

A meno che non ci siano obiettivi di data curation su quei dati, per servizi consulenziali o piattaforme di data marketplace.


Alessio Dragoni: Fatti salvi alcuni casi la qualità non è sufficiente per un riutilizzo professionale.

La qualità dei dati spesso viene misurata in termini tecnici, ovvero esprimendola in gradi di riutilizzo, tralasciando il valore intrinseco di ciò che viene reso disponibile.

Il numero dei dati disponibili e opportunamente accompagnati da una licenza che ne regola il loro riutilizzo è elevato ma... quanti di questi sono veramente utili ?

Da circa due anni e mezzo, analizziamo la richiesta di dati in base alle interrogazioni e quindi all'interesse dei riutilizzatori che arrivano su opendatahub il primo catalogo italiano di dati aperti creato grazie alle tecnologie della piattaforma Amaca. Stiamo per rilasciare pubblicamente queste statistiche che sono certo saranno una sorpresa tra gli addetti ai lavori

 

C) Cosa dovrebbe fare una PA per incentivare l'uso degli Open Data da parte delle imprese?


Luca Corsato: Non c'è nessun incentivo da attivare ma dell'interesse. Esempio: un'azienda di trasporti ha interesse a condividere i dati con Google perché gli risolve un servizio che altrimenti avrebbe in carico. Google ha individuato un servizio per crearsi utili e generare un vantaggio alle PA (intendendo le aziende di trasporto pubbliche perché vincolate a contratto di servizio pubblico). Questo è l'incentivo che serve: verificare in maniera spietata il livello di servizio. Vale anche per la condivisione dei dati: è utile? migliora il lavoro degli uffici? è un adempimento? se la risposta a queste domande è sì, allora nemmeno la PA ha interesse a condividere dati, e a ragione


Andrea Nelson Mauro: Pubblicare dati il più possibile aggiornati e il più possibile consistenti in termini di quantità/qualità.


Vittorio Alvino: Aumentare completezza e frequenza di aggiornamento dei dati esposti per aumentare credibilità e affidabilità nella disponibilità futura. Ma la nostra idea è che questo sia possibile solo a condizione che la PA cambi cultura e processi per orientarli alla pubblicità, innanzitutto per “se stessa”: per lavorare meglio al proprio interno e con le altre PA, prima ancora che con i cittadini e le imprese.


Matteo Brunati: Dovrebbe ragionare sul processo a lungo termine che a latere crea anche gli Open Data, e non lavorare solo sulla necessità imposta dalla normativa. Rendersi conto che il dato Open è uno degli assett del sistema Italia, per quanto riguarda la società della conoscenza.

Dovrebbe porsi in una dialettica di partnership rispetto al Mercato, in un certo senso.

Quella che la PA tratta è un bene comune, che abilita tutti noi, sia attori di mercato che attori della società civile, in questo senso cercare collaborazioni nuove e nuovi modi di interpretare se stessa è fondamentale.

Alessio Dragoni: Aprire dati di effettivo valore. Potrei farti decine di esempi di occasioni perse.

Inoltre garantire il loro accesso e aggiornamento costante implementando API che si rifanno ai principali standard di mercato.

La questione della trasparenza amministrativa, che in parte ha catalizzato la tematica degli Open Data non è stata un buon viatico per il business degli dati aperti.

Lorenzo Modena: Nel 2014 è stato organizzato in Trentino il concorso “Open Data Challenge” per premiare le migliori applicazioni gratuite che fanno uso di dati aperti: dozzine di sviluppatori e società hanno partecipato all’iniziativa, contribuendo complessivamente con progetti di elevata qualità. OpenMove si è classificata prima, aggiudicandosi un premio in denaro ma soprattutto un imprimatur istituzionale. Secondo me si è trattato di un’iniziativa che ha alimentato interesse da parte delle imprese e della community dell’innovazione, da replicare sicuramente in altre realtà.

 

 

D) Ti sei ispirato a modelli stranieri? Se si, a quali?


Luca Corsato: Sì e no. Ovvero esistono aziende come Mapbox che affiancano realtà di condivisione (in questo caso Open Street Map). Come modello di gestione ci ispiriamo molto a Valve; sul fronte impegno per la definizione di una cultura aziendale e di un manifesto i riferimenti sono nell'impresa statunitense e inglese. Amministrativamente siamo inquadrati come startup innovativa, ma già spiegare il nostro statuto al notaio è stato molto divertente


Andrea Nelson Mauro: Sì. In particolare Journalism++  (collaboriamo in vari progetti) e ICIJ (collaborazioni anche qui).


Vittorio Alvino: MySociety, Sunlight Foundation


Matteo Brunati: SpazioDati si è ispirata inizialmente a modelli di data marketplace stranieri (come Kasabi della Talis Corporation), ma ha sempre inserito delle declinazioni diverse, dato che il mercato italiano ed europeo su questi temi è comunque molto più indietro dei mercati americani.

L'elemento di maggior ispirazione è stato comunque quello di legarsi fin da subito all'API Economy, sia per quanto riguarda la text analytics con Dandelion API, sia per quanto riguarda le API sui dati strutturati.


Alessio Dragoni: Nessun modello straniero. L'approccio delle tecnologie che proponiamo, sopratutto quello del Content Discovery è originale.

 

Lorenzo Modena: No. Anche se certamente l’hype attorno agli Open Data presente altrove ha certamente contribuito a renderci stakeholder dell’ecosistema degli open data.

 

 

E) Credi si possa vivere di Open Data, ovvero aprire un'azienda profittevole che sfrutta i dati aperti offerti dalla Pubblica Amministrazione?


Luca Corsato: lo stiamo facendo.


Andrea Nelson Mauro: Non credo sia possibile ma non conosco certo l'intero data-universo. Non conosco ad oggi nessuna azienda che vive solo di OpenData, ma tutt'al più chi costruisce portali per pubblicare OpenData (esempio: Sciamlab). In generale vedo gli OpenData come al massimo una parte delle tue attività, ma quando diventeranno quantitativamente e qualitativamente rilevanti.


Vittorio Alvino: Oggi purtroppo no.


Lorenzo Modena: E’ quanto abbiamo fatto noi.


Matteo Brunati: Al momento è altamente improbabile. Non solo per la questione dei problemi di qualità del dato, ma soprattutto per la necessità di avere servizi arricchiti, e non solo servizi totalmente dipendenti dal fonti open.


Alessio Dragoni: Crediamo che ciò faccia parte di un processo già avviato da tempo e molto vicino a produrre altri e più numerosi casi di successo oltre a quelli già esistenti.

Riteniamo che approcci di partnership pubblico + "mediatore privato", che sono stati i primi a concretizzarsi in questo ambito, andranno ad aumentare e ciò soprattutto in merito ai dati legati alla "salute", ambito questo che in Italia non è ancora avviato ma che all'estero ha già visto diversi casi di successo.

 

30 Settembre 2015

TAG: open data, cogo