big data

Datacy, perché una scienza per studiare l’impatto dei dati sulla società

In un’epoca in cui la crescita dei dati sembra inesauribile, la datacy aiuta a comprenderne il valore per l’economia e la società e l’impatto nella creazione di nuove regole economiche nei rapporti tra singoli, nelle collettività, nel mercato e nelle nazioni. Servono però nuove norme e una nuova cultura datacy-oriented

Pubblicato il 19 Mar 2018

Carlo Batini

professore Università di Milano Bicocca, coordinatore Corso laurea Data Science

bigdata_531892819

Assistiamo e siamo allo stesso tempo protagonisti di una fase storica in cui l’accumulazione di dati digitali cresce in quantità tali che l’unico limite è dato dalla capacità di rappresentarli mediante fenomeni fisici, usualmente binari. I dati digitali (dati nel seguito) sono un artefatto che è al tempo stesso tecnologia, servizio, risorsa, rappresentazione del mondo.

Le tecnologie dei telefoni mobili, dell’internet delle cose e delle reti sociali, e le tecniche di analisi sono una fonte inesauribile di dati; esse nascono e si diffondono con la promessa di rappresentare potenzialmente ogni aspetto del mondo, ad esempio:

  • il sequenziamento del genoma umano,
  • la rappresentazione del territorio resa possibile dalla precisione delle immagini riprese dai satelliti e dai droni, e dalla applicazione di tecniche di deep learning per la trasformazione delle immagini digitali in mappe.
  • la nostra simpatia o emozione per una foto su Facebook, espressa da un like.

La capacità sempre più ampia che i dati hanno di rappresentare il mondo evolve secondo tre direzioni: le proprietà degli oggetti della realtà (ad es. la temperatura corporea di una persona), le classi di oggetti (ad es. le diverse tipologie di persone, i giovani, gli anziani, ecc.) e la loro evoluzione nel tempo (ad es. la posizione della palla in un incontro di tennis).

Due fenomeni ci preme sottolineare a questo punto.

La sfera sfocata e il rischio di “data overload”

Da una parte, come accade metaforicamente se cerchiamo di gonfiare una sfera di plastica (1), la superficie della sfera costituita dai “big data” si espande continuamente; la pelle della sfera – che corrisponde ad esempio in un dominio di cybersecurity, alle risorse disponibili per contrastare gli attacchi – si assottiglia continuamente; infine, l’aria nella sfera, che corrisponde all’insieme degli oggetti e delle relazioni esistenti all’interno della sfera, si espande continuamente con una complessità enormemente ampliata dallo spazio tridimensionale dello spazio e del tempo rappresentato in figura. Tutto ciò porta ad una crescente estensione, ma anche ad un crescente sfocamento, delle informazioni a noi disponibili, e della conoscenza che ne possiamo derivare.

Ciò che abbiamo chiamato sfocamento è dovuto alla enorme espansione delle sorgenti che alimentano il mondo digitale, e al conseguente moltiplicarsi dei punti di vista che possono essere condivisi. La potenza comunicativa delle reti sociali, e il tempo sempre più rapido che dedichiamo alla percezione delle informazioni su web (il tempo che ci metto a “sfogliare” un quotidiano digitale sul web è di molto inferiore a quello che ci metto a sfogliare la copia cartacea) garantiscono alla sorgente dei dati una platea sempre più ampia, e sempre più superficiale. Dobbiamo ammettere che quando Trump dice che con un suo tweet raggiunge 50 milioni di persone, mentre la copia digitale del NYT è letta al massimo da 2 milioni di persone, non solo ha ragione, ma dimostra in maniera inequivocabile la nostra affermazione. Tutto ciò, come osservato anche dal campione di scacchi Jerry Kasparov, accresce la nostra conoscenza del mondo, ma anche la nostra incertezza, il nostro tasso di dubbio. Allo stesso tempo, quando i dati a nostra disposizione aumentano a dismisura, all’inizio la loro utilità aumenta, ma dopo un po’ essa raggiunge un massimo, e a questo punto diminuisce, generando il fenomeno chiamato information overload; per contrastare questo fenomeno, noi dobbiamo agire a livello cognitivo “comprimendo” i dati in astrazioni, cioè potenti sintesi che permettono di controllarne l’espansione.

Dati digitali come rappresentazione della realtà

Il secondo aspetto riguarda il cambiamento del modo in cui, nel mondo dei dati digitali, noi percepiamo e conosciamo la realtà e la sua evoluzione. I dati digitali si manifestano attraverso varie rappresentazioni, di tipo linguistico, come le tabelle o i documenti organizzati mediante una struttura, ovvero di tipo percettivo, facenti riferimento cioè ai nostri sensi, come le fotografie, le immagini, i video, i suoni. In questo processo la realtà è progressivamente sostituita da bit, numeri, codifiche, sistemi di simboli, che spesso ne modificano la percezione del significato, come è accaduto, ad esempio, in India quando in alcuni stati, per accrescere la trasparenza dei processi amministrativi legati al catasto e ridurre la corruzione attraverso la automazione, le mappe analogiche del passato sono state sostituite da rappresentazioni digitali (vedi figura successiva).

Il risultato è stato l’opposto: il cambio di simbolizzazione, non accompagnato da una efficace alfabetizzazione, ha costretto i contadini a dover ricorrere agli impiegati di front office; la trasparenza è diminuita, la corruzione è aumentata.

Datacy, comprendere l’impatto dei dati sulla società

La precedente pur breve sintesi ha lo scopo di introdurre il tema della novità che la cosiddetta scienza dei dati impone alla cultura di un paese e alla sua politica economica e sociale. Il livello di cultura di una comunità viene misurato usualmente per mezzo di due categorie, la literacy e la numeracy. La literacy fa riferimento alla capacità di leggere, comprendere e analizzare criticamente varie forme di comunicazione, inclusi il linguaggio parlato, i testi scritti, i media analogici e digitali. La numeracy riguarda la abilità di usare modelli e abilità matematiche per risolvere problemi in contesti complessi.

La diffusione dei dati digitali, visti come grande fenomeno che influenza tanti aspetti della nostra vita individuale e collettiva, richiede la considerazione di una nuova categoria culturale, che possiamo chiamare con un neologismo, datacy. La datacy misura la capacità di:

  • ragionare su un vasto insieme di tipologie di dati, quali i dati tabellari, i testi, le immagini,
  • rappresentarli mediante modelli, essendo in grado di comprenderne il significato,
  • valutarne la qualità (accuratezza, veridicità, ecc.) e la utilità sociale ed economica,
  • utilizzare linguaggi e tecniche per la loro rappresentazione, elaborazione, interrogazione, gestione e analisi al fine di percepire la realtà, risolvere problemi e prendere decisioni complesse.

Datacy, nuove norme e nuova alfabetizzazione

La categoria culturale della datacy comprende anche la comprensione dell’impatto che i dati hanno sulla società nel descrivere e influenzare i fenomeni sociali e nel determinare nuove regole economiche nei rapporti tra singoli, nelle collettività, nel mercato e nelle nazioni. Inoltre, richiede l’elaborazione di un nuovo quadro normativo per regolare lo sfruttamento e l’accesso ai dati, e la elaborazione di regole etiche che i processi di diffusione, scambio e utilizzazione dei dati devono rispettare, per influenzare in modo equo la vita delle persone e delle comunità.

La necessità di fornire strumenti e modelli descrittivi, interpretativi e di analisi dei dati digitali, tema fondamentale nella Scienza dei dati, si traduce perciò in una esigenza di alfabetizzazione verso l’intera popolazione di un paese moderno, e di formazione di figure di data scientist nei cicli della scuola superiore e universitari. La cultura che va creata e condivisa ha certamente nei suoi paradigmi di base la informatica e la statistica, ma riguarda tante altre aree, dalle scienze cognitive alle scienze sociali, la economia, le scienze giuridiche, e trova applicazione in un vasto insieme di domini applicativi, tutti quelli che usano dati digitali.

Per fare un solo esempio, il tema delle astrazioni che abbiamo visto come strumento cognitivo per contrastare l’information overload, è stato studiato da Boisot, un economista esperto di rappresentazione della conoscenza. Boisot propone di utilizzare l’astrazione (vedi figura seguente) insieme alla codifica e alla scarsità per rappresentare in uno spazio informativo la utilità economica delle informazioni. Nella visione di Boisot accanto alla scarsità, classica categoria economica, la codifica permette lo scambio e il riuso sulla base di una tassonomia comune, mentre la astrazione dà valore alla informazione sulla base del livello di generalità con cui rappresentare, e quindi condividere e scambiare, un vasto insieme di artefatti e fenomeni.

Conclusioni

I cosiddetti big data possono essere una rilevante risorsa che crea valore nella società, in economia, nella ricerca scientifica. Essi richiedono però cambi di paradigma e la diffusione di una nuova cultura orientata alla datacy, area culturale di crescente importanza in tutti i settori della formazione e della società.

Riferimenti:
Boisot – Information space: a framework for learning in organizations, institutions, and culture. London ; New York: Routledge, 1995
Isaac R. Porche III – Emerging Cyber Threats and Implications, RAND Office of External

Valuta la qualità di questo articolo

La tua opinione è importante per noi!

EU Stories - La coesione innova l'Italia

Tutti
Iniziative
Social
Analisi
Video
Finanza sostenibile
BEI e E-Distribuzione: investimenti per la sostenibilità energetica
Professioni
Servono competenze adeguate per gestire al meglio i fondi europei
Master
Come formare nuove professionalità per governare e gestire al meglio i fondi europei?
Programmazione UE
Assunzioni per le politiche di coesione: prossimi passi e aspettative dal concorso nazionale. Il podcast “CapCoe. La coesione riparte dalle persone”
innovazione sociale
Rigenerazione urbana: il quartiere diventa un hub dell’innovazione. La best practice di San Giovanni a Teduccio
Programmazione europ
Fondi Europei: la spinta dietro ai Tecnopoli dell’Emilia-Romagna. L’esempio del Tecnopolo di Modena
Interventi
Riccardo Monaco e le politiche di coesione per il Sud
Iniziative
Implementare correttamente i costi standard, l'esperienza AdG
Finanziamenti
Decarbonizzazione, 4,8 miliardi di euro per progetti cleantech
Formazione
Le politiche di Coesione UE, un corso gratuito online per professionisti e giornalisti
Interviste
L’ecosistema della ricerca e dell’innovazione dell’Emilia-Romagna
Interviste
La ricerca e l'innovazione in Campania: l'ecosistema digitale
Iniziative
Settimana europea delle regioni e città: un passo avanti verso la coesione
Iniziative
Al via il progetto COINS
Eventi
Un nuovo sguardo sulla politica di coesione dell'UE
Iniziative
EuroPCom 2024: innovazione e strategia nella comunicazione pubblica europea
Iniziative
Parte la campagna di comunicazione COINS
Interviste
Marco De Giorgi (PCM): “Come comunicare le politiche di coesione”
Analisi
La politica di coesione europea: motore della transizione digitale in Italia
Politiche UE
Il dibattito sul futuro della Politica di Coesione
Mobilità Sostenibile
L’impatto dei fondi di coesione sul territorio: un’esperienza di monitoraggio civico
Iniziative
Digital transformation, l’Emilia-Romagna rilancia sulle comunità tematiche
Politiche ue
Fondi Coesione 2021-27: la “capacitazione amministrativa” aiuta a spenderli bene
Finanziamenti
Da BEI e Banca Sella 200 milioni di euro per sostenere l’innovazione di PMI e Mid-cap italiane
Analisi
Politiche di coesione Ue, il bilancio: cosa ci dice la relazione 2024
Politiche UE
Innovazione locale con i fondi di coesione: progetti di successo in Italia
Finanza sostenibile
BEI e E-Distribuzione: investimenti per la sostenibilità energetica
Professioni
Servono competenze adeguate per gestire al meglio i fondi europei
Master
Come formare nuove professionalità per governare e gestire al meglio i fondi europei?
Programmazione UE
Assunzioni per le politiche di coesione: prossimi passi e aspettative dal concorso nazionale. Il podcast “CapCoe. La coesione riparte dalle persone”
innovazione sociale
Rigenerazione urbana: il quartiere diventa un hub dell’innovazione. La best practice di San Giovanni a Teduccio
Programmazione europ
Fondi Europei: la spinta dietro ai Tecnopoli dell’Emilia-Romagna. L’esempio del Tecnopolo di Modena
Interventi
Riccardo Monaco e le politiche di coesione per il Sud
Iniziative
Implementare correttamente i costi standard, l'esperienza AdG
Finanziamenti
Decarbonizzazione, 4,8 miliardi di euro per progetti cleantech
Formazione
Le politiche di Coesione UE, un corso gratuito online per professionisti e giornalisti
Interviste
L’ecosistema della ricerca e dell’innovazione dell’Emilia-Romagna
Interviste
La ricerca e l'innovazione in Campania: l'ecosistema digitale
Iniziative
Settimana europea delle regioni e città: un passo avanti verso la coesione
Iniziative
Al via il progetto COINS
Eventi
Un nuovo sguardo sulla politica di coesione dell'UE
Iniziative
EuroPCom 2024: innovazione e strategia nella comunicazione pubblica europea
Iniziative
Parte la campagna di comunicazione COINS
Interviste
Marco De Giorgi (PCM): “Come comunicare le politiche di coesione”
Analisi
La politica di coesione europea: motore della transizione digitale in Italia
Politiche UE
Il dibattito sul futuro della Politica di Coesione
Mobilità Sostenibile
L’impatto dei fondi di coesione sul territorio: un’esperienza di monitoraggio civico
Iniziative
Digital transformation, l’Emilia-Romagna rilancia sulle comunità tematiche
Politiche ue
Fondi Coesione 2021-27: la “capacitazione amministrativa” aiuta a spenderli bene
Finanziamenti
Da BEI e Banca Sella 200 milioni di euro per sostenere l’innovazione di PMI e Mid-cap italiane
Analisi
Politiche di coesione Ue, il bilancio: cosa ci dice la relazione 2024
Politiche UE
Innovazione locale con i fondi di coesione: progetti di successo in Italia

Articoli correlati