I dati tratti dai social network rappresentano una risorsa importante per far fronte alle emergenze. In particolare, raccogliere informazioni sugli spostamenti delle persone può costituire la base su cui realizzare modelli predittivi efficaci per capire l’andamento di situazioni critiche, come la diffusione delle malattie o l’impatto di catastrofi naturali. Un esempio concreto di questo utilizzo dei dati a scopo sociale è il progetto internazionale Data for Good di Facebook, che in queste settimane in Italia è stato avviato per sostenere la ricerca nell’ambito dell’epidemia di coronavirus. Questa iniziativa ha anche l’obiettivo di supportare i Governi nell’adozione delle politiche più adatte per contenere l’epidemia, fornendo riscontri pratici sull’implementazione delle policy e individuando i fronti critici della loro applicazione. Interessante quindi approfondire di che cosa si tratta, considerando anche gli aspetti legati alla privacy.
Il caso: che cos’è Data for Good
Facebook ha avviato Data for Good in diversi Paesi del mondo per sostenere i Governi, tramite enti terzi come università ed istituti di ricerca, nel combattere emergenze di portata critica per la popolazione. Il programma prevede che dati aggregati e anonimizzati raccolti da Facebook vengano messi a disposizione dei ricercatori (previo accordo), i quali poi metteranno le loro elaborazioni a disposizione delle autorità pubbliche. Un intento sociale quindi, che vuole servirsi dell’innovazione per permettere di analizzare le situazioni più difficili e prevedere come si evolveranno nel tempo. Il progetto è stato utile per esempio nel corso dell’emergenza incendi in Australia tra fine 2019 e l’inizio di quest’anno, ma anche per realizzare modelli a scopi urbanistici in California.
Da qualche settimana, il progetto è approdato anche in Italia, per dare una mano alle organizzazioni contro il diffondersi del coronavirus. Attraverso questo programma, al momento l’Università di Pavia, l’ateneo di Venezia e il Politecnico di Milano hanno avuto accesso ai dati resi disponibili da Facebook per utilizzarli a scopo di ricerca, in particolare l’obiettivo è la formulazione di un modello di diffusione del contagio da coronavirus. In questo ambito, a fine aprile sono iniziati i lavori per completare una mappa della diffusione del virus in Italia. In particolare, l’Università di Pavia partendo dai dati relativi agli spostamenti degli utenti del social network, ha creato un modello di previsione per capire lo sviluppo futuro del virus nel territorio.
Allo stesso modo, in collaborazione con la Carnegie Mellon University di Pittsburgh, Pennsylvania, è stata realizzata una mappa dei sintomi. Facebook ha raccolto tramite survey (alla quale le persone potevano scegliere di partecipare) dati relativi ai casi covid-positivi, partendo dagli Stati Uniti per poi estendere il progetto anche a livello globale, fornendo agli utenti domande sulla presenza dei sintomi della malattia (come la tosse o la perdita di gusto e olfatto) per poi realizzare una mappa che indica la presenza dei possibili contagiati sul territorio.
Tool e mappe predittive di Data for Good
In primis dunque, i dati raccolti da Facebook hanno permesso ai ricercatori di creare una mappa dei sintomi, in relazione alla presenza di persone in un certo territorio che hanno mostrato di avere gli effetti del coronavirus. Facebook ha reso poi disponibili due tool: una mappa dedicata alla densità di popolazione di un dato territorio e display CrowdTangle aggiornati in tempo reale. I display sono contenitori in real time che raccolgono i contenuti pubblici presenti sulle piattaforme di Facebook relativi al coronavirus.
Nell’ambito del progetto Data for Good sono anche state realizzate mappe che puntano a prevenire la diffusione delle malattie. Questi strumenti sono di tre tipologie differenti:
- Mappe di co-locazione
- I trend relativi al raggio di spostamento delle persone (Movement range trends)
- L’indice di connessione sociale.
Queste tre tipologie di strumenti sono costituite da dati aggregati e anonimizzati, messi a disposizione da Facebook affinché i ricercatori se ne servano per creare modelli predittivi. Si tratta insomma di capire come una malattia, o un altro fenomeno d’emergenza, si diffonderà, attraverso lo studio della grande quantità di dati raccolti dal social network.
Approfondendo le caratteristiche di ognuno dei tre strumenti disponibili, emerge che le mappe di co-locazione sono in grado di indicare con quale probabilità soggetti presenti in un’area entrino in contatto con utenti di una zona diversa. Una soluzione utile per prevedere in che territori possano insorgere casi di coronavirus. I trend relativi alla distanza degli spostamenti degli utenti riguardano il territorio regionale e sono invece usati per capire se la popolazione resta vicino casa o si muove in altre aree. I trend in questo caso sono utili ai ricercatori ma anche ai politici, per comprendere se davvero le restrizioni previste per evitare la diffusione del virus hanno un impatto positivo. La terza tipologia di strumento disponibile con Data for Good è l’indice di connessione sociale, utilizzato in Africa nella circostanza di un’epidemia di colera. Questo è capace di individuare i legami tra gli utenti di Stati differenti. Un elemento utile in caso di epidemia perché aiuta gli scienziati a valutare la possibilità dei luoghi in cui si diffonderà il contagio, ma anche la capacità dei soggetti di un’area coinvolta di resistere alla situazione difficile.
Data for Good e privacy
Il progetto Data for Good in Italia viene condotto rispettando le disposizioni del regolamento europeo GDPR in materia di Data Protection. Il social utilizza i dati degli utenti in forma anonimizzata, garantendo quindi la totale privacy delle persone. L’iniziativa è stata infatti realizzata rispettando il principio di privacy by design previsto dall’articolo 25 del GDPR, che indica come nella progettazione di un processo di trattamento dei dati si debbano considerare sin dall’inizio le implicazioni relative alla Data Protection.
Come ulteriore garanzia, Facebook raccoglie per il progetto Data for Good solo i dati degli iscritti al social che hanno dato esplicito consenso alla gestione delle informazioni relative alla loro localizzazione. Le mappe infatti sfruttano i dati relativi alla posizione e alla località per formulare i modelli predittivi, non vengono contemplati utilizzi di dati particolari come nomi e cognomi. Le persone quindi possono avere la totale certezza di non essere individuate. Un grande vantaggio anche per i ricercatori, che non dovranno occuparsi in prima persona di anonimizzare i dati ma potranno lavorare con la certezza di rispettare la privacy.
L’articolo è parte di un progetto di comunicazione editoriale che Agendadigitale.eu sta sviluppando con il partner Facebook.