Questo sito utilizza cookie per raccogliere informazioni sull'utilizzo. Cliccando su questo banner o navigando il sito, acconsenti all'uso dei cookie. Leggi la nostra cookie policy.OK

Direttore responsabile Alessandro Longo

big data

Social Media Intelligence per le indagini di polizia: le nuove frontiere

di Maurizio Tesconi, Istituto di Informatica e Telematica del CNR

14 Nov 2017

14 novembre 2017

L’uso diffuso dei social media da parte di miliardi di utenti nel mondo fa delle reti sociali una preziosa fonte di big data, utili per monitorare eventi di grossa portata che per indagini di polizia. Vediamo in che modo

1Sono miliardi in tutto il mondo le persone che ogni giorno utilizzano i social network, mettendo in rete un flusso continuo di informazioni. I social diventano così una finestra sul mondo sempre aperta e rappresentano una miniera di informazioni che anche solo qualche decennio fa sarebbe stata inimmaginabile.

Chi condivide contenuti sui social spesso racconta eventi che stanno accadendo in tempo reale. Negli ultimi anni i ricercatori hanno intuito che questi contenuti, così ricchi di informazioni, potevano rivelarsi utili per eseguire un monitoraggio in tempo reale degli eventi che accadono nel mondo.

Su questi presupposti si basa la Social Media Intelligence, una disciplina nuova che rappresenta una delle ultime frontiere del settore dell’intelligence.

Negli ultimi anni i ricercatori stanno mettendo a punto sistemi che durante un determinato evento – come per esempio un attentato terroristico – producono in tempi rapidi un quadro aggiornato di quello che sta accadendo grazie al flusso di informazioni che condividono gli utenti dei social. Inoltre molti di questi sistemi permettono anche di individuare e contattare gli utenti coinvolti, in modo da aiutare i soccorsi e le forze dell’ordine a gestire un’emergenza.

La disciplina è nuova e ci sono ancora diversi ostacoli da superare. Uno di questi è che il grado di copertura dell’informazione dipende dalla popolazione che vive in un dato territorio e dalla copertura delle reti cellulari o internet. Così, mentre il sistema si adatta bene alle aree metropolitane, non si può dire lo stesso per gli ambienti rurali.

Un’altra difficoltà è legata al grande volume di dati da analizzare. I social network rappresentano infatti anche delle sfide tecnologiche: milioni di accessi simultanei ai contenuti, ZettaByte di dati da immagazzinare, l’ordine di grandezza tipico dei Big data.

E ogni contenuto che postiamo in rete ha un formato diverso. Carichiamo video, audio, foto, testi e ogni singolo file ha una serie di caratteristiche che fanno sì che sia visualizzabile da moltissimi dispositivi diversi, dal computer fisso allo smartphone.

Maneggiare e confrontare dati provenienti da sorgenti diverse è diventato così complesso che la data fusion, cioè la disciplina che studia come integrare dati differenti, ha acquistato sempre più importanza negli ultimi anni.

Il lavoro di social intelligence non è limitato alla gestione delle emergenze. I social network, infatti, sono sempre più spesso teatro di propaganda razzista e di odio, e possono aiutare la radicalizzazione degli estremisti religiosi. Anche in questo scenario lo studio dei contenuti postati dagli utenti, come video e immagini della propaganda, può rivelarsi strategico, per esempio per analizzare la voce all’interno di una traccia e confrontarla con quella di un database di persone note, oppure per comparare i volti che compaiono in un frame video con una lista di indiziati.

Un altro aspetto interessante da studiare riguarda i legami sociali tra le persone. Spesso sui social due utenti sono collegati tra loro, per esempio attraverso una relazione di amicizia.

Gli utenti sono anche collegati ai contenuti che producono e a quelli con cui interagiscono attraverso i vari tipi di interazione implementati all’interno del social network, come i like, i commenti e le condivisioni. Tutte queste interazioni prendono il nome di “engagement”, ovvero il coinvolgimento prodotto dal contenuto sugli utenti.

Questo insieme di caratteristiche forma una base di partenza su cui in genere si articolano le analisi utilizzate dalla Social Media Intelligence per estrapolare conoscenza.

Le interazioni sui contenuti e i legami strutturali tra gli utenti possono essere modellati attraverso un enorme grafo che connette gli account anche su social media diversi e che apre la possibilità ad analisi sempre più sofisticate e interessanti.

La Social Network Analysis è una delle tecniche di indagine che maggiormente si sposa con questo tipo di dati perché consente di ricostruire i legami che intercorrono tra i membri di una comunità, con lo scopo di individuare le persone chiave all’interno di una rete o scoprire eventuali anomalie e singolarità. Con i social network si possono realizzare reti di natura differente, che vanno dai legami di parentela o amicizia all’insieme di interazioni che occorrono all’interno di una pagina o gruppo. Queste analisi permettono di osservare in un tempo breve un numero molto elevato di persone, al contrario di quello che avveniva in passato.

La Social Network Analysis può così aiutare a scovare chi maschera la propria identità dietro falsi profili, con intenti come l’adescamento dei minori, la diffamazione o la diffusione di contenuti falsi.

Anche la timeline, che organizza i contenuti in ordine cronologico, mettendo in alto quelli più recenti, è presente in quasi tutti i social media e può rivelarsi utile per studiare l’evoluzione di una serie di eventi nel tempo. Attraverso la timeline si possono rappresentare e studiare la storia di un singolo utente, i post di un gruppo o la discussione intorno ad un argomento.

Da un punto di vista tecnico, per compiere analisi di intelligence a partire dai social, è necessaria prima di tutto una fase di estrazione dei dati, che solitamente prevede l’utilizzo delle API (Application Program Interface), fornite direttamente dai social network. Attraverso la Social Media Intelligence non è possibile ottenere le tutte le informazioni che gli utenti inseriscono sui social network. Alcune informazioni sono protette con una password oppure non sono visibili per le impostazioni di privacy dell’utente. Inoltre, di recente, i social hanno diminuito il volume di informazioni rilasciate, per questo motivo sono stati sviluppati nuovi sistemi in grado di estrarre le informazioni direttamente dalle pagine web delle piattaforme social.

Una volta estratti i dati, si passa all’analisi. I dati possono essere elaborati immediatamente o salvati per subire successive elaborazioni. Nel caso vengano subito elaborati, servono algoritmi capaci di lavorare in modo efficiente su grandi quantità di dati.

Come si può intuire, i volumi di dati che si possono raggiungere in questo tipo di studi sono molto importanti. Per questo oltre a connessioni molto veloci, servono server di ampia capacità e prestazione, che non sempre sono alla portata di tutti.

Inoltre, lavorare con i big data oggi è molto costoso. Infatti la gestione di questo tipo di dati richiede, oltre all’hardware e al software in grado di gestire una grande quantità di dati, anche personale formato correttamente.

Il mondo dell’intelligence, che guarda con sempre maggiore interesse ai big data, negli ultimi anni si sta dotando di queste strutture e assume professionisti in grado di utilizzarle.

Anche sulla spinta degli ultimi episodi terroristici, sia in Italia che all’estero stanno nascendo laboratori specializzati, all’interno dei quali ricercatori e data scientist lavorano gomito a gomito con le forze dell’ordine.

Articoli correlati