Dal web e social monitoring all’Osint: differenze, pregi e problemi | Agenda Digitale

L'analisi

Dal web e social monitoring all’Osint: differenze, pregi e problemi

Approfondiamo due approcci complementari per la gestione di organizzazioni complesse: dalla comprensione dei movimenti informativi nelle crisi biologiche alla prevenzione del cherry picking nelle risorse umane

27 Ott 2020
Giuseppe Bonura

Head of People & Culture presso la Fondazione internazionale di ricerca scientifica Paediatric European Network for treatment of AIDS and Infectious Diseases (PENTA-ID), esperto di change management, digital transformation e internal communications


Web e social monitoring insieme a Osint sono metodi con cui i decision maker, i manager, i comunicatori e gli analisti presidiano, o provano a presidiare, il mondo digitale. Le loro applicazioni hanno importanti ricadute nell’ambito del marketing, della strategia aziendale e anche in campo investigativo. Analizziamo in cosa consistono e quali sono le loro differenze.

Il contesto d’azione

I dati e il traffico generato dal web sono impressionanti per numero ed eterogeneità. Per Internet Live Stats2 il web è attualmente popolato da 1,7 miliardi di siti (4,66 miliardi di pagine). Il numero oscilla di minuto in minuto con alcune pagine che chiudono e altre che aprono. Ogni secondo (sic) nel mondo vengono pubblicati circa 6.000 tweet, vengono fatte oltre 40.000 ricerche con il motore di Google, sono spediti più di 2 milioni di messaggi di posta elettronica. Ancora più interessante è quanto emerge dall’analisi quantitativa giornaliera per esempio dei Blog, circa 4,5 milioni di post al giorno; dei Tweet, circa 600 milioni; dei video visti su YouTube, più o meno 5 miliardi; delle foto caricate su Instagram, 58 milioni, e così via. Con questi numeri non si fa fatica a credere ai dati prodotti dal Visual Networking Index di Cisco3, il quale riporta che entro il 2019 il traffico internet globale raggiungerà i 2 zettabyte (1 sestilione di byte) all’anno. Sempre secondo Cisco nel solo 2015 sono stati veicolati online 8.000 petabyte al mese di traffico IP sotto forma di video, a fronte di circa 3.000 petabyte al mese di altri contenuti, comprese le mail e il trasferimento dei dati.

Tutti i tipi di organizzazione, da una grande azienda nazionale o multinazionale alla società globalizzata in cui viviamo, sono investiti da questa alluvione informativa. La rimozione del rumore di fondo, l’individuazione dell’hot topic, il monitoraggio di quanto è di reale interesse è un aspetto determinante per comprendere per tempo e gestire un fenomeno informativo impattante, talvolta anticipandolo. Si pensi alla somministrazione di un vaccino o ad un’emergenza biologica come quella che stiamo vivendo collegata al Covid-19, alla necessità di comprendere nel profondo i pensieri di cui si compone l’opinione pubblica, tutto ciò affiancato da campagne organizzate di fake news o focolai spontanei di disinformazione o distorsione delle notizie. Si potrebbero aggiungere a titolo di esempio, oggi quanto mai rilevante, le campagne di reclutamento internazionali di risorse umane altamente specializzate e programmi di cherry picking (è una tecnica utilizzata spesso tra aziende concorrenti per strappare all’altra personale giovane e formato con competenze molto alte). Come evidente, i campi di applicazione sono molti.

Che cos’è il web e social monitoring

Ad oggi, lo strumento più utilizzato per il monitoraggio di alcuni dati che popolano la rete è il web e social monitoring. Nella maggioranza dei casi l’unico metodo per la gestione di dati online è la selezione a monte di un paniere di siti e di social (e porzioni di social ad accesso pubblico) su cui far operare un crawler e un motore semantico in grado di svolgere la funzione di brand e competitor detector. Se non si determinasse a priori un elenco di siti da monitorare, sarebbe impossibile gestire in house una parte significativa delle mole di dati disponibili online e sopra brevemente richiamati (servirebbe una server farm e costi difficilmente gestibili). È peraltro vero che alcune società di media monitoring operano anche una selezione e integrazione dei propri database ascoltando le richieste e analizzando le necessità dei propri clienti. Da tali dati (e altri offline, come le rassegne stampa o il monitoraggio delle broadcast tv) ricaveranno poi un’analisi di media intelligence.

Osint: cosa significa

A questo approccio attuale, comunque necessario del monitoraggio e dell’analisi del mondo digitale, anche a prescindere dall’evoluzione tecnologica dei crawler, dei motori semantici e dei sistemi di infografica, un’ipotesi di lavoro complementare, espansiva e più targetizzata è rappresentata dall’utilizzo delle tecniche e degli applicativi propri dell’Osint: l’open source intelligence. Storicamente, l’Osint è una tecnica utilizzata dai servizi di informazione e successivamente adottata nel giornalismo d’inchiesta; altro non è che l’attività di raccolta di informazioni attraverso il monitoraggio e l’analisi di fonti di “pubblico accesso” La specificità dell’Osint è rappresentata da almeno due fattori:

  • aumento e moltiplicazione dei database contenenti entità informative web (in questo articolo ci concentreremo solo sulle opportunità offerte dal web e non anche dalle risorse offline);
  • l’utilizzazione di software relazionali.

Se il primo punto è intuitivamente comprensibile (eppure profondamente diverso dai database di web monitoring tradizionali), il secondo rappresenta un diverso paradigma nel trattamento delle fonti web e della ricerca di relazioni e lead tra entità (persone, luoghi, notizie, ecc.). In un’ottica di web monitoring e media intelligence, come sopra brevemente richiamata, per aumentare il livello di conoscenza si è spesso investito nell’allargamento del paniere di siti e social disponibili e nel raffinamento dei motori semantici per un miglioramento del detecting automatico e quindi delle tempistiche di intercettazione della notizia, oltre che nella moltiplicazione degli oggetti di analisi. Questo per assecondare l’istinto recondito di ogni committente: più notizie vuol dire più informazione, mancando così la risposta alla domanda fondamentale: a cosa servono le informazioni alla mia struttura? Un approccio Osint al monitoraggio e all’analisi del mondo online investe sulle relazioni tra entità, in cui ciascuna rappresenta un nodo inevitabilmente interconnesso a un altro, a un altro e a un altro ancora. È la relazione tra entità che determina l’accesso a un database e poi a un altro e così via.

Le differenze

Semplificando: anche se sia il web monitoring (e la media intelligence) che l’Osint lavorano nella contemporaneità (diremmo nel real time), il primo ha un approccio a priori, predeterminando il campo da gioco e ben presidiandolo; il secondo ha un approccio imminente e a posteriori (per quanto paradossale possa sembrare), in cui è il target (un brand, i suoi competitori, il management, una minaccia) a determinare, cambiare, allargare il campo da gioco. Nel web monitoring, potremmo dire, si gioca sullo stesso campo, per quanto grande, curato e in parte su misura del cliente possa essere; nell’OSINT si gioca in una pluralità di campi sempre diversi, in cui la dimensione di ciascuno diventa irrilevante poiché è il target a determinare la misure, che quindi, in questo senso, sono teoricamente infinite.

Le ragioni di una tale differenza di approccio sono determinate dal fatto che lo stesso paniere di web monitoring (nonostante le opportune integrazioni di siti web di volta in volta fatte dalle società più serie) deve poter soddisfare contemporaneamente le richieste di una molteplicità di clienti. Almeno nella parte più consistente e statica del proprio database. Ogni progetto Osint soddisfa invece un cliente alla volta. Tornando alla metafora del campo da gioco, il primo strumento punta ad avere un campo sufficientemente grande e senza linee o simboli che ne determinino troppo il gioco; il secondo prova a trovare campi di volta in volta differenti, estremamente precisi, tali che le linee lì presenti descrivano in modo inequivocabile la risposta al quesito: a che gioco stiamo giocando? In altre parole, il paniere del web e social monitoring è in parte stabilito a priori e quindi poco flessibile. Si potrebbe dire che il web e social monitoring sono costituiti da un protocollo operativo informatico standard, almeno nei suoi passaggi principali; l’Osint invece è customizzabile, flessibile e responsive. Entrambi questi sistemi di monitoraggio e analisi del mondo online, proprio per le forti differenze, procedure e risultati che li caratterizzano, non sono evidentemente da considerarsi alternativi, ma complementari.

I database disponibili

Avendo chiarito l’approccio relazionale dell’Osint, passiamo all’analisi dei panieri o database di cui può disporre. Quando si parla di web in genere ci si riferisce al clear web (o clear net), cioè l’internet accessibile da tutti gli utenti e indicizzato dai motori di ricerca. Secondo alcune stime il clear web rappresenterebbe il 6% di internet, ma non esistono dati certi o definitivi. L’Osint si occupa sia di allargare il monitoraggio sul clear web sia di monitorare il deep web (del tutto assente da qualsiasi attività di web e social monitoring o media intelligence). Partiamo dal clear web e dalle possibilità che le statistiche a disposizione ci guidino nella creazione di nuovi database.

Sfogliando le slide della ricerca Global Digital 2018, da un lato troviamo conferma della centralità di Google come motore di indicizzazione, piazzato saldamente al primo posto per total traffic to website (con 7.07 minuti di time per visit o TPV), o di Facebook e Youtube come social più utilizzati (rispettivamente al secondo posto con 13.41 minuti di TPV e al terzo con 19.56 di TPM); dall’altro conquistano e scalano le classifiche i motori di ricerca cinesi (che peraltro superano google per TPV), come per esempio baidu.com (al quarto posto) e yidianzixun.com (al sesto), i cui siti indicizzati sono poco o per nulla presidiati dai database tradizioni di web monitoring.

WHITEPAPER
Quali sono le prossime sfide per i punti vendita in Italia?
Acquisti/Procurement
Marketing

C’è poi il focus specifico sugli utenti attivi sulle piattaforme social. Innanzitutto, quante sono? Senza andare troppo lontano, Wikipedia ne censisce 206. In un’attività di comunicazione e marketing sempre più orizzontale, non serve solo provare a presidiare i big player come facebook, twitter, youtube e instagram, serve soprattutto individuare le microcomunità e quindi un detecting approfondito del maggior numero possibile di social e microsocial platform diventa indispensabile per attività di comunicazione (anche della PA) e marketing. Si pensi ai vari blog e topic presenti in alcune di queste piattaforme social “minori” (reddit.com, forse il più interessante in questo senso, conta comunque circa 250 milioni di utenti attivi al mese!) o, ancora una volta, ai social in lingua cinese (Sinza wibo e Baidu Tieba contano insieme quasi 700 milioni di utenti attivi al mese) , o russa (vkontakte conta 97 milioni di utenti attivi al mese e 210 milioni di utenti registrati), che rappresentano un mondo di informazioni commerciali, politiche, di trend, oggi completamente fuori dal social monitoring e che pure tanto dicono e raccontano su di noi, sui nostri brand e sui “movimenti” delle aziende su scala globale. Alcune di queste piattaforme social hanno invece poche centinaia di migliaia di iscritti in quanto monotopic. Si pensi per esempio Opendiary, la prima comunità di blogger, che garantisce l’anonimato (here you can post in an anonymous, judgement-free environment – where you can share what is really going on in your life, and talk about the things you can’t talk about anywhere else); o Patientslikeme (che mette in contatto persone affette da malattie) il cui motto è Find answers, support and a path forward with people like you e consente agli utenti (circa 600 mila) di condividere delle ricerche su una determinata malattia o in genere di ottenere informazioni da altri utenti e scambiarsi opinioni.

La mancanza di questo tipo di conoscenza e monitoraggi, soprattutto in un mercato e in una società globalizzati, rappresenta un vulnus significativo sia nella capacità di ascolto della Pubblica Amministrazione (e nella capacità di creare un servizio all’utente realmente in grado di catturare i suoi bisogni) che nelle strategie aziendali, dal marketing alle risorse umane (intese ovviamente non come il controllo delle risorse umane, ma come il monitoraggio delle strategie HR in campo da parte delle aziende competitor). Un vuoto da colmare velocemente, se si considera che nel 2021 è stimato che il reddito globale del solo social commerce sarà di circa 165 miliardi di dollari. Si pensi che solo in Italia il 53% della popolazione nell’ultimo anno ha compiuto almeno un acquisto su internet, il 78% in UK, il 45% in Cina, ecc. Ci troviamo di fronte a una prateria sterminata e certamente i prossimi tre anni saranno determinanti per stabilire chi saranno gli influencer di questo nuovo approccio di analisi e commerciale e chi i follower.

Un focus a sé merita Linkedin, spesso tralasciato dai servizi di social monitoring. Visto dalla prospettiva Osint, rappresenta una piattaforma di approfondimento su temi specifici di una comunità di professional e non solo, determinante nell’ottica di individuazione di veri a propri hub tematici, di influencer e best prectice in campo HR. Analogamente, si pensi anche al social settoriale del mondo accademico, academia.edu, che sempre più sta diventando un hub di ricerche e case study in cui compaiono brand e best practice. Si ponga attenzione infine al fatto che secondo il sito Globalwebindex ogni utente social è iscritto in media a sette siti e nel range d’età tra i 16 e 24 anni si sale a otto. Un ultimo aspetto strettamente collegato al mondo delle entità web è senz’altro rappresentato dalle tv online, una fonte di informazioni sempre più preziosa. Secondo GlobalwebIndex le forme online di tv quest’anno arriveranno a intercettare il 40% del tv time (nel 2013 era il 26%!).

I dati del deep web

Questa porzione di informazioni online rappresenta una zona da esplorare e approfondire del clear web. L’Osint si caratterizza per la capacità di trarre informazioni e contenuti anche da siti non indicizzati, appunto il deep web (e dark web). È un’immensa rete parallela e anonima dalle dimensioni impressionanti, tali da sovrastare l’Internet in chiaro. Si tratta di fatto di un’altra rete, alternativa, un enorme contenitore di informazioni. Si ritiene che il deep web contenga un volume di pagine di oltre 600 volte superiore rispetto a quelle presenti sul web in chiaro, secondo una ricerca un po’ datata (2000), della società statunitense Bright Planet, il web globalmente inteso sarebbe costituito da 550 miliardi di documenti, Google ne indicizzerebbe soltanto 2 miliardi. All’interno di questo canale parallelo si trovano informazioni di varia natura presenti su diversi veicoli: pagine web, chat room, social media nascosti, siti del mercato nero (si pensi anche solo all’acquisto di marchi contraffatti della moda o a medicinali senza prescrizione o sostitutivi), data leaks, banche dati con contenuti leciti e illeciti.

Monitorare o almeno presidiare questa porzione maggioritaria del web consente di osservare e analizzare la rete in un’ottica risk based. Anche il dark web ha i suoi motori di ricerca, nonostante la gran parte del deep web sia blind surfing e maggiormente complessa da penetrare. Questi motori di ricerca, a differenza per esempio di Google, sono in grado di intercettare dei forum (per esempio attraverso Torch) o gruppi di siti di esclusivo interesse per il proprio target. Di certo i marketplace (legali e non) la fanno da padrona. Se prima l’accessibilità del dark web era molto limitata e del tutto blind surfing (anche per l’assenza, come poco sopra richiamato, di motori di ricerca interni), oggi si sta diffondendo sempre di più ed è alla portata di qualsiasi utente sappia utilizzare un browser. Questo vuol dire una diffusione esponenziale dei contenuti e delle notizie lì contenuti, con cui il mondo della comunicazione non può non fare i conti.

I vantaggi e le applicazioni dell’Osint

Riassumendo, la forza dell’Osint è data dalla combinazione tra le relazioni possibili delle entità e le banche dati eterogenee di pubblico accesso che le contengono (anche se spesso di difficile consultazione), sia sul web di superficie che sul deep web. Dopo aver analizzato il principio relazionale alla base dell’Osint e chiarita la direzione verso cui estendere il monitoraggio delle fonti informative online, è importante comprendere cosa si può ottenere esattamente da un tale progetto. Tralasciando gli utilizzi nel campo delle investigazioni, che vanno oltre questo articolo, l’Osint può da un lato integrare un’attività tradizionale di media monitoring e può dall’altro fornire una capacità di analisi relazionale che una normale analisi di media intelligence non comprende. L’Osint può per esempio rispondere alle seguenti domande altrimenti senza soluzione: quali elementi, se esistono, collegano due manager target di due diverse aziende monitorate? Chi ha messo in giro una determinata notizia? Come determino la veridicità di una fonte online? Ci sono gruppi sui social organizzati pro e contro un brand? Chi c’è dietro questi gruppi? Quali relazioni hanno col mondo esterno? Ci sono gruppi di interesse e/o movimenti che li muovono? Posso conoscere anticipatamente le loro mosse? Quale tipo di strategia i nostri concorrenti hanno messo in atto per il reclutamento di personale altamente formato? Sono un target di questa strategia?

Oltre ad allargare e moltiplicare i campi informativi (allargamento del clear web da monitorare e deep web monitoring) con un progetto Osint è quindi possibile fare attività di debunking (con individuazione degli autori di notizie false e diffamatorie, elemento particolarmente prezioso per i dipartimenti press, PR e marketing) e in generale information assessment o evaluation; è possibile dare supporto al newsmaking; è senz’altro in grado di svolgere attività di tracerouting e detecting di domini associati allo stesso server (si pensi per esempio alla possibilità, affatto remota, che dentro un server istituzionale o aziendale si trovi il sito di una organizzazione politica radicale e che quindi sia possibile stabilire un link tra le due organizzazioni; lo stesso può valere tra siti di due apparentemente diverse aziende) e cross-correlation della stessa informazione prelevata da diverse fonti per avvalorarne la veridicità (quindi particolarmente utile nel campo delle fake news).

Insieme al campo della comunicazione digitale, del risk & people management, l’Osint è anche applicabile alle attività di competitive intelligence, con lo scopo di raccogliere e analizzare informazioni sui brand concorrenti e sul mercato target. Grazie alle tecniche Osint è possibile l’intercettazione di tutte le campagne di email marketing fatte dai concorrenti, la Spam reputation, la competitive pricing intelligence (intercettazione, monitoraggio e confronto in real time dei prezzi praticati su tutti i siti ecommerce dei propri concorrenti), Marketplace Price Tracking, Backlink analytics (Il backlink è il collegamento che altri siti concedono verso il sito web del cliente, ed è un dato fondamentale da conoscere per il posizionamento della propria pagina su internet), e tutta una serie di altre attività qualificabili solo a partire dal target.

@RIPRODUZIONE RISERVATA

Articolo 1 di 4