cybersecurity

Intelligence open source (Osint): ecco tecniche e vantaggi

L’intelligence preventiva con fonti di pubblico dominio (Osint) sempre più si avvale di social network e tecnologie digitali. Vediamo software, metodi e tecnologie in uso

28 Feb 2018
Rodolfo Zunino

associate professor DITEN Dept. University of Genova

sicurezza_300897920

Si sta affermando sempre più la cosiddetta Osint Intelligence. Con questo termine si intende l’uso di tecnologie di monitoraggio delle fonti di pubblico dominio (OSINT = Open Source INTelligence) a scopo di sicurezza.

Sono tecniche tradizionalmente legate a sorgenti non strutturate quali testate giornalistiche, agenzie e persino libri, ma hanno avuto grande impulso dalla diffusione dei Social Network, qui intesi nella loro accezione più ampia che include anche blog, micro-blog, forum, chat e newsgroup.

I vantaggi dell’Osint Intelligence

Nel comparto sicurezza, il grande vantaggio di tale approccio consiste nella sua natura di difesa preventiva, sulla base del principio per cui quanto più da lontano si identifica una minaccia, tanto più efficacemente la si potrà contrastare. Questo vale soprattutto per Infrastrutture Critiche o enti e Corporate di alta esposizione che costituiscono un “bersaglio pagante” per (cyber) attacchi. L’ipotesi operativa che soggiace all’uso di OSINT è di dover fronteggiare una minaccia organizzata, costituita da team o comunità coordinati che spesso, per massimizzare l’impatto, hanno necessità di comunicare e spesso condividere motivazioni, intenti e modalità, non sempre in modo celato.

WHITEPAPER
Le 7 tipologie di Customer Journey Map che devi conoscere!
Marketing
Advertising

Gli strumenti di OSINT si pongono come moltiplicatori di forza, che amplificano l’efficacia degli asset già disponibili per la sicurezza. Il ruolo dellIntelligence preventiva si sta affermando anche nel mondo della CyberSecurity, dove si esplora il cyber-spazio per difendere le proprie cyber-strutture: i risultati dell’OSINT si integrano come early warning nei sistemi di analisi da log e sonde, che monitorano gli apparati e l’infrastruttura ICT di una organizzazione o azienda e che necessariamente agiscono post rem.

Le sfide dell’Osint

La disponibilità di grandi masse di dati da tante e tali molteplici fonti, espresse in linguaggio naturale, apre prospettive e sfide tecnologiche sotto diversi aspetti: in primo luogo, offre la possibilità di cercare, in modo mirato, informazioni pertinenti ad un’area di interesse; al tempo stesso, supporta la capacità strategica di riconoscere l’insorgenza di fatti, tendenze o novità rilevanti; non da ultimo, un’analisi del (cyber) scenario può fornire informazioni tempestive su minacce in via di costituzione o dispiegamento. Quali che siano le finalità, la ricerca di un ago nel pagliaio richiede una considerevole potenza di calcolo ma soprattutto algoritmi sofisticati, per garantire elaborazione veloce e conseguente reazione tempestiva quando necessaria.

Come usare le fonti di pubblico dominio

Il contesto scientifico di riferimento rientra nell’alveo del Text Mining, insieme di metodi per la lettura e l’interpretazione di testi in linguaggio naturale, in cui si fondono competenze di linguistica computazionale, Machine Learning, Intelligenza Artificiale e calcolo ad alte prestazioni.  Le tecnologie necessarie nel quadro multidisciplinare comprendono sia funzioni di tipo strutturale (riconoscimento della lingua in cui il testo è scritto, analisi lessicale per identificazione e elaborazione dei lemmi, analisi sintattica per riconoscimento dei ruoli dei vari termini in una frase), sia competenze di tipo semantico, che si appoggiano a basi di conoscenza (ontologie, reti semantiche) per raccogliere informazioni collaterali non incluse esplicitamente nel testo.

Va detto che le due aree strutturale/semantica non sono indipendenti perché l’interpretazione del testo deriva dall’interazione ciclica fra le due componenti; essa rappresenta il metodo più promettente per superare l’ostacolo principale nell’analisi testuale, cioè la disambiguazione fra diversi significati alternativi. Una caratterizzazione semantica può offrire numerose dimensioni di interpretazione, spaziando dalla geo-referenziazione (della sorgente e del contenuto) alla sentiment analysis, in cui si ricostruisce l’impatto emotivo evocato nel testo. Queste molteplici tecnologie si declinano in modo diverso secondo la specifica finalità di monitoraggio.

Nel caso della ricerca mirata di contenuti, il Text Mining può integrare efficacemente le funzionalità dei convenzionali motori di ricerca, perché offre la capacità di reperire contenuti che sono affini per significato ad un target predeterminato di interesse (es. un documento base da cui partire), ma da cui differiscono integralmente nel lessico e potenzialmente anche nella lingua di espressione.

È questo il caso dei (Semantic) Focused Crawler, agenti software che esplorano il Web localizzando pagine su base di interesse semantico. In questo senso evidentemente l’analisi linguistica può ricoprire un’importanza notevole perché i contenuti esplorati e analizzati sono espressi secondo una struttura linguistica ben definita (es. pagine Web). Le tecnologie di analisi associate possono essere finalizzate alla classificazione dei contenuti secondo i modelli target predeterminati, per cui sistemi di predizione automatica possono applicarsi con successo.

L’applicazione di tecnologie OSINT al monitoraggio di fonti da Social Network espone invece marcate specificità derivanti dall’uso del mezzo di comunicazione da parte dell’utenza.  Un’analisi sintattica profonda può infatti risultare inefficace quando applicata a un microblog o una chat, perché gli utenti spesso tralasciano tout court le regole grammaticali, né la punteggiatura può aiutare a organizzare il testo. In questo caso risulta efficace un’analisi lessicale basica, spesso aiutata da vocabolari ad-hoc con contenuti gergali, mentre può risultare facilitata una caratterizzazione emozionale, che è talora codificata esplicitamente attraverso simboli o espressioni convenzionali (es. emoticon).

Social media e cybersecurity

La natura dinamica e fluida dei Social Media offre alcune opportunità per OSINT nel comparto sicurezza. In primo luogo, una costante osservazione del traffico di informazioni consente di rilevare eventi o espressioni di particolare interesse per il contesto sotto osservazione; particolarmente utili in tal senso sono la combinazione di analisi lessicale e semantica per il filtraggio di contenuti dal fiume di informazioni esposte che sono per lo più irrilevanti.

Gli algoritmi di riferimento comprendono tecniche di clustering, per identificare gruppi di testi dal contenuto affine, e tagging, per caratterizzare singoli contributi o interi gruppi con una connotazione semantica aggregata; tutto ciò può agevolare l’analista nell’identificare contenuti rilevanti. Questi strumenti sono ugualmente efficaci se applicati a un ambiente generalizzato quali un microblog (Twitter) o ad un contesto più ristretto quali una chat o un forum, e hanno la capacità di produrre conoscenza con una costante di tempo molto ristretta, quasi sempre inferiore a quella delle agenzie di stampa o degli Enti e Istituzioni di supervisione. Un’applicazione più mirata può supportare applicazioni anche più incisive, qualora si intenda considerare una fonte specifica o una comunità per rilevare l’insorgenza di potenziali minacce.

In questo caso si possono combinare tecnologie di clustering, novelty detection per rilevare anomalie, geo-referenziazione e sentiment analysis, per arrivare a metodi di classificazione per validare autenticità e originalità della fonte.

Una parola di attenzione: le molte prospettive offerte da queste tecnologie intelligenti possono talora indurre ad aspettative di tipo velleitario. La tecnologia ha notevoli potenzialità ma al momento espone alcune limitazioni che non possono essere trascurate. In primo luogo, il flusso di dati prodotto continuamente rende molto improbabile un monitoraggio cieco delle fonti: l’impatto tecnologico dell’OSINT automatico è massimo se si definisce un contesto di interesse. La sentiment analysis, inoltre, si rivela efficace in scenari di sicurezza se applicata alla singola sorgente, per rilevarne inclinazioni o mutamenti; esistono applicazioni aggregate di sentiment analysis ma si riferisono tipicamente ad un contesto di marketing o di predizione di tendenze (es. elettorali).  Non da ultimo, le basi di conoscenza per un’analisi semantica pongono la costante sfida della costruzione (devono essere codificate da qualcuno), manutenzione (il contenuto deve essere validato) e dell’aggiornamento (i contenuti cambiano continuamente), per eseguire i quali in modo automatico si richiedono algoritmi e tecniche che spesso sono ancora nella sfera della ricerca tecnologica.

Ciononostante, in tutti i casi considerati appare il ruolo e il vantaggio di strumenti di monitoraggio (semi)automatico di contenuti non strutturati. Le tecnologie coinvolte non possono sicuramente porsi in alternativa ai sistemi di controllo degli asset tecnologici quali sistemi SIEM per rilevazione di anomalie o allarmi; tuttavia è oggi prassi operativa consolidata, da parte di Infrastrutture Critiche, Istituzioni o Corporate di rilevo, dotarsi di strumenti di Intelligence preventiva, anche nel mondo della Cyber Security.

Speciale PNRR

Tutti
Incentivi
PA
Sostemibilità
Analisi
Formazione
Salute digitale
Sicurezza
Sostenibilità
Digital Economy
Formazione
Trasferimento tecnologico, il Mise mette sul piatto 7,5 milioni
Strategie
PSN e Strategia Cloud Italia: a che punto siamo e come supportare la PA in questo percorso
Dispersione idrica
Siccità: AI e analisi dei dati possono ridurre gli sprechi d’acqua. Ecco gli interventi necessari
PNRR
Cloud, firmato il contratto per l’avvio di lavori del Polo strategico
Formazione
Competenze digitali, stanziati 48 milioni per gli Istituti tecnologici superiori
Iniziative
Digitalizzazione delle reti idriche: oltre 600 milioni per 21 progetti
Competenze e competitività
PNRR, così i fondi UE possono rilanciare la ricerca e l’Università
Finanziamenti
PNRR, si sbloccano i fondi per l’agrisolare
Sanità post-pandemica
PNRR, Missione Salute: a che punto siamo e cosa resta da fare
Strategie
Sovranità e autonomia tecnologica nazionale: come avviare un processo virtuoso e sostenibile
La relazione
Pnrr e PA digitale, l’alert della Corte dei conti su execution e capacità di spesa
L'editoriale
Elezioni 2022, la sfida digitale ai margini del dibattito politico
Strategie
Digitale, il monito di I-Com: “Senza riforme Pnrr inefficace”
Transizione digitale
Pnrr: arrivano 321 milioni per cloud dei Comuni, spazio e mobilità innovativa
L'analisi I-COM
Il PNRR alla prova delle elezioni: come usare bene le risorse e centrare gli obiettivi digitali
Cineca
Quantum computing, una svolta per la ricerca: lo scenario europeo e i progetti in corso
L'indice europeo
Desi, l’Italia scala due posizioni grazie a fibra e 5G. Ma è (ancora) allarme competenze
L'approfondimento
PNRR 2, ecco tutte le misure per cittadini e imprese: portale sommerso, codice crisi d’impresa e sismabonus, cosa cambia
Servizi digitali
PNRR e trasformazione digitale: ecco gli investimenti e le riforme previste per la digitalizzazione della PA
Legal health
Lo spazio europeo dei dati sanitari: come circoleranno le informazioni sulla salute nell’Unione Europea
Servizi digitali
PNRR e PA digitale: non dimentichiamo la dematerializzazione
Digital Healthcare transformation
La trasformazione digitale degli ospedali
Governance digitale
PA digitale, è la volta buona? Così misure e risorse del PNRR possono fare la differenza
Servizi digitali
Comuni e digitale, come usare il PNRR senza sbagliare
La survey
Pnrr e digitale accoppiata vincente per il 70% delle pmi italiane
Missione salute
Fascicolo Sanitario Elettronico alla prova del PNRR: limiti, rischi e opportunità
Servizi pubblici
PNRR: come diventeranno i siti dei comuni italiani grazie alle nuove risorse
Skill gap
PNRR, la banda ultra larga crea 20.000 nuovi posti di lavoro
Il Piano
Spazio, Colao fa il punto sul Pnrr: i progetti verso la milestone 2023
FORUMPA2022
PNRR e trasformazione digitale: rivedi i Talk di FORUM PA 2022 in collaborazione con le aziende partner
I contratti
Avio, 340 milioni dal Pnrr per i nuovi propulsori a metano
Next Generation EU
PNRR, a che punto siamo e cosa possono aspettarsi le aziende private
Fondi
Operativo il nuovo portale del MISE con tutti i finanziamenti per le imprese
Servizi comunali
Il PNRR occasione unica per i Comuni digitali: strumenti e risorse per enti e cittadini
Healthcare data platform
PNRR dalla teoria alla pratica: tecnologie e soluzioni per l’innovazione in Sanità
Skill
Competenze digitali, partono le Reti di facilitazione
Gli obiettivi
Scuola 4.0, PNRR ultima chance: ecco come cambierà il sistema formativo
Sistema Paese
PNRR 2, è il turno della space economy
FORUM PA 2022
FORUM PA 2022: la maturità digitale dei comuni italiani rispetto al PNRR
Analisi
PNRR: dalla Ricerca all’impresa, una sfida da cogliere insieme
Innovazione
Pnrr, il Dipartimento per la Trasformazione digitale si riorganizza
FORUM PA 2022
PA verde e sostenibile: il ruolo di PNRR, PNIEC, energy management e green public procurement
Analisi
PNRR, Comuni e digitalizzazione: tutto su fondi e opportunità, in meno di 3 minuti. Guarda il video!
Rapporti
Competenze digitali e servizi automatizzati pilastri del piano Inps
Analisi
Attuazione del PNRR: il dialogo necessario tra istituzioni e società civile. Rivedi lo Scenario di FORUM PA 2022
Progetti
Pnrr, fondi per il Politecnico di Torino. Fra i progetti anche IS4Aerospace
Analisi
PNRR, Colao fa il punto sulla transizione digitale dell’Italia: «In linea con tutte le scadenze»
La Svolta
Ict, Istat “riclassifica” i professionisti. Via anche al catalogo dati sul Pnrr
Analisi
Spazio, Colao fa il punto sul Pnrr: i progetti verso la milestone 2023
FORUM PA 2022
Ecosistema territoriale sostenibile: l’Emilia Romagna tra FESR e PNRR
Il Piano
Innovazione, il Mise “centra” gli obiettivi Pnrr: attivati 17,5 miliardi
Analisi
PNRR: raggiunti gli obiettivi per il primo semestre 2022. Il punto e qualche riflessione
Analisi
PNRR: dal dialogo tra PA e società civile passa il corretto monitoraggio dei risultati, tra collaborazione e identità dei luoghi
Webinar
Comuni e PNRR: un focus sui bandi attivi o in pubblicazione
Analisi
Formazione 4.0: cos’è e come funziona il credito d’imposta
PA e Sicurezza
PA e sicurezza informatica: il ruolo dei territori di fronte alle sfide della digitalizzazione
PA e sicurezza
PNRR e servizi pubblici digitali: sfide e opportunità per Comuni e Città metropolitane
Water management
Water management in Italia: verso una transizione “smart” e “circular” 
LE RISORSE
Transizione digitale, Simest apre i fondi Pnrr alle medie imprese
Prospettive
Turismo, cultura e digital: come spendere bene le risorse del PNRR
Analisi
Smart City: quale contributo alla transizione ecologica
Decarbonizzazione
Idrogeno verde, 450 milioni € di investimenti PNRR, Cingolani firma
Unioncamere
PNRR, imprese in ritardo: ecco come le Camere di commercio possono aiutare
I fondi
Industria 4.0: solo un’impresa su tre pronta a salire sul treno Pnrr
Formazione
Trasferimento tecnologico, il Mise mette sul piatto 7,5 milioni
Strategie
PSN e Strategia Cloud Italia: a che punto siamo e come supportare la PA in questo percorso
Dispersione idrica
Siccità: AI e analisi dei dati possono ridurre gli sprechi d’acqua. Ecco gli interventi necessari
PNRR
Cloud, firmato il contratto per l’avvio di lavori del Polo strategico
Formazione
Competenze digitali, stanziati 48 milioni per gli Istituti tecnologici superiori
Iniziative
Digitalizzazione delle reti idriche: oltre 600 milioni per 21 progetti
Competenze e competitività
PNRR, così i fondi UE possono rilanciare la ricerca e l’Università
Finanziamenti
PNRR, si sbloccano i fondi per l’agrisolare
Sanità post-pandemica
PNRR, Missione Salute: a che punto siamo e cosa resta da fare
Strategie
Sovranità e autonomia tecnologica nazionale: come avviare un processo virtuoso e sostenibile
La relazione
Pnrr e PA digitale, l’alert della Corte dei conti su execution e capacità di spesa
L'editoriale
Elezioni 2022, la sfida digitale ai margini del dibattito politico
Strategie
Digitale, il monito di I-Com: “Senza riforme Pnrr inefficace”
Transizione digitale
Pnrr: arrivano 321 milioni per cloud dei Comuni, spazio e mobilità innovativa
L'analisi I-COM
Il PNRR alla prova delle elezioni: come usare bene le risorse e centrare gli obiettivi digitali
Cineca
Quantum computing, una svolta per la ricerca: lo scenario europeo e i progetti in corso
L'indice europeo
Desi, l’Italia scala due posizioni grazie a fibra e 5G. Ma è (ancora) allarme competenze
L'approfondimento
PNRR 2, ecco tutte le misure per cittadini e imprese: portale sommerso, codice crisi d’impresa e sismabonus, cosa cambia
Servizi digitali
PNRR e trasformazione digitale: ecco gli investimenti e le riforme previste per la digitalizzazione della PA
Legal health
Lo spazio europeo dei dati sanitari: come circoleranno le informazioni sulla salute nell’Unione Europea
Servizi digitali
PNRR e PA digitale: non dimentichiamo la dematerializzazione
Digital Healthcare transformation
La trasformazione digitale degli ospedali
Governance digitale
PA digitale, è la volta buona? Così misure e risorse del PNRR possono fare la differenza
Servizi digitali
Comuni e digitale, come usare il PNRR senza sbagliare
La survey
Pnrr e digitale accoppiata vincente per il 70% delle pmi italiane
Missione salute
Fascicolo Sanitario Elettronico alla prova del PNRR: limiti, rischi e opportunità
Servizi pubblici
PNRR: come diventeranno i siti dei comuni italiani grazie alle nuove risorse
Skill gap
PNRR, la banda ultra larga crea 20.000 nuovi posti di lavoro
Il Piano
Spazio, Colao fa il punto sul Pnrr: i progetti verso la milestone 2023
FORUMPA2022
PNRR e trasformazione digitale: rivedi i Talk di FORUM PA 2022 in collaborazione con le aziende partner
I contratti
Avio, 340 milioni dal Pnrr per i nuovi propulsori a metano
Next Generation EU
PNRR, a che punto siamo e cosa possono aspettarsi le aziende private
Fondi
Operativo il nuovo portale del MISE con tutti i finanziamenti per le imprese
Servizi comunali
Il PNRR occasione unica per i Comuni digitali: strumenti e risorse per enti e cittadini
Healthcare data platform
PNRR dalla teoria alla pratica: tecnologie e soluzioni per l’innovazione in Sanità
Skill
Competenze digitali, partono le Reti di facilitazione
Gli obiettivi
Scuola 4.0, PNRR ultima chance: ecco come cambierà il sistema formativo
Sistema Paese
PNRR 2, è il turno della space economy
FORUM PA 2022
FORUM PA 2022: la maturità digitale dei comuni italiani rispetto al PNRR
Analisi
PNRR: dalla Ricerca all’impresa, una sfida da cogliere insieme
Innovazione
Pnrr, il Dipartimento per la Trasformazione digitale si riorganizza
FORUM PA 2022
PA verde e sostenibile: il ruolo di PNRR, PNIEC, energy management e green public procurement
Analisi
PNRR, Comuni e digitalizzazione: tutto su fondi e opportunità, in meno di 3 minuti. Guarda il video!
Rapporti
Competenze digitali e servizi automatizzati pilastri del piano Inps
Analisi
Attuazione del PNRR: il dialogo necessario tra istituzioni e società civile. Rivedi lo Scenario di FORUM PA 2022
Progetti
Pnrr, fondi per il Politecnico di Torino. Fra i progetti anche IS4Aerospace
Analisi
PNRR, Colao fa il punto sulla transizione digitale dell’Italia: «In linea con tutte le scadenze»
La Svolta
Ict, Istat “riclassifica” i professionisti. Via anche al catalogo dati sul Pnrr
Analisi
Spazio, Colao fa il punto sul Pnrr: i progetti verso la milestone 2023
FORUM PA 2022
Ecosistema territoriale sostenibile: l’Emilia Romagna tra FESR e PNRR
Il Piano
Innovazione, il Mise “centra” gli obiettivi Pnrr: attivati 17,5 miliardi
Analisi
PNRR: raggiunti gli obiettivi per il primo semestre 2022. Il punto e qualche riflessione
Analisi
PNRR: dal dialogo tra PA e società civile passa il corretto monitoraggio dei risultati, tra collaborazione e identità dei luoghi
Webinar
Comuni e PNRR: un focus sui bandi attivi o in pubblicazione
Analisi
Formazione 4.0: cos’è e come funziona il credito d’imposta
PA e Sicurezza
PA e sicurezza informatica: il ruolo dei territori di fronte alle sfide della digitalizzazione
PA e sicurezza
PNRR e servizi pubblici digitali: sfide e opportunità per Comuni e Città metropolitane
Water management
Water management in Italia: verso una transizione “smart” e “circular” 
LE RISORSE
Transizione digitale, Simest apre i fondi Pnrr alle medie imprese
Prospettive
Turismo, cultura e digital: come spendere bene le risorse del PNRR
Analisi
Smart City: quale contributo alla transizione ecologica
Decarbonizzazione
Idrogeno verde, 450 milioni € di investimenti PNRR, Cingolani firma
Unioncamere
PNRR, imprese in ritardo: ecco come le Camere di commercio possono aiutare
I fondi
Industria 4.0: solo un’impresa su tre pronta a salire sul treno Pnrr

Articoli correlati