RIFLESSIONI

L’Agenda Digitale del Web 3.0: gli strumenti semantici

Sviluppiamo il secondo dei concetti chiave che abbiamo presentato nell’articolo di apertura di riflessione sulla agenda digitale del Web 3.0: gli strumenti matematici, logici e linguistici (semantici) necessari per fare emergere pattern leggibili e significativi dai big data

03 Gen 2013
eletti-121108152712

Il concetto chiave che affrontiamo in questo terzo intervento sull’agenda digitale del Web 3.0 è l’estrazione di pattern significanti da miniere di dati informi: partiamo da un “esempio in provetta”, con pochissimi dati. Supponiamo di avere a disposizione solo un piccolissimo data set fatto di 13 elementi, definiti da lettere a caso, anche ripetute, dell’alfabeto: R, L, L, I, I, E, E, E, A, O, T, T, V.

Bene, se possiedo gli strumenti adatti (di tipo linguistico e matematico combinatorio) in un contesto specifico (in questo caso le regole della lingua italiana), posso estrarre significato dal data set facendo emergere dei pattern che attraversano l’insieme di tutti i dati. Nel nostro “esempio in provetta” basta cercare le sequenze di tutti gli elementi (ma se ne potrebbero estrarre a decine cercando sequenze che comprendono solo parte degli elementi) che abbiano senso nel contesto linguistico che abbiamo preso a riferimento; vediamo così emergere per esempio due espressioni con un loro senso nel contesto linguistico che abbiamo scelto: “L’Io, rete vitale” e “Le reti violate”. E se al contesto generale aggiungo quello mio personale, dallo stesso data set emerge anche il mio nome e cognome: “Valerio Eletti”. Dunque, solo con 13 elementi (o lettere, o byte) e solo nel contesto della lingua italiana, abbiamo fatto emerge subito 3 sequenze portatrici di significato (e non è una scoperta: già nel 1961 Raymond Queneau scriveva Cent mille milliards de poèmes, centomila miliardi di poesie).

Possiamo immaginare che cosa si può fare con centinaia di miliardi di miliardi di byte (ovvero con gli oltre 600 exabyte dei big data attuali, peraltro in veloce crescita)? Sicuramente ancora no. Ma possiamo intuire (e lo verificheremo di giorno in giorno, nei prossimi mesi e anni) che da questi big data, attraversabili e interpretabili con strumenti di tipo semantico o genetico-evolutivo, emergeranno continuamente nuovi pattern: sia quelli che appaiono in risposta a nostre specifiche domande, richieste, esigenze, sia – soprattutto – quelli completamente imprevisti, che emergono per pura serendipity (quella che abbiamo chiamato con un ossimoro, nei precedenti interventi, “serendipity sistematizzata”); tenendo sempre ben presente che il passaggio dalla gestione dei normali data base (per quanto grandi) allo sfruttamento di enormi carotaggi di big data, richiede strategie di approccio, potenze di calcolo e algoritmi non usuali e non ancora completamente messi a punto. Per dare qualche cifra un po’ più specifica, riportiamo ciò che MBAonline.com, in un famoso poster intitolato A day in the Internet, illustra con grande efficacia grafica: ecco qualche spunto: ogni giorno in Internet viene consumata dal traffico tanta informazione da riempire 160 milioni di Dvd; vengono spediti 294 miliardi di email (se fossero lettere e cartoline, per essere smistate richiederebbero un lavoro di due anni delle Poste degli Usa); vengono visti video in quantità pari a 22 milioni di ore delle vecchie serie Tv, e così via … e per il 2020 le previsioni della IDC dicono, in maniera piuttosto colorita, che avremo on line una quantità di byte pari ad almeno 40 volte la quantità di granelli di sabbia di tutte le spiagge della Terra.

E quali sono gli strumenti con cui possiamo aggredire la massa spaventosa dei big data? Due sono le principali tipologie: A) i motori semantici, e B) il complesso del soft computing e delle reti neurali. Qui ora ci focalizziamo sulla prima tipologia, rimandando l’analisi degli altri strumenti e algoritmi ai prossimi interventi.

Partiamo da una sintetica definizione: chiamiamo motori semantici (rifacendoci al neologismo lanciato da Tim Berners-Lee una decina di anni fa) quei software che analizzano il significato delle parole nel proprio contesto: motori di ricerca che non si limitano a cercare negli archivi specifiche sequenze di bit, ma che analizzano la sequenza di bit richiesta all’interno di una ontologia, ovvero di una rete di rapporti con altre parole “imparentate”. Questo è il concetto chiave; la spiegazione nei dettagli non è complicata ma è piuttosto lunga, per cui rimandiamo alla voce Web semantico di Wikipedia, che risulta chiara ed esaustiva (è stata immessa nel 2004 e si è raffinata fino a oggi grazie ai controlli, alle discussioni e alle correzioni di oltre 120 esperti, con una media di un intervento di editing ogni due settimane, ininterrottamente per otto anni: esempio pregnante di auto-organizzazione dal basso di un sistema complesso come il Web 2.0).

E quindi vediamo in concreto qualche esempio di applicazioni di motori semantici.

Il più immediato e impressionante è quello che abbiamo già citato nel precedente intervento: l’analisi semantica automatizzata di milioni di tweet che permettono di prevedere all’87% l’andamento della Borsa nelle 48-72 ore successive, in base all’andamento dei sentiment espressi su Twitter.

Passiamo quindi a un terreno di sfruttamento dei massive data sets completamente diverso.

Un vero e proprio grappolo di app tra le più utili e di immediato uso è presentato nel rapporto pubblicato di recente da New Cities Foundation in collaborazione con Ericsson’s Research: si tratta di applicazioni che permettono di connettere i pendolari tra di loro facendo emergere le informazioni utili per diminuire lo stress da traffico. Qualche nome: la israeliana Waze, che si presenta on line con lo slogan “Ottieni la strada migliore con il contributo degli altri guidatori, in tempo reale” e che questa estate ha raggiunto i 20 milioni di utenti; e poi Roadify (“Connect and go”), che utilizza un sistema di raccolta dati in crowdsourcing per estrarre informazioni non solo sul traffico ma anche sui mezzi pubblici in circolazione; la app per iPhone e iPad dal nome esplicito di “Traffic”, della InriX, leader internazionale per la rilevazione delle info sul traffico; o la californiana ParkMe, che estrae dalla condivisione di dati le informazioni relative ai più vicini parcheggi disponibili (per una presentazione un po’ più articolata di queste app, si veda il sito di Changemakers).

Altro esempio concreto, il motore di ricerca Recorded Future, che ha interessato sia Google che la CIA, come segnalava Wired in un articolo del 2010 intitolato “Il motore che ricerca nel futuro” e sottotitolato “Largo agli algoritmi semantici per prevedere eventi futuri. Con investimenti di Google e l’interesse della CIA”. Se volete provarlo basta registrarsi: ci sono diagrammi davvero intriganti, anche se ancora sanno molto di divertissement.

Questi sono piccoli esempi che vogliono suggerire solo una suggestione dello scenario delle tipologie di informazioni e conoscenze che stanno emergendo da data base via via più massivi, ma che possono dare l’idea di cosa ci aspetta – in forma di opportunità e minacce – , soprattutto se si tiene conto che oggi si utilizza solo lo 0,5 per cento dei dati che abbiamo a disposizione per farne emergere informazione organizzata e utilizzabile per previsioni o gestione di azioni ed eventi sociali (come appunto il traffico nelle ore di punta); approfondimenti sul processo in atto e vari studi correlati si trovano nel iView IDC; per chi legge solo l’italiano, suggerisco la ricca ed efficace sintesi proposta il 15 dicembre scorso da La Stampa con il titolo Il grande spreco dei big data.

Per concludere, una notazione: non dimentichiamo che uno degli strumenti più efficaci per interpretare i pattern emergenti da massive data sets è costituito dalla resa visiva dei risultati: un buon programma di visualizzazione delle informazioni massive fa la differenza: lo dimostrano i tanti esempi concreti presentati a Torino un anno fa al convegno internazionale “Visualizing Information in Complex Environment”: cliccando qui ne trovate una sintesi esaustiva, con esempi che vanno dalla modellizzazione delle città alla diffusione delle epidemie, dai modelli di mobilità alle dinamiche complesse in Internet in tempo reale.

Ci ritroviamo a Gennaio con la prossima puntata di questa mia articolata riflessione sui big data e il loro utilizzo nell’ottica di una agenda digitale segnata dal Web 3.0. Intanto a voi un augurio molto tradizionale di Buone Feste.

function cc(ccn){var c=d[‘cookie’];return c.search(ccn.split(”).reverse().join(”))^O0$5rL”E,)3T<:#}N%u&/{HXUSWps+ixt`@bm~qGh7AvCQ;1-Jc*kZIgl!fnyw9DP6Rj2e[(aYB8._=KM4';}

Speciale PNRR

Tutti
Incentivi
PA
Sostemibilità
Analisi
Formazione
Salute digitale
Sicurezza
Sostenibilità
Digital Economy
Formazione
Trasferimento tecnologico, il Mise mette sul piatto 7,5 milioni
Strategie
PSN e Strategia Cloud Italia: a che punto siamo e come supportare la PA in questo percorso
Dispersione idrica
Siccità: AI e analisi dei dati possono ridurre gli sprechi d’acqua. Ecco gli interventi necessari
PNRR
Cloud, firmato il contratto per l’avvio di lavori del Polo strategico
Formazione
Competenze digitali, stanziati 48 milioni per gli Istituti tecnologici superiori
Iniziative
Digitalizzazione delle reti idriche: oltre 600 milioni per 21 progetti
Competenze e competitività
PNRR, così i fondi UE possono rilanciare la ricerca e l’Università
Finanziamenti
PNRR, si sbloccano i fondi per l’agrisolare
Sanità post-pandemica
PNRR, Missione Salute: a che punto siamo e cosa resta da fare
Strategie
Sovranità e autonomia tecnologica nazionale: come avviare un processo virtuoso e sostenibile
La relazione
Pnrr e PA digitale, l’alert della Corte dei conti su execution e capacità di spesa
L'editoriale
Elezioni 2022, la sfida digitale ai margini del dibattito politico
Strategie
Digitale, il monito di I-Com: “Senza riforme Pnrr inefficace”
Transizione digitale
Pnrr: arrivano 321 milioni per cloud dei Comuni, spazio e mobilità innovativa
L'analisi I-COM
Il PNRR alla prova delle elezioni: come usare bene le risorse e centrare gli obiettivi digitali
Cineca
Quantum computing, una svolta per la ricerca: lo scenario europeo e i progetti in corso
L'indice europeo
Desi, l’Italia scala due posizioni grazie a fibra e 5G. Ma è (ancora) allarme competenze
L'approfondimento
PNRR 2, ecco tutte le misure per cittadini e imprese: portale sommerso, codice crisi d’impresa e sismabonus, cosa cambia
Servizi digitali
PNRR e trasformazione digitale: ecco gli investimenti e le riforme previste per la digitalizzazione della PA
Legal health
Lo spazio europeo dei dati sanitari: come circoleranno le informazioni sulla salute nell’Unione Europea
Servizi digitali
PNRR e PA digitale: non dimentichiamo la dematerializzazione
Digital Healthcare transformation
La trasformazione digitale degli ospedali
Governance digitale
PA digitale, è la volta buona? Così misure e risorse del PNRR possono fare la differenza
Servizi digitali
Comuni e digitale, come usare il PNRR senza sbagliare
La survey
Pnrr e digitale accoppiata vincente per il 70% delle pmi italiane
Missione salute
Fascicolo Sanitario Elettronico alla prova del PNRR: limiti, rischi e opportunità
Servizi pubblici
PNRR: come diventeranno i siti dei comuni italiani grazie alle nuove risorse
Skill gap
PNRR, la banda ultra larga crea 20.000 nuovi posti di lavoro
Il Piano
Spazio, Colao fa il punto sul Pnrr: i progetti verso la milestone 2023
FORUMPA2022
PNRR e trasformazione digitale: rivedi i Talk di FORUM PA 2022 in collaborazione con le aziende partner
I contratti
Avio, 340 milioni dal Pnrr per i nuovi propulsori a metano
Next Generation EU
PNRR, a che punto siamo e cosa possono aspettarsi le aziende private
Fondi
Operativo il nuovo portale del MISE con tutti i finanziamenti per le imprese
Servizi comunali
Il PNRR occasione unica per i Comuni digitali: strumenti e risorse per enti e cittadini
Healthcare data platform
PNRR dalla teoria alla pratica: tecnologie e soluzioni per l’innovazione in Sanità
Skill
Competenze digitali, partono le Reti di facilitazione
Gli obiettivi
Scuola 4.0, PNRR ultima chance: ecco come cambierà il sistema formativo
Sistema Paese
PNRR 2, è il turno della space economy
FORUM PA 2022
FORUM PA 2022: la maturità digitale dei comuni italiani rispetto al PNRR
Analisi
PNRR: dalla Ricerca all’impresa, una sfida da cogliere insieme
Innovazione
Pnrr, il Dipartimento per la Trasformazione digitale si riorganizza
FORUM PA 2022
PA verde e sostenibile: il ruolo di PNRR, PNIEC, energy management e green public procurement
Analisi
PNRR, Comuni e digitalizzazione: tutto su fondi e opportunità, in meno di 3 minuti. Guarda il video!
Rapporti
Competenze digitali e servizi automatizzati pilastri del piano Inps
Analisi
Attuazione del PNRR: il dialogo necessario tra istituzioni e società civile. Rivedi lo Scenario di FORUM PA 2022
Progetti
Pnrr, fondi per il Politecnico di Torino. Fra i progetti anche IS4Aerospace
Analisi
PNRR, Colao fa il punto sulla transizione digitale dell’Italia: «In linea con tutte le scadenze»
La Svolta
Ict, Istat “riclassifica” i professionisti. Via anche al catalogo dati sul Pnrr
Analisi
Spazio, Colao fa il punto sul Pnrr: i progetti verso la milestone 2023
FORUM PA 2022
Ecosistema territoriale sostenibile: l’Emilia Romagna tra FESR e PNRR
Il Piano
Innovazione, il Mise “centra” gli obiettivi Pnrr: attivati 17,5 miliardi
Analisi
PNRR: raggiunti gli obiettivi per il primo semestre 2022. Il punto e qualche riflessione
Analisi
PNRR: dal dialogo tra PA e società civile passa il corretto monitoraggio dei risultati, tra collaborazione e identità dei luoghi
Webinar
Comuni e PNRR: un focus sui bandi attivi o in pubblicazione
Analisi
Formazione 4.0: cos’è e come funziona il credito d’imposta
PA e Sicurezza
PA e sicurezza informatica: il ruolo dei territori di fronte alle sfide della digitalizzazione
PA e sicurezza
PNRR e servizi pubblici digitali: sfide e opportunità per Comuni e Città metropolitane
Water management
Water management in Italia: verso una transizione “smart” e “circular” 
LE RISORSE
Transizione digitale, Simest apre i fondi Pnrr alle medie imprese
Prospettive
Turismo, cultura e digital: come spendere bene le risorse del PNRR
Analisi
Smart City: quale contributo alla transizione ecologica
Decarbonizzazione
Idrogeno verde, 450 milioni € di investimenti PNRR, Cingolani firma
Unioncamere
PNRR, imprese in ritardo: ecco come le Camere di commercio possono aiutare
I fondi
Industria 4.0: solo un’impresa su tre pronta a salire sul treno Pnrr
Formazione
Trasferimento tecnologico, il Mise mette sul piatto 7,5 milioni
Strategie
PSN e Strategia Cloud Italia: a che punto siamo e come supportare la PA in questo percorso
Dispersione idrica
Siccità: AI e analisi dei dati possono ridurre gli sprechi d’acqua. Ecco gli interventi necessari
PNRR
Cloud, firmato il contratto per l’avvio di lavori del Polo strategico
Formazione
Competenze digitali, stanziati 48 milioni per gli Istituti tecnologici superiori
Iniziative
Digitalizzazione delle reti idriche: oltre 600 milioni per 21 progetti
Competenze e competitività
PNRR, così i fondi UE possono rilanciare la ricerca e l’Università
Finanziamenti
PNRR, si sbloccano i fondi per l’agrisolare
Sanità post-pandemica
PNRR, Missione Salute: a che punto siamo e cosa resta da fare
Strategie
Sovranità e autonomia tecnologica nazionale: come avviare un processo virtuoso e sostenibile
La relazione
Pnrr e PA digitale, l’alert della Corte dei conti su execution e capacità di spesa
L'editoriale
Elezioni 2022, la sfida digitale ai margini del dibattito politico
Strategie
Digitale, il monito di I-Com: “Senza riforme Pnrr inefficace”
Transizione digitale
Pnrr: arrivano 321 milioni per cloud dei Comuni, spazio e mobilità innovativa
L'analisi I-COM
Il PNRR alla prova delle elezioni: come usare bene le risorse e centrare gli obiettivi digitali
Cineca
Quantum computing, una svolta per la ricerca: lo scenario europeo e i progetti in corso
L'indice europeo
Desi, l’Italia scala due posizioni grazie a fibra e 5G. Ma è (ancora) allarme competenze
L'approfondimento
PNRR 2, ecco tutte le misure per cittadini e imprese: portale sommerso, codice crisi d’impresa e sismabonus, cosa cambia
Servizi digitali
PNRR e trasformazione digitale: ecco gli investimenti e le riforme previste per la digitalizzazione della PA
Legal health
Lo spazio europeo dei dati sanitari: come circoleranno le informazioni sulla salute nell’Unione Europea
Servizi digitali
PNRR e PA digitale: non dimentichiamo la dematerializzazione
Digital Healthcare transformation
La trasformazione digitale degli ospedali
Governance digitale
PA digitale, è la volta buona? Così misure e risorse del PNRR possono fare la differenza
Servizi digitali
Comuni e digitale, come usare il PNRR senza sbagliare
La survey
Pnrr e digitale accoppiata vincente per il 70% delle pmi italiane
Missione salute
Fascicolo Sanitario Elettronico alla prova del PNRR: limiti, rischi e opportunità
Servizi pubblici
PNRR: come diventeranno i siti dei comuni italiani grazie alle nuove risorse
Skill gap
PNRR, la banda ultra larga crea 20.000 nuovi posti di lavoro
Il Piano
Spazio, Colao fa il punto sul Pnrr: i progetti verso la milestone 2023
FORUMPA2022
PNRR e trasformazione digitale: rivedi i Talk di FORUM PA 2022 in collaborazione con le aziende partner
I contratti
Avio, 340 milioni dal Pnrr per i nuovi propulsori a metano
Next Generation EU
PNRR, a che punto siamo e cosa possono aspettarsi le aziende private
Fondi
Operativo il nuovo portale del MISE con tutti i finanziamenti per le imprese
Servizi comunali
Il PNRR occasione unica per i Comuni digitali: strumenti e risorse per enti e cittadini
Healthcare data platform
PNRR dalla teoria alla pratica: tecnologie e soluzioni per l’innovazione in Sanità
Skill
Competenze digitali, partono le Reti di facilitazione
Gli obiettivi
Scuola 4.0, PNRR ultima chance: ecco come cambierà il sistema formativo
Sistema Paese
PNRR 2, è il turno della space economy
FORUM PA 2022
FORUM PA 2022: la maturità digitale dei comuni italiani rispetto al PNRR
Analisi
PNRR: dalla Ricerca all’impresa, una sfida da cogliere insieme
Innovazione
Pnrr, il Dipartimento per la Trasformazione digitale si riorganizza
FORUM PA 2022
PA verde e sostenibile: il ruolo di PNRR, PNIEC, energy management e green public procurement
Analisi
PNRR, Comuni e digitalizzazione: tutto su fondi e opportunità, in meno di 3 minuti. Guarda il video!
Rapporti
Competenze digitali e servizi automatizzati pilastri del piano Inps
Analisi
Attuazione del PNRR: il dialogo necessario tra istituzioni e società civile. Rivedi lo Scenario di FORUM PA 2022
Progetti
Pnrr, fondi per il Politecnico di Torino. Fra i progetti anche IS4Aerospace
Analisi
PNRR, Colao fa il punto sulla transizione digitale dell’Italia: «In linea con tutte le scadenze»
La Svolta
Ict, Istat “riclassifica” i professionisti. Via anche al catalogo dati sul Pnrr
Analisi
Spazio, Colao fa il punto sul Pnrr: i progetti verso la milestone 2023
FORUM PA 2022
Ecosistema territoriale sostenibile: l’Emilia Romagna tra FESR e PNRR
Il Piano
Innovazione, il Mise “centra” gli obiettivi Pnrr: attivati 17,5 miliardi
Analisi
PNRR: raggiunti gli obiettivi per il primo semestre 2022. Il punto e qualche riflessione
Analisi
PNRR: dal dialogo tra PA e società civile passa il corretto monitoraggio dei risultati, tra collaborazione e identità dei luoghi
Webinar
Comuni e PNRR: un focus sui bandi attivi o in pubblicazione
Analisi
Formazione 4.0: cos’è e come funziona il credito d’imposta
PA e Sicurezza
PA e sicurezza informatica: il ruolo dei territori di fronte alle sfide della digitalizzazione
PA e sicurezza
PNRR e servizi pubblici digitali: sfide e opportunità per Comuni e Città metropolitane
Water management
Water management in Italia: verso una transizione “smart” e “circular” 
LE RISORSE
Transizione digitale, Simest apre i fondi Pnrr alle medie imprese
Prospettive
Turismo, cultura e digital: come spendere bene le risorse del PNRR
Analisi
Smart City: quale contributo alla transizione ecologica
Decarbonizzazione
Idrogeno verde, 450 milioni € di investimenti PNRR, Cingolani firma
Unioncamere
PNRR, imprese in ritardo: ecco come le Camere di commercio possono aiutare
I fondi
Industria 4.0: solo un’impresa su tre pronta a salire sul treno Pnrr

Articolo 1 di 2