Che si parli di Industria 4.0, Impresa 4.0, Digital Banking, Smart City, Smart Agrifood o di qualunque altro tema di rilevanza economica e sociale, il denominatore comunque che unisce tutti questi fenomeni è la polarizzazione sui dati: siamo nell’era della Data Driven Innovation, dell’innovazione guidata dalla valorizzazione di tutti i dati aziendali partendo da una visione di insieme di tutte le fonti.
Non è un tema esclusivamente tecnologico e i tavoli ai quali i decisori aziendali sono chiamati non sono eminentemente tecnici.
Emerge, tuttavia, in questi tavoli, una figura professionale nuova, quella del Data Scientist, il cui compito è quello di contribuire a trasformare i dati in conoscenza e la conoscenza in valore di business nelle imprese o di servizio nelle Pubbliche Amministrazioni e nelle istituzioni. (Leggi il servizio su come si diventa Data Scientist)
E accanto ai Data Scientist, nelle realtà che mostrano una maggiore vocazione si fa largo anche la figura del CDO, il Chief Data Officer, vale a dire la figura manageriale chiamata a definire lo sviluppo delle strategie per la valorizzazione dei dati e per la gestione del ciclo di vita del dato, dal momento della sua raccolta fino alla fase di distribuzione, di conservazione ed eventualmente di vendita o trasferimento.
In entrambi i casi parliamo di figure professionali con competenze trasversali, alle quali sono richieste capacità di analisi, di lettura dei fenomeni di business, precisione nell’identificare e nell’illustrare il senso di un risultato e precisione nel rappresentarlo a colleghi o figure che devono essere in grado di comprenderlo per tradurlo in azioni di business o in servizi.
A Data Scientist è richiesta, inoltre, la capacità di scegliere gli strumenti adeguati al contesto e agli obiettivi.
Concretamente, Data Scientist e CDO si muovono nell’ambito dei Big Data e hanno a che fare con i 5 principi chiave che regolano l’identità dei dati stessi, le cosiddette 5V dei dati:
- Volume
- Velocità
- Varietà
- Valore
- Veridicità
Concretamente, hanno a che fare con le diverse tipologie di analisi dei dati stessi, descriptive, predictive, prescriptive, automated, se pure con pesi diversi (i dati dell’ultima ricerca dell’Osservatorio Big Data parlano di una penetrazione del 100 per cento di descritptive analytics, del 73 per cento delle predictivie lasciano più modesti 33 e 11 per cento rispettivamente a prescriptive e automated. (Leggi il servizio Big data e Data Science verso la data Driven economy).
Sono chiamati a un ruolo sempre più strutturale e organico nei processi aziendali con attività che spaziano dalla mappatura, organizzazione e controllo delle fonti di dati aziendali, alla creazione, organizzazione e verifica dei loro flussi, dalla modellizzazione dei dati all’analisi del loro valore dei per ogni area di business, dall’individuazione delle interazioni tra diverse linee di business alla definizione delle linee di indirizzo nello sviluppo di nuovi prodotti e servizi.
È chiaro tuttavia che in questo momento Banche e Manifatturiero drenino oltre la metà della spesa, con quote rispettivamente del 28 e del 24 per cento, seguiti da Telco, GDO e Retail PA e Sanità e via a scendere verso il mondo dei servizi, delle utility e delle assicurazioni.
Stiamo comunque parlando di una spesa in crescita del 22 per cento, che ha ormai superato i 1103 milioni di euro, con investimenti che sempre più puntano all”estrazione di valore” dai dati a supporto di fenomeni quali Industry 4.0, Digital Banking, Smart retail, GDPR, Open banking, PSD2.
In ogni caso, in alcun modo data scientist e CDO lavorano in solitaria.
Anzi.
Secondo un’analisi condotta da IBM, sui dati lavorano Data Scientist, data engineer, developer, business analyst, ciascuno con competenze e ruoli diversi. Così, il Data Scientist ha come obiettivo individuare relazioni o linee di tendenza, il data engineer aiuta a raccogliere, organizzare e riordinare i dati, il developer ha il compito di trasformare l’operato del team Data Science in un prodotto o in un servizio, mentre il business analyst, ha il compito di comprendere le esigenze del business.
Tutti lavorano con dati eterogenei, strutturati e destrutturati e hanno a che fare con tecnologie di base quali Spark, Hadoop, strumenti SQL e NoSQL, datawarehousing ed ETL.
Quanto alle soluzioni di mercato disponibili per la loro attività, la scelta è ormai ampia e forse di non immediata navigazione.
Per questo motivo, Gartner, nella compilazione del suo Magic Quadrant dedicato proprio al mondo dei Big Data, ha identificato i 15 criteri sui quali riflettere nella scelta delle piattaforme di Advanced Analytics:
- capacità di accesso a dati da fonti multiple e destrutturate
- funzionalità di Data Preparation che consentono di filtrare e trasformare i dati per le fasi di modellazione, Data Exploration e Visualization
- funzionalità di automazione
- coerenza del look and feel e intuitività dell’interfaccia utente
- correlazione con strumenti di Machine Learning
- funzionalità di Advanced Analytics
- criteri di flessibilità, estensibilità e apertura
- performance
- scalabilità
- possibilità di utilizzo in scenari di Fast Deployment
- funzionalità di management
- sviluppo e gestione di modelli
- disponibilità di preconfigurazioni ad esempio per attività di cross selling o di analisi dei social media
- capacità di essere utilizzate in contesti di collaboration
- coerenza lungo tutta la pipeline
Su quali obiettivi lavorano Data Scientist e CDO?
In primo luogo, secondo l’Osservatorio Big Data Analytics & Business Intelligence della School of Management del Politecnico di Milano, si parte dal CRM e da tutte le progettualità che concorrono alla gestione dei rapporti con i clienti e alla customer experience.
Ma negli ultimi trimestre ha preso fortemente peso tutto il filone legato all’Internet of Things: i dati raccolti dai sensori abilitano la nascita e lo sviluppo di nuovi prodotti e servizi.
Entriamo dunque in quella che viene definita Data Monetization, ovvero lo studio di progettualità che riescono a estrarre un valore inedito e un tempo impensabile dai dati. La Data Monetization, diretta o indiretta che sia può affiancare, complementare o assistere il contemporaneo sviluppo dei core business tradizionali.
Si va dalla vendita nuda e cruda dei dati, alla vendita di dati “trattati”, ovvero in grado di esprimere una conoscenza, per arrivare allo sfruttamento economico dei dati per altre attività.
Siamo su un terreno delicato: quando si parla di Data Monetization non si può non affrontare il tema normativo e nella fattispecie di quanto previsto dall’Articolo 6 del General Data Protection Regulation (GDPR) che delibera proprio sulle condizioni che permettono o non permettono il trattamento. Proprio il Gdpr rappresenta un faro nell’attività del Data Scientist che, una volta iniziata la raccolta dei dati, non può sottoporli ad analisi e utilizzi non specificati a priori.