standard fair

Open science: come rendere i dati della ricerca riutilizzabili



Indirizzo copiato

L’apertura dei dati scientifici migliora la qualità della ricerca, riducendo la crisi di riproducibilità e favorendo la trasparenza. I dati aperti sono essenziali per validare i risultati e promuovere la collaborazione

Pubblicato il 10 lug 2025

Federico Ferrario

Responsabile Sviluppo Offerta – Direzione Sviluppo Offerta e Gestione Domanda



Qualità del dato PA qualità dei dati sanitari dati pseudonimizzati

Nell’era della scienza aperta, la condivisione dei dati della ricerca è diventata una priorità strategica per università ed enti di ricerca.

Rendere i dati aperti non significa solo garantire l’accesso alle informazioni, ma implica un cambio di paradigma nella gestione, nella conservazione e nell’interoperabilità dei dati scientifici.

Tuttavia, la transizione verso i dati aperti presenta sfide significative: dal rispetto delle normative su privacy e proprietà intellettuale, alla necessità di infrastrutture adeguate e competenze specifiche per garantire la FAIRness (Findability, Accessibility, Interoperability, Reusability) dei dati.ì

L’importanza dei dati aperti nella ricerca

L’apertura dei dati della ricerca rappresenta un tema delicato e insieme un’opportunità strategica per università ed enti di ricerca. I dati generati durante le attività di ricerca costituiscono una risorsa fondamentale non solo per la validazione dei risultati pubblicati, ma anche per il progresso della conoscenza. Tuttavia, il valore dei dati è reale solo quando essi vengono resi accessibili, comprensibili e riutilizzabili da altri ricercatori, stakeholder istituzionali e attori della società civile.

Rendere i dati “aperti” non vuol dire semplicemente pubblicarli online. Implica un cambiamento profondo nella cultura scientifica e nelle pratiche organizzative delle istituzioni della ricerca: dalla progettazione degli esperimenti all’archiviazione, dalla documentazione alla condivisione. Si tratta di una trasformazione che coinvolge aspetti tecnici, giuridici, etici e formativi, in un contesto in cui l’Unione Europea promuove attivamente, attraverso iniziative come l’European Open Science Cloud (EOSC) e i programmi quadro (Horizon 2020, Horizon Europe), la creazione di un ecosistema dei dati orientato alla trasparenza e alla condivisione.

A livello europeo i principi FAIR (Findable, Accessible, Interoperable, Reusable) sono diventati lo standard di riferimento per la gestione dei dati della ricerca e la Commissione Europea richiede sempre più frequentemente che i dati prodotti con fondi pubblici siano aperti, salvo giustificati motivi di riservatezza. L’Italia si sta adeguando a questi orientamenti: ad esempio l’ANVUR ha introdotto riferimenti espliciti all’open science nei criteri di valutazione della ricerca. Diversi consorzi e reti accademiche, come ICDI (Italian Computing and Data Infrastructure) – il progetto nazionale per costruire un’infrastruttura integrata e federata di calcolo e gestione dei dati della ricerca – stanno lavorando alla costruzione di infrastrutture nazionali compatibili con gli standard europei.

Ma il percorso verso l’open data nella ricerca non è privo di ostacoli. Le problematiche legate alla protezione dei dati personali, ai diritti di proprietà intellettuale, alla sostenibilità delle infrastrutture e alla carenza di competenze sono solo alcune delle barriere che oggi frenano l’attuazione dei principi FAIR. In questo scenario, le università e gli enti di ricerca sono chiamati a giocare un ruolo da protagonisti, contribuendo attivamente a una cultura della condivisione e della qualità.

Perché aprire i dati della ricerca

L’apertura dei dati, pur rappresentando una risposta a obblighi normativi o richieste dei finanziatori, è soprattutto un’opportunità concreta per migliorare la qualità, l’integrità e l’impatto della ricerca.

Migliorare la qualità e la riproducibilità della ricerca

Uno dei principali argomenti a favore dell’apertura dei dati riguarda il miglioramento della qualità della ricerca e la sua riproducibilità. In ambito scientifico, riproducibilità vuol dire la possibilità di ottenere gli stessi risultati utilizzando i medesimi dati e lo stesso metodo descritto nella pubblicazione originale. È una condizione necessaria affinché un risultato possa essere considerato solido e affidabile.

Negli ultimi anni, la comunità scientifica ha affrontato un problema sempre più evidente noto come reproducibility crisis (crisi di riproducibilità): molti studi, anche pubblicati su riviste autorevoli, non riescono a essere replicati da altri gruppi di ricerca, né talvolta dagli stessi autori. Le cause sono molteplici:

  • Uso scorretto delle analisi statistiche: talvolta i ricercatori sperimentano numerose combinazioni di analisi fino a ottenere un risultato apparentemente significativo, anche se questo può essere dovuto solo al caso.
  • Pressioni a pubblicare a tutti i costi: per ottenere fondi o fare carriera, i ricercatori sono spesso spinti a pubblicare molti studi, anche a scapito della qualità e dell’accuratezza. Questa dinamica, nota con l’espressione publish or perish, descrive un modello competitivo in cui la quantità di pubblicazioni diventa più rilevante della solidità scientifica.
  • Preferenza delle riviste per i risultati “a effetto”: le riviste scientifiche tendono a pubblicare più facilmente studi con risultati nuovi o sorprendenti, mentre quelli che non trovano nulla o confermano ricerche già fatte faticano a trovare spazio.

Uno studio particolarmente emblematico, pubblicato su Nature nel 2016, ha rivelato che:

“Più del 70% dei ricercatori ha dichiarato di non essere riuscito a riprodurre gli esperimenti di altri, e oltre il 50% non è riuscito a riprodurre nemmeno i propri risultati.” (Nature, “1,500 scientists lift the lid on reproducibility”, 2016)

In questo contesto, l’apertura dei dati rappresenta una risposta concreta: permette ad altri ricercatori di verificare i risultati e identificare eventuali errori metodologici o analitici. In altre parole, aprire i dati non è solo un atto di condivisione, ma una maggior garanzia di qualità.

Accelerare l’innovazione scientifica e tecnologica e l’impatto sociale della ricerca

Condividere dati significa moltiplicarne il valore. Molti dataset possono essere riutilizzati in contesti disciplinari diversi da quelli per cui sono stati originariamente raccolti: immagini satellitari impiegate in ambito agricolo e urbanistico, dati sanitari usati in studi epidemiologici. I dati aperti favoriscono contaminazioni interdisciplinari, nuove collaborazioni e applicazioni inedite. Inoltre, facilitano il dialogo tra scienza e società, rafforzando la “terza missione” delle istituzioni scientifiche.

Rispondere ai requisiti dei finanziatori pubblici

A livello europeo e nazionale, è sempre più diffusa la richiesta che i risultati della ricerca finanziata con fondi pubblici siano accessibili. Il Programma Horizon Europe prevede esplicitamente l’obbligo di apertura dei dati secondo i principi FAIR, salvo eccezioni motivate. In Italia, anche i bandi PRIN e PNRR integrano vincoli di open access. L’apertura dei dati non è dunque più una scelta opzionale, ma una condizione per accedere alle risorse pubbliche.

FAIR: verso dati realmente riutilizzabili

Rendere i dati aperti è un passo fondamentale, ma non sufficiente per garantirne l’effettivo riutilizzo. Un dato può essere disponibile online, ma se non è adeguatamente descritto, strutturato e accessibile secondo criteri standard, rimane di fatto inutilizzabile. È in questa direzione che si collocano i principi FAIR (Findable, Accessible, Interoperable, Reusable), che rappresentano oggi uno standard riconosciuto a livello internazionale per la gestione dei dati della ricerca.

Applicare i principi FAIR significa rendere i dati:

  • Trovabili (Findable), attraverso metadati chiari, identificatori persistenti come il DOI e la loro indicizzazione in repository consultabili;
  • Accessibili (Accessible), tramite protocolli aperti e specificando le condizioni di accesso e licenza;
  • Interoperabili (Interoperable), ossia descritti con vocabolari standard e leggibili anche da sistemi informatici diversi;
  • Riutilizzabili (Reusable), fornendo informazioni complete sul contesto, la qualità e i diritti di utilizzo dei dati.

Seguire questi principi non è un esercizio burocratico, ma un investimento sulla qualità e sulla longevità dei dati aumentando il ritorno sugli investimenti pubblici nella ricerca.

Tuttavia, essere FAIR non equivale sempre a essere “open”: un dato può essere FAIR e avere un accesso ristretto, ad esempio per motivi etici, legali o di protezione della privacy. È quindi importante distinguere tra dati aperti e dati FAIR.

Le sfide da affrontare

Nonostante l’importanza crescente attribuita ai dati aperti e ai dati FAIR, la loro adozione diffusa nei contesti accademici e di ricerca è ancora ostacolata da una serie di difficoltà concrete.

Normative e responsabilità giuridiche

Una delle barriere più complesse riguarda il rispetto delle normative, in particolare quelle sulla protezione dei dati personali (come il GDPR) e sulla proprietà intellettuale. Quando i dati riguardano persone – come avviene ad esempio nei settori della medicina – è fondamentale garantire anonimizzazione, consenso informato e trasparenza nell’uso secondario. Allo stesso tempo, occorre tutelare i diritti degli autori e delle istituzioni, definendo chiaramente le licenze d’uso (es. Creative Commons).

Infrastrutture tecnologiche e interoperabilità

Per rendere i dati effettivamente accessibili e FAIR, servono repository certificati, piattaforme interoperabili e strumenti che facilitino il caricamento, la descrizione e la consultazione dei dati. Non tutti gli atenei o enti di ricerca dispongono delle infrastrutture adeguate o hanno accesso a sistemi aggiornati, scalabili e conformi agli standard internazionali.

In questo contesto, CINECA può offrire un contributo fondamentale. In quanto consorzio interuniversitario, CINECA mette a disposizione una combinazione di piattaforme software, infrastrutture digitali e servizi di compliance normativa che possono supportare università ed enti di ricerca nella gestione dei dati aperti.

Un esempio concreto è l’adozione di una piattaforma basata su Dataverse, un prodotto open source ampiamente riconosciuto a livello internazionale per la pubblicazione e condivisione dei dati della ricerca. La versione proposta da CINECA è personalizzata e integrata con l’ecosistema dei sistemi CINECA, garantendo interoperabilità con altri moduli già in uso presso gli enti (come quelli per la gestione della ricerca, la rendicontazione o l’anagrafica dei prodotti).

CINECA è inoltre tra i partner attivi di iCDI (Italian Computing and Data Infrastructure), contribuendo con le proprie competenze tecniche e piattaforme al consolidamento dell’ecosistema nazionale della scienza aperta.

Grazie a questa infrastruttura, gli enti possono contare su un ambiente affidabile, conforme alle normative europee in materia di protezione dei dati e pienamente allineato con i principi FAIR, riducendo il carico gestionale per i singoli ricercatori e aumentando l’efficacia complessiva delle politiche di open science.

Competenze e formazione del personale

La gestione dei dati aperti richiede competenze specialistiche che non sempre sono presenti nei gruppi di ricerca. Figure come i data steward sono ancora rare o scarsamente integrate. Tuttavia, la sola presenza di figure esperte non basta: è necessario che tutti i ricercatori coinvolti nella produzione, raccolta e gestione dei dati abbiano almeno una formazione di base sulle buone pratiche in materia di dati FAIR e open.

Questa formazione dovrebbe includere aspetti tecnici (metadati, formati, licenze), giuridici (privacy, proprietà intellettuale), ma anche culturali di condivisione e trasparenza. Una barriera invisibile, infatti, è la resistenza culturale alla condivisione dei dati. Molti ricercatori temono di essere “copiati”, fraintesi o penalizzati se i propri dati vengono riutilizzati da altri.
È dunque auspicabile che gli atenei investano non solo nell’inserimento di figure professionali, ma anche nella diffusione capillare di competenze tra i ricercatori, attraverso corsi, linee guida, supporto dedicato e iniziative trasversali.

Oltre la ricerca: l’apertura dei dati nella didattica e nella governance

L’attenzione all’open data in ambito accademico non può limitarsi alla sola ricerca scientifica. Anche la didattica e la governance degli atenei possono trarre grande beneficio da politiche di apertura e condivisione dei dati.

Il Piano Triennale per l’Informatica nella Pubblica Amministrazione 2024–2026, redatto dall’Agenzia per l’Italia Digitale (AgID), attribuisce un ruolo centrale all’apertura dei dati. Il Piano promuove il principio dell’open data by design e by default, indicando che i dati pubblici devono essere considerati un bene comune e resi disponibili in formato aperto.

Nel campo della formazione, si parla sempre più di Open Educational Resources (OER), cioè materiali didattici digitali liberamente accessibili e riutilizzabili.

In entrambi i casi, l’apertura dei dati richiede una visione integrata e intersettoriale, che sappia coinvolgere docenti, tecnici, amministrativi e organi di governo in una strategia comune. Anche in questo ambito, CINECA può offrire supporto, disponendo delle informazioni amministrative provenienti dai suoi sistemi gestionali in ambito HR, contabilità, didattica, dematerializzazione e altri settori strategici. Grazie a questa posizione, CINECA ha la possibilità di realizzare ed esporre in modo trasparente, ma governato, dataset amministrativi di grande valore per la didattica, la valutazione e la governance accademica.

Dati aperti: verso una ricerca più robusta, più efficace e più trasparente


L’apertura dei dati della ricerca non è più una scelta accessoria, ma una componente essenziale di un ecosistema della ricerca moderno. Le università e gli enti di ricerca italiani hanno oggi l’opportunità – e la responsabilità – di promuovere una cultura della condivisione, supportata da infrastrutture solide e competenze diffuse. Investire nei dati aperti significa investire in una ricerca più robusta, più efficace e più trasparente.

guest

0 Commenti
Più recenti
Più votati
Inline Feedback
Vedi tutti i commenti

Articoli correlati