Dati Fair
Una buona gestione dei dati è la base per una buona ricerca scientifica.
Con “dati” si intende «ogni informazione che è stata raccolta, osservata, generata o creata per validare un risultato scientifico» (Leeds Univ., 2018). Tutte le discipline sono quindi interessate, non solo le scienze esatte. Se è possibile i dati dovrebbero essere resi anche aperti (facendo attenzione alla complessa normativa sui dati). Molto importante è che i dati siano gestiti e conservati correttamente (per una ricerca più efficiente) e resi FAIR.
Lo strumento principale per una corretta gestione dei dati è il Data Management Plan (DMP). Il DMP è un documento strutturato, vivo (va infatti aggiornato periodicamente nelle diverse fasi della ricerca) e obbliga a pensare in modo strategico ai propri dati, ponendosi domande sui formati, i metadati utili a descrivere il dataset, le licenze, la conservazione…
Una griglia di domande (Data Management Plan Checklist) da porsi in relazione a ogni dataset è stata elaborata dal gruppo IOSSG – Italian Open Science Support Group.
Un modello online utilizzabile da tutti (DMPonline) è stato creato ad esempio dal Digital Curation Center britannico. Qui è possibile prendere spunto da esempi reali di DMP per disciplina. Importante è ricordare che il DMP è un deliverable del progetto se si è stati finanziati nell’ambito dei bandi Horizon2020, e va consegnato entro i primi sei mesi.
Ma cosa sono i dati FAIR? Questo acronimo sintetizza quelle che sono le caratteristiche che devono possedere i dati perché possano rispondere alle aspettative della Commissione Europea e alle politiche sull’Open Science in generale. I dati in particolare devono essere:
- Findable: descritti e rintracciabili utilizzando set di metadati standard (ad esempio dublin core) riconosciuti dalle diverse comunità disciplinari. Devono adottare identificativi univoci (ad esempio il DOI);
- Accessible: i dati devono essere sempre e comunque accessibili a chi ne faccia motivata richiesta e devono essere aperti tutte le volte che ciò sia possibile. Importante rimane il fatto che “Accessibile” non significa “Aperto”: dati FAIR possono essere chiusi per motivi diversi come ad esempio ragioni di sicurezza o di privacy;
- Interoperable: devono poter essere letti e rielaborati da sistemi conformi ai principi FAIR;
- Reusable: devono essere corredati da una licenza che spiega quali sono gli utilizzi permessi e da tutta la documentazione necessaria per il loro riutilizzo (metodologia, strumenti utilizzati ecc.).
Una corretta gestione dei dati e un buon Data Management Plan rende la ricerca più trasparente; i dati accessibili, fa risparmiare tempo nella redazione di un articolo, riduce il rischio di perdere i dati, facilita la condivisione e il riuso (soprattutto se si tratta di dati prodotti con fondi pubblici), aumenta le citazioni.
Ma se si vuole rendere i dati di ricerca aperti (importante è ricordarsi che il principio dell’EU Competitiveness Council Conclusions 9029, 18 maggio 2018 è «as open as possible, as closed as necessary»), il primo requisito è ovviamente quello di aprirli dal punto di vista giuridico, rilasciandoli con una licenza open.