Ruolo e opportunità del bibliotecario dei dati per la Scienza aperta
Università di Parma annamaria.tammaro@unipr.it
Università di Padova antonella.zane@unipd.it
Abstract
L'Open Science comporta una profonda trasformazione del modo di fare ricerca che ha un impatto sulle biblioteche e sui bibliotecari di dati. Attraverso la documentazione e l'analisi della letteratura, l'articolo si concentra sul profilo del bibliotecario di dati descritto come lo stato dell'arte in Europa e in Italia. Nonostante il ritardo delle politiche nazionali, il profilo del data librarian in Italia sta crescendo, acquisendo consapevolezza dell'importanza del ruolo attraverso esperienze pionieristiche di servizi di supporto alla ricerca.
English abstract
Open Science involves a profound transformation of doing research that has an impact on libraries and data librarians. Through documentation and literature analysis, the article focuses on the profile of the data librarian described as state of the art in Europe and Italy. Despite the delay of national policies, the profile of the data librarian in Italy is growing, acquiring awareness of the importance of the role through pioneering experiences of research support services.
Per scaricare l'articolo in pdf visita la sezione "Risorse" o clicca qui.
Introduzione
Nell’epoca dei big data, i dati aperti della ricerca aiutano ad aumentare la credibilità del processo di ricerca, l’efficienza della scoperta scientifica e la sua verificabilità. A partire dal 2015, i dati aperti della ricerca sono stati promossi in Europa nel contesto della European Open Science Cloud (EOSC). L’obiettivo di EOSC è quello di offrire un portale per federare le infrastrutture di dati di ricerca esistenti in Europa e realizzare una rete di dati di qualità e servizi correlati per la scienza, rendendo reale la visione di dati di ricerca aperti e riusabili. La visione della scienza aperta stimola la trasformazione della costruzione di conoscenza attraverso la condivisione attuata con “buone pratiche” definite dall’adozione dei principi FAIR (Findable, Accessible, Interoperable e Reusable). La scienza aperta definita in termini di apertura, facile accesso ai risultati scientifici, riproducibilità e multidisciplinarietà ha un forte impatto per trasformare la scienza con una ricerca migliore e affidabile. EOSC, con la creazione di EOSC Association nel 2020, sta passando a un approccio più partecipato con il coinvolgimento di tutti quelli che sono interessati alla visione della scienza aperta, per perseguire obiettivi comuni e ottenere risultati complementari a livello europeo, nazionale e istituzionale. Gli attori che hanno interesse a partecipare nelle varie attività previste non comprendono solo docenti e ricercatori,ma includono anche i cittadini, i facilitatori e il personale di supporto, i decisori politici e i finanziatori. La comunicazione scientifica non si limita quindi solo alla comunicazione tra esperti parte dell’invisible college, come veniva chiamato il colloquio tra esperti per la creazione di conoscenza, e nemmeno al ciclo delle pubblicazioni, ma va ben oltre l’accesso aperto. Alcune aree di ricerca sono state completamente trasformate dalla disponibilità di dati aperti, e l’averli a disposizione ha comportato un beneficio anche economico.
La visione della scienza aperta rappresenta la trasformazione del modo di fare ricerca, e ha avuto un forte impatto sulle biblioteche accademiche. Come parte integrante delle infrastrutture per la ricerca, le biblioteche sono in prima fila, insieme a servizi tecnici e a servizi per il supporto della ricerca, nel definire le pratiche per l’archiviazione, la descrizione e la gestione e il riuso dei dati di ricerca.
Lo scopo che ci proponiamo in questo articolo è di concentrarci sul ruolo del bibliotecario dei dati, delle sue competenze e della sua formazione.
Bibliotecario dei dati: uno sguardo internazionale
Per assicurare che i dati aperti siano FAIR e riusabili, occorre assicurare il supporto di personale preparato, come investimento che è stato stimato essere circa il 5% del budget della ricerca. EOSC (2021) ha definito, come descritto nella Tabella 1, le professioni impegnate nella cura dei dati.
Profilo |
Ruolo |
Data Scientist o Data Analyst
|
Esperto di elaborazione dati, non necessariamente esperto di una disciplina specifica, che è in grado di valutare la qualità dei dati, estrarre conoscenze rilevanti dai dati e rappresentare tale conoscenza. |
Data Research Infrastructure Support Professional |
Esperto ICT che gestisce le infrastrutture di ricerca e i servizi necessari per l'archiviazione, la conservazione e l'elaborazione dei dati di ricerca |
Data Curator |
Esperto nella gestione e supervisione di tutti i dati di un'organizzazione per garantire il rispetto delle politiche e/o degli obblighi normativi per la conservazione a lungo termine e per fornire agli utenti dati di alta qualità facilmente accessibili in modo coerente |
Data Steward o Bibliotecario dei dati |
Esperto della disciplina e nella preparazione e nel trattamento dei dati, inclusa la selezione dei dati (es. Data Cleaning), l'archiviazione, la conservazione, la provenienza delle annotazioni e la manutenzione di altri metadati e la diffusione.
I bibliotecari di dati sono personale bibliotecario professionale esperto di RDM, che utilizza i dati di ricerca come risorsa o supporta i ricercatori che si occupano di dati (descrizione, archiviazione e diffusione). |
Tabella 1 - Profili EOSC
Nel febbraio 2021, il Working Group Skills and Training della EOSC Executive Board ha indicato nel suo report dieci diversi ruoli necessari per la scienza aperta e i principi FAIR. Tra questi troviamo il Data Scientist/Data Analyst, il Data Research Infrastructure Support Professional, il Data Curator, il Data Librarian e il Data Steward. Il Data Steward e il bibliotecario dei dati, pur essendo inseriti nella stessa categoria differiscono nel ruolo di supporto che offrono e nel background professionale. Un Data Steward è un esperto della disciplina nella preparazione mirata e nel trattamento dei dati di ricerca, si occupa di selezione, archiviazione, conservazione, provenienza delle annotazioni e altri metadati per la diffusione dei dati aperti nel settore disciplinare. Il Data Librarian è un bibliotecario esperto in Research Data Management (RDM), che considera i dati della ricerca una risorsa e offre servizi ai ricercatori che utilizzano i dati nelle fasi del ciclo di ricerca di descrizione, archiviazione e diffusione.
Come altre professioni impegnate nella cura dei dati, il bibliotecario dei dati è un profilo ancora emergente, che viene definito in modi differenti in diversi contesti, internazionali, nazionali, istituzionali. A seconda dei contesti istituzionali e disciplinari, il bibliotecario dei dati deve acquisire specifiche competenze.
Uno dei primi studi internazionali sul bibliotecario dei dati è quello svolto da IFLA nel 2016-2018 (Tammaro et al. 2019), che ha intervistato alcuni professionisti e analizzato migliaia di job positions per cercare risposta alle seguenti domande:
- come i professionisti definiscono il ruolo?
- quali sono le competenze specifiche?
- quale formazione è richiesta?
Lo studio IFLA ha evidenziato che i ruoli sono diversi e chiamati diversamente in varie fasi di ricerca, descritte nelle fasi di pianificazione e creazione, memorizzazione e gestione, analisi, scoperta e riuso. Requisito comune in tutte le fasi è che le competenze richieste sono legate alla qualità dei dati. I professionisti dei dati non si limitano tuttavia a trattare i dati: le competenze più importanti sono relazionali, come la comunicazione con la comunità dei creatori di dati e dei loro utilizzatori. In alcune posizioni di lavoro le relazioni sono con i politici e amministratori delle istituzioni.
La formazione per i professionisti dei dati segue tre modelli: dottorato, master ed eventi di formazione continua (come scuole estive, tutorial ecc.).
La prima esigenza che si è presentata alle istituzioni di ricerca, è stata quella di formare il personale in servizio, con obiettivi formativi collegati a diversi livelli di servizio di supporto (Corral 2012; Virkus e Garofallou 2020). Il punto di partenza di questi primi studi è stato quello di individuare il bibliotecario come una professione che ha le competenze richieste per gestire i dati di ricerca. Recentemente la comprensione del profilo del bibliotecario dei dati si è approfondita e si riconoscono competenze specifiche, insieme a competenze interdisciplinari e a capacità trasversali come comunicazione e flessibilità per adattarsi al contesto in cambiamento.
Il bibliotecario dei dati svolge un ruolo importante per gli scienziati che necessitano di un accesso continuo ai loro dati, dal momento del disegno di ricerca, in cui gli esperimenti vengono progettati, fino alla fase di analisi in cui vengono condivisi e quella di pubblicazione, riflettendo quindi una nozione più ampia di “biblioteca digitale”.
Le biblioteche accademiche in Olanda (Jetten et al. 2020) ad esempio hanno iniziato a creare e offrire servizi di supporto alla gestione dei dati di ricerca. Sono state discusse sei categorie di competenze specifiche:
- la capacità di raccogliere e gestire i dati dinamici;
- pulire i dati sperimentali;
- documentare il contesto dei dati per l’interpretazione successiva;
- integrare i dati da più fonti;
- analizzare i dati;
- preservare i dati.
I servizi di biblioteca digitale attualmente in corso stanno mettendo in pratica questi requisiti, con l’obiettivo di un contesto interoperabile che, a sua volta, sarà una componente essenziale dell’infrastruttura per la scienza.
Le biblioteche di dati digitali devono conservare i dati, esporli in modo intelligibile e, allo stesso tempo, interagire tra fonti di dati interoperabili. Tuttavia, per preservare l’integrità e il valore del ciclo di vita dei dati, è necessario un livello maggiore di interoperabilità tra le biblioteche di dati e il deposito accademico. Per comprendere gli strumenti e i servizi appropriati necessari per le biblioteche digitali di dati, è richiesta una maggiore conoscenza delle pratiche scientifiche dei ricercatori, e come esse sono associate all’archiviazione, al recupero dei dati, alla loro produzione, analisi e interpretazione.
La progettazione di biblioteche digitali oggi è statica e già difficile a causa della varietà di strumenti, dei comportamenti disciplinari dei ricercatori e delle differenze dei contesti. La biblioteca digitale dei dati aggiunge ulteriori complessità introdotte dalla gestione dei dati di ricerca dinamici, che va oltre l’attività di memorizzare i diversi set di dati prodotti da ciascuna ricerca.
Strategie di formazione
Uno degli obiettivi operativi proposti da EOSC entro il 2021-2023 è che entro il 2025 “vengano definiti i curricula europei per i Data Steward”. Tuttavia non ci sono ancora esperienze e standard internazionali condivisi.
Molti progetti hanno realizzato dei framework di competenze per facilitare il disegno dei curriculum. FAIRsFAIR (Fostering Fair Data Practices in Europe, 2020) ha portato a termine una panoramica e un’analisi dei diversi framework di competenze esistenti, oltre a raccogliere risorse didattiche aperte per i dati aperti, Open Science e principi FAIR.
Prevale quindi la formazione continua con molte OER (Open Educational Resources) disponibili per formare il bibliotecario dei dati.
EOSC-Pillar ha realizzato un catalogo di risorse per Data Stewardship (RDM Training and support catalogue) suddivisi per diverse tipologie di competenze. Include anche risorse pratiche, operative e prontamente disponibili che possono essere utilizzate dai responsabili dei dati per orientare i ricercatori. Tra queste va ricordata la traduzione italiana del manuale di Foster per formatori.
Non esistono ancora sistemi di certificazione e accreditamento per questi nuovi profili dei professionisti coinvolti nella gestione dei dati di ricerca. Come iniziativa pilota, il Progetto OBERRED, di cui Università di Napoli è partner, ha lo scopo di disegnare OpenBadges che possono essere usati per identificare le competenze del data stewards e del bibliotecario dei dati.
E in Italia?
L’implementazione di EOSC in Italia si fonda sulle attività istituzionali di GARR e del CNR. GARR (che coordina ICDI) e ICDI (ICDI Italian Computing and Data Infrastructure) hanno assunto la responsabilità dell’infrastruttura tecnologica nazionale. All’interno dell’ICDI, l’Istituto CNR ISTI di Pisa ha il ruolo di orientamento e formazione attraverso il Centro di competenza nazionale sulla gestione dei dati di ricerca.
GARR in qualità di coordinatore del progetto EOSC-Pillar (2020) ha condotto l’indagine National Initiatives tra università, enti di finanziamento, infrastrutture di ricerca e infrastrutture elettroniche in cinque paesi europei (Austria, Belgio, Francia, Germania, Italia), e nel rapporto pubblicato scrive:
Italy is the country where social regulations concerning RDM are least common, with less than a fifth of the universities that have adopted them (17%) against a mean across countries of 28% [....] A similar situation can be observed for written regulations or policies on the long-term availability of research data [....] which again are less frequently found in Italy (11% against a mean across countries of 21%).
Il quadro legislativo italiano si limita per ora alla legge del 2013 in materia di accesso e valorizzazione dei beni culturali che include l’Open Access alle pubblicazioni di ricerca, ma non agli Open Data. Il Comitato CRUI Open Access/Open Science ha terminato il suo mandato ed è stato ora sostituito dall’Osservatorio per la scienza aperta.
Malgrado il ritardo delle politiche nazionali e istituzionali italiane, i bibliotecari sono stati consapevoli del bisogno di servizi di supporto ai dati di ricerca molto presto e sono diventati promotori attivi di alcune iniziative di servizio (Fava, Gargiulo 2013).
I primi articoli sul bibliotecario dei dati sono di Cassella (2015, 2016), Tammaro (2017), Morriello (2020) e Orrù (2020), tuttavia non si concentrano sulla situazione italiana e non contribuiscono a chiarire la confusione, anche terminologica, sul tema. Ancora nel 2018, a una richiesta di parere del CUN su una proposta di laurea magistrale in Data Management, AIB ha sostenuto una visione tradizionale del bibliotecario per svolgere il ruolo di bibliotecario dei dati. I professionisti che hanno avviato esperienze pioniere di gestione dei dati in Italia sono riuniti nel Gruppo IOSSG (Gargiulo 2020) e stanno facendo crescere la professione attraverso la loro pratica quotidiana.
Questa comunità di pratica sta chiarendo ruolo e competenze del profilo, condividendo buone pratiche a livello nazionale e internazionale.
Un primo seminario Una proposta (non?) sovversiva: le competenze del bibliotecario dei dati è stato organizzato nel 2018 da IOSSG in collaborazione con l’Università di Parma. Il questionario che ha preceduto il seminario è stato diffuso a tutti i partecipanti registrati, e ha permesso di evidenziare le opinioni dei bibliotecari che hanno risposto (in totale 165). Considerate nelle quattro aree di competenza indicate nel questionario, le competenze specifiche del bibliotecario dei dati sono state evidenziate come:
- Gestione dell’informazione: memorizzazione nei depositi istituzionali (41%), Research Data Management (29%), catalogazione (20%).
- Servizi di supporto: Data Management Plan (48%), informazioni sulle fonti di finanziamento (41%), accesso e riuso (18%), strategie di recupero e pubblicazione (18%), ricerca cataloghi e banche dati (5%).
Sono state evidenziate competenze delle aree interdisciplinari e trasversali, come:
- Tecnologie: architettura dell’informazione (35%), depositi istituzionali (31%), semantic Web (28%), interoperabilità (25%), interfaccia (25%).
- Competenze trasversali: il bibliotecario dei dati è un bibliotecario che adotta un approccio “partecipativo” e l’enfasi è nell’integrazione nel ciclo della ricerca (20%), nell’advocacy (20%), nell’orientamento al problem solving (6%) e nella multiculturalità (5%), la capacità di facilitazione (6%) e la conoscenza delle lingue (5%).
- Altre competenze riguardano aspetti come: statistiche, capire la metodologia di ricerca, information literacy, empatia, capacità di delegare.
Nel 2019 un secondo seminario dal titolo Vuoi diventare un bibliotecario dei dati di ricerca? è stato organizzato dal Gruppo IOSSG con lo scopo di chiarire le attività che svolge questa figura, messa a confronto con il bibliotecario digitale. La caratteristica che contraddistingue il servizio pionieristico di supporto alla ricerca offerto da queste prime università italiane è stata definita come single point of entry. Vignocchi (2019) ha così definito le competenze di comunicazione e sociali:
[...] alle competenze tecniche va affiancata la cultura della collaborazione, la profonda conoscenza dell’Istituzione, l’esperienza maturata nel trattare con le risorse e i progetti di ricerca, l’atteggiamento orientato all’utente, la capacità relazionale, l’autonomia lavorativa e la capacità decisionale, la formazione permanente.
Questo secondo seminario del Gruppo IOSSG evidenziato le importanti differenze tra le attività Data Curator delle istituzioni culturali e le attività di gestione dei dati di ricerca delle biblioteche accademiche. Una visione limitata al ruolo del Data Curator, concentrata su attività di preservation, può costituire un ostacolo a comprendere le attività dei bibliotecari dei dati di ricerca dinamici in diverse fasi del ciclo di ricerca che spinge all’importanza delle connessioni con i diversi attori in tutte le fasi del ciclo di ricerca. Nel 2021, Gargiulo et al. hanno raccolto dati sulle iniziative FAIR in Italia attraverso un questionario inviato ai membri della comunità IOSSG (27 membri). I servizi di supporto offerti ai ricercatori si concentrano principalmente sul Data Management Plan che rappresenta il servizio disponibile in tutte le istituzioni intervistate (23,5%). In secondo luogo, i servizi di supporto sono concentrati nella gestione dei repository istituzionali (17,65) e nelle politiche istituzionali (17,6%).
Altri servizi resi disponibili riguardano l’organizzazione dei dati di ricerca, compresa la gestione e la selezione dei dati di ricerca (11,8%). La maggior parte delle istituzioni intervistate dedica tempo alla formazione dei ricercatori (11,8%), meno attenzione viene invece data ai cataloghi dati (5,9%).
Eppur si muove. Primi esempi
Sono ora più chiare le competenze specifiche del bibliotecario dei dati che vanno acquisite dai professionisti. Le iniziative di formazione in Italia si inquadrano nella formazione continua.
Il Centro di ateneo per le biblioteche dell’Università di Padova ha organizzato nel 2017 il workshop Library Carpentry: Software skills for library professionals. Il corso, costruito con una struttura modulare, ha inteso fornire competenze e abilità nella elaborazione dei dati da parte dei professionisti dell’informazione ed è stato ideato sulla scorta dei programmi formativi per ricercatori: Data Carpentry e Software Carpentry. Il corso è stato tenuto da James Baker (Lecturer in Digital History, University of Sussex, fondatore di Library Carpentry). I partecipanti sono stati guidati al contesto concettuale e operativo dei dati e della scienza dei dati, nonché ai fondamenti basilari di Shell, Git, OpenRefine e SQL a cui sono stati avviati anche con esercitazioni pratiche. Al corso, tenutosi in lingua inglese, hanno partecipato circa settanta bibliotecari provenienti da diverse istituzioni. A distanza di quasi quattro anni il Centro di ateneo per le biblioteche dell’Università degli Studi di Padova, ripropone quest’anno il corso La biblioteca dei dati, questa volta in lingua italiana, per la formazione dei suoi bibliotecari.
Nel 2019 una prima summer school Fair Research Data Management è stata organizzata dall’Università di Parma dal Master DILL e all’interno del progetto europeo ROMOR. Sono stati selezionati sessantatré partecipanti che comprendevano ricercatori, dottorandi e bibliotecari.
La prima giornata è stata dedicata a un’introduzione ai principi FAIR per la qualità dei dati di ricerca, insieme a un focus sull’utente dei dati e sulle esigenze di riutilizzo e interoperabilità. La seconda giornata è stata dedicata alla nuova generazione di archivi istituzionali e OpenAIRE, con esercitazioni pratiche per la valutazione di diverse tipologie di bisogni. La terza giornata si è concentrata sulle questioni legali del diritto d’autore e della privacy insieme all’impatto della politica sull’organizzazione dei servizi di supporto. Negli ultimi due giorni è stato realizzato un laboratorio di Data Carpentry.
Open Science e FAIR sono stati il tema di numerosi seminari organizzati da OpenAIRE NOAD e CNR, depositati nella comunità Open Science in Italy su Zenodo.
Il CNR ha inoltre organizzato dei corsi per i suoi ricercatori.
Conclusioni
Il bibliotecario dei dati ha competenze specifiche, anche se c’è ancora ambiguità sul ruolo confuso spesso con altri profili come il Data Steward e il Data Scientist. Tuttavia la situazione del profilo di bibliotecario dei dati è in progress e molto dinamica. Il contesto internazionale e le politiche di EOSC creano un ambiente che favorisce i bibliotecari innovatori, malgrado il ritardo di politiche istituzionali e nazionali. Si può concludere affermando che non ci può essere esempio migliore del profilo del bibliotecario dei dati per spiegare la trasformazione digitale: un cambiamento profondo del ruolo del bibliotecario non tanto per adattarsi al cambiamento del modo di fare ricerca, ma per assumersi la responsabilità di guidare attivamente la trasformazione del modo di fare ricerca.
Bibliografia
Cassella M. (2015), Biblioteche accademiche e dati della ricerca, “Biblioteche oggi”, vol. 33, n. 8, http://dx.doi. org/10.3302/0392-8586-201508-033-1.
Cassella M. (2016), Dal digital curator al data librarian, “Biblioteche oggi”, vol. 34, n. 3, http://dx.doi. org/10.3302/0392-8586-201603-013-1.
Corral S. (2012), Roles and responsibilities. libraries, librarians and Data In Managing Research Data, edited by G. Pryor, London, Facet, p. 105-133.
Esoc Pillar (2020), National Initiatives, https://www.eosc-pillar.eu/eosc-pillar-national-initiatives-survey.
FairsFair (2020), FAIR competence frameworks, https:// www.fairsfair.eu/fair-frameworks-training-programmes.
Fava I., Gargiulo P. (2013), What do Italian Researchers think about Open Research Data?, [Report], http://hdl.handle. net/10760/29671.
Gargiulo P. (2020), Open Science, open research data and the role of IOSSG SCIRES-IT- SCIentific RESearch and Information Technology, vol. 10, Special Issue, p. 53-58.
Gargiulo P., Galimberti P., Tammaro A.M., Zane A. (2021), FAIR RDM (Research Data Management): Italian initiatives towards EOSC implementation, Proceedings of the 17th Italian Research Conference on Digital Libraries, Padua, Italy (virtual event), February 18-19, 2021; CEUR Workshop Proceedings 2816, CEUR-WS.org 2021.
Jetten M., Grootveld M., Mordant A. et al. (2021), Professionalising data stewardship in the Netherlands. Competences, training and education. Dutch roadmap towards national implementation of FAIR data stewardship, Zenodo, http://doi. org/10.5281/zenodo.4486423.
Morriello R. (2020), Birth and Development of Data Librarianship “JLIS.it”, vol. 11, n. 3, http://dx.doi.org/10.4403/jlis.it-12653.
Orrù D. (2020) Open data steward: bibliotecari e alfabetizzazione ai dati aperti, “AIB Studi”, vol. 60, n. 2, https://doi.org/10.2426/aibstudi-12123.
Tammaro A.M. (2017), Data literacy: formare docenti e studenti alla gestione dei dati di ricerca, “Biblioteche oggi”, vol. 35, n. 7, http://dx.doi.org/10.3302/0392-8586-201707-019-1. taMMaro a.M. (2018), Una proposta (non?) sovversiva. Le competenze del bibliotecario dei dati, “Biblioteche oggi”, vol. 36, n. 4, http://dx.doi.org/10.3302/0392-8586-201804-065-1.
Tammaro A. M. (2019), Vuoi diventare un bibliotecario dei dati della ricerca?, “Biblioteche oggi”, vol. 37, n. 4, http://dx. doi.org/10.3302/0392-8586-201904-058-1.
Tammaro A. M., Matusiak k., Casarosa V., Sposito F. (2019), Data curator’s role and responsibilities: an international perspectives, “Libri”, vol. 69, n. 2, p. 89-104.
Virkus S., Garofallou E. (2020), Data science and its relationship to library and information science: a content analysis, “Data technologies and applications”, vol. 54, n. 5, p. 643-663.
Zane A. (2016), CODATA - RDA “Research Data Science” Summer School Report: Research data in the 21st century, http://paduaresearch.cab.unipd.it/9782/1/Report_CODATA_ Trieste_2016.pdf.