N.1 2022 - Biblioteche oggi | Gennaio- febbraio 2022

Navigazione dei contenuti del fascicolo

Biblioteche digitali e oltre: dati aperti e interconnessi

Ivana Truccolo

Francesca Gualtieri

Lucia Cecere

Chiara Formigoni

Mauro Mazzocut

Fulvia Merlini

Silvia Molinari

Per scaricare l'articolo in pdf visita la sezione "Risorse" o clicca qui.

Esperienze e nuove direzioni per il biomedico

Introduzione

Si parla sempre più spesso di dati aperti e interconnessi, ovvero Linked Open Data (LOD), anche nel settore delle biblioteche e dei centri di documentazione. Tuttavia, non sempre se ne parla con cognizione di causa e tutti sappiamo che nulla nuoce di più a una professione quanto trascurare l’approfondimento e l’aggiornamento continuo. “La professionalità è l’unica cosa che nessuno ti può portare via”, disse Valentina Comba, nel corso di un intervento sulla formazione del bibliotecario documentalista a uno storico convegno sulle biblioteche biomediche tenutosi a Roma presso l’Istituto superiore di sanità (ISS) nel 1984. 

Vi è poi un altro fenomeno che si sta sempre più manifestando in alcune realtà culturali: nel passaggio al digitale o nell’organizzarsi con tecnologie digitali, biblioteche, archivi e musei stanno verificando la potenza di affiancare e possibilmente integrare, contenuti testuali a documenti d’archivio, video a testi e immagini, oggetti museali digitalizzati, mappe, musica. È il cosiddetto approccio GLAM, ovvero “Galleries Libraries Archives and Museums” analogo a “Musei Archivi Biblioteche” (MAB), possibile grazie al fatto che dati e metadati di ogni risorsa sono adeguatamente descritti secondo gli standard che garantiscono l’interoperabilità e usando software aperti all’interconnessione e alla resa virtuale

Si può solo intravedere il grande ampliamento di orizzonti, la grande opportunità di andare oltre i tradizionali cataloghi, perfetti per localizzare i documenti ma chiusi, e i database, utilissimi per trovare quello che c’è, ma non per integrare materiali su supporti diversi, e i motori di ricerca che trovano molto ma nascondono altrettanto.

Alla base di tutta questa trasformazione, in parte avviata e comunque possibile, stanno le competenze dei professionisti dell’informazione, bibliotecari, archivisti e operatori museali, la loro capacità di collaborare alla pari con altri professionisti indispensabili quali informatici, ingegneri, architetti, editori, esperti di comunicazione e utenti finali.

GIDIF-RBM organizza tradizionalmente, fra le sue attività formative, un workshop annuale di tipo “commerciale”, dedicato cioè alla conoscenza e al confronto fra le soluzioni informatico-tecnologiche offerte dal mercato in relazione ai nuovi scenari della documentazione e informazione biomedica.

Il workshop Biblioteche digitali e oltre: dati aperti e interconnessi. Esperienze e nuove direzioni per il biomedico, si è svolto lo scorso 23 giugno 2021 – su piattaforma Zoom, data la perdurante pandemia – ed è stato dedicato alle applicazioni basate su tecnologia Linked Open Data (LOD) e ai nuovi confini che si estendono anche per l’informazione biomedica. Lo scopo del workshop è stato quello di prospettare la transizione dalla teoria alla pratica, di tale tecnologia applicata alle biblioteche, attraverso il confronto fra fornitori (vendors) e le organizzazioni di cura (patrons). 

Ha moderato il workshop Fabio Venuda, professore di Biblioteconomia all’Università degli studi di Milano e coordinatore del Master di Digital Humanities presso la stessa Università, alla seconda edizione nell’anno accademico 2020-2021.

Per iniziare, è opportuno dare una definizione di LOD. Pensiamo ai dati dei nostri cataloghi OPAC, essi sono solitamente ben strutturati, controllati e molto ricchi dal punto di vista informativo ma sono locked. Sono dati chiusi cioè dentro ai cataloghi stessi. Di conseguenza, quando una persona cerca un’informazione attraverso i comuni motori di ricerca, non trova le informazioni chiuse dentro ai cataloghi. Immaginiamo, invece, quanto potrebbero arricchirsi se potessero colloquiare con tutte le informazioni presenti in rete, se diventassero aperti e interconnessi, open e linked. Naturalmente queste connessioni non avvengono per magia, ma si realizzano utilizzando il modello RDF (Resource Description Framework) del web semantico. Già questi concetti meriterebbero un lavoro a parte per un approfondimento: per semplificare, in questa sede possiamo dire che di web semantico ne parlò già Tim Berners-Lee nel 1993 quando descriveva la trasformazione del World Wide Web in un ambiente dove i documenti pubblicati (pagine HTML, file, immagini, e così via) venivano associati a informazioni e dati (metadati) che ne specificavano il contesto semantico in un formato adatto all’interrogazione e all’interpretazione (es. tramite motori di ricerca) e, più in generale, all’elaborazione automatica. In pratica, un’identificazione univoca attraverso URI (Uniform Resource Identifier) di opere, persone, luoghi, eventi, soggetti e proprietà. Le relazioni tra di essi attraverso asserzioni del tipo “soggetto - predicato - oggetto” (triple) sono a loro volta interpretabili univocamente e sono processate in modo automatizzato. L’apertura alla condivisione e al riuso dei dati favorisce le collaborazioni, predispone al multilinguismo e porta a un accrescimento del contenuto informativo attraverso i collegamenti a dati selezionati da fonti affidabili. E nella complessità, l’accuratezza e affidabilità dei dati sono vieppiù importanti. Con questa tecnologia, le biblioteche digitali, per la varietà dei documenti trattati, contenuti testuali, documenti d’archivio, video, immagini e oggetti museali digitalizzati, mappe, musica, possono dominarne la specificità e contemporaneamente valorizzarla.

Presentazioni

Tornando al workshop GIDIF-RBM, la presidente Ivana Truccolo introduce il workshop a nome del direttivo dell’associazione, sostenendo che con i LOD i cataloghi si aprono e i bibliotecari possono anticipare e immaginare nuovi territori di conoscenza, milieu fondante della loro professione.

Biblioteche digitali e le piattaforme DSpace-CRIS e DSpace-GLAM

Nell’intervento Biblioteche digitali e le piattaforme DSpace-CRIS e DSpace-GLAM, Susanna Mornati e Anna Busa, direttore operativo e marketing consultant della società 4Science, presentano due soluzioni che la loro azienda ha sviluppato a partire dal software open source DSpace. La prima piattaforma, DSpace-CRIS, in cui l’acronimo CRIS si scioglie in Current Research Information System, aggrega tutte le entità che popolano il dominio della ricerca: pubblicazioni, dataset, progetti, trials, letteratura grigia, contratti, rapporti tecnici e l’anagrafe dei ricercatori, identificati univocamente attraverso l’implementazione di ORCID, ovvero l’Open Researcher and Contributor ID. Esempi di applicazione in Italia di archivi digitali costruiti secondo i canoni dell’accesso aperto allo scopo di raccogliere, conservare e diffondere i prodotti della ricerca nonché gestire i dataset, sono i repository dell’INAF, Istituto nazionale di astrofisica (OA@INAF), dell’Università della Tuscia (UnitusOpen), del Dipartimento di Biotecnologia, chimica e farmacia dell’Università di Siena (DBCFspace), l’archivio aperto di Roma Tre ArcAdiA e Earth-prints dell’Istituto di geofisica e vulcanologia. A breve sarà disponibile anche il repository dell’Agenzia spaziale italiana. DSpace-Cris è utilizzato anche come aggregatore di dati provenienti da più fonti, come il Portale della ricerca del Friuli Venezia Giulia, che ha sei percorsi di esplorazione per tracciare i ricercatori, i dipartimenti, le competenze, i gruppi di ricerca i laboratori e gli eventi relativi al dominio degli atenei del Friuli Venezia Giulia. Un altro recente esempio basato su DSpace-CRIS è il portale per la ricerca biomedica Veneto Health Researchers, ospitata dal Coris - Consorzio per la ricerca Sanitaria, che raccoglie i dati prodotti dai ricercatori operanti nella regione Veneto mettendoli in relazione con le citazioni e le metriche e disegna intorno al ricercatore censito un network delle collaborazioni. Interessante ancora EuroCRIS, che sviluppa e mantiene il DRIS, Directory dei Sistemi Informativi di Ricerca, che si propone di presentare una panoramica delle installazioni CRIS nel mondo. Con la stessa architettura di integrazione, DSpace-GLAM aggrega risorse di varia natura, oggetti digitali risultato di digitalizzazioni e nativi digitali, di biblioteche, musei, archivi. L’adesione allo standard IIIF, International Image Interoperability Framework, mira a promuovere l’interoperabilità delle immagini e il loro accesso aperto, mentre la specificità dei documenti viene salvaguardata attraverso l’impiego dei metadati standard garantiti da ICCU (Istituto Centrale per il catalogo unico), da ICAR (Istituto centrale archivi) e da ICCD (Istituto centrale per la documentazione). Attraverso un software OCR (Riconoscimento ottico dei caratteri) è possibile effettuare una ricerca full text dei contenuti testuali associati all’immagine e il trattamento dell’oggetto digitale come ‘Manifest’ secondo IIIF, ossia una specie di pacco o busta che contiene tutte le informazioni URL utili per la sua identificazione e ne permette la correlazione anche a partire dai singoli componenti in una scrivania virtuale. In particolare, per l’ambito GIDIF-RBM, la possibilità di applicazione anche a materiali born-digital (nativi digitali) offrono anche all’area medico-farmaceutica l’opportunità di aprire nuovi scenari per lo studio e la ricerca (confronto di immagini ecografiche, radiologiche ecc.). Esempi di progetti realizzati o in corso di realizzazione in Italia: le Università di Pavia, Genova, Urbino, Macerata, Salerno, Bologna. 

Share Family: un modello di condivisione internazionale e autonomia locale

Tiziana Possemato, direttore e partner di @Cult e CIO di Casalini Libri, nella sua relazione Share Family: un modello di condivisione internazionale e autonomia locale ha illustrato il modello Share Family, un’iniziativa internazionale che veicola e supporta un insieme di progetti accomunati dall’obiettivo di prendersi cura del futuro dei cataloghi creando ambienti efficienti che facilitino la catalogazione, l’identificazione e l’arricchimento di record bibliografici in linked data. Share Family nasce da un progetto di condivisione dei cataloghi denominato Share-VDE (Share Virtual Discovery Environment), che ha coinvolto diverse biblioteche nordamericane, canadesi e europee, basato sulla conversione del formato dei dati in un’ottica linked, da Marc a BIBFRAME, Bibliographic-Framework, ovvero l’iniziativa che è alla base del futuro della descrizione bibliografica. Share-VDE, a sua volta, ha preso l’avvio ispirandosi a un progetto tutto italiano, Share-Catalogue, nato nell’ambito delle università del Sud Italia. In un processo espansivo, Share-VDE ha amplificato il suo impatto coinvolgendo istituzioni in Europa, America e Canada e innescando una serie di partnership all’interno della comunità bibliotecaria con progetti gemelli (Share-Art, prototipo basato sui dati delle biblioteche presenti nel catalogo Kubikat; Share-Music, sperimentazione nel dominio musicale alla quale partecipano la Bayerische Staatsbibliothek, la Library of Congress e la Stanford University; Share National Bibliographies, che mette insieme biblioteche nazionali per convertire e condividere le bibliografi nazionali e altri cataloghi, con una serie di servizi all’utenza internazionale e ai bibliotecari) fino ad arrivare ai domini più vasti quali Schema.org, IIIF, GeoNames, Getty LOD, ISNI, ISSN, Wikidata. Il risultato più eclatante del progetto è la filosofia collaborativa che ispira tutti i soggetti coinvolti, istituzioni, tecnici, archivisti, bibliotecari, sviluppatori, agenzie bibliografiche, che consente di sperimentare immediatamente quanto viene discusso nei gruppi di lavoro. 

Con i suoi obiettivi Share Family sposa i bisogni conoscitivi degli utenti finali, che hanno a disposizione un Discovery Portal incrementato dalle più diverse fonti, quelli degli utenti professionali – i catalogatori, per esempio – che contribuiscono alla qualità dei dati, e finanche delle macchine considerate come destinatarie dell’immensa mole di informazioni che deve essere elaborata. Tale mole di dati viene acquisita e fruita attraverso un’architettura di API (Application Programming Interface) di ricerca, un insieme di procedure informatiche, in genere raggruppate per strumenti specifici, atte all’espletamento di un dato compito. La direzione centrifuga del progetto non preclude tuttavia l’autonomia delle istituzioni partecipanti, che si possono aggregare in poli specializzati affinché si contemperi il principio della standardizzazione con quello della convenienza dell’utente.

I Linked Open Data nel dominio Cultural Heritage: interoperabilità e arricchimento semantico di dati catalografici

Giorgio Bevilacqua, digital humanist dell’azienda Synapta, spin off del Politecnico di Torino, si sofferma, in premessa al suo intervento I Linked Open Data nel dominio Cultural Heritage, sul fenomeno della recente e crescente disponibilità di dati aperti che vengono pubblicati in rete da parte di enti pubblici e privati. Tale disponibilità consente di poter creare connessioni fra banche dati distribuite nel web e, di conseguenza, poter sviluppare flussi di dati in grado di arricchire i cataloghi locali con informazioni provenienti da fonti esterne e decentralizzate. I Linked Open Data sono una tecnologia nata proprio per favorire questo tipo di collegamenti. Il suo contributo mostra come i Linked Open data e altre tecnologie e best practices di integrazione dei dati possono essere applicate in due domini: quello del public procurement e quello del patrimonio culturale. 

Il primo è concretizzato nel portale ContrattiPubblici.org, basato sui dati aperti della Pubblica amministrazione, pubblicati in base al Decreto Trasparenza. Tale portale è accessibile a tutti in modalità semplice e permette di trovare molte informazioni utili sia alle aziende private per fare marketing mirato, sia alle organizzazioni pubbliche per fare dei confronti qualità/prezzo, sia ai cittadini per capire come vengono spesi i soldi pubblici.

Il secondo dominio presentato è il progetto Linked Open Data del CoBiS (Coordinamento delle biblioteche speciali e specialistiche) di Area metropolitana torinese, che raggruppa 66 biblioteche appartenenti a istituti, accademie, fondazioni, centri e musei. È stato avviato nel 2015 allo scopo di integrare i cataloghi di dodici biblioteche eterogenee sia per ambito disciplinare che per struttura dei dati (Marc21, UNIMARC, Dublin Core). Il primo passaggio è stato la trasformazione in linked data attraverso le ontologie standard e BIBFRAME; il secondo passaggio ha ampliato il contenuto informativo dei dati esposti nel portale mediante l’interlinking verso fonti esterne in tempo reale, al momento dell’interrogazione. L’esito è il portale Linked Open Data del CoBis: interrogabile, oltre che per titolo, autore e anno di edizione dell’opera, tramite query strutturate secondo il linguaggio di interrogazione SPARQL, che utilizza le triple RDF per integrare nella ricerca informazioni aggiuntive (query federate). Con questa tecnologia è possibile, per esempio, sapere dove hanno studiato gli autori presenti nel catalogo, avere una rappresentazione della distribuzione geografica tramite il collegamento con le voci di Wikidata e il puntamento per la georeferenziazione a OpenStreetMap e altre informazioni che arricchiscono il dato e lo integrano. 

Un altro interessante esempio di best practice è il nuovo Catalogo generale dei beni culturali dell’ICCD (Istituto centrale per il catalogo e la documentazione), che incamera i dati provenienti dal Sistema informativo generale del catalogo (SIGECweb) del Ministero della Cultura relativi ai beni culturali riconosciuti di interesse artistico, storico, archeologico o etnoantropologico. Esso utilizza una tecnologia analoga, attingendo informazioni dalla rete attraverso algoritmi a partire, per esempio, dai dati anagrafici nel caso di Entità Persona o quelli relativi alle opere di un artista. Qualora gli identificativi necessari non siano presenti, è stata ideata l’interfaccia OLAF (Open Linked Authority File), che realizza l’allineamento e l’integrazione dei dati nel catalogo ICCD dopo la verifica di effettiva corrispondenza con quelli ottenuti da una comparazione con le fonti esterne. Da qui possono innescarsi progetti di Data Curation, ovvero di organizzazione e integrazione dei dati provenienti da varie fonti disponibili in rete, a vantaggio dell’affidabilità delle informazioni reperibili.

Spazi e saperi: contaminazione tra comunicazione e biblioteca

L’intervento Spazi e saperi: contaminazione tra comunicazione e biblioteca. Accenno a Wikimedia con il progetto GLAM è stato presentato da Federica Viazzi e Mariateresa Dacquino, rispettivamente bibliotecaria e giornalista professionista dirigente dell’Ufficio comunicazione, Biblioteca Biomedica, Formazione DAIRI dell’Azienda Ospedaliera SS. Antonio e Biagio e Cesare Arrigo di Alessandria.

La collaborazione tra la Biblioteca e l’Ufficio comunicazione ha tre obiettivi: 

  1. valorizzare la produzione scientifica, anche in vista del riconoscimento dell’Azienda ospedaliera come IRCCS per le patologie ambientali e asbesto-correlate; 
  2. supportare l’aggiornamento del personale sanitario, partecipando in quest’ottica alla BSV-P (Biblioteca virtuale per la salute - Piemonte), infrastruttura tecnologica della Regione Piemonte voluta per promuovere la medicina basata sulle prove di efficacia e offrire accesso all’informazione biomedica a tutti gli operatori della salute
  3. rafforzare l’health literacy dei cittadini attivando una pluralità di canali di comunicazione e disseminare l’informazione biomedica nel modo più ampio possibile.

Il supporto tecnico è assicurato durante tutta la linea della ricerca, dal reperimento delle fonti al monitoraggio degli esiti delle pubblicazioni. Al contempo, sono stati prodotti, in collaborazione con il personale sanitario, opuscoli informativi, sempre corredati dai riferimenti bibliografici, destinati agli utenti della struttura ospedaliera, anche in vista della costituzione di una biblioteca del paziente. Altri servizi offerti sono:

  • l’accesso a MLOL (Media Library Online), fornito dalla Biblioteca civica e con la mediazione dei volontari del Servizio civile nazionale, che è stata un’azione di risposta, molto apprezzata, alle restrizioni dovute all’emergenza sanitaria; 
  • la realizzazione del portale “Le parole del Covid”, in collaborazione con l’associazione Lab121 che ha proposto ai cittadini un aggiornamento quotidiano sul tema con l’intento di abbassare il livello di incertezza durante le fasi iniziali dell’epidemia; 
  • il format “Le parole della ricerca” con cui si intende comunicare il passaggio dell’ospedale da istituto solo di assistenza e cura a istituto di ricerca, e per questo fonte primaria di informazione biomedica: attraverso un incontro online mensile con i ricercatori, che si avvalgono di un linguaggio diretto e del supporto di due illustratori, si possono seguire le attività svolte nei vari dipartimenti.

È inoltre stato avviato un progetto di valorizzazione delle immagini e del patrimonio storico dell’ospedale che, grazie a una convenzione con Wikimedia, ha ampliato la sua portata rendendo disponibili in Wikipedia contenuti di qualità con licenza Creative Commons.

Conclusioni

Negli interventi al workshop è apparso chiaro, ha sottolineato Fabio Venuda, come la tecnologia LOD rappresenti una leva per sperimentazioni nelle diverse comunità. La comunità bibliotecaria, in particolare, avvezza a rendere disponibili dati ben strutturati, controllati e molto ricchi dal punto di vista informativo, come sono quelli catalografici, potrà trarre grandissimi vantaggi dal miglioramento e potenziamento degli elementi informativi disponibili, e verificare come essi possono colloquiare con tutte le informazioni presenti in rete se diventano linked e open

Per realizzare questo una partnership pubblico/privato è indispensabile e qualificante a patto che siano chiari e condivisi i fini, i compiti, i vantaggi e i rischi. 

La transizione al digitale deve vedere le biblioteche protagoniste del processo siano esse biblioteche e centri di documentazione biomedica e universitarie. 

Ringraziamenti

Ringraziamo tutti i relatori che hanno partecipato al workshop portando il loro contributo originale e rivedendo la loro parte qui riportata: Susanna Mornati e Anna Busa, Tiziana Possemato, Giorgio Bevilacqua, Federica Viazzi e Mariateresa Dacquino. Ringraziamo Fabio Venuda per aver moderato il workshop e i partecipanti per aver animato la discussione. 

Bibliografia e sitografia

Tutti i siti sono stati verificati per l’accesso il 2 novembre 2021.

Bianchini, Carlo. “Dagli OPAC ai library linked data: come cambiano le risposte ai bisogni degli utenti”. AIB studi 52, n. 3 (14 dicembre 2012). https://doi.org/10.2426/aibstudi-8597.

Brigoni, Patrizia. “Nasce BVS-Piemonte, la Biblioteca Virtuale per la Salute del Piemonte”. Dors Piemonte, 13 maggio 2010. http://www.dors.it/page.php?idarticolo=1392.

Bruni, Silvia, Francesca Capetta, Anna Lucarelli, Maria Grazia Pepe, Susanna Peruginelli, e Marco Rulent. “Towards the integration of archives, libraries and museums”. JLIS.it 7, n. 1 (15 gennaio 2016): 225–44. https://doi.org/10.4403/jlis.it-11482.

Comba, Valentina, e Gioia Tavoni. “La formazione professionale del bibliotecario-documentalista in Italia. Riferimenti all’ambito biomedico. in “Atti del Convegno “Biblioteche e Centri di Documentazione nella biomedicina: realtà e prospettive”, Roma, ISS, 12-14 dicembre 1984”. Annali dell’Istituto superiore di sanità 22, n. 4 (1986): 1215–20. https://www.iss.it/documents/20126/45616/Pag1215_1227Vol22N41986.pdf/bc76b27f-5a96-92d1-7645-5ba798f8d6a2?t=1581099393631.

Galimberti, Paola, e Susanna Mornati. “The Italian Model of Distributed Research Information Management Systems: A Case Study”. Procedia Computer Science 106 (2017): 183–95. https://doi.org/10.1016/j.procs.2017.03.015.

GIDIF-RBM. “GIDIF RBM WorkShop”. Consultato 2 novembre 2021. https://gidif-rbm.org/?s=workshop.

Guerrini, Mauro, e Tiziana Possemato. “From Record Management to Data Management: RDA and New Application Models BIBFRAME, RIMMF, and OliSuite/WeCat”. Cataloging & Classification Quarterly 54, n. 3 (2 aprile 2016): 179-99. https://doi.org/10.1080/01639374.2016.1144667.

Istituto Centrale per la Catalogazione e la Documentazione, ICCD Rome. “International Image Interoperability Framework”, 2018. http://www.iccd.beniculturali.it/##MAGAZINE_HOST##/getFile.php?id=6399.

Maconi, Antonio, Mariasilvia Como, Mariateresa Dacquino, e Federica Viazzi. “Cultura è cura: la biblioteca biomedica come soggetto attivo nei percorsi di cura del XXI secolo”. Biblioteche oggi Trends 6, n. 1 (1 luglio 2020). https://doi.org/10.3302/2421-3810-202001-040-1.

Schiavone, Luisa, Federico Morando, Davide Allavena, e Giorgio Bevilacqua. “Library Data Integration: The CoBiS Linked Open Data Project and Portal”. In Digital Libraries and Multimedia Archives, a cura di Giuseppe Serra e Carlo Tasso, 806:15–22. Cham: Springer International Publishing, 2018. https://doi.org/10.1007/978-3-319-73165-0_2.

“SPARQL 1.1 Query Language”. Consultato 26 ottobre 2021. https://www.w3.org/TR/sparql11-query/.

Turbanti, Simona. “Il mondo dei Linked open data e i cataloghi delle biblioteche: reale opportunità o semplice attrattiva? Qualche spunto di riflessione”, Abano Terme (PD), giugno 2016. Consultato 2 novembre 2021 https://www.academia.edu/26418791/Il_mondo_dei_Linked_open_data_e_i_cataloghi_delle_biblioteche_reale_opportunit%C3%A0_o_semplice_attrattiva_Qualche_spunto_di_riflessione.

Wikipedia. “Web semantico”, 20 aprile 2021. https://it.wikipedia.org/w/index.php?title=Web_semantico&oldid=120039688.