N.1 2022 - Biblioteche oggi | Gennaio- febbraio 2022

Navigazione dei contenuti del fascicolo

RDA: differenze tra il toolkit originario e la versione ufficiale del 2020

Laura Manzoni

Università degli studi di Firenze laura.manzoni@unifi.it

Abstract

L'articolo si propone di analizzare le principali differenze tra la versione originale dell'RDA Toolkit pubblicata nel 2010 e la versione ufficiale pubblicata nel 2020, al fine di osservare le principali trasformazioni dovute all'allineamento con l'IFLA LRM, il nuovo modello concettuale pubblicato nel 2017. In particolare, verranno analizzati i cambiamenti nell'organizzazione testuale, nel trattamento di entità, attributi e relazioni e nel modo in cui i dati vengono registrati. Infine, verrà presentato il ruolo cruciale svolto dai profili applicativi nel nuovo toolkit.

English abstract

The paper aims to analyze the main differences between the original version of the RDA Toolkit pub- lished in 2010 and the official version published in 2020, in order to observe the main transformation due to the alignement with IFLA LRM, the new conceptual model published in 2017. In particular, the changes in textual organization, the treatment of entities, attributes and relationships, and the way data is recorded will be analyzed. Finally, the crucial role played by application profiles in the new toolkit will be presented.

Per scaricare l'articolo in pdf visita la sezione "Risorse" o clicca qui.

Quali trasformazioni ha comportato l’allineamento dello standard al modello concettuale IFLA LRM

Il contributo si pone l’obiettivo di analizzare le principali differenze tra la versione originaria del testo di RDA Toolkit del 2010 e la versione ufficiale del 2020 allo scopo di comprendere quali trasformazioni abbia comportato l’allineamento dello standard al modello concettuale IFLA LRM (Library Reference Model) edito nell’agosto del 2017. Verrà utilizzata l’espressione “Toolkit originario” per fare riferimento alla prima edizione di RDA, mentre con “Toolkit ufficiale” ci si riferirà alla nuova versione; della prima è disponibile la traduzione in lingua italiana a cura dell’ICCU, della versione ufficiale la traduzione è ancora in corso; pertanto, nell’articolo verrà utilizzato l’inglese per la citazione di termini e definizioni ripresi dalla versione ufficiale, a eccezione di vocaboli presenti in IFLA LRM (Library Reference Model), di cui è stata pubblicata la traduzione italiana curata dall’ICCU nel 2020 e dalla quale si riprende la terminologia.

Le linee guida RDA (Resource Description and Access) sono state pubblicate nel giugno 2010 in un volume a fo- gli mobili e contemporaneamente nella versione online chiamata RDA Toolkit, ma hanno iniziato a essere utilizzate solo dal 31 marzo 2013 a opera della Library of Congress e di numerose biblioteche americane, canadesi, australiane ed europee. Il testo originario era basato sui modelli concettuali FRBR (Functional Requirements for Bibliographic Records) e FRAD (Functional requirements for Authority Data), tuttavia, in seguito alla pubblicazione di IFLA LRM, questa versione dello standard venne considerata superata e fu avviato l’RDA Toolkit Restructure and Redesign (3R) Project con l’obiettivo di provvedere a tutti i cambiamenti necessari per favorire l’allineamento di RDA con IFLA LRM. Le prime trasformazioni furono visibili già dal 13 giugno 2018, ossia dal lancio della versione Beta di RDA Toolkit, che dal 15 dicembre 2020 è divenuta ufficiale. Il Toolkit originario non viene più aggiornato dal 2017, ma è ancora disponibile ai catalogatori al fine di supportarli nella transizione verso la versione ufficiale che risulta profondamente trasformata sotto molteplici aspetti:

  • l’organizzazione testuale;
  • l’introduzione di nuove entità;
  • la presenza di un numero maggiore di relazioni e minore di attributi;
  • la possibilità di disporre di diverse modalità di registrazione dei dati;
  • la definizione di nuovi criteri di base per la descrizione delle risorse;
  • l’introduzione di nuovi concetti, come quello di opere diacroniche (delle opere pubblicate nel corso del tempo; possono essere monografie, seriali o risorse integrative) e lo sviluppo di altri che erano già presenti nella versione originaria del Toolkit, come le linee guida sulla trascrizione e il trattamento degli aggregati.

Nonostante tutti questi cambiamenti, l’RDA Steering Committee (RSC) si era proposto l’obiettivo di provocare un impatto minimo sulle pratiche correnti. Pertanto, quando è stato possibile, le istruzioni sono state mantenute invariate e sono state previste più opzioni per le modalità di registrazione dei dati che consentis- sero di continuare a registrarli come in precedenza, oppure di introdurre modifiche adatte ai diversi ambienti di lavoro.

L’ organizzazione testuale

Il Toolkit originario presentava una struttura di tipo testuale analoga a quella dei tradizionali codici e standard di catalogazione. Si apriva con una prefazione seguita da un sommario e dall’introduzione. Veniva poi presentato il testo delle linee guida organizzate in dieci sezioni divise in due parti corrispondenti alle finalità di RDA: identificare un’entità mediante i suoi attributi (sezioni 1-4) e collegare le entità attraverso la creazione di relazioni significative (sezioni 5-10). Infine, comparivano le Appendici (dedicate al trattamento delle maiuscole, delle abbreviazioni, degli articoli iniziali, alla sintassi nella registrazione dei dati descrittivi e dei punti d’accesso, alla presentazione di istruzioni aggiuntive per i nomi di persona, per la registrazione dei titoli nobiliari e di rango e dei designatori di relazione) e il Glossario.

Nella versione ufficiale del Toolkit il testo di RDA non mantiene questa linearità, ma è stato reso più navigabile. Prevede quattro menu a tendina relativi a: Entità (Entities), Istruzioni (Guidance), Politiche (Policies) e Risorse (Resources) (Figura 1). Il catalogatore può scegliere il suo punto di partenza e quali pagine consultare in base al lavoro che deve svolgere.

Figura 1

Le Entità sono presentate nell’ordine in cui compaiono in IFLA LRM e a ciascuna di esse è dedicata una pagina che si apre con la sua definizione seguita dall’indicazione degli elementi minimi che consentono la sua identificazione, dalla precisazione dei confini di quell’entità (entity boundaries), dalle indicazioni sulle possibili modalità di rappresentazione e da un elenco degli elementi, ossia gli attributi e le relazioni, che servono a descriverla. 

Le Istruzioni contengono quelli che nel Toolkit originario erano i capitoli introduttivi di RDA, relativi a informazioni di contesto e utili al chiarimento di alcuni concetti. Esse sono rivolte principalmente ai catalogatori che iniziano a utilizzare RDA e hanno bisogno di una guida.

Le pagine dedicate alle Politiche ospiteranno le soluzioni specifiche di ogni agenzia bibliografica o biblioteca. Attualmente sono parzialmente disponibili le politiche adottate dalla British Library, quelle del Library of Congress Program for Cooperative Cataloging e della Music Library Association. Queste policy erano già presenti nella prima edizione di RDA e comparivano sia all’interno del testo delle linee guida sia nella sezione Risorse del Toolkit.

Infine, le pagine dedicate alle Risorse contengono: il glossario, gli schemi di codifica dei vocabolari, alcune risorse messe a disposizione delle comunità specifiche i cui contenuti non sono stati inseriti nel testo ufficiale delle linee guida poiché fanno riferimento a usi e pratiche locali e a specifiche convenzioni culturali, lo storico delle revisioni di RDA e il collegamento al Toolkit originario e al testo delle AACR2.

Le entità

Il Toolkit originario, essendo basato sui modelli concettuali FRBR e FRAD, prendeva in considerazione le seguenti entità: opera, espressione, manifestazione, item (entità del Gruppo 1 di FRBR), persona, famiglia ed ente (entità del Gruppo 2 di FRBR più l’entità famiglia ripresa da FRAD), concetto, oggetto, evento e luogo (entità del Gruppo 3 di FRBR). Nella versione ufficiale sono state aggiunte tre entità nuove: agente collettivo, nomen e arco di tempo, che vengono così definite:

  • Agente collettivo: “An agent who is a gathering or organization of two or more persons that bears a particular name and that is capable of acting as a unit. A collective agent includes a corporate body and a family”.
  • Nomen: “A label for any RDA entity except a nomen. A label includes a name, title, access point, or identifier”.
  • Arco di tempo: “A finite period of time”.

Altre due entità, agente e luogo, la prima implicita in RDA e la seconda presente, ma come entità del Gruppo 3 mai sviluppato, sono state ridefinite e consolidate. In particolare, l’agente è definito come “An entity who is capable of deliberate actions, of being granted rights, and of being held accountable for its actions. An agent includes a collective agent and a person”, mentre il luogo rappresenta “a given extent of space”.

Le entità persona, famiglia ed ente sono diventate delle sottoclassi di agente e agente collettivo e le istruzioni associate sono state organizzate dove appropriato. L’entità persona, a differenza di quanto previsto da FRBR, non include più entità non umane, quali persone fittizie, che vengono ora considerate come pseudonimi della persona. Infine, l’entità Res, prevista da IFLA LRM, è stata sostituita con una sottoclasse definita RDA entity che costituisce “an abstract class of key conceptual objects in the universe of human discourse that are focus of interest to users of RDA metadata in a system for resource discovery. An RDA entity includes an agent, collective agent, corporate body, expression, family, item, manifestation, nomen, person, place, timespan, and work”.

Un importante elemento introdotto nella versione ufficiale del Toolkit relativamente all’identificazione delle entità riguarda la definizione dei confini tra entità: essi costituiscono 

the set of criteria that is applied by an agent who creates metadata to determine if a description of a new RDA entity is required […] the set of criteria is specific to an entity. Some criteria are required for conformance with well-formed RDA metadata and are determined by semantic integrity of the type of entity. Some criteria are specified whithin an application and are determined according to bibliographic and cultural conventions. 

La definizione dei confini tra entità consiste quindi nella scelta dei criteri in base ai quali determinare se quella che stiamo descrivendo corrisponde a un’entità che è già stata descritta, se si tratta di un’altra istanza della stessa entità o se si tratta di un’entità diversa.

Gli attributi

Gli attributi previsti dal Toolkit originario riflettevano ed espandevano quelli previsti da FRBR e FRAD. Nella versione ufficiale, molti di essi, analogamente a quanto avvenuto in IFLA LRM, sono stati eliminati. Tuttavia, sono stati aggiunti due nuovi attributi molto importanti: l’espressione rappresentativa e l’indicazione di manifestazione

L’espressione rappresentativa identifica alcune caratteristiche dell’opera che rappresentano meglio le intenzioni del creatore. RDA la definisce come “an expression that is considered a canonical source of data for identifying a work”.

Un’opera si esprime attraverso diverse espressioni generalmente considerate equivalenti. Tuttavia, ci sono certe caratteristiche dell’espressione che un utente associa intuitivamente all’opera e che rispecchiano le intenzioni del suo creatore. Per esempio, l’opera I promessi sposi di Alessandro Manzoni può avere espressioni in diverse lingue: in italiano, in francese, in inglese ecc., ma l’utente associa intuitivamente l’opera alla versione in italiano perché è così che venne originariamente concepita da Alessandro Manzoni.

L’espressione rappresentativa viene distinta dalle altre espressioni dell’opera sulla base di una o più caratteristiche. Nell’esempio appena visto la caratteristica distintiva è la lingua. Dal momento che questa caratteristica viene associata direttamente all’opera, RDA prevede che l’attributo espressione rappresentativa venga registrato come attributo dell’opera piuttosto che come attributo dell’espressione. Ciò risulta particolarmente chiaro nel seguente box esemplificativo riportato nel Toolkit (Figura 2).

Figura 2

L’opera The Pickwick papers di Charles Dickens ha come lingua dell’espressione rappresentativa l’inglese. L’attributo della lingua verrà poi registrato separatamente anche a livello di espressione.

L’indicazione di manifestazione consente una chiara distinzione tra i dati trascritti da una manifestazione per riflettere come essa si presenta in maniera non strutturata e i dati registrati da altre fonti. Essa è definita da RDA come “a statement appearing in a manifestation and deemed to be significant for users to understand how the manifestation represents itself”. Le informazioni sono registrate seguendo il principio di rappresentazione, ossia trascrivendo i dati come si trovano sulla fonte d’informazione. L’indicazione di manifestazione comprende tredici sotto-elementi:

  • Manifestation copyright statement
  • Manifestation designation of sequence statement
  • Manifestation dissertation statement
  • Manifestation distribution statement
  • Manifestation edition statement
  • Manifestation frequency statement
  • Manifestation identifier statement
  • Manifestation manufacture statement
  • Manifestation production statement
  • Manifestation publication statement
  • Manifestation regional encoding statement
  • Manifestation series statement
  • Manifestation title and responsability statement

Essi sono gli stessi elementi che vengono normalmente registrati per descrivere una manifestazione, ma non vengono presentati con la stessa granularità. Per esempio, nel caso della formulazione di pubblicazione non è prevista la registrazione in campi separati del luogo di pubblicazione, del nome dell’editore e dell’anno di pubblicazione, ma tutti questi elementi vengono riportati nello stesso campo senza seguire un ordine prestabilito.

Le relazioni

Le relazioni, secondo quanto affermato in varie occasioni da Tom Delsey, rappresentano la parte più importante del modello concettuale e delle linee guida. Consentono agli utenti di trovare ciò che desiderano e di scoprire se esistono altre risorse affini per qualche caratteristica favorendo la navigazione dentro e fuori dai cataloghi. Il Toolkit originario sviluppava tre tipologie di relazioni:

  • tra entità del Gruppo 1: sono definite anche relazioni primarie e riguardano la relazione tra un’opera e un’espressione mediante cui l’opera è realizzata; tra un’espressione e la manifestazione che la materializza; tra una manifestazione e l’item che la esemplifica e le relazioni tra opere correlate, espressioni correlate, manifestazioni correlate e item correlati;
  • tra entità del Gruppo 1 ed entità del Gruppo 2, ossia le relazioni tra opere, espressioni, manifestazioni e item e le persone, famiglie ed enti a esse collegate;
  • tra entità del Gruppo 2, ossia tra persone, famiglie ed enti e persone, famiglie ed enti correlate.

Erano previsti anche dei capitoli dedicati alla registrazione delle relazioni di soggetto e delle relazioni tra le entità del Gruppo 3, ma non sono stati ancora sviluppati.

Il Toolkit originario accanto a capitoli dedicati alla registrazione delle relazioni presentava delle Appendici dedicate ai designatori di relazione, i termini che spiegano e chiariscono la relazione e che specificano il ruolo che un agente svolge rispetto a un’opera, a un’espressione a una manifestazione o a un item. In particolare, l’Appendice I contiene i designatori di relazione che specificano il tipo di relazione che intercorre tra una risorsa e persone, famiglie ed enti associati a essa; l’Appendice J contiene i designatori che esprimono le relazioni tra opere, espressioni, manifestazioni e item; l’Appendice K contiene i designatori che esprimono le relazioni tra persone, famiglie ed enti; l’Appendice L contiene i designatori che esprimono le relazioni tra concetti, oggetti, eventi e luoghi e l’Appendice M contiene i designatori per esprimere le relazioni di soggetto.

Con il passaggio alla versione ufficiale del Toolkit sono state mantenute le stesse tipologie di relazione, ma ci sono stati alcuni cambiamenti. I designatori di relazione, per esempio, non sono più relegati nelle Appendici dove apparivano come un raffinamento delle relazioni descritte nelle sezioni 5-10. Ognuno di essi ha una pagina dedicata, oltre a comparire nelle pagine delle entità a cui è associato, e nel glossario. Il numero complessivo dei designatori, inoltre, è cresciuto enormemente rispetto al Toolkit originario e ciò è dipeso da due fattori. Innanzitutto, sono stati previsti designatori di relazione specifici per le singole entità e non per l’insieme delle entità appartenenti a un gruppo nel suo complesso. Nel Toolkit originario, per esempio, l’Appendice I conteneva designatori di relazione che specificavano il tipo di relazione che intercorreva tra un’entità del Gruppo 2 e la risorsa descritta, ma non vi erano distinzioni relative al fatto che l’entità del Gruppo 2 a cui si faceva riferimento fosse una persona, una famiglia o un ente. Nella versione ufficiale di RDA, invece, sono previsti designatori specifici per ogni entità. Se una persona è autore di un’opera si userà il designatore author person of, mentre se l’autore è una famiglia o un ente si utilizzeranno i designatori author family of e author corporate body of.

In secondo luogo, l’introduzione di alcune entità, come il nomen e l’arco di tempo e il consolidamento dell’entità luogo, ha determinato la trasformazione di alcuni attributi in relazioni. Per esempio, il titolo preferito dell’opera e la data di nascita nel Toolkit originario erano degli attributi, mentre nella versione ufficiale di RDA sono stati trasformati in relazioni. Il titolo dell’opera, in particolare, è rappresentato come una relazione tra l’entità opera e l’entità nomen, mentre la data di nascita è definita come una relazione tra un’entità agente e l’entità arco di tempo.

Per designare le relazioni tra entità sono stati introdotti in RDA i concetti di dominio e codominio previsti da IFLA LRM. Il dominio indica l’entità da cui parte l’azione, mentre il codominio l’entità verso la quale è diretta l’azione. Quasi tutte le relazioni previste da RDA sono reciproche.

Gli aggregati

Nel Toolkit originario il trattamento degli aggregati non era stato sviluppato oltre l’approccio previsto delle AACR2 (Anglo American Cataloguing Rules. 2nd edition). L’IFLA Working Group on Aggregates, infatti, aveva suggerito di aspettare che avvenisse il consolidamento dei modelli concettuali della famiglia FR (Functional Requirements) prima di procedere. Nel 2017 l’RSC Working Group on Aggregates definì una serie di obiettivi che era necessario perseguire nella descrizione degli aggregati, ossia:

  • semplificare il processo di identificazione e descrizione degli aggregati con istruzioni chiare;
  • incoraggiare i catalogatori a descrivere gli aggregati al livello più granulare possibile da gestire;
  • prevedere relazioni esplicite che consentissero ai software di creare collegamenti tra dati sempre più granulari;
  • consentire agli utenti di trovare le informazioni riguardo a quell’aggregato in altre espressioni e identificare, selezionare e ottenere l’espressione nella manifestazione preferita.

Il Toolkit ufficiale, seguendo IFLA LRM, definisce un aggregato come “a manifestation that embodies an aggregating expression and one or more expression that are aggregated. The expression that are aggregated may realize one or more works”. Gli aggregati possono essere di tre tipi:

  • raccolte aggregate: incorporano due o più espressioni di due o più opere indipendenti. Le raccolte comprendono le selezioni, le antologie, le serie (collane), fascicoli di seriali e altre tipologie analoghe di risorse;
  • aggregati risultanti da aggiunte: sono manifestazioni che incorporano due o più espressioni di due o più opere in cui un’opera indipendente è integrata da una o più opere dipendenti. Ciò avviene quando un’espressione è integrata da materiale supplementare che non è parte integrante dell’opera originale e non modifica in modo significativo l’espressione originale, per esempio, un volume che incorpora un romanzo, una prefazione, delle illustrazioni e un indice;
  • aggregati di espressioni parallele: sono manifestazioni che incorporano due o più espressioni di una singola opera, per esempio, un volume che incorpora diverse espressioni di un’opera in più lingue.

RDA, inoltre, definisce i concetti di espressione aggregante e di opera aggregante. Un’espressione aggregante realizza il piano di un’opera aggregante per selezionare e ordinare le espressioni incorporate da un aggregato. Un’opera aggregante è il piano per selezionare e organizzare due o più espressioni di un’opera o più opere e incorporarle in una singola manifestazione. Il piano può prevedere di aggregare espressioni di opere intere, di parti di opere o di estratti di opere.

La registrazione dei dati

Un’importante novità prevista dalla versione ufficiale del Toolkit riguarda l’introduzione di quattro modalità per la registrazione dei dati:

  • tramite una descrizione composita e non strutturata (come un’indicazione di manifestazione, una nota non strutturata, un nome, un titolo in forma diretta come compare sulle fonti d’informazione, un termine non controllato ecc.);
  • tramite una descrizione strutturata (tramite una stringa di caratteri che usi una sintassi e uno schema codificati come le aree ISBD o un punto d’accesso autorizzato);
  • tramite un identificatore (come un ISBN o un ISSN); 
  • tramite un IRI (International Resource Identifier).

Tra queste possibilità, la registrazione tramite IRI è quella che supporta al meglio le applicazioni del web semantico. 

La descrizione delle risorse: gli application profiles

Descrivere e dare accesso a una risorsa utilizzando RDA significa produrre i metadati per quella risorsa, ossia creare dati precisi, riutilizzabili e rispondenti ai bisogni degli utenti. Per raggiungere questo obiettivo, la versione originaria delle linee guida prevedeva un insieme di elementi essenziali per l’identificazione delle varie entità, i quali dovevano essere sempre presenti al fine di poter considerare una descrizione conforme allo standard. Essi erano stati individuati in base alla loro capacità di svolgere le principali funzioni utente corrispondenti a:

  • identificare e scegliere una manifestazione;
  • identificare le opere e le espressioni contenute in una manifestazione;
  • identificare il creatore di un’opera;
  • trovare una persona, un ente o una famiglia associati a una risorsa.

La versione ufficiale del Toolkit, pur individuando per ogni entità una serie molto ridotta di elementi che consentono di realizzare quella che viene chiamata minimum description e pur riconoscendo che vi sono degli elementi che devono necessariamente comparire nella descrizione della risorsa, afferma che la loro scelta è realizzata da parte dell’agenzia bibliografica che produce la descrizione: “Decision on whether certain elements are core, and cardinality of recorded elements, may be indicated by an agent who creates metadata. These decisions may be recorded in RDA toolkit as policies, or as separate documents issued by agent, or as application profile”.

Questa decisione mostra la volontà di rispettare tradizioni e pratiche tipiche non condivise a livello globale e attribuisce un’importanza sempre maggiore agli application profiles che diventano degli strumenti fondamentali per la catalogazione poiché indicano quali elementi devono essere compresi all’interno di una descrizione distinguendo tra elementi obbligatori e opzionali, specificano quali campi sono ripetibili, come devono essere registrati i dati, stabiliscono le norme di trascrizione e i vocabolari di riferimento. Le agenzie bibliografiche che utilizzano RDA stanno attualmente lavorando all’elaborazione di questi strumenti e contemporaneamente stanno intervenendo sulle tecnologie per favorire la transizione verso la nuova versione delle linee guida.