Tag Archives: cataloage partajate

8. Viitorul catalog partajat național (culturalia.ro). Sugestii/dileme privind organizarea datelor catalografice și a mecanismului de întreținere a calității acestora

(NB. Publicat la 27 mai 2018)

(expunere la Conferința de primăvară a ANBPR, Bacău, 18.05.2018)

1. Proiectul E-Cultura: stadiul actual

Reamintesc: Institutul Național al Patrimoniului [INP] – din postura sa de agregator național pentru Biblioteca Digitală Europeană (europeana.eu) – a propus acest proiect încă din 2014, ca parte a Agendei Digitale pentru România. El a fost inclus în Programul Operațional Competitivitate [POC] și anume în Acțiunea 2.3.3 „Îmbunătățirea conținutului digital și a infrastructurii TIC sistemice în domeniul e-educație, e- incluziune, e-sănătate și e-cultură” și urmează a fi finanțat cu circa 11 milioane de euro, pentru trei ani.

Obiectivele proiectului sunt:

  • Dezvoltarea unei platforme informatice online de catalog național partajat și portal de bibliotecă digitală (Culturalia), disponibilă gratuit oricărei instituții culturale, precum și publicului larg. (Aceasta urmează a fi pandantul național al Bibliotecii Digitale Europene europeana.eu).
  • Expunerea online în Biblioteca Digitală a României (culturalia.ro) și în Biblioteca Digitală Europeană (europeana.eu) a circa 550.000 de bunuri culturale (texte, imagini, audiograme, videograme, obiecte 3D).

(În sfârșit), proiectul este în faza de contractare între Ministerul Fondurilor Europene și Ministerul Culturii.

2. Europeana vs. (imaginata) Culturalia

2.1. Similitudini

  • Ambele sunt (platforme informatice pentru) cataloage „universaliste” de resurse culturale, adică includ înregistrări catalografice (i.e. metadate) atât provenite din biblioteci, cât și din muzee, arhive, teatre etc. Cu alte cuvinte, descrieri pentru orice fel de resurse culturale.
  • Ambele oferă baleiere fațetată.

Astfel arată acest fel de baleiere în portalul Europeana (https://www.europeana.eu/portal/en/search?q=*&view=grid):

Dar, în Culturalia, am prefera să arate mai sofisticat, chiar mai sofisticat decât în biblio.ro (exemplu: căutarea “Naum”):

2.2. Diferențe

Europeana Culturalia
Este un catalog colectiv, i.e. este alimentat cu date offline. Deocamdată furnizorii sunt doar instituții culturale. Ar fi un catalog partajat, i.e. alimentat cu date online și la descrierea unei resurse pot contribui mai mulți catalogatori. Furnizorii ar fi atât instituțiile culturale, cât și publicul larg. De notat că americanii au un asemenea catalog de aproape 40 de ani (http://www.worldcat.org/). Dar și basarabenii au unul de aproape 20 de ani (http://sibimol.bnrm.md/ro/)
Conține metadate (i.e. fișe descriptive) de resurse culturale digitale expuse online. Ar conține metadate (i.e. fișe descriptive) atât pentru resurse culturale digitale expuse online, cât și pentru resurse culturale fizice, aflate în colecțiile instituțiilor. În definitiv, din perspectiva fișei catalografice, ce mi-e că „adresa” unei resurse culturale este http://www.cimec.ro/pdf/dl.asp?filename=Lambrino-Marcelle-Es-vases-archaiques-d-Histria.pdf sau “BNaR, cota CDR 224”.
Obiectele digitale descrise în catalog se află în repozite digitale locale (i.e. pe saiturile furnizorilor). Obiectele digitale s-ar afla atât în repozite locale, i.e. pe saiturile furnizorilor, cât și (opțional) în repozitul digital central. Consecință colaterală: ar fi unde să se stocheze material digital expus de către public (așa numitul UGC [User Generated Content]).
(Din punct de vedere al modelului de date și al formatului intern) conține înregistrări metadatale (fișe catalografice) „clasice”. Ar conține enunțuri (i.e. fișe catalografice „deconstruite”) interconectate, adică în paradigma LOD [Linked Open Data], paradigme încă ne-uzuală, dar aplicată deja în mari instituții din lume, e.g.:

Entitățile contextuale (concepte, persoane, locuri, perioade etc.): sunt încorporate în înregistrările catalografice, în maniera clasică. Entitățile contextuale ar fi „autonome” (i.e. datele catalografice ar fi pe același plan cu cele de autoritate).

 

 

Ontologia subiacentă este EDM [Europeana Data Model] (https://pro.europeana.eu/resources/standardization-tools/edm-documentation) Ontologia subiacentă ar fi una eclectică (dar mult mai granulară), bazată pe modelele conceptuale standard:

Oferă doar căutare. Ar oferi pe lângă căutare și baleieri alfabetică, sistematică, cronologică, și spațială.

Exemplu de baleiere spațială (imitabil): INP/CIMEC: muzee și colecții (http://map.cimec.ro/Mapserver/):

Și un exemplu de baleiere cronologică (imitabil): WorldCat Identities – căutare “Moliere” (https://www.worldcat.org/identities/lccn-n79043851/):

3. Culturalia: (doar) catalog !

Platforma Culturalia nu-și propune să fie un „sistem integrat de bibliotecă” și nici un „sistem integrat de muzeu”. Așadar, va oferi doar catalog. Cu alte cuvinte, nu va putea fi folosită pentru a gestiona împrumuturi sau achiziții.

Însă platforma va oferi o interfață programabilă (i.e. API [Application Programming Interface]), așadar producătorii de soft vor putea dezvolta și sisteme „dezintegrate”, cu alte cuvinte, vor putea dezvolta sisteme locale care să ofere funcționalitățile necesare gestionării unei colecții, intefațându-le cu catalogul național partajat.

4. Culturalia: tipurile de enunțuri propuse

Entitățile culturale înregistrate în catalogul Culturalia ar urma să fie descrise prin aserțiuni de următoarele tipuri:

  • textuale (text sau XML + limbă);
  • booleene;
  • numerice (întreg sau real + unitate de măsură);
  • temporale (an + lună + zi + oră + minut + secundă + tip de calendar);
  • spațiale (latitudine + longitudine + altitudine + sistem de referință);
  • URL.

ca și prin relații între ele, ca de pildă între o lucrare și autorul ei.

În plus, entităților li se vor putea asocia intrări de index elaborate, care să permită – pe lângă căutare – baleierile lexicografice, sistematice și temporale.

5. Culturalia: asigurarea calității datelor

Un principiu fundamental pentru controlul calității datelor mi se pare a fi: fiecărui enunț trebuie să i se consemneze proveniența, adică să fie limpede cine-și asumă responsabilitatea intelectuală pentru acea afirmație. Așadar (în principiu), pentru fiecare aserțiune să se știe cine a făcut-o, când și pe ce bază (i.e. autor + datare + referințe) !

Dacă pentru datele noi ce vor fi introduse în catalog acest principiu se poate aplica fără mari probleme, pentru multele înregistrări catalografice preexistente (adică cele moștenite) și care urmează a fi ingerate în noua bază de date, aplicarea lui va fi – desigur – foarte aproximativă.

Accesul la fiecare enunț ar trebui limitat la zone, cu niveluri de acces (stabilite de catalogator), atât la modificare cât și la citire. Astfel unele enunțuri pot fi confidențiale, în afara unui cerc de utilizatori, stabilit de către emitentul enunțului. O „zonă” ar fi definită de un domeniu (e.g. arheologie, terminologie, literatură idiș, artă suprarealistă) și o cuprindere (e.g. o anume instituție, o anume rețea, întreaga țară, global).

Așadar, utilizatori ar trebui să primească autorizări pe zone, cu niveluri de acces (atât în scriere, cât și în citire), de pildă între 1 și 9). De notat că un enunț provenit de la un „amator” (inclusiv o editură) ar trebui să stea în „carantină”, până este „certificat” de către un utilizator autorizat. Iar enunțurile în carantină ar trebui marcate explicit (de pildă afișate pe fond galben 🙂

Așadar, agenți care ar putea înregistra în Culturalia ar fi:

a. Administratori
b. Utilizatori:
…b.1. autorizați (per zonă și cu nivel de acces)
…b.2. public

Schematic, accesul la enunțuri (în scriere) ar arăta cam așa (în practică, mă aștept să fie mai complicat):

6. Dilemele

a. Cine ar trebui să acorde autorizările ?

  • asociațiile profesionale ?
  • Ministerul Culturii ?
  • Comisiile Naționale (ale Bibliotecilor și ale Muzeelor) ?

b. Cum „evoluează” nivelurile de acces, odată cu creșterea experienței unui catalogator ?

Sigur că o sursă de inspirație ar putea fi sistemul de autorizare pe care-l practică OCLC (de zeci de ani): https://www.oclc.org/developer/develop/authentication.en.html

c. GDPR [General Data Protection Regulation] ne afectează ?

Cum ?

Și în cazul catalogatorii „neprofesioniști” (adică a publicului contributor) responsabilitatea intelectuală e importantă, așadar:

  • nu tare ne-ar plăcea identități multiple (personas); sau nu prea contează ?
  • oare ar fi util să-i „înregistreze” biblioteca locală ?

7. Ce facem – în așteptare – ca să minimizăm durata „analizei” la dezvoltatorul softului platformei Culturalia

<paranteză>
Nu sunt de loc amator de fandoseli anglicizante, dar am folosit – à contre-coeur – terminologie englezească din două motive: 1) toate specificațiile pentru Culturalia ar trebui discutate și cu colegii din EuropeanaTech (https://pro.europeana.eu/network-association/special-interest-groups/europeanatech) și 2) e foarte posibil ca la licitația pentru dezvoltarea softului să participe și firme străine.
</paranteză>

a. Dezvoltăm o ontologie a bazei de date (provizoriu numită CPoT [CRM Properties of Things], și bazată pe CIDOC-CRM și FRBRoo).

Iată (de curiozitate) vârful ierarhiei claselor (cel puțin la momentul ăsta). Cele cu prefixul “crm” sunt preluate din CIDOC-CRM sau FRBRoo, iar cele cu prefixul “cpot” sunt adaosuri:

Notez că e nevoie de (relativ) multe adaosuri „locale”, deoarece nu ne putem permite să pierdem elemente foarte specifice, când convertim bazele de date moștenite.

Și iată un fragment din ierarhia proprietăților (se văd: numele proprietății, numele proprietății inverse, clasa-domeniu și clasa-codomeniu):

b. Am elaborat o propunere de format de serializare a metadatelor (provizoriu denumit CEF [Culturalia Exchange Format]).

Iată un exemplu de enunțuri, în formatul CEF (desigur, nu este destinat ochiului omului, ci programelor):

… nici nu arată mai rău decât MARC 🙂

c. Constituim o bază de date-prototip („proof-of-concept”).

Iată (de curiozitate) tabelele (în stadiul actual), într-o bază SqlServer:

d. Am început să elaborăm repertoriul „entităților contextuale” (i.e. fișiere de autoritate – cum le ziceam noi, cei de modă veche).

Iată o mostră, într-o formă rudimentară de înregistrare (un Google Sheet):

e. Convertim (experimental) date din bazele noastre (i.e. ale Institutului Național al Patrimoniului) curente.

Să sperăm că proiectul pornește cât de iute.

5. Proiectul E-Cultura: platforma „culturalia.ro” – catalogul național partajat

(NB. Publicat la 27 septembrie 2016)

5. Proiectul E-Cultura: platforma „culturalia.ro” – catalogul național partajat

Catalogul partajat național (un serviciu public mult întârziat la noi – americanii l-au „inventat” încă din anii ’70 !) ar fi un catalog eclectic, adică reunind atât cataloagele de bibliotecă, cât și cele de muzeu și de arhivă. Ideea e să fie dezvoltat pe baza inovațiile conceptuale și tehnice specifice vremurilor, cu alte cuvinte să fie „state of the art”, deoarece nu ne imaginăm că se vor mai obține fonduri de modernizare în următorii 10 ani. Și dă Doamne să mă înșel !

E important de menționat de la început: catalogul va avea o interfață web atât pentru citire, cât și pentru scriere. Dar platforma va oferi și o interfață programabilă (API, i.e. Application Programming Interface), astfel încât instituțiile care au sisteme informatice locale vor putea să le facă pe acestea să comunice cu catalogul național. Prin urmare vor putea să-și prezerve modul familiar de lucru, chiar dacă (re)utilizează date din catalogul partajat.

În plus, furnizorii de date catalografice vor avea control complet asupra permisiunilor de acces la acestea.

a)     Culturalia.ro – obiective specifice pentru public:

  • îmbunătățirea semnificativă a accesul public (online) la resursele culturale naționale;
  • combaterea „discriminării geografice”, adică sporirea posibilitățile de acces la resursele culturale naționale pentru cetățenii din localitățile fără instituții culturale (mai ales cei din mediul rural);
  • facilitarea elaborării bibliografiilor (de la coada lucrărilor academice) – în „colaborare” cu profesioniștii, i.e. atât citările cât și formatarea (e.g. conform Chicago Manual of Style).

b)     Culturalia.ro – obiective specifice pentru instituțiile memoriei:

  • înființarea unei platforme de partajare și cooperare, așadar de minimizare a duplicării de efort intelectual, deci de economisire de resurse publice (deficitare);
  • crearea posibilității ca muzeele/arhivele să beneficieze de înregistrările „entităților contextuale” (i.e. fișierele de autoritate) elaborate de biblioteci; și viceversa !
  • oferirea unui sistem (gratuit) de documentare a colecțiilor, mai ales cele mici (biblioteci școlare, instituționale, personale, case memoriale etc.), dar nu numai !
  • facilitarea împrumutului inter-instituțional;
  • facilitarea expunerii colecțiilor digitale (și) în Biblioteca Digitală Europeană (europeana.eu).

c)     Culturalia.ro – obiective specifice pentru editori/creatori:

  • facilitarea identificării deținătorilor de drepturi intelectuale;
  • facilitatea promovării lucrărilor proprii;
  • facilitarea elaborării fișelor CIP [Cataloguing in Publication].

Cu alte cuvinte, câteva scenarii de utilizare (use cases) întrevăzute ar putea fi:

a)     Pentru public:

  • un utilizator identifică în catalogul partajat național o resursă culturală care-l interesează și identifică și unde poate să o consulte;
  • un cercetător își elaborează bibliografia unui articol și reutilizează fișe bibliografice preexistente sau elaborează înregistrări bibliografice noi, folosindu-se de interfața online specifică, care-i ușurează procesul; în plus, la final, sistemul îi poate genera bibliografia completă, într-unul dintre formatele consacrate (e.g. Chicago Manual of Style, MLA, APA);
  • un cititor digitizează un text literar, îl expune online în Wikisource (http://ro.wikisource.org), îi elaborează (asistat) fișa bibliografică, făcând astfel textul regăsibil în catalogul partajat național;
  • un cititor își cataloghează biblioteca proprie, folosind la maximum fișele bibliografice  preexistente în catalogul național.

b)     Pentru instituțiile culturale:

  • înainte de a fișa o resursă culturală (carte, articol, piesă de muzeu etc.) catalogatorul/indexatorul dintr-o instituție a memoriei verifică dacă nu cumva resursa respectivă este deja fișată, iar dacă da, o reutilizează, eventual doar adăugând/modificând elemente ale  acesteia;
  • în procesul de fișare a unei resurse culturale (neafișate în prealabil), catalogatorul/indexatorul reutilizează înregistrări de entități contextuale (persoane, locuri, perioade, concepte etc.) deja elaborate;
  • un profesionist remarcă o eroare într-o fișă elaborată de un amator și o corectează;
  • o instituție a memoriei digitizează o piesă din colecția sa, o expune online, redactează  (asistat) fișa descriptivă a obiectului digital – plecând de la fișa corespondentului analogic – și o marchează pentru expunere în Europeana;
  • un arheolog înscrie (asistat) în Repertoriul Arheologic Național un sit arheologic nou descoperit;
  • un arhivist elaborează (asistat) un instrument de evidență [finding aid] pentru un fond, și-l face regăsibil în catalogul partajat național;
  • o bibliotecă identifică în catalogul național un material solicitat de către un cititor, dar pe care nu-l deține, și lansează o cerere de împrumut interbibliotecar, în beneficiul acestuia;
  • un curator proiectează o expoziție tematică și, folosind catalogul partajat național, identifică piese de interes la alți deținători, apoi lansează cereri de împrumut intermuzeal;
  • un anticariat sau o galerie de artă fișează (asistat) o carte sau un obiect, făcându-le astfel regăsibile în catalogul partajat național;
  • secretarul literar al unei instituții de spectacole înscrie (asistat) o premieră nouă în Repertoriul Teatral Național;
  • o instituție culturală actualizează seturile sale de date deschise expuse pe http://data.gov.ro/;
  • o bibliotecă înregistrează în catalogul partajat o carte, iar sistemul verifică (automat), folosindu-se de ISBN-ul respectivei ediții, dacă editura a depus cartea în Depozitul Legal. Iar dacă nu, sistemul avertizează (automat) atât editura, cât și Biblioteca Națională.

c)     Pentru editori/creatori:

  • un autor publică un articol online (sau offline) și îi elaborează (asistat) o înregistrare bibliografică, pentru a-l face regăsibil în catalogul partajat național; dacă articolul este expus online, îl înscrie astfel și în viitorul Depozit Legal Digital;
  • o editură elaborează (asistat) fișa CIP a unui volum pe care-l pregătește pentru difuzare, făcându-l astfel regăsibil în catalogul partajat național, chiar înaintea apariției pe piață;
  • editorul unei reviste elaborează (asistat) cuprinsul numărului următor, făcând astfel regăsibile articolele din acel număr în catalogul partajat național;
  • un curator proiectează o expoziție virtuală tematică, folosind resursele expuse în biblioteca digitală culturalia.ro;
  • un cercetător stochează – într-un format standard – un set de date obținute în urma unui experiment sau a unei cercetări de teren, îl fișează (asistat), făcându-l regăsibil în catalogul partajat național;
  • un artist expune online reproducerea digitală a unei creații proprii, o fișează (asistat), expunând-o în Biblioteca Digitală a Românei (culturalia.ro);
  • un critic literar constituie o antologie tematică, folosind texte expuse în biblioteca digitală culturalia.ro;
  • un editor dorește să publice o lucrare și – folosindu-se de fișierul de autoritate al autorilor – determină dacă respectiva lucrare este în domeniul public, iar dacă nu, are șansa să identifice deținătorul drepturilor de autor;
  • un critic literar publică o recenzie a unei cărți, îi expune fișa bibliografică în catalogul național partajat, dar face și o legătură (biunivocă) cu înregistrarea bibliografică a cărții; astfel cititorul recenziei are acces la carte, iar cel care consultă fișa cărții are acces la recenziile ei;
  • un teatrolog fișează o cronică pe care a publicat-o și o asociază cu spectacolul respectiv din Repertoriul Teatral Național.

Catalogul nu va pleca cu conținut zero. Ne vom strădui să migrăm cât mai multe dintre bazele de date culturale existente. Pentru început:

a)     vor fi ingerate bazele de date curatoriate de Institutul Național al Patrimoniului:

  • Inventarul Bunurilor Culturale Mobile Clasate;
  • Repertoriul Arheologic Național;
  • Repertoriul Premierelor Teatrale Postbelice;
  • Catalogul Colectiv Național al Incunabulelor;
  • Catalogul Colectiv Național al Cărții Vechi Românești;
  •  Ghidul Muzeelor;
  • Cronica Cercetărilor Arheologice;
  • Lăcașurile de Cult din România;
  • Bibliografia de Referință a Cărții Vechi;
  • Muzeul Virtual al Monumentelor Etnografice din Muzeele în Aer Liber;
  • Repertoriul Creației Muzicale Românești.

b)     vor fi preluate fișiere de autoritate consacrate pe plan mondial, e.g.:

  • AAT [Art and Architecture Thesaurus];
  • TGN [Thesaurus of Geographic Names];
  • RAMEAU [Répertoire d’autorité-matière encyclopédique et alphabétique unifié];
  • ULAN [Union List of Artist Names];
  • LCSH [Library of Congress Subject Headings].

c)     vor fi importate înregistrările metadatale de proveniență românească din Europeana.

Iar apoi, pe bază voluntară, desigur, se vor importa bazele catalografice ale instituțiile participante (fie ele MARC, fie non-MARC, fie DOCPAT etc.).

Aceste migrări vor fi însoțite – fără îndoială  – de chinul deduplicărilor !

Modelul de date al catalogului va fi și el – inevitabil – eclectic, deoarece nu ne permitem să pierdem nici o „nuanță” din metadatele foarte diverse existente. Dar nucleul său se va baza pe modele conceptuale solide, consacrate: CIDOC-CRM (http://www.cidoc-crm.org/official_release_cidoc.html), FRBRoo (http://www.cidoc-crm.org/frbr_drafts.html), EDM (http://pro.europeana.eu/share-your-data/data-guidelines/edm-documentation). În plus, o mare atenție se va acorda mecanismului de mapare a metadatelor la formatul specific al Bibliotecii Digitale Europene (europeana.eu), și anume EDM [Europeana Data Model].

Dan Matei (2016-09-27)

4. (Probabil) E-Cultura

(NB. Publicat la 22 septembrie 2016)

În sfârșit, proiectul E-Cultura are finanțare și e pe cale să fie lansat (i.e. „studiul de fezabilitate” – comandat de Ministerul Culturii – se apropie de finalizare). Se speră ca la începutul lui 2017, proiectul să fie efectiv pornit.

Reamintesc: proiectul este cuprins în „Programul Operațional Competitivitate” (2016-2020), acțiunea 2.3.3: Îmbunătățirea conținutului digital și a infrastructurii TIC sistemice în domeniul e-educație, e-incluziune, e-sănătate și e-cultură (c. 11 milioane euro) [1].

Obiectivele proiectului (ce va dura 3 ani) sunt:

A. Dezvoltarea unei platforme informatice online de catalog partajat și portal de bibliotecă digitală (culturalia.ro), disponibilă gratuit oricărei instituții culturale, precum și publicului larg. Ea va fi pandantul național al Bibliotecii Culturale Europene (europeana.eu).
B. Expunerea online în Biblioteca Digitală a României (culturalia.ro) și în Biblioteca Digitală Europeană (europeana.eu) a peste 650.000 750.000 de bunuri culturale (texte, imagini, audiograme, videograme, obiecte 3D).

Cele două obiective majore pot fi detaliate astfel:

A. Platforma „culturalia.ro”:

A.1. Dezvoltarea propriu-zisă a platformei informatice (i.e. a softului) pentru catalog partajat, platformă care va stoca metadatele (i.e. fișele descriptive ale) resurselor culturale.
A.2. Migrarea datelor din bazelor de date naționale ale patrimoniului cultural existente în prezent și „integrarea” lor în platformă. De notat că în catalogul partajat se vor putea înregistra atât bunuri fizice din colecțiile bibliotecilor, muzeelor și arhivelor, cât și exponate digitale, așadar catalogul va constitui și portalul bibliotecii digitale.
A.3. „Asimilarea” de vocabulare controlate consacrate pe plan internațional și elaborarea de echivalențe românești, pe măsura necesităților practice.

Subliniez: catalogul partajat culturalia.ro va fi un serviciu public oferit de Ministerul Culturii, adică va fi disponibil gratuit, practic oricui, desigur în grade diferite. Cu alte cuvinte, fiecare participant (instituție sau persoană) va decide cât și cum expune și altora.

.
B. Expunerea masivă în bibliotecile digitale „culturalia.ro” și „europeana.eu”:

B.1. Digitizarea propriu-zisă (scanarea, fotografierea) a minimum 200.000  250.000 de resurse culturale și catalogarea (fișarea) lor.
B.2. Catalogarea a încă minimum 450.000 500.000 de resurse culturale (mai ales articole) care sunt deja digitizate, dar nu sunt expuse individual.
B.3. Înființarea repozitului digital al platformei, în care vor putea fi stocate obiectele digitale expuse în portalul bibliotecii digitale.

De notat: obiectele digitale vor putea fi stocate (și accesate) astfel:

  • local, pe serverele furnizorului (dacă conexiunea sa la Internet este suficient de largă pentru a permite accederea comodă din exterior a obiectelor digitale voluminoase);
  • local, plus copii de siguranță pe platforma culturalia.ro;
  • doar pe platforma culturalia.ro.

NB. Chiar dacă obiectul digital este accesat de un utilizator de pe platforma culturalia.ro, accesul va fi contorizat în contul furnizorului.

.
Detalierea celor două obiective urmează în postări distincte.

.

Dan Matei (2016-09-22, corecții: 2016-09-30)

[1] http://www.fonduri-structurale.ro/stiri/15974/poc-2014-2020-ghidul-pentru-beneficiarii-publici-pentru-axa-2-lansat-spre-consultare

1. Proiectul „Culturalia – Biblioteca Digitală a Românei și Catalogul Partajat Național”. Preambul

(NB. Publicat la 3 iunie 2015)

 Obiectivele generale ale proiectului sunt: 

  • să se constituie o bază de date unificată a resurselor culturale (digitale și analogice) existente în România;
  • să se dezvolte o bibliotecă digitală națională, pandant al Bibliotecii Digitale Europene (europeana.eu);
  • să se ofere un portal către (asimptotic) toate resursele culturale online expuse în România;
  • să se reducă deficitul de resurse culturale românești expuse în Biblioteca Digitală Europeană (europeana.eu);
  • să se capteze (asimptotic) toate sursele de informație catalografică, inclusiv prin convertirea resurselor catalografice moștenite [legacy];
  • să se realizeze informatizarea (gratuită) a colecțiilor instituțiilor memoriei (mai ales cele ale bibliotecilor și muzeelor mici);
  • să se economisească – prin partajarea/reutilizarea informației catalografice existente — timp de muncă calificată și resurse bănești;
  • să se ofere o interfață programabilă [API] la baza de date unificată, pentru a permite dezvoltarea independentă de aplicații specifice pentru dispozitive mobile;
  • să se faciliteze împrumutul inter-instituțional de resurse culturale (atât inter-bibliotecar, cât și inter-muzeal – pentru organizarea de expoziții);
  • să se ofere instituțiilor memoriei spațiu de stocare de rezervă pentru obiectele lor digitale;
  • să se implementeze un mecanism de identificare a deținătorilor de drepturi intelectuale;
  • să se inițieze depozitul legal digital;
  • să se instituie mecanismul de urmărire a exporturilor/importurilor (definitive și temporare) a bunurilor culturale;
  • să se faciliteze elaborarea dosarelor de clasare ale bunurilor culturale;
  • să se realizeze informatizarea documentării proceselor de conservare/restaurare a bunurilor culturale.

Câteva scenarii de utilizare [use-cases] ale bazei de date, suport al catalogului partajat: 

  • un utilizator (amator sau profesionist) identifică și consultă în biblioteca digitală o resursă care-l interesează (e.g. carte, articol, obiect de muzeu, document de arhivă);
  • un utilizator identifică în catalogul național o resursă (analogică) care-l interesează și-i identifică și deținătorul, unde poate să o consulte;
  • un muzeograf sau bibliotecar elaborează (asistat) dosarul de clasare a unui bun cultural mobil și acesta e expus online, ceea ce face ca membrii Comisiei Naționale a Muzeelor să-l poată consulta înainte de ședința în care se votează clasarea;
  • o instituție a memoriei digitizează o piesă din colecția sa, o expune online, derivă (asistat) fișa descriptivă a obiectului digital din fișa corespondentului analogic și o marchează pentru expunere în Europeana;
  • un expert actualizează (asistat) fișa descriptivă a unui monument înscris în Lista Monumentelor Istorice;
  • un arheolog înscrie (asistat) un sit arheologic nou descoperit în Repertoriul Arheologic Național;
  • înainte de a fișa o resursă culturală (carte, articol, piesă de muzeu etc.) catalogatorul/indexatorul dintr-o instituție a memoriei verifică dacă nu cumva resursa respectivă este deja fișată, iar dacă da, eventual doar adaugă/modifică elemente ale  acesteia;
  • în procesul de fișare a unei resurse culturale (nefișate în prealabil), catalogatorul/indexatorul reutilizează entități contextuale (persoane, locuri, perioade, concepte etc.) deja elaborate;
  • un arhivist elaborează (asistat) un instrument de evidență [finding aid] pentru un fond, și-l face regăsibil în catalogul național;
  • o bibliotecă nu dispune de un material solicitat de un cititor, dar îl identifică în catalogul național și-l împrumută de la deținător, în beneficiul cititorului;
  • un curator proiectează o expoziție tematică și, folosind catalogul național, identifică piese de interes la alți deținători, pe care le poate împrumuta pentru expoziția sa;
  • un cercetător își elaborează bibliografia unui articol și reutilizează trimiteri bibliografice preexistente sau elaborează înregistrări bibliografice noi, dar folosindu-se de interfața online specifică, care-i ușurează procesul; în plus, la final, sistemul îi poate genera bibliografia completă, într-unul dintre formatele consacrate (e.g. Chicago Manual of Style, MLA, APA);
  • un autor publică un articol online (sau offline) și îi elaborează (asistat) o înregistrare bibliografică, pentru a-l face regăsibil în catalogul național; dacă articolul este expus online, îl înscrie astfel și în Depozitul Legal Digital;
  • o editură elaborează (asistat) fișa CIP a unui volum pe care-l pregătește pentru difuzare, făcându-l astfel regăsibil în catalogul național, chiar înaintea apariției pe piață;
  • un anticariat sau o galerie de artă fișează (asistat) o carte sau un obiect, făcându-le astfel regăsibile în catalogul național;
  • editorul unei reviste elaborează (asistat) cuprinsul numărului următor, făcând astfel regăsibile articolele din acel număr în catalogul național;
  • un amator entuziast digitizează un text literar și-l expune online în Wikisource[1], îi elaborează (asistat) și o fișă bibliografică, făcând textul regăsibil în catalogul național;
  • secretarul literar al unei instituții de spectacole înscrie (asistat) o premieră nouă în Repertoriul Teatral Național;
  • o instituție culturală actualizează seturile sale de date deschise expuse pe http://data.gov.ro/;
  • un cercetător stochează – într-un format standard – un set de date obținute în urma unui experiment sau a unei cercetări de teren, îl fișează (asistat), făcându-l regăsibil în catalogul național;
  • un artist expune online reproducerea digitală a unei creații proprii, o fișează (asistat), făcând-o regăsibilă în catalogul național;
  • un bibliograf profesionist remarcă o eroare într-o fișă elaborată de un amator și o corectează;
  • un curator proiectează o expoziție virtuală tematică, folosind resursele expuse în biblioteca digitală;
  • un critic literar constituie o antologie tematică, folosind texte expuse în biblioteca digitală;
  • un autor/moștenitor semnalează operele asupra cărora deține drepturi intelectuale;
  • un editor dorește să publice o operă și află statutul acesteia (sub copyright, orfană sau în domeniul public) și – dacă e cazul – identifică deținătorul drepturilor intelectuale asupra operei;
  • un cetățean dorește să exporte un bun cultural și inițiază (online) cererea de export, iar autoritatea îndreptățită constituie dosarul de clasare sau eliberează certificatul de export, după caz.

Dan Matei

[03.06.2015]

[1] http://ro.wikisource.org

2. „Culturalia” – Cerințele funcționale

(NB. Publicat la 10 mai 2015)

Propunerea proiectului „Culturalia – Biblioteca Digitală a Românei și Catalogul Partajat Național” – în cadrul „Programului Operațional Competitivitate 2014-2020” [POC], Acțiunea 2.3.3 „Îmbunătățirea conținutului digital și a infrastructurii TIC sistemice în domeniile e-educație, e-incluziune, e-sănătate, și e-cultură[1]

(propus de Institutul Național al Patrimoniului, [INP] pt. intervalul 2016 – 2020 [2])

Motivație

Pentru:

  • a urma Recomandarea Comisiei Europene C(2011) 7579;
  • a îmbunătăți semnificativ accesul public (online) la resursele culturale naționale;
  • a oferi o platformă de partajare și cooperare pentru profesioniștii din instituțiile memoriei;
  • a facilita ingerarea metadatelor (i.e. a fișelor descriptive a) resurselor culturale românești în Biblioteca Digitală Europeană (europeana.eu),
  • a îmbunătăți accesul nevăzătorilor la resursele culturale ale României,
  • a spori oferta de material cultural reutilizabil ca material didactic,

proiectul urmărește (în esență):

  1. dezvoltarea unei platforme informatice online de catalog partajat și bibliotecă digitală, disponibilă tuturor instituțiilor culturale din România și publicului larg;
  2. digitizarea și expunerea online (până în 2020) în Biblioteca Digitală a României (culturalia.ro) și în Biblioteca Digitală Europeană (europeana.eu) a peste 1 milion de resurse culturale (texte, imagini, audiograme, videograme).

A. Dezvoltarea platformei online culturalia.ro

Soluția de principiu propusă este realizarea unei platforme online centralizate, administrate de agregatorul național, dar oferită spre utilizare gratuită atât instituțiilor memoriei (biblioteci, muzee, arhive), cât și publicului. Această platformă urmează să susțină atât biblioteca digitală (în sens larg, adică bibliotecă/muzeu/arhivă), cât și catalogul partajat al instituțiilor memoriei, adică ar permite atât alimentarea partajată/cooperativă a acestora, cât și facilitarea accesului public la acestea, pe lângă interoperabilitatea cu Biblioteca Digitală Europeană (europeana.eu).

Tehnic, platforma ar urma să fie „state-of-the-art” (folosind tehnologiile cloud), avându-se în vedere că va trebui să fie operațională măcar 10 ani, în condițiile rapidelor evoluții tehnologice. Ea va trebui să suporte volume semnificative de date. Softul dezvoltat pentru această platformă va fi disponibil în regim open-source, sub licența europeană EUPL [European Union Public Licence], așadar va putea fi liber și gratuit folosit/adaptat/modificat și de alți operatori culturali.

Utilizarea acestei platforme online va degreva instituțiile culturale (mai ales cele mici) de necesitatea de a achiziționa/întreține un sistem informatic specific (e.g. sistem integrat de bibliotecă, sistem de management/gestiune a colecțiilor muzeale) propriu. Desigur, ele vor continua să-și administreze cataloagele și bibliotecile digitale, chiar dacă aceste sunt integrate în baza de date centrală, administrată de agregatorul național.

Mai mult, platforma va permite expunerea de „conținut generat de utilizatori” [UGC – user-generated content].

În plus, platforma propusă va integra bazele naționale de date (curatoriate de către Institutul Național al Patrimoniului), cum ar fi:

  • Inventarul Bunurilor Culturale Mobile Clasate,
  • Lista Monumentelor Istorice,
  • Repertoriul Arheologic Național,
  • Repertoriul Teatral Național,
  • Catalogul Colectiv Național al Incunabulelor,
  • Catalogul Colectiv Național al Cărții Vechi Românești,
  • Ghidul Muzeelor,
  • Cronica Cercetărilor Arheologice,
  • Lăcașurile de Cult din România,
  • Bibliografia de Referință a Cărții Vechi,
  • Repertoriul Creației Muzicale Românești.
  • Muzeul Virtual al Monumentelor Etnografice din Muzeele în Aer Liber,

Așadar, platforma va oferi servicii publice comparabile cu ale altor platforme naționale similare, cum ar fi:

sau transnaționale, cum ar fi:

Platforma va trebui să ofere:

  • un punct generic (și mai multe specifice) de acces public la informații privind patrimoniul cultural — liber la cele de interes public și restricționat la cele confidențiale — inclusiv de pe dispozitive mobile;
  • interfețe programabile deschise (RESTful API [3]) sistemelor informatice care doresc să utilizeze informații privind patrimoniul cultural (e.g. enciclopedii online, expoziții virtuale, biblioteci digitale specializate);
  • mecanisme de schimb de date cu sistemele similare din Europa și din lume, mai ales cu Biblioteca Digitală Europeană (europeana.eu);
  • mecanisme care să permită personalului instituțiilor culturale să coopereze la elaborarea metadatelor (adică a fișelor descriptive), evitând astfel duplicarea eforturilor de catalogare/indexare a resurselor culturale: cărți, monede, „entitățile contextuale” (persoane, locuri, evenimente, concepte etc.) etc.;
  • proceduri de asistare a instituțiilor culturale la elaborarea dosarelor de clasare a bunurilor culturale;
  • mecanisme de conversie (și integrare) a materialului catalografic moștenit, din formate răspândite (e.g. UNIMARC [4], MARC21 [5], DOCPAT [6], EAD [7]).

Rezultatele concrete așteptate în urma implementării acestei platforme, sunt:

  • o interfață-utilizator publică generică pentru acces online la resursele culturale – incluzând baleiere cartografică și cronologică (timeline);
  • interfețe-utilizator în limbile română, maghiară și engleză (din start);
  • interfețe programabile (API [Application Programming Interface]) pentru agenții soft;
  • interfețe-utilizator pentru administrarea, respectiv expunerea online a cataloagelor colecțiilor instituțiilor memoriei (obiecte de muzeu, texte, hărți etc.) pe saitul bibliotecii/ muzeului/arhivei;
  • un mecanism care să faciliteze instituțiilor publice expunerea de seturi de date deschise, pe saitul guvernamental specific: http://data.gov.ro;
  • mecanisme standard de expunere offline de date (e.g. OAI-PMH [Open Archives Initiative Protocol for Metadata Harvesting] [8]).

Din rațiuni de interoperabilitate, platforma:

  • va fi construită pe un model conceptual care să permită interpretarea unitară a metadatelor folosite în instituțiile memoriei; acesta se va baza pe modelele conceptuale Conceptual Reference Model [CIDOC-CRM] [9] (ISO 21127:2014) pentru domeniul muzeal și Functional Requirements for Bibliographic Data – object-oriented definition and mapping to FRBRer [FRBRoo] [10] pentru domeniul biblioteconomic;
  • va folosi drept cadru de interoperabilitatea modelul de date EDM [Europeana Data Model] [11], adoptat de Biblioteca Digitală Europeană (europeana.eu);
  • comunicarea cu baza de date-suport se va face printr-o interfață ODBC [12];
  • va permite exportul/importul de date în formate de serializare standard, cum ar fi JSON-LD [13], putând astfel să se profite de datele deschise oferite liber de mari instituții culturale ale lumii, cum ar fi British Museum [14] sau British Library [15], precum și de reputatele vocabulare controlate dezvoltate de Fundația Getty [16].

Alte cerințe specifice:

  • codul-sursă specific elaborat pentru implementarea platformei va fi disponibil sub licența EUPL v.1.1. [European Union Public Licence] [17], promovată de Comisia Europeană;
  • nu se vor folosi la implementarea platformei componente soft proprietare, și trebuie să fie disponibile sub licențe deschise;
  • dezvoltarea platformei se va face gradual, astfel încât aceasta să poată fi folosită pentru achiziție de date încă din primul an;
  • dezvoltarea platformei se va face în continuu contact cu beneficiarul (agregatorul național), astfel încât acesta să-i poată monitoriza evoluția și să fie de la început familiarizat cu codul-sursă, pentru a se minimiza dependența ulterioară de dezvoltator.

Platforma va crea și cadrul pentru instituirea unui depozit legal pentru resursele digitale.


 

 

B. Digitizarea și expunerea

În cadrul proiectului se urmărește digitizarea și expunerea online a peste 1 milion de resurse culturale.

În acest context, prin digitizare nu se înțelege doar conversia analog-digital (fotografiere, scanare etc.), ci și elaborarea metadatelor descriptive (catalogare/indexare) pentru obiectele digitale rezultate în urma conversie. În destule cazuri, elaborarea metadatelor necesită calificări superioare (bibliografi, istorici de artă, teatrologi, arheologi etc.) și deci este mai costisitoare decât simpla conversie analog-digital.

Catalogarea/indexarea adecvată — ca și regăsirea/consultarea online — vor necesita elaborarea de vocabulare controlate (pentru entități contextuale: persoane, locuri, concepte, evenimente, epoci etc.) multilingve și alinierea acestora cu vocabulare controlate culturale, consacrate pe plan internațional, cum ar fi:

  • AAT [Art and Architecture Thesaurus];
  • TGN [Thesaurus of Geographic Names];
  • RAMEAU [Répertoire d’autorité-matière encyclopédique et alphabétique unifié];
  • ULAN [Union List of Artist Names];
  • LCSH [Library of Congress Subject Headings].

Obiectivul specific al proiectului este de a digitiza și de a expune în culturalia.ro și europeana.eu, următoarele:

Exponate digitale

2016

2017

2018

2019

2020

TOTAL

Cărți

2.500

2.500

2.500

2.500

2.500

12.500

Articole

100.000

100.000

100.000

100.000

100.000

500.000

Fotografii

50.000

50.000

50.000

50.000

50.000

250.000

Documente

50.000

50.000

50.000

50.000

50.000

250.000

Audiograme

20.000

20.000

20.000

20.000

20.000

100.000

Videograme

10.000

10.000

10.000

10.000

10.000

50.000

TOTAL

232.500

232.500

232.500

232.500

232.500

1.162.500

Pentru a reuși procesarea unui volum atât de mare, se impune externalizarea atât a operațiilor de conversie analog-digital (e.g. scanare, fotografiere), cât și a celor de catalogare/indexare, indiferent de subordonarea deținătorilor materialelor analogice (biblioteci, muzee, TVR, SRR).

Externalizarea se va face pe mai multe loturi, diferențiat atât pe categorii de materiale, cât și geografic.

Pentru o calitate adecvată a metadatelor (adică a catalogării/indexării), se va impune contractorilor condiții de calificare a specialiștilor, astfel încât aceștia trebuiască să angajeze chiar personal din instituțiile deținătoare, cunoscători direcți ai materialelor digitizate.

Separat, se va externaliza altor companii controlul de calitate, atât a conversiei, cât și a catalogării/indexării.

 


C. Dotări

Dotările cu echipament de calcul sunt relativ modeste, deoarece baza de date va fi găzduită într-un centru de date (de preferință guvernamental), folosind tehnologii cloud.

Pentru a facilita accesul nevăzătorilor la conținutul bibliotecii digitale, proiectul prevede acordarea a câte 200 de subvenții individuale pe an, pentru achiziția de cititoare de ecran.

 


D. Dezvoltarea de aplicații specifice

Pentru a-i extinde aria culturală și pentru valorificarea superioară a conținutului bibliotecii digitale, se prevăd dezvoltări soft specifice:

  • aplicații pentru dispozitive mobile, pentru achiziția de date pe teren (e.g. date arheologice, monumente, depozite muzeale);
  • galerii/expoziții virtuale cu material cultural specific comunităților etnice;
  • aplicații pentru dispozitive mobile, specifice comunităților etnice;
  • aplicații pentru dispozitive mobile , specifice pentru nevăzători.

 


E. Remarci finale

Comisia Europeană consideră proiectul Bibliotecii Digitale Europene (europeana.eu) cel mai important proiect cultural al său. Este deci firesc ca și Biblioteca Digitală a României (culturalia.ro) să fie considerată un proiect național major. Pe lângă semnificația culturală, trebuie ținut cont și de previzibila sa mare vizibilitate publică și de marele său potențial de material didactic.

În plus, catalogarea/indexarea partajată a colecțiilor instituțiilor de cultură va duce și la o semnificativă economie de muncă calificată și deficitară, având în vedere lipsa cronică de personal de specialitate din muzeele și bibliotecile din România. Mai mult, reutilizând metadatele (i.e. fișele descriptive) elaborate de marile instituții culturale, muzeele și bibliotecile mici vor putea să-și descrie colecțiile la un nivel calitativ comparabil cu cel al instituțiilor naționale.

Din punct de vedere tehnologic, și ținând cont de rapiditatea cu care evoluează tehnologiile informatice, proiectul trebuie realizat la nivel de vârf, pentru a nu necesita schimbări majore, măcar 5 ani.

În plus, deoarece platforma soft va fi open-source, codul-sursă va putea fi disponibil liber/gratuit pentru dezvoltări de alte produse.

Dan Matei

[1] www.poscce.research.ro/uploads/documente-programare/programul-opera-ional-competitivitate-1.pdf (pag. 85: E-cultură)

[2] bineînțeles, comentariile și observațiile critice sunt binevenite.

[3] http://en.wikipedia.org/wiki/Representational_state_transfer

[4] http://www.ifla.org/publications/unimarc-formats-and-related-documentation

[5] http://www.loc.gov/marc/bibliographic/

[6] http://cimec.ro/Metodologice/Programul-DOCPAT.html

[7] http://www.loc.gov/ead/

[8] www.openarchives.org/OAI/openarchivesprotocol.html

[9] www.cidoc-crm.org/official_release_cidoc.html

[10] www.cidoc-crm.org/docs/frbr_oo/frbr_docs/FRBRoo_V2.0_draft.pdf

[11] http://pro.europeana.eu/documents/900548/bb6b51df-ad11-4a78-8d8a-44cc41810f22

[12] http://en.wikipedia.org/wiki/Open_Database_Connectivity

[13] www.w3.org/TR/json-ld

[14] http://collection.britishmuseum.org/

[15] http://www.bl.uk/bibliographic/datafree.html

[16] http://vocab.getty.edu/

[17] http://joinup.ec.europa.eu/system/files/EN/EUPL%20v.1.1%20-%20Licence.pdf