Author Archives: Dan Matei

8. Viitorul catalog partajat național (culturalia.ro). Sugestii/dileme privind organizarea datelor catalografice și a mecanismului de întreținere a calității acestora

(NB. Publicat la 27 mai 2018)

(expunere la Conferința de primăvară a ANBPR, Bacău, 18.05.2018)

1. Proiectul E-Cultura: stadiul actual

Reamintesc: Institutul Național al Patrimoniului [INP] – din postura sa de agregator național pentru Biblioteca Digitală Europeană (europeana.eu) – a propus acest proiect încă din 2014, ca parte a Agendei Digitale pentru România. El a fost inclus în Programul Operațional Competitivitate [POC] și anume în Acțiunea 2.3.3 „Îmbunătățirea conținutului digital și a infrastructurii TIC sistemice în domeniul e-educație, e- incluziune, e-sănătate și e-cultură” și urmează a fi finanțat cu circa 11 milioane de euro, pentru trei ani.

Obiectivele proiectului sunt:

  • Dezvoltarea unei platforme informatice online de catalog național partajat și portal de bibliotecă digitală (Culturalia), disponibilă gratuit oricărei instituții culturale, precum și publicului larg. (Aceasta urmează a fi pandantul național al Bibliotecii Digitale Europene europeana.eu).
  • Expunerea online în Biblioteca Digitală a României (culturalia.ro) și în Biblioteca Digitală Europeană (europeana.eu) a circa 550.000 de bunuri culturale (texte, imagini, audiograme, videograme, obiecte 3D).

(În sfârșit), proiectul este în faza de contractare între Ministerul Fondurilor Europene și Ministerul Culturii.

2. Europeana vs. (imaginata) Culturalia

2.1. Similitudini

  • Ambele sunt (platforme informatice pentru) cataloage „universaliste” de resurse culturale, adică includ înregistrări catalografice (i.e. metadate) atât provenite din biblioteci, cât și din muzee, arhive, teatre etc. Cu alte cuvinte, descrieri pentru orice fel de resurse culturale.
  • Ambele oferă baleiere fațetată.

Astfel arată acest fel de baleiere în portalul Europeana (https://www.europeana.eu/portal/en/search?q=*&view=grid):

Dar, în Culturalia, am prefera să arate mai sofisticat, chiar mai sofisticat decât în biblio.ro (exemplu: căutarea “Naum”):

2.2. Diferențe

Europeana Culturalia
Este un catalog colectiv, i.e. este alimentat cu date offline. Deocamdată furnizorii sunt doar instituții culturale. Ar fi un catalog partajat, i.e. alimentat cu date online și la descrierea unei resurse pot contribui mai mulți catalogatori. Furnizorii ar fi atât instituțiile culturale, cât și publicul larg. De notat că americanii au un asemenea catalog de aproape 40 de ani (http://www.worldcat.org/). Dar și basarabenii au unul de aproape 20 de ani (http://sibimol.bnrm.md/ro/)
Conține metadate (i.e. fișe descriptive) de resurse culturale digitale expuse online. Ar conține metadate (i.e. fișe descriptive) atât pentru resurse culturale digitale expuse online, cât și pentru resurse culturale fizice, aflate în colecțiile instituțiilor. În definitiv, din perspectiva fișei catalografice, ce mi-e că „adresa” unei resurse culturale este http://www.cimec.ro/pdf/dl.asp?filename=Lambrino-Marcelle-Es-vases-archaiques-d-Histria.pdf sau “BNaR, cota CDR 224”.
Obiectele digitale descrise în catalog se află în repozite digitale locale (i.e. pe saiturile furnizorilor). Obiectele digitale s-ar afla atât în repozite locale, i.e. pe saiturile furnizorilor, cât și (opțional) în repozitul digital central. Consecință colaterală: ar fi unde să se stocheze material digital expus de către public (așa numitul UGC [User Generated Content]).
(Din punct de vedere al modelului de date și al formatului intern) conține înregistrări metadatale (fișe catalografice) „clasice”. Ar conține enunțuri (i.e. fișe catalografice „deconstruite”) interconectate, adică în paradigma LOD [Linked Open Data], paradigme încă ne-uzuală, dar aplicată deja în mari instituții din lume, e.g.:

Entitățile contextuale (concepte, persoane, locuri, perioade etc.): sunt încorporate în înregistrările catalografice, în maniera clasică. Entitățile contextuale ar fi „autonome” (i.e. datele catalografice ar fi pe același plan cu cele de autoritate).

 

 

Ontologia subiacentă este EDM [Europeana Data Model] (https://pro.europeana.eu/resources/standardization-tools/edm-documentation) Ontologia subiacentă ar fi una eclectică (dar mult mai granulară), bazată pe modelele conceptuale standard:

Oferă doar căutare. Ar oferi pe lângă căutare și baleieri alfabetică, sistematică, cronologică, și spațială.

Exemplu de baleiere spațială (imitabil): INP/CIMEC: muzee și colecții (http://map.cimec.ro/Mapserver/):

Și un exemplu de baleiere cronologică (imitabil): WorldCat Identities – căutare “Moliere” (https://www.worldcat.org/identities/lccn-n79043851/):

3. Culturalia: (doar) catalog !

Platforma Culturalia nu-și propune să fie un „sistem integrat de bibliotecă” și nici un „sistem integrat de muzeu”. Așadar, va oferi doar catalog. Cu alte cuvinte, nu va putea fi folosită pentru a gestiona împrumuturi sau achiziții.

Însă platforma va oferi o interfață programabilă (i.e. API [Application Programming Interface]), așadar producătorii de soft vor putea dezvolta și sisteme „dezintegrate”, cu alte cuvinte, vor putea dezvolta sisteme locale care să ofere funcționalitățile necesare gestionării unei colecții, intefațându-le cu catalogul național partajat.

4. Culturalia: tipurile de enunțuri propuse

Entitățile culturale înregistrate în catalogul Culturalia ar urma să fie descrise prin aserțiuni de următoarele tipuri:

  • textuale (text sau XML + limbă);
  • booleene;
  • numerice (întreg sau real + unitate de măsură);
  • temporale (an + lună + zi + oră + minut + secundă + tip de calendar);
  • spațiale (latitudine + longitudine + altitudine + sistem de referință);
  • URL.

ca și prin relații între ele, ca de pildă între o lucrare și autorul ei.

În plus, entităților li se vor putea asocia intrări de index elaborate, care să permită – pe lângă căutare – baleierile lexicografice, sistematice și temporale.

5. Culturalia: asigurarea calității datelor

Un principiu fundamental pentru controlul calității datelor mi se pare a fi: fiecărui enunț trebuie să i se consemneze proveniența, adică să fie limpede cine-și asumă responsabilitatea intelectuală pentru acea afirmație. Așadar (în principiu), pentru fiecare aserțiune să se știe cine a făcut-o, când și pe ce bază (i.e. autor + datare + referințe) !

Dacă pentru datele noi ce vor fi introduse în catalog acest principiu se poate aplica fără mari probleme, pentru multele înregistrări catalografice preexistente (adică cele moștenite) și care urmează a fi ingerate în noua bază de date, aplicarea lui va fi – desigur – foarte aproximativă.

Accesul la fiecare enunț ar trebui limitat la zone, cu niveluri de acces (stabilite de catalogator), atât la modificare cât și la citire. Astfel unele enunțuri pot fi confidențiale, în afara unui cerc de utilizatori, stabilit de către emitentul enunțului. O „zonă” ar fi definită de un domeniu (e.g. arheologie, terminologie, literatură idiș, artă suprarealistă) și o cuprindere (e.g. o anume instituție, o anume rețea, întreaga țară, global).

Așadar, utilizatori ar trebui să primească autorizări pe zone, cu niveluri de acces (atât în scriere, cât și în citire), de pildă între 1 și 9). De notat că un enunț provenit de la un „amator” (inclusiv o editură) ar trebui să stea în „carantină”, până este „certificat” de către un utilizator autorizat. Iar enunțurile în carantină ar trebui marcate explicit (de pildă afișate pe fond galben 🙂

Așadar, agenți care ar putea înregistra în Culturalia ar fi:

a. Administratori
b. Utilizatori:
…b.1. autorizați (per zonă și cu nivel de acces)
…b.2. public

Schematic, accesul la enunțuri (în scriere) ar arăta cam așa (în practică, mă aștept să fie mai complicat):

6. Dilemele

a. Cine ar trebui să acorde autorizările ?

  • asociațiile profesionale ?
  • Ministerul Culturii ?
  • Comisiile Naționale (ale Bibliotecilor și ale Muzeelor) ?

b. Cum „evoluează” nivelurile de acces, odată cu creșterea experienței unui catalogator ?

Sigur că o sursă de inspirație ar putea fi sistemul de autorizare pe care-l practică OCLC (de zeci de ani): https://www.oclc.org/developer/develop/authentication.en.html

c. GDPR [General Data Protection Regulation] ne afectează ?

Cum ?

Și în cazul catalogatorii „neprofesioniști” (adică a publicului contributor) responsabilitatea intelectuală e importantă, așadar:

  • nu tare ne-ar plăcea identități multiple (personas); sau nu prea contează ?
  • oare ar fi util să-i „înregistreze” biblioteca locală ?

7. Ce facem – în așteptare – ca să minimizăm durata „analizei” la dezvoltatorul softului platformei Culturalia

<paranteză>
Nu sunt de loc amator de fandoseli anglicizante, dar am folosit – à contre-coeur – terminologie englezească din două motive: 1) toate specificațiile pentru Culturalia ar trebui discutate și cu colegii din EuropeanaTech (https://pro.europeana.eu/network-association/special-interest-groups/europeanatech) și 2) e foarte posibil ca la licitația pentru dezvoltarea softului să participe și firme străine.
</paranteză>

a. Dezvoltăm o ontologie a bazei de date (provizoriu numită CPoT [CRM Properties of Things], și bazată pe CIDOC-CRM și FRBRoo).

Iată (de curiozitate) vârful ierarhiei claselor (cel puțin la momentul ăsta). Cele cu prefixul “crm” sunt preluate din CIDOC-CRM sau FRBRoo, iar cele cu prefixul “cpot” sunt adaosuri:

Notez că e nevoie de (relativ) multe adaosuri „locale”, deoarece nu ne putem permite să pierdem elemente foarte specifice, când convertim bazele de date moștenite.

Și iată un fragment din ierarhia proprietăților (se văd: numele proprietății, numele proprietății inverse, clasa-domeniu și clasa-codomeniu):

b. Am elaborat o propunere de format de serializare a metadatelor (provizoriu denumit CEF [Culturalia Exchange Format]).

Iată un exemplu de enunțuri, în formatul CEF (desigur, nu este destinat ochiului omului, ci programelor):

… nici nu arată mai rău decât MARC 🙂

c. Constituim o bază de date-prototip („proof-of-concept”).

Iată (de curiozitate) tabelele (în stadiul actual), într-o bază SqlServer:

d. Am început să elaborăm repertoriul „entităților contextuale” (i.e. fișiere de autoritate – cum le ziceam noi, cei de modă veche).

Iată o mostră, într-o formă rudimentară de înregistrare (un Google Sheet):

e. Convertim (experimental) date din bazele noastre (i.e. ale Institutului Național al Patrimoniului) curente.

Să sperăm că proiectul pornește cât de iute.

7. E-Cultura: întrebări și răspunsuri

(NB. Publicat la 8 noiembrie 2016)

7. E-Cultura: întrebări și răspunsuri

Într-o discuție la Biblioteca Națională având drept subiect Proiectul E-Cultura, mi s-au pus câteva întrebări legitime. Sper ca răspunsurile să fie edificatoare și mai sper ca ele să lămurească nu doar bibliotecarii din Biblioteca Națională.

1. Care este calitatea dvs. în proiectul E-Cultura ?

Instituția mea, Institutul Național al Patrimoniului [INP] – în calitate de agregator național pentru Biblioteca Digitală Europeană (europeana.eu [1]) – a propus acest proiect în 2014, ca parte a Agendei Digitale pentru România. El a fost inclus în Programul Operațional Competitivitate [POC] [2], și anume în Acțiunea 2.3.3 „Îmbunătățirea conținutului digital și a infrastructurii TIC sistemice în domeniul e-educație, e- incluziune, e-sănătate și e-cultură”. Fiind responsabil în cadrul INP pentru activitatea de agregare, am fost unul dintre cei care au formulat tema proiectului. Pe durata desfășurării proiectului, probabil voi fi persoana de legătură cu Biroul Europeana de la Haga.

2. Dar calitatea Ministerului Culturii ?

În cadrul programului POC – Axa prioritară 2, Ministerul Culturii este desemnat „partener implicat pentru domeniul e-cultură”.

3. Care sunt partenerii care au acceptat oficial invitația de a participa la acest proiect ?

Având în vedere că proiectul este abia în fază de elaborare a studiului de fezabilitate, este prematur să se vorbească de invitații oficiale. Opțiuni au fost exprimate de majoritatea muzeelor naționale, de Arhivele Naționale, de Arhiva de Filme, de Societatea Română de Radiodifuziune, de Televiziunea Română, de Biblioteca Metropolitană București, de Institutul Național al Patrimoniului, de BCU Iași și de încă câteva instituții culturale.

4. Proiectul își propune realizarea unei platforme de bibliotecă digitală, a unei baze de date, a unui portal ?

Toate la un loc… În esență, platforma informatică culturalia.ro va conține un catalog partajat de resurse culturale (texte, imagini, audiograme, videograme, 3D), atât fizice, cât și digitale, cu alte cuvinte metadate (i.e. fișe descriptive). Metadatele asociate resurselor digitale (care vor conține și link-uri către aceste resurse) vor constitui biblioteca digitală. Spre deosebire însă de europeana.eu – a cărui pandant național va fi –, culturalia.ro vă putea stoca și obiecte digitale propriu-zise. Adică furnizorii – care vor dori ! – vor putea să-și păstreze în repozitul digital al platformei obiectele digitale (sau doar copii de siguranță ale acestora). Așadar, platforma poate fi văzută și ca un portal către resursele culturale digitale ale contributorilor.

5. Sistemul pe care îl propuneți nu prevede în niciun fel circuitul de achiziție și de evidență, nici al documentelor în format tradițional, nici al documentelor digitizate. Cum își pot gestiona bibliotecile/instituțiile mici colecțiile proprii în acest sistem ?

Platforma Culturalia nu-și propune să înlocuiască sistemele integrate de bibliotecă/muzeu. Contributorii vor putea să-și facă evidența ca în orice catalog informatizat. Desigur, când se va proiecta tehnic sistemul, bibliotecarii vor fi consultați, pentru a se identifica cerințele funcționale de detaliu.

Sistemul nu își propune să rezolve problema achizițiilor. Această problemă poate că e mai firesc să fie rezolvată prin sistemele locale de contabilitate (pentru instituțiile ce nu au sisteme integrate locale).

6. Care sunt avantajele bibliotecilor mari prin utilizarea acestui sistem ?

(Nu doar pentru bibliotecile mari…) a) Mare economie de efort de catalogare, prin reutilizarea fișelor deja existente. b) O cale importantă de expunere a colecției proprii. c) Acces la un mecanism eficient de împrumut inter-bibliotecar.

7. Cine va plăti mentenanța sistemului ?

Ministerul Culturii.

8. Ne puteți da un exemplu de o astfel de platformă care funcționează ?

Catalogul partajat (emblematic): Worldcat [3]. Biblioteci digitale: Europeana [1], Deutsche Digitale Bibliothek [4], Culturaitalia [5].

9. Putem vorbi de mecanisme de prezervare în cadrul proiectului ?

Da, din moment ce contributorii vor putea să-și stocheze copii de siguranță într-un centru de date de încredere.

10. Care este componenta de prezervare în acest proiect ?

Repozitul digital al platformei culturalia.ro.

11. Care sunt standardele, regulamentele, regulile și normele în vigoare pe care le aveți în vedere în realizarea proiectului ?

Standarde catalografice: CIDOC-CRM [6], FRBRoo [7], EDM [8], EAD [9]. Standardul pentru metadatele tehnice: METS [10]. Standardul pentru interoperabilitatea imaginilor digitale: IIIF [11].

Nu există încă regulamente și norme naționale pentru o asemenea întreprindere (sui generis). Acestea vor trebui elaborate de comunitățile profesionale afectate (bibliotecari, muzeografi, arhiviști).

12. Multe dintre instituțiile vizate de proiect sunt deja informatizate și folosesc sisteme integrate care sunt validate și utilizate la nivel internațional (de peste 15 ani). Care este poziția e-cultura în legătură cu aceste aspecte ?

Platforma Culturalia nu va înlocui sistemele integrate locale. Va oferi însă a) o interfață programată (API – Application Programming Interface) pentru ca aplicații/sisteme locale să poată comunica online cu catalogul partajat și b) un format de schimb pentru importul/exportul offline de date.

13. Cine va asigura sustenabilitatea proiectului, după încheierea acestuia ?

Ministerul Culturii.

14. Ce tehnologii software și hardware sunt folosite în dezvoltarea proiectului ?

Nu știm încă. Ce ne va oferi dezvoltatorul care va câștiga licitația. În orice caz, se va cere insistent ca tehnologiile folosite să fie de nivelul cel mai avansat, pentru că e puțin probabil ca în următorii 10 ani să se obțină fonduri pentru modernizarea sistemului.

15. Cum este asumată mentenanța sistemelor și cine este responsabil de aceasta ?

Platforma Culturalia va fi găzduită într-un centru de date al unei instituții publice specializate. Aceasta va asigura mentenanța infrastructurii informatice. Mentenanța softului specific va fi – probabil — externalizată de către Ministerul Culturii, așa cum se procedează cu mai toate sistemele informatice publice de nivel național.

16. Cum se va face conversia datelor ?

Se vor scrie programe specifice de conversie la formatul de schimb de date ce va fi elaborat în cadrul proiectului.

17. Unul dintre „scenariile de utilizare ale bazei de date, suport al catalogului partajat” este următorul: „o editură elaborează (asistat) fișa CIP a unui volum pe care-l pregătește pentru difuzare…”. În viziunea dvs., cum se va desfășura efectiv acest proces ? (Ce va face editorul ? Ce trebuie să facă bibliotecarul ? Ce instrumente vor fi folosite ? etc.).

Ca și până acum, editorul va elabora fișa preliminară pentru CIP (precum oricare fișă bibliografică introdusă în catalogul partajat), iar bibliotecarul specializat din Biblioteca Națională o va corija, dacă e cazul. După aceea, editorul o va prelua (gata formatată), pentru a fi inclusă în șpaltul ediției.

Dar acest mecanism nu-i va fi impus Bibliotecii Naționale. Mecanismul actual va putea fi continuat, în detrimentul productivității, desigur.

18. Cum se va putea exercita controlul bibliografic dacă descrierile vor fi realizate în „colaborare” cu profesioniștii ? În ce va consta această „colaborare” ?

Dacă un „amator” sau un catalogator neexperimentat este primul care elaborează fișa catalografică a unei resurse și face erori sau lasă descrierea prea sumară, catalogatorul experimentat poate interveni și corija/îmbogăți acea fișă. Așa cum se întâmplă la Worldcat de 40 de ani, de pildă.

Modul în care se va reglementa controlul de calitate a metadatelor este o problemă deschisă și serioasă, iar asociațiile profesionale vor fi invitate să convină asupra mecanismelor specifice. Din fericire, există experiență internațională în acest domeniu.

19. „O bibliotecă înregistrează în catalogul partajat o carte, iar sistemul verifică (automat), folosindu-se de ISBN-ul respectivei ediții, dacă editura a depus cartea în Depozitul Legal, iar dacă nu, sistemul avertizează (automat) atât editura, cât și Biblioteca Națională”. Cum se va putea realiza acesta ?

Atât editura, cât și Biblioteca Națională vor primi câte o alertă. Dar – în prealabil — catalogatorul va fi avertizat, fiindcă poate să fie vorba de o simplă eroare de transcriere.

20. Considerați că există probleme de legislație în ceea ce privește buna desfășurare a proiectului, având în vedere faptul că instituțiile vizate sunt subordonate unor ordonatori de credite diferiți, iar legislația în vigoare nu include toate aspectele dezvoltate în proiect ?

După știința mea, nici o problemă. Sistemul nu cred că impune nici o ajustare legislativă. Dar și dacă s-ar descoperi că este nevoie de o astfel de ajustare, Ministerul Culturii o va propune, desigur.

O majoră actualizare s-ar impune la Legea Depozitului Legal, și anume instituirea Depozitului Legal Digital. Dar această actualizare nu este impusă de acest proiect, ci de rezolvarea unei probleme culturale acute.

21. Care este utilitatea, în cadrul proiectului, a vocabularelor controlate străine ? Mai precis, cum se realizează echivalarea între descriptorii LCSH, Rameau și cei din numeroasele vocabulare Controlate utilizate de bibliotecile din România ?

Vocabularele controlate consacrate pe plan internațional (e.g. AAT [12], ULAN [13], TGN [14], RAMEAU [15]) vor fi importate/convertite/unificate în sistem și vor constitui „scheletul” repertoriului de entități contextuale (persoane, locuri, concepte, perioade, evenimente, subiecte — ceea ce tradițional se cheamă „fișiere de autoritate”) al catalogului partajat. Pe de o parte, descrierile catalografice vor putea invoca direct aceste entități contextuale, făcând fișele regăsibile și pentru utilizatorii care formulează interogări în altă limbă decât româna. Pe de altă parte, catalogatorii vor putea adăuga termenilor din aceste vocabulare echivalențele românești. În fine, alinierea eventualelor vocabulare controlate românești la cele consacrate, se va face cu trudă, termen cu termen. Deci, în timp. (Poate cu ocazia asta se va valorifica și Lives-Ro, i.e. efortul de traducere a RAMEAU.) Apropo: și deduplicările se vor face cu trudă, fără îndoială. Dar merită efortul.

22. Care este utilitatea încărcării în Europeana a 500.000 de articole din periodicele de secol XIX, scanate deja și disponibile online, periodice care sunt, în marea lor majoritate, de tip text, în condițiile în care accentul în Europeana se pune pe imagine ?

Nu există un asemenea „accent” în Europeana. Deloc nu sunt favorizate imaginile în detrimentul textelor. Doar că imaginile sunt – de regulă – ceva mai ușor de digitizat/catalogat, deci au fost încărcate mai multe. Chiar și așa, la 07.11.2016, în Europeana sunt: imagini 29.707.565, texte 22.198.071, deci un raport de doar 1,34 la 1. Când sunt expuse peste 22 de milioane de texte, e greu de suspectat o defavorizare a patrimoniului scris.

23. În cadrul proiectului prealabil de digitizare s-a întocmit o documentație detaliată privind starea de conservare a fondului care urmează a fi scanat, precum și o documentație istorică privind documentele respective ?

Nu. Va fi la latitudinea contributorilor ce vor scana și expune în Culturalia. Așadar fiecare în parte va fi răspunzător de procedurile de digitizare a materialului propriu.

24. Digitizarea trebuie să garanteze că sunt respectate principiile conservării, mai ales în cazul suporturilor fragilizate, al cernelurilor alterate ale documentelor de colecții speciale. În situația în care, printre specialiștii amintiți în proiectul-cadru, nu figurează în primul rând conservatorii, cine va asigura respectarea normelor de conservare și cine își va asuma riscurile ? Există o asigurare semnată privind plata daunelor în cazul unor accidente semnalate imediat sau în timp ?

Digitizările se vor realiza în cadrul instituțiilor deținătoare (ca și până acum). Așadar, ele se vor îngriji de conservarea propriilor materiale.

25. Cine are dreptul asupra copiilor. Mai precis, cine încasează taxa de reproducere ? La punerea în circuit a documentelor, marcarea nu este suficientă, întrucât complexitatea gestiunii drepturilor de proprietate impune stabilirea unor metadate administrative prin care să fie evitată exploatarea diferită a datelor, în funcție de diferitele legislații.

În Biblioteca Digitală a Românei vor fi expuse doar resursele ce pot fi accesate gratuit. Problema gestiunii drepturilor rămâne în sarcina deținătorilor. A nu se uita că, în general, obiectele digitale expuse prin portalul Culturalia vor fi stocate și reproduse de pe serverele deținătorilor. Doar deținătorii care nu au infrastructura informatică (i.e. sait propriu) ca să-și găzduiască obiectele digitale le vor expune din repozitul platformei Culturalia. Cu alte cuvinte, expunerea prin portalul Culturalia nu afectează drepturile intelectuale mai mult decât expunerea prin saitul propriu.

Dan Matei [2016-11-08]
[1] www.europeana.eu
[2] www.poscce.research.ro/uploads/documente-programare/vo-poc-2014-2020-18-12-2014.pdf
[3] www.worldcat.org
[4] www.deutsche-digitale-bibliothek.de
[5] www.culturaitalia.it
[6] www.cidoc-crm.org
[7] www.ifla.org/node/10171
[8] http://pro.europeana.eu/share-your-data/data-guidelines/edm-documentation
[9] www.loc.gov/ead
[10] www.loc.gov/standards/mets
[11] http://iiif.io
[12] www.getty.edu/research/tools/vocabularies/aat
[13] www.getty.edu/research/tools/vocabularies/ulan
[14] www.getty.edu/research/tools/vocabularies/tgn
[15] http://rameau.bnf.fr

6. Proiectul E-Cultura: platforma „culturalia.ro” – Biblioteca Digitală a României

(NB. Publicat la 30 septembrie 2016)

6. Proiectul E-Cultura: platforma „culturalia.ro” – Biblioteca Digitală a României

Platforma Culturalia este – în esență – un catalog partajat, așadar stochează metadatele (i.e. fișele descriptive) ale resurselor culturale. În acest catalog pot fi înregistrate – pe lângă fișe descriptive de obiecte tangibile și de entități contextuale (e.g. persoane, locuri, perioade, concepte, evenimente, instituții) – și fișe descriptive de resurse culturale digitale.

Culturalia.ro va reprezintă pandantul național al Bibliotecii Digitale Europene (europeana.eu) [1]. Așadar, resursele culturale expuse în Culturalia vor fi expuse (simultan) și în Europeana.

Spre deosebire însă de Europeana, Culturalia va avea și un repozit (unii îi zic „depozit”) pentru obiectele digitale propriu-zise. Prin urmare, resursele culturale digitale vor putea fi stocate (și accesate) astfel:

  • local, pe saitul furnizorului (dacă conexiunea sa la Internet este suficient de largă pentru a permite accederea comodă din exterior a obiectelor digitale voluminoase);
  • local, cu copie de siguranță pe platforma Culturalia;
  • doar pe platforma Culturalia.

NB. Chiar dacă resursa este accesată de către un utilizator pe platforma Culturalia, accesul va fi contorizat în contul furnizorului, deci furnizorii de resurse digitale nu trebuie să se teamă că Culturalia le „fură” vizitatori.

Poate e cazul unei explicitări terminologice: resursă digitală vs. obiect digital. Prin „resursă digitală” înțeleg o entitate ce are individualitate și integritate „culturală” proprie, deci se justifică să i se facă o fișă descriptivă. Poate fi o carte (în ansamblu), o simfonie, o fotografie, un film ș.a.m.d. Adică este ceea ce prezintă interes pentru vizitator.

Pe când un obiect digital este o entitate ce are individualitate pe plan informatic, ca să zic așa. O resursă digitală poate fi un obiect digital, dar poate fi și un ansamblu de obiecte digitale. De pildă, un facsimil digital al unei cărți, este o succesiune de imagini de pagini scanate. Fiecare pagină scanată este un obiect digital (poate fi un fișier-imagine jpg). Sau o resursă digitală care e reprezentarea unei monede poate fi formată din două imagini (aversul și reversul). Etc.

La modul minimal, fișele descriptive ale resurselor culturale trebuie să fie conforme cu formatul EDM [Europeana Data Model], utilizat de Europeana. Aceasta nu este o cerință restrictivă, deoarece fișele elaborate în departamentele de catalogare ale instituțiilor culturale sunt – de regulă – mai elaborate, deoarece fie sunt conforme formatelor MARC (mai ales în biblioteci), fie sunt conforme formatului DOCPAT (mai ales în muzee), fie sunt conforme formatului EAD (mai ales în arhive). În orice caz, fișele în formatul EDM sunt mai simple decât cele cerute pentru dosarele de clasare.

O resursă digitală (text, imagine, audiogramă, videogramă, obiect 3D) furnizată trebuie să fie expozabilă online, adică expunerea sa să nu încalce nici un drept intelectual. Licențele disponibile sunt cele acceptate de Europeana [2].

Elementele esențiale ale formatului EDM pentru resursa culturală (originală) expusă sunt:

a) Proprietățile obligatorii:

dc:language [limba (pentru resurse textuale)]
edm:type [categoria resursei: TEXT, VIDEO, SOUND, IMAGE, 3D]

b) Măcar una dintre proprietățile acestea e obligatorie:

dc:coverage [context/tratare] dcterms:spatial [context geografic] dcterms:temporal [context temporal] dc:subject [subiect] dc:type [tip]

c) Și măcar una dintre acestea e obligatorie:

dc:description [descriere] dc:title [titlu]

d) Proprietățile suplimentare recomandate sunt:

dc:contributor contributor
dc:creator creator
dcterms:issued data publicării
dc:date dată semnificativă asociată resursei
dc:identifier identificator
dc:publisher editura
dc:source sursa din care resursa culturală a fost derivată
dcterms:alternative titlu alternativ
dcterms:created data creării

e) Iar alte câteva proprietăți utile sunt:

dcterms:medium suport fizic
dc:format format
dcterms:provenance proveniența
dcterms:references referințe
dc:relation relații cu alte resurse
dc:rights drepturi intelectuale
edm:currentLocation localizare actuală
dcterms:extent dimensiuni sau durată
edm:isRelatedTo asocieri

Aceste nu sunt toate proprietățile din EDM.  Cei interesați de detalii, le găsesc în „Ghidul de mapare” [3] sau chiar „Definiția modelului EDM” [4].

Culturalia va constitui așadar (și) Biblioteca Digitală a României. În această postură are următoarele obiective specifice:

  • îmbunătățirea semnificativă a accesului public (online) la resursele culturale naționale;
  • combaterea „discriminării geografice”, (între oraș-sat și capitală-provincie);
  • îmbunătățirea accesului persoanelor cu diverse dizabilități la resursele culturale ale României;
  • sporirea ofertei (atât cantitativ cât și ca diversitate) de material cultural reutilizabil ca material didactic;
  • oferirea unui mecanism prin care muzeele să-și expună piesele „ascunse” (veșnic) în depozite;
  • găzduirea (viitorului) depozit legal digital;
  • sporirea semnificativă a contribuției României la Biblioteca Digitală Europeană (europeana.eu).

De notat că fișele descriptive ale resurselor culturale expuse în Culturalia (și Europeana) trebuie să fie „orientate” către public. Cu alte cuvinte, pe cât posibil, fiecare exponat să fie „îmbrăcat” într-o poveste, care să- confere semnificație în ochii vizitatorului. Așadar, pe lângă proprietățile destinate ochiului curatorului colecției (bibliotecar, muzeograf etc.), catalogatorii/indexatorii vor trebui să facă un efort conștient de interpretare/contextualizare a fiecărui exponat, pentru a-l face interesant și ochiului vizitatorului.

Proiectul E-Cultura presupune și un efort semnificativ de digitizare de resurse culturale și de populare a Bibliotecii Digitale a României (și deci și de furnizare de exponate la Biblioteca Digitală Europeană).

În practică, aceasta înseamnă ca (în cel mult trei ani) să se realizeze:

  • Digitizarea propriu-zisă (scanarea, fotografierea) a minimum 250.000 de resurse culturale și catalogarea (fișarea) lor.
  • Catalogarea/indexarea a încă minimum 500.000 de resurse culturale (mai ales articole) care sunt deja digitizate, dar nu sunt expuse individual. De pildă articole din cele peste 84.500 numere de periodic expuse în Biblioteca Digitală a Bucureștilor [5].

E un obiectiv foarte îndrăzneț ! Sper să nu fie prea îndrăzneț. Dar e un efort necesar: astfel – măcar cu 4-5 ani întârziere – România să atingă obiectivul fixat în „Recomandarea Comisiei Europene din 2011 C(2011) 7579 privind digitizarea și accesibilitatea online a materialului cultural și conservarea digitală”, și anume expunerea în Europeana – până în 2015 (!)  – a 789.000 de resurse digitale (obiectiv fixat pe bază de populație, PIB etc.).

Dan Matei [2016-09-30]

[1] http://www.europeana.eu/portal/en

[2] http://pro.europeana.eu/share-your-data/rights-statement-guidelines/available-rights-statements

[3] http://pro.europeana.eu/files/Europeana_Professional/Share_your_data/Technical_requirements/EDM_Documentation/EDM_Mapping_Guidelines_v2.3_042016.pdf

[4] http://pro.europeana.eu/files/Europeana_Professional/Share_your_data/Technical_requirements/EDM_Documentation//EDM_Definition_v5.2.7_042016.pdf

[5] http://www.digibuc.ro/colectii/publicatii-periodice-c1291

5. Proiectul E-Cultura: platforma „culturalia.ro” – catalogul național partajat

(NB. Publicat la 27 septembrie 2016)

5. Proiectul E-Cultura: platforma „culturalia.ro” – catalogul național partajat

Catalogul partajat național (un serviciu public mult întârziat la noi – americanii l-au „inventat” încă din anii ’70 !) ar fi un catalog eclectic, adică reunind atât cataloagele de bibliotecă, cât și cele de muzeu și de arhivă. Ideea e să fie dezvoltat pe baza inovațiile conceptuale și tehnice specifice vremurilor, cu alte cuvinte să fie „state of the art”, deoarece nu ne imaginăm că se vor mai obține fonduri de modernizare în următorii 10 ani. Și dă Doamne să mă înșel !

E important de menționat de la început: catalogul va avea o interfață web atât pentru citire, cât și pentru scriere. Dar platforma va oferi și o interfață programabilă (API, i.e. Application Programming Interface), astfel încât instituțiile care au sisteme informatice locale vor putea să le facă pe acestea să comunice cu catalogul național. Prin urmare vor putea să-și prezerve modul familiar de lucru, chiar dacă (re)utilizează date din catalogul partajat.

În plus, furnizorii de date catalografice vor avea control complet asupra permisiunilor de acces la acestea.

a)     Culturalia.ro – obiective specifice pentru public:

  • îmbunătățirea semnificativă a accesul public (online) la resursele culturale naționale;
  • combaterea „discriminării geografice”, adică sporirea posibilitățile de acces la resursele culturale naționale pentru cetățenii din localitățile fără instituții culturale (mai ales cei din mediul rural);
  • facilitarea elaborării bibliografiilor (de la coada lucrărilor academice) – în „colaborare” cu profesioniștii, i.e. atât citările cât și formatarea (e.g. conform Chicago Manual of Style).

b)     Culturalia.ro – obiective specifice pentru instituțiile memoriei:

  • înființarea unei platforme de partajare și cooperare, așadar de minimizare a duplicării de efort intelectual, deci de economisire de resurse publice (deficitare);
  • crearea posibilității ca muzeele/arhivele să beneficieze de înregistrările „entităților contextuale” (i.e. fișierele de autoritate) elaborate de biblioteci; și viceversa !
  • oferirea unui sistem (gratuit) de documentare a colecțiilor, mai ales cele mici (biblioteci școlare, instituționale, personale, case memoriale etc.), dar nu numai !
  • facilitarea împrumutului inter-instituțional;
  • facilitarea expunerii colecțiilor digitale (și) în Biblioteca Digitală Europeană (europeana.eu).

c)     Culturalia.ro – obiective specifice pentru editori/creatori:

  • facilitarea identificării deținătorilor de drepturi intelectuale;
  • facilitatea promovării lucrărilor proprii;
  • facilitarea elaborării fișelor CIP [Cataloguing in Publication].

Cu alte cuvinte, câteva scenarii de utilizare (use cases) întrevăzute ar putea fi:

a)     Pentru public:

  • un utilizator identifică în catalogul partajat național o resursă culturală care-l interesează și identifică și unde poate să o consulte;
  • un cercetător își elaborează bibliografia unui articol și reutilizează fișe bibliografice preexistente sau elaborează înregistrări bibliografice noi, folosindu-se de interfața online specifică, care-i ușurează procesul; în plus, la final, sistemul îi poate genera bibliografia completă, într-unul dintre formatele consacrate (e.g. Chicago Manual of Style, MLA, APA);
  • un cititor digitizează un text literar, îl expune online în Wikisource (http://ro.wikisource.org), îi elaborează (asistat) fișa bibliografică, făcând astfel textul regăsibil în catalogul partajat național;
  • un cititor își cataloghează biblioteca proprie, folosind la maximum fișele bibliografice  preexistente în catalogul național.

b)     Pentru instituțiile culturale:

  • înainte de a fișa o resursă culturală (carte, articol, piesă de muzeu etc.) catalogatorul/indexatorul dintr-o instituție a memoriei verifică dacă nu cumva resursa respectivă este deja fișată, iar dacă da, o reutilizează, eventual doar adăugând/modificând elemente ale  acesteia;
  • în procesul de fișare a unei resurse culturale (neafișate în prealabil), catalogatorul/indexatorul reutilizează înregistrări de entități contextuale (persoane, locuri, perioade, concepte etc.) deja elaborate;
  • un profesionist remarcă o eroare într-o fișă elaborată de un amator și o corectează;
  • o instituție a memoriei digitizează o piesă din colecția sa, o expune online, redactează  (asistat) fișa descriptivă a obiectului digital – plecând de la fișa corespondentului analogic – și o marchează pentru expunere în Europeana;
  • un arheolog înscrie (asistat) în Repertoriul Arheologic Național un sit arheologic nou descoperit;
  • un arhivist elaborează (asistat) un instrument de evidență [finding aid] pentru un fond, și-l face regăsibil în catalogul partajat național;
  • o bibliotecă identifică în catalogul național un material solicitat de către un cititor, dar pe care nu-l deține, și lansează o cerere de împrumut interbibliotecar, în beneficiul acestuia;
  • un curator proiectează o expoziție tematică și, folosind catalogul partajat național, identifică piese de interes la alți deținători, apoi lansează cereri de împrumut intermuzeal;
  • un anticariat sau o galerie de artă fișează (asistat) o carte sau un obiect, făcându-le astfel regăsibile în catalogul partajat național;
  • secretarul literar al unei instituții de spectacole înscrie (asistat) o premieră nouă în Repertoriul Teatral Național;
  • o instituție culturală actualizează seturile sale de date deschise expuse pe http://data.gov.ro/;
  • o bibliotecă înregistrează în catalogul partajat o carte, iar sistemul verifică (automat), folosindu-se de ISBN-ul respectivei ediții, dacă editura a depus cartea în Depozitul Legal. Iar dacă nu, sistemul avertizează (automat) atât editura, cât și Biblioteca Națională.

c)     Pentru editori/creatori:

  • un autor publică un articol online (sau offline) și îi elaborează (asistat) o înregistrare bibliografică, pentru a-l face regăsibil în catalogul partajat național; dacă articolul este expus online, îl înscrie astfel și în viitorul Depozit Legal Digital;
  • o editură elaborează (asistat) fișa CIP a unui volum pe care-l pregătește pentru difuzare, făcându-l astfel regăsibil în catalogul partajat național, chiar înaintea apariției pe piață;
  • editorul unei reviste elaborează (asistat) cuprinsul numărului următor, făcând astfel regăsibile articolele din acel număr în catalogul partajat național;
  • un curator proiectează o expoziție virtuală tematică, folosind resursele expuse în biblioteca digitală culturalia.ro;
  • un cercetător stochează – într-un format standard – un set de date obținute în urma unui experiment sau a unei cercetări de teren, îl fișează (asistat), făcându-l regăsibil în catalogul partajat național;
  • un artist expune online reproducerea digitală a unei creații proprii, o fișează (asistat), expunând-o în Biblioteca Digitală a Românei (culturalia.ro);
  • un critic literar constituie o antologie tematică, folosind texte expuse în biblioteca digitală culturalia.ro;
  • un editor dorește să publice o lucrare și – folosindu-se de fișierul de autoritate al autorilor – determină dacă respectiva lucrare este în domeniul public, iar dacă nu, are șansa să identifice deținătorul drepturilor de autor;
  • un critic literar publică o recenzie a unei cărți, îi expune fișa bibliografică în catalogul național partajat, dar face și o legătură (biunivocă) cu înregistrarea bibliografică a cărții; astfel cititorul recenziei are acces la carte, iar cel care consultă fișa cărții are acces la recenziile ei;
  • un teatrolog fișează o cronică pe care a publicat-o și o asociază cu spectacolul respectiv din Repertoriul Teatral Național.

Catalogul nu va pleca cu conținut zero. Ne vom strădui să migrăm cât mai multe dintre bazele de date culturale existente. Pentru început:

a)     vor fi ingerate bazele de date curatoriate de Institutul Național al Patrimoniului:

  • Inventarul Bunurilor Culturale Mobile Clasate;
  • Repertoriul Arheologic Național;
  • Repertoriul Premierelor Teatrale Postbelice;
  • Catalogul Colectiv Național al Incunabulelor;
  • Catalogul Colectiv Național al Cărții Vechi Românești;
  •  Ghidul Muzeelor;
  • Cronica Cercetărilor Arheologice;
  • Lăcașurile de Cult din România;
  • Bibliografia de Referință a Cărții Vechi;
  • Muzeul Virtual al Monumentelor Etnografice din Muzeele în Aer Liber;
  • Repertoriul Creației Muzicale Românești.

b)     vor fi preluate fișiere de autoritate consacrate pe plan mondial, e.g.:

  • AAT [Art and Architecture Thesaurus];
  • TGN [Thesaurus of Geographic Names];
  • RAMEAU [Répertoire d’autorité-matière encyclopédique et alphabétique unifié];
  • ULAN [Union List of Artist Names];
  • LCSH [Library of Congress Subject Headings].

c)     vor fi importate înregistrările metadatale de proveniență românească din Europeana.

Iar apoi, pe bază voluntară, desigur, se vor importa bazele catalografice ale instituțiile participante (fie ele MARC, fie non-MARC, fie DOCPAT etc.).

Aceste migrări vor fi însoțite – fără îndoială  – de chinul deduplicărilor !

Modelul de date al catalogului va fi și el – inevitabil – eclectic, deoarece nu ne permitem să pierdem nici o „nuanță” din metadatele foarte diverse existente. Dar nucleul său se va baza pe modele conceptuale solide, consacrate: CIDOC-CRM (http://www.cidoc-crm.org/official_release_cidoc.html), FRBRoo (http://www.cidoc-crm.org/frbr_drafts.html), EDM (http://pro.europeana.eu/share-your-data/data-guidelines/edm-documentation). În plus, o mare atenție se va acorda mecanismului de mapare a metadatelor la formatul specific al Bibliotecii Digitale Europene (europeana.eu), și anume EDM [Europeana Data Model].

Dan Matei (2016-09-27)

4. (Probabil) E-Cultura

(NB. Publicat la 22 septembrie 2016)

În sfârșit, proiectul E-Cultura are finanțare și e pe cale să fie lansat (i.e. „studiul de fezabilitate” – comandat de Ministerul Culturii – se apropie de finalizare). Se speră ca la începutul lui 2017, proiectul să fie efectiv pornit.

Reamintesc: proiectul este cuprins în „Programul Operațional Competitivitate” (2016-2020), acțiunea 2.3.3: Îmbunătățirea conținutului digital și a infrastructurii TIC sistemice în domeniul e-educație, e-incluziune, e-sănătate și e-cultură (c. 11 milioane euro) [1].

Obiectivele proiectului (ce va dura 3 ani) sunt:

A. Dezvoltarea unei platforme informatice online de catalog partajat și portal de bibliotecă digitală (culturalia.ro), disponibilă gratuit oricărei instituții culturale, precum și publicului larg. Ea va fi pandantul național al Bibliotecii Culturale Europene (europeana.eu).
B. Expunerea online în Biblioteca Digitală a României (culturalia.ro) și în Biblioteca Digitală Europeană (europeana.eu) a peste 650.000 750.000 de bunuri culturale (texte, imagini, audiograme, videograme, obiecte 3D).

Cele două obiective majore pot fi detaliate astfel:

A. Platforma „culturalia.ro”:

A.1. Dezvoltarea propriu-zisă a platformei informatice (i.e. a softului) pentru catalog partajat, platformă care va stoca metadatele (i.e. fișele descriptive ale) resurselor culturale.
A.2. Migrarea datelor din bazelor de date naționale ale patrimoniului cultural existente în prezent și „integrarea” lor în platformă. De notat că în catalogul partajat se vor putea înregistra atât bunuri fizice din colecțiile bibliotecilor, muzeelor și arhivelor, cât și exponate digitale, așadar catalogul va constitui și portalul bibliotecii digitale.
A.3. „Asimilarea” de vocabulare controlate consacrate pe plan internațional și elaborarea de echivalențe românești, pe măsura necesităților practice.

Subliniez: catalogul partajat culturalia.ro va fi un serviciu public oferit de Ministerul Culturii, adică va fi disponibil gratuit, practic oricui, desigur în grade diferite. Cu alte cuvinte, fiecare participant (instituție sau persoană) va decide cât și cum expune și altora.

.
B. Expunerea masivă în bibliotecile digitale „culturalia.ro” și „europeana.eu”:

B.1. Digitizarea propriu-zisă (scanarea, fotografierea) a minimum 200.000  250.000 de resurse culturale și catalogarea (fișarea) lor.
B.2. Catalogarea a încă minimum 450.000 500.000 de resurse culturale (mai ales articole) care sunt deja digitizate, dar nu sunt expuse individual.
B.3. Înființarea repozitului digital al platformei, în care vor putea fi stocate obiectele digitale expuse în portalul bibliotecii digitale.

De notat: obiectele digitale vor putea fi stocate (și accesate) astfel:

  • local, pe serverele furnizorului (dacă conexiunea sa la Internet este suficient de largă pentru a permite accederea comodă din exterior a obiectelor digitale voluminoase);
  • local, plus copii de siguranță pe platforma culturalia.ro;
  • doar pe platforma culturalia.ro.

NB. Chiar dacă obiectul digital este accesat de un utilizator de pe platforma culturalia.ro, accesul va fi contorizat în contul furnizorului.

.
Detalierea celor două obiective urmează în postări distincte.

.

Dan Matei (2016-09-22, corecții: 2016-09-30)

[1] http://www.fonduri-structurale.ro/stiri/15974/poc-2014-2020-ghidul-pentru-beneficiarii-publici-pentru-axa-2-lansat-spre-consultare

3. Ontologia CPoT [CRM Properties of Things]

(NB. Publicat la 7 octombrie 2015)

[formă rudimentară a paginii]

CPoT este o extensie a ontologiilor CIDOC-CRM [Conceptual Reference Model], FRBRoo [Functional Requirements for Bibliographic Records – object oriented] și EDM [Europeana Data Model].

Ierarhia claselor (pdf)

Ierarhia proprietăților (pdf)

NB. Prefixul „cpot” indică un adaos „local”.

Câteva dintre tabelele SQL de stocare (pdf)

1. Proiectul „Culturalia – Biblioteca Digitală a Românei și Catalogul Partajat Național”. Preambul

(NB. Publicat la 3 iunie 2015)

 Obiectivele generale ale proiectului sunt: 

  • să se constituie o bază de date unificată a resurselor culturale (digitale și analogice) existente în România;
  • să se dezvolte o bibliotecă digitală națională, pandant al Bibliotecii Digitale Europene (europeana.eu);
  • să se ofere un portal către (asimptotic) toate resursele culturale online expuse în România;
  • să se reducă deficitul de resurse culturale românești expuse în Biblioteca Digitală Europeană (europeana.eu);
  • să se capteze (asimptotic) toate sursele de informație catalografică, inclusiv prin convertirea resurselor catalografice moștenite [legacy];
  • să se realizeze informatizarea (gratuită) a colecțiilor instituțiilor memoriei (mai ales cele ale bibliotecilor și muzeelor mici);
  • să se economisească – prin partajarea/reutilizarea informației catalografice existente — timp de muncă calificată și resurse bănești;
  • să se ofere o interfață programabilă [API] la baza de date unificată, pentru a permite dezvoltarea independentă de aplicații specifice pentru dispozitive mobile;
  • să se faciliteze împrumutul inter-instituțional de resurse culturale (atât inter-bibliotecar, cât și inter-muzeal – pentru organizarea de expoziții);
  • să se ofere instituțiilor memoriei spațiu de stocare de rezervă pentru obiectele lor digitale;
  • să se implementeze un mecanism de identificare a deținătorilor de drepturi intelectuale;
  • să se inițieze depozitul legal digital;
  • să se instituie mecanismul de urmărire a exporturilor/importurilor (definitive și temporare) a bunurilor culturale;
  • să se faciliteze elaborarea dosarelor de clasare ale bunurilor culturale;
  • să se realizeze informatizarea documentării proceselor de conservare/restaurare a bunurilor culturale.

Câteva scenarii de utilizare [use-cases] ale bazei de date, suport al catalogului partajat: 

  • un utilizator (amator sau profesionist) identifică și consultă în biblioteca digitală o resursă care-l interesează (e.g. carte, articol, obiect de muzeu, document de arhivă);
  • un utilizator identifică în catalogul național o resursă (analogică) care-l interesează și-i identifică și deținătorul, unde poate să o consulte;
  • un muzeograf sau bibliotecar elaborează (asistat) dosarul de clasare a unui bun cultural mobil și acesta e expus online, ceea ce face ca membrii Comisiei Naționale a Muzeelor să-l poată consulta înainte de ședința în care se votează clasarea;
  • o instituție a memoriei digitizează o piesă din colecția sa, o expune online, derivă (asistat) fișa descriptivă a obiectului digital din fișa corespondentului analogic și o marchează pentru expunere în Europeana;
  • un expert actualizează (asistat) fișa descriptivă a unui monument înscris în Lista Monumentelor Istorice;
  • un arheolog înscrie (asistat) un sit arheologic nou descoperit în Repertoriul Arheologic Național;
  • înainte de a fișa o resursă culturală (carte, articol, piesă de muzeu etc.) catalogatorul/indexatorul dintr-o instituție a memoriei verifică dacă nu cumva resursa respectivă este deja fișată, iar dacă da, eventual doar adaugă/modifică elemente ale  acesteia;
  • în procesul de fișare a unei resurse culturale (nefișate în prealabil), catalogatorul/indexatorul reutilizează entități contextuale (persoane, locuri, perioade, concepte etc.) deja elaborate;
  • un arhivist elaborează (asistat) un instrument de evidență [finding aid] pentru un fond, și-l face regăsibil în catalogul național;
  • o bibliotecă nu dispune de un material solicitat de un cititor, dar îl identifică în catalogul național și-l împrumută de la deținător, în beneficiul cititorului;
  • un curator proiectează o expoziție tematică și, folosind catalogul național, identifică piese de interes la alți deținători, pe care le poate împrumuta pentru expoziția sa;
  • un cercetător își elaborează bibliografia unui articol și reutilizează trimiteri bibliografice preexistente sau elaborează înregistrări bibliografice noi, dar folosindu-se de interfața online specifică, care-i ușurează procesul; în plus, la final, sistemul îi poate genera bibliografia completă, într-unul dintre formatele consacrate (e.g. Chicago Manual of Style, MLA, APA);
  • un autor publică un articol online (sau offline) și îi elaborează (asistat) o înregistrare bibliografică, pentru a-l face regăsibil în catalogul național; dacă articolul este expus online, îl înscrie astfel și în Depozitul Legal Digital;
  • o editură elaborează (asistat) fișa CIP a unui volum pe care-l pregătește pentru difuzare, făcându-l astfel regăsibil în catalogul național, chiar înaintea apariției pe piață;
  • un anticariat sau o galerie de artă fișează (asistat) o carte sau un obiect, făcându-le astfel regăsibile în catalogul național;
  • editorul unei reviste elaborează (asistat) cuprinsul numărului următor, făcând astfel regăsibile articolele din acel număr în catalogul național;
  • un amator entuziast digitizează un text literar și-l expune online în Wikisource[1], îi elaborează (asistat) și o fișă bibliografică, făcând textul regăsibil în catalogul național;
  • secretarul literar al unei instituții de spectacole înscrie (asistat) o premieră nouă în Repertoriul Teatral Național;
  • o instituție culturală actualizează seturile sale de date deschise expuse pe http://data.gov.ro/;
  • un cercetător stochează – într-un format standard – un set de date obținute în urma unui experiment sau a unei cercetări de teren, îl fișează (asistat), făcându-l regăsibil în catalogul național;
  • un artist expune online reproducerea digitală a unei creații proprii, o fișează (asistat), făcând-o regăsibilă în catalogul național;
  • un bibliograf profesionist remarcă o eroare într-o fișă elaborată de un amator și o corectează;
  • un curator proiectează o expoziție virtuală tematică, folosind resursele expuse în biblioteca digitală;
  • un critic literar constituie o antologie tematică, folosind texte expuse în biblioteca digitală;
  • un autor/moștenitor semnalează operele asupra cărora deține drepturi intelectuale;
  • un editor dorește să publice o operă și află statutul acesteia (sub copyright, orfană sau în domeniul public) și – dacă e cazul – identifică deținătorul drepturilor intelectuale asupra operei;
  • un cetățean dorește să exporte un bun cultural și inițiază (online) cererea de export, iar autoritatea îndreptățită constituie dosarul de clasare sau eliberează certificatul de export, după caz.

Dan Matei

[03.06.2015]

[1] http://ro.wikisource.org

2. „Culturalia” – Cerințele funcționale

(NB. Publicat la 10 mai 2015)

Propunerea proiectului „Culturalia – Biblioteca Digitală a Românei și Catalogul Partajat Național” – în cadrul „Programului Operațional Competitivitate 2014-2020” [POC], Acțiunea 2.3.3 „Îmbunătățirea conținutului digital și a infrastructurii TIC sistemice în domeniile e-educație, e-incluziune, e-sănătate, și e-cultură[1]

(propus de Institutul Național al Patrimoniului, [INP] pt. intervalul 2016 – 2020 [2])

Motivație

Pentru:

  • a urma Recomandarea Comisiei Europene C(2011) 7579;
  • a îmbunătăți semnificativ accesul public (online) la resursele culturale naționale;
  • a oferi o platformă de partajare și cooperare pentru profesioniștii din instituțiile memoriei;
  • a facilita ingerarea metadatelor (i.e. a fișelor descriptive a) resurselor culturale românești în Biblioteca Digitală Europeană (europeana.eu),
  • a îmbunătăți accesul nevăzătorilor la resursele culturale ale României,
  • a spori oferta de material cultural reutilizabil ca material didactic,

proiectul urmărește (în esență):

  1. dezvoltarea unei platforme informatice online de catalog partajat și bibliotecă digitală, disponibilă tuturor instituțiilor culturale din România și publicului larg;
  2. digitizarea și expunerea online (până în 2020) în Biblioteca Digitală a României (culturalia.ro) și în Biblioteca Digitală Europeană (europeana.eu) a peste 1 milion de resurse culturale (texte, imagini, audiograme, videograme).

A. Dezvoltarea platformei online culturalia.ro

Soluția de principiu propusă este realizarea unei platforme online centralizate, administrate de agregatorul național, dar oferită spre utilizare gratuită atât instituțiilor memoriei (biblioteci, muzee, arhive), cât și publicului. Această platformă urmează să susțină atât biblioteca digitală (în sens larg, adică bibliotecă/muzeu/arhivă), cât și catalogul partajat al instituțiilor memoriei, adică ar permite atât alimentarea partajată/cooperativă a acestora, cât și facilitarea accesului public la acestea, pe lângă interoperabilitatea cu Biblioteca Digitală Europeană (europeana.eu).

Tehnic, platforma ar urma să fie „state-of-the-art” (folosind tehnologiile cloud), avându-se în vedere că va trebui să fie operațională măcar 10 ani, în condițiile rapidelor evoluții tehnologice. Ea va trebui să suporte volume semnificative de date. Softul dezvoltat pentru această platformă va fi disponibil în regim open-source, sub licența europeană EUPL [European Union Public Licence], așadar va putea fi liber și gratuit folosit/adaptat/modificat și de alți operatori culturali.

Utilizarea acestei platforme online va degreva instituțiile culturale (mai ales cele mici) de necesitatea de a achiziționa/întreține un sistem informatic specific (e.g. sistem integrat de bibliotecă, sistem de management/gestiune a colecțiilor muzeale) propriu. Desigur, ele vor continua să-și administreze cataloagele și bibliotecile digitale, chiar dacă aceste sunt integrate în baza de date centrală, administrată de agregatorul național.

Mai mult, platforma va permite expunerea de „conținut generat de utilizatori” [UGC – user-generated content].

În plus, platforma propusă va integra bazele naționale de date (curatoriate de către Institutul Național al Patrimoniului), cum ar fi:

  • Inventarul Bunurilor Culturale Mobile Clasate,
  • Lista Monumentelor Istorice,
  • Repertoriul Arheologic Național,
  • Repertoriul Teatral Național,
  • Catalogul Colectiv Național al Incunabulelor,
  • Catalogul Colectiv Național al Cărții Vechi Românești,
  • Ghidul Muzeelor,
  • Cronica Cercetărilor Arheologice,
  • Lăcașurile de Cult din România,
  • Bibliografia de Referință a Cărții Vechi,
  • Repertoriul Creației Muzicale Românești.
  • Muzeul Virtual al Monumentelor Etnografice din Muzeele în Aer Liber,

Așadar, platforma va oferi servicii publice comparabile cu ale altor platforme naționale similare, cum ar fi:

sau transnaționale, cum ar fi:

Platforma va trebui să ofere:

  • un punct generic (și mai multe specifice) de acces public la informații privind patrimoniul cultural — liber la cele de interes public și restricționat la cele confidențiale — inclusiv de pe dispozitive mobile;
  • interfețe programabile deschise (RESTful API [3]) sistemelor informatice care doresc să utilizeze informații privind patrimoniul cultural (e.g. enciclopedii online, expoziții virtuale, biblioteci digitale specializate);
  • mecanisme de schimb de date cu sistemele similare din Europa și din lume, mai ales cu Biblioteca Digitală Europeană (europeana.eu);
  • mecanisme care să permită personalului instituțiilor culturale să coopereze la elaborarea metadatelor (adică a fișelor descriptive), evitând astfel duplicarea eforturilor de catalogare/indexare a resurselor culturale: cărți, monede, „entitățile contextuale” (persoane, locuri, evenimente, concepte etc.) etc.;
  • proceduri de asistare a instituțiilor culturale la elaborarea dosarelor de clasare a bunurilor culturale;
  • mecanisme de conversie (și integrare) a materialului catalografic moștenit, din formate răspândite (e.g. UNIMARC [4], MARC21 [5], DOCPAT [6], EAD [7]).

Rezultatele concrete așteptate în urma implementării acestei platforme, sunt:

  • o interfață-utilizator publică generică pentru acces online la resursele culturale – incluzând baleiere cartografică și cronologică (timeline);
  • interfețe-utilizator în limbile română, maghiară și engleză (din start);
  • interfețe programabile (API [Application Programming Interface]) pentru agenții soft;
  • interfețe-utilizator pentru administrarea, respectiv expunerea online a cataloagelor colecțiilor instituțiilor memoriei (obiecte de muzeu, texte, hărți etc.) pe saitul bibliotecii/ muzeului/arhivei;
  • un mecanism care să faciliteze instituțiilor publice expunerea de seturi de date deschise, pe saitul guvernamental specific: http://data.gov.ro;
  • mecanisme standard de expunere offline de date (e.g. OAI-PMH [Open Archives Initiative Protocol for Metadata Harvesting] [8]).

Din rațiuni de interoperabilitate, platforma:

  • va fi construită pe un model conceptual care să permită interpretarea unitară a metadatelor folosite în instituțiile memoriei; acesta se va baza pe modelele conceptuale Conceptual Reference Model [CIDOC-CRM] [9] (ISO 21127:2014) pentru domeniul muzeal și Functional Requirements for Bibliographic Data – object-oriented definition and mapping to FRBRer [FRBRoo] [10] pentru domeniul biblioteconomic;
  • va folosi drept cadru de interoperabilitatea modelul de date EDM [Europeana Data Model] [11], adoptat de Biblioteca Digitală Europeană (europeana.eu);
  • comunicarea cu baza de date-suport se va face printr-o interfață ODBC [12];
  • va permite exportul/importul de date în formate de serializare standard, cum ar fi JSON-LD [13], putând astfel să se profite de datele deschise oferite liber de mari instituții culturale ale lumii, cum ar fi British Museum [14] sau British Library [15], precum și de reputatele vocabulare controlate dezvoltate de Fundația Getty [16].

Alte cerințe specifice:

  • codul-sursă specific elaborat pentru implementarea platformei va fi disponibil sub licența EUPL v.1.1. [European Union Public Licence] [17], promovată de Comisia Europeană;
  • nu se vor folosi la implementarea platformei componente soft proprietare, și trebuie să fie disponibile sub licențe deschise;
  • dezvoltarea platformei se va face gradual, astfel încât aceasta să poată fi folosită pentru achiziție de date încă din primul an;
  • dezvoltarea platformei se va face în continuu contact cu beneficiarul (agregatorul național), astfel încât acesta să-i poată monitoriza evoluția și să fie de la început familiarizat cu codul-sursă, pentru a se minimiza dependența ulterioară de dezvoltator.

Platforma va crea și cadrul pentru instituirea unui depozit legal pentru resursele digitale.


 

 

B. Digitizarea și expunerea

În cadrul proiectului se urmărește digitizarea și expunerea online a peste 1 milion de resurse culturale.

În acest context, prin digitizare nu se înțelege doar conversia analog-digital (fotografiere, scanare etc.), ci și elaborarea metadatelor descriptive (catalogare/indexare) pentru obiectele digitale rezultate în urma conversie. În destule cazuri, elaborarea metadatelor necesită calificări superioare (bibliografi, istorici de artă, teatrologi, arheologi etc.) și deci este mai costisitoare decât simpla conversie analog-digital.

Catalogarea/indexarea adecvată — ca și regăsirea/consultarea online — vor necesita elaborarea de vocabulare controlate (pentru entități contextuale: persoane, locuri, concepte, evenimente, epoci etc.) multilingve și alinierea acestora cu vocabulare controlate culturale, consacrate pe plan internațional, cum ar fi:

  • AAT [Art and Architecture Thesaurus];
  • TGN [Thesaurus of Geographic Names];
  • RAMEAU [Répertoire d’autorité-matière encyclopédique et alphabétique unifié];
  • ULAN [Union List of Artist Names];
  • LCSH [Library of Congress Subject Headings].

Obiectivul specific al proiectului este de a digitiza și de a expune în culturalia.ro și europeana.eu, următoarele:

Exponate digitale

2016

2017

2018

2019

2020

TOTAL

Cărți

2.500

2.500

2.500

2.500

2.500

12.500

Articole

100.000

100.000

100.000

100.000

100.000

500.000

Fotografii

50.000

50.000

50.000

50.000

50.000

250.000

Documente

50.000

50.000

50.000

50.000

50.000

250.000

Audiograme

20.000

20.000

20.000

20.000

20.000

100.000

Videograme

10.000

10.000

10.000

10.000

10.000

50.000

TOTAL

232.500

232.500

232.500

232.500

232.500

1.162.500

Pentru a reuși procesarea unui volum atât de mare, se impune externalizarea atât a operațiilor de conversie analog-digital (e.g. scanare, fotografiere), cât și a celor de catalogare/indexare, indiferent de subordonarea deținătorilor materialelor analogice (biblioteci, muzee, TVR, SRR).

Externalizarea se va face pe mai multe loturi, diferențiat atât pe categorii de materiale, cât și geografic.

Pentru o calitate adecvată a metadatelor (adică a catalogării/indexării), se va impune contractorilor condiții de calificare a specialiștilor, astfel încât aceștia trebuiască să angajeze chiar personal din instituțiile deținătoare, cunoscători direcți ai materialelor digitizate.

Separat, se va externaliza altor companii controlul de calitate, atât a conversiei, cât și a catalogării/indexării.

 


C. Dotări

Dotările cu echipament de calcul sunt relativ modeste, deoarece baza de date va fi găzduită într-un centru de date (de preferință guvernamental), folosind tehnologii cloud.

Pentru a facilita accesul nevăzătorilor la conținutul bibliotecii digitale, proiectul prevede acordarea a câte 200 de subvenții individuale pe an, pentru achiziția de cititoare de ecran.

 


D. Dezvoltarea de aplicații specifice

Pentru a-i extinde aria culturală și pentru valorificarea superioară a conținutului bibliotecii digitale, se prevăd dezvoltări soft specifice:

  • aplicații pentru dispozitive mobile, pentru achiziția de date pe teren (e.g. date arheologice, monumente, depozite muzeale);
  • galerii/expoziții virtuale cu material cultural specific comunităților etnice;
  • aplicații pentru dispozitive mobile, specifice comunităților etnice;
  • aplicații pentru dispozitive mobile , specifice pentru nevăzători.

 


E. Remarci finale

Comisia Europeană consideră proiectul Bibliotecii Digitale Europene (europeana.eu) cel mai important proiect cultural al său. Este deci firesc ca și Biblioteca Digitală a României (culturalia.ro) să fie considerată un proiect național major. Pe lângă semnificația culturală, trebuie ținut cont și de previzibila sa mare vizibilitate publică și de marele său potențial de material didactic.

În plus, catalogarea/indexarea partajată a colecțiilor instituțiilor de cultură va duce și la o semnificativă economie de muncă calificată și deficitară, având în vedere lipsa cronică de personal de specialitate din muzeele și bibliotecile din România. Mai mult, reutilizând metadatele (i.e. fișele descriptive) elaborate de marile instituții culturale, muzeele și bibliotecile mici vor putea să-și descrie colecțiile la un nivel calitativ comparabil cu cel al instituțiilor naționale.

Din punct de vedere tehnologic, și ținând cont de rapiditatea cu care evoluează tehnologiile informatice, proiectul trebuie realizat la nivel de vârf, pentru a nu necesita schimbări majore, măcar 5 ani.

În plus, deoarece platforma soft va fi open-source, codul-sursă va putea fi disponibil liber/gratuit pentru dezvoltări de alte produse.

Dan Matei

[1] www.poscce.research.ro/uploads/documente-programare/programul-opera-ional-competitivitate-1.pdf (pag. 85: E-cultură)

[2] bineînțeles, comentariile și observațiile critice sunt binevenite.

[3] http://en.wikipedia.org/wiki/Representational_state_transfer

[4] http://www.ifla.org/publications/unimarc-formats-and-related-documentation

[5] http://www.loc.gov/marc/bibliographic/

[6] http://cimec.ro/Metodologice/Programul-DOCPAT.html

[7] http://www.loc.gov/ead/

[8] www.openarchives.org/OAI/openarchivesprotocol.html

[9] www.cidoc-crm.org/official_release_cidoc.html

[10] www.cidoc-crm.org/docs/frbr_oo/frbr_docs/FRBRoo_V2.0_draft.pdf

[11] http://pro.europeana.eu/documents/900548/bb6b51df-ad11-4a78-8d8a-44cc41810f22

[12] http://en.wikipedia.org/wiki/Open_Database_Connectivity

[13] www.w3.org/TR/json-ld

[14] http://collection.britishmuseum.org/

[15] http://www.bl.uk/bibliographic/datafree.html

[16] http://vocab.getty.edu/

[17] http://joinup.ec.europa.eu/system/files/EN/EUPL%20v.1.1%20-%20Licence.pdf