Monthly Archives: May 2015

1. Proiectul „Culturalia – Biblioteca Digitală a Românei și Catalogul Partajat Național”. Preambul

 Obiectivele generale ale proiectului sunt: 

  • să se constituie o bază de date unificată a resurselor culturale (digitale și analogice) existente în România;
  • să se dezvolte o bibliotecă digitală națională, pandant al Bibliotecii Digitale Europene (europeana.eu);
  • să se ofere un portal către (asimptotic) toate resursele culturale online expuse în România;
  • să se reducă deficitul de resurse culturale românești expuse în Biblioteca Digitală Europeană (europeana.eu);
  • să se capteze (asimptotic) toate sursele de informație catalografică, inclusiv prin convertirea resurselor catalografice moștenite [legacy];
  • să se realizeze informatizarea (gratuită) a colecțiilor instituțiilor memoriei (mai ales cele ale bibliotecilor și muzeelor mici);
  • să se economisească – prin partajarea/reutilizarea informației catalografice existente — timp de muncă calificată și resurse bănești;
  • să se ofere o interfață programabilă [API] la baza de date unificată, pentru a permite dezvoltarea independentă de aplicații specifice pentru dispozitive mobile;
  • să se faciliteze împrumutul inter-instituțional de resurse culturale (atât inter-bibliotecar, cât și inter-muzeal – pentru organizarea de expoziții);
  • să se ofere instituțiilor memoriei spațiu de stocare de rezervă pentru obiectele lor digitale;
  • să se implementeze un mecanism de identificare a deținătorilor de drepturi intelectuale;
  • să se inițieze depozitul legal digital;
  • să se instituie mecanismul de urmărire a exporturilor/importurilor (definitive și temporare) a bunurilor culturale;
  • să se faciliteze elaborarea dosarelor de clasare ale bunurilor culturale;
  • să se realizeze informatizarea documentării proceselor de conservare/restaurare a bunurilor culturale.

Câteva scenarii de utilizare [use-cases] ale bazei de date, suport al catalogului partajat: 

  • un utilizator (amator sau profesionist) identifică și consultă în biblioteca digitală o resursă care-l interesează (e.g. carte, articol, obiect de muzeu, document de arhivă);
  • un utilizator identifică în catalogul național o resursă (analogică) care-l interesează și-i identifică și deținătorul, unde poate să o consulte;
  • un muzeograf sau bibliotecar elaborează (asistat) dosarul de clasare a unui bun cultural mobil și acesta e expus online, ceea ce face ca membrii Comisiei Naționale a Muzeelor să-l poată consulta înainte de ședința în care se votează clasarea;
  • o instituție a memoriei digitizează o piesă din colecția sa, o expune online, derivă (asistat) fișa descriptivă a obiectului digital din fișa corespondentului analogic și o marchează pentru expunere în Europeana;
  • un expert actualizează (asistat) fișa descriptivă a unui monument înscris în Lista Monumentelor Istorice;
  • un arheolog înscrie (asistat) un sit arheologic nou descoperit în Repertoriul Arheologic Național;
  • înainte de a fișa o resursă culturală (carte, articol, piesă de muzeu etc.) catalogatorul/indexatorul dintr-o instituție a memoriei verifică dacă nu cumva resursa respectivă este deja fișată, iar dacă da, eventual doar adaugă/modifică elemente ale  acesteia;
  • în procesul de fișare a unei resurse culturale (nefișate în prealabil), catalogatorul/indexatorul reutilizează entități contextuale (persoane, locuri, perioade, concepte etc.) deja elaborate;
  • un arhivist elaborează (asistat) un instrument de evidență [finding aid] pentru un fond, și-l face regăsibil în catalogul național;
  • o bibliotecă nu dispune de un material solicitat de un cititor, dar îl identifică în catalogul național și-l împrumută de la deținător, în beneficiul cititorului;
  • un curator proiectează o expoziție tematică și, folosind catalogul național, identifică piese de interes la alți deținători, pe care le poate împrumuta pentru expoziția sa;
  • un cercetător își elaborează bibliografia unui articol și reutilizează trimiteri bibliografice preexistente sau elaborează înregistrări bibliografice noi, dar folosindu-se de interfața online specifică, care-i ușurează procesul; în plus, la final, sistemul îi poate genera bibliografia completă, într-unul dintre formatele consacrate (e.g. Chicago Manual of Style, MLA, APA);
  • un autor publică un articol online (sau offline) și îi elaborează (asistat) o înregistrare bibliografică, pentru a-l face regăsibil în catalogul național; dacă articolul este expus online, îl înscrie astfel și în Depozitul Legal Digital;
  • o editură elaborează (asistat) fișa CIP a unui volum pe care-l pregătește pentru difuzare, făcându-l astfel regăsibil în catalogul național, chiar înaintea apariției pe piață;
  • un anticariat sau o galerie de artă fișează (asistat) o carte sau un obiect, făcându-le astfel regăsibile în catalogul național;
  • editorul unei reviste elaborează (asistat) cuprinsul numărului următor, făcând astfel regăsibile articolele din acel număr în catalogul național;
  • un amator entuziast digitizează un text literar și-l expune online în Wikisource[1], îi elaborează (asistat) și o fișă bibliografică, făcând textul regăsibil în catalogul național;
  • secretarul literar al unei instituții de spectacole înscrie (asistat) o premieră nouă în Repertoriul Teatral Național;
  • o instituție culturală actualizează seturile sale de date deschise expuse pe http://data.gov.ro/;
  • un cercetător stochează – într-un format standard – un set de date obținute în urma unui experiment sau a unei cercetări de teren, îl fișează (asistat), făcându-l regăsibil în catalogul național;
  • un artist expune online reproducerea digitală a unei creații proprii, o fișează (asistat), făcând-o regăsibilă în catalogul național;
  • un bibliograf profesionist remarcă o eroare într-o fișă elaborată de un amator și o corectează;
  • un curator proiectează o expoziție virtuală tematică, folosind resursele expuse în biblioteca digitală;
  • un critic literar constituie o antologie tematică, folosind texte expuse în biblioteca digitală;
  • un autor/moștenitor semnalează operele asupra cărora deține drepturi intelectuale;
  • un editor dorește să publice o operă și află statutul acesteia (sub copyright, orfană sau în domeniul public) și – dacă e cazul – identifică deținătorul drepturilor intelectuale asupra operei;
  • un cetățean dorește să exporte un bun cultural și inițiază (online) cererea de export, iar autoritatea îndreptățită constituie dosarul de clasare sau eliberează certificatul de export, după caz.

Dan Matei

[03.06.2015]

[1] http://ro.wikisource.org

2. „Culturalia” – Cerințele funcționale

Propunerea proiectului „Culturalia – Biblioteca Digitală a Românei și Catalogul Partajat Național” – în cadrul „Programului Operațional Competitivitate 2014-2020” [POC], Acțiunea 2.3.3 „Îmbunătățirea conținutului digital și a infrastructurii TIC sistemice în domeniile e-educație, e-incluziune, e-sănătate, și e-cultură[1]

(propus de Institutul Național al Patrimoniului, [INP] pt. intervalul 2016 – 2020 [2])

Motivație

Pentru:

  • a urma Recomandarea Comisiei Europene C(2011) 7579;
  • a îmbunătăți semnificativ accesul public (online) la resursele culturale naționale;
  • a oferi o platformă de partajare și cooperare pentru profesioniștii din instituțiile memoriei;
  • a facilita ingerarea metadatelor (i.e. a fișelor descriptive a) resurselor culturale românești în Biblioteca Digitală Europeană (europeana.eu),
  • a îmbunătăți accesul nevăzătorilor la resursele culturale ale României,
  • a spori oferta de material cultural reutilizabil ca material didactic,

proiectul urmărește (în esență):

  1. dezvoltarea unei platforme informatice online de catalog partajat și bibliotecă digitală, disponibilă tuturor instituțiilor culturale din România și publicului larg;
  2. digitizarea și expunerea online (până în 2020) în Biblioteca Digitală a României (culturalia.ro) și în Biblioteca Digitală Europeană (europeana.eu) a peste 1 milion de resurse culturale (texte, imagini, audiograme, videograme).

A. Dezvoltarea platformei online culturalia.ro

Soluția de principiu propusă este realizarea unei platforme online centralizate, administrate de agregatorul național, dar oferită spre utilizare gratuită atât instituțiilor memoriei (biblioteci, muzee, arhive), cât și publicului. Această platformă urmează să susțină atât biblioteca digitală (în sens larg, adică bibliotecă/muzeu/arhivă), cât și catalogul partajat al instituțiilor memoriei, adică ar permite atât alimentarea partajată/cooperativă a acestora, cât și facilitarea accesului public la acestea, pe lângă interoperabilitatea cu Biblioteca Digitală Europeană (europeana.eu).

Tehnic, platforma ar urma să fie „state-of-the-art” (folosind tehnologiile cloud), avându-se în vedere că va trebui să fie operațională măcar 10 ani, în condițiile rapidelor evoluții tehnologice. Ea va trebui să suporte volume semnificative de date. Softul dezvoltat pentru această platformă va fi disponibil în regim open-source, sub licența europeană EUPL [European Union Public Licence], așadar va putea fi liber și gratuit folosit/adaptat/modificat și de alți operatori culturali.

Utilizarea acestei platforme online va degreva instituțiile culturale (mai ales cele mici) de necesitatea de a achiziționa/întreține un sistem informatic specific (e.g. sistem integrat de bibliotecă, sistem de management/gestiune a colecțiilor muzeale) propriu. Desigur, ele vor continua să-și administreze cataloagele și bibliotecile digitale, chiar dacă aceste sunt integrate în baza de date centrală, administrată de agregatorul național.

Mai mult, platforma va permite expunerea de „conținut generat de utilizatori” [UGC – user-generated content].

În plus, platforma propusă va integra bazele naționale de date (curatoriate de către Institutul Național al Patrimoniului), cum ar fi:

  • Inventarul Bunurilor Culturale Mobile Clasate,
  • Lista Monumentelor Istorice,
  • Repertoriul Arheologic Național,
  • Repertoriul Teatral Național,
  • Catalogul Colectiv Național al Incunabulelor,
  • Catalogul Colectiv Național al Cărții Vechi Românești,
  • Ghidul Muzeelor,
  • Cronica Cercetărilor Arheologice,
  • Lăcașurile de Cult din România,
  • Bibliografia de Referință a Cărții Vechi,
  • Repertoriul Creației Muzicale Românești.
  • Muzeul Virtual al Monumentelor Etnografice din Muzeele în Aer Liber,

Așadar, platforma va oferi servicii publice comparabile cu ale altor platforme naționale similare, cum ar fi:

sau transnaționale, cum ar fi:

Platforma va trebui să ofere:

  • un punct generic (și mai multe specifice) de acces public la informații privind patrimoniul cultural — liber la cele de interes public și restricționat la cele confidențiale — inclusiv de pe dispozitive mobile;
  • interfețe programabile deschise (RESTful API [3]) sistemelor informatice care doresc să utilizeze informații privind patrimoniul cultural (e.g. enciclopedii online, expoziții virtuale, biblioteci digitale specializate);
  • mecanisme de schimb de date cu sistemele similare din Europa și din lume, mai ales cu Biblioteca Digitală Europeană (europeana.eu);
  • mecanisme care să permită personalului instituțiilor culturale să coopereze la elaborarea metadatelor (adică a fișelor descriptive), evitând astfel duplicarea eforturilor de catalogare/indexare a resurselor culturale: cărți, monede, „entitățile contextuale” (persoane, locuri, evenimente, concepte etc.) etc.;
  • proceduri de asistare a instituțiilor culturale la elaborarea dosarelor de clasare a bunurilor culturale;
  • mecanisme de conversie (și integrare) a materialului catalografic moștenit, din formate răspândite (e.g. UNIMARC [4], MARC21 [5], DOCPAT [6], EAD [7]).

Rezultatele concrete așteptate în urma implementării acestei platforme, sunt:

  • o interfață-utilizator publică generică pentru acces online la resursele culturale – incluzând baleiere cartografică și cronologică (timeline);
  • interfețe-utilizator în limbile română, maghiară și engleză (din start);
  • interfețe programabile (API [Application Programming Interface]) pentru agenții soft;
  • interfețe-utilizator pentru administrarea, respectiv expunerea online a cataloagelor colecțiilor instituțiilor memoriei (obiecte de muzeu, texte, hărți etc.) pe saitul bibliotecii/ muzeului/arhivei;
  • un mecanism care să faciliteze instituțiilor publice expunerea de seturi de date deschise, pe saitul guvernamental specific: http://data.gov.ro;
  • mecanisme standard de expunere offline de date (e.g. OAI-PMH [Open Archives Initiative Protocol for Metadata Harvesting] [8]).

Din rațiuni de interoperabilitate, platforma:

  • va fi construită pe un model conceptual care să permită interpretarea unitară a metadatelor folosite în instituțiile memoriei; acesta se va baza pe modelele conceptuale Conceptual Reference Model [CIDOC-CRM] [9] (ISO 21127:2014) pentru domeniul muzeal și Functional Requirements for Bibliographic Data – object-oriented definition and mapping to FRBRer [FRBRoo] [10] pentru domeniul biblioteconomic;
  • va folosi drept cadru de interoperabilitatea modelul de date EDM [Europeana Data Model] [11], adoptat de Biblioteca Digitală Europeană (europeana.eu);
  • comunicarea cu baza de date-suport se va face printr-o interfață ODBC [12];
  • va permite exportul/importul de date în formate de serializare standard, cum ar fi JSON-LD [13], putând astfel să se profite de datele deschise oferite liber de mari instituții culturale ale lumii, cum ar fi British Museum [14] sau British Library [15], precum și de reputatele vocabulare controlate dezvoltate de Fundația Getty [16].

Alte cerințe specifice:

  • codul-sursă specific elaborat pentru implementarea platformei va fi disponibil sub licența EUPL v.1.1. [European Union Public Licence] [17], promovată de Comisia Europeană;
  • nu se vor folosi la implementarea platformei componente soft proprietare, și trebuie să fie disponibile sub licențe deschise;
  • dezvoltarea platformei se va face gradual, astfel încât aceasta să poată fi folosită pentru achiziție de date încă din primul an;
  • dezvoltarea platformei se va face în continuu contact cu beneficiarul (agregatorul național), astfel încât acesta să-i poată monitoriza evoluția și să fie de la început familiarizat cu codul-sursă, pentru a se minimiza dependența ulterioară de dezvoltator.

Platforma va crea și cadrul pentru instituirea unui depozit legal pentru resursele digitale.


 

 

B. Digitizarea și expunerea

În cadrul proiectului se urmărește digitizarea și expunerea online a peste 1 milion de resurse culturale.

În acest context, prin digitizare nu se înțelege doar conversia analog-digital (fotografiere, scanare etc.), ci și elaborarea metadatelor descriptive (catalogare/indexare) pentru obiectele digitale rezultate în urma conversie. În destule cazuri, elaborarea metadatelor necesită calificări superioare (bibliografi, istorici de artă, teatrologi, arheologi etc.) și deci este mai costisitoare decât simpla conversie analog-digital.

Catalogarea/indexarea adecvată — ca și regăsirea/consultarea online — vor necesita elaborarea de vocabulare controlate (pentru entități contextuale: persoane, locuri, concepte, evenimente, epoci etc.) multilingve și alinierea acestora cu vocabulare controlate culturale, consacrate pe plan internațional, cum ar fi:

  • AAT [Art and Architecture Thesaurus];
  • TGN [Thesaurus of Geographic Names];
  • RAMEAU [Répertoire d’autorité-matière encyclopédique et alphabétique unifié];
  • ULAN [Union List of Artist Names];
  • LCSH [Library of Congress Subject Headings].

Obiectivul specific al proiectului este de a digitiza și de a expune în culturalia.ro și europeana.eu, următoarele:

Exponate digitale

2016

2017

2018

2019

2020

TOTAL

Cărți

2.500

2.500

2.500

2.500

2.500

12.500

Articole

100.000

100.000

100.000

100.000

100.000

500.000

Fotografii

50.000

50.000

50.000

50.000

50.000

250.000

Documente

50.000

50.000

50.000

50.000

50.000

250.000

Audiograme

20.000

20.000

20.000

20.000

20.000

100.000

Videograme

10.000

10.000

10.000

10.000

10.000

50.000

TOTAL

232.500

232.500

232.500

232.500

232.500

1.162.500

Pentru a reuși procesarea unui volum atât de mare, se impune externalizarea atât a operațiilor de conversie analog-digital (e.g. scanare, fotografiere), cât și a celor de catalogare/indexare, indiferent de subordonarea deținătorilor materialelor analogice (biblioteci, muzee, TVR, SRR).

Externalizarea se va face pe mai multe loturi, diferențiat atât pe categorii de materiale, cât și geografic.

Pentru o calitate adecvată a metadatelor (adică a catalogării/indexării), se va impune contractorilor condiții de calificare a specialiștilor, astfel încât aceștia trebuiască să angajeze chiar personal din instituțiile deținătoare, cunoscători direcți ai materialelor digitizate.

Separat, se va externaliza altor companii controlul de calitate, atât a conversiei, cât și a catalogării/indexării.

 


C. Dotări

Dotările cu echipament de calcul sunt relativ modeste, deoarece baza de date va fi găzduită într-un centru de date (de preferință guvernamental), folosind tehnologii cloud.

Pentru a facilita accesul nevăzătorilor la conținutul bibliotecii digitale, proiectul prevede acordarea a câte 200 de subvenții individuale pe an, pentru achiziția de cititoare de ecran.

 


D. Dezvoltarea de aplicații specifice

Pentru a-i extinde aria culturală și pentru valorificarea superioară a conținutului bibliotecii digitale, se prevăd dezvoltări soft specifice:

  • aplicații pentru dispozitive mobile, pentru achiziția de date pe teren (e.g. date arheologice, monumente, depozite muzeale);
  • galerii/expoziții virtuale cu material cultural specific comunităților etnice;
  • aplicații pentru dispozitive mobile, specifice comunităților etnice;
  • aplicații pentru dispozitive mobile , specifice pentru nevăzători.

 


E. Remarci finale

Comisia Europeană consideră proiectul Bibliotecii Digitale Europene (europeana.eu) cel mai important proiect cultural al său. Este deci firesc ca și Biblioteca Digitală a României (culturalia.ro) să fie considerată un proiect național major. Pe lângă semnificația culturală, trebuie ținut cont și de previzibila sa mare vizibilitate publică și de marele său potențial de material didactic.

În plus, catalogarea/indexarea partajată a colecțiilor instituțiilor de cultură va duce și la o semnificativă economie de muncă calificată și deficitară, având în vedere lipsa cronică de personal de specialitate din muzeele și bibliotecile din România. Mai mult, reutilizând metadatele (i.e. fișele descriptive) elaborate de marile instituții culturale, muzeele și bibliotecile mici vor putea să-și descrie colecțiile la un nivel calitativ comparabil cu cel al instituțiilor naționale.

Din punct de vedere tehnologic, și ținând cont de rapiditatea cu care evoluează tehnologiile informatice, proiectul trebuie realizat la nivel de vârf, pentru a nu necesita schimbări majore, măcar 5 ani.

În plus, deoarece platforma soft va fi open-source, codul-sursă va putea fi disponibil liber/gratuit pentru dezvoltări de alte produse.

Dan Matei

[1] www.poscce.research.ro/uploads/documente-programare/programul-opera-ional-competitivitate-1.pdf (pag. 85: E-cultură)

[2] bineînțeles, comentariile și observațiile critice sunt binevenite.

[3] http://en.wikipedia.org/wiki/Representational_state_transfer

[4] http://www.ifla.org/publications/unimarc-formats-and-related-documentation

[5] http://www.loc.gov/marc/bibliographic/

[6] http://cimec.ro/Metodologice/Programul-DOCPAT.html

[7] http://www.loc.gov/ead/

[8] www.openarchives.org/OAI/openarchivesprotocol.html

[9] www.cidoc-crm.org/official_release_cidoc.html

[10] www.cidoc-crm.org/docs/frbr_oo/frbr_docs/FRBRoo_V2.0_draft.pdf

[11] http://pro.europeana.eu/documents/900548/bb6b51df-ad11-4a78-8d8a-44cc41810f22

[12] http://en.wikipedia.org/wiki/Open_Database_Connectivity

[13] www.w3.org/TR/json-ld

[14] http://collection.britishmuseum.org/

[15] http://www.bl.uk/bibliographic/datafree.html

[16] http://vocab.getty.edu/

[17] http://joinup.ec.europa.eu/system/files/EN/EUPL%20v.1.1%20-%20Licence.pdf