(NB. Publicat la 10 mai 2015)
Propunerea proiectului „Culturalia – Biblioteca Digitală a Românei și Catalogul Partajat Național” – în cadrul „Programului Operațional Competitivitate 2014-2020” [POC], Acțiunea 2.3.3 „Îmbunătățirea conținutului digital și a infrastructurii TIC sistemice în domeniile e-educație, e-incluziune, e-sănătate, și e-cultură” [1]
(propus de Institutul Național al Patrimoniului, [INP] pt. intervalul 2016 – 2020 [2])
Motivație
Pentru:
- a urma Recomandarea Comisiei Europene C(2011) 7579;
- a îmbunătăți semnificativ accesul public (online) la resursele culturale naționale;
- a oferi o platformă de partajare și cooperare pentru profesioniștii din instituțiile memoriei;
- a facilita ingerarea metadatelor (i.e. a fișelor descriptive a) resurselor culturale românești în Biblioteca Digitală Europeană (europeana.eu),
- a îmbunătăți accesul nevăzătorilor la resursele culturale ale României,
- a spori oferta de material cultural reutilizabil ca material didactic,
proiectul urmărește (în esență):
- dezvoltarea unei platforme informatice online de catalog partajat și bibliotecă digitală, disponibilă tuturor instituțiilor culturale din România și publicului larg;
- digitizarea și expunerea online (până în 2020) în Biblioteca Digitală a României (culturalia.ro) și în Biblioteca Digitală Europeană (europeana.eu) a peste 1 milion de resurse culturale (texte, imagini, audiograme, videograme).
A. Dezvoltarea platformei online culturalia.ro
Soluția de principiu propusă este realizarea unei platforme online centralizate, administrate de agregatorul național, dar oferită spre utilizare gratuită atât instituțiilor memoriei (biblioteci, muzee, arhive), cât și publicului. Această platformă urmează să susțină atât biblioteca digitală (în sens larg, adică bibliotecă/muzeu/arhivă), cât și catalogul partajat al instituțiilor memoriei, adică ar permite atât alimentarea partajată/cooperativă a acestora, cât și facilitarea accesului public la acestea, pe lângă interoperabilitatea cu Biblioteca Digitală Europeană (europeana.eu).
Tehnic, platforma ar urma să fie „state-of-the-art” (folosind tehnologiile cloud), avându-se în vedere că va trebui să fie operațională măcar 10 ani, în condițiile rapidelor evoluții tehnologice. Ea va trebui să suporte volume semnificative de date. Softul dezvoltat pentru această platformă va fi disponibil în regim open-source, sub licența europeană EUPL [European Union Public Licence], așadar va putea fi liber și gratuit folosit/adaptat/modificat și de alți operatori culturali.
Utilizarea acestei platforme online va degreva instituțiile culturale (mai ales cele mici) de necesitatea de a achiziționa/întreține un sistem informatic specific (e.g. sistem integrat de bibliotecă, sistem de management/gestiune a colecțiilor muzeale) propriu. Desigur, ele vor continua să-și administreze cataloagele și bibliotecile digitale, chiar dacă aceste sunt integrate în baza de date centrală, administrată de agregatorul național.
Mai mult, platforma va permite expunerea de „conținut generat de utilizatori” [UGC – user-generated content].
În plus, platforma propusă va integra bazele naționale de date (curatoriate de către Institutul Național al Patrimoniului), cum ar fi:
- Inventarul Bunurilor Culturale Mobile Clasate,
- Lista Monumentelor Istorice,
- Repertoriul Arheologic Național,
- Repertoriul Teatral Național,
- Catalogul Colectiv Național al Incunabulelor,
- Catalogul Colectiv Național al Cărții Vechi Românești,
- Ghidul Muzeelor,
- Cronica Cercetărilor Arheologice,
- Lăcașurile de Cult din România,
- Bibliografia de Referință a Cărții Vechi,
- Repertoriul Creației Muzicale Românești.
- Muzeul Virtual al Monumentelor Etnografice din Muzeele în Aer Liber,
Așadar, platforma va oferi servicii publice comparabile cu ale altor platforme naționale similare, cum ar fi:
sau transnaționale, cum ar fi:
Platforma va trebui să ofere:
- un punct generic (și mai multe specifice) de acces public la informații privind patrimoniul cultural — liber la cele de interes public și restricționat la cele confidențiale — inclusiv de pe dispozitive mobile;
- interfețe programabile deschise (RESTful API [3]) sistemelor informatice care doresc să utilizeze informații privind patrimoniul cultural (e.g. enciclopedii online, expoziții virtuale, biblioteci digitale specializate);
- mecanisme de schimb de date cu sistemele similare din Europa și din lume, mai ales cu Biblioteca Digitală Europeană (europeana.eu);
- mecanisme care să permită personalului instituțiilor culturale să coopereze la elaborarea metadatelor (adică a fișelor descriptive), evitând astfel duplicarea eforturilor de catalogare/indexare a resurselor culturale: cărți, monede, „entitățile contextuale” (persoane, locuri, evenimente, concepte etc.) etc.;
- proceduri de asistare a instituțiilor culturale la elaborarea dosarelor de clasare a bunurilor culturale;
- mecanisme de conversie (și integrare) a materialului catalografic moștenit, din formate răspândite (e.g. UNIMARC [4], MARC21 [5], DOCPAT [6], EAD [7]).
Rezultatele concrete așteptate în urma implementării acestei platforme, sunt:
- o interfață-utilizator publică generică pentru acces online la resursele culturale – incluzând baleiere cartografică și cronologică (timeline);
- interfețe-utilizator în limbile română, maghiară și engleză (din start);
- interfețe programabile (API [Application Programming Interface]) pentru agenții soft;
- interfețe-utilizator pentru administrarea, respectiv expunerea online a cataloagelor colecțiilor instituțiilor memoriei (obiecte de muzeu, texte, hărți etc.) pe saitul bibliotecii/ muzeului/arhivei;
- un mecanism care să faciliteze instituțiilor publice expunerea de seturi de date deschise, pe saitul guvernamental specific: http://data.gov.ro;
- mecanisme standard de expunere offline de date (e.g. OAI-PMH [Open Archives Initiative Protocol for Metadata Harvesting] [8]).
Din rațiuni de interoperabilitate, platforma:
- va fi construită pe un model conceptual care să permită interpretarea unitară a metadatelor folosite în instituțiile memoriei; acesta se va baza pe modelele conceptuale Conceptual Reference Model [CIDOC-CRM] [9] (ISO 21127:2014) pentru domeniul muzeal și Functional Requirements for Bibliographic Data – object-oriented definition and mapping to FRBRer [FRBRoo] [10] pentru domeniul biblioteconomic;
- va folosi drept cadru de interoperabilitatea modelul de date EDM [Europeana Data Model] [11], adoptat de Biblioteca Digitală Europeană (europeana.eu);
- comunicarea cu baza de date-suport se va face printr-o interfață ODBC [12];
- va permite exportul/importul de date în formate de serializare standard, cum ar fi JSON-LD [13], putând astfel să se profite de datele deschise oferite liber de mari instituții culturale ale lumii, cum ar fi British Museum [14] sau British Library [15], precum și de reputatele vocabulare controlate dezvoltate de Fundația Getty [16].
Alte cerințe specifice:
- codul-sursă specific elaborat pentru implementarea platformei va fi disponibil sub licența EUPL v.1.1. [European Union Public Licence] [17], promovată de Comisia Europeană;
- nu se vor folosi la implementarea platformei componente soft proprietare, și trebuie să fie disponibile sub licențe deschise;
- dezvoltarea platformei se va face gradual, astfel încât aceasta să poată fi folosită pentru achiziție de date încă din primul an;
- dezvoltarea platformei se va face în continuu contact cu beneficiarul (agregatorul național), astfel încât acesta să-i poată monitoriza evoluția și să fie de la început familiarizat cu codul-sursă, pentru a se minimiza dependența ulterioară de dezvoltator.
Platforma va crea și cadrul pentru instituirea unui depozit legal pentru resursele digitale.
B. Digitizarea și expunerea
În cadrul proiectului se urmărește digitizarea și expunerea online a peste 1 milion de resurse culturale.
În acest context, prin digitizare nu se înțelege doar conversia analog-digital (fotografiere, scanare etc.), ci și elaborarea metadatelor descriptive (catalogare/indexare) pentru obiectele digitale rezultate în urma conversie. În destule cazuri, elaborarea metadatelor necesită calificări superioare (bibliografi, istorici de artă, teatrologi, arheologi etc.) și deci este mai costisitoare decât simpla conversie analog-digital.
Catalogarea/indexarea adecvată — ca și regăsirea/consultarea online — vor necesita elaborarea de vocabulare controlate (pentru entități contextuale: persoane, locuri, concepte, evenimente, epoci etc.) multilingve și alinierea acestora cu vocabulare controlate culturale, consacrate pe plan internațional, cum ar fi:
- AAT [Art and Architecture Thesaurus];
- TGN [Thesaurus of Geographic Names];
- RAMEAU [Répertoire d’autorité-matière encyclopédique et alphabétique unifié];
- ULAN [Union List of Artist Names];
- LCSH [Library of Congress Subject Headings].
Obiectivul specific al proiectului este de a digitiza și de a expune în culturalia.ro și europeana.eu, următoarele:
Exponate digitale |
2016
|
2017
|
2018
|
2019
|
2020
|
TOTAL
|
Cărți |
2.500
|
2.500
|
2.500
|
2.500
|
2.500
|
12.500
|
Articole |
100.000
|
100.000
|
100.000
|
100.000
|
100.000
|
500.000
|
Fotografii |
50.000
|
50.000
|
50.000
|
50.000
|
50.000
|
250.000
|
Documente |
50.000
|
50.000
|
50.000
|
50.000
|
50.000
|
250.000
|
Audiograme |
20.000
|
20.000
|
20.000
|
20.000
|
20.000
|
100.000
|
Videograme |
10.000
|
10.000
|
10.000
|
10.000
|
10.000
|
50.000
|
TOTAL |
232.500
|
232.500
|
232.500
|
232.500
|
232.500
|
1.162.500
|
Pentru a reuși procesarea unui volum atât de mare, se impune externalizarea atât a operațiilor de conversie analog-digital (e.g. scanare, fotografiere), cât și a celor de catalogare/indexare, indiferent de subordonarea deținătorilor materialelor analogice (biblioteci, muzee, TVR, SRR).
Externalizarea se va face pe mai multe loturi, diferențiat atât pe categorii de materiale, cât și geografic.
Pentru o calitate adecvată a metadatelor (adică a catalogării/indexării), se va impune contractorilor condiții de calificare a specialiștilor, astfel încât aceștia trebuiască să angajeze chiar personal din instituțiile deținătoare, cunoscători direcți ai materialelor digitizate.
Separat, se va externaliza altor companii controlul de calitate, atât a conversiei, cât și a catalogării/indexării.
C. Dotări
Dotările cu echipament de calcul sunt relativ modeste, deoarece baza de date va fi găzduită într-un centru de date (de preferință guvernamental), folosind tehnologii cloud.
Pentru a facilita accesul nevăzătorilor la conținutul bibliotecii digitale, proiectul prevede acordarea a câte 200 de subvenții individuale pe an, pentru achiziția de cititoare de ecran.
D. Dezvoltarea de aplicații specifice
Pentru a-i extinde aria culturală și pentru valorificarea superioară a conținutului bibliotecii digitale, se prevăd dezvoltări soft specifice:
- aplicații pentru dispozitive mobile, pentru achiziția de date pe teren (e.g. date arheologice, monumente, depozite muzeale);
- galerii/expoziții virtuale cu material cultural specific comunităților etnice;
- aplicații pentru dispozitive mobile, specifice comunităților etnice;
- aplicații pentru dispozitive mobile , specifice pentru nevăzători.
E. Remarci finale
Comisia Europeană consideră proiectul Bibliotecii Digitale Europene (europeana.eu) cel mai important proiect cultural al său. Este deci firesc ca și Biblioteca Digitală a României (culturalia.ro) să fie considerată un proiect național major. Pe lângă semnificația culturală, trebuie ținut cont și de previzibila sa mare vizibilitate publică și de marele său potențial de material didactic.
În plus, catalogarea/indexarea partajată a colecțiilor instituțiilor de cultură va duce și la o semnificativă economie de muncă calificată și deficitară, având în vedere lipsa cronică de personal de specialitate din muzeele și bibliotecile din România. Mai mult, reutilizând metadatele (i.e. fișele descriptive) elaborate de marile instituții culturale, muzeele și bibliotecile mici vor putea să-și descrie colecțiile la un nivel calitativ comparabil cu cel al instituțiilor naționale.
Din punct de vedere tehnologic, și ținând cont de rapiditatea cu care evoluează tehnologiile informatice, proiectul trebuie realizat la nivel de vârf, pentru a nu necesita schimbări majore, măcar 5 ani.
În plus, deoarece platforma soft va fi open-source, codul-sursă va putea fi disponibil liber/gratuit pentru dezvoltări de alte produse.
Dan Matei
[1] www.poscce.research.ro/uploads/documente-programare/programul-opera-ional-competitivitate-1.pdf (pag. 85: E-cultură)
[2] bineînțeles, comentariile și observațiile critice sunt binevenite.
[3] http://en.wikipedia.org/wiki/Representational_state_transfer
[4] http://www.ifla.org/publications/unimarc-formats-and-related-documentation
[5] http://www.loc.gov/marc/bibliographic/
[6] http://cimec.ro/Metodologice/Programul-DOCPAT.html
[7] http://www.loc.gov/ead/
[8] www.openarchives.org/OAI/openarchivesprotocol.html
[9] www.cidoc-crm.org/official_release_cidoc.html
[10] www.cidoc-crm.org/docs/frbr_oo/frbr_docs/FRBRoo_V2.0_draft.pdf
[11] http://pro.europeana.eu/documents/900548/bb6b51df-ad11-4a78-8d8a-44cc41810f22
[12] http://en.wikipedia.org/wiki/Open_Database_Connectivity
[13] www.w3.org/TR/json-ld
[14] http://collection.britishmuseum.org/
[15] http://www.bl.uk/bibliographic/datafree.html
[16] http://vocab.getty.edu/
[17] http://joinup.ec.europa.eu/system/files/EN/EUPL%20v.1.1%20-%20Licence.pdf