(NB. Publicat la 8 noiembrie 2016)
7. E-Cultura: întrebări și răspunsuri
Într-o discuție la Biblioteca Națională având drept subiect Proiectul E-Cultura, mi s-au pus câteva întrebări legitime. Sper ca răspunsurile să fie edificatoare și mai sper ca ele să lămurească nu doar bibliotecarii din Biblioteca Națională.
1. Care este calitatea dvs. în proiectul E-Cultura ?
Instituția mea, Institutul Național al Patrimoniului [INP] – în calitate de agregator național pentru Biblioteca Digitală Europeană (europeana.eu [1]) – a propus acest proiect în 2014, ca parte a Agendei Digitale pentru România. El a fost inclus în Programul Operațional Competitivitate [POC] [2], și anume în Acțiunea 2.3.3 „Îmbunătățirea conținutului digital și a infrastructurii TIC sistemice în domeniul e-educație, e- incluziune, e-sănătate și e-cultură”. Fiind responsabil în cadrul INP pentru activitatea de agregare, am fost unul dintre cei care au formulat tema proiectului. Pe durata desfășurării proiectului, probabil voi fi persoana de legătură cu Biroul Europeana de la Haga.
2. Dar calitatea Ministerului Culturii ?
În cadrul programului POC – Axa prioritară 2, Ministerul Culturii este desemnat „partener implicat pentru domeniul e-cultură”.
3. Care sunt partenerii care au acceptat oficial invitația de a participa la acest proiect ?
Având în vedere că proiectul este abia în fază de elaborare a studiului de fezabilitate, este prematur să se vorbească de invitații oficiale. Opțiuni au fost exprimate de majoritatea muzeelor naționale, de Arhivele Naționale, de Arhiva de Filme, de Societatea Română de Radiodifuziune, de Televiziunea Română, de Biblioteca Metropolitană București, de Institutul Național al Patrimoniului, de BCU Iași și de încă câteva instituții culturale.
4. Proiectul își propune realizarea unei platforme de bibliotecă digitală, a unei baze de date, a unui portal ?
Toate la un loc… În esență, platforma informatică culturalia.ro va conține un catalog partajat de resurse culturale (texte, imagini, audiograme, videograme, 3D), atât fizice, cât și digitale, cu alte cuvinte metadate (i.e. fișe descriptive). Metadatele asociate resurselor digitale (care vor conține și link-uri către aceste resurse) vor constitui biblioteca digitală. Spre deosebire însă de europeana.eu – a cărui pandant național va fi –, culturalia.ro vă putea stoca și obiecte digitale propriu-zise. Adică furnizorii – care vor dori ! – vor putea să-și păstreze în repozitul digital al platformei obiectele digitale (sau doar copii de siguranță ale acestora). Așadar, platforma poate fi văzută și ca un portal către resursele culturale digitale ale contributorilor.
5. Sistemul pe care îl propuneți nu prevede în niciun fel circuitul de achiziție și de evidență, nici al documentelor în format tradițional, nici al documentelor digitizate. Cum își pot gestiona bibliotecile/instituțiile mici colecțiile proprii în acest sistem ?
Platforma Culturalia nu-și propune să înlocuiască sistemele integrate de bibliotecă/muzeu. Contributorii vor putea să-și facă evidența ca în orice catalog informatizat. Desigur, când se va proiecta tehnic sistemul, bibliotecarii vor fi consultați, pentru a se identifica cerințele funcționale de detaliu.
Sistemul nu își propune să rezolve problema achizițiilor. Această problemă poate că e mai firesc să fie rezolvată prin sistemele locale de contabilitate (pentru instituțiile ce nu au sisteme integrate locale).
6. Care sunt avantajele bibliotecilor mari prin utilizarea acestui sistem ?
(Nu doar pentru bibliotecile mari…) a) Mare economie de efort de catalogare, prin reutilizarea fișelor deja existente. b) O cale importantă de expunere a colecției proprii. c) Acces la un mecanism eficient de împrumut inter-bibliotecar.
7. Cine va plăti mentenanța sistemului ?
Ministerul Culturii.
8. Ne puteți da un exemplu de o astfel de platformă care funcționează ?
Catalogul partajat (emblematic): Worldcat [3]. Biblioteci digitale: Europeana [1], Deutsche Digitale Bibliothek [4], Culturaitalia [5].
9. Putem vorbi de mecanisme de prezervare în cadrul proiectului ?
Da, din moment ce contributorii vor putea să-și stocheze copii de siguranță într-un centru de date de încredere.
10. Care este componenta de prezervare în acest proiect ?
Repozitul digital al platformei culturalia.ro.
11. Care sunt standardele, regulamentele, regulile și normele în vigoare pe care le aveți în vedere în realizarea proiectului ?
Standarde catalografice: CIDOC-CRM [6], FRBRoo [7], EDM [8], EAD [9]. Standardul pentru metadatele tehnice: METS [10]. Standardul pentru interoperabilitatea imaginilor digitale: IIIF [11].
Nu există încă regulamente și norme naționale pentru o asemenea întreprindere (sui generis). Acestea vor trebui elaborate de comunitățile profesionale afectate (bibliotecari, muzeografi, arhiviști).
12. Multe dintre instituțiile vizate de proiect sunt deja informatizate și folosesc sisteme integrate care sunt validate și utilizate la nivel internațional (de peste 15 ani). Care este poziția e-cultura în legătură cu aceste aspecte ?
Platforma Culturalia nu va înlocui sistemele integrate locale. Va oferi însă a) o interfață programată (API – Application Programming Interface) pentru ca aplicații/sisteme locale să poată comunica online cu catalogul partajat și b) un format de schimb pentru importul/exportul offline de date.
13. Cine va asigura sustenabilitatea proiectului, după încheierea acestuia ?
Ministerul Culturii.
14. Ce tehnologii software și hardware sunt folosite în dezvoltarea proiectului ?
Nu știm încă. Ce ne va oferi dezvoltatorul care va câștiga licitația. În orice caz, se va cere insistent ca tehnologiile folosite să fie de nivelul cel mai avansat, pentru că e puțin probabil ca în următorii 10 ani să se obțină fonduri pentru modernizarea sistemului.
15. Cum este asumată mentenanța sistemelor și cine este responsabil de aceasta ?
Platforma Culturalia va fi găzduită într-un centru de date al unei instituții publice specializate. Aceasta va asigura mentenanța infrastructurii informatice. Mentenanța softului specific va fi – probabil — externalizată de către Ministerul Culturii, așa cum se procedează cu mai toate sistemele informatice publice de nivel național.
16. Cum se va face conversia datelor ?
Se vor scrie programe specifice de conversie la formatul de schimb de date ce va fi elaborat în cadrul proiectului.
17. Unul dintre „scenariile de utilizare ale bazei de date, suport al catalogului partajat” este următorul: „o editură elaborează (asistat) fișa CIP a unui volum pe care-l pregătește pentru difuzare…”. În viziunea dvs., cum se va desfășura efectiv acest proces ? (Ce va face editorul ? Ce trebuie să facă bibliotecarul ? Ce instrumente vor fi folosite ? etc.).
Ca și până acum, editorul va elabora fișa preliminară pentru CIP (precum oricare fișă bibliografică introdusă în catalogul partajat), iar bibliotecarul specializat din Biblioteca Națională o va corija, dacă e cazul. După aceea, editorul o va prelua (gata formatată), pentru a fi inclusă în șpaltul ediției.
Dar acest mecanism nu-i va fi impus Bibliotecii Naționale. Mecanismul actual va putea fi continuat, în detrimentul productivității, desigur.
18. Cum se va putea exercita controlul bibliografic dacă descrierile vor fi realizate în „colaborare” cu profesioniștii ? În ce va consta această „colaborare” ?
Dacă un „amator” sau un catalogator neexperimentat este primul care elaborează fișa catalografică a unei resurse și face erori sau lasă descrierea prea sumară, catalogatorul experimentat poate interveni și corija/îmbogăți acea fișă. Așa cum se întâmplă la Worldcat de 40 de ani, de pildă.
Modul în care se va reglementa controlul de calitate a metadatelor este o problemă deschisă și serioasă, iar asociațiile profesionale vor fi invitate să convină asupra mecanismelor specifice. Din fericire, există experiență internațională în acest domeniu.
19. „O bibliotecă înregistrează în catalogul partajat o carte, iar sistemul verifică (automat), folosindu-se de ISBN-ul respectivei ediții, dacă editura a depus cartea în Depozitul Legal, iar dacă nu, sistemul avertizează (automat) atât editura, cât și Biblioteca Națională”. Cum se va putea realiza acesta ?
Atât editura, cât și Biblioteca Națională vor primi câte o alertă. Dar – în prealabil — catalogatorul va fi avertizat, fiindcă poate să fie vorba de o simplă eroare de transcriere.
20. Considerați că există probleme de legislație în ceea ce privește buna desfășurare a proiectului, având în vedere faptul că instituțiile vizate sunt subordonate unor ordonatori de credite diferiți, iar legislația în vigoare nu include toate aspectele dezvoltate în proiect ?
După știința mea, nici o problemă. Sistemul nu cred că impune nici o ajustare legislativă. Dar și dacă s-ar descoperi că este nevoie de o astfel de ajustare, Ministerul Culturii o va propune, desigur.
O majoră actualizare s-ar impune la Legea Depozitului Legal, și anume instituirea Depozitului Legal Digital. Dar această actualizare nu este impusă de acest proiect, ci de rezolvarea unei probleme culturale acute.
21. Care este utilitatea, în cadrul proiectului, a vocabularelor controlate străine ? Mai precis, cum se realizează echivalarea între descriptorii LCSH, Rameau și cei din numeroasele vocabulare Controlate utilizate de bibliotecile din România ?
Vocabularele controlate consacrate pe plan internațional (e.g. AAT [12], ULAN [13], TGN [14], RAMEAU [15]) vor fi importate/convertite/unificate în sistem și vor constitui „scheletul” repertoriului de entități contextuale (persoane, locuri, concepte, perioade, evenimente, subiecte — ceea ce tradițional se cheamă „fișiere de autoritate”) al catalogului partajat. Pe de o parte, descrierile catalografice vor putea invoca direct aceste entități contextuale, făcând fișele regăsibile și pentru utilizatorii care formulează interogări în altă limbă decât româna. Pe de altă parte, catalogatorii vor putea adăuga termenilor din aceste vocabulare echivalențele românești. În fine, alinierea eventualelor vocabulare controlate românești la cele consacrate, se va face cu trudă, termen cu termen. Deci, în timp. (Poate cu ocazia asta se va valorifica și Lives-Ro, i.e. efortul de traducere a RAMEAU.) Apropo: și deduplicările se vor face cu trudă, fără îndoială. Dar merită efortul.
22. Care este utilitatea încărcării în Europeana a 500.000 de articole din periodicele de secol XIX, scanate deja și disponibile online, periodice care sunt, în marea lor majoritate, de tip text, în condițiile în care accentul în Europeana se pune pe imagine ?
Nu există un asemenea „accent” în Europeana. Deloc nu sunt favorizate imaginile în detrimentul textelor. Doar că imaginile sunt – de regulă – ceva mai ușor de digitizat/catalogat, deci au fost încărcate mai multe. Chiar și așa, la 07.11.2016, în Europeana sunt: imagini 29.707.565, texte 22.198.071, deci un raport de doar 1,34 la 1. Când sunt expuse peste 22 de milioane de texte, e greu de suspectat o defavorizare a patrimoniului scris.
23. În cadrul proiectului prealabil de digitizare s-a întocmit o documentație detaliată privind starea de conservare a fondului care urmează a fi scanat, precum și o documentație istorică privind documentele respective ?
Nu. Va fi la latitudinea contributorilor ce vor scana și expune în Culturalia. Așadar fiecare în parte va fi răspunzător de procedurile de digitizare a materialului propriu.
24. Digitizarea trebuie să garanteze că sunt respectate principiile conservării, mai ales în cazul suporturilor fragilizate, al cernelurilor alterate ale documentelor de colecții speciale. În situația în care, printre specialiștii amintiți în proiectul-cadru, nu figurează în primul rând conservatorii, cine va asigura respectarea normelor de conservare și cine își va asuma riscurile ? Există o asigurare semnată privind plata daunelor în cazul unor accidente semnalate imediat sau în timp ?
Digitizările se vor realiza în cadrul instituțiilor deținătoare (ca și până acum). Așadar, ele se vor îngriji de conservarea propriilor materiale.
25. Cine are dreptul asupra copiilor. Mai precis, cine încasează taxa de reproducere ? La punerea în circuit a documentelor, marcarea nu este suficientă, întrucât complexitatea gestiunii drepturilor de proprietate impune stabilirea unor metadate administrative prin care să fie evitată exploatarea diferită a datelor, în funcție de diferitele legislații.
În Biblioteca Digitală a Românei vor fi expuse doar resursele ce pot fi accesate gratuit. Problema gestiunii drepturilor rămâne în sarcina deținătorilor. A nu se uita că, în general, obiectele digitale expuse prin portalul Culturalia vor fi stocate și reproduse de pe serverele deținătorilor. Doar deținătorii care nu au infrastructura informatică (i.e. sait propriu) ca să-și găzduiască obiectele digitale le vor expune din repozitul platformei Culturalia. Cu alte cuvinte, expunerea prin portalul Culturalia nu afectează drepturile intelectuale mai mult decât expunerea prin saitul propriu.
Dan Matei [2016-11-08]
[1] www.europeana.eu
[2] www.poscce.research.ro/uploads/documente-programare/vo-poc-2014-2020-18-12-2014.pdf
[3] www.worldcat.org
[4] www.deutsche-digitale-bibliothek.de
[5] www.culturaitalia.it
[6] www.cidoc-crm.org
[7] www.ifla.org/node/10171
[8] http://pro.europeana.eu/share-your-data/data-guidelines/edm-documentation
[9] www.loc.gov/ead
[10] www.loc.gov/standards/mets
[11] http://iiif.io
[12] www.getty.edu/research/tools/vocabularies/aat
[13] www.getty.edu/research/tools/vocabularies/ulan
[14] www.getty.edu/research/tools/vocabularies/tgn
[15] http://rameau.bnf.fr
deocamdată văd doar intenții. Am digitalizat în ultimii 12 ani ziarele de sport apărute (peste 25.000 ediții) și este enorm de lucru, iar interesul populației este minim, dacă se dă gratuit este OK, altfel puțini sunt dispuși să plătească. Pe mine nu m-a plătit nimeni, chiar am plătit taxe ca să mi se permită fotografierea. Scanarea care oferă o calitate mai bună nu este posibilă decât transportând un aparat într-o bibliotecă națională, iar indolența angajaților te face să renunți, chiar dacă o faci din efortri proprii. Scanarea A3 oferă o viteză de maxim 2 pagini pe minut, la care trebuie adăugat timpul redenumirii fișierelor, deci greu de crezt că se va ajunge la un volum consistent dacă stăm și ne aflăm in vorbe. Publicațiile deja scanate sunt mai mult in domeniul literar sau fotografic (Realitatea Ilustrată, Ilustratiunea Română), dar ziare precum Universul sau Dimineața au avut 12-24 pagini zilnic, ceea ce necesită multă muncă. Un scanner A 3 costă cel puțin 800-1000 lei, așa că unul pentru ziare mari este mult mai scump. Toate cărțile apărute astăzi provin din documente word sau pdf, deci se pot urca în orice spațiu virtual. Legea depozitului legal se poate extinde la domeniul electronic