Digitálne akademické repozitáre a knižnice

Milena Maťašovská Tetřevová
(tetrevova@lib.tuke.sk

Čas zmien v komunikácii vedeckých poznatkov

“Staré tradície a nové technológie sa spojili, aby
umožnili bezprecedentné verejné blaho.“

Budapest Open Access Initiative, február 2002

Tradičný model komunikácie vedeckých a odborných informácií vzhľadom na komerčné záujmy vydavateľstiev vyústil do celosvetovej krízy tlačených odborných publikácií. Prudký nárast cien odborných časopisov a kníh (nárast asi o 200 – 400 % za posledných 15 až 20 rokov) je neúnosný pre akvizičné rozpočty knižníc a spôsobuje redukciu objednaných titulov. Tento stav prirodzene vyústil do nespokojnosti na všetkých úrovniach v publikačnom reťazci. Autori sú nespokojní, pretože ich publikácie sú málo dostupné odbornej verejnosti a tým je obmedzené citovanie ich prác. K ich nespokojnosti prispievajú aj legislatívne reštrikcie, ktoré spôsobujú prenos práv na ich vlastný intelektuálny produkt na vydavateľstvá. Na strane druhej čitatelia nemajú prístup k všetkým publikáciám, ktoré potrebujú a ktoré sú často výsledkom štátom podporovaného výskumu, ktorý nepriamo sami financujú ako daňoví poplatníci. Knižnice nemôžu uspokojivo plniť informačné požiadavky svojich čitateľov. Obmedzené šírenie vedeckých poznatkov v opísanom komunikačnom modeli má negatívny dosah na celú spoločnosť.

Rozvoj internetu a elektronického publikovania priniesol nové technologické možnosti na voľné šírenie odborno-vedeckých poznatkov, predstavujúc alternatívny model elektronickej sieťovej komunikácie, ktorá sa v akademickom prostredí okamžite udomácnila. Elektronická komunikácia vedeckých poznatkov má mnoho foriem a prostriedkov. Ich spoločným prvkom je snaha o naplnenie základnej funkcie vedy, ktorou je komunikácia a šírenie vedeckých poznatkov. Úsilie prerástlo do celosvetovej iniciatívy, známej pod názvom Open Access (OA, voľný prístup, niekedy sa v literatúre vyskytuje aj pod názvom Free Online Scholarship (FOS) movement). Definície OA publikácií a postupy implementácie v rámci inštitúcií boli výsledkom stretnutí významných odborníkov z rôznych oblastí vedy a výskumu. Základnými dokumentmi sú známe deklarácie Budapest [1], Bethesda [2] a Berlin [3]. OA môžeme stručne definovať ako bezplatný online prístup k (prevažne) odbornej literatúre v digitálnej forme na internete.

Hnutie OA výrazne ovplyvňuje tradičný ekonomický model financovania publikácií. Existuje viacero ekonomických modelov pre OA. Jedným z existujúcich riešení je systém, v ktorom autori platia vydavateľstvám za tzv. pridané služby (editácia, recenzovanie, marketing, “dobré meno“ vydavateľa ako “záruka“ kvality), ale čitatelia neplatia za prístup. Ďalším riešením je prístup omeškania (napr. Delayed Open Access Journals), keď vydavatelia s časovým oneskorením v rozsahu niekoľkých mesiacov až po viac ako 1 rok sprístupňujú bezplatne svoje tituly z archívov. Možný je aj opačný postup, teda časopisy sú prvý mesiac bezplatne prístupné a neskôr sú prístupné len na základe predplatného. Trend OA zachytili aj niektoré tradičné vydavateľstvá, ktoré sa rozhodli transformovať svoje klasické uzavreté časopisy na OA časopisy (napr. Oxford University Press, American Physiological Society…) alebo indexovať aj publikácie z OA časopisov (napr. ISI z počtu 8 700 časopisov sledovaných v databáze Web of Science® indexuje 191 OA časopisov [5]).

Hlavnými výsledkami iniciatívy OA sú okrem spomínaných voľne dostupných odborných časopisov (OA journals) aj predmetové alebo inštitucionálne repozitáre (OA repositories) na internete.

Teoretické východiská otvoreného univerzálneho informačného systému

Pojem digitálny repozitár zaviedli v roku 1995 Robert Kahn a Robert Wilensky, ktorí definovali teoretické princípy otvoreného univerzálneho informačného systému, známeho pod názvom Kahn-Wilensky Framework (KWF). Kahn a Wilensky [7] definujú komponenty otvoreného systému na uchovávanie, prístup a manažment (organizáciu, riadenie) informácií, pričom architektúru systému oddeľujú od uchovávaného obsahu, čím je ich prístup univerzálny.

Základným prvkom KWF architektúry je digitálny objekt. Digitálne objekty [8] sú dátové štruktúry, ktorých základnými prvkami sú digitálny materiál, metadáta a jedinečný identifikátor (Handle). Vo forme digitálneho objektu môže byť reprezentovaný každý typ informácie (text, obraz, zvuk, video a ich kombinácie).

Repozitár (sklad) je sieťovo prístupný systém, v ktorom sú uložené digitálne objekty pre ich ďalšie sprístupnenie a využitie. Rôzne repozitáre majú rôznu internú organizáciu digitálnych objektov, ale digitálne objekty v každom repozitári majú vždy metadátový záznam (properties), v ktorom sú uložené všetky atribúty objektu (o. i. aj podmienky prístupových práv) a translačný log. Repozitáre majú priradené jednoznačné globálne meno a obsahujú mechanizmy na pridanie nových digitálnych objektov. Každý repozitár musí podporovať prístupový protokol Repository Access Protocol (RAP), ktorý umožňuje ukladať a sprístupňovať digitálne objekty alebo informácie o digitálnych objektoch z repozitára pomocou špecifikácie identifikátora digitálneho objektu (Handle), typu požiadavky a ďalších parametrov. Každý digitálny objekt má pôvodcu (Originator), čo môže byť osoba alebo organizácia, ktorá definuje podmienky jeho sprístupňovania alebo modifikovania. Architektúra KWF definuje aj tzv. Handle System, globálny systém na rozpoznávanie digitálnych objektov v repozitároch podľa ich identifikátora. Architektúra KWF je zobrazená na tomto obrázku:

matas.jpg (40577 bytes)
Obr. 1 Repozitár a architektúra Kahn-Wilensky Framework

Aj keď model KWF nebol nikdy uvedený do praxe pri implementácii reálnej digitálnej knižnice, ovplyvnil všetky repozitáre a neskoršie projekty založené na objektovom modeli (Fedora, Dienst, OAI-PMH).

Digitálny akademický repozitár

Akademickým repozitárom (AR, repozitár akademickej inštitúcie) je v širokom význame slova ľubovoľná zbierka digitálnych materiálov, ktorých tvorcami, vlastníkmi a šíriteľmi sú zamestnanci, pedagógovia alebo študenti akademického pracoviska (katedra, fakulta, univerzita). Podľa definície SPARC (The Scholarly Publishing and Academic Resources Coalition) [9] je repozitárom otvorený digitálny archív intelektuálnych produktov vytvorených fakultou, výskumnými pracovníkmi a študentmi danej inštitúcie a prístupný koncovým používateľom v rámci a mimo tejto inštitúcie bez bariér v prístupe, resp. s minimálnymi bariérami.

Základné charakteristiky AR:

  • inštitucionálne pokrytie (obsah generuje akademická obec inštitúcie),
  • odborno-vedecký obsah (preprinty, pracovné materiály, publikované články, výučbové materiály, záverečné práce študentov, prednášky, súbory dát...),
  • kumulatívnosť a trvácnosť (mechanizmy na pridávanie prác, ochrana akademickej produkcie inštitúcie do budúcnosti, dlhodobá archivácia),
  • interoperabilita a otvorený prístup (štandardizácia v heterogénnom prostredí pre bezplatný online prístup používateľov k dokumentom inštitúcie).

Základom implementácie akademického repozitára je logické oddelenie obsahu a komponentov služieb. Toto oddelenie umožňuje, aby bol obsah distribuovaného otvoreného repozitára dostupný pre rôznych (viacerých) poskytovateľov pridaných služieb spravovaných nezávisle od repozitára pomocou implementácie štandardov interoperability.

V rámci inciatívy OA je podporovaný protokol interoperability OAI-PMH [10], ktorý zabezpečuje interoperabilitu systémov, založenú na tzv. metadátovej žatve (metadata harvesting). Otvorené archívy sú inštalované na repozitároch (sieťovo prístupných serveroch), ktoré podporujú protokol OAI-PMH. Protokol OAI-PMH je postavený na 4 vlastnostiach: využití jednoznačných identifikátorov, použití spoločného metadátového štandardu (nekvalifikovaný Dublin Core), komunikácii cez HTTP protokol, striktnom dodržiavaní syntaxe XML (v ktorej sú zakódované metadátové záznamy podľa schémy oai_dc). Repozitáre fungujú ako poskytovatelia dát o svojich zbierkach pre klientske aplikácie (harvester) poskytovateľov služieb (služby s pridanou hodnotou) prostredníctvom protokolu OAI-PMH.

OAI-PMH definuje nasledujúce pojmy [10]:

  • Repository – (repozitár) sieťovo prístupný server, ktorý prevádzkuje poskytovateľ dát. Repozitár poskytuje metadátové záznamy poskytovateľom služieb prostredníctvom rozhrania OAI-PMH a protokolu HTTP.
  • Harvester – klientsky program, ktorý prevádzkuje poskytovateľ služieb s cieľom získať metadátové záznamy z repozitárov.
  • Resource – zdroj, ktorý je popisovaný metadátovým objektom.
  • Item – metadátový objekt, ktorý je uložený v repozitári a z ktorého sa odvodzujú metadátové záznamy.
  • Record – metadátový záznam v špecifikovanom formáte, získaný alebo dynamicky odvodený z metadátového objektu.

Jednoznačné identifikátory slúžia na deduplikáciu metadátových záznamov a sú definované na úrovni metadátových objektov. Formát identifikátorov musí vyhovovať špecifikácii URI (Uniform Resource Identifiers (RFC 2396).

V súčasnosti existujú na strane registrovaných poskytovateľov dát približne stovky implementácií významných akademických repozitárov ([11], [12]) a poskytovateľov služieb [13].

Hlavný význam akademických repozitárov

Hlavný význam pre jednotlivé skupiny:

Autori:

  • centrálny digitálny priestor na šírenie vedeckých poznatkov a vzdelávanie,
  • podpora šírenia publikácií a výsledkov vedeckého bádania v nich obsiahnutých, komunikácia viacerými kanálmi, lepší prístup čitateľov a nárast citovanosti prác autorov, akcelerácia výskumu,
  • ďalšia alternatíva pre publikačnú platformu, možnosť kombinácie (tradičné publikovanie + open access publikovanie);

Univerzita:

  • zviditeľnenie výsledkov vedy a výskumu, (možný) nárast prestíže,
  • repozitáre slúžia ako marketingový nástroj pre potencionálnych sponzorov, nábor študentov a pod.,
  • repozitáre postavené na opensource (GNU) softvérových riešeniach poskytujú alternatívne nízkonákladové riešenie vzhľadom na proprietárne softvéry a komerčné knižničné systémy;

Spoločnosť:

  • prístup k celosvetovému výskumu, zlepšenie a obohatenie možnosti vzdelávania občanov,
  • dlhodobá archivácia intelektuálneho bohatstva. Funkcie akademických knižníc v procese OA:
    • zriaďovanie a prevádzka akademických repozitárov v spolupráci s IT špecialistami univerzity,
    • podpora internej kooperácie (knižnica – autori – výpočtové centrá – manažment), vzájomné porozumenie a akceptácia na základe partnerstva,
    • podpora otvoreného prístupu, podpora open access časopisov, akademických repozitárov a ich propagácia,
    • marketing a komunikácia s vedením univerzity a s autormi na podporu otvoreného prístupu,
    • vzdelávanie personálu a štúdium v oblasti OA,
    • podpora OA na úrovni profesijných spolkov a združení, podpora medzinárodných iniciatív v oblasti,
    • iniciácia riešenia autorskoprávnych otázok.

 

Budúcnosť a otvorený svet

Doterajší vývoj v oblasti akademického publikovania smeruje k tomu, že v budúcnosti sa bude neustále zvyšovať tlak autorov a používateľov na otvorený prístup k vedecko-odborným publikáciám. Tento smer bude vyžadovať existenciu viacerých ekonomických modelov otvoreného publikovania, pričom najrozšírenejším modelom bude ten, kde informácie budú publikovať inštitúcie, ktoré ich produkujú (univerzity, vedecké spoločnosti...). Pracovníci knižníc môžu zohrávať významnú úlohu v procese plánovania a budovania digitálnych repozitárov, aby svojím vkladom do tohto procesu zvýšili počet kvalitných online dostupných odborno-vedeckých publikácií na internete a zabezpečili ochranu intelektuálneho bohatstva svojej inštitúcie do budúcnosti.


Zoznam bibliografických odkazov:

  1. Budapest Open Access Initiative [online]. [cit 2005-05-06]. Dostupné na internete: http://www.soros.org/openaccess/read.shtml.
  2. Bethesda Statement on Open Access Publishing [online]. [cit 2005-05-04]. Dostupné na internete: http://www.earlham.edu/~peters/fos/bethesda.htm.
  3. Berlin Declaration on Open Access to Knowledge in the Sciences and Humanities [online]. [cit 2005-05-04]. Dostupné na internete:
    http://www.zim.mpg.de/openaccess-berlin/berlindeclaration.html.
  4. MAŤAŠOVSKÁ TETŘEVOVÁ, Milena – MAŤAŠOVSKÝ, Žigmund. Elektronické diplomové a dizertačné práce na Technickej univerzite v Košiciach. In UNINFOS ‘04 : Univerzitné informačné systémy (medzinárodná konferencia), 29. – 30. novembra 2004, Bratislava, Slovensko. Bratislava : STU, 2004. s. 195-200. ISBN 80-227-2096-8.
  5. Thomson ISI Finds Open Access Journals Making an Impact [online]. [cit 2005-05-06]. Dostupné na internete: http://www.isinet.com/press/2004/8221713.
  6. Papík, Richard – Souček, Martin. Znalosti 2004. Zpřístupňování textových informací z profesionálních zdrojů. Databázová centra, databáze a digitální knihovny. In VEDA.CZ [online]. [cit 2005-05-06]. Dostupnéna internete:http://www.veda.cz/detail.jsp?articleId=9213.
  7. Kahn, Robert – WilenskY, Robert. A Framework for Distributed Digital Object Services, (1995) [online]. [cit 2005-05-04]. Dostupné na internete: http://www.cnri.reston.va.us/home/cstr/arch/kw.html.
  8. Arms, William. Key Concepts in the Architecture of the Digital Library. In D-Lib Magazine, 1(1), 1995 [online]. [cit 2005-05-04]. Dostupné na internete: http://www.dlib.org/dlib/July95/07arms.html.
  9. Crow, Raym. The Case for Institutional Repositories: A SPARC Position Paper [online]. Scholarly Publishing and Academic Resources Coalition. 2002 [cit 2005-05-04]. Dostupné na internete: http://www.arl.org/SPARC/IR/ir.html.
  10. LAGOZE, C. a kol. The Open Archives Initiative Protocol for Metadata Harvesting [online]. Protocol Version 2.0 of 2002-06-14. Document Version 2004/10/12T15:31:00Z 2004 [cit. 2004-11-10]. Dostupné na internete: http://www.openarchives.org/OAI/openarchvesprotocol.html
  11. Registered Data Providers [online]. [cit 2005-05-04]. Dostupné na internete: http://www.openarchives.org/Register/BrowseSites.
  12. Experimental OAI Registry at UIUC [online]. [cit 2005-05-04]. Dostupné na internete: http://gita.grainger.uiuc.edu/registry/ListReposByVer.asp?ver=%3E%3D+2.0.
  13. Registered Sevice Providers [online]. [cit 2005-05-04]. Dostupné na internete: http://www.openarchives.org/service/listproviders.html.

 

 


In ITlib. Informačné technológie a knižnice [online], 2005, č. 02 [cit. 2005-07-31]. Dostupné na internete <http://www.cvtisr.sk/itlib/itlib052/matasovska.htm>. ISSN 1336-0779.

ITlib. Informačné technológie a knižnice