Centrálny
register publikačnej činnosti
Úvod
Publikačná činnosť predstavuje jeden z hlavných ukazovateľov vedeckovýskumnej
činnosti vysokej školy a zároveň nastavuje zrkadlo aj kvalite jej pedagogickej
činnosti. V roku 2005 bol jej význam podčiarknutý zahrnutím do metodiky rozdeľovania
rozpočtových finančných prostriedkov a povinnosť odovzdávania i zverejňovania
výsledkov publikačnej činnosti verejnou vysokou školou bola upravená Smernicou č.
13/2005-R z 31. augusta 2005 o bibliografickej registrácii a kategorizácii publikačnej
činnosti a ohlasov.
Účelom smernice bolo zabezpečiť jednotný postup pri registrovaní a vykazovaní
publikačnej činnosti, vymedziť predmet bibliografickej registrácie, definovať
základné pravidlá a kategórie publikácií a ohlasov. Smernica uložila akademickým
knižniciam na vysokých školách povinnosť bibliografickej registrácie publikačnej
činnosti vysokoškolských učiteľov, výskumných pracovníkov a doktorandov vysokej
školy.
Centrálne zhromažďovanie údajov pre potreby rozpočtu z VVŠ na MŠ prebiehalo
nárazovo (rok 2005 v papierovej podobe, rok 2006 v elektronickej podobe) a MŠ SR
nedisponovalo efektívnym nástrojom pre kontrolu a ďalšie spracovanie doručených
záznamov.
Centrálny register evidencie publikačnej činnosti (CREPČ)
Skutočnosť, že publikačná činnosť (EPČ) je registrovaná knižnicami
väčšinou ako súčasť knižnično-informačných systémov (KIS), vytvára vhodné
podmienky na integráciu údajov o publikačných aktivitách.
Spracovanie údajov o publikáciách v knižnično-informačnom systéme podlieha
záväzným pravidlám. Sú to najmä Anglo-americké katalogizačné pravidlá (AACR 2)
pre popis publikácií, formát MARC 21/UNIMARC pre štruktúru záznamov, pravidlá ISBD
(International Standard Bibliographic Description) pre štruktúru výstupov, ISO 2709 pre
výmenu dát, protokol Z 39.50 pre prezentáciu, export, import a ďalšie.
Východiskovým predpokladom bolo, že väčšina vysokých škôl má implementovaný
niektorý z profesionálnych KIS (napr. Rapid Library, Virtua, Aleph alebo Dawinci),
prípadne samostatné aplikácie vytvorené vo vlastnej réžii. Používané systémy
umožňujú webovú prezentáciu údajov a veľká časť vysokých škôl má databázy
publikačnej činnosti dostupné cez web a umožňuje ich prehľadávanie prostredníctvom
rôznych kritérií, generovanie prehľadov EPČ za jednotlivé pracoviská či VŠ ako
celok.
Tento stav viedol k vypísaniu centrálneho rozvojového projektu MŠ SR na vybudovanie
centrálneho registra publikačnej činnosti.
Hlavným cieľom projektu bolo vytvorenie centrálneho registra na evidenciu
publikačnej činnosti (CREPČ) schopného v čo najvyššej miere automatizovať proces
získavania a vyhodnocovania údajov súvisiacich s publikačnou činnosťou verejných
vysokých škôl. Získané údaje predstavujú podklady na vytvorenie výročnej správy
fakúlt a univerzít o publikačnej činnosti, ako i ročnej databázy o vytvorených
alebo publikovaných dielach, ktoré slúžia ako podklad pre dotačnú činnosť
Ministerstva školstva SR univerzitám v oblasti vedy, výskumu a vývoja. Zhromaždené
údaje majú na úrovni verejnosti poskytovať prehľad o činnosti všetkých
(univerzitných) pracovísk a súčasne umožňovať kvalifikované porovnanie a
vyhodnotenie činnosti rovnako zameraných pracovísk na rôznych univerzitách.
Realizácia projektu bola zložená z nasledujúcich čiastkových cieľov:
- analýza možností a definícia formátov a protokolov na transfer údajov z KIS VVŠ
na CREPČ MŠ SR,
- na úrovni CREPČ definovať štruktúru databázy tak, aby bolo možné realizovať
výmenu so všetkými univerzitnými pracoviskami a vytvoriť centrálny register
publikačnej činnosti ako kombináciu databázového servera a používateľského
rozhrania,
- implementovať funkcie schopné detegovať zdvojené alebo viacnásobné záznamy,
tvorbu štatistík, inteligentné vyhľadávanie a triedenie,
- pre VVŠ, ktoré nedisponujú vhodným riešením pre evidenciu publikačnej činnosti,
poskytnúť aplikáciu komunikujúcu s CREPČ.
Analýza problematiky a príprava centrálneho registra
Ako prvý krok bolo nutné zmapovať aktuálny stav evidencie publikačnej činnosti na
vysokých školách SR, pričom sa potvrdili očakávané predpoklady:
- väčšina verejných VŠ používa profesionálne IS, typicky ako súčasť riešenia
pre ich univerzitnú knižnicu (ARL, DAWINCI, Virtua, Aleph, ProEpc),
- časť má vlastný systém,
- časť výkazy realizovala ručnou kompiláciou podkladov.
Na základe posúdenia reálnej situácie bol vzhľadom na nezávislosť,
čitateľnosť a potreby unifikácie dát zvolený ako najvhodnejší formát - formát
XML definovaný pomocou XSD. Jeho výhody spočívajú v:
- nezávislosti od štruktúry polí UNIMARC, ani polí MARC21,
- použiteľnosti aj pre vysoké školy, ktoré nesumarizujú EPČ prostredníctvom KIS,
- kompatibilite s nástrojmi využívanými na osobných počítačoch (HTML, MS Office
dokumenty),
- kompatibilite so zahraničím,
- plnom rešpektovaní legislatívy a odporúčaní pre výstavbu štátnych
informačných systémov, ich súčastí a protokolov na výmenu dát.
Jedinou nevýhodou formátu zostala nutnosť konverzie údajov z existujúceho KIS do
požadovaného formátu. Tento aspekt však bol eliminovaný prostredníctvom rozpočtu
projektu, v ktorom boli pre všetkyVVŠ vyčlenené a poskytnuté finančné zdroje
umožňujúce vyriešiť požiadavku.
Následne bola pre CREPČ definovaná vo formáte XML dátová štruktúra s cieľom:
- striktne definovať minimálny záznam pre potreby CREPČ (identifikácia zdroja
katalogizácie, druh dokumentu, kód kategórie dokumentu a časové zaradenie,
príslušnosť záznamu k pracovisku/pracoviskám, príslušnosť záznamu k autorom -
informácie o roli autora a jeho podiele na zázname),
- definovať povinné i voliteľné elementy a striktne definovať ich vzájomné vzťahy,
- zabezpečiť prevod všetkých dát nevyhnutných pre funkcie registra (povinné polia)
a ďalších dát, ktoré prinášajú dôležitú informačnú hodnotu pre potenciálnych
používateľov CREPČ (vedecké agentúry, akreditačná komisia, verejnosť a pod.),
- minimalizovať chyby vyplývajúce z rozdielov implementácie noriem rôznymi
informačnými systémami alebo rôznymi pracoviskami používajúcimi systém rovnakého
výrobcu s inými nastaveniami,
- zabezpečiť formát ľahko implementovateľný aj v informačných systémoch
nepoužívajúcich normu ISO 2709 a niektorý z MARC formátov,
- použiť formát, ktorý bude ľahko rozšíriteľný a modifikovateľný aj pre budúce
(a dosiaľ neznáme) funkcie CREPČ alebo jeho systémové rozšírenia (v čom sú MARC
formáty obmedzené až nepoužiteľné),
- presná špecifikácia výmenného formátu je umiestnená priamo na serveri
centrálneho registra alebo je k dispozícii na požiadanie.
Súčasťou riešenia bola nutne i komunikačná schéma na výmenu údajov medzi VVŠ
a CREPČ pozostávajúca z nasledujúcich krokov:
- VVŠ vo vlastnej réžii spracováva EPC pracovníkov a v určenom termíne odovzdáva
dátový súbor XMLs dávkou pre potreby štatistického zhodnotenia MŠ SR,
- pred odovzdaním dávky je vhodné realizovať validáciu prostredníctvom
štandardných prvkov operačného systému (DOM validátor - súčasť najnovších
verzií www prehliadačov) a/alebo prostredníctvom aplikácie na tento účel vyvinutej
riešiteľmi projektu,
- odovzdávanie dávky do CREPČ prebieha prostredníctvom rozhrania na zaslanie dávky,
ktoré:
- umožňuje upload dávky v privátnej sekcii VVŠ,
- v procese uploadu skontroluje základnú syntaktickú správnosť a v prípade úspechu
zobrazuje štatistiku záznamov dávky v štruktúre podľa MŠ SR, pričom vkladajúci
má možnosť skontrolovať súlad štatistiky z vlastného KIS so štruktúrou záznamov
v odovzdávanej dávke,
- v prípade nesúladu informuje o nezrovnalostiach a umožní upload dávky opakovať.
Na zabezpečenie funkčnosti komunikačnej schémy bolo navrhnuté nasledujúce
rozdelenie zodpovednosti:
- Za zápis údajov do univerzitnej databázy, dodržanie platných noriem a správu
databázy o odborných aktivitách univerzitných pracovísk, spracovanie prehľadov,
vyhodnotení a štatistík, ako aj poskytovanie informácií o výsledkoch
vedeckovýskumnej činnosti zodpovedá univerzitná knižnica. Podľa aktuálne platného
Usmernenia MŠ SR o publikačnej činnosti sa záznam do databázy CREPČ dostane až po
overení úplnosti a správneho zaradenia záznamu.
- Za usmerňovanie a vyhodnocovanie vedeckovýskumnej a odbornej činnosti zodpovedá
prorektor pre vedu a výskum na univerzite a prodekani pre vedu a výskum na fakultách.
- Za zber prvotných údajov a ich obsah zodpovedajú odborné pracoviská univerzity.
- Za technickú a programovú podporu zberu údajov a prevádzku informačného systému
na univerzite zodpovedá univerzitné IT pracovisko.
- Za prevádzku centrálneho registra publikačnej činnosti zodpovedá MŠ SR, ktoré
túto zodpovednosť prenieslo na riešiteľov projektu.
- Proces bibliografickej registrácie a následného vykazovania publikačnej činnosti,
resp. evidencie publikačnej činnosti (EPC) sa delí na etapy, na ktorých sa podieľajú
vedeckí a pedagogickí pracovníci vysokých škôl, pracovníci akademických knižníc
a príslušné pracoviská vysokej školy pre vedu a výskum.
Softvérová realizácia registra
Po vykonaní analýzy a popísaní procesov bolo pristúpené k softvérovej
realizácii projektu. Webovým sídlom projektu sa stala doména http://www.crepc.sk,
ktorá počas vývoja slúžila na výmenu technickýchúdajov a informácií medzi
riešiteľmi projektu a zástupcami zúčastnených VVŠ. Fyzicky je CREPČ umiestnený na
UKF v Nitre.
Následne bol vytvorený portál poskytujúci:
- anonymné rozhranie na vyhľadávanie údajov a získavanie štatistík EPC na priereze
rokov, univerzít i univerzitných pracovísk, zamestnancov, kategórií publikácií a
pod. (obr. 1);
- autorizované rozhranie na odovzdávanie dávok univerzitami a poskytovanie ich
hodnotenia prostredníctvom súborov generovaných systémom a na základe manuálnych
kontrol (obr. 2)
- štatistiky podľa potreby a zadania.

Obr. 1 Možnosti vyhľadávania bez nutnosti
autorizácie

Obr. 2 Autorizované rozhranie
Práca s údajmi
V prvej fáze bol portál naplnený údajmi z roku 2007. Kompletným importom dát
všetkých dotknutých organizácií tak vznikla unikátna databáza evidencie
publikačnej činnosti, na základe ktorej bolo možné analyzovať možné typy a
výskyty chýb, multiplicít i percentuálneho rozdelenia publikácií medzi viac
pracovísk (univerzít).
Na získané údaje boli postupne nasadzované viaceré techniky kontroly úplnosti,
sémantickej správnosti záznamov a kontroly duplicít. Tieto techniky v sebe integrujú
pravidlá pre efektívnu a sofistikovanú kontrolu údajov v aktuálnom, ale aj ďalších
rokoch. Kontrola správnosti údajov pozostáva z:
- automatizovanej kontroly úplnosti položiek záznamov (realizovanej už vlastnosťami
výmenného formátu),
- automatizovanej kontroly duplicít pozostávajúcej z kontroly na:
- duplicitu publikácie v rámci odovzdanej dávky univerzity (tá istá/takmer totožná
publikácia sa vyskytuje v rámci dávky viackrát),
- duplicitu publikácie autora v rámci viacerých VVŠ (viac univerzít vykazuje tú
istú publikáciu - zamestnanec zrejme pôsobí na viacerých univerzitách),
- duplicitu publikácie v rámci viacerých VVŠ pri viacerých autoroch (percentuálne
podiely autorov prípadne i kategórie v záznamoch viacerých univerzít nie sú
totožné),
- manuálnej/poloautomatizovanej kontroly údajov vo vnútri CREPČ v aktuálnom roku
síce prebiehajúcej mimo CREPČ, no v budúcnosti sa odporúča využívať na tento
účel vytvorené formuláre systému umožňujúce:
- kontrolu zaradenia publikácie do kategórie na základe rozsahu dokumentu,
- kontrolu zaradenia publikácie do kategórie na základe obsahu dokumentu,
- manuálne odhalené duplicity a pod.,
- následného odoslania výsledkov kontroly príslušnej VVŠ, ktorá paralelne s opravou
údajov dávky opravuje údaje vo svojom KIS. Návrhy z CREPČ môže:
- odsúhlasiť a opraviť,
- v prípade zamietnutia návrhu CREPČ odôvodniť zamietnutie navrhovanej opravy s
odovzdaním v privátnej sekcii,
- v rámci tejto aktivity nie je potrebné obmedziť pridávanie nových záznamov.
Medzi dvoma importmi údajov do CREPČ môžu niektoré záznamy zo systému z rôznych
dôvodov vypadnúť alebo častejšie nové záznamy v rámci už uzavretého obdobia
pribudnúť. V prípade odstránenia záznamu v KIS VVŠ, je tento záznam v rámci CREPČ
po importe novej dávky tiež odstránený a v prípade pridania nového záznamu, ktorý
je vykazovaný v už spracovanom období, je tento do systému doplnený a vykazovaný v
rámci už spracovaného obdobia (VVŠ sa tým ochudobňuje o záznam).
Záver
CREPČ sa v súčasnosti stará o verejnú prezentáciu výsledkov univerzitných
pracovísk, poskytuje zdroj údajov pre potreby manažmentu finančných prostriedkov a
vnútorne zabezpečuje elimináciu duplicít v rámci jednej i medzi univerzitami.
Do budúcnosti sa predpokladá jeho rozšírenie o ďalšie typy vysokých škôl
(štátne, súkromné), SAV, o poskytovanie údajov o publikačnej činnosti ďalším
subjektom (grantové agentúry, akreditačná komisia a pod.) a riešenie evidencie
ohlasov.
Mgr. Ján Skalka, PhD. (jskalka@am-skalka.sk)
prof. RNDr. Libor Vozár, CSc. (lvozar@ukf.sk)
Univerzita Konštantína Filozofa v Nitre
In ITlib. Informačné technológie
a knižnice [online], 2008, č. 02 [cit. 2008-07-11].
Dostupné na internete <http://www.cvtisr.sk/itlib/itlib082/skalka_vozar.htm>. ISSN
1336-0779.
ITlib. Informačné technológie a knižnice |