CERIF: štandardizácia informácií o vede

 

Štandardizácia v oblasti informačných systémov o vede a výskume je medzi odbornou verejnosťou na Slovensku takmer neznámym pojmom. Dátový formát CERIF (Common European Research Information  Format) je odporúčaný Európskou komisiou a rozvíjaný na pôde profesionálnej asociácie prevádzkovateľov informačných systémov o vede EuroCRIS.

Ako môžeme najvýstižnejšie charakterizovať CERIF? Odporučený dátový formát, štandard  určený pre oblasť automatizácie vedeckovýskumných informácií. Zjednodušene ho môžeme nazvať UNIMARC-om informačných systémov o vede a výskume.

Jeho podstatou je dátový model umožňujúci metadátovú reprezentáciu výskumných entít, ich aktivít a vzájomných väzieb, ako aj ich výsledkov. Umožňuje spracovanie informácií o výskume  v adekvátnej kvalite, ich archiváciu, sprístupňovanie a vzájomnú výmenu. Podporuje transfer znalostí širokej škále subjektov: výskumníkom, manažérom, tvorcom výskumných stratégií, vydavateľom vedeckých publikácií, médiám aj širokej verejnosti.

Prvky CERIF majú definovanú základnú štruktúru, sémantiku a väzby a delia sa do piatich hierarchicky usporiadaných kategórií:

  • Základné entity  (Core Entities)
  • Entity 2. úrovne (2nd Level Entities)
  • Entity určujúce vzájomné prepojenia dát (Link Entities)
  • Entity určené na vytváranie jazykových verzií  (Language-related Entities)
  • Klasifikačné entity (Sémantická vrstva) (Classification Entities-Semantic Layer)

Formát definuje 4 základné entity (moduly informačného systému):

  • Osoby: experti vedy a výskumu; personálna databáza;
  • Projekty;
  • Subjekty: organizácie výskumu a vývoja, ich služby a infraštruktúra;
  • Výsledky: najmä publikácie, ale aj patenty, produkty, podujatia.

Každá entita musí mať definované svoje atribúty, vlastnosti, ktoré ju charakterizujú. Tieto atribúty (položky) sú v rámci formátu presne určené. Napríklad u osoby sú to základné osobné údaje: meno, priezvisko, tituly, profesionálne zameranie a pod. Na základné entity sú naviazané ďalšie súvisiace objekty –  entity 2. úrovne.

V rámci slovenského informačného systému o vede a výskume (Centrálny informačný portál pre výskum, vývoj a inovácie – CIP VVI) sú softvérovo aj obsahovo spracované všetky základné entity okrem výsledkov výskumu. Ich štruktúra však v súčasnosti nezodpovedá formátu CERIF. S aktuálnou štruktúrou a úrovňou prepojenia dát súvisí aj relatívne obmedzená možnosť extrahovania agregovaných informácií zo systému.

Vzájomné prepojenia dát jednotlivých modulov (entít) sú v rámci CERIF presne definované entitami tretieho typu (Link Entities). Entitou tohto typu je napríklad objekt nazvaný Person_ResultPublication, ktorý určuje vzťah medzi osobou (záznamom v entite 1. úrovne Person, t. j. v databáze osôb) a publikáciou (záznamom v entite 1. úrovne Result Publication, t. j. Publikácie/výsledky výskumu a vývoja). Podobne ako entity 1. a 2. úrovne, aj táto „prepojovacia“ entita je definovaná špecifickými atribútmi.

zendul.jpg (66679 bytes)

Obrázok 1  CERIF –  Entity 1. a 2. úrovne

Výsledkom implementácie uvedeného dátového modelu (samozrejme za podmienky naplnenia modelu reálnymi dátami) je komplexný pohľad na spracované údaje a ich vzájomné súvislosti. Často žiadané sú napríklad informácie o projektoch, ktoré riešia konkrétne organizácie, alebo zoznam projektov z určitej oblasti. Tieto údaje poskytuje aj aktuálna verzia systému. Neexistuje však možnosť vyhľadať publikácie konkrétneho vedeckého pracovníka, vybrať z nich tie publikácie, ktoré napísal vo vzťahu k zamestnávateľskej organizácii (aj v prípade, že má viacerých zamestnávateľov), či vo vzťahu ku konkrétnemu projektu (t. j. výsledky výskumu a vývoja konkrétneho pracovníka). Získavanie širšieho spektra informácií je podmienkou, aby mohol informačný systém plniť všetky svoje funkcie.

Informačný systém o vede a výskume s implementovaným štandardom CERIF môže plniť tieto funkcie:

  • Informačná a popularizačná funkcia spočíva v propagácii vedeckej práce, jej subjektov a výsledkov medzi odbornou aj laickou verejnosťou doma i v zahraničí.
  • Analyticko-metodická funkcia umožňuje rozhodovacej sfére získať argumentačnú bázu slúžiacu na tvorbu stratégií a nástrojov na cielenú podporu vedy a výskumu vrátane finančnej.
  • Kontrolná funkcia umožňuje  riadiacej sfére získavať informácie o tom, či sú prostriedky prideľované na vedu a výskum zo štátneho rozpočtu hospodárne vynakladané a či vedeckovýskumné aktivity prinášajú adekvátne výsledky.
  • Implementačná funkcia spočíva v podpore prenosu informácií medzi subjektmi vedy a výskumu na jednej strane a podnikateľskými subjektmi na druhej strane. Výsledkom je ekonomický prínos vedy a výskumu pre spoločnosť, inovácie.

Dátový formát CERIF sa priebežne vyvíja v súlade s aktuálnymi trendmi zberu a spracovania dát o vede a výskume v jednotlivých krajinách EÚ. Tvorbou štandardov a vývojom CERIF sa zaoberá špeciálna pracovná skupina v rámci asociácie EuroCRIS. Implementácia štandardov  do informačných systémov o vede a prevádzka týchto systémov je vo viacerých európskych krajinách vecne aj inštitucionálne prepojená s akademickým prostredím a nezriedka spadá do pôsobnosti vedeckých a akademických knižníc a informačných centier.

CVTI SR ako prevádzkovateľ Centrálneho informačného portálu a informačného systému pre oblasť výskumu, vývoja a inovácií (CIP VVI) sa v rámci národného projektu Národný informačný systém podpory výskumu a vývoja na Slovensku – prístup k elektronickým informačným zdrojom, financovaného z OP Výskum a vývoj, bude od roku 2009 venovať prispôsobeniu CIP VVI štandardom EÚ, reprezentovaným dátovým modelom CERIF. Toto prispôsobenie umožní zapojenie Slovenska do efektívnej výmeny dát a umožní prístup k vedeckovýskumným informáciám v celom európskom priestore.

 

Zdroje: 

EuroCRIS, Online: http://www.eurocris.org   [4.11.2008]

Jörg, Brigitte: CERIF 2008 Tutorial. Online: http://www.eurocris.org/fileadmin/Upload/CERIF/CERIF2008_Tutorial_Brigitte_Joerg_June2008_Maribor.ppt [4.11.2008]

 

Ing. Danica Zendulková (zendulkova@cvtisr.sk)
CVTI SR, Bratislava

 


In ITlib. Informačné technológie a knižnice [online], 2008, č. 04 [cit. 2009-02-04].
Dostupné na internete <http://www.cvtisr.sk/itlib/itlib084/zendulkova.htm>. ISSN 1336-0779.

ITlib. Informačné technológie a knižnice