Knihovník budúcnosti – úradník alebo autor?

Andrew Hardie

Kto neovládne svet metadát, toho zmetú!

Aká bude úloha knihovníkov v budúcnosti, keď všetky informácie budú prístupné v počítačových sieťach a knižnice sa pretvoria na virtuálne organizácie, ktoré budú podľa potreby spontánne vznikať a zase miznúť? Zmení sa aj rola knihovníkov spolu s tým, ako sa už dnes verejné knižnice pretvárajú na verejné informačné strediská a národné knižnice sa nahrádzajú distribuovanými súbormi digitalizovaných dát? Stanú sa knihovníci iba vrátnikmi či operátormi pri počítačoch, alebo zaujmú tvorivejšiu rolu pracovníkov priamo sa zúčastňujúcich na autorskom procese?

Nový poriadok

Vznik veľkokapacitných pamäťových médií a prenikavý rozvoj počítačových sietí vytvárajú pre knihovníkov paradoxnú situáciu. Technický pokrok zjednodušuje prístup k neporovnateľne väčšiemu objemu informácií ako predtým, ale tradičná rola knihovníkov ako tvorcov zbierok kníh, katalogizátorov a dodávateľov surových informácií beznádejne zastaráva. Problém je podobný tomu, ktorému budú čeliť učitelia. Aj ich rola sa zmení: zo sprostredkovateľov vopred daných znalostí sa stanú sprievodcovia po nekonečnom zdroji informácií.

Knihovníci už nebudú iba strážcami a konzervátormi knižných fondov. Staré knihy prestanú byť vyhľadávané kvôli obsahu a miesto toho sa budú ceniť len ako artefakty. Ich obsah bude prístupný online. V dravom, prevažne anglicky hovoriacom svete webu sa konverzia národných literatúr do digitálnej formy prístupnej online stane jedinou možnou cestou k zachovaniu národnej identity a jazyka.

Ľudia sa pri hľadaní konkrétnych odpovedí budú čoraz menej obracať na knižnice a knihovníkov; sami si ich nájdu na sieti. S využitím inteligentných vyhľadávacích mechanizmov dotazovacích jazykov budú ľudia pri vyhľadávaní informácií čoraz menej potrebovať pomoc a nebudú ani vedieť, ani sa starať o to, ktorá virtuálna knižnica obsahuje odpovede na ich otázky či kde sa potrebné informácie fyzicky nachádzajú. Distribuované dátové súbory so súbornými indexmi a univerzálnymi dotazovacími rozhraniami, ktoré budú prístupné online, vytvoria dojem knižnice ako fyzického fondu, ad hoc usporiadanej tak, aby bol čo najpohodlnejší prístup k požadovaným informáciám.

Aká je nová rola knižníc?

Už dávno boli knižnice nútené vzdať sa zámeru vlastniť úplný súbor ľudských znalostí. Web však paradoxne práve toto umožňuje. Zhotovovanie fyzických kopií každej publikácie, o ktorej sa knihovník domnieval, že by mohla byť užitočná pre jeho čitateľov, stratí akýkoľvek zmysel. Už nebude potrebných ani viac exemplárov jednotlivých publikácií; jediný originál bude stačiť všetkým používateľom webu, ktorí si budú môcť kedykoľvek v prípade potreby vytvoriť svoju vlastnú lokálnu kópiu.

Kto tento originálny exemplár vlastní a udržuje? A kde? Čo vlastne bude “knižný” či skôr “informačný” fond? Ak nebudú fondy viazané fyzickými parametrami, stanú sa možno tematickými, a to, čo ich bude charakterizovať, nebudú iba vzťahy, ale pridaná hodnota zvyšujúca ich užitočnosť ako informačného zdroja. Lenže pridaná hodnota najviac vzrastie nie z bezprostrednej intelektuálnej práce spojenej so získavaním a triedením nových informácií od prípadu k prípadu, ale ako nepriama aktivita spojená s vytváraním pravidiel – algoritmov – riadiacich automaticky a autonómne samovytvárajúce a samoudržujúce sa fondy. Objem dostupných informácií ani nič iného nepripúšťa.

Udržiavanie online digitálnej knižnice je veľmi odlišné od bežnej “papierovej” knižnice. Bude vyžadovať len minimálnu zručnosť operátora počítača (ako práca typu pravidelného kopírovania informácií z jedného pamäťového média alebo systému do média či systému ďalšej generácie) v harmonograme danom technológiou dostupnou na trhu, a nie knihovníckymi princípmi.

Ak verejné knižnice pretrvajú (skôr kvôli sociálnym dôvodom ako kvôli zabezpečeniu prístupu k informáciám), budú knihovníci redukovaní na akýsi druh recepčných, ľudskú tvár uvádzajúcu používateľa skôr do internetovej kaviarne než do knižnice, tak ako ju poznáme dnes? Táto rola by mohla byť potrebná, avšak pre menej kvalifikovaných pracovníkov, než sú knihovníci. Alebo verejné knižnice úplne zmiznú a budú nahradené len ďalšiou funkciou dostupnou na portále webu?

Aká teda bude úloha knihovníkov?

Sú knihovníci, ako ich poznáme dnes, druhom odsúdeným k záhube? To závisí od toho, v čom vidíte súčasnú rolu knihovníka.

Knihovník ako správca fyzických fondov, či už určených na prezenčné štúdium alebo na výpožičky, nemá pred sebou dlhodobú budúcnosť, pretože ju nemajú ani fondy.

Knihovník ako katalogizátor fondov tiež nemá dlhotrvajúcu budúcnosť, pretože fondy budúcnosti nebudú len sebakatalogizujúce, ale tiež sebavytvárajúce. V konečnom dôsledku by knihovníkom mohlo zostať len jediné rozhodovanie, a to, čo z fondu vyradiť. To sa však nezlučuje s tradíciou knihovníka ako konzervátora.

Knihovník ako pomocník pri formulovaní dotazov či sprievodca webom možno budúcnosť má, samozrejme, na ako dlho a v akej forme? Keď sa zdokonalia vyhľadávacie stroje a dotazovacie jazyky, pomoc špecialistu bude menej potrebná. Zdá sa tiež nepravdepodobné, že by ľudia osobne navštevovali fyzického sprievodcu virtuálnymi zdrojmi. Namiesto toho budú očakávať, že spomínaný pomocník – sprievodca bude tiež prístupný online, takže by knihovník mohol byť nahradený menej kvalifikovaným zamestnancom vzdialeného webového centra.

Bolo by zaujímané špekulovať o časovom horizonte, v ktorom spomínané funkcie zmiznú. Pre knihovníkov je však podstatné to, že technologické i iné faktory určujúce rýchlosť týchto zmien jednoducho sami ovplyvniť nemôžu.

Naozaj nová intelektuálna rola pre knihovníkov budúcnosti je vytvárať a udržiavať novokoncipované metadáta. Katalogizovanie a udržiavanie fondov vždy prinášalo tvorbu jednoduchých metadát, ako sú hoci aj prosté lístky v papierovom katalógu alebo ich súčasný počítačový ekvivalent, napríklad záznamy typu Dublin Core. Už také jednoduché metadáta, ak sú pripojené k elektronickej publikácii, dávajú fondu vlastnosť sebakatalogizácie. Metadáta vytvárané spoločne s dokumentom a riadiace jeho ďalšie automatizované spracovanie z veľkej časti alebo dokonca úplne odstránia nutnosť ďalších ľudských zásahov do vytvárania informačných fondov.

V každom prípade súčasný vývoj webu ukazuje, že význam metadát v blízkej budúcnosti neuveriteľne vzrastie. Aby sme pochopili, prečo a aké to prinesie nové intelektuálne výzvy, musíme porozumieť súčasnému stavu obsahu webu, najmä tomu, čo je na webe zlé a čo sa pre vyriešenie tohto problému robí.

Každý, kto používal sieťové vyhľadávače, sa iste stretol so všeobecným problémom: získal na zadaný dotaz príliš veľa irelevantných odpovedí, aj keď podiel indexovaných stránok predstavuje len 20 % webu. S exponenciálne narastajúcim rozsahom siete budú mať tieto primitívne techniky v budúcnosti čoraz menšiu úspešnosť, aj keď vyhľadávacie stroje sú v súčasnosti predsa len užitočné a veľmi populárne. Kľúčom k vyhľadávaniu relevantných informácií je možnosť formulovať veľmi kvalitné dotazy, čo však vyžaduje štruktúrované informácie, ktoré web zatiaľ nemá. “Nájdi X v Y, pokiaľ je Z” je otázka vyššej kvality než jednoduché “Nájdi X”, čo je väčšinou všetko, čo je v súčasnosti možné.

Jazyk používaný na zápis webových stránok – HTML (HyperText Markup Language) – nemá spôsob, ako identifikovať prvky, ktoré vytvárajú štruktúru vo vnútri dokumentu, a má len veľmi primitívne možnosti použitia metadát na úrovni celého dokumentu. Z mnohých dôvodov trpí jazyk HTML radom dalších problémov, ktoré viedli k tomu, že tento jazyk nie je celkom jednotný, často sa ešte aj zle používa, čo vytvára problémy pri ďalšom spracovaní informácií nachádzajúcich sa v sieti.

Ako krok dopredu sa javí náhrada HTML novým jazykom nazvaným XML (eXtended Markup Language). XML umožňuje štruktúrovanie dokumentov do ľubovoľnej hĺbky zložitosti, napriek tomu však systematicky, čo umožňuje ich jednoduché spracovanie. V technickom chápaní XML nie je skutočný jazyk, ale metajazyk, teda súbor pravidiel popisujúcich, ako vytvoriť štruktúrovaný jazyk. Pravidlá XML sú veľmi jednoduché, a teda aj pružné pri vytváraní ľubovoľných nových jazykov založených na princípoch XML. Rovnako ako HTML je odvodený od ISO SGML (Standard Generalised Markup Language), ktorý sa používa v typografii už viac ako desať rokov.

XML nie je iba jednoduchší ako SGML, ale prekvapujúco je tiež omnoho mocnejším nástrojom. SGML si kládol za cieľ vyjsť v ústrety všetkým možným požiadavkám typografov, a tak skončil ako príliš zložitý a obmedzene použiteľný mimo oblasti typografie, pre ktorú bol vytvorený. Výsledkom bolo, že XML, hoci funguje iba dva roky, už celkom zatienil SGML, ktorý zastaral.

Tu sa objavuje jedna z možností budúceho uplatnenia knihovníkov. Štruktúra predpokladá taxonómiu, teda pomenovanie častí. Prvky štruktúry musia byť pomenované tak, aby sa na ne mohlo odkazovať ako pri výmene informácií, tak aj pri formulácii dotazov. Takéto taxonomické jednotky – pomenované prvky a ich štruktúry či namespaces, ako sa nazývajú vo webovom slangu – sa musia definovať. Pre určité oblasti už bolo definovaných mnoho pomenovacích prvkov vytvárajúcich popisné jazyky, ktoré vo svojom názve obvykle obsahujú slovo “markup”, teda “popisný”, napríklad Human Resources Markup Language, čo je meno jedného zhruba zo sto už existujúcich jazykov. Búrlivo sa rozvíjali predovšetkým popisné jazyky pre potreby finančného sektora a oblasti elektronického obchodu (ecommerce).

Možno síce definovať dohodnuté pomenované prvky pre informačnú výmenu medzi organizáciami spolupracujúcimi v danom odbore, ale žiadna štruktúra prvkov nebude schopná obsiahnuť všetko. Dokonca nikdy ani nebude možné sa o to pokúsiť, pretože by to ohrozilo efektívnosť spracovania informácií a možnosť udržiavať príslušné súbory. Jedným zo základných princípov webu je zachovať možnosť distribuovaného vývoja. Preto mimo špecifických organizovaných zoskupení budúcnosť prinesie veľké množstvo rôznorodých štruktúr s pomenovanými prvkami, medzi ktorými bude nutné vytvoriť rozhranie pre informačnú výmenu a pre ktoré bude potrebný nový lingvista, prekladateľ štruktúr pomenovaných prvkov.

Tam, kde nie je možné jednoznačne priradiť prvky jednej štruktúry k prvkom štruktúry druhej, sa musia vytvoriť pravidlá na spracovanie informácií obsiahnutých v určitom prvku pri prevode z jednej štruktúry do druhej. Toto je v zásade lingvistický a sémantický problém, nie programátorský, teda problém z oblasti knihovníkom vlastnej, hoci v úplne netradičnom kontexte.

Základný význam metadát

V publikáciách sa bežne sústreďuje pozornosť na možnosti jazyka XML pri vytváraní a popise štruktúr, avšak skutočným strategickým významom XML nie je štruktúra, ale metadáta. Jednoduché, ale temer nepoužiteľné metadáta v HTML sa nahradia schémou RDF (Resource Description Framework), ktorá je sama zapísaná v XML. Podobne ako XML, aj RDF predstavuje súbor pravidiel popisujúcich informačné zdroje, ktorými môže byť čokoľvek, počínajúc jediným slovom až po celý informačný fond, či už lokálny alebo vzdialený. To umožní zachytiť metadáta v omnoho väčšej kvantite a kvalite, ako to bolo možné predtým.

Prinajmenšom to tak začalo. Mimoriadna pružnosť RDF sa nakoniec ukázala ako omnoho silnejší nátroj, než si pôvodne jej tvorcovia mysleli. Okrem toho, že RDF umožňuje vytvárať kvalitnejšie metadáta, ktoré by informácie popísali presnejšie a umožnili formulovať kvalitnejšie dotazy, jeho hlavným prínosom je, že ním možno definovať spracovanie informácie a sémantickú úroveň informácií. Metadáta spracovania informácií, ktoré popisujú, ako s informáciami nakladať, ocenili najmä predstavitelia elektronického obchodu, zatiaľ čo metadáta sémantickej úrovne by mali potešiť knihovníkov, pretože v ich existencii spočíva aj ich budúcnosť.

Klásť dokonalejšie dotazy je len jedným z cieľov XML. Dôležitejším cieľom je premena zo strojom čitateľného webu na stroju zrozumiteľný web, teda vytvoriť to, čomu tvorca webu Tim BernersLee hovoril “sémantický (významový) web”. To bude možné uskutočniť novým druhom metadát – sémantickými informáciami – popisujúcim nie to, čo dáta sú alebo ako ich spracovávať, ale aj čo znamenajú. Zámerom sémantického webu je umožniť automatizované logické myslenie. Aby sa zlepšila relevancia výsledkov vrátených bežnými vyhľadávacími strojmi, nie je rozhodujúce, či sa logické myslenie využíva a priori alebo nepriamo. Podstatné je to, že rozsiahly informačný priestor, ktorý web predstavuje, sa stane spracovateľným, a nie iba prístupným.

Predstavte si tú obrovskú intelektuálnu výzvu. Bude nutné vytvoriť nepreberné množstvo sémantických metadát popisujúcich význam vecí v termínoch zrozumiteľných stroju. Ide o nový súbor riadiacich činností veľmi vysokej úrovne. Nebude však zahrnovať iba výber a súhrn existujúcich sémantických tvrdení (zovšeobecnenou formou niekdajších vecných hesiel a kľúčových slov), ale i vytváranie nových, ktoré doteraz neexistujú, alebo náhradu iných, ktoré sú nedostatočne presné. Čím bližšie k originálnemu autorskému procesu budú metadáta vytvárané, tým lepšia bude kvalita týchto sémantických informácií.

V tom bude pravdepodobne spočívať nová zmysluplná rola knihovníka – miesto toho, aby bol len vzdialeným príjemcom ukončenej práce ostatných, stane sa “tieňovým autorom” zodpovedným za vytváranie nových typov metadát ako súčasti pôvodného tvorivého procesu. Písanie nových sémantických tvrdení (vecného popisu), ktoré využívajú iní za zanedbateľný poplatok, ale často, by sa mohlo stať možnou cestou k zárobku na živobytie. “Koľkokrát si citovaný, toľkokrát si človekom” by tak mohlo dostať celkom nový význam!

Zamyslime sa teraz nad samotným jazykom. Zmysel dokumentu spočíva v kombinácii textu a významu používanej reči. Vek elektronických médií všetkých druhov a kultúra mládeže sprevádzajú rýchle zmeny v slovníku a zmysle jazyka v čase, čo azda nie je nikde evidentnejšie ako v globálnej angličtine. Sledovanie a registrovanie týchto lingvistických zmien v metadátach sémantickej úrovne je nielen ďalšou intelektuálnou výzvou pre knihovníka budúcnosti, ale aj životnou nevyhnutnosťou pre informačné fondy prístupné online. Bez toho by neboli fondy pre ďalšie generácie použiteľné. To je príklad, ako môže byť k informácii pridaná hodnota súbežnou intelektuálnou aktivitou, pri ktorej sa vytvárajú metadáta tak na špecifickej, ako aj na všeobecnej úrovni.

Ďalší priestor pre aktivitu ideálne vyhovujúcu skúsenostiam knihovníkov predstavuje časový kontext. Médiá majú snahu skracovať popisy udalostí i verejných vystúpení a podčiarkovať v nich aktuálne prvky. Časový kontext bude preto pre pochopenie historických udalostí životne dôležitý. Vyjadrovanie politika by mohlo byť nezrozumiteľné bez znalosti kontextu udalostí, na ktoré reaguje, či opozičných politkov, ktorých kritizuje. S tým súvisí ďalší typ nepriamej intelektuálnej aktivity pridávajúcej hodnotu k informáciám, ktorou je určovanie kontextu definovaním vzťahov na sémantickej úrovni medzi dokumentmi alebo medzi jednotlivými prvkami vnútri dokumentu.

Vecný popis (sémantické výroky), lingvistický zmysel a časový kontext, to všetko budú brať metadáta do úvahy pri formulácii dopytov vysokej kvality alebo pri stanovovaní relevancie odpovedí. Dokončenie nasledujúceho kroku vo vývoji webu bude požadovať obrovskú a dlhodobú intelektuálnu aktivitu. To je úplne nová profesijná príležitosť a knihovníci majú skvelú možnosť chopiť sa jej. Keď nechytia šancu za pačesy, potom sú ich vyhliadky naozaj neradostné.

Príležitosť pre statočných knihovníkov

Rola knihovníka bude veľmi odlišná, pretože iná bude aj knižnica. Prichádzajúce zmeny sú hnané pokrokom techniky a budú mimo kontroly knihovníkov. Nové sémantické úrovne aktivít, ktoré sa stanú ich perspektívnou rolou, tu ešte nie sú, ale našťastie zatiaľ neexistujú ani sebavytvárajúce online knižnice, kvôli ktorým budú tradičné roly knihovníkov nepotrebné. Ako online knižnice, tak aj knihovníci sú závislí od tej istej veci – od metadát. Je preto dobrý dôvod dúfať v relatívne bezbolestný prerod. Hovorí sa, že čas zmien je čas príležitostí. Príležitosti pre statočných a prispôsobivých knihovníkov, ktorí by zvyšovali ich cenu, sú istotne veľké. Knihovníci sa buď musia chopiť nového sveta metadát a ovládnuť ho, alebo ním budú zmetení.

Článok uverejňujeme s láskavým dovolením redakcie časopisu
Vesmír (www.vesmir.cz). Z češtiny preložila
PhDr. Marta Mandysová

 


http://www.cvtisr.sk/itlib/itlib024/hardie.htm
ITlib. Informačné technológie a knižnice