World Wide Web a Z39.50
V predchádzajúcich článkoch na stránkach BCVTI SR (2, 3, 4/1999, 1/2000) som sa
venovala problematike komunikačného protokolu Z39.50. Teraz by som sa chcela pokúsiť
o porovnanie práve spomínaného protokolu Z39.50 oproti tak známemu
a rozšírenému prostrediu WWW.
Žijeme v čase, keď nové informačné technológie menia náš každodený stereotyp. Internet sa veľmi rýchlo rozšíril do všetkých oblastí vedy, vývoja, výskumu, ale i obchodu a mnohí z nás ho používame denodenne, či už pri práci, na zábavu alebo komunikáciu. No a práve preto sa tu ponúka otázka, či investície do Z39.50 sú oprávnené. Avšak na druhej strane zdokonalená a rozšírená verzia tohto protokolu z roku 1995 si našla svoje uplatnenie vďaka svojim silným vyhľadávacím nástrojom. Druhým veľmi výrazným kladom tohto protokolu je jeho nezávislosť od aplikácií bibliografických databáz. Takže otázkou zostáva, kde a kedy v súčasnej informačnej infraštruktúre je vhodné použiť WWW a Z39.50. Ak sa pozrieme na tieto nástroje bližšie, zistíme ich spoločné prvky.
WWW aj Z39.50 fungujú ako vyhľadávacie nástroje, určené sú pre koncových používateľov a z technického hľadiska sú konštruované ako aplikácie client - server.
Prístup k informačným zdrojom pomocu WWW
Ak použijeme WWW, teda grafického klienta, alebo samotný prehliadač, ako je Netscape alebo Internet Explorer, tak tu máme veľmi lacný, ale zato používateľsky veľmi príjemný formulár, ktorý môže slúžiť na prístup ku knižničným katalógom. Jedným z dôvodov masového rozšírenia je aj to, že samotné nástroje umožňujúce publikovanie vlastných informácií v prostredí WWW sú väčšinou finančne nenáročné a jednoduché na používanie. Dovoľujú tak vytvoriť veľmi rýchlo takmer rovnaké stránky bez ohľadu na platformu. A čo sa týka ich prehľadávania, ani na strane klienta nie je potrebné žiadne špeciálne vybavenie na to, aby mohol pristupovať k takto vytvoreným informáciám. Prakticky klient potrebuje mať k dispozícii len prehliadač a prostriedky na prenos informácií, teda File Transfer Protocol – FTP. Vyhľadávacie nástroje sú prevažne zabudované priamo v prehliadači.
Samotný klient potom nemusí nič vedieť o doméne, ktorú práve prehľadáva. Jednoducho len prijíma grafické informácie, ako sú ikonky, tlačidlá, text atď. od servera, a tieto zobrazuje používateľovi. Problém však je v tom, že každý systém používa iné grafické rozhranie a iný dizajn stránky. To je pre používateľa veľmi neefektívne. Navyše má používateľ mylnú predstavu o tom, že pri vyhľadávaní sa vytvára spojenie medzi klientom a serverom a na základe toho sa domnieva, že môže použiť výsledok predchádzajúceho prehľadávania na spresnenie vyhľadávacej otázky. Toto nie je správne. WWW prístup to neumožňuje. Dôvodom je HyperText Transfer Protokol, ktorý tvorí základ WWW prístupu. Tento protokol je označovaný ako stateless – menejhodnotný. WWW prístup nie je vytvorený pre online informačné systémy, ktoré sú založené na komunikácii v rámci vzájomného spojenia. Nevyhnutnosť takéhoto prehľadávacieho mechanizmu je daná aj skutočnosťou, že stále narastajúci počet WWW stránok s odlišným prístupovým rozhraním si vyžaduje čoraz viac času. Prehľadávanie indexov bez štruktúrovaného prístupu k informáciám sa pomaly stáva nerealizovateľné.
Z.39.50 a jeho funkcie pri vyhľadávaní informácií
Knižničná komunita preto na rozdiel od WWW ponúka nástroj pre prístup k štruktúrovaným informačným zdrojom pomocou internetu. Dôkazom toho je Z39.50 Tento štandard špecifikuje spôsob výmeny správ medzi klientom označovaným ako Origin a serverom označovaným ako Target. Cieľom je vyhľadať a prenášať informácie od servera ku klientovi bez toho, aby klient vedel niečo o dátabázovom jadre či aplikácii a jej dátovej štruktúre, ktorá je nad týmto jadrom vybudovaná a uchováva informácie v štruktúrovanej podobe. Server teda vytvára akúsi abstraktnú databázu nad reálnou databázou, ktorá uchováva informácie a s klientom komunikuje v abstraktnom jazyku – abstract syntax notation. Server potom jednotlivé otázky prekladá do reálnej syntaxe, v ktorej rozumie reálna databáza. Od nej prijíma v tejto podobe výsledky a tie opäť prekladá do abstraktnej reči tzv. Z-jazyka, v ktorom odovzdá výsledky klientovi. Ten buď priamo výsledky zobrazí používateľovi, alebo v prípade jeho prepojenia s iným grafickým rozhraním, napr. WWW geatway, ich odovzdá v dohodnutej podobe tomuto rozhraniu a v rámci tohto rozhrania sú potom prezentované používateľovi.
Z39.50 teda špecifikuje prostriedky a operácie, ktoré mu umožňujú vyhľadávať a preberať záznamy, ako aj prezerať slovníky použítých termínov v konkrétnych databázach na základe abstraktného informačného systému. Popri tom však je presne definované spojenie a spôsob komunikácie medzi klientom a serverom. Klient tak môže v rovnakom čase nadviazať spojenie s viacerými servermi a každý server môže obsahovať abstraktné databázy z viacerých reálnych databáz. To zabezpečuje klientovi prístup k aplikáciám a informáciám v nich obsiahnutých bez toho, aby musel vedieť podrobnosti o ich architektúre a vnútornej štruktúre.
Nesmiernou výhodou je jednotnosť rozhrania, ktoré používa používateľ pri prístupe k týmto databázam. Z toho dôvodu môže byť toto rozhranie upravené vždy podľa požiadaviek konkrétneho používateľa, pretože určite iné rozhranie bude používať vedecký pracovník ako žiak základnej školy. Toto rozhranie sa môže podobať databázovému prostrediu rovnako ako textovému editoru či konkrétnemu WWW prehliadaču. No a v tom je práve sila tohto komunikačného protokolu. Jeho nezávislosť, ktorá umožňuje v rovnakom čase pristupovať k jednému zdroju viacerým používateľom s rôznym používateľským rozhraním.
Je jasné, že tento protokol bol od počiatku budovaný na základe client – server. Preto nie je problém vytvárať prepojenie medzi databázami na jednom serveri. Poblém je však v tom, ako získať informácie o takýchto serveroch – informačných zdrojoch, teda ako nájsť tie servery, ktoré obsahujú databázy s informáciami, ktoré práve potrebujeme, a ako zistiť obsah konkrétneho servera. Tieto informácie sú nesmierne dôležité pre klienta a jeho správnu konfiguráciu. Bez správnej konfigurácie totiž nie je možné nadviazať spojenie so serverom, teda nie je povolený prístup k jeho informáciám. Tento problém rozdelíme na dve časti a to:
Ak sa zameriame na prvý problém, tak môžeme v samotnom protokole nájsť komunikačný prostriedok označovaný ako Explain. Jedná sa nástroj slúžiaci správcovi takýchto serverov, ktorý mu umožňuje v pevne definovanej štrukturovanej podobe zverejniť informácie o sebe samom ako i o databázach a ich obsahu, ktoré spravuje. Množina informačných prvkov, ktorá je definovaná v tomto komunikačnom prostriedku obsahuje základné informácie pre klienta, ako je adresa a port, názov databázy, porpípade databáz, ale tiež množinu prístupových – vyhľadávacích prvkov a ďalšie informácie nevyhnutné pre konfiguráciu klienta. Presne definovaná štruktúra správ, ktoré sa vymieňajú medzi klientom a serverom potom umožní klientovi samonastavenie parametrov pre nadviazanie spojenia s takýmto serverom.
Pri druhom probléme je trocha odlišná situácia. Na vyhľadávanie samotných Z-serverov a určenie ich lokácií, teda URL adries je možné jednak používať už spomínané WWW prehliadače, ale rovnako dobre môžeme použiť tiež samotný protokol Z39.50. K tomuto účelu nám veľmi dobre poslúži Global Information Locator Service (GILS), ktorý je definovaný v jednom z aplikačných profilov tohoto protokolu. Pôvodne bol definovaný a teda i prispôsobený pre vládne dokumenty USA, ale v súčasnosti nachádza uplatnenie i v iných oblastiach. Veľmi dobre ho môžeme využiť pri hľadaní rôznych druhov dokumentov ako sú knihy, fotografie, zbierky múzeí a gelérií, audiovizuálne dokumenty, ďalšie informácie uložené v databázach rozličných platforiem, ale i WWW dokomuty, ktorými tiež môžu byť ďalšie Z39.50 servery, ale i mnohé ďalšie. Veľmi pekným príkladom jeho použítia je AHDS Gateway – Arts & Humanities Data Service. Ide o rozhranie, vytvorené v Londýne, ktoré zabezpečuje prístup k piatim úplne odlišným databázam. Bližšie sa s ním môžete zoznámiť na adrese http://ahds.ac.uk:8080/ahds_live-hitlist_rames.html. Uvedený príklad svedčí o tom, že nám vlastne stačí ako koľvek vstupný prvok pre hľadanie a pomocou tohto silného nástroja máme zabezpečný prístup k akýmkoľvek informáciám uloženým kdekoľvek vo svete.
A čo povedať na záver? Ako vidieť máme tu dva samostatné nástroje, ktoré predstavujú značný potenciál pre vyhľadávanie a prístup k informáciám. Vzťah medzi Z39.50 a WWW sa nedá poprieť. Ich rýchle rozširovanie a uplatnenie v praxi je výsledkom ich vzájomnej spolupráce kde jeden využíva tie najlepšie prvky druhého. Preto pre prepojenie rôznych systémov a typov dokumentov je dobré použiť WWW prehliadače a pre štrukturované vyhľadávanie informácií Z39.50
Ing. Nadežda Andrejčíková, Cosmotron Systems & Bohemia, s. r. o
http://www.cvtisr.sk/itlib/bc2000_2/cosmotron.htm
ITlib. Informačné technológie a
knižnice