Návrh
vyhľadávania na webových sídlach rešpektujúci odporúčania informačných
architektov V minulom článku K niektorým problémom vyhľadávania na webových sídlach (Makulová 2006 c) sme bližšie charakterizovali dôležitý pilier informačnej architektúry vyhľadávania na webových sídlach. Zdôraznili sme nutnosť spolupráce medzi IT špecialistom a informačným architektom pri výbere vhodného vyhľadávacieho nástroja. V dnešnom príspevku si povieme niečo o možnosti monitorovania návštevnosti webového sídla, ktoré nám pomôže pri určení vyhľadávacích zón a odporúčaní informačných architektov pri návrhu systému vyhľadávania. Úvod Dobre navrhnutý systém vyhľadávania sa vráti predovšetkým v zvýšení návštevnosti webového sídla, ktorá úzko súvisí s jeho nájditeľnosťou. Nájditeľnosť webového sídla patrí k dôležitým kvalitatívnym atribútom, pretože veľké percento návštevníkov môže prichádzať na stránky z vyhľadávačov. Toto percento je závislé práve od kvality optimalizácie webového sídla pre vyhľadávače. Nájditeľnosť je o to dôležitejšia, že až 90 % používateľov neprejde pri listovaní vo výsledkoch cez tretiu ponúkanú stranu (iProspect Search Engine User Behavior Study 2006). O tom, že na nájditeľnosť stránky má veľký vplyv informačná architektúra, sme hovorili vo viacerých príspevkoch (Makulová 2005 b). Okrem informačnej architektúry má veľký vplyv na nájditeľnosť aj optimalizácia webových stránok pre vyhľadávače. V súčasnosti existujú mnohé sofistikované nástroje umožňujúce zistiť, ako sa správajú používatelia pri návšteve webového sídla. Výsledky analýz môžeme potom využiť pri návrhu vhodnej štruktúry sídla v prípade redizajnu, pri optimalizácii stránok, ale aj pri tvorbe vyhľadávacích zón. Systém NAJ.sk monitorujúci správanie používateľov na webe Na Slovensku patrí k najznámejším systém NAJ.sk (www.naj.sk) na meranie a analýzu návštevnosti stránok. K dispozícii sú rozsiahle štatistiky zahrňujúce základné informácie o návštevnosti, ako napríklad počet návštev, počet návštevníkov, počet zobrazených stránok, počet aktívnych návštevníkov, informácie o tom, odkiaľ ľudia na stránky prichádzajú a ako sa správajú, aké používajú prehliadače, aké majú technické možnosti (podpora flash, java, cookies a pod.), ako a odkiaľ sa k internetu pripájajú a veľa ďalších ukazovateľov spracovaných v prehľadných tabuľkách a grafoch. Tieto údaje možno ďalej využiť na optimalizáciu webových sídiel pre prehliadače, zlepšenie informačnej architektúry, určenia vyhľadávacích zón a pod. Na nasledujúcom obrázku vidíme, z ktorých vyhľadávačov prichádzajú návštevníci najčastejšie na Portál ku katalógom a zbierkam slovenských knižníc, ktorý je jedným z výstupov projektu KIS3G (www.kis3g.sk).
Ako vidíme na obrázku, zo 6 185 návštev až 65,92 % používateľov prichádza z vyhľadávača Google Slovensko. K ďalším vyhľadávačom s menším zastúpením patria Google.com (8,5 %), Zoznam.sk (fulltext 7,18 %) a Zoznam.sk (katalóg 7,07 %). K dispozícii sú aj mesačné správy poskytujúce celý rad užitočných informácií, ako napríklad počítače návštevníkov podľa regiónov v SR, podľa spôsobu pripojenia, podľa poskytovateľov pripojenia, informácie o tom, koľko času strávia na stránke a na webe, koľko stránok navštívia za jednu návštevu, ktoré sú najčastejšie hľadané spojenia a pod. Oblasti spolupráce pri návrhu systému vyhľadávania Jednou z najčastejších chýb pri návrhu systému vyhľadávania je, že sa úplne zveruje do rúk IT špecialistov a pri implementácii sa nekonzultuje s informačným architektom a neberie sa do úvahy správanie používateľa pri vyhľadávaní informácií. Preto je pri návrhu ideálna spolupráca medzi IT špecialistom a informačným architektom predovšetkým v nasledujúcich oblastiach (Rosenfeld – Morville, 2002, s. 137-144). Výber oblastí vyhľadávania Pri návrhu systému vyhľadávania sa často zindexuje celé webové sídlo, čo úplne nemusí vyhovovať požiadav-kám používateľov, ktorí majú často špecifické potreby. Preto sa odporúča vytvoriť vyhľadávacie zóny, ktoré tvoria súbory homogénneho obsahu a budú indexované zvlášť. Na nasledujúcom obrázku vidíme, ako má vyhľadávacie zóny na svojich stránkach pekne naimplementované spoločnosť DELL.
Prvé vyhľadávacie zóny sú určené podľa typu používateľov (malí a strední podnikatelia, zdravotníctvo, vysoké školy a pod.). Ak používatelia neurčia svoj typ, prehľadáva sa celé sídlo. Navyše majú možnosť si zvoliť, či chcú vyhľadávať produkty, technickú podporu alebo články a riešenia. Ak hľadáme napríklad tlačiarne, systém ponúka úplne iné typy pre domácnosti a iné pre federálnu vládu. Tvorba správnych vyhľadávacích zón v spolupráci s informačným architektom umožní zúžiť počet nájdených záznamov, ktoré sú špeciálne určené konkrétnej cieľovej skupine. Pri návrhu vyhľadávacích zón sa často využívajú aj navrhnuté organizačné schémy. Vyhľadávacie zóny môžu byť podľa typu obsahu, používateľov, predmetu, zemepisného názvu, chronológie, autora, oddelenia a pod. Indexovanie pre špecifické skupiny používateľov Často sa odporúča vytvoriť vyhľadávacie zóny aj pre špecifické skupiny používateľov, ktoré majú iné informačné potreby. K pekným príkladom patrí napríklad Národná lekárska knižnica USA (http://www.nlm.nih.gov/), ktorá už v rámci úvodnej stránky ponúka špeciálne informácie pre verejnosť, lekárskych profesionálov, knihovníkov, výskumníkov a vydavateľov. Indexovanie podľa predmetu K typickým príkladom využívajúcim indexovanie podľa predmetu patria predmetové adresáre internetu (Yahoo!, Open Directory Project, Zoznam.sk a pod.). Veľmi pekné indexovanie podľa predmetu má prvý predmetový adresár internetu Yahoo! Ako vidíme na nasledujúcom obrázku, systém umožňuje vyhľadávať buď v celom webovom priestore, v predmetovom adresári Yahoo!, alebo už iba v konkrétnej skupine.
Obr. 3 Určenie vyhľadávacej zóny v systéme Yahoo!
V nasledujúcej tabuľke vidíme porovnanie počtu nájdených záznamov na požiadavku “information architecture” v jednotlivých vyhľadávacích zónach.
Ako vidíme, počet nájdených záznamov nám výrazne klesol pri určení špecifickej zóny. Po prezretí záznamov v časti adresára Yahoo! Library and Information Science vidíme, že sme našli skutočne relevantné a kvalitné záznamy. Indexovanie nového obsahu V praxi sa často stretávame s obsahom, ktorý je indexovaný chronologicky. V takomto prípade môžeme vyhľadávať buď najnovšie informácie, prípadne informácie dodané pred týždňom, mesiacom alebo v určitom časovom pásme. S uvedeným príkladom vyhľadávacích zón sa často stretávame v rozšírenom vyhľadávaní. Napríklad vyhľadávač Google umožňuje hľadať záznamy, ktoré boli aktualizované kedykoľvek, posledné 3 alebo 6 mesiacov, prípadne za posledný rok. Výber prvkov záznamu zahrnutých do indexu Často sa odporúča zahrnúť do indexu aj časti dokumentu, podľa ktorých môžu používatelia ďalej zjemňovať a ladiť rešerš. Veľmi pekne sú dané filtre nastavené v systéme Virtua v projekte KIS3G, kde si používateľ môže nastaviť filtre podľa obsahu, formátu, jazyka, miesta vydania, dátumu vydania, lokácie a pod. Konvencie informačnej architektúry týkajúce sa vyhľadávania Už sme spomínali, že vyhľadávanie patrí k jedným z najdôležitejších pilierov informačnej architektúry. Počas vývoja vyhľadávania sa ustálili dva typy vyhľadávania: základné vyhľadávanie alebo vyhľadávanie podľa kľúčových slov a rozšírené vyhľadávanie umožňujúce zjemňovať a ladiť rešeršnú požiadavku. Kvalita vyhľadávania záleží od viacerých faktorov, ale predovšetkým je to kvalita a aktualizáca indexu, ktorý vytvárajú roboty. Počas viac ako desaťročnej existencii vyhľadávacích nástrojov sa vytvorili nasledujúce konvencie rešpektujúce výsledky prieskumov používateľov a odporúčania odborníkov. Základné vyhľadávanie
Rozšírené vyhľadávanie
Zobrazovanie výsledkov vyhľadávania Stránka s výsledkami vyhľadávania by mala obsahovať iba údaje vzťahujúce sa na výsledok vyhľadávania.
Záver Návrh vyhľadávacieho systému je jednou z najťažších oblastí vývoja sídla. Je chybou, že sa často podceňuje a zveruje sa do rúk iba IT špecialistom. Ak sa pri návrhu vychádza z výsledkov výskumov správania používateľov, odrazí sa to na vyššej návštevnosti webového sídla a ich spokojnosti. Pri zle navrhnutom systéme vyhľadávania riskujeme stratu dôležitých informácií, a preto by sme si mali uvedomiť, že informáciu, ktorú nikto nenájde, ani nikto neprečíta. Literatúra iProspect Search Engine User Behavior Study. April 2006. [cit. 2007-01-22]. Dostupné na internete: <http://www.iprospect.com/premiumPDFs/WhitePaper_2006_SearchEngineUserBehavior.pdf> MAKULOVÁ, Soňa. 2002. Vyhľadávanie informácií v internete. Problémy, východiská, postupy. Bratislava : EL&T, 2002. 376 s. ISBN 80-88812-16-X. MAKULOVÁ, Soňa. 2006 a. Analýza faktorov vplývajúcich na nájditeľnosť webových sídiel. In Information Use in Information Society. International Conference. Bratislava, Slovakia, October 10-11, 2006. Bratislava : Centrum VTI SR, 2006, s. 109-118. MAKULOVÁ, Soňa. 2006 b. Prečo musíme optimalizovať webové sídla pre vyhľadávače, alebo čo je SEO. In Newsletter. 2. február 2006 [online], [cit. 2007-01-22]. Dostupné na internete: < http://www.elet.sk/?newsletter&sprava=preco-musime-optimalizovat-webove-sidla-pre-vyhladavace-alebo-co-je-seo> MAKULOVÁ, Soňa. 2006 c. K niektorým problémom vyhľadávania na webových sídlach. In ITlib. Informačné technológie a knižnice [online], 2006, č. 4 [cit. 2007-01-22]. Dostupné na internete: < http://www.cvtisr.sk/itlib/itlib064/makulova.htm>. ISSN 1336-0779. McGOVERN, Gerry; NORTON, Rob. 2002. Content Critical. London : Pearson Education Limited, 2002. 241 s. ROSENFELD, L., MORVILLE, P. 2002. Information Architecture for the World Wide Web. 2. vyd. Sebastopol : O´Reilly&Associates, 2002, 461 s. ISBN 0-596-00035-9. Príspevok bol spracovaný v rámci vedeckého grantového projektu VEGA 1/2481/05 Využívanie informácií pri informačnom správaní vo vzdelávaní a vede.
prof. PhDr. Soňa Makulová, PhD. (makulova@elet.sk)
In ITlib. Informačné technológie
a knižnice [online], 2007, č. 01 [cit. 2007-28-03]. |