EFEKTIVNÍ VYHLEDÁVÁNÍ INFORMACÍ ŘÍZENÉ UŽIVATELI Pavel Kocourek
Již tradičně je vyhledávání akcí, která spojuje uživatele s informacemi, které hledají prostřednictvím významu svých dotazů. V uplynulých deseti letech profitoval infromační trh ze stále se snižujících cen datových úložišť. Počítačové systémy nabízely relativně jednoduché a také levné uchování dat - v databázích, na souborových serverech či emailových archivech. Tato řešení ve svém základním účelu uspěla - poskytla prostředí pro vytváření ohromného množství elektronických informací, které jsou dnes shromažděna v aplikačních "silech".
Komerční společnosti a státní instituce čelí novým požadavkům na shodu s právními pravidly státu či EU. V dnešní ekonomice založené na znalostech tak vítězí společnosti poskytující svým zaměstnancům i zákazníkům efektivní přístup k informacím. Vezměme jako příklad tradiční informační infrastrukturu podniku: řetěz hodnoty informací. Na spodní úrovni je produkce informací, na špičce jejich využívání. Jednotlivé úrovně se směrem k užití informací zužují a vytváří pyramidu v souladu se snižujícími se investicemi do jednotlivých úrovní. Ve většině institucí právě nákladná databázová úložiště a legacy architektura rozšiřuje pomyslnou spodní část. Inovativní řešení může spočívat v otočení nákladové struktury pyramidy.
Podíváme-li se na obrázek, ve spodní části pyramidy jsou zobrazeny datové zdroje. Fakt, že uložená data různého typu a formátu v podniku zpravidla vyžadují skupinu db architektů, programátorů, manažerů, řadu softwarových licencí a pár high-end serverů, není třeba dodávat. Na datové zdroje navazují aplikační nástroje, které jsou určeny pro pracovníky, kteří informace organizují, spravují a vyhledávají. Pro ty, kteří zprostředkovávají přístup pro uživatele. Knihovníci, správci aplikací a pracovníci podpory uživatelů tráví většinu svého pracovního času přípravou heslářů, zápisem metadat, správou přístupových práv a vývojem nových informačních služeb. Na vrcholku pyramidy jsou pak samotní uživatelé: zaměstnanci, analytici, vedení společnosti a také zákazníci hledající informace o produktech. Jaká bývá v takovém případě situace? Pesimisticky zhodnoceno: neflexibilní, mnohdy pomalý a nákladný přístup k informacím v relačních databázích a „legacy“ systémech. Finančně náročná a subjektivní správa metadat. Ne zrovna jednoduchá správa a koordinace prostředí. Duplicita práce. A stává se stále, že důležité informace nejsou dostupné… a nebo jsou k dispozici pozdě. Pokud ale připustíme informační architekturu založenou na moderní vyhledávací platformě, situace v hodnotovém řetězu se může dramaticky změnit. Řešení spočívá v obrácení pomyslné pyramidy. Zlepšením přístupu k informacím se sníží náklady na jejich vytváření a vlastnictví a také se pravděpodobně zvýší výkonnost podniku. Informace v okamžiku potřeby Tradiční pyramida vyrůstá ze zaměření na transakce. Bývalo méně dat… a co víc, většinou byla strukturovaná. To se ale vývojem dost změnilo. Dnešní uživatelé si uvědomují hodnotu včasných a přesných informací a vědí, jak je použít. Lepší informační služby mají přímý dopad na jejich práci. Lepší přístup k informacím je v podnicích strategickým požadavkem „objevování informací v okamžiku potřeby“ s intuitivním vyhledávacím rozhraním, relevantními výsledky, odezvou ve zlomcích vteřin a pokročilými nástroji pro jejich další zpracování řídí mnoho nových obchodních modelů. Tradiční informační systémy optimalizují produkci informací a jejích ukládání, ne využívání informací a velmi častou zanechávají potenciální uživatele bez odpovídající podpory. Pro zachování konkurenceschopnosti musí podnik svým zákazníkům a zaměstnancům umožnit co nejlépe dosáhnout a využít informace. Společnosti, které informace využívají, namísto toho, aby je pouze vytvářeli a ukládali, mají velkou a významnou strategickou výhodu. Vyhledávací řešení Trh vyhledávacích technologií již přerostl IT oblast. Vyhledávání má stěžejní roli v aplikacích pro objevování informací, BI, KM a v dalších svou výraznou roli postupně získává. Vývoj řídí zejména uživatelská očekávání. Vyhledávání není pouze o nalézání informací. Je výchozím bodem pro uživatele. Základní pohled na vlastnosti pokročilého vyhledávacího řešení nové generace: Pohled na souvislosti
Správa vyhledávání
Hodnocení relevance Cílem hodnocení je vyvážit poměr odezvy a přesnosti. Jak dobře odpovídá okruh odpovědí záměru položeného dotazu.
Pro hodnocení se používá u pokročilých vyhledávacích řešení řada kritérií. Hodnocení probíhá na úrovni dokumentu, vyhledání samotné pak na úrovni objektu. Uvedený model hodnocení relevance odpovídá produktu FAST ESP.
Získávání obsahu a jeho zpracování
Zpracování obsahu je klíčovým prvkem pro zvýšení kvality vyhledávací služby. Obsah externího datového zdroje je zpracován a podán vyhledávacímu systému. Před jeho uložením musí být optimalizován pro vyhledávání. Probíhá analýza dokumentů, transformace údajů a řada dalších kroků. „Vyčištěný“ a normalizovaný obsah pomáhá dosažení nejlepší úrovně relevance během vyhledávání.
Extrakce entit z obsahu zahrnuje definovatelné objekty: jména osob, jména institucí, emailové adresy, místa, datumy a další. Příklad: Neznám jméno osoby, kterou hledám, ale vím, že souvisí s tématem, na které se ptám. Jazyková relevance Vyhledávací řešení definují jazykovou relevanci jako využití informací se strukturou gramatiky a varia-cemi daného jazyka. S porozuměním jazykové relevanci je možné vyhledávat informace, které jsou mimo dosah tradičního hledání pomocí klíčových slov. Využívá se lematizace, slovníků a oborových taxonomií a dalších podpůrných nástrojů. Lingvistické nástroje pro zpracování obsahu a dotazů výrazně ovlivňují relevanci: odezvu a přesnost vyhledávání. Kvalita služby Spolehlivé řešení zajišťuje jak zpracování vstupních dat, tak obsluhu uživatelů. Při zachování výkonu a rychlosti. Lineární škálovatelnost je nezbytná ve třech dimenzích: objemu dat, počtu dotazů za vteřinu (QPS) a aktuálnosti dat. Integrovatelnost Možnost připojení existujících služeb, datových zdrojů a aplikačních systémů prostřednictvím standardů (SOA, Web services, Java). Podpora „rich media“ formátů pro vyhledávání, jakými jsou audio a video. Bezpečnost Zabezpečení je u vyhledávacího řešení na třech úrovních: u zpracovávaného obsahu, ve vyhledávací aplikaci a v serverovém prostředí. Záměrem je jednoduchý přístup k informacím, které jsou v zabezpečeném prostředí a jsou doručeny zabezpečeným způsobem. Řešení podnikového vyhledávání (ES) se poměrně rychle
stává strategickou komponentou informač- Poskytovatelé systému spolu s interními IT odděleními se musí pokusit očekávání plnit. „Je to jako příprava večeře pro návštěvu – buď bude ze surovin, které máte k dispozici, nebo se jich zeptáte, co mají rádi...“ Pro článek byly použity zdroje společnosti FAST Search and Transfer, kterou společnost INCAD zastupuje.
In ITlib. Informačné technológie
a knižnice [online], 2007, č. 04 [cit. 2007-12-21]. |