E-learning – elektronické vzdelávanie a spracovanie dokumentov


Vývoj vzdelávania v informačnej spoločnosti

Informačná spoločnosť označuje ďalšiu etapu vývoja ľudstva, ktorú je možné dosiahnuť uplatnením nových informačno-komunikačných technológií. Pre oblasť vzdelávania sa v tejto súvislosti začína používať pojem e-vzdelávanie, e-learning. Tento pojem je potrebné rozlišovať v dvoch rovinách: ako technický systém a ako nový systém vzdelávania. Technický systém e-vzdelávania zahrnuje všetky potrebné technické prostriedky informačno-komunikačných technológií pre vzdelávanie, systém vzdelávania a novú technológiu vzdelávania s implementáciou technického systému. Spoločné pôsobenie obidvoch systémov je základným predpokladom vytvorenia nového vzdelávania v informačnej spoločnosti.

Vývoj vo svete ukazuje, že trend vytvárania novej vzdelávacej formy, e-vzdelávania, nastúpil a je možné uviesť nasledujúce dôvody na jeho uplatnenie:

Množstvo informácií, ktoré je potrebné zvládnuť, neustále narastá. Absorbovanie všetkých informácií prestáva byť vo vzdelávacom procese dominantným a nahrádza sa rozvíjaním schopnosti učiť sa.

Znalosti získané v škole vystačia na čoraz kratšie časové obdobie, vzniká potreba kontinuálneho vzdelávania.

Spracovanie učebnej látky do multimediálnych kurzov a ich interaktívne študovanie zvyšuje kvalitu a rýchlosť získavania vedomostí a zručností, dovoľuje študentovi prechádzať z pasívnej roly do aktívnej.

Konkurenčný tlak, ktorý vytvárajú predovšetkým americké univerzity, príchod slabších populačných ročníkov a zvyšujúca sa mobilita študentov začína ohrozovať vysoké školy, ktoré sa bránia zmenám systému vzdelávania.

Ako prekážky realizácie služby e-vzdelávanie sa dnes dajú uviesť:

Uvedené prekážky sú skutočnosťou, ale sú zároveň výzvou na ich prekonanie a vyriešenie. Nie sú faktorom, ktorý nastupujúci trend zabrzdí, iba ho môže spomaliť.

Zmeny vzdelávacieho procesu

Ak má byť výsledok vzdelávania iný ako doteraz, nemôže ho vytvoriť doterajší spôsob vzdelávacieho procesu. Znamená to, že vzdelávanie dnešného storočia vyžaduje uskutočnenie nového vzdelávacieho procesu. Už dnes sa predpokladá uskutočnenie nasledujúcich zmien:

Zmení sa spôsob vyučovania. Doterajší spôsob vyučovania uplatňoval a aj uplatňuje princíp reprodukcie vzdelávacích obsahov študentom učiteľmi v klasickej škole. Študenti sa naučia základné znalosti, kto využívajú vo svojom ďalšom aktívnom živote. Súčasné tempo vývoja informačných a komunikačných technológií dovoľuje uskutočniť zásadné zmeny vo vyučovacom procese tým, že poskytuje možnosti na vytváranie nielen textových stránok, ale aj prezentácie vo forme multimediálnych kurzov. Tie umožnia študovanú látku absorbovať rýchlejšie a lepšie ako klasická forma výkladu a textového či grafického spracovania.

Multimediálne vzdelávacie kurzy môžu byť dostupné cez komunikačné siete, čo umožňuje študentom získavať aktuálne vzdelávacie obsahy z viacerých zdrojov, v akomkoľvek čase a z akéhokoľvek miesta. Tým sa dá meniť čiastočne alebo v niektorých prípadoch aj celkom charakter poskytovania služby vzdelávania na službu e-vzdelávania.

Možnosť prístupu k vzdelávacím multimediálnym kurzom cez komunikačnú sieť umožní kontinuálne vzdelávanie ľudí bez toho, aby prerušili svoje pracovné povinnosti. Tento spôsob ďalšieho vzdelávania je v prudko sa meniacich podmienkach práce nevyhnutný. Zároveň sa tak rozšíri okruh študentov, ktorí budú používať vytvorené kurzy.

Vzdelávacie inštitúcie a učitelia môžu prístupom k štúdiu cez komunikačnú sieť získať nielen miestnych študentov, ale aj študentov z miest vzdialených. Tým sa dá zväčšiť ich pole pôsobenia, čo prinesie vyššiu efektivitu vzdelávania.

Zmení sa skladba pracovníkov zabezpečujúcich vzdelávací proces. Kým doteraz bol učiteľ tvorcom informačného obsahu, prednášateľom a tvorcom študijných materiálov, vytvánie multimediálnych kurzov bude vyžadovať špeciálne profesie potrebné pre tímovú prácu odborníkov z rôznych oblastí.

Súčasná zodpovednosť učiteľov za vedomostnú úroveň študentov sa prenesie na študentov samotných. Učiteľ sa stane viac trénerom a poradcom študenta pri získavaní požadovaných vedomostí.

Zmeny vzdelávacieho procesu si vyžadujú riešiť najmä tieto oblasti:


Informačno-komunikačné technológie

Na význam pojmu informačno-komunikačné technológie vo vzdelávaní existuje veľa názorov. Mnohí zastávajú názor, že každý spôsob elektronického spracovania informácie, ktorý sa dá použiť vo vzdelávaní, patrí k informačno-komunikačným technológiám. Možno sem tak zaradiť video, audiokazetu, rovnako ako dnešnú službu www či CBT kurz na CD. Niet dôvodu tento názor neprijať. Treba však poznamenať, že uvedené produkty sú v skutočnosti iba pomôckou pri uskutočňovaní existujúceho vzdelávacieho procesu a skôr ide o elektronické učebné/didaktické pomôcky. Ich implementácia do vzdelávania, hoci existujú už niekoľko desaťročí, žiadnu zásadnú zmenu vo vzdelávaní nepriniesla, iba ho v niektorých častiach zlepšila. Poslednou technológiou, ktorá spôsobila zmenu vo vzdelávacom procese, je kníhtlač. Sprístupnila vzdelanie podstatne širšiemu počtu osôb, ale len vtedy, keď sa zmenil systém vzdelávania a vznikli obecné školy.

Ak nová informačná spoločnosť vyžaduje iný prístup k vzdelávaniu, potom treba technické prostriedky informačno-komunikačných technológií združiť a využiť inak. Typická štruktúra technického podsystému v systéme e-vzdelávania je znázornená na obr. 1.

drozd.gif (6755 bytes)

Obr. 1 Technické nástroje e-vzdelávania

 

Technické nástroje potrebné na jej realizáciu sú:

Z procesného hľadiska môžeme rozdeliť úlohy, ktoré treba zabezpečiť, na infraštrukturálne a štrukturálne. Infraštrukturálne úlohy vykonávajú:

Štrukturálne úlohy vykonávajú:

 


Pedagogika pre e-vzdelávanie

Hoci je úloha informačno-komunikačných technológií prvoradá a bez nej nemožno ísť ďalej, netreba tento problém preceňovať na úkor riešenia problémov pedagogických. Vzdelávací proces v informačnej spoločnosti nebude predstavovať automatizáciu vzdelávacieho procesu prostredníctvom počítača, bez priamej účasti realizátorov vzdelávania. Študent bude aj v budúcnosti potrebovať motiváciu k štúdiu, radu, ako pri štúdiu postupovať, a sociológovia tvrdia, že i kontakt s inými ľuďmi. Technológie nenahradia učiteľa, ale zásadne zmenia jeho úlohu. Nové technológie s pomocou učiteľa majú celý proces zmeniť a prispôsobiť potrebám novej informačnej spoločnosti.

Pre takýto prístup je vhodný pedagogický postup označovaný ako konštruktívny. Vychádza z posledných poznatkov o funkciách ľudského mozgu a zároveň rešpektuje budúce nároky na proces vzdelávania. Jeho hlavné zásady sú:

Ak porovnáme dnešný spôsob realizácie vzdelávacieho procesu, musíme konštatovať, že je predovšetkým orientovaný na interpretáciu informačných obsahov. Učiteľ prezentuje svoje vedomosti a zisťuje, či ich študenti dokážu správne reprodukovať. Táto forma je určite v niektorých oblastiach nevyhnutná, ale sú oblasti, kde nie je vhodná. Získavanie informácií nebude hlavnou úlohou vzdelávacieho procesu. Tie môžu byť uložené v správne spracovanom multimediálnom vyučovacom kurze. Hlavnou úlohou učiteľov vďaka informačno-komunikačným technológiám bude vytvoriť také motivujúceho prostredie na kreatívnu prácu študentov, ktoré ich dobre pripraví na život v informačnej spoločnosti. A to je ťažká úloha, ktorú musíme vyriešiť.


Sociálno-kultúrne problémy

Realizácia služby e-vzdelávania je celospoločenský problém. Nemožno očakávať jeho dosiahnutie samostatne každým účastníkom vzdelávacieho procesu. Celospoločensky v našom ponímaní znamená úroveň vzdelávacích inštitúcií, ktoré možno rozdeliť na dve základné formy:

Pre uplatnenie e-vzdelávania v týchto dvoch odlišných formách sú podstatné dva faktory:

Školský systém je z hľadiska právnych a legislatívnych noriem zložitý a nie je jednoduché vytvoriť ho a ani meniť. Naproti tomu podnikové vzdelávanie je záležitosťou samotného podniku. Jeho vytvorenie a zmeny v ňom si podnik vytvára sám. Preto uplatnenie systému e-vzdelávania v podnikoch je z tohto pohľadu jednoduchšie. Ale aj v školskom systéme vzdelávania postupne dôjde k zmenám. Podľa prognóz v Syracus Heral American [1] “v blízkej budúcnosti kvôli štúdiu na vysokej škole nebude potrebné opúšťať ani byt. Priamo z bytu bude možné navštevovať aj viaceré vysoké školy. Toto všetko bude možné vďaka širokopásmovému internetu, pričom sa predpokladá rýchle a trvalé pripojenie domácností. Fyzickú návštevu vysokej školy nahradí rozšírená videokonferencia, priame štúdium univerzitných programov diaľkového vzdelávania.”

Druhý rozdiel pri uplatňovaní nových technológií je vo financovaní, ktoré je v školskom systéme nepriaznivejšie ako v podnikoch. Napriek tejto situácii je e-vzdelávanie téma, ktorej sa treba venovať a riešiť ju aj v školách, pretože potrebujeme byť nachystaní na čas, keď problémy finančné nebudú to, na čo sa môžeme vyhovoriť.

Bez ohľadu na to, o aký proces vzdelávania ide, prístup k riešeniu tohoto problému je úplne rovnaký. Pri základných strategických úvahách o vytváraní služby e-vzdelávania treba mať na pamäti, že historický vývoj smeruje k informačnej spoločnosti. Vybudovanie informačnej spoločnosti znamená, že všade, kde sa pracuje s informáciami, dôjde k zásadnej zmene doterajšej práce s nimi.

Vzdelávací proces je jednoznačne práca s informáciami.

Informačno-komunikačné technológie umožňujú prostredníctvom svojich produktov informáciu v akomkoľvek type (hlas, text, obraz, dáta) a v ich kombináciách zbierať, spracovať, triediť, vyberať, uchovať, prenášať a prezentovať.

Vo vzdelávacom procese sú využívané všetky typy informácie.

Zmeny, ktoré prináša globalizácia, sa dotknú každého, kto pracuje vo vzdelávacom procese. Úvahy o očakávaných zmenách vedú k implementácii nových služieb informačno-komunikačných technológií. E-vzdelávanie je takouto novou službou vo vzdelávacom procese.

Vzdelávací proces sa zmení na službu e-vzdelávanie.

Zámer implementovať službu e-vzdelávanie vo vzdelávaní musí byť v súlade so zámerom príslušného producenta vzdelávania.

V súčasnosti sa [2] najviac pozornosti venuje vybudovaniu zodpovedajúcej sieťovej infraštruktúry, zabezpečeniu prístupu k vysokorýchlostnej komunikačnej sieti, tvorbe multimediálnych vzdelávacích kurzov, avšak bez celkovej koncepcie riešenia vzdelávacieho procesu. Projekty budovania informačno-komunikačnej infraštruktúry sú vytvárané podľa technologických a finančných možností a nie na základe potrieb nového vzdelávacieho procesu. Tento prístup sa všeobecne nepovažuje za správny pre implementáciu nových informačno-komunikačných služieb, a teda ani pre e-vzdelávanie. Vytváranie nových riešení vyžaduje induktívny systémový prístup, ktorý je založený na overovaní mnohých čiastkových úloh, z ktorých sa neskôr vytvorí vhodný implementačný postup.

Rozsah tohto článku neumožňuje vysvetliť princípy správnej implementácie informačno-komunikačných technológií do systému vzdelávania. Preto odkazujeme čitateľa na ďalšiu literatúru, uvedenú v závere článku.

 

Informačné technológie pre spracovanie dokumentov

V súčasnosti neustále stúpa potreba spracovania veľkého množstva informácií – časopiseckých článkov, novinových článkov, odbornej literatúry, korešpondencie, agentúrnych správ, vyhlášok, zákonov, príspevkov z konferencií na počítačových sieťach atď., ktoré sú prístupné pro-stredníctvom počítača. Pre používateľov je väčšinou problémom, že nevedia, kde presne sa nachádzajú pre nich zaujímavé informácie, alebo dokonca ani nevedia, či sa žiadané informácie v dostupných textoch vôbec nachádzajú. V reálnom živote asi ťažko dosiahneme to, že sa všetci autori podriadia pravidlám stanoveným pre štruktúru textu. Vzniká teda potreba nástrojov umožňujúcich rýchlu a ľahkú orientáciu v dokumentoch.

Vyvinuli sa dva hlavné smery hromadného spracovania údajov. Prvý z nich – tzv. rešeršné systémy – slúži na vyhľadávanie bibliografických informácií. Tieto systémy sú základom tzv. dokumentografických informačných systémov (DIS). Zo začiatku boli tieto systémy určené výhradne na spravovanie rozsiahlych bibliografických databáz obsahujúcich nie úplné texty dokumentov, ale len sekundárne informácie, ako napr. meno autora, názov a abstrakt článku. Trendom posledných rokov je prechod k DIS, ktoré obsahujú úplné texty dokumentov. Je dôležité si uvedomiť, že tieto texty nemusia byť rovnorodé, ale najrôznejšieho druhu. Databázy obsahujúce texty môžu byť a zväčša sú značne rozsiahle.

Implementácia DIS vyžaduje špeciálne metódy prístupu k dátam. Rešeršné systémy či DIS boli pôvodne vyvíjané s cieľom efektívne zvládnuť nárast spracovania dát v oblasti vedecko-technických informácií. Mnoho univerzitných, podnikových a verejných knižníc v súčasnosti používa DIS, aby zaistili prístup k informáciám v knihách, časopisoch a ostatných dokumentoch.

Druhým smerom sú tzv. faktografické databázy či faktografické informačné systémy (FIS), ktoré v prevažnej miere spracovávajú údaje určené napr. pre podnikanie. Tu sa veľmi prejavuje snaha po integrácií databázového (faktografického) sveta a sveta DIS.

Zásadný rozdiel medzi DIS a FIS spočíva v tom, že FIS ukladajú údaje do pevnej údajovej štruktúry. Umiestnenie údajov v tejto štruktúre dáva údajom istú sémantiku. Napr. atribúty ako sú meno zamestnanca, číslo zamestnanca, adresa a plat môžu modelovať zamestnanca podniku, pomocou čísla úlohy a čísla zamestnanca možno modelovať skutočnosť, že zamestnanec pracuje na úlohe, t. j. možno modelovať vzťah. Sú tiež definované vzťahy medzi údajmi. Ďalšou vlastnosťou týchto systémov je, že sú deterministické a vyhľadávanie v týchto systémoch sa uskutočňuje podľa presnej a úplnej špecifikácie podmienky. DIS pracujú s málo štruktúrovanými údajmi. Na logickej úrovni môže byť v najjednoduchšom prípade štrukturálnou jednotkou dokument, ktorý obsahuje text v prirodzenom jazyku so všetkými variabilnosťami, napr. v slovenčine s takým zložitým skloňovaním a časovaním, synonymami, homonymami a pod. Bez lingvistickej znalosti vlastného textu predstavuje údaje s veľmi slabo definovanou sémantikou.

V súčasných trendoch je text tiež chápaný štruktúrovane, napr. zborník – článok – kapitola – odstavec. Tieto objekty sú ale opäť texty. Definovaná štruktúra v nich vytvára len isté usporiadanie. V DIS sa často používa technika klasifikácie. Zatiaľ čo vo FIS je trieda objektov definovaná pomocou atribútov, podľa ich hodnôt objekt buď do danej triedy patrí, alebo nepatrí, v DIS sa často uspokojíme len s tým, že objekty danej triedy sa týkajú len niektorých z týchto atribútov. Prvému spôsobu sa hovorí monotetická klasifikácia, druhá je označovaná ako polytetická.

Systematicky organizovanú digitálnu reprezentáciu textových údajov, vrátane príslušných pomocných dátových štruktúr, nazývame textovou databázou. Programové prostriedky na manipuláciu s týmito údajmi a ich bezpečné uchovávanie nazývame systém riadenia textovej bázy údajov a oba komponenty dohromady budeme nazývať dokumentografický informačný systém. Primárne údaje v textovej databáze sú zvyčajne predstavované kolekciou textov, ktorá sa môže i meniť v čase. Možno teda hovoriť o stave textovej databázy či stave kolekcie.

Charakteristickou črtou DIS je spôsob práce, akým sú využívané. Účelom DIS je umožniť riešiť vyhľadávací problém, ktorý možno formulovať takto: Nájsť k používateľskej požiadavke (dotazu) relevantné dokumenty.

Pri vyhľadávaní v týchto systémoch na rozdiel od FIS, žiaľ, používateľ väčšinou nevie, ako formulovať svoju požiadavku, aby obdržal žiadaný (relevantný) dokument. Existujú dve formy vyhľadávania relevantných dokumentov: listovaním v databáze (browsing) a formuláciou dotazu. Druhá možnosť znamená formulovať požiadavku v nejakom dotazovacom jazyku. Dotazom potom možno, podobne ako vo faktografických databázach, chápať vyčísliteľnú funkciu Q, definovanú na stavoch kolekcie textov. Dokumenty či iné jednotky textu tvoriace odpoveď na dotaz Q sa nazývajú hity. Hovorí sa, že dokumenty z odpovede vyhovujú dotazu.

Používateľovi je dnes obvykle ako výsledok dotazu prezentovaný online dokument, čo môže byť bibliografická referencia alebo abstrakt, ale tiež napr. ASCII verzia úplného dokumentu alebo dokonalejší súbor v postskriptovom formáte. V službe WWW je možné objaviť i dokumenty, ktoré sú samy osebe riadené hypertextovo, t. j. je možné v nich nielen listovať lineárne (dopredu, dozadu), ale zložitejším spôsobom, ktorý zodpovedá cestám po orientovanom grafe.

V súčasnosti sa pri vytváraní DIS uplatňujú nasledujúce disciplíny: matematika (logika, teória pravdepodobnosti, fuzzy množiny, vektorové priestory), lingvistika (syntaktická analýza, sémantická analýza), databázové technológie ( dátové modelovanie, databázové gramatiky a jazyky, dolovanie znalostí, dátové sklady), teória algoritmov (dátové štruktúry, zložitosť algoritmov).

Podobne ako v modeli FIS je vhodné i s textmi pracovať na viacerých úrovniach abstrakcie, t. j. vedľa textov je vhodné popísať i jeho schému pomocou zodpovedajúceho modelu. Táto schéma je vo svojich funkciách podobná schéme klasických databáz. Model DIS je definovaný ako súbor pojmov či nástrojov pre:

To prináša určité výhody:

Medzi prominentné modely DIS patrí v súčasnosti rozšírený Boolov model, vektorový model a model založený na pravdepodobnostnom výbere. S modelom DIS sú spojené i zodpovedajúce metódy vyhľadávania. Podľa Schebera sú všetky tieto metódy založené na dvoch princípoch:

1. Princíp vyhľadávania podľa umiestnenia. Ak je raz dokument ulože- ný na vhodnom mieste (polica v knižnici, riadok v tabuľke, lístok v zá- suvke), je jednoduché ho v ľubovoľnom neskoršom čase vybrať. Hlavným zámerom je organizácia “vhodných miest”, kde sú dokumenty uložené, alebo odkazov na tieto miesta (napr. indexy). Zodpovedajúce metódy využívajú údajové štruktúry, ako sú klasifikácie a tezaury.

2. Princíp pravdepodobnostného usporiadania. Ak je odpoveďou na dotaz kolekcia dokumentov usporiadaná vzostupne podľa klesajúcej pravdepodobnosti užitočnosti týchto dokumentov pre používateľa, pričom tieto pravdepodobnosti sú na základe dostupných údajov odhadnuté čo najpresnejšie, potom celková efektívnosť DIS bude pre používateľa najlepšia, akú je možné na základe takých údajov dosiahnuť.

V prvom prípade ide o organizáciu odkazov k dokumentom. S indexáciou úplných textov sa môžeme dostať k stovkám či stotisícom odkazov. V logických modeloch, kde sa vychádza z predpokladu, že zadaný term (kľúčové slovo, deskriptor) implikuje dokument nesúci relevantnú informáciu, t. j. term => dokument, môže byť takých odkazov neobmedzené množstvo.

Pravdepodobnostný princíp je nepochybne kvalitatívne vyššie než tradičný prístup pomocou umiestnenia. Možno ho formulovať a dokázať i matematicky. V kontexte digitálnych knižníc má dokonca jasnú prioritu. Zdôraznime však, že metódy vyhľadávania charakteristické pre jednotlivé princípy sa často prekrývajú. Nejde teda o dva disjunktné prístupy. Pravdepodobnostný princíp má zrejme na kvalitu výberu informácií podstatný vplyv. Mieru uspokojenia používateľských dotazov nazveme informatívnosťou DIS. Systémy uspokojujúce požiadavky používateľa sa nazývajú informatívne. Výskumníci sa snažia zlepšiť informatívnosť DIS použitím informácií o štatistickom rozložení termov, t. j. frekvenciu termov v jednotlivých dokumentoch, kolekciách dokumentov alebo v podmnožinách kolekcí dokumentov, ktoré sú pre dotaz relevantné. Distribúcia termov sa využíva v kontexte štatistických modelov, ako je vektorový model, pravdepodobnostný model alebo model zhlukov dokumentov. Pri použití týchto modelov je na základe informácií o distribúcií termov možno priradiť pravdepodobnosť relevancie každému dokumentu v množine, ktorá je odpoveďou na dotaz.

Ohodnotenie dokumentu je dôležité v prípade, že je vybraný veľký počet dokumentov a používateľ by bol tak zavalený veľkým množstvom informácií. Potom hovoríme o usporiadaní dokumentov (dokument ranking) charakteristickom pre pravdepodobnostný prístup k vyhľadávaniu dokumentov. Ako prídavok k algoritmom na usporiadanie dokumentov je možno združovať dokumenty na základe termov do tzv. zhlukov, ktoré obsahujú “príbuzné” dokumenty.

K vytváraniu DIS je tiež možné pristupovať z druhej strany, t. j. zdola od údajových štruktúr. Príkladom takéhoto prístupu je model založený na súboroch signatúr.

Charakteristickou metódou pre vývoj DIS je experiment. Ukazuje sa, že vývoj DIS prechádza štádiami teória – experiment – prax a späť. Cieľov v tomto cykle je stanovených niekoľko. Ide najmä o efektívne ukladanie a prístup k údajom a, samozrejme, o najväčšiu mieru uspokojenia používateľa.

Modely či metódy DIS nesú so sebou mnoho heuristík, ktoré treba overovať na kolekciách textov. Príznačné je, že jedna metóda vyhľadávania úspešná na jednej kolekcii nemusí byť použiteľná na kolekcii inej.

V súvislosti s rozšírením počítačových sietí a dostupnosťou informácií z rôznych informačných zdrojov vystupujú do popredia rôzne informačné služby. Tieto služby sa v skorších DIS väčšinou spracovávali offline. Budeme o nich v súlade s dnešnými trendmi uvažovať všeobecne v sieťovom prostredí.

Najčastejšou službou, ktorú poskytujú dnešné DIS, je možnosť zadať dotaz v dotazovacom jazyku, vyhodnotiť ho, posúdiť mohutnosť výsledku, upresniť dotaz a po niekoľkých takýchto iteráciách požiadať o sprístupnenie zodpovedajúcich jednotiek textu (článok, stránka, odstavec a pod.). Vyhľadávaciemu systému sa niekedy hovorí vyhľadávací stroj a používateľskému rozhraniu prehliadač (angl. browser). Tieto služby teda riešia vyhľadávací problém. K otázkam súvisiacim s riešením vyhľadávacieho problému, patrí najmä:

V rozsiahlych systémoch, ako sú bázy článkov či výskumných správ, sú texty často zoskupované do databáz záujmových oblastí, z nich len niektoré sú v danom čase dostupné. Používateľ sa teda stretáva s problémom dostupnosti zodpovedajúcej databáze, na ktorú mieni aplikovať svoj dotaz. Ďalším problémom je, že dotaz prekrýva viac databáz, a tak je nutné ich nájsť a dotaz realizovať na každú zvlášť.

V týchto prípadoch je vhodné ponúknuť vyššie služby než len výber informácií. Ide o služby, ktoré v klasickom poňatí niesli názov Selective Dissemination of Information (SDI). Používatelia popíšu tzv. profil, čo je jeden alebo niekoľko dotazov, ktoré sa ako celok vyhodnocujú v pravidelných časových intervaloch. Z hľadiska vývoja informačných zdrojov to znamená, že všetky nové informačné pramene, ktoré pribudli od posledného spracovania, vstupujú do nového spracovania.

Základný problém v SDI nazveme priraďovacím problémom – nájsť k novému dokumentu D tie profily, pre ktoré je D hitom.

Základné riešenie tohto problému predpokladá sekvenčné uloženie profilov. Profily sú spracovávané sekvenčne tak, že každý profil P je testovaný oproti dokumentu D, t. j. kontroluje sa, či D vyhovuje nejakému dotazu z P. Tento štýl poskytovania informácií budeme nazývať filtrovanie informácií (IF, z angl. information filtering). Program, ktorý tieto činnosti zaisťuje, nazveme informačným filtrom.

Rozdielov, ktoré je možné objaviť pri porovnaní klasického vyhľadávania informácií a filtrovaním informácií, nie je mnoho; ide vlastne o dve strany tej istej mince. Rozdiely sú skôr v poňatí:

Medzi najnovšie smery sa radí tzv. extrakcia informácií. Ide o identifikáciu entít, atribútov a vzťahov medzi entitami z textov uložených v databáze. V jednoduchých aplikáciách tak možno extrahovať napr. mená firiem, výrobkov, miest.

Literatúra

[1] Syracus Herald American, Progres 2000, Feb., 6., 2000
[2] Drozdová, M., Klimo, M. (1999) Metodika návrhu aplikácie Televzdelávanie, ISTEP 2000, Symposium Proceedings, Košice 2000, ISBN 80-88964-38-5
[3] Drozdová, M.: Implementácia nových informačno-komunikačných služieb, Habilitačná práca, Žilinská univerzita, 2001


doc. Ing. Matilda Drozdová, CSc., doc. Ing. Martin Klimo, CSc.,Ing.Tatiana Kováčiková, CSc., doc. Ing. Karol Matiaško, CSc.,

Fakulta riadenia a informatiky, Žilinská univerzita

 


http://www.cvtisr.sk/itlib/itlib022/drozdova.htm
ITlib. Informačné technológie a knižnice