Digitalizácia

Charakteristika pracoviska
Dňa 11. mája 2010 podpredseda vlády SR a minister školstva SR Ján Mikolaj slávnostne otvoril v Centre vedecko-technických informácií SR (CVTI SR) digitalizačné pracovisko (ďalej len DP) pre vedu a výskum na Slovensku. Vybudovanie DP bolo možné vďaka finančnej podpore Európskej únie, konkrétne Európskeho fondu regionálneho rozvoja v rámci realizácie národného projektu „Infraštruktúra pre výskum a vývoj - Dátové centrum pre výskum a vývoj“. Ide o moderné pracovisko národného i medzinárodného významu na konverziu tradičných textových a grafických dokumentov určené predovšetkým pre účely vzdelávania a podporu vedy a výskumu. Naše služby poskytujeme verejnosti, vedeckým pracovníkom, pedagogickým pracovníkom, vysokým školám, zrakovo znevýhodneným, súkromnému sektoru, štátnym a verejným inštitúciám. Naše pracovisko zabezpečuje profesionálnu digitalizáciu, komplexný digitalizačný postprocessing, dlhodobú archiváciu a sprístupňovanie digitalizovaného obsahu. 
Prostredníctvom digitálnej knižnice (systém MediaInfo) plnotextovo sprístupňuje knižničné dokumenty k podpore vzdelávania, vedy a výskumu. Služby digitálnej knižnice umožňujú extrakciu textu, extrakciu ľubovoľnej zóny, extrakciu obrazu, preklad textu, metadátový popis vo viacerých jazykoch, vyhľadávanie podľa slov na úrovni celej zbierky, ale i konkrétneho dokumentu, zoskupovanie obsahu podľa faziet v kombináciách s inými kritériami (dátum vydania, výskyt frázy v obsahu). Digitálna knižnica CVTI SR predstavuje multifunkčný nástroj, ktorý vie efektívne sprístupňovať širokú škálu digitálneho obsahu (audio, video, dáta).
Všetky procesy v nášho pracoviska sú plne automatizované. V rámci riadenia interných procesov používame softvér Scanflow od spoločnosti Treventus. Medzi funkcionality softvéru patrí delegovanie pracovných úloh jednotlivým používateľom, sledovanie procesných úkonov, kontrola kvality a štatistické výstupy. Automatizovaný workflow má prepojenie na ABBYY Recognition server (kde prebieha optické rozpoznanie znakov), interný pracovný úložný server, digitálnu knižnicu a softvérový nástroj na zabezpečenie dlhodobej archivácie (LTP).
Naše technické vybavenie
Naše digitalizačné pracovisko disponuje 13 skenermi. Z toho je 6 skenerov na skenovanie voľných listov, 2 skenery na veľkoplošné skenovanie, 2 knižné robotické skenery na skenovanie viazaných dokumentov, 2 manuálne skenery na viazané dokumenty a 1 mikrofilmový skener na skenovanie mikrofilmov a mikrofišov. Na všetkých skeneroch primárne skenujeme do formátu nekomprimovaný tiff.

Knižný robot DL – 3003

Skener na viazané dokumenty veľkosti od A6 do A2.

-          automatické otáčanie strán (na otáčanie strán používa vzduchové vákum),

-          možnosť manuálneho režimu,

-          produkčná rýchlosť skenovania v priemere cca 751 strán/hod (závisí od rozlíšenia veľkosti a stavu knihy),

-          rozlíšenie 200, 400, 600 dpi,

-          dvojkamerový system,

-          minimálne zásahy operátora,

-          automatická detekcia parametrov knihy (váha, veľkosť, okraj),

-          automatická detekcia pri otáčaní viac ako 1 strany,

-          nastaviteľná rýchlosť skenovania.

Listové skenery Canon DR-X10C

Skener na skenovanie voľných listov. V digitalizačnom pracovisku máme 2 kusy týchto skenerov.

-          skener dokumentov do veľkosti A3,

-          obojstranné skenovanie,

-          max. rýchlosť skenovania 256 strán/min,

-          optické rozlíšenie max. 600 dpi,

-          automatické vyrovnávanie, orezávanie strán, potláčanie pozadia,

-          denný záťažový cyklus až 60 000 skenov/deň.

Listové skenery s plochým lôžkom – Kodak i1440

Skener na skenovanie voľných listov. V digitalizačnom pracovisku máme 3 kusy týchto skenerov.

-          skener dokumentov do veľkosti A3+,

-          obojstranné skenovanie,

-          prevádzková rýchlosť max. 150 strán/minútu,

-          maximálne rozlíšenie 1200 dpi.

Mikrofilmový skener Canon Microfilm Scanner 800II

Mikrofilmový skener, ktorý skenuje mikrofilmy a mikrofiše v polarizácii pozitív, negatív a double negatív. Zvládne skenovať čiernobiele obrázky a obrázky v odtieňoch sivej farby.

-          skener dokumentov do veľkosti A3,

-          maximálne rozlíšenie 600 dpi,

-          max. rýchlosť skenovania, približne 3 sekundy na snímku.

Typy dokumentov:

-          mikrofiše,

-          mikrokarty,

-          mikroštítky

-          16 mm/35 mm zvitkový film.

Veľkoplošný skener OCE CS4354

Skener na skenovanie veľkoplošných formátov. V digitalizačnom pracovisku máme 2 kusy týchto skenerov.

-          skener dokumentov do veľkosti A0,

-          skener s maximálnym rozlíšením 1200 DPI,

-          skenovanie plnofarebných aj monochromatických dokumentov.

Max. veľkosť skenovaných dokumentov

-          šírka: 137,2 cm,

-          dĺžka: nelimitovaná,

-          maximálna hrúbka obrázku: 1,5 cm,

-          max. rýchlosť skenovania pri rozlíšení farebne 4,5 m/min, ČB 18m/min pri rozlíšení 200 DPI.

Minolta PS5000c MKII

Skener, ktorý bol zakúpený z vlastných finančných prostriedkov CVTI SR na komerčné skenovanie.

-          skener dokumentov do veľkosti A3,

-          rýchlosť skenovania sa dá dosiahnuť cca 250 skenov za hodinu,

-          maximálne rozlíšenie 600 dpi.

Treventus ScanRobot 2.0 MDS

Vysokorýchlostný skener určený na masovú digitalizáciu veľkého objemu viazaných dokumentov. Skener, ktorý je šetrný ku knihám, pretože počas skenovania sa kniha otvára max. pod 100° uhlom.

Rýchlosť skenovania:

Rýchlosť skenovania sa môže líšiť v závislosti od kvality papiera, veľkosti knihy a stavu knihy.

-          automatický mód až do 2500 strán /hod.,

-          poloautomatický mód až do 1000 strán/hod.,

-          automatické otáčanie strán,

-          rozlíšenie do 400DPI,

-          farebná hĺbka: 36-bit, color, greyscale, b&w,

-          uhol otvorenia knihy 60 ° -  100 °.

Formát strany (skenovacia plocha):

-          minimum (2x): 5 x 5 cm,

-          maximum (2x): 32 x 32 cm,

-          veľkosť knihy (maximum) 35.5 x 34.0 cm,

-          hrúbka knihy  Max. 15 cm,

-          hrúbka papiera bez obmedzenia (doporučené spektrum: 40 g/m² -  260 g/m²),

-          kvalita papiera všetky stránky, tiež poškodené a zvlnené stránky od 14. storočia až doteraz,

-          obálky všetky typy (mäkké aj tvrdé).

Listový skener Xino S700

Skener na skenovanie voľných listov.

-          obojstranné skenovanie,

-          rýchlosť skenovania: 220strán/min.,

-          rozlíšenie do 600DPI,

-          automatické vyrovnávanie, orezávanie,

-          výstupné formáty: tiff, JPG s kompresiou, alebo bez kompresie, PDF.

Formát dokumentu:

-          min. 60 x 100 mm,

-          max. 315 – nekonečno.

Bookeye 4 V1A

Vysokovýkonný produkčný skener.

-          skener dokumentov do veľkosti A1+,

-          maximálne rozlíšenie 600 dpi,

-          skenovanie pod sklom, alebo bez skla,

-          ochranná kolíska v tvare písmena V pre krehké viazané dokumenty so 140° – 180° uhlom,

-          farebný výstup, vrátane ICC profilov,

-          7 palcový farebný dotykový ovládací panel,

-          skenovanie priamo na USB kľuč.

Aplikované softvérové riešenia
Scanflow
ScanFlow je komplexné a výkonné softvérové ​​riešenie pre optimalizáciu pracovných procesov v oblasti masovej digitalizácie. Spravuje všetky úlohy od skenovania, spracovávania, úpravy skenov až po výstupné dáta. ScanFlow umožňuje vytvárať a prispôsobovať viacero separátnych pracovných procesov, ktoré dokážu fungovať súbežne.
Scangate

Komplexný softvér slúžiaci na spracovanie digitalizovaných dát. Môže byť jednoducho integrovaný na jednotlivých skenovacích staniciach.

-          umožňuje vytvorenie individuálnych lokálnych pracovných postupov,

-          automatické rozpoznávanie veľkosti stránky,

-          vyrovnávanie, orezávanie, extrapolácia stránky,

-          automatické odstránenie pozadia,

-          automatická detekcia stredu dvojstrán, rozrezanie dvojstrán a spájanie strán.

ABBYY Recognition server
Výkonné serverovo založené riešenie pre optické rozpoznávanie dokumentov (ďalej len OCR). Technológia OCR spoločnosti ABBYY prináša rýchle a vysoko presné výsledky v 199 jazykoch.  Umožňuje v digitálnych dokumentoch plno textové vyhľadávanie pre konkrétne informácie a zabezpečuje presné vyťaženie obsahu textu a konvertuje ho na požadované výstupné formáty.
Digitálna knižnica MediaINFO
MediaINFO je komplexné softvérové ​​riešenie pre digitálnu knižnicu, ktoré umožňuje extrakciu textu, extrakciu ľubovoľnej zóny, extrakciu obrazu, preklad textu, metadátový popis vo viacerých jazykoch, vyhľadávanie podľa slov na úrovni celej zbierky, ale i  konkrétneho dokumentu, zoskupovanie obsahu podľa faziet v kombináciách s inými kritériami (dátum vydania, výskyt frázy v obsahu). Z hľadiska funkcií pre zaregistrovaných používateľov sú významné aj funkcie poznámok v texte, označenie obľúbeného obsahu a možnosti ich zdieľania s ostatnými používateľmi.
Plánované aktivity
 Aktivita č.1 Sprístupňovanie autorsky chránených diel čitateľom CVTI SR na diaľku

V rámci realizácie tejto úlohy chceme ako prvý implementovať do praxe model vzdialeného elektronického vypožičiavania digitalizovaných knižničných dokumentov, ktoré sú chránených autorským zákonom.

Aktivita č.2 Pilotné skenovanie skrípt v spolupráci s akademickými knižnicami
CVTI SR plánuje komplexné zabezpečenie študijnej literatúry pre vybraný študijný odbor od prvého ročníka až po posledný ročník. Pracovný model pilotného projektu bude pozostávať zo skenovania, post processingu, OCR a importu do digitálnej knižnice CVTI SR. Prístup k digitalizovaným dokumentom bude výhradne v priestoroch akademickej knižnice.
Aktivita č.3 Spolupráca pri výmene digitalizovaných dokumentov v rámci SR
Zabezpečenie zmluvnej bezplatnej výmeny digitalizovaných dokumentov vedy a výskumu s univerzitami a štátnymi vedeckými knižnicami.
Aktivita č.4 Sprístupňovanie digitalizovaného obsahu nevidiacim
V rámci súčasného znenia autorského zákona 185/2015 je možné nevidiacim občanom neobmedzene sprístupňovať digitalizované autorsky chránené dokumenty z fondov CVTI SR
Aktivita č.5 Social humanities
CVTI SR má ambíciu ponúkať analyticko-syntetické služby na báze recyklácie importovaných dát digitálnej knižnice s vytváraním nových špecializovaných stránok s agregovaným obsahom pre podporu akademického štúdia, popularizáciu vedy a podporu vedy a výskumu.
Aktivita č.6 Register digitalizovaných diel
V rámci spolupráce s akademickými knižnicami na Slovensku a štátnymi vedeckými knižnicami v oblasti výmeny digitalizovaných dokumentov, plánujeme vytvorenie centrálnej evidencie digitalizovaných diel vedy a výskumu na Slovensku.
Aktivita č.7 Realizácia nových digitalizačných služieb pre vedu a výskum
Aktivita č.8 Spolupráca s vybranými katedrami
Máme záujem o spoluprácu v oblasti praktickej a metodickej pomoci študentom a doktorandom vybraných katedier v oblasti digitalizácie, LTP, sprístupňovania digitalizovaných knižných dokumentov, digitálnych knižníc, digitalizačného workflow, OCR,  riadenia digitalizačných projektov, social humanities, atď. CVTI SR ponúka metodickú a praktickú pomoc študentom riešiacim bakalárske a diplomové práce týkajúce sa digitalizácie, možnosť v rámci vedy a výskumu využívať technické a softvérové vybavenie digitalizačného pracoviska, konzultácie, možnosť realizácie odbornej praxe a exkurzie.
Aktivita č.9 Masová digitalizácia dokumentov z fondov CVTI SR

Aktivita č. 10 Projekty vedy a výskumu v digitalizačnom pracovisku CVTI SR

Kontakt:

Odbor akvizície a spracovania / Oddelenie digitalizácie, repozitárov a archivácie

Ing. Branislav Jandorf

1. posch. / miestnosť č. 132
tel: 02/ 69 253 147
e-mail: digi@cvtisr.sk 

Posledný update stránky: 2018-03-06 10:27