Digitalizácia
Úvod do digitalizácie písomného dedičstva
Dištanční študijní text
Dušan Katuščák
Opava 20 19
Obor: Knihovnictví, bibliografie, digitalizace, dokumentace, informační
věda (sociální aspekty), Library and Information Science (LIS)
Klasifikační kódy: 00, 022, 030, 0322, 038
Klíčová slova: knihovnictví, digitalizace, terminoligie, uchovávavní,
konzervovaání, Minerva, Europeana, OCR, konzervování,
deacidifikace, Library and Information Science (LIS), workflow
digitalizace, digitální knihovna, on-line katalog, digitální
repozitář, služby knihoven, copyright, digitální repozit,
Islandom, DSpace, Invenio, Greenstone, skenery, deskriptívni
metadata
Anotace: Předmět seznámí studenty s problematikou digitalizace knih a
částečně i digitalizace zvukových a obrazových záznamů. Autor
učebního textu se na jedné straně opírá o vlastní dlouholeté
zkušenosti v oblasti digitalizace a jednak o nejdůležitější
evropské doporučení a nejlepší praxe. Velké projekty
digitalizace se na světě začaly rozvíjet koncem 90. let a
bezprostředně po roce 2000. V té době vznikly příručky a
praktická doporučení, které se uplatnily v mnoha digitalizačních
projektech. Mezi hlavní použité zdroje patří zkušenosti a
poznatky z opisu velkého národního projektu Digitální knihovna
a digitální archiv, který byl financován ze strukturálních fondů a
jehož autorem je i autor tohoto textu. Studenti se seznámí s
poselstvím Comité des sages projektu Europeana. Praktické
standardní doporučení jsou uvedeny v souladu s pravidly, které
byly vypracovány v projektu Minerva. Pozornost je věnována
jednotlivým fázím projektu digitalizace, infrastruktuře,
metadatům, klíčovým technologickým operacím, jako je výběr
materiálu, skenování, formáty dat, konzervační postupy,
sterilizace, odkyselování, lyofylizácia, otázkám digitálních
repozitov Islandom, DSpace, Invenio, Grenstone, jakož i
finančním a právním otázkám zpřístupňování digitálního
obsahu. Důraz je kladen na proces plánování a realizace
procesu digitalizace. Dále jsou analyzována významné české
Digitalizační projekty (Manascriptorium, Kramerius). V druhé
části jsou studenti seznámení s problematikou dlouhodobé
uchování výsledků digitalizace s důrazem na problematiku
migrace digitálních obsahů na nové nosiče. Cvičení jsou
zaměřena na praktické vyzkoušení si celého procesu
digitalizace, Počínaje posouzeny kvality podkladů, přes
skenování, OCR a korekci chyb až po ukládání na nosič.
Součástí předmětu je i exkurze na významné Digitalizační
pracoviště.
2
B-IU - Charakteristika studijního předmětu
Název studijního předmětu Digitalizace a dlouhodobá ochrana fondů 1
T i p předmětu Povinny, ZT (společný základ) Idoporučenv ročník/semestr 1 1/ZS
Rozsah studi jniho předmětu 13p+26s I hod. 39 h/sem. 1 kreditů
Prerekvizity, korekvizity,
ekvivalence
Způsob ověřeni studijních
vvsledků
Zápočet, zkouška Forma vvukv j Přednáška,
seminář
Forma způsobu ověření studijních
výsledků a další požadavky na
studenta
Zkouška, zápočet
Účast na zkoušce j e podmíněna předložením seminární práce v rozsahu 15 normostran textu s obsahovým zaměřením m
práci s obchodními informacemi.
Předmět je uzavřen zkouškou, která bude udělena p odevzdáni a uznání seminárni práce. Podrobné informace obdrží
studenti na začátku semestru. Podmínkou j e 80% účast studenta m seminářích.
Garant předmětu Prof PhDr. Dušan Katuščák, PhD.
Zapojení garanta do výuky
předmětu
Vedeni přednášek.
Vyučující Prof. PhDr. Dušan Katuščák, PhD. (přednášející, 1001
Stručná anotace předmětu |
Cíl i i uki
Předmět seznámí studenty s problematikou digitalizace knih a částečně i digitalizací zvukových a obrazových záznamů.
Důraz j e kladen m proces plánování a realizace procesu digitalizace. Dále jsou analyzovány významné české digitalizační
projekty (Manascriptorium, Kramerius). V druhé části jsou studenti seznámeny s problematikou dlouhodobého uchováni
výsledků digitalizace s důrazem m problematiku migrace digitálních obsahů na nové nosiče. Cvičení jsou zaměřeny na
praktické vyzkoušení si celého procesu digitalizace, počínaje posouzením kvality podkladů, přes skenování, OCR a korekci
chyb až po ukládání na nosič. Součástí předmětu j e i exkurze m významné digitalizační pracoviště.
Osnova - bloky
L význam procesu digitalizace v oboru knihovnictví
2. strategické aspekty procesu digitalizace
3. plánování a příprava procesu digitalizace
4. technologické aspekty procesu digitalizace
5. digitalizace starých tisků
6. právní aspekty procesu digitalizace
7. procesy před a p digitalizaci (konzervace, ochrana)
8. optické rozpoznávání obrazců a korekce chyb
zpřístupňování digitalizovaných dél
strategické plánování procesu dlouhodobého uchování digitálních děl
11. problémy, které třeba řešit
12. známé postupy dlouhodobého uchování digitálních děl
13. práce s původními digitálními dokumenty
10,
Studijní literatura a studijní pomůcky
Povinná literatura
Studijní materiály, prezentace a učební text umístěné na webových stránkách Ústavu bohemistiky a knihovnictví FPF SU
v Opavě - oddělení knihovnictví - webová adresa: http://knihovnik.fpf.slu.cz/
KONVIT, M Digitization and Long-term Fund Protection I £ Opava, SU v Opavě, 2017.
Doporučená literatura
ČNK. Digitalizace a digitálni zpřístupnění dokumentů. Online. Dostupné na https:/Amviv.nkp.cz/o-knihovne/odborne-
cinnosti/sprava-a-ochrana-fondu/zzz_osof/digitalizace
Archivy, knihovny, muzea v digitálním světě 2005. Praha: Národní technické muzeum, 2006 - 121 s. ISBN 80- 7037- 149-
S
Negroponte, N Digitální svět. Praha: Management Press, 2001 - 207 s, ISBN 80-7261-046-5
3
Obsah
1 VÝZNAM PROCESU DIGITALIZACE V OBORU KNIHOVNICTVÍ 7
1.1 DEFINÍCIA DIGITALIZÁCIE A ZÁKLADNÉ POJMY 7
1.2 ZÁKLADNÉ POJMY 8
1.3 VÝZNAM DIGITALIZÁCIE 9
1.4 PRÍNOSY DIGITALIZÁCIE V PRAXI 1 0
1.5 POLITIKA, PROGRAMY A PROJEKTY DIGITALIZÁCIE. EURÓPA A SVET 1 1
2 STRATEGICKÉ ASPEKTY PROCESU DIGITALIZACE 1 4
2.1 VŠEOBECNÉ CIELE STRATÉGIE DIGITALIZÁCIE. MINERVA 1 5
2.1.1 Europeana (Comité des Sages). Pozícia Európskej únie 15
2.1.2 Zabezpečenie širokého prístupu k digitalizovaným verejne dostupným materiálom a ich
využívania í 6
2.1.3 Stimuly digitalizácie 17
2.1.4 Úloha Europeany 17
2.1.5 Zaručenie trvalej udržateľnosti digitalizovaných zdrojov 18
2.1.6 Udržateľnosť. 19
2.1.7 PPP projekty 19
3 PLÁNOVANÍ A PŘÍPRAVA PROCESU DIGITALIZACE 2 1
3.1 DIGITALIZÁCIA INTERNE ALEBO EXTERNE 2 5
3.2 PLÁNOVÁNÍ A PŘÍPRAVA PROCESU DIGITALIZACE V KNIHOVNĚ 2 7
3.3 PRAKTICKÉ ODPORÚČANIA 2 7
3.4 PROJEKT MINERVA A LUNDSKÉ ZÁSADY 2 8
3.5 LUNDSKÉ ZÁSADY 2 8
3.6 MANAŽÉRSKE PLÁNOVANIE PROJEKTU DIGITALIZÁCIE 2 8
3.7 ZDÔVODNENIE PROJEKTU 2 9
3.8 ĽUDSKÉ ZDROJE 3 0
3.9 VÝSKUM 3 0
3 . 1 0 HROZBY. RIZIKÁ 3 1
3 . 1 1 VÝBER ZDROJOVÉHO MATERIÁLU NA DIGITALIZÁCIU 3 2
3 . 1 2 STANOVENIE KRITÉRIÍ VÝBERU 3 2
3.12.1 Výber podľa kritérií 33
3.12.2 Príprava na digitalizáciu 33
3 . 1 3 HARDVÉR 3 3
3.13.1 Skenery 35
3.13.2 Druhy skenerov 36
3 . 1 4 SOFTVÉR 4 0
3 . 1 5 PROCES DIGITALIZÁCIE 4 1
3.15.1 Používanie skenerov 42
3.15.2 Používanie digitálnych kamier/fotoaparátov 44
3.15.3 Softvérové aplikácie na optické rozoznávanie znakov (OCR) 45
3 . 1 6 METAÚDAJE (METADÁTA) 4 6
3.16.1 Metaúdaje použité pre opis predmetu (deskriptívne metadáta) 46
3 . 1 7 VYHOVUJÚCE ŠTANDARDY PRE METAÚDAJE 4 7
3.17.1 Zverejnenie 48
3 . 1 8 SPRACOVANIE OBRAZU 4 8
3.18.1 Trojrozmerné materiály a virtuálna realita 51
3 . 1 9 ON-LINE ZVEREJNENIE 5 1
4 TECHNOLOGICKÉ ASPEKTY PROCESU DIGITALIZACE 53
4.1.1 Konverzia (Převod) 53
4.1.2 Atributy zdrojového dokumentu 54
4.1.3 Kvalita obrazu 55
4.1.4 Rozlišení 55
4
4.1.5 Bitová hloubka 56
4.1.6 Procesy vylepšení obrazu 56
4.1.7 Komprese 56
4.1.8 Použité zařízení a jeho výkon 57
4.1.9 Kvalita operátora 57
4.1.10 Doporučení pro skenovaní (konverzi, převod) 57
4 . 2 VYTVÁŘEN! PRACOVNÍHO PROSTŘEDÍ PRO PROJEKT DIGITÁLNÍHO ZOBRAZOVÁNÍ 5 8
4 . 3 NÁZVOVÉ A IDENTIFIKAČNÉ KONVENCIE 5 9
4 . 4 PRÍKLADY DOSTUPNÝCH OPEN-SOURCE REPOZITOV PRE DIGITÁLNE KNIŽNICE 6 1
4.4.1 Islandom 8 61
4.4.2 DSpace 61
4.4.3 Invenio (CERN) 62
4.4.4 Greenstone 62
5 DIGITALIZACE STARÝCH TISKŮ 63
6 PRÁVNÍ ASPEKTY PROCESU DIGITALIZACE 64
6.1 PRÁVNE ASPEKTY 6 4
6.2 AUTORSKÉ PRÁVA (COPYRIGHTS) 6 4
6.3 VYDAVATEĽSKÉ A LICENČNÉ ZMLUVY 6 4
6.4 COPYRIGHT v KNIŽNICI PODĽA AMERICKÉHO A AUSTRÁLSKEHO PRÁVA 6 4
6.4.1 Praktický príklad 64
6.4.2 Dispenzácia s formálnym povolením 65
6.4.3 Vytvorenie copyrightu 65
6.4.4 Ochrana copyrightu 66
7 PROCESY PŘED A PO DIGITALIZACI (KONZERVACE, OCHRANA) 68
7.1 KONZERVÁCIA DOKUMENTOV (KONZERVOVANIE) 6 8
7.2 REŠTAUROVANIE 6 8
7.3 INTEGRÁCIA KONZERVOVANIA A DIGITALIZÁCIE 6 8
7.3.1 Sterilizácia 69
7.3.2 Deacidifikácia 69
7.3.3 Lyofilizácia 69
8 OPTICKÉ ROZPOZNÁVANÍ OBRAZCŮ A KOREKCE CHYB 71
8.1 OCRSOFTVÉR 7 1
9 ZPŘÍSTUPŇOVÁNÍ DIGITALIZOVANÝCH DĚL 72
9.1 ISLANDORA 8 7 2
9.2 DSPACE 7 2
9.2.1 Invenio (CERN) 72
9.2.2 Greenstone 72
10 STRATEGICKÉ PLÁNOVÁNÍ PROCESU DLOUHODOBÉHO UCHOVÁNÍ DIGITÁLNÍCH DĚL 73
1 0 . 1 UCHOVÁVANIE AARCHIVOVANIE ÚDAJOV 7 3
1 0 . 2 DLHODOBÁ ARCHIVÁCIA 7 3
1 0 . 3 VOĽBA MÉDIÍ 7 4
1 0 . 4 TYPY MÉDIÍ 7 4
11 PROBLÉMY, KTERÉ TŘEBA ŘEŠIT 75
1 1 . 1 HLAVNÉ ZISTENÉ BARIÉRY V EURÓPE 7 5
12 ZNÁMÉ POSTUPY DLOUHODOBÉHO UCHOVÁNÍ DIGITÁLNÍCH DĚL 76
1 2 . 1 VÝBER MÉDIÍ 7 6
1 2 . 2 MIGRAČNÉ STRATÉGIE 7 7
13 PRÁCE S PŮVODNÍMI DIGITÁLNÍMI DOKUMENTY 78
1 3 . 1 ZAOBCHÁDZANIE A PRÁCA S ORIGINÁLMI 7 8
5
13.2 PREMIESTŇOVANIE A MANIPULÁCIA S ORIGINÁLMI
VÝZNAM P R O C E S U DIGITALIZACE V OBORU KNIHOVNICTVÍ
1.1 Definícia digitalizácie a základné pojmy
Digitalizácia je proces konverzie analógových dokumentov (text, obraz, zvuk,
audio, video) do digitálneho formátu alebo priama tvorba dokumentov v
digitálnej forme. Digitálny obsah, ktorý vzniká digitalizáciou je zaznamenaný v
samostatných údajových jednotkách (nazývaných bity), ktoré je možné
adresovať osobitne (zvyčajne v skupinách viacerých bitov zvaných bajty). Ide o
binárne údaje (0, 1), s ktorými dokážu pracovať počítače a iné zariadenia s
výpočtovou schopnosťou (napr. digitálne fotoaparáty, digitálne načúvacie
pomôcky).
Digitalizácia (digitisation) - Proces vytvárania digitálnych súborov snímaním
(skenovaním, fotografovaním) alebo iným spôsobom konverzie analógových
materiálov. Výsledná digitálna kópia, alebo digitálna náhrada sa označuje za
digitálny obsah (digitálny materiál, digitálny dokument) je predmetom
digitálneho uchovávania, podobne ako "digitálne narodené" materiály.
Digitalizácia môže byť:
• prevod informácií z analógového tvaru (analógového signálu, napr.
elektrického napätia, zvuku, svetlosti, tlaku) do číslicového (=digitálneho)
tvaru , spravidla do počítačových súborov; špecificky najmä:
o snímanie a premena grafických tvarov do číslicových tvarov
(spravidla pomocou skenera),
o snímanie a premena písma do číslicového tvaru (spravidla
pomocou skenera a softvéru OCR),
o zaznamenávanie a prevod zvukových signálov do číselných
tvarov (vzorkovanie, rozlišovanie vzorky),
o snímanie a prenos rozmerov trojrozmerných predmetov do
číslicového tvaru (spravidla pomocou 3D skenerov),
• prechod od analógovej techniky na digitálnu techniku, najmä v rámci
modernizácie, špecificky napr.:
o digitalizácia televízneho a rozhlasového vysielania
7
1.2 Základné pojmy
Prístup, sprístupnenie (access) - priebežná a pretrvávajúca použiteľnosť
digitálneho zdroja, pričom sa zachovajú všetky kvality hodnovernosti, presnosti
a funkčnosti, ktoré sa považujú za podstatné z hľadiska účelu vytvorenia
a/alebo získania digitálneho zdroja.
Potvrdenie pravosti (authentication) - mechanizmus, ktorého cieľom je
stanovenie hodnovernosti digitálnych materiálov v konkrétnom čase. Ide
napríklad o digitálne podpisovanie.
Hodnovernosť, autentickosť (authenticity) - Digitálny materiál je taký, aký sa
zdá byť. V prípade elektronických záznamov sa tento pojem vzťahuje na
dôveryhodnosť príslušného elektronického záznamu. V prípade "digitálne
vytvorených" a zdigitalizovaných materiálov sa pojem vzťahuje na fakt, že pri
citovaní akéhokoľvek zdroja je tento zdroj rovnaký ako keď bol vytvorený, pokiaľ
sprievodné metaúdaje neuvádzajú zmenu. Dôvera v autentickosť digitálnych
materiálov v čase je obzvlášť dôležitá vzhľadom na ľahkosť vykonania zmien.
"Digitálne narodené, digitálne vytvorené" ("bom digital") - Digitálne
materiály, ktoré nemajú mať analógový ekvivalent, buď ako pôvodný zdroj,
alebo ako výsledok konverzie do analógovej formy. Tento termín sa používa na
rozlíšenie takýchto materiálov od 1) digitálnych materiálov, ktoré boli vytvorené
ako výsledok konverzie analógových originálov (zdigitalizované); a od 2)
digitálnych materiály, ktoré mohli vzniknúť z digitálneho zdroja, ale napr. sa
vytlačili sa na papier.
Digitálna archivácia (digital archiving) - Tento termín sa v rôznych oblastiach
používa rôzne. Knihovnícka a archivárska komunita ho často používajú
zameniteľné s termínom digitálne uchovávanie. Počítačoví odborníci majú sklon
používať termín digitálna archivácia na označenie procesu zálohovania a
priebežnej údržby na rozdiel od stratégií dlhodobého digitálneho uchovávania.
Digitálna archivácia (digital archiving) - Tento termín sa v rôznych oblastiach
používa rôzne. Knihovnícka a archivárska komunita ho často používajú
zameniteľné s termínom digitálne uchovávanie. Počítačoví odborníci majú sklon
používať termín digitálna archivácia na označenie procesu zálohovania a
priebežnej údržby na rozdiel od stratégií dlhodobého digitálneho uchovávania.
Digitálne materiály, digitálne zdroje (digital materials) - široký termín
zahŕňajúci digitálne náhrady vytvorené ako výsledok konverzie analógových
materiálov na digitálnu formu (digitalizácia), ďalej "digitálne vytvorené"
materiály, pre ktoré neexistuje a nikdy nebude existovať analógový ekvivalent, a
digitálne záznamy.
Digitálne uchovávanie (digitalpreservation) - termín označujúci sériu
riadených činností potrebných na zabezpečenie trvalého prístupu k digitálnym
materiálom na taký dlhý čas, na aký to je potrebné. Digitálne uchovávanie má
veľmi širokú definíciu a vzťahuje sa na všetky úkony požadované na udržanie
prístupu k digitálnym materiálom až za hranice výdrže nosičov bez ohľadu na
technologické zmeny. Môže ísť o záznamy vytvárané počas každodennej
činnosti organizácie; o "digitálne narodené" materiály vytvorené na konkrétny
účel (napríklad zdroje pre vzdelávanie); alebo výstupy projektov digitalizácie.
Existuje možnosť využitia digitálnych technológií na uchovávanie originálnych
artefaktov prostredníctvom digitalizácie.
8
Dlhodobé uchovávanie - Dlhodobé uchovávanie je najkomplikovanejšia výzva
digitálnej doby, a preto je to významná oblasť výskumu a praxe, ktorá je
zameraná na dlhodobé uchovávanie digitálneho obsahu. Dlhodobosťou sa
pritom rozumie 50 a viac rokov. Trvalý prístup k digitálnym materiálom, alebo
aspoň k informáciám v nich obsiahnutým, na neurčitú dobu. (Napr. 100 rokov
podľa Kongresovej knižnice USA)
Strednodobé uchovávanie - Trvalý prístup k digitálnym materiálom
presahujúci technologickú zmenu na určité obdobie (nie na neurčitú dobu).
Krátkodobé uchovávanie - Prístup k digitálnym materiálom buď na určité
obdobie, kým sa predpokladá ich využívanie, pričom toto obdobie nepresahuje
predpovedateľnú budúcnosť a/alebo uchovanie na obdobie, kým sa materiály
nestanú neprístupné vzhľadom na zmenu technológií.
Emulácia (emulation) - Spôsob prekonávania technologického zastarávania
softvéru vývojom techník na imitáciu zastaralých systémový budúcich
generáciách počítačov.
Migrácia (migration) - Spôsob prekonávania technického zastarávania
prevodom digitálnych zdrojov z jednej generácie hardvéru/softvéru na dálšiu.
Účelom migrácie je zachovať intelektuálny obsah digitálnych objektov a
zachovať pre klientov možnosť získať, vyhľadať a používať bez ohľadu na
meniace sa technológie. Migrácia sa líši od obnovovania skladovacích médií v
tom, že nie vždy je možné vyrobiť presnú digitálnu kópiu alebo replikovat'
pôvodné vlastnosti a vzhľad a stále zachovať kompatibilitu daného zdroja s
novou generáciou technológií.
1.3 Význam digitalizácie
Digitalizácia znamená podstatnú inováciu informačných služieb knižníc a iných
informačných inštitúcií a systémov. Od katalógov smerom k úplným textom,
obrazom, zvuku, audio, video.
Digitalizácia umožňuje:
• Plnotextové vyhľadávanie. Pridanou hodnotou digitalizácie kultúrnych
a vedeckých objektov je možnosť vyhľadávania v plných textoch,
indexoch či klasifikáciách, a tým aj efektívneho a rýchleho získavania
potrebných informácií, údajov, odpovedí či znalostí, čo má nesmierny
význam pri procesoch riadenia a rozhodovania, vzdelávania a ďalších
ľudských činnosti v akejkoľvek sfére.
• Zdroj poznania jazyka. Digitalizáciou sa vytvára jedinečný a
obrovský masív digitálnych textov, čo umožní získať dôkladné a úplné
vedomosti o vývoji jazyka (národný korpus jazyka, lexikografia,
etymológia).
• Retrospektívny zdroj informácií. Zdigitalizované archívne dokumenty
okrem nezastupiteľnej úlohy zdroja retrospektívnych informácií pri
zachovaní kontinuity rozhodovacích a riadiacich procesov pri výkone
verejnej správy budú akcelerátorom rozvoja miestnej kultúry, prispejú
k zvyšovaniu vedomostnej úrovne o vlastných dejinách, zohrajú
významnú úlohu pri upevňovaní kultúrnej a občianskej identity,
národných tradícií a rodovej rovnosti.
9
• Historický výskum. Digitálna knižnica a digitálny archív bude rovnako
nenahraditeľným zdrojom poznatkov a informácií pre historický výskum,
pre tvorbu encyklopédií, výkladových slovníkov, odborných a vedeckých
syntetických diel.
• Digitálny obsah pre školy. Digitálna knižnica a digitálny archív
sprístupní všetky diela, ako sú napríklad učebnice ako aj všetku vedeckú
a odbornú literatúru potrebnú pre vzdelávanie na všetkých stupňoch
škôl.
• Antiplagiátorské systémy. Digitálna knižnica a digitálny archív je
jedinečným masívom digitálnych textov, ktoré bude možné využiť na
vysokých školách v antiplagiátorských systémocha tým podporí etiku
publikovania. Bez digitálnej knižnice je antiplagiátorský systém
nemysliteľný.
• Osobné digitálne knižnice. Prezentačný systém Digitálnej knižnice
a digitálneho archívu umožní používateľom tvorbu osobných digitálnych
knižnica zdieľanie poznatkovpodľa tematického alebo komunitného
princípu{\Neb 2.0, Web 3.0 a súvisiace služby).
Digitalizácia umožňuje premenu pamäťových a fondových inštitúcií na moderné
organizácie, ktoré dokážu reagovať na potreby a požiadavky spoločnosti sa
spája predovšetkým s komplexnou digitalizáciou spravovaných fondov,
hmotných artefaktov, či na rozmanitých nosičoch zachytených nehmotných
súčastí kultúrneho dedičstva a znalostí o tomto bohatstve nadobudnutom počas
existencie inštitúcií. Digitalizácia je teda prostriedok, ktorého pomocou
inštitucionalizovaná kultúra dokáže získať lepšiu kontrolu nad kultúrnym
dedičstvom.
1.4 Prínosy digitalizácie v praxi
Digitálne zbierky môže ktokoľvek a kedykoľvek prehľadávať rýchlo, nezávisle
a komplexne z akéhokoľvek miesta cez počítačovú sieť.
Ušetrí sa čas zamestnancov zodpovedaním najčastejšie kladených otázok na
internetovej stránke.
Digitálne obrazy sa elektronicky môžu vylepšovať tak, aby sa dali prezerať
a mohli byť lepšie zobrazené a čitateľné.
Digitalizácia zlepšuje a rozširuje možnosti využívania zbierok.
Digitalizácia napomáha vzdelávaniu a bádaniu: digitálne materiály vzácnych
a ťažko dostupných digitalizovaných dokumentov sú použiteľné v školách priamo
vo vzdelávacom procese.
Digitalizácia spojená s OCR umožňuje uskutočňovať fulltextové vyhľadávanie
(napr. historické noviny a časopisy, projekt digitalizácie diplomových prác
a dizertácií a pod.)
Digitalizácia umožňuje počúvať/prezerať zdigitalizované zvukové nahrávky
a videozáznamy.
Digitalizáciou a vylepšením kvality sa sprístupní obsah záznamov na nosičoch,
ktoré nieje možné prezerať/prehrávať pomocou bežných zariadení (mikrofilmy,
negatívy atď.).
Digitalizácia umožňuje kvalitnejšiu intelektuálnu kontrolu cez tvorbu nových
vyhľadávacích pomôcok, väzieb na bibliografické záznamy a vývoj indexov
(registrov) a iných nástrojov.
10
• Digitalizácia umožní lepšie a bohatšie využívanie materiálov, kedže umožní
rozsiahly prieskum, manipuláciu s obrazmi a textami a skúmanie digitálnych
obrazov v nových kontextoch.
• Digitalizáciou sa dosiahne kvalitnejšie využívanie zbierok cez zlepšenú kvalitu
obrazu (napríklad zlepšená čitateľnosť vyblednutých alebo poškvrnených
dokumentov).
• Digitalizácia umožní vytvárať „virtuálně zbierky" na základe flexibilnej integrácie
a syntézy rozličných formátov alebo obsahovo či tematicky súvisiacich materiálov
nachádzajúcich sa na rôznych miestach.
• Pri digitalizácii je zvýšená intelektuálna kontrola prostredníctvom vytvárania
nových vyhľadávacích pomôcok, prepojenie na bibliografické záznamy, tvorba
registrov a iných nástrojov
• Zvýšené a obohatené využívanie na základe možnosti rozšíreného vyhľadávania,
manipulácie s obsahom, štúdium rozmanitých zdrojov v nových kontextoch.
• Podpora nového spôsobu využitia na vzdelávanie na základe poskytovania
vylepšených zdrojov vo forme rozsiahleho rozširovania lokálnych a jedinečných
zbierok, lepšie využívanie prostredníctvom zlepšenej kvality dokumentu,
napríklad, lepšia čitateľnosť poškvrnených a vyblednutých textov, lepšia
počuteľnosť,
• Vytváranie "virtuálnych zbierok" prostredníctvom flexibilnej integrácie a syntézy
rozmanitých formátov alebo virtuálně zbierky vzájomne súvisiacich materiálov
roztrúsených na mnohých miestach.
1.5 Politika, programy a projekty digitalizácie. Európa a svet
V oblasti digitalizácie kultúrneho a vedeckého dedičstva boli v pôvodných 15
krajinách EÚ v rámci iniciatívy eEurope vypracované Lundské zásady (2001) s
cieľom vytvoriť v rámci členských štátov koordinačný mechanizmus pre
programy digitalizácie. Na koordináciu politiky a programov digitalizácie bol
vypracovaný Lundský akčný plán a vznikla Skupina národných zástupcov
(NRG) krajín EÚ a iných krajín. Ako sekretariát pre skupinu NRG vystupoval
projekt MINERVA/MINERVA Plus, ktorý zabezpečil vytvorenie špecializovaných
pracovných skupín, vydávanie publikácií a politického dokumentu s
názvom Parmská charta, ktorý podporuje a nadväzuje na Lundské zásady.
Ako pokračovanie Lundského akčného plánu vznikol Dynamický akčný plán,
ktorý identifikuje hlavné zistené bariéry:
• Fragmentovaný inštitucionálny prístup
• Neschopnosť mnohých inštitúcií v oblasti kultúrneho a vedeckého dedičstva
odpovedať na potreby používateľov
• Neschopnosť mnohých inštitúcií v oblasti kultúrneho dedičstva rozpoznať
a implementovat' perspektívne inovácie
• Neschopnosť mnohých inštitúcií v oblasti kultúrneho dedičstva prikloniť sa ku
spoločnému prístupu
• Nejasná návratnosť investície pre inštitúcie v oblasti kultúrneho dedičstva
• V rámci inštitúcií je v oblasti digitalizácie nedostatok odbornosti a zručností
• Oddeľovanie otázok uchovávania od praktickej digitalizácie
• Nevyspelosť kľúčových technológií a štandardov
11
• Neschopnosť kľúčových informačných technológií vysporiadať sa s
technologickou zmenou
• Slabé zladenie priemyselných záujmov s požiadavkami a potrebami v oblasti
kultúrneho dedičstva
• Nedostatok jasného smerovania vo výskume a vývoji
• Nedostatok vhodných softvérových nástrojov na integráciu digitalizačnú prax do
širšieho informačného priestoru
• Fragmentácia národných politických prístupov
• Nezhoda medzi kultúrnymi programami a programami pre nové technológie v
národnom aj v medzinárodnom kontexte
• Slabé prepojenie súčasnej legislatívy v oblasti kultúrneho dedičstva s
požiadavkami používateľov, hlavne pri presadzovaní využitia vo vzdelávaní a
inštitúciách, obsahovom priemysle a služieb s pridanou hodnotou
• Nejasné rozdelenie zodpovednosti medzi inštitúciami, projektami a sieťami
• Nejasnosť budúceho vlastníctva digitálnych kultúrnych obsahov a infrastruktur
• Fragmentované mechanizmy financovania a ciele
• Stagnujúca a nepohyblivá národná technická vybavenosť a odbornosť
• Absencia rozdelenia digitalizačnej práce a produkcie
• Nedostatočná integrácia digitalizačných akcií v znalostnej ekonomike
• Nedostatočná priehľadnosť zdrojov čo do ich prístupnosti, kvality, integrity a
právne bezproblémové používanie tvorivým kreatívnym priemyslom
• Nedostatočná implementácia viacjazyčných prístupov a technológií
• Slabé uplatnenie digitálnych kultúrnych zdrojov v znalostnej spoločnosti
• Neadekvátne prispievanie digitalizácie do kultúrneho dialógu a k prepojeniu
dedičstiev.
Navrhuje konkrétne činnosti v týchto oblastiach:
1. Používatelia a obsah :
2. Trvalá udržateľnosť obsahu
3. Technologický rozvoj a nástroje
4. Digitálne uchovávanie
5. Monitorovanie pokroku
Európska komisia podporuje vybudovanie spoločnej európsku digitálnu knižnicu
(Europeana) ktorá by mala byť postavená na koncepcii už prevádzkovanej
Európskej knižnice združujúcej všetky národné knižnice Európy. Za podstatnú
hodnotu spoločného európskeho postupu pri digitalizácii je považovaná
mnohojazyčnosť a kultúrna rôznorodosť.
Stratégia digitalizácie navrhnutá Európskou komisiou sa stala základom pre
národnú stratégiu digitalizácie v niektorých krajinách. Knižnice využívajú
metodológiu a výsledky získané najprv v rokoch 2007-2008 pri budovaní
Európskej digitálnej knižnice. Výsledky digitalizácie, teda digitálne zbierky
národných pamäťových inštitúcií a systémov, ako aj zbierky iných subjektov
budú sprístupnené cez špeciálny digitálny portál na národnej alebo
inštitucionálnej úrovni (národný digitálny repozit, inštitucionálny digitálny
repozit)
V rámcových programoch výskumu a vývoja technológií sa digitalizácii a
digitálnemu kultúrnemu a vedeckému obsahu venujú okrem projektov
MINERVA aj CALIMERA, ERPANET, TEL-ME-MOR, DELOS, BRICKS,
12
PRESTOSPACE a i. Osobitný význam má fórum DigiCULT, v rámci ktorého sa
publikovali analýzy technologického vývoja v oblasti kultúrneho a vedeckého
dedičstva, startegickýmzámerom je orientácia digitálneho uchovávania a
sprístupňovania na technológie pokryté v prehľadoch fóra DigiCULT.
Všetky krajiny sveta už dlhodobo riešia, prípadne si prinajmenšom uvedomujú
potrebu riešiť problémy spojené s digitálnym uchovávaním a sprístupňovaním
obsahu. Spojené štáty americké investovali stovky miliónov dolárov do
výskumu digitálneho uchovávania na vypracovanie dlhodobej stratégie. Ďalšie
príklady stratégií a konkrétne politické, ekonomické a technologické opatrenia je
možné pozorovať v Austrálii (PADI), Nórsku (digitálne úložisko), Kanade
(HeritageCanada), Holandsku (e-DEPOT). V každej krajine je rôzna štruktúra
účasti významných aktérov, no vo všeobecnosti ide o zodpovednosť,
kompetencie a iniciatívy národných inštitúcii, najmä národných knižníc a
archívov.
Ako odozva na globálny problém dlhodobého uchovávania digitálne
vytvoreného a digitálneho obsahu bola v roku 2003 schválená Charta UNESCO
o zachovaní digitálneho dedičstva.
13
2 STRATEGICKÉ ASPEKTY PROCESU DIGITALIZACE
Digitálny kultúrny a vedecký obsah sa tvorí z dvoch dôvodov.
Prvým dôvodom je dlhodobé uchovanie a druhým dôvodom je
jeho sprístupnenie širokej verejnosti.
Podobne, ako sa inštitúcie snažia okrem obsahu a nosiča nejakého diela
chrániť aj originálne pomôcky na jeho sprístupnenie (gramofón, magnetofón,
hracie skrinky), tak aj prístup k digitálnemu záznamu na fyzickom nosiči
vyžaduje technológie, ako sú diskové mechaniky, adaptéry, monitory a pod.,
ktoré by bolo vhodné v inštitúciách tiež zachovávať. Súčasťou riešenia
problému digitalizácie je potreba vypracovať koncepciu na zabezpečenie
prístupnosti obsahu v budúcnosti prostredníctvom emulácie pôvodného
prostredia alebo migrácie obsahu do meniacich sa nových prostredí.
Internet a Web sú v súčasnosti globálnymi, univerzálne dostupným priestorom.
Pre subjekty v krajinách a relevantných inštitúciách je potrebné vypracovať
relevantné odporúčania spracovania a sprístupnenia obsahu cez internet
a ustanoviť povinnosti ich dodržiavania.
Zbierky je potrebné vystaviť na internete cez vyhľadávače, metaprieskumové
stroje prostredníctvom využívania vhodných metaúdajov. Údaje na internete by
mali spĺňať odporúčania W W W konzorcia ohľadom prístupnosti Webu (napr.
pre znevýhodnené osoby).
Digitálny obsah (komunity, zbierky, objekty) bude vo virtuálnom prostredí vždy
prístupný z akejkoľvek domény cez akýkoľvek pojem, v knižniciach, archívoch,
múzeách, galériách, pamäťových úložiskách (repozitoch).
V krajine je potrebné pre oblasť digitalizácie a uchovávania a sprístupňovania
digitálneho obsahu zostaviť plán školení, seminárov a odborných konferencií
konaných napríklad pod záštitou Ministerstva kultúry, ktoré by malo zriadiť aj
účinnú komunikáciu v elektronickom prostredí - napr. sociálne siete,
elektronická konferencia, poštové zoznamy.
Významná je aj komunikácia s médiami a prezentácia spoločných aktivít kultúry
a vzdelávania pred verejnosťou. Kľúčovú úlohu v tvorbe stratégie informatizácie
a digitalizácie by mala zohrávať napríklad Rada pre informatizaci u, ktorú je
potrebné čo najskôr konštituovať.
Vhodným metodickým nástrojom na návrh, implementáciu a prevádzkovanie
a trvalú udržateľnosťaktivít na národnej úrovni sú príručky MINERVA - Príručka
pre dobrú prax projektov digitalizácie, Zásady kvalitného kultúrneho webového
sídla, Technické predpisy pre programy tvorby digitálneho kultúrneho obsahu
(pripravujú sa odporúčania ohľadom práv duševného vlastníctva). Ako metodika
pre dlhodobé uchovávanie kultúrneho dedičstva boli vypracované
a distribuované Technické odporúčania pre zachovanie digitálneho dedičstva
tvoriace doplnenie ku Charte o zachovaní digitálneho dedičstva UNESCO. V
mnohých krajinách neexistuje politika ani pravidlá (angl. policy) digitalizácie. Je
potrebná Stratégia uchovávania a sprístupňovania kultúrneho, vedeckého a
intelektuálneho dedičstva v krajine a koordináciadigitalizácie môže byť
rozpracovaním Dynamického akčného plánu koordinácie digitalizácie
kultúrneho a vedeckého obsahu pre krajinu, vyhláseného a presadzovaného
sieťou ministerstiev kultúry EÚ prostredníctvom Skupiny národných zástupcov.
14
2.1 Všeobecné ciele stratégie digitalizácie. Minerva
Zdroje kultúry a vedeckých poznatkov sú jedinečným verejným vkladom a formujú
kolektívnu a vyvíjajúcu sa pamäť národných spoločenstiev. Objavovanie zdrojov, ich
dostupnosť, použiteľnosť, interoperabilita, autentickosť, kvalita a dôvera zo strany všetkých
používateľov informačnej spoločnosti sú nevyhnutnými požiadavkami na poskytovanie
digitálnych kultúrnych informácií a služieb. Kultúrne inštitúcie ako knižnice, múzeá, archívy
a organizácie venujúce sa prírodnému a environmentálnemu dedičstvu sú hlavnými
dodávateľmi digitálneho obsahu, no musia sa mobilizovať. Ich úsilie je potrebné
koordinovať, aby sa čo najlepšie využili existujúce technológie a prispelo sa k tvorbe,
využívaniu a poskytovaniu lokálneho kultúrneho obsahu, ktorý vyhovuje potrebám všetkých
občanov.
Prostredníctvom tohto aktualizovaného plánuje na realizáciu vízie Európskeho kultúrnoinformačného
priestoru sledovaných šesť cieľov, pričom sa berie do úvahy a ďalej rozvíja
predchádzajúci súbor Lundských zásad:
(1) Zabezpečiť vedúcu úlohu národných pamäťových inštitúcií v dynamickom a
meniacom sa prostredí, v ktorom sa uskutočňuje rýchly technologický a ekonomický rozvoj.
(2) Posilniť koordináciu a presadzovať silnejšie prepojenie medzi digitalizačnými
iniciatívami inštitúcií, systémov a projektov prostredníctvom riadiaceho grémia zriadeného
pri ministerstve kultúry (Rada pre informatizaciu a digitalizáciu)
(3) Pokračovať v snahe o prekonávanie fragmentáciea duplikáciedigitalizačnýchaktivít a
o maximalizáciusynergií sprístupnením štandardov, metodík a odporúčaní pre projekty
digitalizácie
(4) Hodnotiť a identifikovať vhodné modely, spôsoby financovania a politické prístupy na
udržanie rozvoja a stratégie dlhodobého uchovávania.
(5) Presadzovať kultúrnu a jazykovú rôznorodosťprostredníctvom tvorby digitálneho
obsahu.
(6) Zlepšovať on-line prístup ku kultúrnemu obsahu.
(7) Prispôsobovať digitálny obsah pre špecifické využívanie (napr. v školách)
2.1.1 EUROPEANA (COMITÉ DES SAGES). POZÍCIA EURÓPSKEJ ÚNIE.
„Knižnice, archívy a múzeá v celej Európe sú už storočia opatrovníkmi
európskeho bohatého a rozmanitého kultúrneho dedičstva. Chránia
svedectvá o vedomostiach, kráse a talente Európanov, napríklad ich
sochy, obrazy, hudbu a literatúru, a poskytujú k nim prístup. Nové
informačné technológie vytvorili neuveriteľné možnosti na lepšie
sprístupnenie tohto spoločného dedičstva všetkým.
Kultúra ide po digitálnej ceste a „pamäťové inštitúcie" menia spôsob,
ktorým komunikujú s verejnosťou.
Digitalizácia vdychuje nový život materiálom z minulosti a mení ich na
impozantné bohatstvo pre individuálneho používateľa a na dôležitý
stavebný blok digitálneho hospodárstva, digitálneho priemyslu.
Sme toho názoru, že za sprístupnenie nášho kultúrneho dedičstva a za
jeho zachovanie pre budúce generácie nesie hlavnú zodpovednosť
verejný sektor. Táto zodpovednosť za dedičstvo Európy a kontrola nad
ním sa nemôžu ponechať na jeden alebo niekoľko subjektov na trhu, hoci
15
výrazne podporujeme myšlienku, aby sa do arény digitalizácie vnieslo viac
súkromných investícií a aby sa do nej zapojil väčší počet spoločností
prostredníctvom spravodlivého a vyváženého partnerstva.
Digitalizácia nášho kultúrneho dedičstva je obrovská úloha, ktorá si
vyžaduje veľké investície. Podľa štúdie bude na uloženie celého dedičstva
online postupne potrebných 100 miliárd EUR. Takéto úsilie si vyžaduje
čas a na dosiahnutie najlepších výsledkov sa investície budú musieť
dôkladne naplánovať a koordinovať.
Myslíme si, že prínosy stoja za toto úsilie. Tieto prínosy súvisia
predovšetkým so širším prístupom ku kultúre a k vedomostiam a s ich
demokratizáciou, ako aj s prínosmi pre vzdelávací systém - pre školy aj
univerzity. Ďalšie významné prínosy sú v hospodárskej sfére a týkajú sa
rozvoja nových technológií a služieb pre digitalizáciu, digitálne
uchovávanie a pre vzájomné pôsobenie s kultúrnymi materiálmi
inovačnými spôsobmi. Digitalizované materiály môžu byť samé osebe
stimulom inovácie a tvoriť základ nových služieb v takých sektoroch, ako
cestovný ruch a vzdelávanie.
Uvádzame naše odporúčania, pričom máme na pamäti tieto potenciálne
prínosy acieľ podporovať prostredie, ktoré pomôže:
• spoločne využívať naše bohaté a rozmanité spoločné
dedičstvo,
• spojiť minulosť s prítomnosťou,
• zachovať toto dedičstvo pre budúce generácie,
• chrániť záujmy európskych tvorcov,
• živiť tvorivosť, vrátane tvorivého úsilia zo strany
neprofesionálov,
• prispieť k vzdelávaniu, a
• podporovať inovácie a podnikanie.
Odporúčania Comité des sages sa týkajú všetkých oblastí stanovených
referenčným rámcom pre našu prácu a zaoberajú sa situáciami, v prípade
ktorých si myslíme, že je potrebná stimulácia alebo odstránenie prekážok.
2.1.2 ZABEZPEČENIE ŠIROKÉHO PRÍSTUPU K DIGITALIZOVANÝM VEREJNE DOSTUPNÝM
MATERIÁLOM A ICH VYUŽÍVANIA
Kultúrne inštitúcie by mali zabezpečiť čo najširší prístup k verejne
dostupným materiálom digitalizovaným spomocou verejných finančných
prostriedkov a ich opakované použitie. Tento cezhraničný prístup by mal
byť súčasťou podmienok financovania digitalizácie v celej Európe. Malo by
sa zabrániť využívaniu rušivej vodotlače alebo iných prostriedkov, ktoré
obmedzujú využívanie materiálov.
V prípade, že kultúrne inštitúcie účtujú súkromným spoločnostiam
poplatok za opakované použitie digitalizovaného verejne dostupného
16
materiálu, mali by dodržiavať pravidlá európskej smernice o opakovanom
použití informácií verejného sektora.
• Európska komisia by mala posúdiť spôsoby a prostriedky na
odstránenie rozdielov v stave práv týkajúcich sa digitalizovaných
materiálov medzi členskými štátmi v kontexte, v ktorom je
cezhraničný prístup a používanie normou. Samotný proces
digitalizácie by v zásade nemal vytvárať žiadne nové práva.
• Metaúdaje týkajúce sa digitalizovaných predmetov vytvorené
kultúrnymi inštitúciami by mali byť široko a bezplatne dostupné na
opakované použitie.
2.1.3 STIMULY DIGITALIZÁCIE
• Stimulovanie digitalizácie a online prístupnosti materiálov, na ktoré
sa vzťahujú autorské práva.
• Čo najskôr sa musí prijať európsky právny nástroj pre osirotené
diela. Tento nástroj by mal byť v súlade s 8-stupňovým testom,
ktorý vymedzil výbor.
• Musí sa zabrániť budúcim osiroteným dielam. Určitá forma
registrácie by sa mala považovať za podmienku úplného výkonu
práv. Vrámci Svetovej organizácie duševného vlastníctva (WIPO)
by sa v tejto súvislosti mala uskutočniť diskusia o úprave
Bernského dohovoru s cieľom prispôsobiť ho digitálnemu veku,
ktorú by mala podporiť Európska komisia.
• Národné vlády a Európska komisia by mali podporovať riešenia
týkajúce sa digitalizácie diel, ktoré už nie sú v distribúcii, a
cezhraničného prístupu k týmto dielam.
• Držitelia práv by mali byť na prvom mieste, pokiaľ ide o využívanie
diel, ktoré už nie sú v distribúcii.
• V prípade kultúrnych inštitúcií by riešenia týkajúce sa kolektívneho
udeľovania licencií a príležitosti mali byť podporené právnymi
predpismi s cieľom digitalizovat a uložiť diela, ktoré už nie sú v
distribúcii, online, ak to nerobia držitelia práv a komerční
poskytovatelia.
• Riešenia pre osirotené diela a diela, ktoré už nie sú v distribúcii, sa
musia týkať všetkých rôznych sektorov: audiovizuálneho sektora,
textov, výtvarného umenia, zvuku.
2.1.4 ÚLOHA EUROPEANY
Posilnenie knižnice Europeana ako referenčného bodu pre európsku
kultúru online
• Europeana by sa mala dálej rozvíjať, aby sa stala referenčným
bodom pre európsky kultúrny obsah online. To si vyžaduje
koncentráciu finančných snáh a politického kapitálu na európskej a
vnútroštátnej úrovni na vytvorenie stránky Europeana a hlavných
štruktúr.
17
• Členské štáty by mali zabezpečiť, aby všetko verejné financovanie
digitalizácie bolo podmienené následnou bezplatnou prístupnosťou
digitalizovaných materiálov prostredníctvom Europeany. Mali by
tiež zabezpečiť, aby do roku 2016 preniesli všetky svoje verejne
dostupné majstrovské diela do Europeany.
• V nadchádzajúcich niekoľkých rokoch by sa na portál Europeany
mala pridať aplikačná platforma, a k tejto stránke by sa mali pripojiť
hlavné činnosti súvisiace s digitalizáciou a ochranou kultúrneho
dedičstva Európy. Pri technickom rozvíjaní stránky by sa osobitná
pozornosť mala venovať aspektom viacjazyčnosti. V rámci
Europeany by sa mali preskúmať aj budúce možnosti „cloud
computing" (internetový oblak počítačov).
• Zo strednodobého hľadiska je potrebné zvážiť možnosť poveriť
Europeanu kľúčovou úlohou v ochrane dedičstva Európy a
premeniť ju na európsku úschovnu verejne dostupných
digitalizovaných kultúrnych materiálov a na „tmavý" archív pre
pôvodné digitálne kultúrne materiály.
• Europeana musí byť aktívne a široko podporovaná kultúrnymi
inštitúciami, Európskou komisiou a členskými štátmi.
2.1.5 ZARUČENIE TRVALEJ UDRŽÄTEĽNOSTI DIGITALIZOVANÝCH ZDROJOV
• V snahách o digitalizáciu je kľúčovým aspektom ochrana. Digitálna
ochrana je tiež hlavným problémom pre akýkoľvek pôvodný
digitálny obsah. Primeraná pozornosť by sa mala venovať
organizačným, právnym, technickým a finančným rozmerom
dlhodobej ochrany digitalizovaných materiálov a pôvodných
digitálnych materiálov.
• Za ochranu digitalizovaných kultúrnych materiálov a pôvodných
digitálnych kultúrnych materiálov by mali byť zodpovedné kultúrne
inštitúcie - ako je to teraz v prípade nedigitálnych materiálov.
• Aby sa zaručila ochrana európskeho digitálneho kultúrneho
dedičstva, na Europeane by sa mala archivovať kópia
digitalizovaných kultúrnych materiálov alebo pôvodných digitálnych
kultúrnych materiálov. Vprípade diel, na ktoré sa vzťahujú autorské
práva, by bol úschovnou „tmavý" archív fungujúci ako bezpečný
prístav.
• Aby sa predišlo zdvojeniu úsilia spoločností pôsobiacich v zahraničí
a kultúrnych inštitúcií, systém by mohol byť navrhnutý tak, aby sa
materiály, ktoré sa teraz musia uchovávať v niekoľkých krajinách,
uchovávali iba raz. Tento systém by zahŕňal pracovný tok pre
zasielanie kópie akejkoľvek inštitúcii, ktorá má na ňu právo na
základe vnútroštátnych právnych predpisov o povinných
výtlačkoch.
• Právne predpisy o autorských právach a súvisiace predpisy musia
umožniť inštitúciám kultúrneho dedičstva zodpovedným za
ochranu, aby si vytvorili archívne kópie a upravili súbory na
archívne účely.
• Pri každom digitálnom predmete archivovanom v kultúrnych
inštitúciách sa musia využívať trvalé identifikátory. Na európskej
18
úrovni sa musí vytvoriť a zachovať spoľahlivá rozlišovacia služba
na trvalú identifikáciu digitálnych predmetov, najlepšie spojená s
Europeanou.
2.1.6 UDRŽATEĽNOSŤ
Zabezpečenie trvalo udržateľného financovania digitalizácie a
Europeany
Verejný sektor je hlavným subjektom zodpovedným za financovanie
digitalizácie ačlenské štáty budú musieť značne zvýšiť svoje investície
1 „Tmavý" archív je archív, ku ktorému je obmedzený prístup. Súčasnú
finančnú krízu nemožno ignorovať, ale rovnako nemôže byť dôvodom
na nečinnosť.
• Malo by sa podporovať zapojenie súkromných partnerov.
Súkromné financovanie digitalizácie dopĺňa potrebné verejné
investície anemalo by sa vnímať ako náhrada verejného
financovania.
• Digitalizácia by sa v podstate mala financovať na vnútroštátnej
alebo regionálnej úrovni, nie na európskej úrovni. Členské štáty by
však mali byť silne podporované vtom, aby využívali možnosti
financovania zeurópskych štrukturálnych fondov na činnosti v
oblasti digitalizácie. Na európskej úrovni by sa mohli
spolufinancovať aj určité cielené snahy v oblasti digitalizácie, ktoré
majú jasný cezhraničný rozsah (napríklad cezhraničné zbierky).
• Vzhľadom na povahu Europeany ako spoločného dobra by sa
najväčšia časť prevádzkových nákladov Europeany mala
financovať z verejných prostriedkov, ato aj po roku 2013.
Financovanie digitalizácie aEuropeany by sa malo vnímať ako blok,
v ktorom sú ČŠ všeobecne zodpovedné za financovanie
digitalizácie svojho kultúrneho dedičstva avytváranie vnútroštátnych
zberných miest a v ktorom by financovanie portálu Europeana malo
pochádzať predovšetkým z rozpočtu Európskej únie.
• Členské štáty by mali podporovať spôsoby premeny digitalizácie na
nové možnosti rozvoja pre európske firmy, napríklad
prostredníctvom regionálnych zoskupení podnikov vpartnerstve
skultúrnymi inštitúciami, znalostnými partnerstvami medzi
kultúrnymi inštitúciami a univerzitami alebo prostredníctvom
strategických partnerstiev na európskej alebo medzinárodnej úrovni
v oblasti nových technológií a aplikácií v súvislosti s kultúrnym
dedičstvom.
2.1.7 PPP PROJEKTY
Doplnenie verejného financovania prostredníctvom verejno-súkromných
partnerstiev (PPP) pre digitalizáciu
Aby sa ochránili záujmy verejných inštitúcií, ktoré vstupujú do partnerstva
so súkromným partnerom, mal by sa dodržiavať súbor minimálnych
podmienok:
19
• Mal by sa zverejniť obsah dohody medzi verejnou kultúrnou
inštitúciou a súkromným partnerom.
• Digitalizované verejne dostupné materiály by mali byť pre širokú
verejnosť bezplatné a dostupné vo všetkých členských štátoch EÚ.
• Súkromný partner by mal kultúrnym inštitúciám poskytnúť
digitalizované súbory rovnakej kvality, ako je kvalita tých, ktoré sám
používa.
• Maximálny čas prednostného používania materiálov
digitalizovaných vo verejno- súkromných partnerstvách nesmie
presiahnuť 7 rokov. Toto obdobie sa považuje za primerané na
vytvorenie stimulov na súkromné investovanie do masovej
digitalizácie kultúrneho dedičstva na jednej strane a na umožnenie
dostatočnej kontroly verejných inštitúcií nad ich digitalizovanými
materiálmi na strane druhej.
• Tvorcovia politiky na európskej a vnútroštátnej úrovni by mali
vytvoriť priaznivé podmienky na zapojenie európskych subjektov.
Mali by najmä:
• podporovať digitalizáciu v nových oblastiach, ktorým sa doteraz
nevenovala veľká pozornosť, napríklad audiovizuálne materiály,
noviny, časopisy alebo muzeálne predmety;
• v strednodobom horizonte, pod podmienkou zlepšenia finančnej
situácie členských štátov, vytvoriť stimuly na investovanie
súkromných finančných prostriedkov prostredníctvom zdaňovania;
• podporovať využívanie verejných finančných prostriedkov
zosúladených so súkromnými finančnými prostriedkami
investovanými do digitalizácie. Verejné finančné prostriedky sa
môžu poskytnúť kultúrnym inštitúciám, ktoré zabezpečili partnerstvo
pre digitalizáciu svojej zbierky so súkromným subjektom na základe
spolufinancovania s investovanými súkromnými finančnými
prostriedkami;
• podporovať Europeanu a jej prispievajúce inštitúcie s cieľom
rozšíriť jej digitálny obsah prostredníctvom budovania partnerstiev s
európskymi podnikmi.
Môže si Európa dovoliť byť nečinnou a čakať alebo ponechať digitalizáciu
nášho spoločného kultúrneho dedičstva na jeden alebo viac súkromných
subjektov? Naša odpoveď je rezolútne „nie". Členské štáty, kultúrne inštitúcie
Európy, Európska komisia a dálšie zainteresované strany budú musieť prevziať
na seba zodpovednosť, aby sa zabezpečilo, že občania a hospodárstvo Európy
plne využijú potenciál ukladania kultúrneho dedičstva Európy online. Našim
cieľom je zabezpečiť, aby Európa namiesto vstupu do digitálnej doby
temna zažila digitálnu renesanciu."
20
3 PLÁNOVÁNÍ A PŘÍPRAVA PROCESU DIGITALIZACE
Tabulka 1 Projekt digitalizáie. Opis projektu
Projekt digitalizácie
Opis projektu
Názov projektu
Inštitúcia
Organizačný útvar inštitúcie
(oddelenie, ústav, katedra
ai)
Vedecký manažér
Priezvisko, Meno Telefon
fax
e-mail
Vedecký manažér (expert alebo vedecká
rada) je subjekt, ktorýje zodpovedný za
výber materiálu na digitalizáciu a
definovanie kvality metadát. Vo fáze
výberu materiáluje podporovaný
projektovým manažérom, najmä pokiaľ
ide o kontrolu materiálu a právne aspekty.
Manažér projektu
Priezvisko, Meno Telefon
fax
e-mail
Projektový manažér spolupracuje s
vedeckým manažérom pri analýze
právnych otázok, koordinuje činnosti
digitalizácie a garantuje kvalitu metadát.
Technický koordinátor
Priezvisko, Meno Telefon
fax
e-mail
Koordinuje technické a technologické
procesy a spolupracuje s tímom, ktorý v
systéme zabazpečuje využívanie,
prevádzkyschopnosť a prevádzky
Stručný popis zbierky
určenej na digitalizáciu
Stručný popis etáp
projektu a osoby
zodpovedné za etapy
(názov etapy)
Začiatok / Koniec Zodpovednosť
Trvanie projektu:
Začiatok - Koniec
R R R R M M D D
Začiatok Koniec
Informácia o dokumentoch určených na digitalizáciu (knihy, noviny, časopisy, atlasy, mapy,
fotografie atd.).
Typ (znak) Počet Poznámka
21
Tlačený text
Rukopisný text
Tlačené alebo rukopisné
hudobniny
Mapy
Postery
Pohľadnice
Kresby
Maľby
Tlač (gravírovanie, leptanie
atď.) Pergamen
Negatív č / b
Fotografia č / b
Fotografia col.
Snímka č / b
Posúvač stĺpcov.
Iné (špecifikuj)
Maľby
Forma dokumentov
určených na digitalizáciu
(nosič)
voľné listy
zrolované listy, zvitky
zviazané
Album
na kartóne alebo iných
materiáloch v ráme
obálky
Zložky
krabice
iné ?
voľné listy
Rozmery dokumentov
Menšie ako A4
A4
A3
A2
A1
AO
Väčšie ako AO
Iná veľkosť - špecifikuj
Celkový počet
dokumentov na
digitalizáciu
22
Informácia o digitálnych objektoch
Odhad počtu digitálnych
objektov
Ako je možné použiť
digitálne objekty (plán)
V sprístupnení sa musí dbať na
práva duševného vlastníctva.
Otvorený prístup je k deskriptívnym
metadátam a môže byť aj k
náhľadom objektov, voľným alebo
osirelým dielam ap. Práva
sprístupnenia sa môžu viazať na
každý jednotlivý dokument alebo
zbierku
otvorený, voľný prístup na
webe
obmedzený prístup na
webe
prístup v lokálnej sieti
CD-ROM alebo DVD
Tlač
iné (špecifikuj)
Predbežná kontrola
Zdroj dokumentov (odkiaľ
pochádzajú)
akvizícia áno - nie
Dar áno - nie
neviem áno - nie
iné (špecifikuj)_ áno - nie
Ak áno, aké boli výberové
kritériá?
historická a kultúrna hodnota áno - nie
unikátnosť a rarita áno - nie
často žiadaný áno - nie
materiál bez právnych
obmedzení prístupu alebo o
získaným povolením na
digitalizáciu a prístup
áno - nie
prístup obmedzený z dôvodu
stavu ochrany, hodnoty alebo
miesta
áno - nie
pridaná hodnota
prostredníctvom online prístupu,
áno - nie
vytvárania virtuálnych zbierok áno - nie
zvýšenie záujmu o výskum pre
málo známy alebo neznámy
materiál atď. iné (špecifikuj)
áno - nie
Bola vykonaná kontrola? áno - čiastočne - nie
Existuje už digitalizovaná
verzia?
áno - nie
Ak nie, tak vypíšte, v
ktorých organizáciách ste
vykonali kontrolu, či je
23
dokument alebo zbierka
digitalizovaná?
Sú nejaké právne
obmedzenia (copyright,
ochrana súkromia,
donorské práva atd)?
áno - čiastočne - nie
Podrobnejšie o
obmedzeniach
Sú už dokumenty
katalogizované?
áno - čiastočne - nie - neviem
Ak áno, tak ako? tlačený zoznam
elektronický zoznam
tlačený katalóg
elektronický katalóg
tlačený archívny zoznam
elektronický archívny zoznam
iné (špecifikuj)
V prípade, že ide o
tlačený text, máte v
úmysle robiť OCR ?
(Optical Character
Recognition)?
áno - čiastočne - nie
V prípade že ide o
rukopisný text, máte v
úmysle transkribovať,
prepísať text
dokumentov?
áno - čiastočne - nie - neviem
Približné náklady na
digitalizáciu
In-house náklady spolu:
Náklady na technickú
infrastrukturu, hardvér, softvér,
úpravy, tovary, služby
Prevádzkové náklady
Outsourcing spolu
Jednotkové ceny
Autor opisu projektu
Dátum
Dolupodpísaní sú si vedomí, že musia pracovať v súlade s miestnymi predpismi o autorských právach.
Vyhlasujú, že dokumenty tohto projektu sú (zaškrtnite jednu z možností):
vo vlastníctve tejto inštitúcie a chránené platnými právnymi predpismi o
autorských právach o priemyselnom vlastníctve
vo vlastníctve tretích strán, ktoré však udelili inštitúcii právo tejto ich
používať
vo verejnej doméne
24
Podpis vedeckého
manažéra
Podpis projektového
manažéra
Digitalizácia je proces transformácie / konverzie analógového objektu (text,
obrázok, zvuk, video) do digitálneho formátu, ktorý je možné pomocou počítača
interpretovať.
Výber skenovacieho systému, systém osvetlenia a metódy spracovania
(preprava, otváranie zväzkov, manipulácia) závisia od povahy a veľkosti
originálov.
Požadovaná kvalita obrazov definovaných v projekte určuje aké budú
hardvérové a softvérové požiadavky na skenovanie, časy akvizície a nároky na
spracovania obrazu a využitie pamäte v úložnom médiu na správu repozitu a
údržbu.
3.1 Digitalizácia interne alebo externe
Pri výbere digitalizácii v rámci inštitúcie (interne) alebo pri využívaní externých
služieb (outsourcing) sa musia zohľadniť výhody a nevýhody týchto dvoch
metód.
Tabulka 2 Alternatívy digitalizácie in-house a outsourcing
Digitalizácia doma (in-house) Digitalizácia dodávateľsky
^^^^^^^^^^^^^^^m (Outsourced)
organizácia ma priamu
kontrolu nad celým procesom
zamestnanci sa učia
prácou
požiadavky na
digitalizáciu sa nemusia
stanoviť vopred a priebežne sa
práca zlepšuje
zaručené je bezpečné a
správne zaobchádzanie
materiál a pomôcky sú
dostupné
inštitúcia platí náklady
namiesto výsledkov, ktoré
inštitúcia platí za
výrobok obvykle za určenú
cenu za obrázok
obmedzovanie
nákladov a malé riziká
dodávateľ môže
manipulovať s veľkým
množstvom materiálu
dodávateľ znáša
náklady na odborné znalosti,
školenia a technologické
zastaráván ie
dostupnosť širokej
škály možností a služieb
inštitúcia eliminuje
jednu fázu procesu;
25
zahŕňajú náklady na odbornú
prípravu, technologické
zastarávanie a prestoje
investície do nákupu a
údržby vybavenia
potreba
špecializovaného personálu
cena za obrázok nie je
definovaná
inštitúcia nerozvíja
vlastné hĺbkové znalosti
skúsenosti o digitalizácii
otázna je bezpečnosť,
preprava a manipulácia so
dokumentmi
Odporúčania Digitalizácia vlastnými silami
sa odporúča, ak:
Outsourcing sa odporúča, ak:
zbierky nie je možné dať
mimo inštitúcie
ak je digitalizácia
nenáročná
ak je v inštitúcii
špecializovaný personál a
infrastruktura
ak ide o dlhodobejší
projekt
nie je možné
digitalizovat' originály v rámci
inštitúcie
plánovanie zahŕňa
veľké množstvo práce v
krátkom čase
existujú v inštitúcii
obmedzenia týkajúce sa
priestoru, infrastruktury a
personálu
Outsourcovaná digitalizácia sa môže vykonať v priestoroch knižnice alebo na
mieste vybranej spoločnosti. Ak sa digitalizácia vykonáva v spoločnosti, musí
premiestnenie písomností povoliť štatutár inštitúcie a príslušný vedúci. Vrátenie
písomností musí byť oznámené štatutárovi a supervízorovi.
Tok činností súvisiacich s digitalizáciou mimo inštitúcie zahŕňa:
• Definovanie parametrov skenovania
• Vypracovanie štúdie uskutočniteľnosti alebo ponuky
• Preskúmanie technických a logistických aspektov
• Usporiadanie digitalizačného súboru
• Príprava dokumentov
• Školenie personálu a prevádzkovateľov zapojených do kontroly kvality
• Vytvorenie prototypu digitalizácie (technologický model)
• Kontrola kvality
• Oprava chýb a chýb
• Premiestnenie dokumentov
• Dodávka produktu
• Konečná kontrola kvality
Tok in-house digitalizačných aktivít zahŕňa najmä:
26
• Definovanie parametrov skenovania
• Nákup vybavenia
• Školenie príslušných zamestnancov a operátorov
• Preskúmanie technických a logistických aspektov
• Usporiadanie digitalizačného súboru
• Príprava dokumentov
• Vytvorenie prototypu digitalizácie
• Kontrola kvality
• Oprava chýb a chýb
• Premiestnenie dokumentov
Prehľad najlepšej praxe možno nájsť napríklad na stránke Minervy:
http://www.minervaeurope.org/bestpractices/listgoodpract.htm
3.2 Plánovania příprava procesu digitalizace v knihovně
Kultúrne inštitúcie, ako knižnice, múzeá, archívy a organizácie venujúce sa
prírodnému a environmentálnemu dedičstvu sú hlavnými dodávateľmi
digitálneho obsahu, no musia sa mobilizovať. Ich úsilie je potrebné koordinovať,
aby sa čo najlepšie využili existujúce technológie a prispelo sa k tvorbe,
využívaniu a poskytovaniu lokálneho kultúrneho obsahu, ktorý vyhovuje
potrebám všetkých občanov.
Prostredníctvom tohto aktualizovaného plánuje na realizáciu vízie Európskeho
kultúrno-informačného priestoru sledovaných šesť cieľov, pričom sa berie do
úvahy a ďalej rozvíja predchádzajúci Lundských zásady. Rovnako sa pri
plánovaní digitalizácie využívajú aj zistenia a návrhy projektu Minerva
a najlepšia prax inštitúcií, ktoré už majú s digitalizáciou praktické skúsenosti.
3.3 Praktické odporúčania
V tejto kapitole sú prezentované najdôležitejšie praktické vedomosti získané
tímom pre najlepšie praktiky projektu Minerva. Zameriava sa na praktické
pravidlá, ktoré by mali organizácie zobrať do úvahy pri začatí, realizácii alebo
riadení digitalizačných projektov vo sfére kultúry. Odporúčania sú rozdelené do
nasledovných oblastí, z ktorých každá odráža nejakú etapu projektu digitalizácie:
1. Plánovanie projektu digitalizácie
2. Výber zdrojového materiálu na digitalizáciu
3. Príprava na digitalizáciu
4. Zaobchádzanie a práca s originálmi
5. Proces digitalizácie
6. Uchovávanie originálneho digitálneho materiálu
7. Metaúdaje
8. Zverejnenie
9. Práva duševného vlastníctva a copyright
10. Manažment projektov digitalizácie
27
3.4 Projekt Minerva a Lundské zásady
Projekt Minerva, začal v roku 2002 pod vedením talianskeho Ministerstva
kultúry (zmluva IST 2001-35461). Projekt zahŕňal zástupcov príslušných
vládnych ministerstiev alebo centrálnych štátnych agentúr z mnohých členských
štátov EÚ so spoločným cieľom presadzovania spoločného prístupu
a metodológie digitalizácie európskeho kultúrneho materiálu. Projekt uznáva
jedinečnú hodnotu európskeho kultúrneho dedičstva a strategickú úlohu, ktorú
môže zohrávať v rastúcom priemysle digitálneho priemyslu v Európe. Uznáva aj
hodnotu koordinácie úsilia národných vlád a kultúrnych organizácií, aby sa
zvýšila úroveň syntézy a synergie digitalizačných iniciatív.
3.5 Lundské zásady
Dňa 4. apríla 2001 sa stretli predstavitelia a experti Európskej komisie
a členských štátov v meste Lund vo Švédsku (v rámci švédskeho predsedníctva),
aby diskutovali o tom, ako koordinovať a pridať hodnotu národným programom
digitalizácie na európskej úrovni. Stretnutie vyústilo do publikovania súboru
všeobecných zásad, ktorými sa majú riadiť verejné digitalizačně iniciatívy a ich
koordinácia. Tieto zásady (Lundské zásady) boli transformované do Lundského
akčného plánu, ktorý stanovuje zoznam úkonov, ktoré majú vykonať členské
štáty, Komisia, Komisia a členské štáty spoločne, aby sa vylepšili podmienky
digitalizácie v Európe.
(1) Zabezpečiť vedúcu úlohu národných pamäťových inštitúcií v
dynamickom a meniacom sa prostredí, v ktorom sa uskutočňuje rýchly
technologický a ekonomický rozvoj.
(2) Posilniť koordináciu a presadzovať silnejšie prepojenie
medzi digitalizačnýmiiniciatívami inštitúcií, systémov a projektov
prostredníctvom riadiaceho grémia zriadeného pri ministerstve kultúry (Rada
pre informatizáciu a digitalizáciu)
(3) Pokračovať v snahe o prekonávanie fragmentáciea
duplikáciedigitalizačnýchaktivít a o maximalizáciusynergií sprístupnením
štandardov, metodík a odporúčaní pre projekty digitalizácie
(4) Hodnotiť a identifikovať vhodné modely, spôsoby financovania a politické
prístupy na udržanie rozvoja a stratégie dlhodobého uchovávania.
(5) Presadzovať kultúrnu a jazykovú rôznorodosťprostredníctvom tvorby
digitálneho obsahu.
(6) Zlepšovať on-line prístup ku kultúrnemu obsahu.
(7) Prispôsobovať digitálny obsah pre špecifické využívanie (napr. v školách).
3.6 Manažérske plánovanie projektu digitalizácie
Plánovanie projektu je prvým krokom akéhokoľvek projektu digitalizácie. Čas
venovaný plánovaniu sa oplatí tak, že sa uľahčí riadenie a realizácia projektu. Za
normálnych okolností je potrebné odpovedať na nasledovné otázky:
• Čo sa musí urobiť?
28
. Kto to bude robiť?
• Kde sa to bude robiť?
• Kedy sa to bude robiť?
• Ako sa to bude robiť?
Projekt digitalizácie musí mať jasne špecifikované ciele, pretože majú priamy
vplyv na výber, copyright a zverejnenie materiálu. Do projektu by mal byť
zapojený vhodný personál s vyhovujúcimi vedomosťami a zručnosťami. Mal by
zahŕňať aj plán školení, aby sa zaručila dostatočná odbornosť, ktorú môže projekt
vyžadovať.
Projekt by sa nemal začať bez toho, aby sa uskutočnil prieskum iných projektov
v rovnakej oblasti. Takýto výskum identifikuje problémy, ktorým sa treba venovať,
bude stimulovať nové nápady a oblasti, ktoré ešte neboli zvážené a pridá
hodnotu výstupu projektu.
Výskum taktiež pomôže určiť množstvo práce, ktorú treba naplánovať pre
realizáciu projektu pomocou stretnutí alebo inej komunikácie s organizáciami,
ktoré realizovali podobné projekty. Takáto interakcia pomôže stanoviť, či vaša
organizácia má potrebný personál, vedomosti a technologickú infrastrukturu na
realizáciu projektu, alebo či bude potrebné školenie a iná príprava.
Je výhodné investovať určitý čas do zistenia statusu copyrightu materiálu, ktorý
sa ma digitalizovat'. Neúspech pri získaní povolenia digitalizovat' a zverejniť na
webe môže spôsobiť neúspešnosť celého projektu, bez ohľadu na technickú
odbornosť a skúsenosti.
Môže sa zvážiť aj možnosť realizácie technického pilotného projektu na začiatku
projektu, aby sa zabezpečilo to, že akékoľvek anomálie alebo problémy pri
technickej realizácii sa odstránia pred spustením hlavného projektu
3.7 Zdôvodnenie projektu
Definícia problému
Každý projekt digitalizácie má vlastné zdôvodnenie. Medzi dôvody často
patrí sprístupnenie kultúrnych zbierok cez internet, ktoré by boli v opačnom
prípade využívané len málo. Ďalším dôvodom je ochrana krehkých zbierok pred
opotrebovaním pri bežnom používaní. V ďalších prípadoch sú projekty
digitalizácie realizáciou spolupráce medzi organizáciami a zahŕňajú zriadenie
portálov, sietí atď.
Dôvody projektu majú silný vplyv na kritéria výberu materiálu, ktorý sa má
digitalizovat'. Často majú vplyv aj na riadenie projektu, metaúdaje a on-line
zverejnenie výstupu projektu (ak k nemu dôjde), kontrolu kvality atď. „Prečo" je
najdôležitejšou otázkou, ktorú si treba položiť pred začatím projektu digitalizácie.
Pragmatické návrhy
• Projekt musí mať konkrétne, explicitné ciele, ktoré sa musia
zdokumentovať.
• Ciele projektu by mali byť realistické v porovnaní s prostriedkami, ktoré sú
k dispozícii.
29
• Všetky kroky projektu sa musia overiť podľa týchto cieľov, aby sa zaručilo,
že práca vykonávaná v projekte prispieva k dosiahnutiu splnenia smerníc.
• Ciele projektu by mali dokumentovať hodnotu, akú projekt prinesie
inštitúciám zapojeným do projektu. Ak sa má do projektu investovať čas a
úsilie, musí byť jasné zaradenie projektu z inštitucionálneho pohľadu.
3.8 Ľudské zdroje
Definícia problému
Pred tým, ako môže projekt začať, je dôležité, aby bol k dispozícii personál
potrebný pre prácu na projekte. Mnohé kultúrne inštitúcie nemajú veľký počet
zamestnancov s dostatkom voľného času na vykonávanie digitalizácie mimo ich
zvyčajnej pracovnej náplne. Aj vedomosti potrebné pre projekt digitalizácie sa
môžu líšiť od zručností potrebných na vykonávanie bežných úloh každodennej
prevádzky. Preto je potrebné identifikovať hardvérové a softvérové riešenia
potrebné pre projekt digitalizácie.
Pragmatické návrhy
• Zabezpečte dostatočný počet zamestnancov na realizáciu projektu
• Prideľte zamestnanca ku každej úlohe alebo pracovnému balíku
projektového plánu.
• Identifikujte požiadavky na školenie, vrátane IT školení a inštruktáži o
zaobchádzaní s jemnými artefaktmi a dokumentmi.
• Ak je to možné, realizujte školenia pred začatím projektu pomocou tých
istých hardvérových a softvérových riešení, ktoré sa budú používať počas
projektu (firmy niekedy ponúkajú technické riešenia zdarma na školenie,
na krátky čas sa dajú prenajať aj potrebné zariadenia)
• Zamerajte sa skôr na malé jadro šikovných zamestnancov nadšených
projektom ako na veľkú skupinu "príležitostných" zamestnancov.
Poznámky/komentáre
Aj keď je materiál prezentovaný v tomto odporúčaní spoločný pre všetky scenáre
riadenia digitalizácie, je potrebné túto vec zopakovať: existuje reálne riziko, že
môžu vzniknúť nenapraviteľné škody na nenahraditeľných artefaktoch
a dokumentoch pri nesprávnom zaobchádzaní.
3.9 Výskum
Definícia problému
Bez ohľadu na rozsah konkrétneho projektu sa dá predpokladať, že v minulosti
sa už realizovali podobné projekty. Je vysoká pravdepodobnosť, že informácie
o takýchto projektoch sú dostupné na internete alebo publikované inde
v časopisoch a pod.
Výskum v danej oblasti môže ako súčasť procesu plánovania projektu pomôcť
identifikovať hardvérové a softvérové riešenia prichádzajúce do úvahy,
naplánovať pracovný postup a proces a vyhnúť sa problémom a prekážkam,
ktoré sa vyskytli v iných projektoch.
30
Pragmatické návrhy
• Už vo fáze plánovania vykonajte prieskum všetkých podobných projektov,
ktoré sa zaoberajú podobným záležitosťami ako plánovaný projekt. Na
internete je ich mnoho.
• Výskum pomáha predchádzať chybám. Môže skontaktovať projektový tím
s inými, ktoré uskutočnili podobné projekty a poskytnúť možnosť učiť sa z
ich skúseností.
• Vlastný výskum pridáva uznanie a hodnotu výstupu akéhokoľvek projektu.
Výsledok projektu zlepší aj štúdium diel iných, aby sa zaručilo, že projekt
sa nebude uskutočňovať vo vákuu.
Poznámky/komentáre
Mnohé kultúrne projekty digitalizácie sú financované z verejného rozpočtu a je
na ne kladená požiadavka, aby ich zistenia a správy boli zverejnené.
Publikovanie môže byť na internete, alebo cez iné vhodné médiá.
Projektové tímy sa často s radosťou delia o ich skúsenosti a výsledky - pridáva
to hodnotu ich dielu.
3.10 Hrozby. Riziká
Definícia problému
Na začiatku akéhokoľvek projektu je potrebné naplánovať, ako sa zaručí
úspešnosť výstupu. Cieľom však nie je odstrániť všetky hrozby ale pripraviť sa
na ne tak, že sa vytvorí projektový rámec, v rámci ktorého bude možné efektívne
reagovať na nepredvídané okolnosti. Cieľom je vytvorenie projektu s personálom
a postupmi, ktoré sa môžu prispôsobiť zmenám. Preto je do plánovania projektu
potrebné zahrnúť analýzu rizík.
Pragmatické návrhy
• Distribúcia digitalizovaných obrazov cez Internet je forma publikovania a
preto sa na ňu vzťahujú autorské zákony (copyright) a právo duševného
vlastníctva (IPR). Pri analýze rizík sa kladú nasledujúce otázky:
o Aké by mohli byť následky použitia materiálu bez špecifického
povolenia?
o Vyvinulo sa úsilie na zistenie držiteľa práv?
o V prípade porušenia copyrightu, aký by mohol byť dopad na
projekt?
• Pri verejných informáciách je dôležitou otázkou právna hodnota
informácie. Aké kroky sa podnikli na zaručenie toho, že digitalizovaný
zdrojový materiál nie je narušený a že sa vyprodukoval oprávnenou
inštitúciou?
• Musí sa zaručiť autenticita. Aké úkony sa podnikli na udržiavanie
obrazových súborov a aké nástroje sa použili?
• Financovanie projektu by mohlo predstavovať problém a možné ohrozenie
možností dosiahnuť ciele projektu.
31
• Kľúčovou je otázka úrovne zručností v projekte. Je možné najať nové
vysoko zručné a skúsené osoby? Ak nie, aký to bude mať vplyv na
projekt?
3.11 Výber zdrojového materiálu na digitalizáciu
Výber materiálu na digitalizáciu je dôležité rozhodnutie. Ideálnou voľbou je
zvyčajne digitalizácia celej zbierky alebo fondu, to je však realizovateľné len v
ojedinelých prípadoch, preto je nutný určitý výber. Kritéria výberu sa budú meniť
v závislosti od cieľov projektu digitalizácie, napríklad on-line zdroj pre školy sa
bude riadiť učebnými osnovami, múzeá vyberú najznámejšie predmety na
zvýšenie počtu návštevníkov alebo najvzácnejšie artefakty, aby sa znížil dopyt
po „blízkom" skúmaní. Toto samozrejme nie sú jediné problémy, ktorým sa treba
venovať pri stanovení kritérií výberu -dôvody výberu určitého materiálu sa budú
meniť od projektu k návrhu, rovnako aj dôvody, prečo nedigitalizovať Medzi
príklady ďalších dôvodov patria právne obmedzenia, inštitucionálna politika,
technická náročnosť digitalizácie, existencia digitálnej kópie atď.
3.12 Stanovenie kritérií výberu
Definícia problému
Pri plánovaní projektu digitalizácie je kriticky dôležitá voľba, aký materiál sa má
digitalizovat'. Kritéria výberu budú závisieť od cieľov projektu, rovnako aj od
technických a finančných obmedzení, otázok copyrightu a práv duševného
vlastníctva a od iných projektov v danej oblasti.
Pragmatické návrhy
• Musia sa stanoviť kritériá na výber materiálu, ktorý sa má digitalizovat'.
Kritériá výberu musia odrážať celkové ciele projektu. Mali by sa zvážiť
minimálne nasledujúce kritériá:
o Prístup k materiálom by inakšie nebol možný, alebo by bol
obmedzený.
o Širší a ľahší prístup k veľmi obľúbenému materiálu
o Stav originálov
o Uchovávanie chúlostivých materiálov tým, že sa sprístupnia ich
digitálne verzie ako alternatíva
o Téma projektu
o Copyright a práva duševného vlastníctva
o Dostupnosť existujúcich digitálnych verzií
o Náklady na digitalizáciu
o Vhodnosť zdrojového materiálu na prezeranie v režime online
• Kritériá výberu musia byť explicitné a prediskutované všetkými
zainteresovanými účastníkmi pred výberom alebo digitalizáciou.
• Kritériá výberu sa musia plne zdokumentovať, aby boli všetky rozhodnutia
digitalizovať/nedigitalizovať jasné počas celého projektu.
32
Poznámky/komentáre
Kultúrne organizácie majú bežne jadro vysoko hodnotného a atraktívneho
materiálu, ktorý je bez diskusie zahrnutý do projektu digitalizácie a jeho úlohou
je reprezentovať danú inštitúciu.
Veľká časť všetkých digitalizačných projektov majú za cieľ zverejnenie na webe.
To znamená, že je potrebné zvážiť záležitosti copyrightu a práv duševného
vlastníctva týkajúcich sa akéhokoľvek materiálu ešte pred výberom.
3.12.1 VÝBER PODĽA KRITÉRIÍ
Definícia problému
Po stanovení kritérií, aký materiál sa má digitalizovat' sa môže začať vlastný
proces výberu. Táto príručka navrhuje, ako sa má tento proces riadiť.
Pragmatické návrhy
• Každý kandidát na digitalizáciu sa musí hodnotiť podľa kritérií výberu. Mali
by sa poznamenať prípady, kedy sa kritérium výberu nesplnilo. Ak budú v
takýchto prípadoch odmietnuté dôležité alebo kritické objekty, môže sa
stať, že bude potrebné znovu revidovať kritériá. Ak sa toto vyskytne, nové
kritériá by sa mali zaznamenať.
• Po výbere objektu na digitalizáciu by sa mali podrobnosti o ňom zadať do
bázy poznatkov riadenia digitalizácie
Poznámky/komentáre
V tomto štádiu sa projekt zaoberá každým dokumentom/objektom, ktorý sa má
digitalizovat', po prvý krát. Toto je optimálna príležitosť pre projekt, aby vytvoril
bázu poznatkov o všetkých dokumentoch/objektoch, ktoré sú v rozsahu projektu.
Takáto báza poznatkov podporí manažment projektu a pomôže zaručiť, že na
zaobchádzanie so vzácnymi artefaktmi boli nadobudnuté odborné znalosti
a obsahuje aj také bežné informácie, ako je umiestnenie originálov.
3.12.2PRÍPRAVA NA DIGITALIZÁCIU
Pred tým, ako môže začať digitalizácia, musí sa pripraviť vhodné prostredie
a systém hardvéru a softvéru. Medzi prvky takéhoto prostredia patrí hardvér pre
samotný proces digitalizácie (skenery, digitálne fotoaparáty, stojany, iný
hardvér), počítačová infrastruktura, ku ktorej je pripojený hardvér, softvér na
zachytávanie a spracovanie obrazu, rovnako aj softvér pre metaúdaje a kontrolu
metaúdajov. Pracovné prostredie by malo vyhovovať digitalizovanému materiálu
a zvláštnu pozornosť je potrebné venovať svetlu, vlhkosti, vibráciám, rušivým
vplyvom, presunu originálov atď.
3.13 Hardvér
Definícia problému
Je potrebné zabezpečiť vhodné technické zariadenia na digitalizáciu, akými sú
zariadenia na zachytenie digitálneho obrazu (digitálne fotoaparáty a kamery,
skenery na knihy, dokumenty alebo mikrofilmy, audio a video hardvér) pripojené
na vhodnú počítačovú platformu (počítač, operačný systém, sieť). Je možné
33
rozlíšiť dve rôzne metódy digitalizácie: skenovanie a používanie digitálnych
kam ier/fotoaparátov.
Pragmatické návrhy
• Pred začatím digitalizácie sa musí nainštalovať vhodný hardvér a
skontrolovať jeho kvalita a funkčnosť.
• Na účely ohodnotenia zariadení na zhotovenie digitálneho obrazu by sa
mali použiť relevantné skúšobné materiály.
• Kým sa hardvérové prostredie úplne nepripraví a neodskúša na necitlivých
materiáloch, nemali by byť prítomné žiadne zdrojové materiály.
• Pre materiál, ktorý sa nepoškodí přitlačením o tvrdý povrch, bude vhodný
plošný skener (napríklad rozviazaný tlačený materiál a rukopisy,
fotografie)
• Na účely projektu by sa mal zaobstarať čo najväčší skener. Nemalo by sa
pristupovať k mozaikovitému skenovaniu alebo k skladaniu materiálov. Je
potrebné mať na pamäti, že preprava veľkého skenera (napr. AO) nie je
triviálna záležitosť.
• Plošný skener by sa mal použiť len vtedy, ak je materiál plochý a
nepoškodí sa pri pridŕžaní na plochom tvrdom povrchu. Pre mnohé
viazané dokumenty bude vhodný skener s knižnou kolískou, až do
príslušnej veľkosti. Mnohé materiály, ktoré nie sú ploché, ani vhodné pre
knižnú kolísku, budú na zhotovenie obrazov vyžadovať digitálny
fotoaparát/kameru.
• Pri použití skenera by malo mať toto zariadenie aspoň taký rozsah, ako je
veľkosť dokumentu/objektu, ktorý sa má skenovať.
• Zhotovenie obrazu by sa malo realizovať pri čo najvyššom primeranom
rozlíšení. Takto budú vznikať veľké súbory, z ktorých sa môžu extrahovať
menšie verzie - napríklad na účely prezentácie cez Web. Z obrazu s
nižšou kvalitou nie je za žiadnych okolností možné získať obraz s vyššou
kvalitou.
• Definícia "primeraného" rozlíšenia závisí od povahy snímaného materiálu
a od spôsobov využitia digitálnych obrazov. Napríklad ak sa skenované
obrázky majú použiť len ako miniatúrne náhľady, skenovať sa môže pri
nižšom rozlíšení. Vo všetkých prípadoch však musí rozlíšenie umožniť
zachytenie najvýznamnejších detailov dokumentu alebo predmetu. Je
ťažké odôvodniť použitie vyššieho rozlíšenia, ak skenovanie s vyšším
rozlíšením neposkytuje viac informácií ako skenovanie pri nižšom
rozlíšení.
• Zachytávaním obrazu by sa mal vytvárať formát súborov, ktorý je
bezstratový, čiže nekomprimovaný. Typicky sa používa formát TIFF
(Tagged Image File Formát).
• Projekt by mal použiť čo najvýkonnejšiu a flexibilnú digitálnu kameru
(fotoaparát), akú je možné zaobstarať. Žiadnym ďalším spracovaním nie
je možné prekonať obmedzenia digitalizačného zariadenia. Je potrebné
poznamenať, že digitálny "zoom" neposkytuje lepšiu kvalitu obrazu, len sa
ním zobrazuje menej bodov (pixelov) na jednotku plochy zobrazenia. Na
34
zachytenie detailov sú najdôležitejšie tieto tri parametre: počet bodov
(pixelov) v obraze, bitová hĺbka a kvalita použitých optických šošoviek.
• Je dôležité mať k dispozícii vhodné stojany na uchytenie a pridržanie
materiálov pri digitalizácii.
• Mala by sa použiť digitálna kamera/fotoaparát s účelovým stojanom.
Kamera alebo fotoaparát by mali byť nainštalované na trojnohom statíve
a podľa potreby by mali mať doplnkové osvetlenie, filtre a pod.
• Fotografická rovina a rovina materiálu musia byť rovnobežné, aby sa
obraz neskreslil.
• Súčasťou fotografických príprav musí byť vhodné osvetlenie. Je málo
pravdepodobné, že bude postačovať len okolité svetlo. Svetelné
podmienky musia byť stabilné.
• Na zníženie skreslenia farieb by sa mali použiť vhodné filtre.
• K zariadeniam musí byť pripojený počítač s veľkým úložným priestorom.
Údaje na tomto počítači by sa mali v krátkych a pravidelných intervaloch
zálohovať.
• Ak sa musí obraz skenovať po častiach, mal by sa ponechať priestor
niekoľko centimetrov na prekrytie, aby sa zabránilo vzniku medzier medzi
jednotlivými časťami. Pre všetky časti by sa mali použiť rovnaké
nastavenia, aby nedošlo ku efektu „zlátaniny".
Poznámky/komentár
Použitý hardvér je hlavným obmedzením kvality konečného výstupu projektu
digitalizácie. Pokiaľ projekt sa v rámci projektu nedigitalizujú len ploché materiály,
ktoré sa dajú skenovať bez poškodenia väzby, rámov alebo samotného
materiálu, bude potrebné použiť digitálnu kameru/fotoaparát. Môže sa použiť aj
analógový fotoaparát a následne z neho skenovať diapozitívy, no digitálny
fotoaparát má mnohé výhody z hľadiska času, úsilia a kvality.
Ak má projekt obmedzený životný cyklus, môže byť výhodný prenájom hardvéru.
Ďalšou alternatívou je využitie externých agentúr na realizáciu digitalizácie
v prospech kultúrnych subjektov zapojených do projektu.
3.13.1 SKENERY
Skener (z angl. scanner) je vstupné zariadenie počítača určené
na digitalizáciu plošných predlôh, predovšetkým papierovychdokumentov,
obrázkov, fotografií alebo iných predlôh
obsahujúcich grafické alebo textové informácie. Skener je teda
elektromechanické (elektronické) hardvérové zariadenie premieňajúce
obrazové (reálne) body do digitálnej formy čiže počítačom spracovateľných dát.
3.13.1.1 Delenie skenerov
Skenery si môžeme rozdeliť podľa viacerých hľadísk.
3.13.1.2 Podľa predlohy
plošné, predloha sa kladie na plochu, obvykle sklenenú platňu
ručné, snímacím prvkom sa ručne pohybuje po snímanej ploche
35
bubnové, predloha sa vkladá do skleneného valca
fotografické, predloha sa sníma podobne ako fotoaparátom - odfotografuje sa
bezkontaktné, laserové - sníma sa len modulované laserové svetlo odrazené
od predlohy
prechodové, predloha prechádza štrbinou okolo snímacieho prvku (ako
pri faxe)
filmové, snímanou predlohou sú negatívne filmy a diapozitivně filmy
3.13.1.3 Podľa snímača
CCD skenery. Snímač CCD svetlocitlivý polovodičový čip. Predloha je
osvetlená výbojkou. Obraz sa odráža od sústavy zrkadiel, prechádza
objektívom a dopadá na CCD snímací prvok.
CIS skenery (Contact Image Senzor): snímací prvok je tvorený jedným riadkom
snímacích senzorov umiestnených čo najbližšie k predlohe. Zdroj svetla
zabezpečujú LEDdiódy integrované v čítacej hlave.
laserové CCD - snímač sníma iba špecificky modulované
monochromatické laserové svetlo odrazené od predlohy. Používa sa pre
snímanie čiarového kódu a detekciu tvaru predmetov.
3.13.1.4 Podľa komunikačného rozhrania
USB, pripojenie je vytvorené zbernicou USB (Universal Seriál Bus)
FireWire, málo používané, iba pre špeciálne aplikácie. Používa interface
1394 FireWire
SCSI Small Computer System Interface
Paralelný port, pripojenie je cez centronics, paralelný port
Bezdrôtové, používajúce technológie IrDA, Wi-Fi, Bluetooth
3.13.1.5 Snímač čiarového kódu
Snímač čiarového kódu (anglicky barcode reader) je zvláštna forma skeneru
umožňujúca čítať tzv. čiarový kód, čo je do binárnej formy zakódovaná číselná,
alebo textová informácia zobrazená vo forme hrubších a tenších čiar a medzier.
Pre bližšie informácie pozri snímač čiarového kódu.
3.13.2 DRUHY SKENEROV
S pomocou skenera je možné digitálne spracovávať a ďalej
upravovať tlačené obrázky (napr. fotografie, obrázky z časopisov a pod.).
Výstupom je obraz predlohy vo forme binárneho obrázku, ktorý ovládač
skenera umožňuje uložiť vo formáte bežne používanom iným softvérom (bmp,
jpeg, tiff, pcx, png, gif a pod.). Súčasťou skeneru je jeho ovládač, ako aj tzv.
twain interface, ktorý umožní používať driver skenera a tým skenovať obrázok
priamo do príslušnej aplikácie. Obvykle je ku skeneru pribalený aj jednoduchý
softvér na úpravu a tlač obrázkov, niekedy tiež tzv. OCR softvér, slúžiaci na
strojové čítanie textu (obrázok textu sa prekonvertuje na text).
36
3.13.2.1 Ručný skener
Tiež hand-held scanner. Prvou kategóriou sú ručné skenery, ktoré sa dnes
používajú len v obmedzenom rozsahu - väčšinou len tam, kde je potrebné
skener prenášať - mobilné riešenia. Zariadenie je podobné väčšej myši, ktorou
užívateľ prechádza cez obrazovú predlohu a zosnímané dáta odošle do
pripojeného počítača (alebo uloží do integrovanej pamäte). Výhodou sú malé
rozmery, nevýhodou je hlavne nízka kvalita snímania a malá šírka snímania (~
10 cm). Ručné skenery sú náročné na spôsob ovládania, pretože užívateľ musí
pohybovať skenerom po predlohe ručne. Presnosť snímania je potom daná
presnosťou, a plynulosťou pohybu ruky.
3.13.2.2 Prechodový skener
Prechodový skener sníma dokument na rovnakom princípe ako faxový prístroj.
Predloha (obvykle len jeden hárok papiera štandardnej hrúbky)sa vloží do
skenera, ktorý ho posúva cez štrbinu okolo CCD snímacieho prvku. Táto
skupina skenerov je určená na snímanie papiera s formátom maximálne A4.
Výhodou sú malé nároky na miesto, nevýhodou je nemožnosť snímania
predlohy z časopisu alebo knihy. Obvykle sa s nimi stretávame iba ako so
zabudovanou súčasťou iných zariadení (fax, tlačiareň a pod.)
3.13.2.3 Plošný skener
Flatbet scanner. V súčasnosti sú najrozšírenejšou skupinou stolné plošné
skenery. Tieto snímajú predlohu, ktorá je položená na sklenenú dosku, pričom
sa pod touto doskou pohybuje snímacia hlava. Plošné skenery sú konštrukčne
náročné, ale poskytujú kvalitný výstup pri snímaní predlôh. Ich nevýhodou sú
väčšie nároky na miesto. Plošné skenery sa vyrábajú vo formátoch A5, A4 a
A3. Bývajú aj súčasťou multifunkčnych zariadení, ktoré obsahujú navyše aj
tlačiareň.
3.13.2.4 Filmový skener
Filmový alebo kinofilmový skener slúži na snímanie negatívov
alebo diapozitívov. Na zosnímanie malého formátu obrázku z kinofilmu do
vysokého rozlíšenia sa vyžaduje iná technológia snímania ako pri plošných
skeneroch. Slúži pre snímanie jednotlivých políčok filmu s použitím vysokého
rozlíšenia - minimálne 2400 dpi. Vzhľadom k špecifickému účelu sú používané
iba profesionálne.
3.13.2.5 Bubnový skener
Drum scanner. Zvláštnou kategóriou sú bubnové skenery - sú určené pre
profesionálne snímanie. Predloha sa vloží do skleneného bubna, ktorý sa
roztočí. V bubne sa nachádza snímacie zariadenie, ktoré predlohu sníma v
kružniciach. Ich nevýhodou je vysoká cena, a preto sú používané hlavne pre
snímanie veľmi veľkých predlôh, prípadne tam, kde je potrebná vysoká kvalita
výsledku. Táto technológie je najstaršou snímacou technológiou.
3.13.2.6 3D skener
Technológia umožňujúca pomocou laserových lúčov nasnímať trojrozmerný
objekt. Využíva sa nie len snímanie povrchu objektov, ale laserom je zároveň
odmeraná presná vzdialenosť k nim. Táto technológia sa používa pre získanie
37
trojrozmerného obrazu snímanej predlohy napr. sochy, miestnosti a pod. Táto
technológia je veľmi nákladná a preto iba pre profesionálne využitie.
3.13.2.7 Konštrukčné časti
Najčastejšie používaným skenerom je plošný skener, ktorý býva aj
súčasťou multifunkčného zariadenia.
predloha odraz svetla od predlohy
I C
/ \ ' I
sklo skenera zdroj svetla - lampa
pevné zrkadlo
odrazené svetlo jj
pohyblivé zrkadlo
snímač CCD
Obrázok 1 Schéme procesu snímania skenerom
3.13.2.8 Snímacia hlava
Snímacia hlava je vozík pohybujúci sa po koľajničkách vytvorených presne
brúsenými vodiacimi tyčami. Vozík má šírku podľa typu skenera na celú šírku
snímaného média. Pohon zabezpečuje krokový motor a prevod lankom,
alebo ozubeným remeňom. Horizontálne rozlíšenie je teda dané snímacím
prvkom, vertikálne počtom krokov motora vozíka. Preto je často u skenerov
udávané rozlíšenie skenera vo forme násobku napr. 300 x 600 dpi. Rýchlosť
snímania skenera je teda daná rýchlosťou presunu vozíka, rýchlosťou
zosnímania riadku a rýchlosťou prenosu dát do počítača. Na snímacej hlave sa
nachádzajú všetky podstatné časti skenera - osvetlenie predlohy, optická
sústava a snímací prvok - senzor
3.13.2.9 Osvetlenie
Snímače pracujú len v určitom rozsahu osvetlenia predlohy, preto väčšina
skenerov si nevystačí s prirodzeným svetlom a vyžaduje prídavné
nasvietenie. Osvetlenie musí byť čo najrovnomernejšie a nesmie posúvať
farebné spektrum predlohy (vernosť farebného podania). Plošné skenery
používajú studené katódové svetlo - katódová lampu, resp. výbojku - žiarivku.
Výhodou je vysoká intenzita produkovaného svetla, nevýhodou však práve
nerovnomerné osvetlenie (najviac svetla v strede). Nerovnoměrnost'
sa kompenzuje nahriatím lampy, sústavou zrkadiel a elektronicky. CIS
technológia požíva na osvetlenie predlohy LED diódy umiestnené hneď vedľa
snímacích elementov. Všetky diódy sú rovnaké, čo zaručuje rovnomerné
osvetlenie po celej šírke snímaného dokumentu. Osvetľovací a snímací
mechanizmus sú obvykle integrované v spoločnej pohyblivej hlave, ktorá sa
pomocou motora postupne presúva popod predlohu po jednotlivých krokoch
daných nastaveným rozlíšením a snímajú jeden riadok za druhým.
38
3.13.2.10 Snímač
Odrazené svetlo je optickou sústavou (ktorá je taktiež súčasťou snímacej hlavy)
premietnuté na CCD snímací prvok (podobný ako u digitálneho fotoaparátu),
ktorý premieňa hodnoty zo svetla na dáta. Kombinácia žiarivka - optická
sústava - snímací prvok CCD je najpoužívanejšou technológiou, ktorú súhrnne
nazývame CCD. Skenery vybavené týmto spôsobom snímania sú o čosi
drahšie, chúlostivejšie na poškodenie, ale majú lepšiu farebnú citlivosť a
snímanú hĺbku.
Lacnejšou technológiou snímania je technológia CIS. Ide vlastne o dve rady
diód - jedna rada vysoko svietivých LED diód a druhý rad zo snímacích
polovodičových prvkov. Kladom sú nižšie výrobné náklady a teda aj nižšia cena
CIS skenerov, menšie rozmery a väčšia odolnosť. Nevýhodou je ale naopak
nižšia svietivosť a citlivosť, ktorá sa potom prejaví pri snímaní jemných
farebných odtieňov. Snímací prvok CIS však časom nestráca svoje snímacie
vlastnosti ako je tomu u skenerov s CCD snímacími prvkami najmä s ohľadom
na žiarivku.
3.13.2.11 Prevodník
Jeho úlohou je prevod obrazovej informácie zosnímanej snímačom do
elektronickej formy. Snímač pracuje tak, že intenzita svetla, ktoré dopadá na
jeho jednotlivé bunky je premenená na elektricky náboj s rôznou intenzitou.
Každý bod elektronickej podoby obrazu je zložený z troch informácií - intenzity
troch základných farieb - R (červená), G (zelená) a B (modrá).
Každý bod snímanej predlohy je teda „meraný" tromi bunkami snímača - každá
bunka pomocou špeciálnych filtrov vyhodnocuje jednu z uvedených farebných
zložiek bodu. V plošných skeneroch sú použité tzv. riadkové CCD alebo CIS
snímače, použitý snímač (počet snímacích elementov v riadku) teda určuje
maximálne možné rozlíšenie skenera.
Kvalita skenera je priamo závislá na kvalite použitého snímača a počtu jeho
buniek, tzv. pixelov. V súčasnej dobe väčšina plošných skenerov používa
snímače s rozlíšením 600, 1 200 alebo 2 400 dpi. Označenie dpj (dot per inch)
udáva, koľko bodov je snímač schopný nasnímať na jednotku vzdialenosti
jedného palca (2,54 cm).
CCD snímač s rozlíšením 600 dpi má teda 1 800 buniek (každý bod je snímaný
trikrát) na každých 2,54 cm. Plošný skener určený pre formáty A4 má približne
15 000 buniek. Skenery umožňujú aj tzv. interpoláciu, čiže predlohu zosnímanú
na nižší počet dpi prepočítajú na vyšší počet s rešpektovaním prechodov, hrán
a pod. Každý pôvodne vyhodnotený bod rozdelí na niekoľko ďalších bodov a na
kvalite programového vybavenia potom záleží, ako dobre si skener poradí s
farebnými odtieňmi pridelenými novým bodom. Tento proces však zvládne
väčšina programov pre úpravu obrázkov, a preto využitie tejto funkcie skenera
je malé. Kvalitu výstupu zo skenera ovplyvňuje najviac jeho optické rozlíšenie a
tým aj ostrosť výsledného elektronického obrazu. Okrem počtu buniek na
snímači je dôležitá aj jeho kvalita, ktorá je reprezentovaná bitovou hĺbkou. Táto
vlastnosť je ako verne schopný prevodník obrazovej informácie na elektronickú
reprodukovať farby. Udáva, koľko možných hodnôt môže mať elektrický náboj
produkovanými jednotlivými bunkami snímača. Udáva sa v bitoch a väčšie číslo
udáva väčší počet farieb, ktoré je schopný skener rozpoznať. V praxi sa u
39
farebných skeneroch stretávame s hodnotami 24 až 48 bitov. Snímané údaje sú
spracované procesorom a cez komunikačný interfejs odoslané do počítača.
3.13.2.12 Použitie
Kritériom pre použitie skenera je rozsah jeho používania - požiadavky na
rýchlosť, objem snímaných dokumentov, rozlíšenie, účel snímaného obrázku a
pod. Ďalším dôležitým kritériom je jeho cena a možnosť technickej podpory a
servisu. Najväčšia časť domácich a kancelárskych užívateľov bude pre
spracovanie grafických a textových predlôh dostačujúce rozlíšenie 600 dpi, pre
náročnejších 1 200 resp. 2 400 dpi, ktoré dnes ponúka väčšina modelov.
Pri voľbe rozlíšenia je dôležitá skutočnosť, že obrázky s vyšším rozlíšením
zaberajú viac miesta v operačnej pamäti a pri práci ale najmä viacej miesta na
disku pri ukladaní. Taktiež pre pružnú prácu s veľkými obrázkami bude
potrebné aj príslušné hardvérové vybavenie. To je zvlášť dôležité pri snímaní
predlôh A3.
Okrem počítača ovplyvňuje rýchlosť práce práve skener. Väčšina skenerov
sníma predlohu o veľkosti formátu A4 v rozmedzí jednej až dvoch minút. Pred
vlastným snímaním je však obvykle nutné podľa náhľadu dokumentu nastaviť
minimálne oblasť snímania a korekcie - tento náhľad zvládne bežne skener asi
za polovicu uvedenej doby. Pokiaľ je potrebné skenovať niekoľko desiatok strán
denne, je potrebný skener s rýchlym snímaním a s rýchlym rozhraním.
Pri výbere skenera si musíme zvoliť aj typ interfejsu, ktorým pripojíme skener k
počítaču. Dnes je takmer výhradne používanú interfejs USB. Pre profesionálne
použitie sa ešte využíva aj SCSI rozhranie
3.14 Softvér
Definícia problému
Po vytvorení digitálnej verzie objektu je pravdepodobné, že výsledný súbor bude
požadovať spracovanie pred tým, ako sa bude môcť použiť. Medzi úpravy patria
korekcia farby, orezanie obrazu, kompresia na menší súbor (napr. náhľady, obraz
na prezentáciu cez web).
Pragmatické návrhy
• Kalibračný proces má začať ihneď po zapnutí skeneru alebo digitálnej
kamery.
• Na zúžitkovanie matričných súborov bude potrebný vhodný softvér na
spracovanie obrazov. Aj keď digitalizačný hardvér je často poskytovaný s
nejakým softvérom, pre projekt digitalizácie nemusí byť dostatočne
výkonný a flexibilný.
• Požiadavky na softvér závisia na cieľoch projektu. Je vhodné
poznamenať, že ak sa matričné súbory akýmkoľvek spôsobom nezmenia,
na ich spracovanie sa môžu použiť rôzne typy softvérov. Avšak náklady
na čas a úsilie môžu byť významné a zvyčajne prevýšia náklady na
výkonnejší softvérový balík.
40
• Projekt by mal získať ten najvhodnejší a najvýkonnejší softvér, ktorý si
môže dovoliť.
• Absolútne minimum, ktoré musí softvér byť schopný vykonať je:
o otvárať veľmi veľké obrazové súbory
o meniť rozlíšenie a hĺbku farby
o uchovávať viaceré rôzne verzie, s rôznymi veľkosťami súborov.
o vyberať a kopírovať časť obrazu a uchovať ho ako iný súbor.
o exportovať obrazy v rôznych formátoch súborov, vrátane webových
štandardov J P E G a GIF.
• Túto úroveň funkčnosti poskytuje niekoľko voľne dostupných softvérových
balíkov; avšak investícia do komerčného produktu sa oplatí z hľadiska
ušetrenia času, úsilia, dokumentácie a technickej podpory.
• Ak má projekt aj zložku optického rozoznávania znakov (OCR), je dôležitá
voľba softvéru pre OCR. Všetky úkony spojené s OCR vyžadujú určitú
dávku ručných úprav a opráv, spôsob, akým tieto funkcie softvérový
produkt podporuje, má významný vplyv na čas a úsilie vyžadované
projektom. Lepšie balíky OCR umožňujú prehľad a úpravy na jednej
obrazovke, navrhujú opravy zle prečítaných slov. podporujú rôzne
spôsoby rozloženia textu a obrazov, obsahujú mnohé slovníky a pod.
Oplatí sa zhodnotenie viacerých softvérových balíkov pre OCR, ak projekt
zahŕňa viac ako jednu osobu za rok.
Poznámky/komentár
Správna voľba softvéru ušetrí projektu množstvo času a práce. Ak má projekt
značné trvanie (napr. viac ako dve osoby počas viac ako pol roka), je vhodné
ohodnotiť viac softvérových balíkov, aby sa vybral produkt, ktorý najlepšie
vyhovuje požiadavkám projektu
3.15 Proces digitalizácie
Táto kapitola poskytuje praktické odporúčania pre samotný proces digitalizácie.
Technické riešenia na digitálne snímanie sa môžu meniť. Detailnejšie je opísaná
práca so skenermi, digitálnymi kamerami/fotoaparátmi alebo softvérovými
aplikáciami na optické rozoznávanie znakov (OCR), nakoľko ide o oblasti
relevantné pre väčšinu projektov. Neuvažuje sa tu o digitalizácii priehľadných
originálov (napr. mikrofilm).
41
3.15.1 POUŽÍVANIE SKENEROV
Obrázok 2 Prehľad skenerov a softvér na úpravu obrazu
Definícia problému
Plošné skenery sú najbežnejším nástrojom na digitalizáciu. Najrozšírenejšie
modely A4 a A3 sú relatívne lacné, nenáročné na použitie a ak sa raz zabehne
pracovný tok, zvládnu relatívne veľké množstvo materiálu. Veľkoplošné skenery
(až do AO) a skenery vybavené knižnými kolískami sú veľmi drahé a požadujú
dlhodobé projekty/programy, veľkokapacitnú digitalizáciu alebo nadrozmerný
zdrojový materiál.
Príklad automatického skenera:
https://www.voutube.com/watch?v=Kh7qqyn6QOY
Rôzne skenery:
https://www.i2s. fr/en/bu/heritage-digitization#categories
Pragmatické návrhy
• Na plošnom skeneri snímajte len materiály, ktoré sa nepoškodia pri
pritlačení o pevný povrch. V prípade pochybností sa poraďte s odborníkmi.
• Zabezpečte neustálu a úplnú čistotu sklenenej skenovacej plochy, čím
zvýšite kvalitu obrazu a chránite materiál pre znečistením.
• Ak je to možné, skenujte len také dokumenty/predmety, ktoré sa celé
zmestia na plošný skener alebo skener vybavený knižnou kolískou.
• Ak je potrebné skenovať dokument/predmet po častiach, zabezpečte, aby
zostalo dostatočné prekrytie umožňujúce znovu zmontovať obraz pri
budúcom spracovaní (pomocou mozaikovacieho softvéru).
• Otestuje skener a jeho výstup na necitlivom materiáli pred tým, ako
začnete skenovať originálny zdrojový materiál. Používateľov tiež
vyškoľujte pomocou toho istého necitlivého materiálu.
• Zaveďte konvenciu prideľovania názvov súborom vytvorených skenerom
- napríklad podľa existujúceho katalogizačného systému - a/alebo
pridávania názvov s významom. Názov súboru by mal umožniť mapovanie
so zdrojovým dokumentom/predmetom.
42
• Aby sa maximalizovala schopnosť přenosu súborov cez viaceré
počítačové platformy, mal by sa používať taký názov súboru, ktorý má
osem znakov a po ktorom nasleduje pozostávajúce z maximálne troch
znakov.
• Pred stanovením toku práce alebo dávkového pracovného procesu
vykonajte ucelený proces skenovania a spracovania obrazu, aby ste sa
uistili, že výsledkom toku práce je to, čo sa očakáva.
• Rozlíšenie a bitová dĺžka by mali byť čo najvyššie, ako je prípustné podľa
dôvodu projektu, obmedzení skenera, podmienok na ukladanie údajov a
atribútov zdrojového materiálu.
• Skenujte pri maximálnej vhodnej hĺbke farby, s tými istými limitmi
uvedenými vyššie.
• Denne zálohujte pevné disky, na ktorých sú uložené údaje.
• Ďalej je dôležitá kontrola kvality digitálneho obrazu a metaúdajov. V čase
skenovania je najlepšie zaoberať sa otázkou kvality. Je potrebné mať na
pamäti nasledovné body:
o Pre jednotlivé skupiny dokumentov/predmetov a ich častí sa musí
stanoviť minimálne rozlíšenie.
o Preskúmajte zoskenovaný výstup na obrazovke, na papieri,
premietacom a v akomkoľvek inom formáte, v ktorom sa môže
používať (napríklad na mobilnom zariadení)
o Uistite sa, že obrazovky (monitory) sú spoľahlivo vykalibrované.
Zabráňte tomu, aby na obrazovke alebo v jej okolí bol iný materiál,
ktorý môže mať vplyv na vnímanie dokumentu/predmetu.
o Matricové obrazy sa musia vytvárať s viditeľnými mierkami, farebné
obrazy alebo obrazy so stupnicou šedej farby musia obsahovať aj
štandardizované referenčné hodnoty.
Poznámky/komentáre
Samotné skenovanie je relatívne nenáročná operácia. Je však užitočné vytvoriť
si pracovný tok na zvýšenie efektívnosti a zníženie výskytu chýb.
Skenovanie nadrozmerných dokumentov/objektov alebo skenovanie pri veľmi
vysokej kvalite vyžaduje veľké investície času a úsilia najeden dokument/objekt.
Tie je možné znížiť používaním hardvéru, ktorý vyhovuje povahe dokumentu
(napr. veľkoplošný skener, knižná kolíska). V prípade, že nie je k dispozícii veľa
prostriedkov na hardvér, vyhraďte na skenovanie dostatok času.. Nemalo by sa
zanedbať školenie o práci s nadrozmernými a nepravidelne tvarovanými
materiálmi.
43
Obrázok 3 Pracovisko masovej priemyselnej digitalizácie s digitalizačnými robotmi
3.15.2POUŽÍVANIE DIGITÁLNYCH KAMIER/FOTOAPARÁTOV
Definícia problému
Používanie digitálnych kamier/fotoaparátov sa stáva v digitalizačných projektoch
čoraz bežnejšie. To vypovedá o ich flexibilite, hlavne ohľadom schopnosti
digitalizovat' neploché objekty, akými sú zviazané knihy, poskladané alebo
pokrčené rukopisy a trojrozmerné predmety. Normálne sa však pri digitalizácii
zviazaných kníh a nadrozmerných materiálov ako mapy a nákresy uprednostňuje
skener vybavený knižnou kolískou
Pragmatické návrhy
• Pri obmedzenom rozsahu projektu je potrebné zvážiť prenájom vysokokvalitnej
kamery/fotoaparátu.
• Digitálnu kameru/fotoaparát nainštalujte na motorizovaný vozík s
možnosťou vertikálneho posuvu a umiestnite dokumenty/predmety, ktoré
sa majú digitalizovat', na pevný podklad pri špeciálne prispôsobenom
osvetlení.
• Zorganizujte cvičenie špecialistom na digitálne fotografovanie - rozdiel
medzi obrázkami zhotovenými amatérom a tými istými fotografiami
zhotovenými profesionálom môže byť obrovský.
• Vytvorte také pozadie, aby dokument/predmet na ňom vynikal.
• Zabráňte zmenám svetelných podmienok medzi jednotlivými zábermi
medzi obrazmi rôznych častí alebo strán dokumentu/objektu - toto môže
viesť k mylným dojmom z variácie farieb.
• Používajte apochromatické šošovky a vhodné filtre, aby nedošlo k
nesprávnej registrácii farieb a skresleniu obrazu.
Poznámky/komentáre
Stúpajúce používanie digitálnych kamier/fotoaparátov v digitalizácii odráža ich
dostupnosť ako všeobecne rozšírený konzumentský produkt s klesajúcou cenou.
Stále však zostáva veľký rozdiel v cene aj kvalite medzi profesionálnymi
44
digitálnymi kamerami/fotoaparátmi a masovo vyrábanými konzumentskými
produktmi.
3.15.3 SOFTVÉROVÉ APLIKÁCIE NA OPTICKÉ ROZOZNÁVANIE ZNAKOV (OCR)
Definícia problému
Mnohé projekty digitalizácie zahŕňajú digitalizáciu tlačených dokumentov, akými
sú knihy a noviny. To sa odohráva v tandeme s využívaním skenerov, aj keď nie
výlučne. Používanie softvéru na optické rozoznávanie znakov (OCR) je
populárnym spôsobom extrakcie informácií zo naskenovaných informácií a
otvorenia možností spracovania informácií. Softvér OCR rozoznáva písmená
a číslice, ktoré vytvárajú naskenovaný obraz (obrazový súbor s mapovanými
bitmi), a exportuje ich ako textové súbory ASCII namiesto obrazových súborov.
To umožňuje vykonať vyhľadávanie, indexovanie, konverzie formát a iné
operácie na spracovanie.
Pragmatické návrhy
• Pred výberom konkrétneho produktu ohodnoťte viaceré ponúkané
riešenia na rozoznávanie znakov (OCR, optické rozoznávanie znakov). Aj
keď je softvér na OCR zahrnutý v cene skenera, výkonnejší softvér sa
typicky predáva osobitne.
• Hlavným prvkom projektu OCR je identifikácia a manuálna oprava chýb,
dvojzmyslov a miest, na ktorých sa text nedal spracovať. Balík OCR, ktorý
poskytuje rozhranie prívetivé k používateľovi vykonávajúcemu túto úlohu,
ušetrí čas a úsilie.
• OCR pracuje najlepšie pri dokumentoch v dobrom stave - skladané,
pokrčené a vyblednuté zdrojové materiály zvýšia počet chýb v procese
OCR. Aby ku takýmto chybám nedochádzalo, zdrojový materiál by sa mal
vopred ošetriť. Pri materiáloch, ktoré nie sú v perfektnom stave, by sa pred
použitím softvéru OCR malo zvážiť aj použitie softvéru na spracovanie
obrazu, aby sa zamedzilo strate farby a bolo možné zlepšiť kontrast.
• Pri výbere softvéru OCR je nutné zistiť, či v balíku OCR je súčasťou aj
jeho schopnosť (alebo neschopnosť) pracovať so slovníkmi v jazyku
zdrojového materiálu.
Poznámky/komentáre
Medzi relevantné produkty na trhu patria:
• OmniPage
• TextBridge
• Adobe Capture
• Abby FineReader - má vynikajúcu funkčnosť vykonávania úprav a
rozpoznávania chýb
• Transkribus (rozpoznávanie rukopisných a historických textov)
45
3.16 Metaúdaje (metadáta)1
Oblasť metaúdajov je jedna z najaktívnejšie skúmaných a najdynamickejších
v celej oblasti digitalizácie, rovnako aj v oblastiach, akými je informačný
prieskum, vyhľadávanie na Webe, výmena údajov, integrácia podnikových
aplikácií, atď.
Vybraný model metaúdajov je obzvlášť dôležitý, nakoľko ovplyvňuje výber
atribútov na opísanie objektu.
3.16.1 METAÚDAJE POUŽITÉ PRE OPIS PREDMETU (DESKRIPTÍVNE METADÁTA)
Definícia problému
Pred výberom modelu metaúdajov pre projekt digitalizácie by sa mal skontrolovať
materiál opísaný prostredníctvom príslušných metaúdajov. Umožní sa tak
identifikácia existujúcich metaúdajových modelov, rovnako aj určenie všetkých
nepokrytých aspektov a nedostatkov pri porovnaní existujúceho metaúdajového
modelu s metaúdajmi potrebnými pre váš projekt.
Pragmatické návrhy
• Použitie vhodných metaúdajov je veľmi dôležité pre to, aby bolo možné
nájsť a získať materiál z digitálnych zbierok. Ide viac o prípad, kedy je
celkovým zámerom vyhľadávanie vo viacerých zbierkach uložených na
rôznych miestach (logické súborné katalógy, virtuálně kombinované
múzeá atď.).
• Existuje niekoľko modelov metaúdajov. Preto si musí každý projekt vybrať
model metaúdajov v súlade s jeho cieľmi. Odporúča sa, aby sa nevytváral
nový model, len pokiaľ požiadavkám projektu nevyhovuje žiaden z
existujúcich štandardov.
• Dobrou investíciou je čas strávený modelovaním dôležitých charakteristík
digitalizovaného materiálu a identifikácia jeho kľúčových atribútov. Takýto
model možno porovnať s rozsahom a vlastnosťami existujúcich modelov
metaúdajov.
• Mali by sa identifikovať príslušné riadené slovníky (napr. na miestopis
alebo popis umelca).
• Už existuje niekoľko takýchto slovníkov, ktoré môžu vo veľkej miere zvýšiť
úspešnosť vyhľadávaní.
Poznámky/komentáre
1
Day, Michael. IMPACT Best Practice Guide: Metadata for Text Digitisation & OCR. - UKOLN,
University of Bath. Dostupne: http://www.impact-proiect.eu/uploads/media/IMPACT-metadatabpq-pilot-1
.pdf
46
Projekt Making of America II (Kongresová knižnica USA) použil tri kategórie
metaúdajov:
• Deskriptívne - na účely opisu a identifikácie informácií
• Štrukturálne - na účely navigácie a prezentácie
• Administratívne - na účely riadenia a spracovania
Osobitný význam majú metaúdajové modely, ktoré sa majú vybrať pre projekt
digitalizácie - ide rozhodnutie o tom, ktoré množiny atribútov sa použijú na
charakterizáciu diel a dokumentov/objektov, ktoré sa majú digitalizovat', a
výsledných obrazov, na opis spracovania, techník a technológie a na riadenie
práv.
Národná knižnica Austrálie má na toto silný model. Existencia širokého spektra
existujúcich modelov a konkurenčných štandardov pre metaúdaje spôsobila, že
sa mnohé projekty zameriavali čisto len na preklad z jedného štandardu do
druhého.
3.17 Vyhovujúce štandardy pre metaúdaje
Definícia problému
Pre metaúdaje už existujú určité dôležité štandardy. V bibliografickej doméne (a
v zvyšujúcej sa miere aj v kultúrnej neknihovníckej doméne) má veľký význam
štandard Dublin Core (Dublinské jadro).
Pragmatické návrhy
• Pred vytvorením vlastného modelu si preštudujte existujúce štandardy a
modely pre metaúdaje
• Vyhnite sa vytváraniu nového modelu metaúdajov pre kultúrne zbierky.
• Je pravdepodobné, že pre projekt digitalizácie budú relevantné modely
metaúdajov, ktoré sú výsledkom práce na podobných projektoch. Medzi
projektmi v oblasti kultúry sa modely metaúdajov prenášajú dobre.
• Do modelu metaúdajov by sa mali zahrnúť polia Dublin Core, pokiaľ
neexistuje rozumný dôvod neurobiť tak. Aj keď múzeá môžu zistiť, že ich
zbierkam lepšie vyhovuje model CIMI, mal by sa sledovať cieľ existencie
spoločnej jadrovej množiny atribútov, ktorá umožní vyhľadávanie vo
viacerých zbierkach súčasne.
• Ak sa má použiť súkromne vytvorený model metaúdajov, mal by sa
vyvinúť spôsob mapovania prvkov tohto modelu do Dublin Core.
• Aj keď sú schémy prideľovania názvov alebo národné konvencie
pomenúvania užitočné, úplný model metaúdajov je lepší, aj ohľadom
množstva údajov o dokumente/predmete a na umožnenie výkonnejšieho
vyhľadávania a spolupráce s inými projektmi a inými krajinami.
Poznámky/komentáre
Existuje ohromný počet existujúcich štandardov, ktoré pokrývajú rôzne aspekty
metaúdajov. Medzi jednotlivými štandardmi je však veľké prekrývanie a veľmi
veľké množstvo modelov špecifických pre inštitúcie, pri tvorbe ktorých sa
zanedbali rezortné alebo medzidoménové modely.
47
3.17.1 ZVEREJNENIE
V tejto fáze projektu sa vytvoril a zálohoval/uložil originálny digitálny materiál. Bol
identifikovaný vyhovujúci metaúdajový model a vytvorili sa metaúdaje súvisiace
s každým artiklom.
Príprava na zverejnenie zahŕňa spracovanie novo vzniknutého materiálu ešte
pred zverejnením. Zverejnenie typicky znamená vystavenie na internete
a spracovanie znamená typicky redukciu kvality obrazu/zvuku/videozáznamu,
kvôli tomu, aby sa prispôsobili prevádzkovým podmienkam na internete.
3.18 Spracovanie obrazu
Definícia problému
Súbory TIFF vytvorené počas procesu digitalizácie sú typicky veľmi veľké (až
niekoľko desiatok megabajtov). Takéto súbory nie sú vhodné na zverejnenie na
internete kvôli dlhému času, ktorý je potrebný na prevzatie obrazu koncovým
používateľom.
Pragmantické návrhy
• Vytvorte doručiteľné verzie matričného materiálu. Musí existovať
minimálne jedna doručiteľná verzia. Môže byť užitočné vytvoriť aj druhú
verziu 'miniatúru, náhľad', čo závisí od architektúry webového sídla, na
ktorom sa má materiál verejne sprístupniť.
• Doručiteľné verzie sa vytvárajú otvorením matričného súboru TIFF v
softvéri na spracovanie obrazu a jeho exportom vo formáte JPEG, PNG.
• Farebné rozlíšenie sa môže zredukovať na 256 farieb. Ak pri takomto
rozlíšení dochádza k značnej strate kvality môže sa použiť vyššie
rozlíšenie pre farbu.
• Výber správneho farebného rozlíšenia zvyčajne vyžaduje subjektívne
rozhodnutie.
• Obraz vytvorený pri rozlíšení 72 DPI približne ukáže jeho pôvodnú veľkosť
na mnohých počítačových monitoroch. Preto je rozlíšenie 72DPI
rozumnou voľbou pre mnohé obrazy, ktoré sa majú prezerať cez
obrazovku. Pre nižšie rozlíšenia bude potrebné subjektívne rozhodnutie
ohľadom 'prijateľnej kvality'.
• Výber formátu súborov, farebného rozlíšenia a bodového rozlíšenia
zahŕňa rozhodnutie o tom, čo je 'prijateľná' kvalita. Medzi kvalitou a
veľkosťou súborov je potrebné nájsť rovnováhu.
• Vo všeobecnosti by všetky obrazové súbory na webstránke nemali
presahovať veľkosť 100 kilobajtov. Môžu sa publikovať aj väčšie súbory;
mali by však byť prístupné cez linku z webovskej stránky s upozornením,
že ich získanie môže trvať dlhšie.
• Pokiaľ materiál nie je určený na spúšťanie cez sieť (streaming), video a
audio materiál má typicky väčšie súbory, pričom súbor sa preberie pred
jeho prezretím/vypočutím v režime offline.
48
• Čas na preberanie môže byť ovplyvnený zmenou počtu obrázkov
(okienok) na sekundu pri video materiále, vzorkovacou rýchlosťou pri
audio materiále atď.
Tabulka 3 Použitie archívneho nekomprmovaného formátu TIFF (RAW)
TIFF master
Type of document File for­
mat
Colour Optical resolution
Graphic material
(Photography, Prints,
Drawings, Paintings,
Posters, Maps, Geographic
Maps...)
TIFF 6.0,
uncompres­
sed
Colour profile "Adobe
RGB" to 24 bit (S bits per
channel).
For documents requiring
the highest quality:
Colour profile "ProPhoto
RGB) to 43 bit (16 per
channel)
Format up to A4: 600 dpi. Larger than
A4: 400 dpi. For large and small
formats, adjust the resolution in order
to get the best results
Books, journals and
manuscripts, rare
or valuable (e.g.
illustrated or painted)
or with poor
readability (faded
characters, law
contrast, margin
notes in pencil,
stained)
TIFF 6.0,
uncompres­
sed
Colour profile "Adobe
RGB" to 24 bit (8 bits per
channel).
For documents requiring
the highest quality:
Colour profile "ProPhoto
RGB" to 48 bit (1S per
channel)
Format up to A4: 600 dpi. Larger than
A4: 400 dpi. For large and small
formats, adjust the resolution in order
to get the best results
Books, journals,
manuscripts, typed
and mimeographed,
not rare nor
valuable, easily
readable
TIFF 6.0,
uncompres­
sed
Colour Profile "Adobe
RGB" to 24-bit (8 bits per
channel) or to 16-bit
grayscale
Format up to A4: 400 dpi. Larger than
A4: 300 dpi. For large and small
sizes, adjust the resolution in order to
get the best results
Negatives, Black
and White Slides
TIFF 6.0,
uncompres­
sed
1 S-bit greyscale From 35 mm to 10x12 cm: 800-2800
with a resolution based on 4000
pixels on the longest side.
From 10x12 to 20x25 cm: 800-1200
with a resolution based on 6000
pixels on the longest side.
> 20x25 cm: 800 with a resolution
based on 8000 pixels on the longest
side.
Negatives, Colour
Slides
TIFF 6.0,
uncompres­
sed
Colour profile "Adobe
RGB" to 24 bit (8 bits per
channel).
For docu ment requiring
the highest quality:
Colour profile "ProPhoto
RGB" to 48 bit (18 per
channel)
From 35 mm to 10x12 cm: 800-2800
with a resolution based on 4000
pixels along the long side.
From 10x12 to 20x25 cm: 800-1200
with a resolution based on 6000
pixels along the long side.
> 20x25 cm: 800 with a resolution
based on 8000 pixels on the longest
side.
49
Tabuľka 4 Použitie formátu na deriváty obsahu vysokokvalitný formát JPEG
High-quality JPEG
Type of File format Size Optical reso­ Use
document lution
All docu­ JPEG com­ The same of sRGB colour 300 dpi For highments
in pressed a1 the master profile definition
the Master best quality viewing of
File Table (100%) images in
Phaidra. It can
be adopted for
maps and
other objects
requiring
viewing of
small details.
Tabuľka 5 Použitie formátu JPEG stdrednej kvality
Medium quality JPEG
Type of File format Size Colour Optical reso­ Use
document lution
All docu­ JPEG com­ Approximate! Colour profile 300 dpi For average
ments in the pressed at y 2400 pixels sRGB IEC- quality printing or
Master File 1he best on the 61966-2.1 uploading to
TableCom- quality longest and depth of Phaidra
pressed (100%) sideColour 24 bits (8 bits
JPEG at the profile Adobe per channel)
best quality RGB (1998)
(100%) and depth of
24 bits (3 bits
per channel)
Tabulka 6 Použitie formátu JPEG nízkej kvality
Low quality JPEG
Type of
document
File format Size Optical reso­
lution
Use
All documents
in
the Master
File Table
J P E G compressed
at a
quality between
90%
and 100%
Between
1200 and
1500 pixels
on the
longest side
sRGB colour
profile
150 dpi For uploading to
Phaidra
Poznámky/komentáre
Rozhodnutie ohľadom spracovania obrazu závisia vo veľkej miere na osobnom
zvážení. Tu uvedené predpisy môžu byť pre niekoho príliš striktné, pre iného
voľné, čo sa odvíja od projektu a koncových používateľov.
50
Softvér na spracovanie obrazu ako Paint alebo Paintshop je voľne dostupný na
Internete. Ďalšie softvérové nástroje na spracovanie obrazu môžu ušetriť čas
a úsilie a podľa toho je potrebné zvážiť výdavky na softvér.
Voľne dostupný je aj softvér na úpravu zvuku a videa. Audio a video softvér sa
spravidla dodáva na spracovanie vytvorených údajov spolu s príslušným
hardvérom.
3.18.1 TROJROZMERNÉ MATERIÁLY A VIRTUÁLNA REALITA
Definícia problému
Predpisy o zverejnení obrazov nie sú priamo aplikovateľné na digitálne
prevedenie materiálu virtuálnej reality a v trojrozmerné materiály. V súvislosti s
prezentáciou na internete je dôležitá rovnováha medzi kvalitou a veľkosťou
súboru.
Pragmatické návrhy
• Prehliadače trojrozmerných (3D) a VR materiálov nie sú ešte všeobecne
rozšírené spolu so sofťvérom operačného systému. Ide o protiklad
rozšírenia softvéru pre obraz, audio a video, ktorý je bežne zahrnutý v
softvéri Windows.
• Uistite sa, že sú k dispozícii prehliadače 3D a VR materiálu. Sprístupnite
prehliadač z toho istého sieťového miesta, na ktorom je materiál. Tým sa
predíde situácii, že softvér nebude dostupný ani z iných zdrojov.
• Pred rozhodnutím sa pre nejaký prehliadač ohodnoťte viaceré.
Kompatibilita formátov súborov a prehliadačov nie je štandardizovaná do
takej miery, ako pri statických obrazoch.
• Moderné PC s úpravou pre hry majú hardvérové akcelerátory a vyššiu
grafickú pamäť, čo má významný vplyv na zážitok z pobytu vo virtuálnej
realite.
Poznámky/komentáre
VRML prehliadač, ktorý sa úspešne používa v jednom z referenčných projektoch
(írsky projekt ACTIVATE) je prehliadač Blaxxun Contact.
3.19 On-line zverejnenie
Definícia problému
Mnohé projekty digitalizácie v oblasti kultúry vedú k vytvoreniu on-line kultúrnych
zdrojov, zvyčajne ide o web sídlo s obrazmi, metaúdajmi, trojrozmernými
artefaktmi atď. Môže ísť od sídel s jednoduchým obsahom až po zložité
softvérom ovládané portály a nástroje na prezeranie. V tejto príručke je len
niekoľko odporúčaní ohľadom tvorby web sídel, nakoľko vyžaduje rozsiahle
vedomosti. Na stránke projektu Minerva je možné nájsť odkazy na príklady
najlepších postupov nominovaných partnermi projektu Minerva.
Pragmatické návrhy
• Vo webových sídlach by mala byť ľahká navigácia - odvšadiaľ by mala
viesť linka na úvodnú stránku alebo obsah.
51
• Náležitá pozornosť sa musí venovať univerzálnemu prístupu a využívaniu
web stránok slabozrakými a inými hendikepovanými osobami.
• Webové stránky by mali byť dostatočne krátke, aby ich používateľ
nemusel veľa rolovať.
• Obrázky by mali byť dostatočne malé na to, aby nenarušovali zážitky pri
prezeraní.
• Väčšie obrazy by sa mali byť prepojené z webových stránok s poznámkou,
že obraz je veľký a preberanie môže byť pomalé.
• K používaniu animácií, vysúvacích prvkov (pop-ups), flashových
programov a podobných technológií by sa malo pristupovať s
obozretnosťou. Musí byť možné obísť dlhé úvodné animované sekvencie.
• Webové sídla by mali byť v ideálnom prípade viacjazyčné, pričom by sa
mal podporovať domáci jazyk a jeden alebo dva iné jazyky (spravidla
anglický jazyk, ktorý je de facto jazykový štandard on-line zdrojov).
• Prepojenia na externé zdroje by sa mali overovať denne, aby sa
minimalizoval výskyt mŕtvych liniek a s nimi súvisiace mrzutosti.
Poznámky/komentáre
Samotný proces sprístupnenia materiálu na Webe je najširšie chápaný
a zdokumentovaný. Táto príručka neposkytuje inštrukcie o tom, ako vytvárať
webové sídla, programovať v HTML, budovať databázy prístupné cez Web
a vykonávať dálšie úlohy, ktoré sú potrebné na tvorbu a údržbu web prezentácií.
Očakáva sa. Že mnohé z kultúrnych inštitúcií, Ktoré využívajú tieto odporúčania,
budú mať už k dispozícii nejaký web server, ktorý využijú pri ich projekte
digitalizácie.
52
4 TECHNOLOGICKÉ ASPEKTY PROCESU DIGITALIZACE
Schéma procesu masovej digitalizácie viazaných tlačených dokumentov
Process Chart
last changed : 20.01.2009
Obrázok 2 Schéma procesov v projekte digitalizácie menšieho rozsahu aj s prihliadnutím komerčné
využitie
4.1.1 KONVERZIA (PŘEVOD)
Digitální obraz je „elektronická fotografie" mapovaná jako sada obrazových
prvků (pixelů), ktoré jsou auspořádány podle předdefinovaného poměru sloupců
a řádků.
Počet pixelů v daném poli definuje rozlišení obrázku.
Každý pixel má danou tonální hodnotu v závislosti na úroveň světla
odrážejícího se od zdrojového dokumentu k zařízení s nábojem spojeným se
zařízením (CCD) se světelnou citlivostí diody. Když jsou vystaveni světlu,
vytvářejí proporcionální elektrický náboj, který prostřednictvím
analogově/digitální konverze generuje řadu digitálních signálů
reprezentovaných v binární kód.
Nejmenší jednotka dat uložená v počítači se nazývá bit (binární číslice). Počet
bitů použitých k reprezentaci každého pixelu v obrázku určuje počet barev nebo
odstíny šedé, které lze znázornit v digitálním obrazu. Tomu se říká bitová
hloubka.
Digitální obrazy jsou také známé jako bit-mapované obrázky nebo rastrové
obrázky, které je oddělují od jiných typů elektronických souborů, jako jsou
vektorové soubory, ve kterých jsou grafické informace kódovány jako
matematické vzorce představující čáry a křivky.
Zdrojové dokumenty jsou skenerem nebo digitálním fotoaparátem
transformovány do bitmapových obrázků. Během snímání obrázků jsou tyto
dokumenty "čteny" nebo skenovány v předdefinovaném rozlišení a bitové
hloubce. Výsledné digitální soubory, obsahující binární číslice (bity) pro každý
53
pixel, jsou pak formátovány a označeny způsobem, který usnadňuje jejich
ukládání a načítání v počítači. Z těchto souborů může počítač vytvářet
analogové reprezentace pro zobrazení na obrazovce nebo tisk.
Protože soubory s obrázky s vysokým rozlišením jsou velmi velké, může být
nutné zmenšit velikost souboru (komprese), aby byly spravovatelnější pro
počítač i pro uživatele.
Po naskenování zdrojového dokumentu jsou všechna data převedena do
konkrétního formátu souboru pro úložný prostor.
Na trhu existuje řada široce používaných obrazových formátů. Některé z nich
jsou určeny jak pro skladování, tak pro kompresi.
Obrazové soubory také obsahují technické informace uložené voblast souboru
nazvaná „záhlaví" obrázku.
Cílem každého digitalizačního programu by mělo být zachytit a prezentovat v
digitálních formátech významný informační obsah obsažený v jediném
zdrojovém dokumentu nebo ve sbírce dokumentů.
Pro zachycení důležitých částí má hodnocení kvality digitálních obrázků být
založeno na porovnání mezi těmito digitálními obrázky a původními zdrojovými
dokumenty, které mají být převedeny, nikoli na nějaký vágně definovaný
koncept toho, co je dost dobré, aby sloužil pro okamžité potřeby.
Řešením však není zachytit obraz za každou cenu v co nejvyšší možné kvalitě
možné, ale přizpůsobit proces převodu informačnímu obsahu originálu.
To vyvolává dvě otázky: (1) atributy zdrojových dokumentů, které mají být
digitalizovány a (2) kvalita obrazu.
4.1.2 A TRIBUTY ZDROJOVÉHO DOKUMENTU
Obrázok 3 Ilustračný obrázok. Čítajúci, skenujúci a transkribujúci robot
Při zachycení je třeba vzít v úvahu jednak technické procesy související s
digitalizací a jednak atributy zdrojových dokumentů.
Zdrojové dokumenty mohou mít různé rozměry a tónový rozsah (barvnost nebo
černá a bílá). Zdrojové dokumenty lze také charakterizovat pomocí způsobů,
54
jakým byly vytvořeny: ručně (inkoustem), psacím strojem nebo tiskárnou nebo
pomocí fotografické nebo elektronické metody.
Fyzický stav zdrojových dokumentů může ovlivnit převod různými způsoby.
Blednutí textu, razmazaný inkoust, spálené stránky a další druhy poškození
někdy ničí také informační obsah a častěji představují fyzická omezení
zaznamenání informací během skenování.
Proto je třeba provést před skenováním důkladnou kontrolu zdroje a posouzení
stavu dokumentu. Zanedbání této kontroly může být nejen ohrožením
dokumentů, ale může také omezit přínosy a výsledky digitalizace a zvýšit
náklady. Tomu možno zabránit například provedením předběžné základní
ochrany, ošetření a použití kolébek na knihy pro vázané dokumenty a vykonat
rutiny k ovládání osvětlení a dalších okolních podmínek během skenování.
Pokud mají zdrojové dokumenty uměleckou nebo jinou hodnotu, musí
dokument před skenováním zkontrolovat konzervátor. Jsou-li rizika poškození
zdrojových dokumentů vysoká a dokumenty jsou zvláštní hodnoty nebo ve
špatném stavu, může být někdy lepší skenovat z filmových meziproduktů místo
z původních dokumentů, pokud je takový film k dispozici.
210x297
Obrázok 4 Štandardné formáty papiera
4.1.3 KVALITA OBRAZU
Kvalitu obrazu při snímání lze definovat jako kumulativní výsledek rozlišení
skenování, bitová hloubka naskenovaného obrázku, použité procesy vylepšení
a komprese, použité skenovací zařízení nebo technika a dovednost
skenovacího operátora.
4.1.4 ROZLIŠENÍ
Rozlišení je určeno počtem pixelů použitých k prezentaci obrázku, vyjádřených
v bodkách na palec (dpi) nebo pixelů na palec (ppi).
Zvýšení počtu pixelů použitých k pořízení snímku bude mít za následek vyšší
rozlišení a větší schopnost rozpoznání jemných detailů, ale pouze samotné
zvyšování rozlišení nebude mít za následek lepší kvalitu, pouze ve větší
velikosti souboru.
Klíčovým problémem je určit okamžik, kdy je použité rozlišení dostatečné k
zachycení všech důležitých podrobností ze zdrojového dokumentu.
55
Při určování rozlišení je důležitá také fyzická velikost zdrojového dokumentu.
Čím větší jsou rozměry dokumentu, tím je potřeba počet pixelů potřebných k
zachycení podrobnosti v něm také větší a stejně se zvětšuje velikost souboru.
Velké soubory mohou uživatelům způsobit problémy při prohlížení obrázků na
obrazovce nebo při jejich odesílání přes sítě, protože velikost souboru má
důležitý dopad na čas potřebný k zobrazení obrázku. Jeden způsob, jak
zmenšit souborvelikost znamená snížení rozlišení. Jedná se o kritické
rozhodnutí, zejména pokud zdrojový dokument má velkou fyzickou velikost s
žádá se vysoká úroveň detailů, což může být případ nadměrných rozměrů
mapy a kresby (grafika).
4.1.5 BITOVÁ HLOUBKA
Bitová hloubka je vyjádření počtu bitů použitých k definování každého pixelu.
Čím větší je použitá bitová hloubka, tím větší je počet šedých a barevných tónů,
které lze reprezentovat.
Existujítři druhy skenování (digitální vzorkování):
• bitonální skenování pomocí jednoho bitu na pixel pro reprezentaci černé nebo
bílé
• skenování ve stupních šedi pomocí více bitů na pixel pro znázornění odstínů
šedé; preferovaná úroveň šedé stupnice je 8 bitů na pixel a na této úrovni
zobrazení si obrázek může vybrat ze 256 různých úrovní šedé.
• barevné skenování pomocí více bitů na pixel pro reprezentaci barev; 24 bitů
na pixel jenazývá skutečnou úroveň barev a umožňuje výběr ze 16,7 milionu
barev.
Volba bitové hloubky ovlivňuje možnost zachycení jak fyzického vzhledu, tak
informační obsah zdrojového dokumentu. Proto musí být přijata rozhodnutí o
bitové hloubce do úvahy, zda fyzický vzhled dokumentu nebo jeho části mají
přidanou informační hodnotu a musí být zachycen. To může být, když má být
účel digitalizačního projektu vytvářet faximile (věrná kopie) zdrojových
dokumentů.
4.1.6 PROCESY VYLEPŠENÍ OBRAZU
Procesy vylepšení obrazu lze použít ke změně nebo zlepšení zachycení obrazu
změnou velikosti, barvy, kontrastu a jasu, nebo porovnat a analyzovat obrázky
pro vlastnosti, které lidské oko nemůže vnímat. Tím se otevírá mnoho nových
možností pro zpracování obrázků. Ale použití takových procesů může způsobit
těžkosti ohledně věrnosti a autentičnosti originálu. Mezi funkce zpracování
obrazu patří například použití filtrů, tonální reprodukce křivky a nástroje pro
správu barev.
4.1.7 KOMPRESE
Komprese se obvykle používá ke snížení velikosti souboru pro zpracování,
ukládání a přenos digitálních obrázků. Používané metody jsou například
zkrácení opakovaných informací nebo vyloučení informace, které lidské oko
těžko s vidí. Kvalita obrazu tedy může být ovlivněna použitými kompresními
technikami a aplikovanou úrovní komprese. Kompresní techniky mohou být buď
„méně ztrátové", což znamená, že dekomprimovaný obraz bude identický s
56
jeho dřívějším stavem, protože při velikosti souboru nebudou žádné informace
redukovány nebo „ztrátové", je-li v nich zlikvidována nejméně významná
informace. Obecně se komprese „bez ztráty" používá pro hlavní soubory
(masters) a techniky „ztráty"pro uživatelský přístup k souborům.
Je důležité si uvědomit, že obrázky mohou reagovat na kompresi různě. Mohou
vytvářet zvláštní druhy vizuálních charakteristik, jako jsou jemné tónové variace
a nezamýšlené vizuální efekty. Digitální obrazy reprodukované z fotografických
formátů mají obvykle široký rozsah tónů a výsledkem jsou velké soubory.
Další technikou kromě komprese, kterou lze použít ke zmenšení
souboruvelikost je omezit prostorovou dimenzi digitálního obrazu. To lze
provést, když je obraz zamýšlen spíše jako archivní reprodukce než věrná
faximilná náhrada originálu.
4.1.8 POUŽITÉ ZAŘÍZENÍ A JEHO VÝKON
Použité zařízení a jeho výkon mají důležitý dopad na kvalitu obrazu. Zařízení
od různých výrobců mohou fungovat odlišně, i když deklarují podobné nebo
stejné technické schopnosti.
4.1.9 KVALITA OPERÁTORA
Schopnosti a péče operátora mají vždy významný dopad na kvalitu obrazu.
Nakonec je důležité vždy rozhodnutí lidí, rozhodujících o tom, jaké kvality bude
dosaženo.
4.1.10 DOPORUČENÍ PRO SKENOVANÍ (KONVERZI, PŘEVOD)
Průvodce deseti kroky k zajištění dobrého procesu převodu:
1. Používejte skenery, které vyhovují pro:
• fyzické rozměry zdrojových dokumentů
• druh média (průhledný nebo reflexní)
• rozsah podrobností, tónů a barev přítomných v dokumentech
• fyzický stav dokumentů
2. Pečlivě zkontrolujte všechny požadavky na zvláštní zacházení nebo
zachování zdrojového dokumentu ještě před skenováním
3. Vyberte rozlišení, které bude dostatečné k zachycení nejjemnějších
významných detailů zdrojových dokumentů, které mají být skenovány.
Zkontrolujte, zda rozlišení neomezuje zamýšlené použití digitálních obrázků.
Nastavte rozlišení na zvolená úroveň pro celou skupinu zdrojových dokumentů,
aby se zabránilo nutnosti opakovaného přestavování zařízení pro jednotlivé
dokumenty (vytvořit technologické třídy a nastavit skener podle tříd)
4. Vyberte bitovou hloubku, která je v souladu s vlastnostmi dokumentu a na
úrovni nezbytné pro přenos informačního obsahu:
• bitonální skenovaní textových dokumentů sestávajících z černého
obrazu na bílém papíře;
57
• ve stupních šedi (8bitů) skenování dokumentů obsahujících významné
informace ve stupních šedi (včetně tužkové zápisy a anotace v textu) a
pro fotografické materiály;
• barevné skenování pro dokumenty obsahující barevné informace,
zejména pro dosáhnutí vysoce kvalitních digitálních kopií.
5. Opatrně používejte procesy vylepšení obrazu a všechny tyto použité procesy
pečlivě dokumentujte
6. Použijte „bezeztrátové" standardní techniky komprese pro hlavní soubory
(master) a pro přístup k objektům, když je potřeba. To například znamená:
• pro kompresi: ITU Group 3 nebo 4 a JBIG (binární obrazy), bezeztrátové
kompresně techniky JPEG/JPEG 2000 nebo LZW (vícebitové obrázky)
• pro výměnu: bezeztrátové JPEG/JPEG 2000, TIFF 5 nebo novější verze
7. Zkuste pečlivým testováním přístupových souborů najít rovnováhu mezi
přijatelným kvaliním vizuálním vzhledem pro uživatele a velikostí souboru
8. Chcete-li získat stabilní výkon z používaného zařízení, pečlivě prozkoumejte
požadavky výrobců na systémové schopnosti a reference uživatelů
9. Použijte standardy pro hodnocení kvality digitálního obrazu
10. Implementujte program nepřetržité kontroly kvality, aby ste ověřili
konzistenci výstupů jednotlivých operátorů skenování.
4.2 Vytváření pracovního prostředí pro projekt digitálního
zobrazování
Spuštění projektu digitálního zobrazování znamená a) respektování
a předvídání potřeb známých a potenciálních uživatelů b) technologickou
infrastrukturu použitou v projektu a c) požadavky na dostupné lidské a finanční
zdroje.
Technologické možnosti zařízení pro snímání obrazu a volba pracovních stanic
(skenery nebo digitální fotoaparáty, operační systémy, interní paměť, úložiště,
kvalita zobrazení, síťové schopnosti a rychlosti) musí být jasné před zahájením
projektu. Známé musejí být také prostředky poskytování obrazových dat
uživatelům.
Analýza technických potřeb projektu digitálního zobrazování se obvykle provádí
v v rámci pilotního projektu nebo studie. Ty dávají projektu šanci prozkoumat v
malém měřítku proveditelnost (1) uskutečnění plánů a (2) zavedení digitální
technologie do knihovny nebo archivu, pokud se jedná o první projekt
digitalizace dané instituce.
Technické potřeby se zaměřují především na hardware a software.
Pořízení zařízení by mělo rovněž zahrnovat smlouvu o údržbě na minimálně tři
a možná i pět let. Obecně se předpokládá, že po třech letech zařízení bude
vyžadovat upgrade a po pěti letech bude zastaralý a musí být vyměněn.
Výběr softwaru by měl být založen na seriózním zvážení otevřeného zdroje (tj.
Open source). Podpora open source softwaru za podmínek GNU General
Public Licence vytváří komunitu uživatelů digitálních knihoven nezávislou na
58
tržních silách a řeší zastarávání tam, kde není možné udržovat drahé licenční
struktury připojené a komerční produkty.
4.3 Názvové a identifikačné konvencie
Všeobecne bude názov každého súboru zapísaný ako reťazec znakov zložený
z niekoľkých častí, ktoré obsahujú informácie potrebné na jednoznačnú
identifikáciu dokumentu, ku ktorému sa vzťahuje digitálny obraz.
Názvy súborov budú doplnené príslušnou príponou (tif, jpg, pdf, xml). V
hromadnom úložisku budú obrazové súbory usporiadané do viacerých
priečinkov, aby sa zachoval celkový obsah materiálov. Nomenklatúra priečinkov
a súborov je reťazec spojovníkom (-) oddelených polí (kód knižnice,
signatúra...). Ak signatúra obsahuje spojovník (-), medzery alebo špeciálne
znaky, nahradia sa bodkou (.).
Aby sa uľahčila kontrola kvality, odporúča sa, aby sa do priečinkov pre súbory s
adresou nezačlenili viac ako 200 obrázkov vo formáte TIF alebo viac ako 100
obrázkov, ak ide o veľkoformátové dokumenty. V týchto prípadoch sa ďalej delí
priečinok do viacerých, postupne očíslovaných priečinkov.
Pri grafických materiáloch a archívnych materiáloch, ktoré sú naskenované na
oboch stranách, postupujte podľa postupu číslovanie súborov ,,-r" pre pravé
(recto) a súborov ,,-v" pre ľavé (verso). V prípade kníh sú predné a zadné obaly
pomenované tak, aby sa vyskytovali v rovnakom poradí, v akom sú uvedené vo
fyzickom dokumente. Chrbát alebo iné časti pôvodného dokumentu (bloky
textu, detaily väzby ...) musia byť uvedené na konci.
The file name will followthe following schéma: "Library Code - Shelf mark - Progressive Num-
ber.extensionľľ
Example of folders structure and file name:
PUV21 -ANT. B. 1.10\TIF.Master\PUV21 -ANT. B.I. 10-0001 .tif
Obrázok 5 Schéma názvovej konvencie súborov z digitalizácie
Názov súboru obsahuje: Kód knižnice-Signatúru\Formát súboru\Kód knižniceSignatúra-Poradové
číslo obrázku s príponou
Poznámka:
59
Kód knižnice by mal byť v súlade so štandardným národným kódovníkom
knižníc alebo informačných inštitúcií (ISIL) (Napríklad Verejná knižnica
v Banskej Bystrici má kód: ISIL SK-1KACRA03919 - čo je medzinárodný
identifikátor.
Signatúra je miesto uloženia dokumentu na polici v sklade. Ak dokument nemá
signatúru, použije sa iný identifikátor dokumentu v inštitúcii (prírastkové číslo,
sigla, čiarový kód a pod.)
Čísla obrázkov a prípona formátu spravidla automaticky pridáva
k pripravenému reťazcu skener. Napr. obr0001.jpg, 0002.jpg...00150.jpg
Konvencia pre časopis: Kód knižnice-Signatúra\Rok\Formát súboru\Kód
knižnice-Signatúra-Rok-Mesiac-Deň-poradové číslo obrázka s príponou formátu
Library Code and Shelf Mark
e.g.: P U V 2 1 - A . 9 9 2
Year
e.g.: 2010
File format
e.g.: TIF.Master
Example of folders structure and file name:
PUV21 -A.992N2010\T IF. Mast e r\P UV21 - A . 9 9 2 - 2 0 1 0 - 1 2 - 2 4 - 0 0 0 1 .jpg
Obrázok 6 Schéma názvovej konvencie pre súbory z digitalizácie pre seriály
Poznámka: Rok-Mesiac-Deň (vydania časopisu) môže byž aj podľa štandardu
RRRRMMDD a potom poradové číslo obrázka s príponou formátu
60
4.4 Príklady dostupných open-source repozitov pre digitálne
knižnice
4.4.1 ISLANDORA 8
(https://islandora.ca/islandora8).
Islandora 8 (predtým Islandora CLAW) je nová generácia Islandory. Tento
významný upgrade Islandora 8 je compatibilný s Drupal 82
(to je redakčný
systém) a Fedora 53
4.4.2 DSPACE
https://duraspace.org/dspace/
DSpace je softvér určený pre akademické, neziskové a komerčné organizácie,
ktoré budujú otvorené digitálne archívy. Inštalácia „po vybalení z krabice" je
jednoduchá a ľahká a úplne prispôsobiteľná potrebám každej organizácie.
DSpace zachováva a umožňuje jednoduchý a otvorený prístup ku všetkým
typom digitálneho obsahu vrátane textu, obrázkov, pohyblivých obrazov,
súborov mpeg a dátových súborov. Vdáka neustále rastúcej komunite
vývojárov sa softvér rozširuje a vylepšuje.
Drupal je oblíbený redakční systém. Je snadno rozšiřitelný pomocí modulů, a to ho činí flexibilním. Tato rozšiřitelnost
z něj dělá velmi dobrý redakční systém, který můžete použít jak pro weblog, tak pro diskusní fórum. Drupal je
naprogramovaný v jazyce PHP a využívá databázi MySQL nebo PostgreSQL.
https://www.cesky-hosting.cz/webhosting/opensource/drupal/?&aclid=Ci0KCQiw5rbsBRCFARIsAGEYRweetX3xisoZI4FPh2ei9RORk8ghRHkdLmO
-
HRfunpewuzjjPBwWkgaAqKnEALw wcB
3
Fedora je robustný, modulárny, open source repository systém určený na manažment
a šírenie digitálneho obsahu.
61
Obrázok 7 Globálna schéma systému repozitu DSpace
4.4.3 INVENIO (CERN)
https://invenio-software.org
https://invenio-software.org/showcase/
Open-source digitálny repozit rozšírený najmä vo vedeckej komunite.
4.4.4 GREENSTONE
http://www.greenstone.org
Greenstone je softvérový balík na vytváranie a distribúciu zbierok digitálnych
knižníc. Poskytuje spôsob usporiadania informácií a ich publikovania na webe
alebo na vymeniteľných médiách, ako sú DVD a USB flash disky. Greenstone
sa používa v digitálnej knižnici Nového Zélandu na Waikato University a v
mnohých iných inštitúciách; vyvíja a distribuuje sa v spolupráci s UNESCO. Je
to viacjazyčný softvér s otvoreným zdrojovým kódom, ktorý sa poskytuje na
základe podmienok Všeobecnej verejnej licencie GNU.
62
5 DIGITALIZACE STARÝCH TISKŮ
Digitalizácia starých a vzácnych tlačí si vyžaduje mimoriadnu starostlivosť. Pred
digitalizáciou je potrebné stanovisko konzervátora, ktorý odporučí, aký spôsob
skenovania je pre daný dokument najšetrnejší a či je vôbec skenovanie možné.
Pred skenovaním je potrebné dokument očistiť, podľa možností aj sterilizovať
prípadne deacidifikovať. Ak treba, musia sa vykonať aj reštaurátorské zásahy,
opravy a pod. podľa návrhu konzervátora.
Na skenovanie starých a vzácnych tlačí a viazané zväzky rukopisov sa
používajú kolísky a rôzne pomôcky. Dokument by sa nemal otvárať tak, aby sa
poškodila väzba (na 180 stupňov). Používajú sa kolísky a rôzne podložky.
Skenovanie musí prebiehať opatrne kvôli kovovým častiam, sponám, ozdobám
väzby a pod.
Skenuje sa spravidla na ručných skeneroch. Osvetlenie musí zohľadňovať stav
dokumentu. Na rôzne časti skenovania dokumentu (mapy, príväzky, prítlačky,
grafika, rytiny, iniciály, farebné ilustrácie a ozdoby) je užitočné použiť rôzne
rôzne rozlíšenie (bežne 600 dpi, pre grafiku až 1200 dpi).
Príklady práce skenerov:
https://www.youtube.com/watch?v=BSqTrn5wuEQ
https://www.voutube.com/watch?v=z5KEFRqMEc4
63
6 PRÁVNÍ ASPEKTY PROCESU DIGITALIZACE
6.1 Prá vneaspekty
Právnu situáciu je potrebné overiť pri každom objekte alebo skupine (kategórii)
objektov a práva na používanie digitálnych dokumentov by sa mali získať čo
najskôr, podľa možnosti už vo fáze plánovania.
6.2 Autorské práva (Copyrights)
Podľa zákona o autorských právach napríklad na Slovensku sú diela chránené
až 70 rokov po úmrtí autora, po ktorom sú voľne dostupné ako takzvané
"verejné domény" (§ 32 Trvanie majetkových práv) "(1) Majetkové práva trvajú
od okamihu vytvorenia diela počas autorovho života a 70 rokov po jeho smrti.
Pri spoluautorskom diele majetkové práva trvajú počas života posledného zo
spoluautorov a 70 rokov po jeho smrti. Ak je audiovizuálne dielo vytvorené ako
spoluautorské dielo, majetkové práva trvajú počas života poslednej osoby
spomedzi režiséra, autora scenára, autora dialógov a autora hudby, ktorá bola
vytvorená osobitne pre toto dielo a 70 rokov po jeho smrti."
http://www.zakonypreludi.sk/zz/2015-185#cast2
Napríklad práca zverejnená v roku 1905, ktorého autor zomrel v roku 1955, je
preto pod autorským právom do roku 2025.
6.3 Vydavateľské a licenčné zmluvy
Je potrebné overiť, či vydavateľ diela vlastní práva na jeho (dodatočné)
zverejnenie na internete. (1990, t. j. koniec systému ARPANET a prvé
nasadenie W W W v Černe vo Švajčiarsku).
Znamená to, že do roku 1990 neexistovali vydavateľské zmluvy, v ktorých by si
vydavatelia dohodli s autormi práva zverejnenia na internete. Podľa našich
skúseností sa na Slovensku podmienky zverejňovania dohodnutého diela na
internete v autorských zmluvách upravovali a upravujú len zriedka, ale prax
v tomto ohľade sa postupne mení. V prípade starších publikácií (kategória staré
a vzácne tlače a seriály) to možno vylúčiť hneď od začiatku, pretože internet
neexistoval v čase dohody medzi autorom a vydavateľom.
6.4 Copyright v knižnici podľa amerického a austrálskeho
práva
https://www.nla.gov.au/kev-exceptions-in-the-copyright-act
6.4.1 PRAKTICKÝ PRÍKLAD
Okrem niekoľkých výnimiek sa staré a vzácne tlače, ktoré boli publikované pred
rokom 1900 a na ktoré sa už nevzťahujú žiadne obmedzenia týkajúce sa
autorských práv, môžu voľne digitalizovat a sprístupňovať organizáciám i, ktoré
ich vlastnia alebo spravujú vo svojich zbierkach.
Praktický príklad - seriálové publikácie, noviny, časopisy, periodické zborníky
64
Predpokladom na zaradenie týchto dokumentov na digitalizáciu je súhlas
držiteľov autorských práv. Výnimku tvoria časopisy až do 19. storočia, kedy už
nie je možné zistiť držiteľov autorských práv.
Skúsenosti ukázali, že iba vydavatelia novších obchodných časopisov
uzatvárajú zmluvy s ich autormi. Pritom autori prenášajú plné práva na
používanie daného článku na vydavateľa (dohoda o autorských právach,
licencia). Pokiaľ ide o historický obsah, takéto jasné dohody zvyčajne neexistujú
a získanie spätného povolenia od autorov a ich potomkov prostredníctvom
správnych právnych kanálov by znamenalo neúmerné úsilie.
6.4.2 DlSPENZÁCIA S FORMÁLNYM POVOLENÍM
Pre digitalizáciu novín a časopisov je možné prijať pragmatický postup (ako
napr. vo Švajčiarsku): autorský súhlas nieje získaný, ale autor môže následne
požadovať zablokovanie alebo vymazanie jeho práce z online služby.
Tento prístup predpokladá, že držitelia autorských práv sú akademicky aktívni
ľudia alebo autori na čiastočný úväzok, ktorí podporujú ďalšie šírenie svojej práce
v záujme slobodnej vedy.
Pri on-line zverejnení akéhokoľvek materiálu musia byť vysporiadané práva
duševného vlastníctva (IPR) súvisiace s materiálom.
Materiál, ktorý je vo verejnej doméne (konkrétne napríklad staré knihy alebo
noviny, starý materiál umiestnený explicitne vo verejnej doméne) predstavuje
relatívne nízku náročnosť. Mnohé kultúrne inštitúcie však z využívania obrazov
artefaktov alebo obrazov z ich zbierok odvodzujú príjmy, preto obhajujú
copyright.
Materiál, ktorého copyright držia tretie strany, sa môže zverejniť len so súhlasom
takýchto tretích strán.
Našťastie existuje niekoľko technických možností na ochranu copyrightu
materiálu umiestneného na Internet.
6.4.3 VYTVORENIE COPYRIGHTU
Definícia problému
Prvým krokom pri skúmaní situácie súvisiacej s copyrightom pre nejaký kultúrny
dokument/predmet je stanovenie vlastníctva daného copyrightu.
Pragmatické návrhy
• Stanovte právnu situáciu s ohľadom na copyright a publikovanie v krajine,
kde sa projekt v realizuje. Každá krajina má svoje zákony o copyrighte
zvyčajne aspoň od 19. storočia. Takéto zákony sa zvyčajne vzťahujú na
všetky formy publikácií, vrátane ich on-line zverejnenia. Môžu, ale
nemusia pokrývať zákon o digitalizácii, ktorá sa môže chápať ako
archivačný proces, alebo ako kopírovanie (rozmnožovanie).
• K verejnému sprístupneniu v režime on-line by v žiadnom prípade nemalo
dôjsť pred zistením copyrightu.
• Niektoré dokumenty/predmety, napr. staré noviny, majú jasné pravidlá
copyrightu, ktorými sa riadia. Typicky je umožnené voľné kopírovanie až
65
vtedy, keď noviny dosiahnu určitý vek. Dokumenty/predmety, ktoré
spadajú do tejto kategórie, sa môžu voľne digitalizovat' a zverejniť.
• Pre dokumenty/predmety, ktorých copyright prináleží inštitúcii realizujúcej
projekt, bude požadované udeľovať interné povolenie na digitalizáciu
a on-line zverejnenie.
• Pre dokumenty/predmety, ktorých copyright drží tretia strana - napríklad
prenajímateľ alebo darca zbierky historických dokumentov/predmetov, sa
musí získať písomné povolenie tejto strany. K zverejneniu môže dôjsť až
po prijatí takéhoto rozhodnutia.
• Zaručenie povolenia digitalizovat' a zverejniť môže zahŕňať aj potrebu
platiť. Medzi výškou platby a hodnotou vyplývajúcej zo zahrnutia
relevantných dokumentov/predmetov do on-line zdroja musí byť
rovnováha
Poznámky/komentáre
Situácia týkajúca sa copyrightu sa mení z krajiny na krajinu.
6.4.4 OCHRANA COPYRIGHTU
Definícia problému
Zverejnenie dokumentov/objektov na webe je vydanie ich na voľné kopírovanie.
Nie je možné zamedziť kopírovaniu materiálu vystaveného na webe. Je však
možné zvážiť niekoľko postupov, z ktorých má každý nejaký vplyv na ochranu
copyrightu.
Pragmatické návrhy
• Stanovte, či sa copyright musí ochraňovať, alebo nie.
• S držiteľmi copyrightu sa dohodnite na postupoch, ktoré sa majú použiť
na ochranu copyrightu.
• Do úvahy prichádzajú nasledujúce postupy:
o Pridanie viditeľného vodoznaku alebo známky o copyrighte na
každý obraz.
o Pridanie neviditeľného digitálneho vodoznaku na každý obraz.
Takéto značky sa môžu použiť na dokázanie vlastníctva
'ukradnutého' obrazu, takisto aj na vystopovanie využívania obrazu
na Internete.
o Enkrypcia (šifrovanie) obrazov, pričom správny kľúč sa vydá len
registrovaným používateľom. Tým sa samozrejme zníži hodnota
on-line obrazu z pohľadu zvyšnej verejnosti.
o Obmedzenie zverejnenia len na obrazy s nízkym rozlíšením, napr.
75 DPI na prezeranie na obrazovke. Tým sa zníži úroveň použitia
obrazu v iných doménach, napr. tlač, odevy atď.
o Obmedzenie zverejnenia len na malé časti obrazu.
o Zobrazovanie obrazov len registrovaným, oprávneným členom
nejakej komunity.
66
• Preskúšajte výsledky procesu na ochranu copyrightu pomocou prvých
niekoľkých dokumentov/predmetov, aby ste sa uistili, že proces nemá
žiadne neočakávané alebo neželané následky.
Poznámky/komentáre
Prístup, ktorý je najvhodnejší pre akýkoľvek projekt, bude závisieť vo veľkej miere
od cieľov projektu a kultúrnej inštitúcie, rovnako aj od povahy materiálu.
Najčastejším riešením galérií a múzeí. Relatívna jedinečnosť kultúrnych zbierok
poskytuje v mnohých situáciách dôkaz o vlastníctve.
67
7 PROCESY PŘED A PO DIGITALIZACI (KONZERVACE, OCHRANA)
7.1 Konzervácia dokumentov (konzervovanie)
Je to odborné ošetrenie dokumentov s cieľom zachovať ich súčasný stav, resp.
zachrániť poškodené dokumenty pred zánikom. Predstavuje priamu fyzickú
ochranu zabezpečujúcu zlepšenie rizikových vlastností dokumentov (nosičov
informácie) pri zachovaní ich originality a dlhodobej stability s minimálnou
mierou rozpadu.
7.2 Reštaurovanie
Na rozdiel od konzervácie reštaurovanie predstavuje takú úpravu dokumentov,
aby sa dosiahol ich pôvodný vzhľad. Odborné ošetrenie konzerváciou sa týka
najmä tradičných nosičov, t. j. písomných dokumentov (písomného dedičstva, tj.
kníh a archívnych dokumentov, najmä starých a vzácnych tlačí, historických
rukopisov ap.).
7.3 Integrácia konzervovania a digitalizácie
Konzervovanie a konzervačná veda sa však zaoberá všetkými objektmi
kultúrneho dedičstva ako aj nosičmi digitálneho obsahu. Pri audiovizuálnych
dokumentoch (filmových dielach) sa za najvhodnejší spôsob konzervácie z
dlhodobého hľadiska pokladá pasívna konzervácia na filmových pásoch, hoci
za spôsob konzervácie sa považuje aj digitalizácia.
Digitalizácia však fakticky nemôže byť konzervačným zásahom, pretože
nezabraňuje objektívnej degradácii originálnych nosičov až po ich zánik.
Digitalizácia môže nanajvýš spomaliť poškodzovanie dokumentov ich priamym
používaním. Je ideálne, ak projekt digitalizácie zahŕňa aj konzervovanie, najmä
čistenie, sterilizáciu a deacidifikáciu. Vyplýva to z jednoduchej úvahy, že ak sa
dokument raz vyberie zo skladu, treba s ním urobiť maximum operáciu v rámci
jednej technologickej linky. To znamená, že konzervačné procesy je potrebné
zahrnúť do komplexného procesu digitalizácie.
Digitalizácia sa spravidla realizuje po konzervácii tradičných dokumentov, v
súčasnosti je však využívaná najmä pri ich sprístupnení verejnosti, čím sa
zamedzuje ich opotrebeniu. Nosiče digitalizovaných dokumentov sú však
spojené s rizikami, ktorými sú napr. zastarávanie dátových formátov,
obmedzená životnosť pamäťových zariadení a i.
Konzervácia tradičných (papierových) dokumentov je odborné ošetrenie
dokumentov konzervačnými prostriedkami s cieľom zastaviť alebo spomaliť
proces ich rozpadu. Pripúšťajú sa však iba zásahy, ktoré zabezpečujú existujúci
stav dokumentu bez akýchkoľvek doplnkov (k používaným metódam patria
deacidifikácia, sterilizácia, dezinfekcia, lyofilizácia a i.), v širšom chápaní sa
pripúšťajú aj opatrenia, ktoré sú nevyhnutné na technické zabezpečenie
fyzického stavu nosiča dokumentu (laminovanie dokumentov).
68
7.3.1 STERILIZÁCIA
Sterilizáciou a dezinfekciou dokumentov sa zabraňuje ich ďalšiemu
poškodzovaniu mikroorganizmami a predchádza sa riziku poškodenia zdravia
pri ich ďalšom spracovaní (alebo používaní).
7.3.2 DEACIDIFIKÁCIA
Významnou súčasťou procesu konzervácie dokumentov je deacidifikácia
(odkyslenie) papiera, ktorou sa upravuje jeho nevhodné nízke pH signalizujúce
jeho kyslosť, čím sa papier stabilizuje. Degradácia kyslého papiera je nevratný
termodynamický dej, ktorý môže spomaliť deacidifikácia. Kyslosť papiera na
báze drevnej celulózy je zapríčinená kyselinou sírovou, ktorá sa tvorí pri styku
oxidov síry prítomných v atmosfére s vlhkým papierom, ako aj karboxylovými
kyselinami, ktoré v ňom vznikajú pri oxidačných procesoch, ktorým časom
podlieha. Výsledky testov potvrdzujú, že papier má pomerne dobrú stálosť, ak
nemá nižšiu hodnotu pH ako 5,5, pričom všeobecne sa papier považuje za
odkyslený, keď jeho hodnota pH vzrastie na 6,2. Na neutralizáciu sa používajú
vodné roztoky a suspenzie hydroxidov, uhličitanov alebo hydrogenuhličitanov
vápnika, príp. horčíka, alebo sa dokument umiestni do plynnej atmosféry
amoniaku (krátkodobá stabilizácia).
Cieľom deacidifikácie je jednak zníženie kyslosti papiera, jednak vytvorenie
dostatočného alkalického pufru, ktorý zabráni reacidifikácii v priebehu času.
Poškodený papier možno spevniť aj pomocou spevňujúcich zmesí, ktoré sa
nanášajú štetcom alebo ponorením do roztoku. Používajú sa prírodné polyméry
(pšeničný škrob, želatína), modifikované prírodné polyméry rozpustné vo vode
(sodná soľ karboxymetylcelulózy a i.) alebo syntetické polyméry (polyvinyletanol
plastifikovaný glycerínom a i.).
7.3.3 LYOFILIZÁCIA
Lyofilizácia sa používa pri ošetrení a záchrane dokumentov postihnutých
prírodnými katastrofami (búrky, povodne). — K najvýznamnejším
konzervačným (a reštaurátorským) pracoviskám na Slovensku patrí pracovisko
Ochrany fondov Slovenskej národnej knižnice v Martine, Odbor ochrany
dokumentov Univerzitnej knižnice v Bratislave, Oddelenie ochrany archívnych
dokumentov Slovenského národného archívu v Bratislave a i. Na svete sú to
najmä: Getty Conservation Institute a Rochester Institute of Technology.
69
Obrázok 8 Schéma procesov a operácií digitalizácie v knižnici
8 OPTICKÉ ROZPOZNÁVÁNÍ OBRAZCŮ A KOREKCE CHYB
Optické rozoznávanie znakov alebo OCR (z angl. Optical Character
Recognition) je metóda umožňujúca překlad obrazu (grafiky) tlačených alebo
písaných znakov do textovej, editovateľnej formy napr. do ASCII znakov
abecedy. Typickým príkladom je zoskenovany text (čo je vlastne len obrázok
znázorňujúci text) a jeho preklad do strojovej formy použiteľnej a editovateľnej
v textovom editore. V minulosti sa využívali rôzne metódy rozoznávania znakov
napr. optické, dnes sa na tento účel používa výhradne výpočtová technika.
OCR technológie sa nepoužívajú len na rozoznávanie textu, ale napr. aj na
rozoznávanie notového zápisu, špeciálnych znakov (napr. na bankovkách pre
zvýšenie bezpečnosti), rozoznávanie správnosti podpisu a pod.
8.1 OCRsoftvér
OCR softvér je program umožňujúci rozoznanie jednotlivých znakov v texte.
Zahŕňa v sebe prvky umelej inteligencie a strojového videnia, ako
aj lingvistické prvky kontrolujúce správnosť preložených slov a viet. Od zložitosti
softvéru záleží aj presnosť výstupu. Samostatnou kapitolou sú softvéry schopné
rozoznávať rukou písaný text, obvykle vybavené schopnosťou naučiť sa formu
a štýl rukopisu, s prispôsobením na meniacemu sa sklonu a rôznej veľkosti
písma.
U OCR softvéru je obvykle potrebné nastaviť jazyk v ktorom je text napísaný,
napr. slovenčina, angličtina aby správne vyhodnotil diakritické znaky, a aby
pre výstupný text použil správny jazykový slovník. Jednoduché OCR softvéry sú
bežnou súčasťou softvérového vybavenia skenerov, alebo sa predávajú ako
samostatné produkty.
Ak má projekt aj zložku optického rozoznávania znakov (OCR), je dôležitá
voľba softvéru pre OCR. Všetky úkony spojené s OCR vyžadujú určitú dávku
ručných úprav a opráv, spôsob, akým tieto funkcie softvérový produkt
podporuje, má významný vplyv na čas a úsilie vyžadované projektom. Lepšie
balíky OCR umožňujú prehľad a úpravy najednej obrazovke, navrhujú opravy
zle prečítaných slov. podporujú rôzne spôsoby rozloženia textu a obrazov,
obsahujú mnohé slovníky a pod. Oplatí sa zhodnotenie viacerých softvérových
balíkov pre OCR, ak projekt zahŕňa viac ako jednu osobu za rok.
Medzi relevantné softvéry OCR na trhu patria najlepšie OCR softvéry (2019):
https://www.techradar.com/news/best-ocr-software
• 1. Nuance OmniPage Ultimate
• 2. Abbvy FineReader 14
. 3. Adobe Acrobat Pro P C
• 4. Readiris
. 5. TopOCR
• Transkribus (rozpoznávanie rukopisných a historických textov)
71
9 ZPŘÍSTUPŇOVÁNÍ DIGITALIZOVANÝCH DĚL
9.1 Islandom 8
(https://islandora.ca/islandora8).
Islandora 8 (predtým Islandora CLAW) je nová generácia Islandory. Tento
významný upgrade Islandora 8 je compatibilný s Drupal 84
(to je redakčný
systém) a Fedora 55
9.2 DSpace
https://duraspace.org/dspace/
DSpace je softvér určený pre akademické, neziskové a komerčné organizácie,
ktoré budujú otvorené digitálne archívy. Inštalácia „po vybalení z krabice" je
jednoduchá a ľahká a úplne prispôsobiteľná potrebám každej organizácie.
DSpace zachováva a umožňuje jednoduchý a otvorený prístup ku všetkým
typom digitálneho obsahu vrátane textu, obrázkov, pohyblivých obrazov,
súborov mpeg a dátových súborov. Vdáka neustále rastúcej komunite
vývojárov sa softvér rozširuje a vylepšuje.
9.2.1 INVENIO (CERN)
https://invenio-software.org
https://invenio-software.org/showcase/
Open-source digitálny repozit rozšírený najmä vo vedeckej komunite.
9.2.2 GREENSTONE
http://www.greenstone.org
Greenstone je softvérový balík na vytváranie a distribúciu zbierok digitálnych
knižníc. Poskytuje spôsob usporiadania informácií a ich publikovania na webe
alebo na vymeniteľných médiách, ako sú DVD a USB flash disky. Greenstone
sa používa v digitálnej knižnici Nového Zélandu na Waikato University a v
mnohých iných inštitúciách; vyvíja a distribuuje sa v spolupráci s UNESCO. Je
to viacjazyčný softvér s otvoreným zdrojovým kódom, ktorý sa poskytuje na
základe podmienok Všeobecnej verejnej licencie GNU.
Drupal je oblíbený redakční systém. Je snadno rozšiřitelný pomocí modulů, a to ho činí flexibilním. Tato rozšiřitelnost
z něj dělá velmi dobrý redakční systém, který můžete použít jak pro weblog, tak pro diskusní fórum. Drupal je
naprogramovaný v jazyce PHP a využívá databázi MySQL nebo PostgreSQL.
https://www.cesky-hosting.cz/webhosting/opensource/drupal/?&aclid=Ci0KCQiw5rbsBRCFARIsAGEYRweetX3xisoZI4FPh2ei9RORk8ghRHkdLmO
-
HRfunpewuzjjPBwWkgaAqKnEALw wcB
5
Fedora je robustný, modulárny, open source repository systém určený na manažment
a šírenie digitálneho obsahu.
72
10 STRATEGICKÉ PLÁNOVÁNÍ PROCESU DLOUHODOBÉHO UCHOVÁNÍ
DIGITÁLNÍCH DĚL
10.1 Uchovávanie a archivovanie údajov
Zbierka obrázkov pozostávajúca zo zložiek a súborov sa bude ukladať na
optické alebo magnetické pamäťové médiá, ako sú CD, DVD a externé pevné
disky. Odporúča sa ukladať údaje na dvoch rôznych nosičoch - rôznych značiek
alebo rôznych sérií - a uchovávať médiá na dvoch miestach, pravidelne ich
overovať a pravidelne prenášať údaje na nové médiá.
Životnosť pamäťového média je ovplyvnená rôznymi faktormi (normy ISO
18923: 2000 a 18925: 2013 označujú parametre pre správnu údržbu
pamäťového média).
Je nevyhnutné udržiavať veľmi starostlivo digitálne súbory vytvorené v priebehu
času, aby sa predišlo opakovaniu nákladnej práce skenovania. Preto je
potrebné zaviesť postupy, ktoré zabezpečia, aby digitálne objekty zostali
použiteľné a prístupné bez ohľadu na budúce zmeny v technológii. Použiteľnosť
a prístupnosť digitálnych objektov v čase je zaručená formátom súboru
(štandardný formát, veľkosť súboru, doba prenosu v sieti, spôsob zobrazenia
obrázkov ...), ukladaním médií a digitálnym archívom. Na uľahčenie
interoperability s inými systémami, a teda prístup k metaúdajom
prostredníctvom iných poskytovateľov služieb (napr. Europeana), je nevyhnutné
používať otvorené normy. Súbory z projektu musia byť doručené do
dohodnutého archívu a repozitu v súlade s plánom, ktorý musí byť súčasťou
projektu.
Hardvérová infrastruktura musí byť vybavená modernými systémami detekcie
zhoršenia, schopnými rýchlej zmeny a obnovy.
10.2 Dlhodobá archivácia
Pri dlhodobej archivácii je nutné sa snažiť zachovať tri základné ciele:
1. technologické uchovanie
2. technologickú emuláciu
3. migráciu údajov
Prvé dve snahy zaisťujú možnosť prístupu k digitálnemu objektu použitím
pôvodného softvéru a hardvéru alebo emuláciou pôvodného prostredia.
Pre dlhodobú archiváciu by mala byť zaistená stratégia založená na možnosti
migrácie a zahrnutá do implementácie riešenia. V tomto prípade sú
objekty/obsah migrovaný z jedného technologického prostredia do dálšieho.
Kritické body migrácie pre dlhodobú archiváciu je zachytenie metaúdajov, ktoré
sú potrebné pre podporu manažmentu obsahu a migračného procesu.
Archivácia dokumentov by mala byť zaistená na dva rôzne typy archivačného
úložiska/média a na dvoch rôznych zemepisných miestach.
73
10.3 Voľba médií
Pre dlhodobú aj krátkodobú archiváciu je veľmi dôležité mať znalosť rôznych
médií, pretože tie vyžadujú rôzne softvérové a hardvérové zariadenia pre
prístup a majú rôzne podmienky archivácie a požiadavky na uchovávanie.
Média by mali byť obnovované v pravidelnom cykle doby životnosti média
identifikovanom buď výrobcom alebo nezávislým zdrojom.
Ukážka príkladu životnosti média skladovaného pri rôznych klimatických
podmienkach (RH=relatívna vlhkosť)
Médium 25RH
10°C
30RH
15°C
40RH
20°C
50RH 25°C 50RH 28°C
D3 magnetická páska 50 rokov 25 rokov 15
rokov
3 rokov 1 rok
DLT magnetický
páskový box (magnetic
cartrige)
75 rokov 40 rokov 15
rokov
3 rokov 1 rok
CD/DVD 75 rokov 40 rokov 20
rokov
10 rokov 2 rokov
CD ROM 30 rokov 15 rokov 3 rokov 9 mesiacov 3 mesiacov
10.4 Typy médií
Média pre archiváciu sa v základnom koncepte rozdeľujú do troch základných
skupín:
1. Mikrofilm
2. Magnetické média
3. Optické média
V súčasnosti sú magnetická páska a mikrofilm najrozšírenejšie média pre
dlhodobú archiváciu, ale optické média sa stávajú stále viac bežné
a predovšetkým vhodné aj pre dlhodobú archiváciu.
Optické média sa vyvíjajú rýchlo a mali by eventuálne nahradiť zvyšné média
pre dlhodobú archiváciu. V súčasnosti však magnetické disky ponúkajú
rýchlejší čas prístupu, čo im dáva lepší predpoklad využitia za účelom
hromadného uchovávania.
Poznámka: Existuje množstvo diskusií vo vnútri ISO, ANSI a ICA ohľadne
najvhodnejšieho uchovávania elektronických záznamov. Nasledovné hodnoty
ilustrujú príklady z praxe:
Priemerná teplota: +18°C/-5°C
Relatívna vlhkosť: +40%/-5%
Interval medzi prepisom: 10 rokov
74
11 PROBLÉMY, KTERÉ TŘEBA ŘEŠIT
11.1 Hlavné zistené bariéry v Európe
• Fragmentovaný inštitucionálny přístup
• Neschopnosť mnohých inštitúcií v oblasti kultúrneho a vedeckého dedičstva
odpovedať na potreby používateľov
• Neschopnosť mnohých inštitúcií v oblasti kultúrneho dedičstva rozpoznať
a implementovat' perspektívne inovácie
• Neschopnosť mnohých inštitúcií v oblasti kultúrneho dedičstva prikloniť sa ku
spoločnému prístupu
• Nejasná návratnosť investície pre inštitúcie v oblasti kultúrneho dedičstva
• V rámci inštitúcií je v oblasti digitalizácie nedostatok odbornosti a zručností
• Oddeľovanie otázok uchovávania od praktickej digitalizácie
• Nevyspelosť kľúčových technológií a štandardov
• Neschopnosť kľúčových informačných technológií vysporiadať sa s
technologickou zmenou
• Slabé zladenie priemyselných záujmov s požiadavkami a potrebami v oblasti
kultúrneho dedičstva
• Nedostatok jasného smerovania vo výskume a vývoji
• Nedostatok vhodných softvérových nástrojov na integráciu digitalizačnú prax do
širšieho informačného priestoru
• Fragmentácia národných politických prístupov
• Nezhoda medzi kultúrnymi programami a programami pre nové technológie v
národnom aj v medzinárodnom kontexte
• Slabé prepojenie súčasnej legislatívy v oblasti kultúrneho dedičstva s
požiadavkami používateľov, hlavne pri presadzovaní využitia vo vzdelávaní a
inštitúciách, obsahovom priemysle a služieb s pridanou hodnotou
• Nejasné rozdelenie zodpovednosti medzi inštitúciami, projektami a sieťami
• Nejasnosť budúceho vlastníctva digitálnych kultúrnych obsahov a infrastruktur
• Fragmentované mechanizmy financovania a ciele
• Stagnujúca a nepohyblivá národná technická vybavenosť a odbornosť
• Absencia rozdelenia digitalizačnej práce a produkcie
• Nedostatočná integrácia digitalizačných akcií v znalostnej ekonomike
• Nedostatočná priehľadnosť zdrojov čo do ich prístupnosti, kvality, integrity a
právne bezproblémové používanie tvorivým kreatívnym priemyslom
• Nedostatočná implementácia viacjazyčných prístupov a technológií
• Slabé uplatnenie digitálnych kultúrnych zdrojov v znalostnej spoločnosti
• Neadekvátne prispievanie digitalizácie do kultúrneho dialógu a k prepojeniu
dedičstiev.
Navrhuje konkrétne činnosti v týchto oblastiach:
• Používatelia a obsah
• Trvalá udržateľnosť obsahu
• Technologický rozvoj a nástroje
• Digitálne uchovávanie
• Monitorovanie pokroku
75
12 ZNÁMÉ POSTUPY DLOUHODOBÉHO UCHOVÁNÍ DIGITÁLNÍCH DĚL
12.1 Výber médií
Definícia problému
Otázka výberu médií (nosičov) je dôležitá pri projektoch, ktoré chcú udržiavať ich
digitálne zbierky počas obdobia niekoľkých rokov. Mnohé projekty (napríklad
Domes Day vo Veľkej Británii) sa stratili vďaka zastarávaniu médií.
Pragmatické návrhy
• Výstup projektu digitalizácie sa bude uchovávať na serverových strojoch,
vrátane tých, ktoré poskytujú digitálny obsah používateľom na Internete.
Tieto stroje je potrebné zálohovať. Ak server nie je určený výhradne pre
daný projekt digitalizácie, digitálny obsah by sa mal ukladať na odpojiteľné
médiá oddelené od iných údajov na servri.
• Všetky matričné súbory (a príslušné metaúdaje) sa budú zálohovať na
dvoch druhoch nosičov skladovaných oddelene od seba.
• V súčasnosti (2004) sa bežné zálohovacie médium CD-R nahrádza
médiami DVD, ktoré ponúkajú oveľa väčší úložný priestor, pričom
zariadenie na čítanie DVD je prítomné na takmer všetkých nových PC a
notebookoch. Zariadenia na zapisovanie DVD sú stále dosť drahé, ale ich
cena klesá, prípadne sú úplne nahradené inými nosičmi (USB kľúče,
pamäťové karty SD a i.)
• Ešte pred 10 rokmi sa neočakávalo, že v blízkej budúcnosti nosiče DVD
nahradia magnetické pásky, akou je napríklad páska Digital Linear Tape
(DLT) ako úložné médiá použiteľné na zálohovanie počítačových diskov.
Je potrebné seriózne zváženie oboch technológií na uchovávanie
digitálneho obsahu. V skutočnosti sú pásky LT05 a LT06 vhodné na
dlhodobé archivovanie. Bežne sa používajú aj pomerne lacné
veľkokapacitné úložiská 10 a viac TB aj pre bežné domáce použitie na
archivovane digitálneho obsahu.
• Bez ohľadu na voľbu média je potrebné mať na pamäti, že dané médium
bude v blízkej a stredne vzdialenej budúcnosti zastaralé. Je veľmi
pravdepodobné, že v priebehu piatich rokov bude nevyhnutná migrácia na
nové úložné médiá.
Poznámky/komentáre
Projekty digitalizácie v minulosti boli vo veľkej miere projekty poznačené
zmenami médií, ktoré boli spôsoboval hlavne konzumentský elektronický
priemysel.
Stúpajúci trend „ukladať údaje na internete" na veľkých serveroch a na mobilných
jednotkách s pevnými diskmi však uľahčuje migráciu údajov z jedného miesta na
iné a z média na médium. Ak sa z času na čas servre zálohujú a migrujú na nové
servery, očakáva sa, že bude klesať závislosť na oddeliteľných médiách ako
jediných záznamoch z procesu digitalizácie.
Medzitým ostáva stále dôležitá otázka výberu médií. Nič nenasvedčuje tomu, že
sa naráža na obmedzenia pri uchovávaní komprimovaného digitálneho obsahu.
76
12.2 Migračné stratégie
Definícia problému
Pri výbere formátu súborov a úložného média je potrebné vziať do úvahy
realizovateľnosť presunu dát do nového formátu a/alebo na iné úložné médium.
Pragmatické návrhy
• Preskúmajte príslušné súvisiace štandardy ohľadom formátov súborov a
úložných médií, ako bolo uvedené vyššie. Vyhovenie štandardom je
rozumným indikátorom toho, že konkrétny formát alebo médium budú
nejakým spôsobom podporované aj v budúcnosti.
• K používaniu súkromných formátov súborov a neštandardných formátov
médií by sa malo pristupovať s obozretnosťou.
• Pri migrácii z jedného formátu na iný by sa malo zamedziť konverzii
matričného digitálneho materiálu z bezstratového formátu (napr. TIFF v
doméne obrazov) do stratového (napr. JPEG). Ak sa raz informácie
stratia, nie je možné ich nahradiť.
• Je nutné mať na pamäti, že každý formát súborov a/alebo každé úložné
médium bude v dohľadnej budúcnosti zastaralé (možno v priebehu piatich
rokov, pravdepodobne do desiatich rokov).
• O tom, aká bude pravdepodobná realizovateľnosť migrácie z jedného
úložného média na iné pri jeho zastarávaní, vypovedá veľkosť trhu s
úložnými médiami.
• Po vytvorení digitálneho materiálu by sa mali úložné médiá (napr. CD-R,
DVD) periodicky obnovovať (jedenkrát za dva až tri roky), aby sa zabránilo
strate údajov, to sa týka aj kopírovania všetkých údajov na nové médiá.
• Status digitalizovaného materiálu, vrátane údajov o tom, kedy sa
obnovoval nosič, by sa mali zaznamenávať v príslušnom protokole.
Ak je to možné, kópie digitalizovaného materiálu sa majú uchovávať na
viacerých miestach, čím sa zníži riziko straty údajov pri nehodách ako požiar,
záplavy a pod.
77
13 PRÁCE S PŮVODNÍMI DIGITÁLNÍMI DOKUMENTY
13.1 Zaobchádzanie a práca s originálmi
Táto časť za zaoberá tým, ako by sa v rámci projektu malo zaobchádzať
s materiálom, ktorý sa digitalizuje. Zdrojový materiál je v mnohých prípadoch
vzácny alebo hodnotný, preto sa musí minimalizovať negatívny vplyv, ktorý naň
môže mať digitalizácia.
V každom prípade je nutné zdôrazniť, že pre projektový tím budú cenné poznatky
osôb, ktoré bežne zodpovedajú za zbierky.
13.2 Premiestňovanie a manipulácia s originálmi
Definícia problému
V mnohých prípadoch je materiál určený na digitalizáciu veľmi citlivý a krehký.
Nahradenie bezprostredného prístupu on-line zverejnením je v prvom rade často
dôležitým dôvodom projektu digitalizácie. Je kriticky dôležité, aby projekt prijal
opatrenia, aby sa počas procesu digitalizácie materiál žiadnym spôsobom
nepoškodil. Tieto opatrenia môžu mať podobu používania správneho nardvéru,
zabezpečenia vyhovujúcej mikroklímy alebo presunu digitalizačného centra na
miesto uloženia materiálu namiesto sťahovania dokumentov a predmetov.
Pragmatické návrhy
• Pred manipuláciou a prácou so zdrojovým materiálom sa poraďte s
osobou, ktorá za materiál zodpovedá.
• Vyžaduje sa určitá flexibilnosť - nevyhovenie z pohľadu projektu
digitalizácie sa dá prekonať, zatiaľ čo poškodenie jedinečného artefaktu
môže byť nenapraviteľné.
• Ak to bude potrebné, digitalizačně zariadenie (digitálna kamera) sa môže
preniesť k zdrojovému dokumentu alebo predmetu a nemusí sa
prepravovať objekt určený na digitalizáciu.
• Vyhnite sa rozväzovaniu kníh a spisov. Namiesto plošného skenera
použite skener s knižnou kolískou alebo digitálnu kameru.
• Vždy odstráňte skoby, spinky, svorky a iné spony; môžu poškodiť
digitalizačně zariadenie i zdrojový materiál.
• Pred prácou s originálom sa treba poradiť s odborníkom (napr. kurátorom
dokumentu/predmetu určeného na digitalizáciu).
• Konzultácie sa majú realizovať pred digitalizáciou, ideálne v čase výberu
daného kusu na digitalizáciu. Pokyny by sa mali zaznamenať v báze
poznatkov digitalizácie a mali by sa preštudovať pred premiestnením
alebo digitalizáciou. Ak je to potrebné, schopnosti každého možného
hardvérového riešenia by sa mali prekonzultovať s odborníkom.
Poznámky/komentár
Aj keď sú tieto odporúčania zrejmé, pri zaobchádzaní so zdrojovým materiálom
je nutné a dôležité dodržiavať disciplínu
78
79