Digitalizácia Úvod do digitalizácie písomného dedičstva Dištanční študijní text Dušan Katuščák Opava 20 19 Obor: Knihovnictví, bibliografie, digitalizace, dokumentace, informační věda (sociální aspekty), Library and Information Science (LIS) Klasifikační kódy: 00, 022, 030, 0322, 038 Klíčová slova: knihovnictví, digitalizace, terminoligie, uchovávavní, konzervovaání, Minerva, Europeana, OCR, konzervování, deacidifikace, Library and Information Science (LIS), workflow digitalizace, digitální knihovna, on-line katalog, digitální repozitář, služby knihoven, copyright, digitální repozit, Islandom, DSpace, Invenio, Greenstone, skenery, deskriptívni metadata Anotace: Předmět seznámí studenty s problematikou digitalizace knih a částečně i digitalizace zvukových a obrazových záznamů. Autor učebního textu se na jedné straně opírá o vlastní dlouholeté zkušenosti v oblasti digitalizace a jednak o nejdůležitější evropské doporučení a nejlepší praxe. Velké projekty digitalizace se na světě začaly rozvíjet koncem 90. let a bezprostředně po roce 2000. V té době vznikly příručky a praktická doporučení, které se uplatnily v mnoha digitalizačních projektech. Mezi hlavní použité zdroje patří zkušenosti a poznatky z opisu velkého národního projektu Digitální knihovna a digitální archiv, který byl financován ze strukturálních fondů a jehož autorem je i autor tohoto textu. Studenti se seznámí s poselstvím Comité des sages projektu Europeana. Praktické standardní doporučení jsou uvedeny v souladu s pravidly, které byly vypracovány v projektu Minerva. Pozornost je věnována jednotlivým fázím projektu digitalizace, infrastruktuře, metadatům, klíčovým technologickým operacím, jako je výběr materiálu, skenování, formáty dat, konzervační postupy, sterilizace, odkyselování, lyofylizácia, otázkám digitálních repozitov Islandom, DSpace, Invenio, Grenstone, jakož i finančním a právním otázkám zpřístupňování digitálního obsahu. Důraz je kladen na proces plánování a realizace procesu digitalizace. Dále jsou analyzována významné české Digitalizační projekty (Manascriptorium, Kramerius). V druhé části jsou studenti seznámení s problematikou dlouhodobé uchování výsledků digitalizace s důrazem na problematiku migrace digitálních obsahů na nové nosiče. Cvičení jsou zaměřena na praktické vyzkoušení si celého procesu digitalizace, Počínaje posouzeny kvality podkladů, přes skenování, OCR a korekci chyb až po ukládání na nosič. Součástí předmětu je i exkurze na významné Digitalizační pracoviště. 2 B-IU - Charakteristika studijního předmětu Název studijního předmětu Digitalizace a dlouhodobá ochrana fondů 1 Tip předmětu Povinny, ZT (společný základ) Idoporučenv ročník/semestr 1 1/ZS Rozsah studi jniho předmětu 13p+26s I hod. 39 h/sem. 1 kreditů Prerekvizity, korekvizity, ekvivalence Způsob ověřeni studijních vvsledků_ Zápočet, zkouška Forma vvukv j Přednáška, seminář Forma způsobu ověření studijních výsledků a další požadavky na studenta Zkouška, zápočet Účast na zkoušce j e podmíněna předložením seminární práce v rozsahu 15 normostran textu s obsahovým zaměřením na práci s obchodními informacemi. Předmět je uzavřen zkouškou, která bude udělena p odevzdání a uznání seminární práce. Podrobné informace obdrží studenti na začátku semestru. Podmínkou j e 80% účast studenta m seminářích._ Garant předmětu Prof PhDr. Dušan Katuščák, PhD. Zapojení garanta do výuky předmětu_ Vedení přednášek. Vyučující Prof. PhDr. Dušan Katuščák, PhD. (přednášející, 100 1 Stručná anotace předmětu_| Cíl ii uki Předmět seznámí studenty s problematikou digitalizace knih a částečně i digitalizací zvukových a obrazových záznamů. Důraz j e kladen m proces plánování a realizace procesu digitalizace. Dále jsou analyzovány významné české digitalizační projekty (Manascriptorium, Kramerius). V druhé části jsou studenti seznámeny s problematikou dlouhodobého uchováni výsledků digitalizace s důrazem m problematiku migrace digitálních obsahů na nové nosiče. Cvičení jsou zaměřeny na praktické vyzkoušení si celého procesu digitalizace, počínaje posouzením kvality podkladů, přes skenování, OCR a korekci chyb až po ukládám m nosič. Součástí předmětu j e i exkurze m významné digitalizační pracoviště. Osnova - bloky L význam procesu digitalizace v oboru knihovnictví 2. strategické aspekty procesu digitalizace 3. plánování a příprava procesu digitalizace 4. technologické aspekty procesu digitalizace 5. digitalizace starých tisků 6. právní aspekty procesu digitalizace 7. procesy před a p digitalizaci (konzervace, ochrana) 8. optické rozpoznávání obrazců a korekce chyb zpřístupňování digitalizovaných dél strategické plánování procesu dlouhodobého uchování digitálních děl 11. problémy, které třeba řešit 12. známé postupy dlouhodobého uchovám digitálních děl 13. práce s původními digitálními dokumenty 10, Studijní literatura a studijní pomůcky Povinná literatura Studijní materiály, prezentace a učební text umístěné na webových stránkách Ústavu bohemistiky a knihovnictví FPF SU v Opavě - oddělení knihovnictví - webová adresa: http://knihovnik.fpf.slu.cz/ KONVIT, M Digitization and Long-term Fund Protection I £ Opava, SU v Opavě, 2017. Doporučená literatura ČNK. Digitalizace a digitálni zpřístupnění dokumentů. Online. Dostupné na https:/ Amviv.nkp.cz/o-knihovne/odborne-cinnosti/sprava-a-ochrana-fondu/zzz_osof/digitalizace Archivy, knihovny, muzea v digitálním světě 2005. Praha: Národní technické muzeum, 2006 - 121 s. ISBN 80- 7037- 149-S Negroponte, N Digitální svět. Praha: Management Press, 2001 - 207 s. ISBN 80-7261-046-5 3 Obsah 1 VÝZNAM PROCESU DIGITALIZACE V OBORU KNIHOVNICTVÍ.........................................................7 1.1 Definícia digitalizácie a základné pojmy.......................................................................................7 1.2 základné pojmy..........................................................................................................................8 1.3 význam digitalizácie...................................................................................................................9 1.4 Prínosy digitalizácie v praxi......................................................................................................10 1.5 Politika, programy a projekty digitalizácie. Európa a svet.........................................................11 2 STRATEGICKÉ ASPEKTY PROCESU DIGITALIZACE.........................................................................14 2.1 všeobecné ciele stratégie digitalizácie. MlNERVA........................................................................15 2.1.1 Europeana (Comité des Sages). Pozícia Európskej únie.....................................................15 2.1.2 Zabezpečenie širokého prístupu k digitalizovaným verejne dostupným materiálom a ich využívania.........................................................................................................................................15 2.1.3 Stimuly digitalizácie...........................................................................................................17 2.1.4 Úloha Europeany................................................................................................................17 2.1.5 Zaručenie trvalej udržateľnosti digitalizovaných zdrojov...................................................18 2.1.6 Udržateľnosť.......................................................................................................................19 2.1.7 PPP projekty.......................................................................................................................19 3 PLÁNOVANÍ A PŘÍPRAVA PROCESU DIGITALIZACE......................................................................21 3.1 Digitalizácia interne alebo externe...........................................................................................25 3.2 Plánování a příprava procesu digitalizace v knihovně...............................................................27 3.3 Praktické odporúčania.............................................................................................................27 3.4 Projekt Minerva a Lundské zásady............................................................................................28 3.5 Lundské zásady.........................................................................................................................28 3.6 Manažérske plánovanie projektu digitalizácie...........................................................................28 3.7 Zdôvodnenie projektu..............................................................................................................29 3.8 ľudské zdroje...........................................................................................................................30 3.9 Výskum....................................................................................................................................30 3.10 Hrozby. Riziká...........................................................................................................................31 3.11 výber zdrojového materiálu na digitalizáciu ............................................................................32 3.12 Stanovenie kritérií výberu.........................................................................................................32 3.12.1 Výber podľa kritérií........................................................................................................33 3.12.2 Príprava na digitalizáciu................................................................................................33 3.13 Hardvér...................................................................................................................................33 3.13.1 Skenery..........................................................................................................................35 3.13.2 Druhy skenerov..............................................................................................................36 3.14 Softvér....................................................................................................................................40 3.15 Proces digitalizácie..................................................................................................................41 3.15.1 Používanie skenerov......................................................................................................42 3.15.2 Používanie digitálnych kamier/fotoaparátov................................................................44 3.15.3 Softvérové aplikácie na optické rozoznávanie znakov (OCR)........................................45 3.16 Metaúdaje (metadáta).............................................................................................................46 3.16.1 Metaúdaje použité pre opis predmetu (deskriptívne metadáta)..................................46 3.17 Vyhovujúce štandardy pre metaúdaje.......................................................................................47 3.17.1 Zverejnenie....................................................................................................................48 3.18 Spracovanie obrazu..................................................................................................................48 3.18.1 Trojrozmerné materiály a virtuálna realita...................................................................51 3.19 On-line zverejnenie...................................................................................................................51 4 TECHNOLOGICKÉ ASPEKTY PROCESU DIGITALIZACE...................................................................53 4.1.1 Konverzia (Převod).............................................................................................................53 4.1.2 Atributy zdrojového dokumentu........................................................................................54 4.1.3 Kvalita obrazu....................................................................................................................55 4.1.4 Rozlišení.............................................................................................................................55 4 4.1.5 Bitová hloubka...................................................................................................................56 4.1.6 Procesy vylepšení obrazu...................................................................................................56 4.1.7 Komprese...........................................................................................................................56 4.1.8 Použité zařízení a jeho výkon.............................................................................................57 4.1.9 Kvalita operátora...............................................................................................................57 4.1.10 Doporučení pro skenovaní (konverzi, převod)...............................................................57 4.2 Vytváření pracovního prostředí pro projekt digitálního zobrazování........................................58 4.3 Názvové a identifikačné konvencie............................................................................................59 4.4 Príklady dostupných open-source repozitov pre digitálne knižnice............................................61 4.4.1 Islandom 8.........................................................................................................................61 4.4.2 DSpace...............................................................................................................................61 4.4.3 Invenio (CERN)....................................................................................................................62 4.4.4 Greenstone.........................................................................................................................62 5 DIGITALIZACE STARÝCH TISKŮ....................................................................................................63 6 PRÁVNÍ ASPEKTY PROCESU DIGITALIZACE..................................................................................64 6.1 Právne aspekty.........................................................................................................................64 6.2 Autorské práva (Copyrights)....................................................................................................64 6.3 Vydavateľské a licenčné zmluvy................................................................................................64 6.4 Copyright v knižnici podľa amerického a austrálskeho práva....................................................64 6.4.1 Praktický príklad.................................................................................................................64 6.4.2 Dispenzácia s formálnym povolením..................................................................................65 6.4.3 Vytvorenie copyrightu........................................................................................................65 6.4.4 Ochrana copyrightu...........................................................................................................66 7 PROCESY PŘED A PO DIGITALIZACI (KONZERVACE, OCHRANA)...................................................68 7.1 Konzervácia dokumentov (konzervovanie)...............................................................................68 7.2 Reštaurovanie..........................................................................................................................68 7.3 Integrácia konzervovania a digitalizácie...................................................................................68 7.3.1 Sterilizácia..........................................................................................................................69 7.3.2 Deacidifikácia.....................................................................................................................69 7.3.3 Lyofilizácia..........................................................................................................................69 8 OPTICKÉ ROZPOZNÁVANÍ OBRAZCŮ A KOREKCE CHYB...............................................................71 8.1 OCRSOFTVÉR.............................................................................................................................71 9 ZPŘÍSTUPŇOVÁNÍ DIGITALIZOVANÝCH DĚL................................................................................72 9.1 islandora 8..............................................................................................................................72 9.2 DSpace.....................................................................................................................................72 9.2.1 Invenio (CERN)....................................................................................................................72 9.2.2 Greenstone.........................................................................................................................72 10 STRATEGICKÉ PLÁNOVÁNÍ PROCESU DLOUHODOBÉHO UCHOVÁNÍ DIGITÁLNÍCH DĚL...............73 10.1 Uchovávanie aarchivovanie údajov.........................................................................................73 10.2 Dlhodobá archivácia................................................................................................................73 10.3 Voľba médií..............................................................................................................................74 10.4 Typy médií.................................................................................................................................74 11 PROBLÉMY, KTERÉ TŘEBA ŘEŠIT.................................................................................................75 11.1 Hlavné zistené bariéry v Európe................................................................................................75 12 ZNÁMÉ POSTUPY DLOUHODOBÉHO UCHOVÁNÍ DIGITÁLNÍCH DĚL............................................76 12.1 výber médií...............................................................................................................................76 12.2 Migračné stratégie..................................................................................................................77 13 PRÁCE S PŮVODNÍMI DIGITÁLNÍMI DOKUMENTY......................................................................78 13.1 Zaobchádzanie a práca s originálmi..........................................................................................78 5 13.2 Premiestňovanie a manipulácia s originálmi VÝZNAM PROCESU DIGITALIZACE V OBORU KNIHOVNICTVÍ 1.1 Definícia digitalizácie a základné pojmy Digitalizácia je proces konverzie analógových dokumentov (text, obraz, zvuk, audio, video) do digitálneho formátu alebo priama tvorba dokumentov v digitálnej forme. Digitálny obsah, ktorý vzniká digitalizáciou je zaznamenaný v samostatných údajových jednotkách (nazývaných bity), ktoré je možné adresovať osobitne (zvyčajne v skupinách viacerých bitov zvaných bajty). Ide o binárne údaje (0, 1), s ktorými dokážu pracovať počítače a iné zariadenia s výpočtovou schopnosťou (napr. digitálne fotoaparáty, digitálne načúvacie pomôcky). Digitalizácia (digitisation) - Proces vytvárania digitálnych súborov snímaním (skenovaním, fotografovaním) alebo iným spôsobom konverzie analógových materiálov. Výsledná digitálna kópia, alebo digitálna náhrada sa označuje za digitálny obsah (digitálny materiál, digitálny dokument) je predmetom digitálneho uchovávania, podobne ako "digitálne narodené" materiály. Digitalizácia môže byť: • prevod informácií z analógového tvaru (analógového signálu, napr. elektrického napätia, zvuku, svetlosti, tlaku) do číslicového (=digitálneho) tvaru , spravidla do počítačových súborov; špecificky najmä: o snímanie a premena grafických tvarov do číslicových tvarov (spravidla pomocou skenera), o snímanie a premena písma do číslicového tvaru (spravidla pomocou skenera a softvéru OCR), o zaznamenávanie a prevod zvukových signálov do číselných tvarov (vzorkovanie, rozlišovanie vzorky), o snímanie a prenos rozmerov trojrozmerných predmetov do číslicového tvaru (spravidla pomocou 3D skenerov), • prechod od analógovej techniky na digitálnu techniku, najmä v rámci modernizácie, špecificky napr.: o digitalizácia televízneho a rozhlasového vysielania Obrázok 11lustračná schéma procesu digitalizácie a najbežnejšie výstupné formáty 7 1.2 Základné pojmy Prístup, sprístupnenie (access) - priebežná a pretrvávajúca použiteľnosť digitálneho zdroja, pričom sa zachovajú všetky kvality hodnovernosti, presnosti a funkčnosti, ktoré sa považujú za podstatné z hľadiska účelu vytvorenia a/alebo získania digitálneho zdroja. Potvrdenie pravosti (authentication) - mechanizmus, ktorého cieľom je stanovenie hodnovernosti digitálnych materiálov v konkrétnom čase. Ide napríklad o digitálne podpisovanie. Hodnovernosť, autentickosť (authenticity) - Digitálny materiál je taký, aký sa zdá byť. V prípade elektronických záznamov sa tento pojem vzťahuje na dôveryhodnosť príslušného elektronického záznamu. V prípade "digitálne vytvorených" a zdigitalizovaných materiálov sa pojem vzťahuje na fakt, že pri citovaní akéhokoľvek zdroja je tento zdroj rovnaký ako keď bol vytvorený, pokiaľ sprievodné metaúdaje neuvádzajú zmenu. Dôvera v autentickosť digitálnych materiálov v čase je obzvlášť dôležitá vzhľadom na ľahkosť vykonania zmien. "Digitálne narodené, digitálne vytvorené" ("bom digital") - Digitálne materiály, ktoré nemajú mať analógový ekvivalent, buď ako pôvodný zdroj, alebo ako výsledok konverzie do analógovej formy. Tento termín sa používa na rozlíšenie takýchto materiálov od 1) digitálnych materiálov, ktoré boli vytvorené ako výsledok konverzie analógových originálov (zdigitalizované); a od 2) digitálnych materiály, ktoré mohli vzniknúť z digitálneho zdroja, ale napr. sa vytlačili sa na papier. Digitálna archivácia (digital archiving) - Tento termín sa v rôznych oblastiach používa rôzne. Knihovnícka a archivárska komunita ho často používajú zameniteľné s termínom digitálne uchovávanie. Počítačoví odborníci majú sklon používať termín digitálna archivácia na označenie procesu zálohovania a priebežnej údržby na rozdiel od stratégií dlhodobého digitálneho uchovávania. Digitálna archivácia (digital archiving) - Tento termín sa v rôznych oblastiach používa rôzne. Knihovnícka a archivárska komunita ho často používajú zameniteľné s termínom digitálne uchovávanie. Počítačoví odborníci majú sklon používať termín digitálna archivácia na označenie procesu zálohovania a priebežnej údržby na rozdiel od stratégií dlhodobého digitálneho uchovávania. Digitálne materiály, digitálne zdroje (digital materials) - široký termín zahŕňajúci digitálne náhrady vytvorené ako výsledok konverzie analógových materiálov na digitálnu formu (digitalizácia), ďalej "digitálne vytvorené" materiály, pre ktoré neexistuje a nikdy nebude existovať analógový ekvivalent, a digitálne záznamy. Digitálne uchovávanie (digitalpreservation) - termín označujúci sériu riadených činností potrebných na zabezpečenie trvalého prístupu k digitálnym materiálom na taký dlhý čas, na aký to je potrebné. Digitálne uchovávanie má veľmi širokú definíciu a vzťahuje sa na všetky úkony požadované na udržanie prístupu k digitálnym materiálom až za hranice výdrže nosičov bez ohľadu na technologické zmeny. Môže ísť o záznamy vytvárané počas každodennej činnosti organizácie; o "digitálne narodené" materiály vytvorené na konkrétny účel (napríklad zdroje pre vzdelávanie); alebo výstupy projektov digitalizácie. Existuje možnosť využitia digitálnych technológií na uchovávanie originálnych artefaktov prostredníctvom digitalizácie. 8 Dlhodobé uchovávanie - Dlhodobé uchovávanie je najkomplikovanejšia výzva digitálnej doby, a preto je to významná oblasť výskumu a praxe, ktorá je zameraná na dlhodobé uchovávanie digitálneho obsahu. Dlhodobosťou sa pritom rozumie 50 a viac rokov. Trvalý prístup k digitálnym materiálom, alebo aspoň k informáciám v nich obsiahnutým, na neurčitú dobu. (Napr. 100 rokov podľa Kongresovej knižnice USA) Strednodobé uchovávanie - Trvalý prístup k digitálnym materiálom presahujúci technologickú zmenu na určité obdobie (nie na neurčitú dobu). Krátkodobé uchovávanie - Prístup k digitálnym materiálom buď na určité obdobie, kým sa predpokladá ich využívanie, pričom toto obdobie nepresahuje predpovedateľnú budúcnosť a/alebo uchovanie na obdobie, kým sa materiály nestanú neprístupné vzhľadom na zmenu technológií. Emulácia (emulation) - Spôsob prekonávania technologického zastarávania softvéru vývojom techník na imitáciu zastaralých systémový budúcich generáciách počítačov. Migrácia (migration) - Spôsob prekonávania technického zastarávania prevodom digitálnych zdrojov z jednej generácie hardvéru/softvéru na dálšiu. Účelom migrácie je zachovať intelektuálny obsah digitálnych objektov a zachovať pre klientov možnosť získať, vyhľadať a používať bez ohľadu na meniace sa technológie. Migrácia sa líši od obnovovania skladovacích médií v tom, že nie vždy je možné vyrobiť presnú digitálnu kópiu alebo replikovat' pôvodné vlastnosti a vzhľad a stále zachovať kompatibilitu daného zdroja s novou generáciou technológií. 1.3 Význam digitalizácie Digitalizácia znamená podstatnú inováciu informačných služieb knižníc a iných informačných inštitúcií a systémov. Od katalógov smerom k úplným textom, obrazom, zvuku, audio, video. Digitalizácia umožňuje: • Plnotextové vyhľadávanie. Pridanou hodnotou digitalizácie kultúrnych a vedeckých objektov je možnosť vyhľadávania v plných textoch, indexoch či klasifikáciách, a tým aj efektívneho a rýchleho získavania potrebných informácií, údajov, odpovedí či znalostí, čo má nesmierny význam pri procesoch riadenia a rozhodovania, vzdelávania a ďalších ľudských činnosti v akejkoľvek sfére. • Zdroj poznania jazyka. Digitalizáciou sa vytvára jedinečný a obrovský masív digitálnych textov, čo umožní získať dôkladné a úplné vedomosti o vývoji jazyka (národný korpus jazyka, lexikografia, etymológia). • Retrospektívny zdroj informácií. Zdigitalizované archívne dokumenty okrem nezastupiteľnej úlohy zdroja retrospektívnych informácií pri zachovaní kontinuity rozhodovacích a riadiacich procesov pri výkone verejnej správy budú akcelerátorom rozvoja miestnej kultúry, prispejú k zvyšovaniu vedomostnej úrovne o vlastných dejinách, zohrajú významnú úlohu pri upevňovaní kultúrnej a občianskej identity, národných tradícií a rodovej rovnosti. 9 • Historický výskum. Digitálna knižnica a digitálny archív bude rovnako nenahraditeľným zdrojom poznatkov a informácií pre historický výskum, pre tvorbu encyklopédií, výkladových slovníkov, odborných a vedeckých syntetických diel. • Digitálny obsah pre školy. Digitálna knižnica a digitálny archív sprístupní všetky diela, ako sú napríklad učebnice ako aj všetku vedeckú a odbornú literatúru potrebnú pre vzdelávanie na všetkých stupňoch škôl. • Antiplagiátorské systémy. Digitálna knižnica a digitálny archív je jedinečným masívom digitálnych textov, ktoré bude možné využiť na vysokých školách v antiplagiátorských systémocha tým podporí etiku publikovania. Bez digitálnej knižnice je antiplagiátorský systém nemysliteľný. • Osobné digitálne knižnice. Prezentačný systém Digitálnej knižnice a digitálneho archívu umožní používateľom tvorbu osobných digitálnych knižnica zdieľanie poznatkovpodľa tematického alebo komunitného princípu{\Neb 2.0, Web 3.0 a súvisiace služby). Digitalizácia umožňuje premenu pamäťových a fondových inštitúcií na moderné organizácie, ktoré dokážu reagovať na potreby a požiadavky spoločnosti sa spája predovšetkým s komplexnou digitalizáciou spravovaných fondov, hmotných artefaktov, či na rozmanitých nosičoch zachytených nehmotných súčastí kultúrneho dedičstva a znalostí o tomto bohatstve nadobudnutom počas existencie inštitúcií. Digitalizácia je teda prostriedok, ktorého pomocou inštitucionalizovaná kultúra dokáže získať lepšiu kontrolu nad kultúrnym dedičstvom. 1.4 Prínosy digitalizácie v praxi Digitálne zbierky môže ktokoľvek a kedykoľvek prehľadávať rýchlo, nezávisle a komplexne z akéhokoľvek miesta cez počítačovú sieť. Ušetrí sa čas zamestnancov zodpovedaním najčastejšie kladených otázok na internetovej stránke. Digitálne obrazy sa elektronicky môžu vylepšovať tak, aby sa dali prezerať a mohli byť lepšie zobrazené a čitateľné. Digitalizácia zlepšuje a rozširuje možnosti využívania zbierok. Digitalizácia napomáha vzdelávaniu a bádaniu: digitálne materiály vzácnych a ťažko dostupných digitalizovaných dokumentov sú použiteľné v školách priamo vo vzdelávacom procese. Digitalizácia spojená s OCR umožňuje uskutočňovať fulltextové vyhľadávanie (napr. historické noviny a časopisy, projekt digitalizácie diplomových prác a dizertácií a pod.) Digitalizácia umožňuje počúvať/prezerať zdigitalizované zvukové nahrávky a videozáznamy. Digitalizáciou a vylepšením kvality sa sprístupní obsah záznamov na nosičoch, ktoré nieje možné prezerať/prehrávať pomocou bežných zariadení (mikrofilmy, negatívy atď.). Digitalizácia umožňuje kvalitnejšiu intelektuálnu kontrolu cez tvorbu nových vyhľadávacích pomôcok, väzieb na bibliografické záznamy a vývoj indexov (registrov) a iných nástrojov. 10 • Digitalizácia umožní lepšie a bohatšie využívanie materiálov, kedže umožní rozsiahly prieskum, manipuláciu s obrazmi a textami a skúmanie digitálnych obrazov v nových kontextoch. • Digitalizáciou sa dosiahne kvalitnejšie využívanie zbierok cez zlepšenú kvalitu obrazu (napríklad zlepšená čitateľnosť vyblednutých alebo poškvrnených dokumentov). • Digitalizácia umožní vytvárať „virtuálně zbierky" na základe flexibilnej integrácie a syntézy rozličných formátov alebo obsahovo či tematicky súvisiacich materiálov nachádzajúcich sa na rôznych miestach. • Pri digitalizácii je zvýšená intelektuálna kontrola prostredníctvom vytvárania nových vyhľadávacích pomôcok, prepojenie na bibliografické záznamy, tvorba registrov a iných nástrojov • Zvýšené a obohatené využívanie na základe možnosti rozšíreného vyhľadávania, manipulácie s obsahom, štúdium rozmanitých zdrojov v nových kontextoch. • Podpora nového spôsobu využitia na vzdelávanie na základe poskytovania vylepšených zdrojov vo forme rozsiahleho rozširovania lokálnych a jedinečných zbierok, lepšie využívanie prostredníctvom zlepšenej kvality dokumentu, napríklad, lepšia čitateľnosť poškvrnených a vyblednutých textov, lepšia počuteľnosť, • Vytváranie "virtuálnych zbierok" prostredníctvom flexibilnej integrácie a syntézy rozmanitých formátov alebo virtuálně zbierky vzájomne súvisiacich materiálov roztrúsených na mnohých miestach. 1.5 Politika, programy a projekty digitalizácie. Európa a svet V oblasti digitalizácie kultúrneho a vedeckého dedičstva boli v pôvodných 15 krajinách EÚ v rámci iniciatívy eEurope vypracované Lundské zásady (2001) s cieľom vytvoriť v rámci členských štátov koordinačný mechanizmus pre programy digitalizácie. Na koordináciu politiky a programov digitalizácie bol vypracovaný Lundský akčný plán a vznikla Skupina národných zástupcov (NRG) krajín EÚ a iných krajín. Ako sekretariát pre skupinu NRG vystupoval projekt MINERVA/MINERVA Plus, ktorý zabezpečil vytvorenie špecializovaných pracovných skupín, vydávanie publikácií a politického dokumentu s názvom Parmská charta, ktorý podporuje a nadväzuje na Lundské zásady. Ako pokračovanie Lundského akčného plánu vznikol Dynamický akčný plán, ktorý identifikuje hlavné zistené bariéry: • Fragmentovaný inštitucionálny prístup • Neschopnosť mnohých inštitúcií v oblasti kultúrneho a vedeckého dedičstva odpovedať na potreby používateľov • Neschopnosť mnohých inštitúcií v oblasti kultúrneho dedičstva rozpoznať a implementovat' perspektívne inovácie • Neschopnosť mnohých inštitúcií v oblasti kultúrneho dedičstva prikloniť sa ku spoločnému prístupu • Nejasná návratnosť investície pre inštitúcie v oblasti kultúrneho dedičstva • V rámci inštitúcií je v oblasti digitalizácie nedostatok odbornosti a zručností • Oddeľovanie otázok uchovávania od praktickej digitalizácie • Nevyspelosť kľúčových technológií a štandardov 11 • Neschopnosť kľúčových informačných technológií vysporiadať sa s technologickou zmenou • Slabé zladenie priemyselných záujmov s požiadavkami a potrebami v oblasti kultúrneho dedičstva • Nedostatok jasného smerovania vo výskume a vývoji • Nedostatok vhodných softvérových nástrojov na integráciu digitalizačnú prax do širšieho informačného priestoru • Fragmentácia národných politických prístupov • Nezhoda medzi kultúrnymi programami a programami pre nové technológie v národnom aj v medzinárodnom kontexte • Slabé prepojenie súčasnej legislatívy v oblasti kultúrneho dedičstva s požiadavkami používateľov, hlavne pri presadzovaní využitia vo vzdelávaní a inštitúciách, obsahovom priemysle a služieb s pridanou hodnotou • Nejasné rozdelenie zodpovednosti medzi inštitúciami, projektami a sieťami • Nejasnosť budúceho vlastníctva digitálnych kultúrnych obsahov a infrastruktur • Fragmentované mechanizmy financovania a ciele • Stagnujúca a nepohyblivá národná technická vybavenosť a odbornosť • Absencia rozdelenia digitalizačnej práce a produkcie • Nedostatočná integrácia digitalizačných akcií v znalostnej ekonomike • Nedostatočná priehľadnosť zdrojov čo do ich prístupnosti, kvality, integrity a právne bezproblémové používanie tvorivým kreatívnym priemyslom • Nedostatočná implementácia viacjazyčných prístupov a technológií • Slabé uplatnenie digitálnych kultúrnych zdrojov v znalostnej spoločnosti • Neadekvátne prispievanie digitalizácie do kultúrneho dialógu a k prepojeniu dedičstiev. Navrhuje konkrétne činnosti v týchto oblastiach: 1. Používatelia a obsah : 2. Trvalá udržateľnosť obsahu 3. Technologický rozvoj a nástroje 4. Digitálne uchovávanie 5. Monitorovanie pokroku Európska komisia podporuje vybudovanie spoločnej európsku digitálnu knižnicu (Europeana) ktorá by mala byť postavená na koncepcii už prevádzkovanej Európskej knižnice združujúcej všetky národné knižnice Európy. Za podstatnú hodnotu spoločného európskeho postupu pri digitalizácii je považovaná mnohojazyčnosť a kultúrna rôznorodosť. Stratégia digitalizácie navrhnutá Európskou komisiou sa stala základom pre národnú stratégiu digitalizácie v niektorých krajinách. Knižnice využívajú metodológiu a výsledky získané najprv v rokoch 2007-2008 pri budovaní Európskej digitálnej knižnice. Výsledky digitalizácie, teda digitálne zbierky národných pamäťových inštitúcií a systémov, ako aj zbierky iných subjektov budú sprístupnené cez špeciálny digitálny portál na národnej alebo inštitucionálnej úrovni (národný digitálny repozit, inštitucionálny digitálny repozit) V rámcových programoch výskumu a vývoja technológií sa digitalizácii a digitálnemu kultúrnemu a vedeckému obsahu venujú okrem projektov MINERVA aj CALIMERA, ERPANET, TEL-ME-MOR, DELOS, BRICKS, 12 PRESTOSPACE a i. Osobitný význam má fórum DigiCULT, v rámci ktorého sa publikovali analýzy technologického vývoja v oblasti kultúrneho a vedeckého dedičstva, startegickýmzámerom je orientácia digitálneho uchovávania a sprístupňovania na technológie pokryté v prehľadoch fóra DigiCULT. Všetky krajiny sveta už dlhodobo riešia, prípadne si prinajmenšom uvedomujú potrebu riešiť problémy spojené s digitálnym uchovávaním a sprístupňovaním obsahu. Spojené štáty americké investovali stovky miliónov dolárov do výskumu digitálneho uchovávania na vypracovanie dlhodobej stratégie. Ďalšie príklady stratégií a konkrétne politické, ekonomické a technologické opatrenia je možné pozorovať v Austrálii (PADI), Nórsku (digitálne úložisko), Kanade (HeritageCanada), Holandsku (e-DEPOT). V každej krajine je rôzna štruktúra účasti významných aktérov, no vo všeobecnosti ide o zodpovednosť, kompetencie a iniciatívy národných inštitúcii, najmä národných knižníc a archívov. Ako odozva na globálny problém dlhodobého uchovávania digitálne vytvoreného a digitálneho obsahu bola v roku 2003 schválená Charta UNESCO o zachovaní digitálneho dedičstva. 13 2 Strategické aspekty procesu digitalizace Digitálny kultúrny a vedecký obsah sa tvorí z dvoch dôvodov. Prvým dôvodom je dlhodobé uchovanie a druhým dôvodom je jeho sprístupnenie širokej verejnosti. Podobne, ako sa inštitúcie snažia okrem obsahu a nosiča nejakého diela chrániť aj originálne pomôcky na jeho sprístupnenie (gramofón, magnetofón, hracie skrinky), tak aj prístup k digitálnemu záznamu na fyzickom nosiči vyžaduje technológie, ako sú diskové mechaniky, adaptéry, monitory a pod., ktoré by bolo vhodné v inštitúciách tiež zachovávať. Súčasťou riešenia problému digitalizácie je potreba vypracovať koncepciu na zabezpečenie prístupnosti obsahu v budúcnosti prostredníctvom emulácie pôvodného prostredia alebo migrácie obsahu do meniacich sa nových prostredí. Internet a Web sú v súčasnosti globálnymi, univerzálne dostupným priestorom. Pre subjekty v krajinách a relevantných inštitúciách je potrebné vypracovať relevantné odporúčania spracovania a sprístupnenia obsahu cez internet a ustanoviť povinnosti ich dodržiavania. Zbierky je potrebné vystaviť na internete cez vyhľadávače, metaprieskumové stroje prostredníctvom využívania vhodných metaúdajov. Údaje na internete by mali spĺňať odporúčania WWW konzorcia ohľadom prístupnosti Webu (napr. pre znevýhodnené osoby). Digitálny obsah (komunity, zbierky, objekty) bude vo virtuálnom prostredí vždy prístupný z akejkoľvek domény cez akýkoľvek pojem, v knižniciach, archívoch, múzeách, galériách, pamäťových úložiskách (repozitoch). V krajine je potrebné pre oblasť digitalizácie a uchovávania a sprístupňovania digitálneho obsahu zostaviť plán školení, seminárov a odborných konferencií konaných napríklad pod záštitou Ministerstva kultúry, ktoré by malo zriadiť aj účinnú komunikáciu v elektronickom prostredí - napr. sociálne siete, elektronická konferencia, poštové zoznamy. Významná je aj komunikácia s médiami a prezentácia spoločných aktivít kultúry a vzdelávania pred verejnosťou. Kľúčovú úlohu v tvorbe stratégie informatizácie a digitalizácie by mala zohrávať napríklad Rada pre informatizaci u, ktorú je potrebné čo najskôr konštituovať. Vhodným metodickým nástrojom na návrh, implementáciu a prevádzkovanie a trvalú udržateľnosťaktivít na národnej úrovni sú príručky MINERVA - Príručka pre dobrú prax projektov digitalizácie, Zásady kvalitného kultúrneho webového sídla, Technické predpisy pre programy tvorby digitálneho kultúrneho obsahu (pripravujú sa odporúčania ohľadom práv duševného vlastníctva). Ako metodika pre dlhodobé uchovávanie kultúrneho dedičstva boli vypracované a distribuované Technické odporúčania pre zachovanie digitálneho dedičstva tvoriace doplnenie ku Charte o zachovaní digitálneho dedičstva UNESCO. V mnohých krajinách neexistuje politika ani pravidlá (angl. policy) digitalizácie. Je potrebná Stratégia uchovávania a sprístupňovania kultúrneho, vedeckého a intelektuálneho dedičstva v krajine a koordináciadigitalizácie môže byť rozpracovaním Dynamického akčného plánu koordinácie digitalizácie kultúrneho a vedeckého obsahu pre krajinu, vyhláseného a presadzovaného sieťou ministerstiev kultúry EÚ prostredníctvom Skupiny národných zástupcov. 14 2.1 Všeobecné ciele stratégie digitalizácie. Minerva Zdroje kultúry a vedeckých poznatkov sú jedinečným verejným vkladom a formujú kolektívnu a vyvíjajúcu sa pamäť národných spoločenstiev. Objavovanie zdrojov, ich dostupnosť, použiteľnosť, interoperabilita, autentickosť, kvalita a dôvera zo strany všetkých používateľov informačnej spoločnosti sú nevyhnutnými požiadavkami na poskytovanie digitálnych kultúrnych informácií a služieb. Kultúrne inštitúcie ako knižnice, múzeá, archívy a organizácie venujúce sa prírodnému a environmentálnemu dedičstvu sú hlavnými dodávateľmi digitálneho obsahu, no musia sa mobilizovať. Ich úsilie je potrebné koordinovať, aby sa čo najlepšie využili existujúce technológie a prispelo sa k tvorbe, využívaniu a poskytovaniu lokálneho kultúrneho obsahu, ktorý vyhovuje potrebám všetkých občanov. Prostredníctvom tohto aktualizovaného plánuje na realizáciu vízie Európskeho kultúrno-informačného priestoru sledovaných šesť cieľov, pričom sa berie do úvahy a ďalej rozvíja predchádzajúci súbor Lundských zásad: (1) Zabezpečiť vedúcu úlohu národných pamäťových inštitúcií v dynamickom a meniacom sa prostredí, v ktorom sa uskutočňuje rýchly technologický a ekonomický rozvoj. (2) Posilniť koordináciu a presadzovať silnejšie prepojenie medzi digitalizačnými iniciatívami inštitúcií, systémov a projektov prostredníctvom riadiaceho grémia zriadeného pri ministerstve kultúry (Rada pre informatizaci u a digitalizáciu) (3) Pokračovať v snahe o prekonávanie fragmentáciea duplikáciedigitalizačnýchaktivít a o maximalizáciusynergií sprístupnením štandardov, metodík a odporúčaní pre projekty digitalizácie (4) Hodnotiť a identifikovať vhodné modely, spôsoby financovania a politické prístupy na udržanie rozvoja a stratégie dlhodobého uchovávania. (5) Presadzovať kultúrnu a jazykovú rôznorodosťprostredníctvom tvorby digitálneho obsahu. (6) Zlepšovať on-line prístup ku kultúrnemu obsahu. (7) Prispôsobovať digitálny obsah pre špecifické využívanie (napr. v školách) 2.1.1 europeana (comité des sages). pozícia európskej únie. „Knižnice, archívy a múzeá v celej Európe sú už storočia opatrovníkmi európskeho bohatého a rozmanitého kultúrneho dedičstva. Chránia svedectvá o vedomostiach, kráse a talente Európanov, napríklad ich sochy, obrazy, hudbu a literatúru, a poskytujú k nim prístup. Nové informačné technológie vytvorili neuveriteľné možnosti na lepšie sprístupnenie tohto spoločného dedičstva všetkým. Kultúra ide po digitálnej ceste a „pamäťové inštitúcie" menia spôsob, ktorým komunikujú s verejnosťou. Digitalizácia vdychuje nový život materiálom z minulosti a mení ich na impozantné bohatstvo pre individuálneho používateľa a na dôležitý stavebný blok digitálneho hospodárstva, digitálneho priemyslu. Sme toho názoru, že za sprístupnenie nášho kultúrneho dedičstva a za jeho zachovanie pre budúce generácie nesie hlavnú zodpovednosť verejný sektor. Táto zodpovednosť za dedičstvo Európy a kontrola nad ním sa nemôžu ponechať na jeden alebo niekoľko subjektov na trhu, hoci 15 výrazne podporujeme myšlienku, aby sa do arény digitalizácie vnieslo viac súkromných investícií a aby sa do nej zapojil väčší počet spoločností prostredníctvom spravodlivého a vyváženého partnerstva. Digitalizácia nášho kultúrneho dedičstva je obrovská úloha, ktorá si vyžaduje veľké investície. Podľa štúdie bude na uloženie celého dedičstva online postupne potrebných 100 miliárd EUR. Takéto úsilie si vyžaduje čas a na dosiahnutie najlepších výsledkov sa investície budú musieť dôkladne naplánovať a koordinovať. Myslíme si, že prínosy stoja za toto úsilie. Tieto prínosy súvisia predovšetkým so širším prístupom ku kultúre a k vedomostiam a s ich demokratizáciou, ako aj s prínosmi pre vzdelávací systém - pre školy aj univerzity. Ďalšie významné prínosy sú v hospodárskej sfére a týkajú sa rozvoja nových technológií a služieb pre digitalizáciu, digitálne uchovávanie a pre vzájomné pôsobenie s kultúrnymi materiálmi inovačnými spôsobmi. Digitalizované materiály môžu byť samé osebe stimulom inovácie a tvoriť základ nových služieb v takých sektoroch, ako cestovný ruch a vzdelávanie. Uvádzame naše odporúčania, pričom máme na pamäti tieto potenciálne prínosy acieľ podporovať prostredie, ktoré pomôže: • spoločne využívať naše bohaté a rozmanité spoločné dedičstvo, • spojiť minulosť s prítomnosťou, • zachovať toto dedičstvo pre budúce generácie, • chrániť záujmy európskych tvorcov, • živiť tvorivosť, vrátane tvorivého úsilia zo strany neprofesionálov, • prispieť k vzdelávaniu, a • podporovať inovácie a podnikanie. Odporúčania Comité des sages sa týkajú všetkých oblastí stanovených referenčným rámcom pre našu prácu a zaoberajú sa situáciami, v prípade ktorých si myslíme, že je potrebná stimulácia alebo odstránenie prekážok. 2.1.2 Zabezpečenie širokého prístupu k digitalizovaným verejne dostupným materiálom a ich využívania Kultúrne inštitúcie by mali zabezpečiť čo najširší prístup k verejne dostupným materiálom digitalizovaným spomocou verejných finančných prostriedkov a ich opakované použitie. Tento cezhraničný prístup by mal byť súčasťou podmienok financovania digitalizácie v celej Európe. Malo by sa zabrániť využívaniu rušivej vodotlače alebo iných prostriedkov, ktoré obmedzujú využívanie materiálov. V prípade, že kultúrne inštitúcie účtujú súkromným spoločnostiam poplatok za opakované použitie digitalizovaného verejne dostupného 16 materiálu, mali by dodržiavať pravidlá európskej smernice o opakovanom použití informácií verejného sektora. • Európska komisia by mala posúdiť spôsoby a prostriedky na odstránenie rozdielov v stave práv týkajúcich sa digitalizovaných materiálov medzi členskými štátmi v kontexte, v ktorom je cezhraničný prístup a používanie normou. Samotný proces digitalizácie by v zásade nemal vytvárať žiadne nové práva. • Metaúdaje týkajúce sa digitalizovaných predmetov vytvorené kultúrnymi inštitúciami by mali byť široko a bezplatne dostupné na opakované použitie. 2.1.3 Stimuly digitalizácie • Stimulovanie digitalizácie a online prístupnosti materiálov, na ktoré sa vzťahujú autorské práva. • Čo najskôr sa musí prijať európsky právny nástroj pre osirotené diela. Tento nástroj by mal byť v súlade s 8-stupňovým testom, ktorý vymedzil výbor. • Musí sa zabrániť budúcim osiroteným dielam. Určitá forma registrácie by sa mala považovať za podmienku úplného výkonu práv. Vrámci Svetovej organizácie duševného vlastníctva (WIPO) by sa v tejto súvislosti mala uskutočniť diskusia o úprave Bernského dohovoru s cieľom prispôsobiť ho digitálnemu veku, ktorú by mala podporiť Európska komisia. • Národné vlády a Európska komisia by mali podporovať riešenia týkajúce sa digitalizácie diel, ktoré už nie sú v distribúcii, a cezhraničného prístupu k týmto dielam. • Držitelia práv by mali byť na prvom mieste, pokiaľ ide o využívanie diel, ktoré už nie sú v distribúcii. • V prípade kultúrnych inštitúcií by riešenia týkajúce sa kolektívneho udeľovania licencií a príležitosti mali byť podporené právnymi predpismi s cieľom digitalizovat a uložiť diela, ktoré už nie sú v distribúcii, online, ak to nerobia držitelia práv a komerční poskytovatelia. • Riešenia pre osirotené diela a diela, ktoré už nie sú v distribúcii, sa musia týkať všetkých rôznych sektorov: audiovizuálneho sektora, textov, výtvarného umenia, zvuku. 2.1.4 úloha europeany Posilnenie knižnice Europeana ako referenčného bodu pre európsku kultúru online • Europeana by sa mala dálej rozvíjať, aby sa stala referenčným bodom pre európsky kultúrny obsah online. To si vyžaduje koncentráciu finančných snáh a politického kapitálu na európskej a vnútroštátnej úrovni na vytvorenie stránky Europeana a hlavných štruktúr. 17 • Členské štáty by mali zabezpečiť, aby všetko verejné financovanie digitalizácie bolo podmienené následnou bezplatnou prístupnosťou digitalizovaných materiálov prostredníctvom Europeany. Mali by tiež zabezpečiť, aby do roku 2016 preniesli všetky svoje verejne dostupné majstrovské diela do Europeany. • V nadchádzajúcich niekoľkých rokoch by sa na portál Europeany mala pridať aplikačná platforma, a k tejto stránke by sa mali pripojiť hlavné činnosti súvisiace s digitalizáciou a ochranou kultúrneho dedičstva Európy. Pri technickom rozvíjaní stránky by sa osobitná pozornosť mala venovať aspektom viacjazyčnosti. V rámci Europeany by sa mali preskúmať aj budúce možnosti „cloud computing" (internetový oblak počítačov). • Zo strednodobého hľadiska je potrebné zvážiť možnosť poveriť Europeanu kľúčovou úlohou v ochrane dedičstva Európy a premeniť ju na európsku úschovnu verejne dostupných digitalizovaných kultúrnych materiálov a na „tmavý" archív pre pôvodné digitálne kultúrne materiály. • Europeana musí byť aktívne a široko podporovaná kultúrnymi inštitúciami, Európskou komisiou a členskými štátmi. 2.1.5 Zaručenie trvalej udržäteľnosti digitalizovaných zdrojov • V snahách o digitalizáciu je kľúčovým aspektom ochrana. Digitálna ochrana je tiež hlavným problémom pre akýkoľvek pôvodný digitálny obsah. Primeraná pozornosť by sa mala venovať organizačným, právnym, technickým a finančným rozmerom dlhodobej ochrany digitalizovaných materiálov a pôvodných digitálnych materiálov. • Za ochranu digitalizovaných kultúrnych materiálov a pôvodných digitálnych kultúrnych materiálov by mali byť zodpovedné kultúrne inštitúcie - ako je to teraz v prípade nedigitálnych materiálov. • Aby sa zaručila ochrana európskeho digitálneho kultúrneho dedičstva, na Europeane by sa mala archivovať kópia digitalizovaných kultúrnych materiálov alebo pôvodných digitálnych kultúrnych materiálov. V prípade diel, na ktoré sa vzťahujú autorské práva, by bol úschovnou „tmavý" archív fungujúci ako bezpečný prístav. • Aby sa predišlo zdvojeniu úsilia spoločností pôsobiacich v zahraničí a kultúrnych inštitúcií, systém by mohol byť navrhnutý tak, aby sa materiály, ktoré sa teraz musia uchovávať v niekoľkých krajinách, uchovávali iba raz. Tento systém by zahŕňal pracovný tok pre zasielanie kópie akejkoľvek inštitúcii, ktorá má na ňu právo na základe vnútroštátnych právnych predpisov o povinných výtlačkoch. • Právne predpisy o autorských právach a súvisiace predpisy musia umožniť inštitúciám kultúrneho dedičstva zodpovedným za ochranu, aby si vytvorili archívne kópie a upravili súbory na archívne účely. • Pri každom digitálnom predmete archivovanom v kultúrnych inštitúciách sa musia využívať trvalé identifikátory. Na európskej 18 úrovni sa musí vytvoriť a zachovať spoľahlivá rozlišovacia služba na trvalú identifikáciu digitálnych predmetov, najlepšie spojená s Europeanou. 2.1.6 Udržateľnosť Zabezpečenie trvalo udržateľného financovania digitalizácie a Europeany Verejný sektor je hlavným subjektom zodpovedným za financovanie digitalizácie ačlenské štáty budú musieť značne zvýšiť svoje investície 1 „Tmavý" archív je archív, ku ktorému je obmedzený prístup. Súčasnú finančnú krízu nemožno ignorovať, ale rovnako nemôže byť dôvodom na nečinnosť. • Malo by sa podporovať zapojenie súkromných partnerov. Súkromné financovanie digitalizácie dopĺňa potrebné verejné investície anemalo by sa vnímať ako náhrada verejného financovania. • Digitalizácia by sa v podstate mala financovať na vnútroštátnej alebo regionálnej úrovni, nie na európskej úrovni. Členské štáty by však mali byť silne podporované vtom, aby využívali možnosti financovania zeurópskych štrukturálnych fondov na činnosti v oblasti digitalizácie. Na európskej úrovni by sa mohli spolufinancovať aj určité cielené snahy v oblasti digitalizácie, ktoré majú jasný cezhraničný rozsah (napríklad cezhraničné zbierky). • Vzhľadom na povahu Europeany ako spoločného dobra by sa najväčšia časť prevádzkových nákladov Europeany mala financovať z verejných prostriedkov, ato aj po roku 2013. Financovanie digitalizácie aEuropeany by sa malo vnímať ako blok, v ktorom sú ČŠ všeobecne zodpovedné za financovanie digitalizácie svojho kultúrneho dedičstva avytváranie vnútroštátnych zberných miest a v ktorom by financovanie portálu Europeana malo pochádzať predovšetkým z rozpočtu Európskej únie. • Členské štáty by mali podporovať spôsoby premeny digitalizácie na nové možnosti rozvoja pre európske firmy, napríklad prostredníctvom regionálnych zoskupení podnikov vpartnerstve skultúrnymi inštitúciami, znalostnými partnerstvami medzi kultúrnymi inštitúciami a univerzitami alebo prostredníctvom strategických partnerstiev na európskej alebo medzinárodnej úrovni v oblasti nových technológií a aplikácií v súvislosti s kultúrnym dedičstvom. 2.1.7 PPP projekty Doplnenie verejného financovania prostredníctvom verejno-súkromných partnerstiev (PPP) pre digitalizáciu Aby sa ochránili záujmy verejných inštitúcií, ktoré vstupujú do partnerstva so súkromným partnerom, mal by sa dodržiavať súbor minimálnych podmienok: 19 • Mal by sa zverejniť obsah dohody medzi verejnou kultúrnou inštitúciou a súkromným partnerom. • Digitalizované verejne dostupné materiály by mali byť pre širokú verejnosť bezplatné a dostupné vo všetkých členských štátoch EÚ. • Súkromný partner by mal kultúrnym inštitúciám poskytnúť digitalizované súbory rovnakej kvality, ako je kvalita tých, ktoré sám používa. • Maximálny čas prednostného používania materiálov digitalizovaných vo verejno- súkromných partnerstvách nesmie presiahnuť 7 rokov. Toto obdobie sa považuje za primerané na vytvorenie stimulov na súkromné investovanie do masovej digitalizácie kultúrneho dedičstva na jednej strane a na umožnenie dostatočnej kontroly verejných inštitúcií nad ich digitalizovanými materiálmi na strane druhej. • Tvorcovia politiky na európskej a vnútroštátnej úrovni by mali vytvoriť priaznivé podmienky na zapojenie európskych subjektov. Mali by najmä: • podporovať digitalizáciu v nových oblastiach, ktorým sa doteraz nevenovala veľká pozornosť, napríklad audiovizuálne materiály, noviny, časopisy alebo muzeálne predmety; • v strednodobom horizonte, pod podmienkou zlepšenia finančnej situácie členských štátov, vytvoriť stimuly na investovanie súkromných finančných prostriedkov prostredníctvom zdaňovania; • podporovať využívanie verejných finančných prostriedkov zosúladených so súkromnými finančnými prostriedkami investovanými do digitalizácie. Verejné finančné prostriedky sa môžu poskytnúť kultúrnym inštitúciám, ktoré zabezpečili partnerstvo pre digitalizáciu svojej zbierky so súkromným subjektom na základe spolufinancovania s investovanými súkromnými finančnými prostriedkami; • podporovať Europeanu a jej prispievajúce inštitúcie s cieľom rozšíriť jej digitálny obsah prostredníctvom budovania partnerstiev s európskymi podnikmi. Môže si Európa dovoliť byť nečinnou a čakať alebo ponechať digitalizáciu nášho spoločného kultúrneho dedičstva na jeden alebo viac súkromných subjektov? Naša odpoveď je rezolútne „nie". Členské štáty, kultúrne inštitúcie Európy, Európska komisia a dálšie zainteresované strany budú musieť prevziať na seba zodpovednosť, aby sa zabezpečilo, že občania a hospodárstvo Európy plne využijú potenciál ukladania kultúrneho dedičstva Európy online. Našim cieľom je zabezpečiť, aby Európa namiesto vstupu do digitálnej doby temna zažila digitálnu renesanciu." 20 3 Plánování a příprava procesu digitalizace Tabulka 1 Projekt digitalizáie. Opis projektu Projekt digitalizácie Opis projektu Názov projektu Inštitúcia Organizačný útvar inštitúcie (oddelenie, ústav, katedra ai) Vedecký manažér Priezvisko, Meno Telefon fax e-mail Vedecký manažér (expert alebo vedecká rada) je subjekt, ktorý je zodpovedný za výber materiálu na digitalizáciu a definovanie kvality metadát. Vo fáze výberu materiálu je podporovaný projektovým manažérom, najmä pokiaľ ide o kontrolu materiálu a právne aspekty. Manažér projektu Priezvisko, Meno Telefon fax e-mail Projektový manažér spolupracuje s vedeckým manažérom pri analýze právnych otázok, koordinuje činnosti digitalizácie a garantuje kvalitu metadát. Technický koordinátor Priezvisko, Meno Telefon fax e-mail Koordinuje technické a technologické procesy a spolupracuje s tímom, ktorý v systéme zabazpečuje využívanie, prevádzkyschopnosť a prevádzky Stručný popis zbierky určenej na digitalizáciu Stručný popis etáp projektu a osoby zodpovedné za etapy (názov etapy) Začiatok / Koniec Zodpovednosť Trvanie projektu: Začiatok - Koniec RRRRMMDD Začiatok Koniec Informácia o dokumentoch určených na digitalizáciu (knihy, noviny, časopisy, atlasy, mapy, fotografie atd.). Typ (znak) Počet Poznámka 21 Tlačený text Rukopisný text Tlačené alebo rukopisné hudobniny Mapy Postery Pohľadnice Kresby Maľby Tlač (gravírovanie, leptanie atď.) Pergamen Negatív č / b Fotografia č / b Fotografia col. Snímka č / b Posúvač stĺpcov. Iné (špecifikuj) Maľby Forma dokumentov určených na digitalizáciu (nosič) voľné listy zrolované listy, zvitky zviazané Album na kartóne alebo iných materiáloch v ráme obálky Zložky krabice iné ?_ voľné listy Rozmery dokumentov Menšie ako A4 A4 A3 A2 A1 AO Väčšie ako AO Iná veľkosť - špecifikuj Celkový počet dokumentov na digitalizáciu 22 Informácia o digitálnych objektoch Odhad počtu digitálnych objektov Ako je možné použiť digitálne objekty (plán) V sprístupnení sa musí dbať na práva duševného vlastníctva. Otvorený prístup je k deskriptívnym metadátam a môže byť aj k náhľadom objektov, voľným alebo osirelým dielam ap. Práva sprístupnenia sa môžu viazať na každý jednotlivý dokument alebo zbierku otvorený, voľný prístup na webe obmedzený prístup na webe prístup v lokálnej sieti CD-ROM alebo DVD Tlač iné (špecifikuj)_ Predbežná kontrola Zdroj dokumentov (odkiaľ pochádzajú) akvizícia áno - nie Dar áno - nie neviem áno - nie iné (špecifikuj)_ áno - nie Ak áno, aké boli výberové kritériá? historická a kultúrna hodnota áno - nie unikátnosť a rarita áno - nie často žiadaný áno - nie materiál bez právnych obmedzení prístupu alebo o získaným povolením na digitalizáciu a prístup áno - nie prístup obmedzený z dôvodu stavu ochrany, hodnoty alebo miesta áno - nie pridaná hodnota prostredníctvom online prístupu, áno - nie vytvárania virtuálnych zbierok áno - nie zvýšenie záujmu o výskum pre málo známy alebo neznámy materiál atď. iné (špecifikuj) áno - nie Bola vykonaná kontrola? áno - čiastočne - nie Existuje už digitalizovaná verzia? áno - nie Ak nie, tak vypíšte, v ktorých organizáciách ste vykonali kontrolu, či je 23 dokument alebo zbierka digitalizovaná? Sú nejaké právne obmedzenia (copyright, ochrana súkromia, donorské práva atd)? áno - čiastočne - nie Podrobnejšie o obmedzeniach Sú už dokumenty katalogizované? áno - čiastočne - nie - neviem Ak áno, tak ako? tlačený zoznam elektronický zoznam tlačený katalóg elektronický katalóg tlačený archívny zoznam elektronický archívny zoznam iné (špecifikuj) V prípade, že ide o tlačený text, máte v úmysle robiť OCR ? (Optical Character Recognition)? áno - čiastočne - nie V prípade že ide o rukopisný text, máte v úmysle transkribovať, prepísať text dokumentov? áno - čiastočne - nie - neviem Približné náklady na digitalizáciu In-house náklady spolu: Náklady na technickú infrastrukturu, hardvér, softvér, úpravy, tovary, služby Prevádzkové náklady Outsourcing spolu Jednotkové ceny Autor opisu projektu Dátum Dolupodpísaní sú si vedomí, že musia pracovať v súlade s miestnymi predpismi o autorských právach. Vyhlasujú, že dokumenty tohto projektu sú (zaškrtnite jednu z možností): vo vlastníctve tejto inštitúcie a chránené platnými právnymi predpismi o autorských právach o priemyselnom vlastníctve vo vlastníctve tretích strán, ktoré však udelili inštitúcii právo tejto ich používať vo verejnej doméne 24 Podpis vedeckého manažéra Podpis projektového manažéra Digitalizácia je proces transformácie / konverzie analógového objektu (text, obrázok, zvuk, video) do digitálneho formátu, ktorý je možné pomocou počítača interpretovať. Výber skenovacieho systému, systém osvetlenia a metódy spracovania (preprava, otváranie zväzkov, manipulácia) závisia od povahy a veľkosti originálov. Požadovaná kvalita obrazov definovaných v projekte určuje aké budú hardvérové a softvérové požiadavky na skenovanie, časy akvizície a nároky na spracovania obrazu a využitie pamäte v úložnom médiu na správu repozitu a údržbu. 3.1 Digitalizácia interne alebo externe Pri výbere digitalizácii v rámci inštitúcie (interne) alebo pri využívaní externých služieb (outsourcing) sa musia zohľadniť výhody a nevýhody týchto dvoch metód. Tabulka 2 Alternatívy digitalizácie in-house a outsourcing Digitalizácia doma (in-house) Digitalizácia dodávateľsky ^^^^^^^^^^^^^^^m (Outsourced) organizácia ma priamu kontrolu nad celým procesom zamestnanci sa učia prácou požiadavky na digitalizáciu sa nemusia stanoviť vopred a priebežne sa práca zlepšuje zaručené je bezpečné a správne zaobchádzanie materiál a pomôcky sú dostupné inštitúcia platí náklady namiesto výsledkov, ktoré inštitúcia platí za výrobok obvykle za určenú cenu za obrázok obmedzovanie nákladov a malé riziká dodávateľ môže manipulovať s veľkým množstvom materiálu dodávateľ znáša náklady na odborné znalosti, školenia a technologické zastaráván ie dostupnosť širokej škály možností a služieb inštitúcia eliminuje jednu fázu procesu; 25 zahŕňajú náklady na odbornú prípravu, technologické zastarávanie a prestoje investície do nákupu a údržby vybavenia potreba špecializovaného personálu cena za obrázok nie je definovaná inštitúcia nerozvíja vlastné hĺbkové znalosti skúsenosti o digitalizácii otázna je bezpečnosť, preprava a manipulácia so dokumentmi Odporúčania Digitalizácia vlastnými silami sa odporúča, ak: Outsourcing sa odporúča, ak: zbierky nie je možné dať mimo inštitúcie ak je digitalizácia nenáročná ak je v inštitúcii špecializovaný personál a infrastruktura ak ide o dlhodobejší projekt nie je možné digitalizovat' originály v rámci inštitúcie plánovanie zahŕňa veľké množstvo práce v krátkom čase existujú v inštitúcii obmedzenia týkajúce sa priestoru, infrastruktury a personálu Outsourcovaná digitalizácia sa môže vykonať v priestoroch knižnice alebo na mieste vybranej spoločnosti. Ak sa digitalizácia vykonáva v spoločnosti, musí premiestnenie písomností povoliť štatutár inštitúcie a príslušný vedúci. Vrátenie písomností musí byť oznámené štatutárovi a supervízorovi. Tok činností súvisiacich s digitalizáciou mimo inštitúcie zahŕňa: • Definovanie parametrov skenovania • Vypracovanie štúdie uskutočniteľnosti alebo ponuky • Preskúmanie technických a logistických aspektov • Usporiadanie digitalizačného súboru • Príprava dokumentov • Školenie personálu a prevádzkovateľov zapojených do kontroly kvality • Vytvorenie prototypu digitalizácie (technologický model) • Kontrola kvality • Oprava chýb a chýb • Premiestnenie dokumentov • Dodávka produktu • Konečná kontrola kvality Tok in-house digitalizačných aktivít zahŕňa najmä: 26 • Definovanie parametrov skenovania • Nákup vybavenia • Školenie príslušných zamestnancov a operátorov • Preskúmanie technických a logistických aspektov • Usporiadanie digitalizačného súboru • Príprava dokumentov • Vytvorenie prototypu digitalizácie • Kontrola kvality • Oprava chýb a chýb • Premiestnenie dokumentov Prehľad najlepšej praxe možno nájsť napríklad na stránke Minervy: http://www.minervaeurope.org/bestpractices/listgoodpract.htm 3.2 Plánovania příprava procesu digitalizace v knihovně Kultúrne inštitúcie, ako knižnice, múzeá, archívy a organizácie venujúce sa prírodnému a environmentálnemu dedičstvu sú hlavnými dodávateľmi digitálneho obsahu, no musia sa mobilizovať. Ich úsilie je potrebné koordinovať, aby sa čo najlepšie využili existujúce technológie a prispelo sa k tvorbe, využívaniu a poskytovaniu lokálneho kultúrneho obsahu, ktorý vyhovuje potrebám všetkých občanov. Prostredníctvom tohto aktualizovaného plánuje na realizáciu vízie Európskeho kultúrno-informačného priestoru sledovaných šesť cieľov, pričom sa berie do úvahy a ďalej rozvíja predchádzajúci Lundských zásady. Rovnako sa pri plánovaní digitalizácie využívajú aj zistenia a návrhy projektu Minerva a najlepšia prax inštitúcií, ktoré už majú s digitalizáciou praktické skúsenosti. 3.3 Praktické odporúčania V tejto kapitole sú prezentované najdôležitejšie praktické vedomosti získané tímom pre najlepšie praktiky projektu Minerva. Zameriava sa na praktické pravidlá, ktoré by mali organizácie zobrať do úvahy pri začatí, realizácii alebo riadení digitalizačných projektov vo sfére kultúry. Odporúčania sú rozdelené do nasledovných oblastí, z ktorých každá odráža nejakú etapu projektu digitalizácie: 1. Plánovanie projektu digitalizácie 2. Výber zdrojového materiálu na digitalizáciu 3. Príprava na digitalizáciu 4. Zaobchádzanie a práca s originálmi 5. Proces digitalizácie 6. Uchovávanie originálneho digitálneho materiálu 7. Metaúdaje 8. Zverejnenie 9. Práva duševného vlastníctva a copyright 10. Manažment projektov digitalizácie 27 3.4 Projekt Minerva a Lundské zásady Projekt Minerva, začal v roku 2002 pod vedením talianskeho Ministerstva kultúry (zmluva IST 2001-35461). Projekt zahŕňal zástupcov príslušných vládnych ministerstiev alebo centrálnych štátnych agentúr z mnohých členských štátov EÚ so spoločným cieľom presadzovania spoločného prístupu a metodológie digitalizácie európskeho kultúrneho materiálu. Projekt uznáva jedinečnú hodnotu európskeho kultúrneho dedičstva a strategickú úlohu, ktorú môže zohrávať v rastúcom priemysle digitálneho priemyslu v Európe. Uznáva aj hodnotu koordinácie úsilia národných vlád a kultúrnych organizácií, aby sa zvýšila úroveň syntézy a synergie digitalizačných iniciatív. 3.5 Lundské zásady Dňa 4. apríla 2001 sa stretli predstavitelia a experti Európskej komisie a členských štátov v meste Lund vo Švédsku (v rámci švédskeho predsedníctva), aby diskutovali o tom, ako koordinovať a pridať hodnotu národným programom digitalizácie na európskej úrovni. Stretnutie vyústilo do publikovania súboru všeobecných zásad, ktorými sa majú riadiť verejné digitalizačně iniciatívy a ich koordinácia. Tieto zásady (Lundské zásady) boli transformované do Lundského akčného plánu, ktorý stanovuje zoznam úkonov, ktoré majú vykonať členské štáty, Komisia, Komisia a členské štáty spoločne, aby sa vylepšili podmienky digitalizácie v Európe. (1) Zabezpečiť vedúcu úlohu národných pamäťových inštitúcií v dynamickom a meniacom sa prostredí, v ktorom sa uskutočňuje rýchly technologický a ekonomický rozvoj. (2) Posilniť koordináciu a presadzovať silnejšie prepojenie medzi digitalizačnýmiiniciatívami inštitúcií, systémov a projektov prostredníctvom riadiaceho grémia zriadeného pri ministerstve kultúry (Rada pre informatizáciu a digitalizáciu) (3) Pokračovať v snahe o prekonávanie fragmentáciea duplikáciedigitalizačnýchaktivít a o maximalizáciusynergií sprístupnením štandardov, metodík a odporúčaní pre projekty digitalizácie (4) Hodnotiť a identifikovať vhodné modely, spôsoby financovania a politické prístupy na udržanie rozvoja a stratégie dlhodobého uchovávania. (5) Presadzovať kultúrnu a jazykovú rôznorodosťprostredníctvom tvorby digitálneho obsahu. (6) Zlepšovať on-line prístup ku kultúrnemu obsahu. (7) Prispôsobovať digitálny obsah pre špecifické využívanie (napr. v školách). 3.6 Manažérske plánovanie projektu digitalizácie Plánovanie projektu je prvým krokom akéhokoľvek projektu digitalizácie. Čas venovaný plánovaniu sa oplatí tak, že sa uľahčí riadenie a realizácia projektu. Za normálnych okolností je potrebné odpovedať na nasledovné otázky: • Čo sa musí urobiť? 28 . Kto to bude robiť? • Kde sa to bude robiť? • Kedy sa to bude robiť? • Ako sa to bude robiť? Projekt digitalizácie musí mať jasne špecifikované ciele, pretože majú priamy vplyv na výber, copyright a zverejnenie materiálu. Do projektu by mal byť zapojený vhodný personál s vyhovujúcimi vedomosťami a zručnosťami. Mal by zahŕňať aj plán školení, aby sa zaručila dostatočná odbornosť, ktorú môže projekt vyžadovať. Projekt by sa nemal začať bez toho, aby sa uskutočnil prieskum iných projektov v rovnakej oblasti. Takýto výskum identifikuje problémy, ktorým sa treba venovať, bude stimulovať nové nápady a oblasti, ktoré ešte neboli zvážené a pridá hodnotu výstupu projektu. Výskum taktiež pomôže určiť množstvo práce, ktorú treba naplánovať pre realizáciu projektu pomocou stretnutí alebo inej komunikácie s organizáciami, ktoré realizovali podobné projekty. Takáto interakcia pomôže stanoviť, či vaša organizácia má potrebný personál, vedomosti a technologickú infrastrukturu na realizáciu projektu, alebo či bude potrebné školenie a iná príprava. Je výhodné investovať určitý čas do zistenia statusu copyrightu materiálu, ktorý sa ma digitalizovat'. Neúspech pri získaní povolenia digitalizovat' a zverejniť na webe môže spôsobiť neúspešnosť celého projektu, bez ohľadu na technickú odbornosť a skúsenosti. Môže sa zvážiť aj možnosť realizácie technického pilotného projektu na začiatku projektu, aby sa zabezpečilo to, že akékoľvek anomálie alebo problémy pri technickej realizácii sa odstránia pred spustením hlavného projektu 3.7 Zdôvodnenie projektu Definícia problému Každý projekt digitalizácie má vlastné zdôvodnenie. Medzi dôvody často patrí sprístupnenie kultúrnych zbierok cez internet, ktoré by boli v opačnom prípade využívané len málo. Ďalším dôvodom je ochrana krehkých zbierok pred opotrebovaním pri bežnom používaní. V ďalších prípadoch sú projekty digitalizácie realizáciou spolupráce medzi organizáciami a zahŕňajú zriadenie portálov, sietí atď. Dôvody projektu majú silný vplyv na kritéria výberu materiálu, ktorý sa má digitalizovat'. Často majú vplyv aj na riadenie projektu, metaúdaje a on-line zverejnenie výstupu projektu (ak k nemu dôjde), kontrolu kvality atď. „Prečo" je najdôležitejšou otázkou, ktorú si treba položiť pred začatím projektu digitalizácie. Pragmatické návrhy • Projekt musí mať konkrétne, explicitné ciele, ktoré sa musia zdokumentovať. • Ciele projektu by mali byť realistické v porovnaní s prostriedkami, ktoré sú k dispozícii. 29 • Všetky kroky projektu sa musia overiť podľa týchto cieľov, aby sa zaručilo, že práca vykonávaná v projekte prispieva k dosiahnutiu splnenia smerníc. • Ciele projektu by mali dokumentovať hodnotu, akú projekt prinesie inštitúciám zapojeným do projektu. Ak sa má do projektu investovať čas a úsilie, musí byť jasné zaradenie projektu z inštitucionálneho pohľadu. 3.8 Ľudské zdroje Definícia problému Pred tým, ako môže projekt začať, je dôležité, aby bol k dispozícii personál potrebný pre prácu na projekte. Mnohé kultúrne inštitúcie nemajú veľký počet zamestnancov s dostatkom voľného času na vykonávanie digitalizácie mimo ich zvyčajnej pracovnej náplne. Aj vedomosti potrebné pre projekt digitalizácie sa môžu líšiť od zručností potrebných na vykonávanie bežných úloh každodennej prevádzky. Preto je potrebné identifikovať hardvérové a softvérové riešenia potrebné pre projekt digitalizácie. Pragmatické návrhy • Zabezpečte dostatočný počet zamestnancov na realizáciu projektu • Prideľte zamestnanca ku každej úlohe alebo pracovnému balíku projektového plánu. • Identifikujte požiadavky na školenie, vrátane IT školení a inštruktáži o zaobchádzaní s jemnými artefaktmi a dokumentmi. • Ak je to možné, realizujte školenia pred začatím projektu pomocou tých istých hardvérových a softvérových riešení, ktoré sa budú používať počas projektu (firmy niekedy ponúkajú technické riešenia zdarma na školenie, na krátky čas sa dajú prenajať aj potrebné zariadenia) • Zamerajte sa skôr na malé jadro šikovných zamestnancov nadšených projektom ako na veľkú skupinu "príležitostných" zamestnancov. Poznámky/komentáre Aj keď je materiál prezentovaný v tomto odporúčaní spoločný pre všetky scenáre riadenia digitalizácie, je potrebné túto vec zopakovať: existuje reálne riziko, že môžu vzniknúť nenapraviteľné škody na nenahraditeľných artefaktoch a dokumentoch pri nesprávnom zaobchádzaní. 3.9 Výskum Definícia problému Bez ohľadu na rozsah konkrétneho projektu sa dá predpokladať, že v minulosti sa už realizovali podobné projekty. Je vysoká pravdepodobnosť, že informácie o takýchto projektoch sú dostupné na internete alebo publikované inde v časopisoch a pod. Výskum v danej oblasti môže ako súčasť procesu plánovania projektu pomôcť identifikovať hardvérové a softvérové riešenia prichádzajúce do úvahy, naplánovať pracovný postup a proces a vyhnúť sa problémom a prekážkam, ktoré sa vyskytli v iných projektoch. 30 Pragmatické návrhy • Už vo fáze plánovania vykonajte prieskum všetkých podobných projektov, ktoré sa zaoberajú podobným záležitosťami ako plánovaný projekt. Na internete je ich mnoho. • Výskum pomáha predchádzať chybám. Môže skontaktovať projektový tím s inými, ktoré uskutočnili podobné projekty a poskytnúť možnosť učiť sa z ich skúseností. • Vlastný výskum pridáva uznanie a hodnotu výstupu akéhokoľvek projektu. Výsledok projektu zlepší aj štúdium diel iných, aby sa zaručilo, že projekt sa nebude uskutočňovať vo vákuu. Poznámky/komentáre Mnohé kultúrne projekty digitalizácie sú financované z verejného rozpočtu a je na ne kladená požiadavka, aby ich zistenia a správy boli zverejnené. Publikovanie môže byť na internete, alebo cez iné vhodné médiá. Projektové tímy sa často s radosťou delia o ich skúsenosti a výsledky - pridáva to hodnotu ich dielu. 3.10 Hrozby. Riziká Definícia problému Na začiatku akéhokoľvek projektu je potrebné naplánovať, ako sa zaručí úspešnosť výstupu. Cieľom však nie je odstrániť všetky hrozby ale pripraviť sa na ne tak, že sa vytvorí projektový rámec, v rámci ktorého bude možné efektívne reagovať na nepredvídané okolnosti. Cieľom je vytvorenie projektu s personálom a postupmi, ktoré sa môžu prispôsobiť zmenám. Preto je do plánovania projektu potrebné zahrnúť analýzu rizík. Pragmatické návrhy • Distribúcia digitalizovaných obrazov cez Internet je forma publikovania a preto sa na ňu vzťahujú autorské zákony (copyright) a právo duševného vlastníctva (IPR). Pri analýze rizík sa kladú nasledujúce otázky: o Aké by mohli byť následky použitia materiálu bez špecifického povolenia? o Vyvinulo sa úsilie na zistenie držiteľa práv? o V prípade porušenia copyrightu, aký by mohol byť dopad na projekt? • Pri verejných informáciách je dôležitou otázkou právna hodnota informácie. Aké kroky sa podnikli na zaručenie toho, že digitalizovaný zdrojový materiál nie je narušený a že sa vyprodukoval oprávnenou inštitúciou? • Musí sa zaručiť autenticita. Aké úkony sa podnikli na udržiavanie obrazových súborov a aké nástroje sa použili? • Financovanie projektu by mohlo predstavovať problém a možné ohrozenie možností dosiahnuť ciele projektu. 31 • Kľúčovou je otázka úrovne zručností v projekte. Je možné najať nové vysoko zručné a skúsené osoby? Ak nie, aký to bude mať vplyv na projekt? 3.11 Výber zdrojového materiálu na digitalizáciu Výber materiálu na digitalizáciu je dôležité rozhodnutie. Ideálnou voľbou je zvyčajne digitalizácia celej zbierky alebo fondu, to je však realizovateľné len v ojedinelých prípadoch, preto je nutný určitý výber. Kritéria výberu sa budú meniť v závislosti od cieľov projektu digitalizácie, napríklad on-line zdroj pre školy sa bude riadiť učebnými osnovami, múzeá vyberú najznámejšie predmety na zvýšenie počtu návštevníkov alebo najvzácnejšie artefakty, aby sa znížil dopyt po „blízkom" skúmaní. Toto samozrejme nie sú jediné problémy, ktorým sa treba venovať pri stanovení kritérií výberu -dôvody výberu určitého materiálu sa budú meniť od projektu k návrhu, rovnako aj dôvody, prečo nedigitalizovať Medzi príklady ďalších dôvodov patria právne obmedzenia, inštitucionálna politika, technická náročnosť digitalizácie, existencia digitálnej kópie atď. 3.12 Stanovenie kritérií výberu Definícia problému Pri plánovaní projektu digitalizácie je kriticky dôležitá voľba, aký materiál sa má digitalizovat'. Kritéria výberu budú závisieť od cieľov projektu, rovnako aj od technických a finančných obmedzení, otázok copyrightu a práv duševného vlastníctva a od iných projektov v danej oblasti. Pragmatické návrhy • Musia sa stanoviť kritériá na výber materiálu, ktorý sa má digitalizovat'. Kritériá výberu musia odrážať celkové ciele projektu. Mali by sa zvážiť minimálne nasledujúce kritériá: o Prístup k materiálom by inakšie nebol možný, alebo by bol obmedzený. o Širší a ľahší prístup k veľmi obľúbenému materiálu o Stav originálov o Uchovávanie chúlostivých materiálov tým, že sa sprístupnia ich digitálne verzie ako alternatíva o Téma projektu o Copyright a práva duševného vlastníctva o Dostupnosť existujúcich digitálnych verzií o Náklady na digitalizáciu o Vhodnosť zdrojového materiálu na prezeranie v režime online • Kritériá výberu musia byť explicitné a prediskutované všetkými zainteresovanými účastníkmi pred výberom alebo digitalizáciou. • Kritériá výberu sa musia plne zdokumentovať, aby boli všetky rozhodnutia digitalizovať/nedigitalizovať jasné počas celého projektu. 32 Poznámky/komentáre Kultúrne organizácie majú bežne jadro vysoko hodnotného a atraktívneho materiálu, ktorý je bez diskusie zahrnutý do projektu digitalizácie a jeho úlohou je reprezentovať danú inštitúciu. Veľká časť všetkých digitalizačných projektov majú za cieľ zverejnenie na webe. To znamená, že je potrebné zvážiť záležitosti copyrightu a práv duševného vlastníctva týkajúcich sa akéhokoľvek materiálu ešte pred výberom. 3.12.1 výber podľa kritérií Definícia problému Po stanovení kritérií, aký materiál sa má digitalizovat' sa môže začať vlastný proces výberu. Táto príručka navrhuje, ako sa má tento proces riadiť. Pragmatické návrhy • Každý kandidát na digitalizáciu sa musí hodnotiť podľa kritérií výberu. Mali by sa poznamenať prípady, kedy sa kritérium výberu nesplnilo. Ak budú v takýchto prípadoch odmietnuté dôležité alebo kritické objekty, môže sa stať, že bude potrebné znovu revidovať kritériá. Ak sa toto vyskytne, nové kritériá by sa mali zaznamenať. • Po výbere objektu na digitalizáciu by sa mali podrobnosti o ňom zadať do bázy poznatkov riadenia digitalizácie Poznámky/komentáre V tomto štádiu sa projekt zaoberá každým dokumentom/objektom, ktorý sa má digitalizovat', po prvý krát. Toto je optimálna príležitosť pre projekt, aby vytvoril bázu poznatkov o všetkých dokumentoch/objektoch, ktoré sú v rozsahu projektu. Takáto báza poznatkov podporí manažment projektu a pomôže zaručiť, že na zaobchádzanie so vzácnymi artefaktmi boli nadobudnuté odborné znalosti a obsahuje aj také bežné informácie, ako je umiestnenie originálov. 3.12.2Príprava na digitalizáciu Pred tým, ako môže začať digitalizácia, musí sa pripraviť vhodné prostredie a systém hardvéru a softvéru. Medzi prvky takéhoto prostredia patrí hardvér pre samotný proces digitalizácie (skenery, digitálne fotoaparáty, stojany, iný hardvér), počítačová infrastruktura, ku ktorej je pripojený hardvér, softvér na zachytávanie a spracovanie obrazu, rovnako aj softvér pre metaúdaje a kontrolu metaúdajov. Pracovné prostredie by malo vyhovovať digitalizovanému materiálu a zvláštnu pozornosť je potrebné venovať svetlu, vlhkosti, vibráciám, rušivým vplyvom, presunu originálov atď. 3.13 Hardvér Definícia problému Je potrebné zabezpečiť vhodné technické zariadenia na digitalizáciu, akými sú zariadenia na zachytenie digitálneho obrazu (digitálne fotoaparáty a kamery, skenery na knihy, dokumenty alebo mikrofilmy, audio a video hardvér) pripojené na vhodnú počítačovú platformu (počítač, operačný systém, sieť). Je možné 33 rozlíšiť dve rôzne metódy digitalizácie: skenovanie a používanie digitálnych kam ier/fotoaparátov. Pragmatické návrhy • Pred začatím digitalizácie sa musí nainštalovať vhodný hardvér a skontrolovať jeho kvalita a funkčnosť. • Na účely ohodnotenia zariadení na zhotovenie digitálneho obrazu by sa mali použiť relevantné skúšobné materiály. • Kým sa hardvérové prostredie úplne nepripraví a neodskúša na necitlivých materiáloch, nemali by byť prítomné žiadne zdrojové materiály. • Pre materiál, ktorý sa nepoškodí přitlačením o tvrdý povrch, bude vhodný plošný skener (napríklad rozviazaný tlačený materiál a rukopisy, fotografie) • Na účely projektu by sa mal zaobstarať čo najväčší skener. Nemalo by sa pristupovať k mozaikovitému skenovaniu alebo k skladaniu materiálov. Je potrebné mať na pamäti, že preprava veľkého skenera (napr. AO) nie je triviálna záležitosť. • Plošný skener by sa mal použiť len vtedy, ak je materiál plochý a nepoškodí sa pri pridŕžaní na plochom tvrdom povrchu. Pre mnohé viazané dokumenty bude vhodný skener s knižnou kolískou, až do príslušnej veľkosti. Mnohé materiály, ktoré nie sú ploché, ani vhodné pre knižnú kolísku, budú na zhotovenie obrazov vyžadovať digitálny fotoaparát/kameru. • Pri použití skenera by malo mať toto zariadenie aspoň taký rozsah, ako je veľkosť dokumentu/objektu, ktorý sa má skenovať. • Zhotovenie obrazu by sa malo realizovať pri čo najvyššom primeranom rozlíšení. Takto budú vznikať veľké súbory, z ktorých sa môžu extrahovať menšie verzie - napríklad na účely prezentácie cez Web. Z obrazu s nižšou kvalitou nie je za žiadnych okolností možné získať obraz s vyššou kvalitou. • Definícia "primeraného" rozlíšenia závisí od povahy snímaného materiálu a od spôsobov využitia digitálnych obrazov. Napríklad ak sa skenované obrázky majú použiť len ako miniatúrne náhľady, skenovať sa môže pri nižšom rozlíšení. Vo všetkých prípadoch však musí rozlíšenie umožniť zachytenie najvýznamnejších detailov dokumentu alebo predmetu. Je ťažké odôvodniť použitie vyššieho rozlíšenia, ak skenovanie s vyšším rozlíšením neposkytuje viac informácií ako skenovanie pri nižšom rozlíšení. • Zachytávaním obrazu by sa mal vytvárať formát súborov, ktorý je bezstratový, čiže nekomprimovaný. Typicky sa používa formát TIFF (Tagged Image File Formát). • Projekt by mal použiť čo najvýkonnejšiu a flexibilnú digitálnu kameru (fotoaparát), akú je možné zaobstarať. Žiadnym ďalším spracovaním nie je možné prekonať obmedzenia digitalizačného zariadenia. Je potrebné poznamenať, že digitálny "zoom" neposkytuje lepšiu kvalitu obrazu, len sa ním zobrazuje menej bodov (pixelov) na jednotku plochy zobrazenia. Na 34 zachytenie detailov sú najdôležitejšie tieto tri parametre: počet bodov (pixelov) v obraze, bitová hĺbka a kvalita použitých optických šošoviek. • Je dôležité mať k dispozícii vhodné stojany na uchytenie a pridržanie materiálov pri digitalizácii. • Mala by sa použiť digitálna kamera/fotoaparát s účelovým stojanom. Kamera alebo fotoaparát by mali byť nainštalované na trojnohom statíve a podľa potreby by mali mať doplnkové osvetlenie, filtre a pod. • Fotografická rovina a rovina materiálu musia byť rovnobežné, aby sa obraz neskreslil. • Súčasťou fotografických príprav musí byť vhodné osvetlenie. Je málo pravdepodobné, že bude postačovať len okolité svetlo. Svetelné podmienky musia byť stabilné. • Na zníženie skreslenia farieb by sa mali použiť vhodné filtre. • K zariadeniam musí byť pripojený počítač s veľkým úložným priestorom. Údaje na tomto počítači by sa mali v krátkych a pravidelných intervaloch zálohovať. • Ak sa musí obraz skenovať po častiach, mal by sa ponechať priestor niekoľko centimetrov na prekrytie, aby sa zabránilo vzniku medzier medzi jednotlivými časťami. Pre všetky časti by sa mali použiť rovnaké nastavenia, aby nedošlo ku efektu „zlátaniny". Poznámky/komentár Použitý hardvér je hlavným obmedzením kvality konečného výstupu projektu digitalizácie. Pokiaľ projekt sa v rámci projektu nedigitalizujú len ploché materiály, ktoré sa dajú skenovať bez poškodenia väzby, rámov alebo samotného materiálu, bude potrebné použiť digitálnu kameru/fotoaparát. Môže sa použiť aj analógový fotoaparát a následne z neho skenovať diapozitívy, no digitálny fotoaparát má mnohé výhody z hľadiska času, úsilia a kvality. Ak má projekt obmedzený životný cyklus, môže byť výhodný prenájom hardvéru. Ďalšou alternatívou je využitie externých agentúr na realizáciu digitalizácie v prospech kultúrnych subjektov zapojených do projektu. 3.13.1 Skenery Skener (z angl. scanner) je vstupné zariadenie počítača určené na digitalizáciu plošných predlôh, predovšetkým papierovychdokumentov, obrázkov, fotografií alebo iných predlôh obsahujúcich grafické alebo textové informácie. Skener je teda elektromechanické (elektronické) hardvérové zariadenie premieňajúce obrazové (reálne) body do digitálnej formy čiže počítačom spracovateľných dát. 3.13.1.1 Delenie skenerov Skenery si môžeme rozdeliť podľa viacerých hľadísk. 3.13.1.2 Podľa predlohy plošné, predloha sa kladie na plochu, obvykle sklenenú platňu ručné, snímacím prvkom sa ručne pohybuje po snímanej ploche 35 bubnové, predloha sa vkladá do skleneného valca fotografické, predloha sa sníma podobne ako fotoaparátom - odfotografuje sa bezkontaktné, laserové - sníma sa len modulované laserové svetlo odrazené od predlohy prechodové, predloha prechádza štrbinou okolo snímacieho prvku (ako pri faxe) filmové, snímanou predlohou sú negatívne filmy a diapozitivně filmy 3.13.1.3 Podľa snímača CCD skenery. Snímač CCD svetlocitlivý polovodičový čip. Predloha je osvetlená výbojkou. Obraz sa odráža od sústavy zrkadiel, prechádza objektívom a dopadá na CCD snímací prvok. CIS skenery (Contact Image Senzor): snímací prvok je tvorený jedným riadkom snímacích senzorov umiestnených čo najbližšie k predlohe. Zdroj svetla zabezpečujú LEDdiódy integrované v čítacej hlave. laserové CCD - snímač sníma iba špecificky modulované monochromatické laserové svetlo odrazené od predlohy. Používa sa pre snímanie čiarového kódu a detekciu tvaru predmetov. 3.13.1.4 Podľa komunikačného rozhrania USB, pripojenie je vytvorené zbernicou USB (Universal Seriál Bus) FireWire, málo používané, iba pre špeciálne aplikácie. Používa interface 1394 FireWire SCSI Small Computer System Interface Paralelný port, pripojenie je cez centronics, paralelný port Bezdrôtové, používajúce technológie IrDA, Wi-Fi, Bluetooth 3.13.1.5 Snímač čiarového kódu Snímač čiarového kódu (anglicky barcode reader) je zvláštna forma skeneru umožňujúca čítať tzv. čiarový kód, čo je do binárnej formy zakódovaná číselná, alebo textová informácia zobrazená vo forme hrubších a tenších čiar a medzier. Pre bližšie informácie pozri snímač čiarového kódu. 3.13.2 Druhy skenerov S pomocou skenera je možné digitálne spracovávať a ďalej upravovať tlačené obrázky (napr. fotografie, obrázky z časopisov a pod.). Výstupom je obraz predlohy vo forme binárneho obrázku, ktorý ovládač skenera umožňuje uložiť vo formáte bežne používanom iným softvérom (bmp, jpeg, tiff, pcx, png, gif a pod.). Súčasťou skeneru je jeho ovládač, ako aj tzv. twain interface, ktorý umožní používať driver skenera a tým skenovať obrázok priamo do príslušnej aplikácie. Obvykle je ku skeneru pribalený aj jednoduchý softvér na úpravu a tlač obrázkov, niekedy tiež tzv. OCR softvér, slúžiaci na strojové čítanie textu (obrázok textu sa prekonvertuje na text). 36 3.13.2.1 Ručný skener Tiež hand-held scanner. Prvou kategóriou sú ručné skenery, ktoré sa dnes používajú len v obmedzenom rozsahu - väčšinou len tam, kde je potrebné skener prenášať - mobilné riešenia. Zariadenie je podobné väčšej myši, ktorou užívateľ prechádza cez obrazovú predlohu a zosnímané dáta odošle do pripojeného počítača (alebo uloží do integrovanej pamäte). Výhodou sú malé rozmery, nevýhodou je hlavne nízka kvalita snímania a malá šírka snímania (~ 10 cm). Ručné skenery sú náročné na spôsob ovládania, pretože užívateľ musí pohybovať skenerom po predlohe ručne. Presnosť snímania je potom daná presnosťou, a plynulosťou pohybu ruky. 3.13.2.2 Prechodový skener Prechodový skener sníma dokument na rovnakom princípe ako faxový prístroj. Predloha (obvykle len jeden hárok papiera štandardnej hrúbky)sa vloží do skenera, ktorý ho posúva cez štrbinu okolo CCD snímacieho prvku. Táto skupina skenerov je určená na snímanie papiera s formátom maximálne A4. Výhodou sú malé nároky na miesto, nevýhodou je nemožnosť snímania predlohy z časopisu alebo knihy. Obvykle sa s nimi stretávame iba ako so zabudovanou súčasťou iných zariadení (fax, tlačiareň a pod.) 3.13.2.3 Plošný skener Flatbet scanner. V súčasnosti sú najrozšírenejšou skupinou stolné plošné skenery. Tieto snímajú predlohu, ktorá je položená na sklenenú dosku, pričom sa pod touto doskou pohybuje snímacia hlava. Plošné skenery sú konštrukčne náročné, ale poskytujú kvalitný výstup pri snímaní predlôh. Ich nevýhodou sú väčšie nároky na miesto. Plošné skenery sa vyrábajú vo formátoch A5, A4 a A3. Bývajú aj súčasťou multifunkčnych zariadení, ktoré obsahujú navyše aj tlačiareň. 3.13.2.4 Filmový skener Filmový alebo kinofilmový skener slúži na snímanie negatívov alebo diapozitívov. Na zosnímanie malého formátu obrázku z kinofilmu do vysokého rozlíšenia sa vyžaduje iná technológia snímania ako pri plošných skeneroch. Slúži pre snímanie jednotlivých políčok filmu s použitím vysokého rozlíšenia - minimálne 2400 dpi. Vzhľadom k špecifickému účelu sú používané iba profesionálne. 3.13.2.5 Bubnový skener Drum scanner. Zvláštnou kategóriou sú bubnové skenery - sú určené pre profesionálne snímanie. Predloha sa vloží do skleneného bubna, ktorý sa roztočí. V bubne sa nachádza snímacie zariadenie, ktoré predlohu sníma v kružniciach. Ich nevýhodou je vysoká cena, a preto sú používané hlavne pre snímanie veľmi veľkých predlôh, prípadne tam, kde je potrebná vysoká kvalita výsledku. Táto technológie je najstaršou snímacou technológiou. 3.13.2.6 3D skener Technológia umožňujúca pomocou laserových lúčov nasnímať trojrozmerný objekt. Využíva sa nie len snímanie povrchu objektov, ale laserom je zároveň odmeraná presná vzdialenosť k nim. Táto technológia sa používa pre získanie 37 trojrozmerného obrazu snímanej predlohy napr. sochy, miestnosti a pod. Táto technológia je veľmi nákladná a preto iba pre profesionálne využitie. 3.13.2.7 Konštrukčné časti Najčastejšie používaným skenerom je plošný skener, ktorý býva aj súčasťou multifunkčného zariadenia. predloha odraz svetla od predlohy I C /\ ' I sklo skenera zdroj svetla - lampa pevné zrkadlo odrazené svetlo {j pohyblivé zrkadlo snímač CCD Obrázok 1 Schéme procesu snímania skenerom 3.13.2.8 Snímacia hlava Snímacia hlava je vozík pohybujúci sa po koľajničkách vytvorených presne brúsenými vodiacimi tyčami. Vozík má šírku podľa typu skenera na celú šírku snímaného média. Pohon zabezpečuje krokový motor a prevod lankom, alebo ozubeným remeňom. Horizontálne rozlíšenie je teda dané snímacím prvkom, vertikálne počtom krokov motora vozíka. Preto je často u skenerov udávané rozlíšenie skenera vo forme násobku napr. 300 x 600 dpi. Rýchlosť snímania skenera je teda daná rýchlosťou presunu vozíka, rýchlosťou zosnímania riadku a rýchlosťou prenosu dát do počítača. Na snímacej hlave sa nachádzajú všetky podstatné časti skenera - osvetlenie predlohy, optická sústava a snímací prvok - senzor 3.13.2.9 Osvetlenie Snímače pracujú len v určitom rozsahu osvetlenia predlohy, preto väčšina skenerov si nevystačí s prirodzeným svetlom a vyžaduje prídavné nasvietenie. Osvetlenie musí byť čo najrovnomernejšie a nesmie posúvať farebné spektrum predlohy (vernosť farebného podania). Plošné skenery používajú studené katódové svetlo - katódová lampu, resp. výbojku - žiarivku. Výhodou je vysoká intenzita produkovaného svetla, nevýhodou však práve nerovnomerné osvetlenie (najviac svetla v strede). Nerovnoměrnost' sa kompenzuje nahriatím lampy, sústavou zrkadiel a elektronicky. CIS technológia požíva na osvetlenie predlohy LED diódy umiestnené hneď vedľa snímacích elementov. Všetky diódy sú rovnaké, čo zaručuje rovnomerné osvetlenie po celej šírke snímaného dokumentu. Osvetľovací a snímací mechanizmus sú obvykle integrované v spoločnej pohyblivej hlave, ktorá sa pomocou motora postupne presúva popod predlohu po jednotlivých krokoch daných nastaveným rozlíšením a snímajú jeden riadok za druhým. 38 3.13.2.10 Snímač Odrazené svetlo je optickou sústavou (ktorá je taktiež súčasťou snímacej hlavy) premietnuté na CCD snímací prvok (podobný ako u digitálneho fotoaparátu), ktorý premieňa hodnoty zo svetla na dáta. Kombinácia žiarivka - optická sústava - snímací prvok CCD je najpoužívanejšou technológiou, ktorú súhrnne nazývame CCD. Skenery vybavené týmto spôsobom snímania sú o čosi drahšie, chúlostivejšie na poškodenie, ale majú lepšiu farebnú citlivosť a snímanú hĺbku. Lacnejšou technológiou snímania je technológia CIS. Ide vlastne o dve rady diód - jedna rada vysoko svietivých LED diód a druhý rad zo snímacích polovodičových prvkov. Kladom sú nižšie výrobné náklady a teda aj nižšia cena CIS skenerov, menšie rozmery a väčšia odolnosť. Nevýhodou je ale naopak nižšia svietivosť a citlivosť, ktorá sa potom prejaví pri snímaní jemných farebných odtieňov. Snímací prvok CIS však časom nestráca svoje snímacie vlastnosti ako je tomu u skenerov s CCD snímacími prvkami najmä s ohľadom na žiarivku. 3.13.2.11 Prevodník Jeho úlohou je prevod obrazovej informácie zosnímanej snímačom do elektronickej formy. Snímač pracuje tak, že intenzita svetla, ktoré dopadá na jeho jednotlivé bunky je premenená na elektricky náboj s rôznou intenzitou. Každý bod elektronickej podoby obrazu je zložený z troch informácií - intenzity troch základných farieb - R (červená), G (zelená) a B (modrá). Každý bod snímanej predlohy je teda „meraný" tromi bunkami snímača - každá bunka pomocou špeciálnych filtrov vyhodnocuje jednu z uvedených farebných zložiek bodu. V plošných skeneroch sú použité tzv. riadkové CCD alebo CIS snímače, použitý snímač (počet snímacích elementov v riadku) teda určuje maximálne možné rozlíšenie skenera. Kvalita skenera je priamo závislá na kvalite použitého snímača a počtu jeho buniek, tzv. pixelov. V súčasnej dobe väčšina plošných skenerov používa snímače s rozlíšením 600, 1 200 alebo 2 400 dpi. Označenie dpj (dot per inch) udáva, koľko bodov je snímač schopný nasnímať na jednotku vzdialenosti jedného palca (2,54 cm). CCD snímač s rozlíšením 600 dpi má teda 1 800 buniek (každý bod je snímaný trikrát) na každých 2,54 cm. Plošný skener určený pre formáty A4 má približne 15 000 buniek. Skenery umožňujú aj tzv. interpoláciu, čiže predlohu zosnímanú na nižší počet dpi prepočítajú na vyšší počet s rešpektovaním prechodov, hrán a pod. Každý pôvodne vyhodnotený bod rozdelí na niekoľko ďalších bodov a na kvalite programového vybavenia potom záleží, ako dobre si skener poradí s farebnými odtieňmi pridelenými novým bodom. Tento proces však zvládne väčšina programov pre úpravu obrázkov, a preto využitie tejto funkcie skenera je malé. Kvalitu výstupu zo skenera ovplyvňuje najviac jeho optické rozlíšenie a tým aj ostrosť výsledného elektronického obrazu. Okrem počtu buniek na snímači je dôležitá aj jeho kvalita, ktorá je reprezentovaná bitovou hĺbkou. Táto vlastnosť je ako verne schopný prevodník obrazovej informácie na elektronickú reprodukovať farby. Udáva, koľko možných hodnôt môže mať elektrický náboj produkovanými jednotlivými bunkami snímača. Udáva sa v bitoch a väčšie číslo udáva väčší počet farieb, ktoré je schopný skener rozpoznať. V praxi sa u 39 farebných skeneroch stretávame s hodnotami 24 až 48 bitov. Snímané údaje sú spracované procesorom a cez komunikačný interfejs odoslané do počítača. 3.13.2.12 Použitie Kritériom pre použitie skenera je rozsah jeho používania - požiadavky na rýchlosť, objem snímaných dokumentov, rozlíšenie, účel snímaného obrázku a pod. Ďalším dôležitým kritériom je jeho cena a možnosť technickej podpory a servisu. Najväčšia časť domácich a kancelárskych užívateľov bude pre spracovanie grafických a textových predlôh dostačujúce rozlíšenie 600 dpi, pre náročnejších 1 200 resp. 2 400 dpi, ktoré dnes ponúka väčšina modelov. Pri voľbe rozlíšenia je dôležitá skutočnosť, že obrázky s vyšším rozlíšením zaberajú viac miesta v operačnej pamäti a pri práci ale najmä viacej miesta na disku pri ukladaní. Taktiež pre pružnú prácu s veľkými obrázkami bude potrebné aj príslušné hardvérové vybavenie. To je zvlášť dôležité pri snímaní predlôh A3. Okrem počítača ovplyvňuje rýchlosť práce práve skener. Väčšina skenerov sníma predlohu o veľkosti formátu A4 v rozmedzí jednej až dvoch minút. Pred vlastným snímaním je však obvykle nutné podľa náhľadu dokumentu nastaviť minimálne oblasť snímania a korekcie - tento náhľad zvládne bežne skener asi za polovicu uvedenej doby. Pokiaľ je potrebné skenovať niekoľko desiatok strán denne, je potrebný skener s rýchlym snímaním a s rýchlym rozhraním. Pri výbere skenera si musíme zvoliť aj typ interfejsu, ktorým pripojíme skener k počítaču. Dnes je takmer výhradne používanú interfejs USB. Pre profesionálne použitie sa ešte využíva aj SCSI rozhranie 3.14 Softvér Definícia problému Po vytvorení digitálnej verzie objektu je pravdepodobné, že výsledný súbor bude požadovať spracovanie pred tým, ako sa bude môcť použiť. Medzi úpravy patria korekcia farby, orezanie obrazu, kompresia na menší súbor (napr. náhľady, obraz na prezentáciu cez web). Pragmatické návrhy • Kalibračný proces má začať ihneď po zapnutí skeneru alebo digitálnej kamery. • Na zúžitkovanie matričných súborov bude potrebný vhodný softvér na spracovanie obrazov. Aj keď digitalizačný hardvér je často poskytovaný s nejakým softvérom, pre projekt digitalizácie nemusí byť dostatočne výkonný a flexibilný. • Požiadavky na softvér závisia na cieľoch projektu. Je vhodné poznamenať, že ak sa matričné súbory akýmkoľvek spôsobom nezmenia, na ich spracovanie sa môžu použiť rôzne typy softvérov. Avšak náklady na čas a úsilie môžu byť významné a zvyčajne prevýšia náklady na výkonnejší softvérový balík. 40 • Projekt by mal získať ten najvhodnejší a najvýkonnejší softvér, ktorý si môže dovoliť. • Absolútne minimum, ktoré musí softvér byť schopný vykonať je: o otvárať veľmi veľké obrazové súbory o meniť rozlíšenie a hĺbku farby o uchovávať viaceré rôzne verzie, s rôznymi veľkosťami súborov. o vyberať a kopírovať časť obrazu a uchovať ho ako iný súbor. o exportovať obrazy v rôznych formátoch súborov, vrátane webových štandardov JPEG a GIF. • Túto úroveň funkčnosti poskytuje niekoľko voľne dostupných softvérových balíkov; avšak investícia do komerčného produktu sa oplatí z hľadiska ušetrenia času, úsilia, dokumentácie a technickej podpory. • Ak má projekt aj zložku optického rozoznávania znakov (OCR), je dôležitá voľba softvéru pre OCR. Všetky úkony spojené s OCR vyžadujú určitú dávku ručných úprav a opráv, spôsob, akým tieto funkcie softvérový produkt podporuje, má významný vplyv na čas a úsilie vyžadované projektom. Lepšie balíky OCR umožňujú prehľad a úpravy na jednej obrazovke, navrhujú opravy zle prečítaných slov. podporujú rôzne spôsoby rozloženia textu a obrazov, obsahujú mnohé slovníky a pod. Oplatí sa zhodnotenie viacerých softvérových balíkov pre OCR, ak projekt zahŕňa viac ako jednu osobu za rok. Poznámky/komentár Správna voľba softvéru ušetrí projektu množstvo času a práce. Ak má projekt značné trvanie (napr. viac ako dve osoby počas viac ako pol roka), je vhodné ohodnotiť viac softvérových balíkov, aby sa vybral produkt, ktorý najlepšie vyhovuje požiadavkám projektu 3.15 Proces digitalizácie Táto kapitola poskytuje praktické odporúčania pre samotný proces digitalizácie. Technické riešenia na digitálne snímanie sa môžu meniť. Detailnejšie je opísaná práca so skenermi, digitálnymi kamerami/fotoaparátmi alebo softvérovými aplikáciami na optické rozoznávanie znakov (OCR), nakoľko ide o oblasti relevantné pre väčšinu projektov. Neuvažuje sa tu o digitalizácii priehľadných originálov (napr. mikrofilm). 41 3.15.1 Používanie skenerov Definícia problému Plošné skenery sú najbežnejším nástrojom na digitalizáciu. Najrozšírenejšie modely A4 a A3 sú relatívne lacné, nenáročné na použitie a ak sa raz zabehne pracovný tok, zvládnu relatívne veľké množstvo materiálu. Veľkoplošné skenery (až do AO) a skenery vybavené knižnými kolískami sú veľmi drahé a požadujú dlhodobé projekty/programy, veľkokapacitnú digitalizáciu alebo nadrozmerný zdrojový materiál. Príklad automatického skenera: https://www.voutube.com/watch?v=Kh7qqyn6QOY Rôzne skenery: https://www.i2s. fr/en/bu/heritage-digitization#categories Pragmatické návrhy • Na plošnom skeneri snímajte len materiály, ktoré sa nepoškodia pri pritlačení o pevný povrch. V prípade pochybností sa poraďte s odborníkmi. • Zabezpečte neustálu a úplnú čistotu sklenenej skenovacej plochy, čím zvýšite kvalitu obrazu a chránite materiál pre znečistením. • Ak je to možné, skenujte len také dokumenty/predmety, ktoré sa celé zmestia na plošný skener alebo skener vybavený knižnou kolískou. • Ak je potrebné skenovať dokument/predmet po častiach, zabezpečte, aby zostalo dostatočné prekrytie umožňujúce znovu zmontovať obraz pri budúcom spracovaní (pomocou mozaikovacieho softvéru). • Otestuje skener a jeho výstup na necitlivom materiáli pred tým, ako začnete skenovať originálny zdrojový materiál. Používateľov tiež vyškoľujte pomocou toho istého necitlivého materiálu. • Zaveďte konvenciu prideľovania názvov súborom vytvorených skenerom - napríklad podľa existujúceho katalogizačného systému - a/alebo pridávania názvov s významom. Názov súboru by mal umožniť mapovanie so zdrojovým dokumentom/predmetom. 42 • Aby sa maximalizovala schopnosť přenosu súborov cez viaceré počítačové platformy, mal by sa používať taký názov súboru, ktorý má osem znakov a po ktorom nasleduje pozostávajúce z maximálne troch znakov. • Pred stanovením toku práce alebo dávkového pracovného procesu vykonajte ucelený proces skenovania a spracovania obrazu, aby ste sa uistili, že výsledkom toku práce je to, čo sa očakáva. • Rozlíšenie a bitová dĺžka by mali byť čo najvyššie, ako je prípustné podľa dôvodu projektu, obmedzení skenera, podmienok na ukladanie údajov a atribútov zdrojového materiálu. • Skenujte pri maximálnej vhodnej hĺbke farby, s tými istými limitmi uvedenými vyššie. • Denne zálohujte pevné disky, na ktorých sú uložené údaje. • Ďalej je dôležitá kontrola kvality digitálneho obrazu a metaúdajov. V čase skenovania je najlepšie zaoberať sa otázkou kvality. Je potrebné mať na pamäti nasledovné body: o Pre jednotlivé skupiny dokumentov/predmetov a ich častí sa musí stanoviť minimálne rozlíšenie. o Preskúmajte zoskenovaný výstup na obrazovke, na papieri, premietacom a v akomkoľvek inom formáte, v ktorom sa môže používať (napríklad na mobilnom zariadení) o Uistite sa, že obrazovky (monitory) sú spoľahlivo vykalibrované. Zabráňte tomu, aby na obrazovke alebo v jej okolí bol iný materiál, ktorý môže mať vplyv na vnímanie dokumentu/predmetu. o Matricové obrazy sa musia vytvárať s viditeľnými mierkami, farebné obrazy alebo obrazy so stupnicou šedej farby musia obsahovať aj štandardizované referenčné hodnoty. Poznámky/komentáre Samotné skenovanie je relatívne nenáročná operácia. Je však užitočné vytvoriť si pracovný tok na zvýšenie efektívnosti a zníženie výskytu chýb. Skenovanie nadrozmerných dokumentov/objektov alebo skenovanie pri veľmi vysokej kvalite vyžaduje veľké investície času a úsilia najeden dokument/objekt. Tie je možné znížiť používaním hardvéru, ktorý vyhovuje povahe dokumentu (napr. veľkoplošný skener, knižná kolíska). V prípade, že nie je k dispozícii veľa prostriedkov na hardvér, vyhraďte na skenovanie dostatok času.. Nemalo by sa zanedbať školenie o práci s nadrozmernými a nepravidelne tvarovanými materiálmi. 43 Obrázok 3 Pracovisko masovej priemyselnej digitalizácie s digitalizačnými robotmi 3.15.2Používanie digitálnych kamier/fotoaparátov Definícia problému Používanie digitálnych kamier/fotoaparátov sa stáva v digitalizačných projektoch čoraz bežnejšie. To vypovedá o ich flexibilite, hlavne ohľadom schopnosti digitalizovat' neploché objekty, akými sú zviazané knihy, poskladané alebo pokrčené rukopisy a trojrozmerné predmety. Normálne sa však pri digitalizácii zviazaných kníh a nadrozmerných materiálov ako mapy a nákresy uprednostňuje skener vybavený knižnou kolískou Pragmatické návrhy • Pri obmedzenom rozsahu projektu je potrebné zvážiť prenájom vysokokvalitnej kamery/fotoaparátu. • Digitálnu kameru/fotoaparát nainštalujte na motorizovaný vozík s možnosťou vertikálneho posuvu a umiestnite dokumenty/predmety, ktoré sa majú digitalizovat', na pevný podklad pri špeciálne prispôsobenom osvetlení. • Zorganizujte cvičenie špecialistom na digitálne fotografovanie - rozdiel medzi obrázkami zhotovenými amatérom a tými istými fotografiami zhotovenými profesionálom môže byť obrovský. • Vytvorte také pozadie, aby dokument/predmet na ňom vynikal. • Zabráňte zmenám svetelných podmienok medzi jednotlivými zábermi medzi obrazmi rôznych častí alebo strán dokumentu/objektu - toto môže viesť k mylným dojmom z variácie farieb. • Používajte apochromatické šošovky a vhodné filtre, aby nedošlo k nesprávnej registrácii farieb a skresleniu obrazu. Poznámky/komentáre Stúpajúce používanie digitálnych kamier/fotoaparátov v digitalizácii odráža ich dostupnosť ako všeobecne rozšírený konzumentský produkt s klesajúcou cenou. Stále však zostáva veľký rozdiel v cene aj kvalite medzi profesionálnymi 44 digitálnymi kamerami/fotoaparátmi a masovo vyrábanými konzumentskými produktmi. 3.15.3 softvérové aplikácie na optické rozoznávanie znakov (OCR) Definícia problému Mnohé projekty digitalizácie zahŕňajú digitalizáciu tlačených dokumentov, akými sú knihy a noviny. To sa odohráva v tandeme s využívaním skenerov, aj keď nie výlučne. Používanie softvéru na optické rozoznávanie znakov (OCR) je populárnym spôsobom extrakcie informácií zo naskenovaných informácií a otvorenia možností spracovania informácií. Softvér OCR rozoznáva písmená a číslice, ktoré vytvárajú naskenovaný obraz (obrazový súbor s mapovanými bitmi), a exportuje ich ako textové súbory ASCII namiesto obrazových súborov. To umožňuje vykonať vyhľadávanie, indexovanie, konverzie formát a iné operácie na spracovanie. Pragmatické návrhy • Pred výberom konkrétneho produktu ohodnoťte viaceré ponúkané riešenia na rozoznávanie znakov (OCR, optické rozoznávanie znakov). Aj keď je softvér na OCR zahrnutý v cene skenera, výkonnejší softvér sa typicky predáva osobitne. • Hlavným prvkom projektu OCR je identifikácia a manuálna oprava chýb, dvojzmyslov a miest, na ktorých sa text nedal spracovať. Balík OCR, ktorý poskytuje rozhranie prívetivé k používateľovi vykonávajúcemu túto úlohu, ušetrí čas a úsilie. • OCR pracuje najlepšie pri dokumentoch v dobrom stave - skladané, pokrčené a vyblednuté zdrojové materiály zvýšia počet chýb v procese OCR. Aby ku takýmto chybám nedochádzalo, zdrojový materiál by sa mal vopred ošetriť. Pri materiáloch, ktoré nie sú v perfektnom stave, by sa pred použitím softvéru OCR malo zvážiť aj použitie softvéru na spracovanie obrazu, aby sa zamedzilo strate farby a bolo možné zlepšiť kontrast. • Pri výbere softvéru OCR je nutné zistiť, či v balíku OCR je súčasťou aj jeho schopnosť (alebo neschopnosť) pracovať so slovníkmi v jazyku zdrojového materiálu. Poznámky/komentáre Medzi relevantné produkty na trhu patria: • OmniPage • TextBridge • Adobe Capture • Abby FineReader - má vynikajúcu funkčnosť vykonávania úprav a rozpoznávania chýb • Transkribus (rozpoznávanie rukopisných a historických textov) 45 3.16 Metaúdaje (metadáta)1 Oblasť metaúdajov je jedna z najaktívnejšie skúmaných a najdynamickejších v celej oblasti digitalizácie, rovnako aj v oblastiach, akými je informačný prieskum, vyhľadávanie na Webe, výmena údajov, integrácia podnikových aplikácií, atď. Vybraný model metaúdajov je obzvlášť dôležitý, nakoľko ovplyvňuje výber atribútov na opísanie objektu. 3.16.1 Metaúdaje použité pre opis predmetu (deskriptívne metadáta) Definícia problému Pred výberom modelu metaúdajov pre projekt digitalizácie by sa mal skontrolovať materiál opísaný prostredníctvom príslušných metaúdajov. Umožní sa tak identifikácia existujúcich metaúdajových modelov, rovnako aj určenie všetkých nepokrytých aspektov a nedostatkov pri porovnaní existujúceho metaúdajového modelu s metaúdajmi potrebnými pre váš projekt. Pragmatické návrhy • Použitie vhodných metaúdajov je veľmi dôležité pre to, aby bolo možné nájsť a získať materiál z digitálnych zbierok. Ide viac o prípad, kedy je celkovým zámerom vyhľadávanie vo viacerých zbierkach uložených na rôznych miestach (logické súborné katalógy, virtuálně kombinované múzeá atď.). • Existuje niekoľko modelov metaúdajov. Preto si musí každý projekt vybrať model metaúdajov v súlade s jeho cieľmi. Odporúča sa, aby sa nevytváral nový model, len pokiaľ požiadavkám projektu nevyhovuje žiaden z existujúcich štandardov. • Dobrou investíciou je čas strávený modelovaním dôležitých charakteristík digitalizovaného materiálu a identifikácia jeho kľúčových atribútov. Takýto model možno porovnať s rozsahom a vlastnosťami existujúcich modelov metaúdajov. • Mali by sa identifikovať príslušné riadené slovníky (napr. na miestopis alebo popis umelca). • Už existuje niekoľko takýchto slovníkov, ktoré môžu vo veľkej miere zvýšiť úspešnosť vyhľadávaní. Poznámky/komentáre 1 Day, Michael. IMPACT Best Practice Guide: Metadata for Text Digitisation & OCR. - UKOLN, University of Bath. Dostupne: http://www.impact-proiect.eu/uploads/media/IMPACT-metadata-bpq-pilot-1 .pdf 46 Projekt Making of America II (Kongresová knižnica USA) použil tri kategórie metaúdajov: • Deskriptívne - na účely opisu a identifikácie informácií • Štrukturálne - na účely navigácie a prezentácie • Administratívne - na účely riadenia a spracovania Osobitný význam majú metaúdajové modely, ktoré sa majú vybrať pre projekt digitalizácie - ide rozhodnutie o tom, ktoré množiny atribútov sa použijú na charakterizáciu diel a dokumentov/objektov, ktoré sa majú digitalizovat', a výsledných obrazov, na opis spracovania, techník a technológie a na riadenie práv. Národná knižnica Austrálie má na toto silný model. Existencia širokého spektra existujúcich modelov a konkurenčných štandardov pre metaúdaje spôsobila, že sa mnohé projekty zameriavali čisto len na preklad z jedného štandardu do druhého. 3.17 Vyhovujúce štandardy pre metaúdaje Definícia problému Pre metaúdaje už existujú určité dôležité štandardy. V bibliografickej doméne (a v zvyšujúcej sa miere aj v kultúrnej neknihovníckej doméne) má veľký význam štandard Dublin Core (Dublinské jadro). Pragmatické návrhy • Pred vytvorením vlastného modelu si preštudujte existujúce štandardy a modely pre metaúdaje • Vyhnite sa vytváraniu nového modelu metaúdajov pre kultúrne zbierky. • Je pravdepodobné, že pre projekt digitalizácie budú relevantné modely metaúdajov, ktoré sú výsledkom práce na podobných projektoch. Medzi projektmi v oblasti kultúry sa modely metaúdajov prenášajú dobre. • Do modelu metaúdajov by sa mali zahrnúť polia Dublin Core, pokiaľ neexistuje rozumný dôvod neurobiť tak. Aj keď múzeá môžu zistiť, že ich zbierkam lepšie vyhovuje model CIMI, mal by sa sledovať cieľ existencie spoločnej jadrovej množiny atribútov, ktorá umožní vyhľadávanie vo viacerých zbierkach súčasne. • Ak sa má použiť súkromne vytvorený model metaúdajov, mal by sa vyvinúť spôsob mapovania prvkov tohto modelu do Dublin Core. • Aj keď sú schémy prideľovania názvov alebo národné konvencie pomenúvania užitočné, úplný model metaúdajov je lepší, aj ohľadom množstva údajov o dokumente/predmete a na umožnenie výkonnejšieho vyhľadávania a spolupráce s inými projektmi a inými krajinami. Poznámky/komentáre Existuje ohromný počet existujúcich štandardov, ktoré pokrývajú rôzne aspekty metaúdajov. Medzi jednotlivými štandardmi je však veľké prekrývanie a veľmi veľké množstvo modelov špecifických pre inštitúcie, pri tvorbe ktorých sa zanedbali rezortné alebo medzidoménové modely. 47 3.17.1 Zverejnenie V tejto fáze projektu sa vytvoril a zálohoval/uložil originálny digitálny materiál. Bol identifikovaný vyhovujúci metaúdajový model a vytvorili sa metaúdaje súvisiace s každým artiklom. Príprava na zverejnenie zahŕňa spracovanie novo vzniknutého materiálu ešte pred zverejnením. Zverejnenie typicky znamená vystavenie na internete a spracovanie znamená typicky redukciu kvality obrazu/zvuku/videozáznamu, kvôli tomu, aby sa prispôsobili prevádzkovým podmienkam na internete. 3.18 Spracovanie obrazu Definícia problému Súbory TIFF vytvorené počas procesu digitalizácie sú typicky veľmi veľké (až niekoľko desiatok megabajtov). Takéto súbory nie sú vhodné na zverejnenie na internete kvôli dlhému času, ktorý je potrebný na prevzatie obrazu koncovým používateľom. Pragmantické návrhy • Vytvorte doručiteľné verzie matričného materiálu. Musí existovať minimálne jedna doručiteľná verzia. Môže byť užitočné vytvoriť aj druhú verziu 'miniatúru, náhľad', čo závisí od architektúry webového sídla, na ktorom sa má materiál verejne sprístupniť. • Doručiteľné verzie sa vytvárajú otvorením matričného súboru TIFF v softvéri na spracovanie obrazu a jeho exportom vo formáte JPEG, PNG. • Farebné rozlíšenie sa môže zredukovať na 256 farieb. Ak pri takomto rozlíšení dochádza k značnej strate kvality môže sa použiť vyššie rozlíšenie pre farbu. • Výber správneho farebného rozlíšenia zvyčajne vyžaduje subjektívne rozhodnutie. • Obraz vytvorený pri rozlíšení 72 DPI približne ukáže jeho pôvodnú veľkosť na mnohých počítačových monitoroch. Preto je rozlíšenie 72DPI rozumnou voľbou pre mnohé obrazy, ktoré sa majú prezerať cez obrazovku. Pre nižšie rozlíšenia bude potrebné subjektívne rozhodnutie ohľadom 'prijateľnej kvality'. • Výber formátu súborov, farebného rozlíšenia a bodového rozlíšenia zahŕňa rozhodnutie o tom, čo je 'prijateľná' kvalita. Medzi kvalitou a veľkosťou súborov je potrebné nájsť rovnováhu. • Vo všeobecnosti by všetky obrazové súbory na webstránke nemali presahovať veľkosť 100 kilobajtov. Môžu sa publikovať aj väčšie súbory; mali by však byť prístupné cez linku z webovskej stránky s upozornením, že ich získanie môže trvať dlhšie. • Pokiaľ materiál nie je určený na spúšťanie cez sieť (streaming), video a audio materiál má typicky väčšie súbory, pričom súbor sa preberie pred jeho prezretím/vypočutím v režime offline. 48 • Čas na preberanie môže byť ovplyvnený zmenou počtu obrázkov (okienok) na sekundu pri video materiále, vzorkovacou rýchlosťou pri audio materiále atď. Tabulka 3 Použitie archívneho nekomprmovaného formátu TIFF (RAW) TIFF master Type of document File format Colour Optical resolution Graphic material (Photography, Prints, Drawings, Paintings, Posters, Maps, Geographic Maps...) TIFF 6.0, uncompressed Colour profile "Adobe RGB" to 24 bit (S bits per channel). For documents requiring the highest quality: Colour profile "ProPhoto RGB) to 43 bit (16 per channel) Format up to A4: 600 dpi. Larger than A4: 400 dpi. For large and small formats, adjust the resolution in order to get the best results Books, journals and manuscripts, rare or valuable (e.g. illustrated or painted) or with poor readability (faded characters, law contrast, margin notes in pencil, stained) TIFF 6.0, uncompressed Colour profile "Adobe RGB" to 24 bit (8 bits per channel). For documents requiring the highest quality: Colour profile "ProPhoto RGB" to 48 bit (1S per channel) Format up to A4: 600 dpi. Larger than A4: 400 dpi. For large and small formats, adjust the resolution in order to get the best results Books, journals, manuscripts, typed and mimeographed, not rare nor valuable, easily readable TIFF 6.0, uncompressed Colour Profile "Adobe RGB" to 24-bit (8 bits per channel) or to 16-bit grayscale Format up to A4: 400 dpi. Larger than A4: 300 dpi. For large and small sizes, adjust the resolution in order to get the best results Negatives, Black and White Slides TIFF 6.0, uncompressed 1 S-bit greyscale From 35 mm to 10x12 cm: 800-2800 with a resolution based on 4000 pixels on the longest side. From 10x12 to 20x25 cm: 800-1200 with a resolution based on 6000 pixels on the longest side. > 20x25 cm: 800 with a resolution based on 8000 pixels on the longest side. Negatives, Colour Slides TIFF 6.0, uncompressed Colour profile "Adobe RGB" to 24 bit (8 bits per channel). For docu ment requiring the highest quality: Colour profile "ProPhoto RGB" to 48 bit (18 per channel) From 35 mm to 10x12 cm: 800-2800 with a resolution based on 4000 pixels along the long side. From 10x12 to 20x25 cm: 800-1200 with a resolution based on 6000 pixels along the long side. > 20x25 cm: 800 with a resolution based on 8000 pixels on the longest side. 49 Tabuľka 4 Použitie formátu na deriváty obsahu vysokokvalitný formát JPEG High-quality JPEG Type of File format Size Colour Optical reso- Use document lution All docu- JPEG com- The same of sRGB colour 300 dpi For high- ments in pressed a1 the master profile definition the Master best quality viewing of File Table (100%) images in Phaidra. It can be adopted for maps and other objects requiring viewing of small details. Tabuľka 5 Použitie formátu JPEG stdrednej kvality Medium quality JPEG Type of File format Size Colour Optical reso- Use document lution All docu- JPEG com- Approximate! Colour profile 300 dpi For average ments in the pressed at y 2400 pixels sRGB IEC- quality printing or Master File 1he best on the 61966-2.1 uploading to TableCom- quality longest and depth of Phaidra pressed (100%) sideColour 24 bits (8 bits JPEG at the profile Adobe per channel) best quality RGB (1998) (100%) and depth of 24 bits (3 bits per channel) Tabulka 6 Použitie formátu JPEG nízkej kvality Low quality JPEG Type of document File format Size Optical resolution Use All documents in the Master File Table JPEG compressed at a quality between 90% and 100% Between 1200 and 1500 pixels on the longest side sRGB colour profile 150 dpi For uploading to Phaidra Poznámky/komentáre Rozhodnutie ohľadom spracovania obrazu závisia vo veľkej miere na osobnom zvážení. Tu uvedené predpisy môžu byť pre niekoho príliš striktné, pre iného voľné, čo sa odvíja od projektu a koncových používateľov. 50 Softvér na spracovanie obrazu ako Paint alebo Paintshop je voľne dostupný na Internete. Ďalšie softvérové nástroje na spracovanie obrazu môžu ušetriť čas a úsilie a podľa toho je potrebné zvážiť výdavky na softvér. Voľne dostupný je aj softvér na úpravu zvuku a videa. Audio a video softvér sa spravidla dodáva na spracovanie vytvorených údajov spolu s príslušným hardvérom. 3.18.1 Trojrozmerné materiály a virtuálna realita Definícia problému Predpisy o zverejnení obrazov nie sú priamo aplikovateľné na digitálne prevedenie materiálu virtuálnej reality a v trojrozmerné materiály. V súvislosti s prezentáciou na internete je dôležitá rovnováha medzi kvalitou a veľkosťou súboru. Pragmatické návrhy • Prehliadače trojrozmerných (3D) a VR materiálov nie sú ešte všeobecne rozšírené spolu so sofťvérom operačného systému. Ide o protiklad rozšírenia softvéru pre obraz, audio a video, ktorý je bežne zahrnutý v softvéri Windows. • Uistite sa, že sú k dispozícii prehliadače 3D a VR materiálu. Sprístupnite prehliadač z toho istého sieťového miesta, na ktorom je materiál. Tým sa predíde situácii, že softvér nebude dostupný ani z iných zdrojov. • Pred rozhodnutím sa pre nejaký prehliadač ohodnoťte viaceré. Kompatibilita formátov súborov a prehliadačov nie je štandardizovaná do takej miery, ako pri statických obrazoch. • Moderné PC s úpravou pre hry majú hardvérové akcelerátory a vyššiu grafickú pamäť, čo má významný vplyv na zážitok z pobytu vo virtuálnej realite. Poznámky/komentáre VRML prehliadač, ktorý sa úspešne používa v jednom z referenčných projektoch (írsky projekt ACTIVATE) je prehliadač Blaxxun Contact. 3.19 On-line zverejnenie Definícia problému Mnohé projekty digitalizácie v oblasti kultúry vedú k vytvoreniu on-line kultúrnych zdrojov, zvyčajne ide o web sídlo s obrazmi, metaúdajmi, trojrozmernými artefaktmi atď. Môže ísť od sídel s jednoduchým obsahom až po zložité softvérom ovládané portály a nástroje na prezeranie. V tejto príručke je len niekoľko odporúčaní ohľadom tvorby web sídel, nakoľko vyžaduje rozsiahle vedomosti. Na stránke projektu Minerva je možné nájsť odkazy na príklady najlepších postupov nominovaných partnermi projektu Minerva. Pragmatické návrhy • Vo webových sídlach by mala byť ľahká navigácia - odvšadiaľ by mala viesť linka na úvodnú stránku alebo obsah. 51 • Náležitá pozornosť sa musí venovať univerzálnemu prístupu a využívaniu web stránok slabozrakými a inými hendikepovanými osobami. • Webové stránky by mali byť dostatočne krátke, aby ich používateľ nemusel veľa rolovať. • Obrázky by mali byť dostatočne malé na to, aby nenarušovali zážitky pri prezeraní. • Väčšie obrazy by sa mali byť prepojené z webových stránok s poznámkou, že obraz je veľký a preberanie môže byť pomalé. • K používaniu animácií, vysúvacích prvkov (pop-ups), flashových programov a podobných technológií by sa malo pristupovať s obozretnosťou. Musí byť možné obísť dlhé úvodné animované sekvencie. • Webové sídla by mali byť v ideálnom prípade viacjazyčné, pričom by sa mal podporovať domáci jazyk a jeden alebo dva iné jazyky (spravidla anglický jazyk, ktorý je de facto jazykový štandard on-line zdrojov). • Prepojenia na externé zdroje by sa mali overovať denne, aby sa minimalizoval výskyt mŕtvych liniek a s nimi súvisiace mrzutosti. Poznámky/komentáre Samotný proces sprístupnenia materiálu na Webe je najširšie chápaný a zdokumentovaný. Táto príručka neposkytuje inštrukcie o tom, ako vytvárať webové sídla, programovať v HTML, budovať databázy prístupné cez Web a vykonávať dálšie úlohy, ktoré sú potrebné na tvorbu a údržbu web prezentácií. Očakáva sa. Že mnohé z kultúrnych inštitúcií, Ktoré využívajú tieto odporúčania, budú mať už k dispozícii nejaký web server, ktorý využijú pri ich projekte digitalizácie. 52 4 Technologické aspekty procesu digitalizace Presun súborov do jednotky štruktúrovania Strukturoval Structuring Presun súborov do jednotky OCR nie I Technické procesy Premenovanie podľa špecifickej konvencie Kopírovanie na digimédium/ repozitu Účtovanie (IF..) Predprocesy v SNK v Oddelení digitálnej akvizície Odborné a addministratívne procesy v Oddelení digitálnej akvizície Addministratívne procesy v Oddelení digitálnej akvizície HPotvrdenie príjmu Vymazanie KONIEC nepotrebných súborov PROJEKTU last changed : 20.01.2009 Obrázok 2 Schéma procesov v projekte digitalizácie menšieho rozsahu aj s prihliadnutím komerčné využitie 4.1.1 Konverzia (Převod) Digitální obraz je „elektronická fotografie" mapovaná jako sada obrazových prvků (pixelů), ktoré jsou auspořádány podle předdefinovaného poměru sloupců a řádků. Počet pixelů v daném poli definuje rozlišení obrázku. Každý pixel má danou tonální hodnotu v závislosti na úroveň světla odrážejícího se od zdrojového dokumentu k zařízení s nábojem spojeným se zařízením (CCD) se světelnou citlivostí diody. Když jsou vystaveni světlu, vytvářejí proporcionální elektrický náboj, který prostřednictvím analogově/digitální konverze generuje řadu digitálních signálů reprezentovaných v binární kód. Nejmenší jednotka dat uložená v počítači se nazývá bit (binární číslice). Počet bitů použitých k reprezentaci každého pixelu v obrázku určuje počet barev nebo odstíny šedé, které lze znázornit v digitálním obrazu. Tomu se říká bitová hloubka. Digitální obrazy jsou také známé jako bit-mapované obrázky nebo rastrové obrázky, které je oddělují od jiných typů elektronických souborů, jako jsou vektorové soubory, ve kterých jsou grafické informace kódovány jako matematické vzorce představující čáry a křivky. Zdrojové dokumenty jsou skenerem nebo digitálním fotoaparátem transformovány do bitmapových obrázků. Během snímání obrázků jsou tyto dokumenty "čteny" nebo skenovány v předdefinovaném rozlišení a bitové hloubce. Výsledné digitální soubory, obsahující binární číslice (bity) pro každý 53 pixel, jsou pak formátovány a označeny způsobem, který usnadňuje jejich ukládání a načítání v počítači. Z těchto souborů může počítač vytvářet analogové reprezentace pro zobrazení na obrazovce nebo tisk. Protože soubory s obrázky s vysokým rozlišením jsou velmi velké, může být nutné zmenšit velikost souboru (komprese), aby byly spravovatelnější pro počítač i pro uživatele. Po naskenování zdrojového dokumentu jsou všechna data převedena do konkrétního formátu souboru pro úložný prostor. Na trhu existuje řada široce používaných obrazových formátů. Některé z nich jsou určeny jak pro skladování, tak pro kompresi. Obrazové soubory také obsahují technické informace uložené voblast souboru nazvaná „záhlaví" obrázku. Cílem každého digitalizačního programu by mělo být zachytit a prezentovat v digitálních formátech významný informační obsah obsažený v jediném zdrojovém dokumentu nebo ve sbírce dokumentů. Pro zachycení důležitých částí má hodnocení kvality digitálních obrázků být založeno na porovnání mezi těmito digitálními obrázky a původními zdrojovými dokumenty, které mají být převedeny, nikoli na nějaký vágně definovaný koncept toho, co je dost dobré, aby sloužil pro okamžité potřeby. Řešením však není zachytit obraz za každou cenu v co nejvyšší možné kvalitě možné, ale přizpůsobit proces převodu informačnímu obsahu originálu. To vyvolává dvě otázky: (1) atributy zdrojových dokumentů, které mají být digitalizovány a (2) kvalita obrazu. 4.1.2 A tributy zdrojového dokumentu Obrázok 3 Ilustračný obrázok. Čítajúci, skenujúci a transkribujúci robot Při zachycení je třeba vzít v úvahu jednak technické procesy související s digitalizací a jednak atributy zdrojových dokumentů. Zdrojové dokumenty mohou mít různé rozměry a tónový rozsah (barvnost nebo černá a bílá). Zdrojové dokumenty lze také charakterizovat pomocí způsobů, 54 jakým byly vytvořeny: ručně (inkoustem), psacím strojem nebo tiskárnou nebo pomocí fotografické nebo elektronické metody. Fyzický stav zdrojových dokumentů může ovlivnit převod různými způsoby. Blednutí textu, razmazaný inkoust, spálené stránky a další druhy poškození někdy ničí také informační obsah a častěji představují fyzická omezení zaznamenání informací během skenování. Proto je třeba provést před skenováním důkladnou kontrolu zdroje a posouzení stavu dokumentu. Zanedbání této kontroly může být nejen ohrožením dokumentů, ale může také omezit přínosy a výsledky digitalizace a zvýšit náklady. Tomu možno zabránit například provedením předběžné základní ochrany, ošetření a použití kolébek na knihy pro vázané dokumenty a vykonat rutiny k ovládání osvětlení a dalších okolních podmínek během skenování. Pokud mají zdrojové dokumenty uměleckou nebo jinou hodnotu, musí dokument před skenováním zkontrolovat konzervátor. Jsou-li rizika poškození zdrojových dokumentů vysoká a dokumenty jsou zvláštní hodnoty nebo ve špatném stavu, může být někdy lepší skenovat z filmových meziproduktů místo z původních dokumentů, pokud je takový film k dispozici. 210x297 Obrázok 4 Štandardné formáty papiera 4.1.3 Kvalita obrazu Kvalitu obrazu při snímání lze definovat jako kumulativní výsledek rozlišení skenování, bitová hloubka naskenovaného obrázku, použité procesy vylepšení a komprese, použité skenovací zařízení nebo technika a dovednost skenovacího operátora. 4.1.4 Rozlišení Rozlišení je určeno počtem pixelů použitých k prezentaci obrázku, vyjádřených v bodkách na palec (dpi) nebo pixelů na palec (ppi). Zvýšení počtu pixelů použitých k pořízení snímku bude mít za následek vyšší rozlišení a větší schopnost rozpoznání jemných detailů, ale pouze samotné zvyšování rozlišení nebude mít za následek lepší kvalitu, pouze ve větší velikosti souboru. Klíčovým problémem je určit okamžik, kdy je použité rozlišení dostatečné k zachycení všech důležitých podrobností ze zdrojového dokumentu. 55 Při určování rozlišení je důležitá také fyzická velikost zdrojového dokumentu. Čím větší jsou rozměry dokumentu, tím je potřeba počet pixelů potřebných k zachycení podrobnosti v něm také větší a stejně se zvětšuje velikost souboru. Velké soubory mohou uživatelům způsobit problémy při prohlížení obrázků na obrazovce nebo při jejich odesílání přes sítě, protože velikost souboru má důležitý dopad na čas potřebný k zobrazení obrázku. Jeden způsob, jak zmenšit souborvelikost znamená snížení rozlišení. Jedná se o kritické rozhodnutí, zejména pokud zdrojový dokument má velkou fyzickou velikost s žádá se vysoká úroveň detailů, což může být případ nadměrných rozměrů mapy a kresby (grafika). 4.1.5 Bitová hloubka Bitová hloubka je vyjádření počtu bitů použitých k definování každého pixelu. Čím větší je použitá bitová hloubka, tím větší je počet šedých a barevných tónů, které lze reprezentovat. Existujítři druhy skenování (digitální vzorkování): • bitonální skenování pomocí jednoho bitu na pixel pro reprezentaci černé nebo bílé • skenování ve stupních šedi pomocí více bitů na pixel pro znázornění odstínů šedé; preferovaná úroveň šedé stupnice je 8 bitů na pixel a na této úrovni zobrazení si obrázek může vybrat ze 256 různých úrovní šedé. • barevné skenování pomocí více bitů na pixel pro reprezentaci barev; 24 bitů na pixel jenazývá skutečnou úroveň barev a umožňuje výběr ze 16,7 milionu barev. Volba bitové hloubky ovlivňuje možnost zachycení jak fyzického vzhledu, tak informační obsah zdrojového dokumentu. Proto musí být přijata rozhodnutí o bitové hloubce do úvahy, zda fyzický vzhled dokumentu nebo jeho části mají přidanou informační hodnotu a musí být zachycen. To může být, když má být účel digitalizačního projektu vytvářet faximile (věrná kopie) zdrojových dokumentů. 4.1.6 Procesy vylepšení obrazu Procesy vylepšení obrazu lze použít ke změně nebo zlepšení zachycení obrazu změnou velikosti, barvy, kontrastu a jasu, nebo porovnat a analyzovat obrázky pro vlastnosti, které lidské oko nemůže vnímat. Tím se otevírá mnoho nových možností pro zpracování obrázků. Ale použití takových procesů může způsobit těžkosti ohledně věrnosti a autentičnosti originálu. Mezi funkce zpracování obrazu patří například použití filtrů, tonální reprodukce křivky a nástroje pro správu barev. 4.1.7 Komprese Komprese se obvykle používá ke snížení velikosti souboru pro zpracování, ukládání a přenos digitálních obrázků. Používané metody jsou například zkrácení opakovaných informací nebo vyloučení informace, které lidské oko těžko s vidí. Kvalita obrazu tedy může být ovlivněna použitými kompresními technikami a aplikovanou úrovní komprese. Kompresní techniky mohou být buď „méně ztrátové", což znamená, že dekomprimovaný obraz bude identický s 56 jeho dřívějším stavem, protože při velikosti souboru nebudou žádné informace redukovány nebo „ztrátové", je-li v nich zlikvidována nejméně významná informace. Obecně se komprese „bez ztráty" používá pro hlavní soubory (masters) a techniky „ztráty"pro uživatelský přístup k souborům. Je důležité si uvědomit, že obrázky mohou reagovat na kompresi různě. Mohou vytvářet zvláštní druhy vizuálních charakteristik, jako jsou jemné tónové variace a nezamýšlené vizuální efekty. Digitální obrazy reprodukované z fotografických formátů mají obvykle široký rozsah tónů a výsledkem jsou velké soubory. Další technikou kromě komprese, kterou lze použít ke zmenšení souboruvelikost je omezit prostorovou dimenzi digitálního obrazu. To lze provést, když je obraz zamýšlen spíše jako archivní reprodukce než věrná faximilná náhrada originálu. 4.1.8 Použité zařízení a jeho výkon Použité zařízení a jeho výkon mají důležitý dopad na kvalitu obrazu. Zařízení od různých výrobců mohou fungovat odlišně, i když deklarují podobné nebo stejné technické schopnosti. 4.1.9 Kvalita operátora Schopnosti a péče operátora mají vždy významný dopad na kvalitu obrazu. Nakonec je důležité vždy rozhodnutí lidí, rozhodujících o tom, jaké kvality bude dosaženo. 4.1.10 Doporučení pro skenovaní (konverzi, převod) Průvodce deseti kroky k zajištění dobrého procesu převodu: 1. Používejte skenery, které vyhovují pro: • fyzické rozměry zdrojových dokumentů • druh média (průhledný nebo reflexní) • rozsah podrobností, tónů a barev přítomných v dokumentech • fyzický stav dokumentů 2. Pečlivě zkontrolujte všechny požadavky na zvláštní zacházení nebo zachování zdrojového dokumentu ještě před skenováním 3. Vyberte rozlišení, které bude dostatečné k zachycení nejjemnějších významných detailů zdrojových dokumentů, které mají být skenovány. Zkontrolujte, zda rozlišení neomezuje zamýšlené použití digitálních obrázků. Nastavte rozlišení na zvolená úroveň pro celou skupinu zdrojových dokumentů, aby se zabránilo nutnosti opakovaného přestavování zařízení pro jednotlivé dokumenty (vytvořit technologické třídy a nastavit skener podle tříd) 4. Vyberte bitovou hloubku, která je v souladu s vlastnostmi dokumentu a na úrovni nezbytné pro přenos informačního obsahu: • bitonální skenovaní textových dokumentů sestávajících z černého obrazu na bílém papíře; 57 • ve stupních šedi (8bitů) skenování dokumentů obsahujících významné informace ve stupních šedi (včetně tužkové zápisy a anotace v textu) a pro fotografické materiály; • barevné skenování pro dokumenty obsahující barevné informace, zejména pro dosáhnutí vysoce kvalitních digitálních kopií. 5. Opatrně používejte procesy vylepšení obrazu a všechny tyto použité procesy pečlivě dokumentujte 6. Použijte „bezeztrátové" standardní techniky komprese pro hlavní soubory (master) a pro přístup k objektům, když je potřeba. To například znamená: • pro kompresi: ITU Group 3 nebo 4 a JBIG (binární obrazy), bezeztrátové kompresně techniky JPEG/JPEG 2000 nebo LZW (vícebitové obrázky) • pro výměnu: bezeztrátové JPEG/JPEG 2000, TIFF 5 nebo novější verze 7. Zkuste pečlivým testováním přístupových souborů najít rovnováhu mezi přijatelným kvaliním vizuálním vzhledem pro uživatele a velikostí souboru 8. Chcete-li získat stabilní výkon z používaného zařízení, pečlivě prozkoumejte požadavky výrobců na systémové schopnosti a reference uživatelů 9. Použijte standardy pro hodnocení kvality digitálního obrazu 10. Implementujte program nepřetržité kontroly kvality, aby ste ověřili konzistenci výstupů jednotlivých operátorů skenování. 4.2 Vytváření pracovního prostředí pro projekt digitálního zobrazování Spuštění projektu digitálního zobrazování znamená a) respektování a předvídání potřeb známých a potenciálních uživatelů b) technologickou infrastrukturu použitou v projektu a c) požadavky na dostupné lidské a finanční zdroje. Technologické možnosti zařízení pro snímání obrazu a volba pracovních stanic (skenery nebo digitální fotoaparáty, operační systémy, interní paměť, úložiště, kvalita zobrazení, síťové schopnosti a rychlosti) musí být jasné před zahájením projektu. Známé musejí být také prostředky poskytování obrazových dat uživatelům. Analýza technických potřeb projektu digitálního zobrazování se obvykle provádí v v rámci pilotního projektu nebo studie. Ty dávají projektu šanci prozkoumat v malém měřítku proveditelnost (1) uskutečnění plánů a (2) zavedení digitální technologie do knihovny nebo archivu, pokud se jedná o první projekt digitalizace dané instituce. Technické potřeby se zaměřují především na hardware a software. Pořízení zařízení by mělo rovněž zahrnovat smlouvu o údržbě na minimálně tři a možná i pět let. Obecně se předpokládá, že po třech letech zařízení bude vyžadovat upgrade a po pěti letech bude zastaralý a musí být vyměněn. Výběr softwaru by měl být založen na seriózním zvážení otevřeného zdroje (tj. Open source). Podpora open source softwaru za podmínek GNU General Public Licence vytváří komunitu uživatelů digitálních knihoven nezávislou na 58 tržních silách a řeší zastarávání tam, kde není možné udržovat drahé licenční struktury připojené a komerční produkty. 4.3 Názvové a identifikačné konvencie Všeobecne bude názov každého súboru zapísaný ako reťazec znakov zložený z niekoľkých častí, ktoré obsahujú informácie potrebné na jednoznačnú identifikáciu dokumentu, ku ktorému sa vzťahuje digitálny obraz. Názvy súborov budú doplnené príslušnou príponou (tif, jpg, pdf, xml). V hromadnom úložisku budú obrazové súbory usporiadané do viacerých priečinkov, aby sa zachoval celkový obsah materiálov. Nomenklatúra priečinkov a súborov je reťazec spojovníkom (-) oddelených polí (kód knižnice, signatúra...). Ak signatúra obsahuje spojovník (-), medzery alebo špeciálne znaky, nahradia sa bodkou (.). Aby sa uľahčila kontrola kvality, odporúča sa, aby sa do priečinkov pre súbory s adresou nezačlenili viac ako 200 obrázkov vo formáte TIF alebo viac ako 100 obrázkov, ak ide o veľkoformátové dokumenty. V týchto prípadoch sa ďalej delí priečinok do viacerých, postupne očíslovaných priečinkov. Pri grafických materiáloch a archívnych materiáloch, ktoré sú naskenované na oboch stranách, postupujte podľa postupu číslovanie súborov ,,-r" pre pravé (recto) a súborov ,,-v" pre ľavé (verso). V prípade kníh sú predné a zadné obaly pomenované tak, aby sa vyskytovali v rovnakom poradí, v akom sú uvedené vo fyzickom dokumente. Chrbát alebo iné časti pôvodného dokumentu (bloky textu, detaily väzby ...) musia byť uvedené na konci. The file name will followthe following schéma: "Library Code - Shelf mark - Progressive Num-ber.extensionľľ Library Code and Shelf Mark Example of folders structure and file name: PU V21 -ANT. B. 1.10YTIE M aster\PUV21 -ANT. B.I.I 0-0001.1H Obrázok 5 Schéma názvovej konvencie súborov z digitalizácie Názov súboru obsahuje: Kód knižnice-Signatúru\Formát súboru\Kód knižnice-Signatúra-Poradové číslo obrázku s príponou Poznámka: 59 Kód knižnice by mal byť v súlade so štandardným národným kódovníkom knižníc alebo informačných inštitúcií (ISIL) (Napríklad Verejná knižnica v Banskej Bystrici má kód: ISIL SK-1KACRA03919 - čo je medzinárodný identifikátor. Signatúra je miesto uloženia dokumentu na polici v sklade. Ak dokument nemá signatúru, použije sa iný identifikátor dokumentu v inštitúcii (prírastkové číslo, sigla, čiarový kód a pod.) Čísla obrázkov a prípona formátu spravidla automaticky pridáva k pripravenému reťazcu skener. Napr. obr0001.jpg, 0002.jpg...00150.jpg Konvencia pre časopis: Kód knižnice-Signatúra\Rok\Formát súboru\Kód knižnice-Signatúra-Rok-Mesiac-Deň-poradové číslo obrázka s príponou formátu Library Code and Shelf Mark e.g.: PUV21-A.992 Year e.g.: 201D Fite format e.g.: TIF.Master Example of folders structure and file name: PUV21 -A.992\2010\TIF.Master\PUV21-A.992-2010-12-24-0001 .jpg Obrázok 6 Schéma názvovej konvencie pre súbory z digitalizácie pre seriály Poznámka: Rok-Mesiac-Deň (vydania časopisu) môže byž aj podľa štandardu RRRRMMDD a potom poradové číslo obrázka s príponou formátu 60 4.4 Príklady dostupných open-source repozitov pre digitálne knižnice 4.4.1 islandora 8 (https://islandora.ca/islandora8). Islandora 8 (predtým Islandora CLAW) je nová generácia Islandory. Tento významný upgrade Islandora 8 je compatibilný s Drupal 82 (to je redakčný systém) a Fedora 53 4.4.2 DSpace https://duraspace.org/dspace/ DSpace je softvér určený pre akademické, neziskové a komerčné organizácie, ktoré budujú otvorené digitálne archívy. Inštalácia „po vybalení z krabice" je jednoduchá a ľahká a úplne prispôsobiteľná potrebám každej organizácie. DSpace zachováva a umožňuje jednoduchý a otvorený prístup ku všetkým typom digitálneho obsahu vrátane textu, obrázkov, pohyblivých obrazov, súborov mpeg a dátových súborov. Vdáka neustále rastúcej komunite vývojárov sa softvér rozširuje a vylepšuje. Drupal je oblíbený redakční systém. Je snadno rozšiřitelný pomocí modulů, a to ho činí flexibilním. Tato rozšiřitelnost z něj dělá velmi dobrý redakční systém, který můžete použít jak pro weblog, tak pro diskusní fórum. Drupal je naprogramovaný v jazyce PHP a využívá databázi MySQL nebo PostgreSQL. https://www.cesky-hosting.cz/webhosting/open- source/drupal/?&aclid=Ci0KCQiw5rbsBRCFARIsAGEYRweetX3xisoZI4FPh2ei9RORk8ghRHkdLmO -HRfunpewuzjjPBwWkgaAqKnEALw wcB 3 Fedora je robustný, modulárny, open source repository systém určený na manažment a šírenie digitálneho obsahu. 61 Obrázok 7 Globálna schéma systému repozitu DSpace 4.4.3 Invenio (CERN) https://invenio-software.org https://invenio-software.org/showcase/ Open-source digitálny repozit rozšírený najmä vo vedeckej komunite. 4.4.4 Greenstone http://www.greenstone.org Greenstone je softvérový balík na vytváranie a distribúciu zbierok digitálnych knižníc. Poskytuje spôsob usporiadania informácií a ich publikovania na webe alebo na vymeniteľných médiách, ako sú DVD a USB flash disky. Greenstone sa používa v digitálnej knižnici Nového Zélandu na Waikato University a v mnohých iných inštitúciách; vyvíja a distribuuje sa v spolupráci s UNESCO. Je to viacjazyčný softvér s otvoreným zdrojovým kódom, ktorý sa poskytuje na základe podmienok Všeobecnej verejnej licencie GNU. 62 5 Digitalizace starých tisků Digitalizácia starých a vzácnych tlačí si vyžaduje mimoriadnu starostlivosť. Pred digitalizáciou je potrebné stanovisko konzervátora, ktorý odporučí, aký spôsob skenovania je pre daný dokument najšetrnejší a či je vôbec skenovanie možné. Pred skenovaním je potrebné dokument očistiť, podľa možností aj sterilizovať prípadne deacidifikovať. Ak treba, musia sa vykonať aj reštaurátorské zásahy, opravy a pod. podľa návrhu konzervátora. Na skenovanie starých a vzácnych tlačí a viazané zväzky rukopisov sa používajú kolísky a rôzne pomôcky. Dokument by sa nemal otvárať tak, aby sa poškodila väzba (na 180 stupňov). Používajú sa kolísky a rôzne podložky. Skenovanie musí prebiehať opatrne kvôli kovovým častiam, sponám, ozdobám väzby a pod. Skenuje sa spravidla na ručných skeneroch. Osvetlenie musí zohľadňovať stav dokumentu. Na rôzne časti skenovania dokumentu (mapy, príväzky, prítlačky, grafika, rytiny, iniciály, farebné ilustrácie a ozdoby) je užitočné použiť rôzne rôzne rozlíšenie (bežne 600 dpi, pre grafiku až 1200 dpi). Príklady práce skenerov: https://www.youtube.com/watch?v=BSqTrn5wuEQ https://www.voutube.com/watch?v=z5KEFRqMEc4 63 6 Právní aspekty procesu digitalizace 6.1 Prá vneasp ekty Právnu situáciu je potrebné overiť pri každom objekte alebo skupine (kategórii) objektov a práva na používanie digitálnych dokumentov by sa mali získať čo najskôr, podľa možnosti už vo fáze plánovania. 6.2 Autorské práva (Copyrights) Podľa zákona o autorských právach napríklad na Slovensku sú diela chránené až 70 rokov po úmrtí autora, po ktorom sú voľne dostupné ako takzvané "verejné domény" (§ 32 Trvanie majetkových práv) "(1) Majetkové práva trvajú od okamihu vytvorenia diela počas autorovho života a 70 rokov po jeho smrti. Pri spoluautorskom diele majetkové práva trvajú počas života posledného zo spoluautorov a 70 rokov po jeho smrti. Ak je audiovizuálne dielo vytvorené ako spoluautorské dielo, majetkové práva trvajú počas života poslednej osoby spomedzi režiséra, autora scenára, autora dialógov a autora hudby, ktorá bola vytvorená osobitne pre toto dielo a 70 rokov po jeho smrti." http://www.zakonypreludi.sk/zz/2015-185#cast2 Napríklad práca zverejnená v roku 1905, ktorého autor zomrel v roku 1955, je preto pod autorským právom do roku 2025. 6.3 Vydavateľské a licenčné zmluvy Je potrebné overiť, či vydavateľ diela vlastní práva na jeho (dodatočné) zverejnenie na internete. (1990, t. j. koniec systému ARPANET a prvé nasadenie WWW v Černe vo Švajčiarsku). Znamená to, že do roku 1990 neexistovali vydavateľské zmluvy, v ktorých by si vydavatelia dohodli s autormi práva zverejnenia na internete. Podľa našich skúseností sa na Slovensku podmienky zverejňovania dohodnutého diela na internete v autorských zmluvách upravovali a upravujú len zriedka, ale prax v tomto ohľade sa postupne mení. V prípade starších publikácií (kategória staré a vzácne tlače a seriály) to možno vylúčiť hneď od začiatku, pretože internet neexistoval v čase dohody medzi autorom a vydavateľom. 6.4 Copyright v knižnici podľa amerického a austrálskeho práva https://www.nla.gov.au/kev-exceptions-in-the-copyright-act 6.4.1 Praktický príklad Okrem niekoľkých výnimiek sa staré a vzácne tlače, ktoré boli publikované pred rokom 1900 a na ktoré sa už nevzťahujú žiadne obmedzenia týkajúce sa autorských práv, môžu voľne digitalizovat a sprístupňovať organizáciám i, ktoré ich vlastnia alebo spravujú vo svojich zbierkach. Praktický príklad - seriálové publikácie, noviny, časopisy, periodické zborníky 64 Predpokladom na zaradenie týchto dokumentov na digitalizáciu je súhlas držiteľov autorských práv. Výnimku tvoria časopisy až do 19. storočia, kedy už nie je možné zistiť držiteľov autorských práv. Skúsenosti ukázali, že iba vydavatelia novších obchodných časopisov uzatvárajú zmluvy s ich autormi. Pritom autori prenášajú plné práva na používanie daného článku na vydavateľa (dohoda o autorských právach, licencia). Pokiaľ ide o historický obsah, takéto jasné dohody zvyčajne neexistujú a získanie spätného povolenia od autorov a ich potomkov prostredníctvom správnych právnych kanálov by znamenalo neúmerné úsilie. 6.4.2 DlSPENZÁCIA S FORMÁLNYM POVOLENÍM Pre digitalizáciu novín a časopisov je možné prijať pragmatický postup (ako napr. vo Švajčiarsku): autorský súhlas nieje získaný, ale autor môže následne požadovať zablokovanie alebo vymazanie jeho práce z online služby. Tento prístup predpokladá, že držitelia autorských práv sú akademicky aktívni ľudia alebo autori na čiastočný úväzok, ktorí podporujú ďalšie šírenie svojej práce v záujme slobodnej vedy. Pri on-line zverejnení akéhokoľvek materiálu musia byť vysporiadané práva duševného vlastníctva (IPR) súvisiace s materiálom. Materiál, ktorý je vo verejnej doméne (konkrétne napríklad staré knihy alebo noviny, starý materiál umiestnený explicitne vo verejnej doméne) predstavuje relatívne nízku náročnosť. Mnohé kultúrne inštitúcie však z využívania obrazov artefaktov alebo obrazov z ich zbierok odvodzujú príjmy, preto obhajujú copyright. Materiál, ktorého copyright držia tretie strany, sa môže zverejniť len so súhlasom takýchto tretích strán. Našťastie existuje niekoľko technických možností na ochranu copyrightu materiálu umiestneného na Internet. 6.4.3 Vytvorenie copyrightu Definícia problému Prvým krokom pri skúmaní situácie súvisiacej s copyrightom pre nejaký kultúrny dokument/predmet je stanovenie vlastníctva daného copyrightu. Pragmatické návrhy • Stanovte právnu situáciu s ohľadom na copyright a publikovanie v krajine, kde sa projekt v realizuje. Každá krajina má svoje zákony o copyrighte zvyčajne aspoň od 19. storočia. Takéto zákony sa zvyčajne vzťahujú na všetky formy publikácií, vrátane ich on-line zverejnenia. Môžu, ale nemusia pokrývať zákon o digitalizácii, ktorá sa môže chápať ako archivačný proces, alebo ako kopírovanie (rozmnožovanie). • K verejnému sprístupneniu v režime on-line by v žiadnom prípade nemalo dôjsť pred zistením copyrightu. • Niektoré dokumenty/predmety, napr. staré noviny, majú jasné pravidlá copyrightu, ktorými sa riadia. Typicky je umožnené voľné kopírovanie až 65 vtedy, keď noviny dosiahnu určitý vek. Dokumenty/predmety, ktoré spadajú do tejto kategórie, sa môžu voľne digitalizovat' a zverejniť. • Pre dokumenty/predmety, ktorých copyright prináleží inštitúcii realizujúcej projekt, bude požadované udeľovať interné povolenie na digitalizáciu a on-line zverejnenie. • Pre dokumenty/predmety, ktorých copyright drží tretia strana - napríklad prenajímateľ alebo darca zbierky historických dokumentov/predmetov, sa musí získať písomné povolenie tejto strany. K zverejneniu môže dôjsť až po prijatí takéhoto rozhodnutia. • Zaručenie povolenia digitalizovat' a zverejniť môže zahŕňať aj potrebu platiť. Medzi výškou platby a hodnotou vyplývajúcej zo zahrnutia relevantných dokumentov/predmetov do on-line zdroja musí byť rovnováha Poznámky/komentáre Situácia týkajúca sa copyrightu sa mení z krajiny na krajinu. 6.4.4 Ochrana copyrightu Definícia problému Zverejnenie dokumentov/objektov na webe je vydanie ich na voľné kopírovanie. Nie je možné zamedziť kopírovaniu materiálu vystaveného na webe. Je však možné zvážiť niekoľko postupov, z ktorých má každý nejaký vplyv na ochranu copyrightu. Pragmatické návrhy • Stanovte, či sa copyright musí ochraňovať, alebo nie. • S držiteľmi copyrightu sa dohodnite na postupoch, ktoré sa majú použiť na ochranu copyrightu. • Do úvahy prichádzajú nasledujúce postupy: o Pridanie viditeľného vodoznaku alebo známky o copyrighte na každý obraz. o Pridanie neviditeľného digitálneho vodoznaku na každý obraz. Takéto značky sa môžu použiť na dokázanie vlastníctva 'ukradnutého' obrazu, takisto aj na vystopovanie využívania obrazu na Internete. o Enkrypcia (šifrovanie) obrazov, pričom správny kľúč sa vydá len registrovaným používateľom. Tým sa samozrejme zníži hodnota on-line obrazu z pohľadu zvyšnej verejnosti. o Obmedzenie zverejnenia len na obrazy s nízkym rozlíšením, napr. 75 DPI na prezeranie na obrazovke. Tým sa zníži úroveň použitia obrazu v iných doménach, napr. tlač, odevy atď. o Obmedzenie zverejnenia len na malé časti obrazu. o Zobrazovanie obrazov len registrovaným, oprávneným členom nejakej komunity. 66 • Preskúšajte výsledky procesu na ochranu copyrightu pomocou prvých niekoľkých dokumentov/predmetov, aby ste sa uistili, že proces nemá žiadne neočakávané alebo neželané následky. Poznámky/komentáre Prístup, ktorý je najvhodnejší pre akýkoľvek projekt, bude závisieť vo veľkej miere od cieľov projektu a kultúrnej inštitúcie, rovnako aj od povahy materiálu. Najčastejším riešením galérií a múzeí. Relatívna jedinečnosť kultúrnych zbierok poskytuje v mnohých situáciách dôkaz o vlastníctve. 67 7 Procesy před a po digitalizaci (konzervace, ochrana) 7.1 Konzervácia dokumentov (konzervovanie) Je to odborné ošetrenie dokumentov s cieľom zachovať ich súčasný stav, resp. zachrániť poškodené dokumenty pred zánikom. Predstavuje priamu fyzickú ochranu zabezpečujúcu zlepšenie rizikových vlastností dokumentov (nosičov informácie) pri zachovaní ich originality a dlhodobej stability s minimálnou mierou rozpadu. 7.2 Reštaurovanie Na rozdiel od konzervácie reštaurovanie predstavuje takú úpravu dokumentov, aby sa dosiahol ich pôvodný vzhľad. Odborné ošetrenie konzerváciou sa týka najmä tradičných nosičov, t. j. písomných dokumentov (písomného dedičstva, tj. kníh a archívnych dokumentov, najmä starých a vzácnych tlačí, historických rukopisov ap.). 7.3 Integrácia konzervovania a digitalizácie Konzervovanie a konzervačná veda sa však zaoberá všetkými objektmi kultúrneho dedičstva ako aj nosičmi digitálneho obsahu. Pri audiovizuálnych dokumentoch (filmových dielach) sa za najvhodnejší spôsob konzervácie z dlhodobého hľadiska pokladá pasívna konzervácia na filmových pásoch, hoci za spôsob konzervácie sa považuje aj digitalizácia. Digitalizácia však fakticky nemôže byť konzervačným zásahom, pretože nezabraňuje objektívnej degradácii originálnych nosičov až po ich zánik. Digitalizácia môže nanajvýš spomaliť poškodzovanie dokumentov ich priamym používaním. Je ideálne, ak projekt digitalizácie zahŕňa aj konzervovanie, najmä čistenie, sterilizáciu a deacidifikáciu. Vyplýva to z jednoduchej úvahy, že ak sa dokument raz vyberie zo skladu, treba s ním urobiť maximum operáciu v rámci jednej technologickej linky. To znamená, že konzervačné procesy je potrebné zahrnúť do komplexného procesu digitalizácie. Digitalizácia sa spravidla realizuje po konzervácii tradičných dokumentov, v súčasnosti je však využívaná najmä pri ich sprístupnení verejnosti, čím sa zamedzuje ich opotrebeniu. Nosiče digitalizovaných dokumentov sú však spojené s rizikami, ktorými sú napr. zastarávanie dátových formátov, obmedzená životnosť pamäťových zariadení a i. Konzervácia tradičných (papierových) dokumentov je odborné ošetrenie dokumentov konzervačnými prostriedkami s cieľom zastaviť alebo spomaliť proces ich rozpadu. Pripúšťajú sa však iba zásahy, ktoré zabezpečujú existujúci stav dokumentu bez akýchkoľvek doplnkov (k používaným metódam patria deacidifikácia, sterilizácia, dezinfekcia, lyofilizácia a i.), v širšom chápaní sa pripúšťajú aj opatrenia, ktoré sú nevyhnutné na technické zabezpečenie fyzického stavu nosiča dokumentu (laminovanie dokumentov). 68 7.3.1 Sterilizácia Sterilizáciou a dezinfekciou dokumentov sa zabraňuje ich ďalšiemu poškodzovaniu mikroorganizmami a predchádza sa riziku poškodenia zdravia pri ich ďalšom spracovaní (alebo používaní). 7.3.2 Deacidifikácia Významnou súčasťou procesu konzervácie dokumentov je deacidifikácia (odkyslenie) papiera, ktorou sa upravuje jeho nevhodné nízke pH signalizujúce jeho kyslosť, čím sa papier stabilizuje. Degradácia kyslého papiera je nevratný termodynamický dej, ktorý môže spomaliť deacidifikácia. Kyslosť papiera na báze drevnej celulózy je zapríčinená kyselinou sírovou, ktorá sa tvorí pri styku oxidov síry prítomných v atmosfére s vlhkým papierom, ako aj karboxylovými kyselinami, ktoré v ňom vznikajú pri oxidačných procesoch, ktorým časom podlieha. Výsledky testov potvrdzujú, že papier má pomerne dobrú stálosť, ak nemá nižšiu hodnotu pH ako 5,5, pričom všeobecne sa papier považuje za odkyslený, keď jeho hodnota pH vzrastie na 6,2. Na neutralizáciu sa používajú vodné roztoky a suspenzie hydroxidov, uhličitanov alebo hydrogenuhličitanov vápnika, príp. horčíka, alebo sa dokument umiestni do plynnej atmosféry amoniaku (krátkodobá stabilizácia). Cieľom deacidifikácie je jednak zníženie kyslosti papiera, jednak vytvorenie dostatočného alkalického pufru, ktorý zabráni reacidifikácii v priebehu času. Poškodený papier možno spevniť aj pomocou spevňujúcich zmesí, ktoré sa nanášajú štetcom alebo ponorením do roztoku. Používajú sa prírodné polyméry (pšeničný škrob, želatína), modifikované prírodné polyméry rozpustné vo vode (sodná soľ karboxymetylcelulózy a i.) alebo syntetické polyméry (polyvinyletanol plastifikovaný glycerínom a i.). 7.3.3 Lyofilizácia Lyofilizácia sa používa pri ošetrení a záchrane dokumentov postihnutých prírodnými katastrofami (búrky, povodne). — K najvýznamnejším konzervačným (a reštaurátorským) pracoviskám na Slovensku patrí pracovisko Ochrany fondov Slovenskej národnej knižnice v Martine, Odbor ochrany dokumentov Univerzitnej knižnice v Bratislave, Oddelenie ochrany archívnych dokumentov Slovenského národného archívu v Bratislave a i. Na svete sú to najmä: Getty Conservation Institute a Rochester Institute of Technology. 69 Workflow cf jtalizáde v DIGRE P SVKBB Obrázok 8 Schéma procesov a operácií digitalizácie v knižnici 8 Optické rozpoznávání obrazců a korekce chyb Optické rozoznávanie znakov alebo OCR (z angl. Optical Character Recognition) je metóda umožňujúca překlad obrazu (grafiky) tlačených alebo písaných znakov do textovej, editovateľnej formy napr. do ASCII znakov abecedy. Typickým príkladom je zoskenovany text (čo je vlastne len obrázok znázorňujúci text) a jeho preklad do strojovej formy použiteľnej a editovateľnej v textovom editore. V minulosti sa využívali rôzne metódy rozoznávania znakov napr. optické, dnes sa na tento účel používa výhradne výpočtová technika. OCR technológie sa nepoužívajú len na rozoznávanie textu, ale napr. aj na rozoznávanie notového zápisu, špeciálnych znakov (napr. na bankovkách pre zvýšenie bezpečnosti), rozoznávanie správnosti podpisu a pod. 8.1 OCRsoftvér OCR softvér je program umožňujúci rozoznanie jednotlivých znakov v texte. Zahŕňa v sebe prvky umelej inteligencie a strojového videnia, ako aj lingvistické prvky kontrolujúce správnosť preložených slov a viet. Od zložitosti softvéru záleží aj presnosť výstupu. Samostatnou kapitolou sú softvéry schopné rozoznávať rukou písaný text, obvykle vybavené schopnosťou naučiť sa formu a štýl rukopisu, s prispôsobením na meniacemu sa sklonu a rôznej veľkosti písma. U OCR softvéru je obvykle potrebné nastaviť jazyk v ktorom je text napísaný, napr. slovenčina, angličtina aby správne vyhodnotil diakritické znaky, a aby pre výstupný text použil správny jazykový slovník. Jednoduché OCR softvéry sú bežnou súčasťou softvérového vybavenia skenerov, alebo sa predávajú ako samostatné produkty. Ak má projekt aj zložku optického rozoznávania znakov (OCR), je dôležitá voľba softvéru pre OCR. Všetky úkony spojené s OCR vyžadujú určitú dávku ručných úprav a opráv, spôsob, akým tieto funkcie softvérový produkt podporuje, má významný vplyv na čas a úsilie vyžadované projektom. Lepšie balíky OCR umožňujú prehľad a úpravy najednej obrazovke, navrhujú opravy zle prečítaných slov. podporujú rôzne spôsoby rozloženia textu a obrazov, obsahujú mnohé slovníky a pod. Oplatí sa zhodnotenie viacerých softvérových balíkov pre OCR, ak projekt zahŕňa viac ako jednu osobu za rok. Medzi relevantné softvéry OCR na trhu patria najlepšie OCR softvéry (2019): https://www.techradar.com/news/best-ocr-software • 1. Nuance OmniPage Ultimate • 2. Abbvy FineReader 14 . 3. Adobe Acrobat Pro PC • 4. Readiris . 5. TopOCR • Transkribus (rozpoznávanie rukopisných a historických textov) 71 9 Zpřístupňování digitalizovaných děl 9.1 Islandom 8 (https://islandora.ca/islandora8). Islandora 8 (predtým Islandora CLAW) je nová generácia Islandory. Tento významný upgrade Islandora 8 je compatibilný s Drupal 84 (to je redakčný systém) a Fedora 55 9.2 DSpace https://duraspace.org/dspace/ DSpace je softvér určený pre akademické, neziskové a komerčné organizácie, ktoré budujú otvorené digitálne archívy. Inštalácia „po vybalení z krabice" je jednoduchá a ľahká a úplne prispôsobiteľná potrebám každej organizácie. DSpace zachováva a umožňuje jednoduchý a otvorený prístup ku všetkým typom digitálneho obsahu vrátane textu, obrázkov, pohyblivých obrazov, súborov mpeg a dátových súborov. Vdáka neustále rastúcej komunite vývojárov sa softvér rozširuje a vylepšuje. 9.2.1 Invenio (CERN) https://invenio-software.org https://invenio-software.org/showcase/ Open-source digitálny repozit rozšírený najmä vo vedeckej komunite. 9.2.2 Greenstone http://www.greenstone.org Greenstone je softvérový balík na vytváranie a distribúciu zbierok digitálnych knižníc. Poskytuje spôsob usporiadania informácií a ich publikovania na webe alebo na vymeniteľných médiách, ako sú DVD a USB flash disky. Greenstone sa používa v digitálnej knižnici Nového Zélandu na Waikato University a v mnohých iných inštitúciách; vyvíja a distribuuje sa v spolupráci s UNESCO. Je to viacjazyčný softvér s otvoreným zdrojovým kódom, ktorý sa poskytuje na základe podmienok Všeobecnej verejnej licencie GNU. Drupal je oblíbený redakční systém. Je snadno rozšiřitelný pomocí modulů, a to ho činí flexibilním. Tato rozšiřitelnost z něj dělá velmi dobrý redakční systém, který můžete použít jak pro weblog, tak pro diskusní fórum. Drupal je naprogramovaný v jazyce PHP a využívá databázi MySQL nebo PostgreSQL. https://www.cesky-hosting.cz/webhosting/open- source/drupal/?&aclid=Ci0KCQiw5rbsBRCFARIsAGEYRweetX3xisoZI4FPh2ei9RORk8ghRHkdLmO -HRfunpewuzjjPBwWkgaAqKnEALw wcB 5 Fedora je robustný, modulárny, open source repository systém určený na manažment a šírenie digitálneho obsahu. 72 10 Strategické plánování procesu dlouhodobého uchování digitálních děl 10.1 Uchovávanie a archivovanie údajov Zbierka obrázkov pozostávajúca zo zložiek a súborov sa bude ukladať na optické alebo magnetické pamäťové médiá, ako sú CD, DVD a externé pevné disky. Odporúča sa ukladať údaje na dvoch rôznych nosičoch - rôznych značiek alebo rôznych sérií - a uchovávať médiá na dvoch miestach, pravidelne ich overovať a pravidelne prenášať údaje na nové médiá. Životnosť pamäťového média je ovplyvnená rôznymi faktormi (normy ISO 18923: 2000 a 18925: 2013 označujú parametre pre správnu údržbu pamäťového média). Je nevyhnutné udržiavať veľmi starostlivo digitálne súbory vytvorené v priebehu času, aby sa predišlo opakovaniu nákladnej práce skenovania. Preto je potrebné zaviesť postupy, ktoré zabezpečia, aby digitálne objekty zostali použiteľné a prístupné bez ohľadu na budúce zmeny v technológii. Použiteľnosť a prístupnosť digitálnych objektov v čase je zaručená formátom súboru (štandardný formát, veľkosť súboru, doba prenosu v sieti, spôsob zobrazenia obrázkov ...), ukladaním médií a digitálnym archívom. Na uľahčenie interoperability s inými systémami, a teda prístup k metaúdajom prostredníctvom iných poskytovateľov služieb (napr. Europeana), je nevyhnutné používať otvorené normy. Súbory z projektu musia byť doručené do dohodnutého archívu a repozitu v súlade s plánom, ktorý musí byť súčasťou projektu. Hardvérová infrastruktura musí byť vybavená modernými systémami detekcie zhoršenia, schopnými rýchlej zmeny a obnovy. 10.2 Dlhodobá archivácia Pri dlhodobej archivácii je nutné sa snažiť zachovať tri základné ciele: 1. technologické uchovanie 2. technologickú emuláciu 3. migráciu údajov Prvé dve snahy zaisťujú možnosť prístupu k digitálnemu objektu použitím pôvodného softvéru a hardvéru alebo emuláciou pôvodného prostredia. Pre dlhodobú archiváciu by mala byť zaistená stratégia založená na možnosti migrácie a zahrnutá do implementácie riešenia. V tomto prípade sú objekty/obsah migrovaný z jedného technologického prostredia do dálšieho. Kritické body migrácie pre dlhodobú archiváciu je zachytenie metaúdajov, ktoré sú potrebné pre podporu manažmentu obsahu a migračného procesu. Archivácia dokumentov by mala byť zaistená na dva rôzne typy archivačného úložiska/média a na dvoch rôznych zemepisných miestach. 73 10.3 Voľba médií Pre dlhodobú aj krátkodobú archiváciu je veľmi dôležité mať znalosť rôznych médií, pretože tie vyžadujú rôzne softvérové a hardvérové zariadenia pre prístup a majú rôzne podmienky archivácie a požiadavky na uchovávanie. Média by mali byť obnovované v pravidelnom cykle doby životnosti média identifikovanom buď výrobcom alebo nezávislým zdrojom. Ukážka príkladu životnosti média skladovaného pri rôznych klimatických podmienkach (RH=relatívna vlhkosť) Médium 25RH 10°C 30RH 15°C 40RH 20°C 50RH 25°C 50RH 28°C D3 magnetická páska 50 rokov 25 rokov 15 rokov 3 rokov 1 rok DLT magnetický páskový box (magnetic cartrige) 75 rokov 40 rokov 15 rokov 3 rokov 1 rok CD/DVD 75 rokov 40 rokov 20 rokov 10 rokov 2 rokov CD ROM 30 rokov 15 rokov 3 rokov 9 mesiacov 3 mesiacov 10.4 Typy médií Média pre archiváciu sa v základnom koncepte rozdeľujú do troch základných skupín: 1. Mikrofilm 2. Magnetické média 3. Optické média V súčasnosti sú magnetická páska a mikrofilm najrozšírenejšie média pre dlhodobú archiváciu, ale optické média sa stávajú stále viac bežné a predovšetkým vhodné aj pre dlhodobú archiváciu. Optické média sa vyvíjajú rýchlo a mali by eventuálne nahradiť zvyšné média pre dlhodobú archiváciu. V súčasnosti však magnetické disky ponúkajú rýchlejší čas prístupu, čo im dáva lepší predpoklad využitia za účelom hromadného uchovávania. Poznámka: Existuje množstvo diskusií vo vnútri ISO, ANSI a ICA ohľadne najvhodnejšieho uchovávania elektronických záznamov. Nasledovné hodnoty ilustrujú príklady z praxe: Priemerná teplota: +18°C/-5°C Relatívna vlhkosť: +40%/-5% Interval medzi prepisom: 10 rokov 74 11 Problémy, které třeba řešit 11.1 Hlavné zistené bariéry v Európe • Fragmentovaný inštitucionálny přístup • Neschopnosť mnohých inštitúcií v oblasti kultúrneho a vedeckého dedičstva odpovedať na potreby používateľov • Neschopnosť mnohých inštitúcií v oblasti kultúrneho dedičstva rozpoznať a implementovat' perspektívne inovácie • Neschopnosť mnohých inštitúcií v oblasti kultúrneho dedičstva prikloniť sa ku spoločnému prístupu • Nejasná návratnosť investície pre inštitúcie v oblasti kultúrneho dedičstva • V rámci inštitúcií je v oblasti digitalizácie nedostatok odbornosti a zručností • Oddeľovanie otázok uchovávania od praktickej digitalizácie • Nevyspelosť kľúčových technológií a štandardov • Neschopnosť kľúčových informačných technológií vysporiadať sa s technologickou zmenou • Slabé zladenie priemyselných záujmov s požiadavkami a potrebami v oblasti kultúrneho dedičstva • Nedostatok jasného smerovania vo výskume a vývoji • Nedostatok vhodných softvérových nástrojov na integráciu digitalizačnú prax do širšieho informačného priestoru • Fragmentácia národných politických prístupov • Nezhoda medzi kultúrnymi programami a programami pre nové technológie v národnom aj v medzinárodnom kontexte • Slabé prepojenie súčasnej legislatívy v oblasti kultúrneho dedičstva s požiadavkami používateľov, hlavne pri presadzovaní využitia vo vzdelávaní a inštitúciách, obsahovom priemysle a služieb s pridanou hodnotou • Nejasné rozdelenie zodpovednosti medzi inštitúciami, projektami a sieťami • Nejasnosť budúceho vlastníctva digitálnych kultúrnych obsahov a infrastruktur • Fragmentované mechanizmy financovania a ciele • Stagnujúca a nepohyblivá národná technická vybavenosť a odbornosť • Absencia rozdelenia digitalizačnej práce a produkcie • Nedostatočná integrácia digitalizačných akcií v znalostnej ekonomike • Nedostatočná priehľadnosť zdrojov čo do ich prístupnosti, kvality, integrity a právne bezproblémové používanie tvorivým kreatívnym priemyslom • Nedostatočná implementácia viacjazyčných prístupov a technológií • Slabé uplatnenie digitálnych kultúrnych zdrojov v znalostnej spoločnosti • Neadekvátne prispievanie digitalizácie do kultúrneho dialógu a k prepojeniu dedičstiev. Navrhuje konkrétne činnosti v týchto oblastiach: • Používatelia a obsah • Trvalá udržateľnosť obsahu • Technologický rozvoj a nástroje • Digitálne uchovávanie • Monitorovanie pokroku 75 12 Známé postupy dlouhodobého uchování digitálních děl 12.1 Výber médií Definícia problému Otázka výberu médií (nosičov) je dôležitá pri projektoch, ktoré chcú udržiavať ich digitálne zbierky počas obdobia niekoľkých rokov. Mnohé projekty (napríklad Domes Day vo Veľkej Británii) sa stratili vďaka zastarávaniu médií. Pragmatické návrhy • Výstup projektu digitalizácie sa bude uchovávať na serverových strojoch, vrátane tých, ktoré poskytujú digitálny obsah používateľom na Internete. Tieto stroje je potrebné zálohovať. Ak server nie je určený výhradne pre daný projekt digitalizácie, digitálny obsah by sa mal ukladať na odpojiteľné médiá oddelené od iných údajov na servri. • Všetky matričné súbory (a príslušné metaúdaje) sa budú zálohovať na dvoch druhoch nosičov skladovaných oddelene od seba. • V súčasnosti (2004) sa bežné zálohovacie médium CD-R nahrádza médiami DVD, ktoré ponúkajú oveľa väčší úložný priestor, pričom zariadenie na čítanie DVD je prítomné na takmer všetkých nových PC a notebookoch. Zariadenia na zapisovanie DVD sú stále dosť drahé, ale ich cena klesá, prípadne sú úplne nahradené inými nosičmi (USB kľúče, pamäťové karty SD a i.) • Ešte pred 10 rokmi sa neočakávalo, že v blízkej budúcnosti nosiče DVD nahradia magnetické pásky, akou je napríklad páska Digital Linear Tape (DLT) ako úložné médiá použiteľné na zálohovanie počítačových diskov. Je potrebné seriózne zváženie oboch technológií na uchovávanie digitálneho obsahu. V skutočnosti sú pásky LT05 a LT06 vhodné na dlhodobé archivovanie. Bežne sa používajú aj pomerne lacné veľkokapacitné úložiská 10 a viac TB aj pre bežné domáce použitie na archivovane digitálneho obsahu. • Bez ohľadu na voľbu média je potrebné mať na pamäti, že dané médium bude v blízkej a stredne vzdialenej budúcnosti zastaralé. Je veľmi pravdepodobné, že v priebehu piatich rokov bude nevyhnutná migrácia na nové úložné médiá. Poznámky/komentáre Projekty digitalizácie v minulosti boli vo veľkej miere projekty poznačené zmenami médií, ktoré boli spôsoboval hlavne konzumentský elektronický priemysel. Stúpajúci trend „ukladať údaje na internete" na veľkých serveroch a na mobilných jednotkách s pevnými diskmi však uľahčuje migráciu údajov z jedného miesta na iné a z média na médium. Ak sa z času na čas servre zálohujú a migrujú na nové servery, očakáva sa, že bude klesať závislosť na oddeliteľných médiách ako jediných záznamoch z procesu digitalizácie. Medzitým ostáva stále dôležitá otázka výberu médií. Nič nenasvedčuje tomu, že sa naráža na obmedzenia pri uchovávaní komprimovaného digitálneho obsahu. 76 12.2 Migračné stratégie Definícia problému Pri výbere formátu súborov a úložného média je potrebné vziať do úvahy realizovateľnosť presunu dát do nového formátu a/alebo na iné úložné médium. Pragmatické návrhy • Preskúmajte príslušné súvisiace štandardy ohľadom formátov súborov a úložných médií, ako bolo uvedené vyššie. Vyhovenie štandardom je rozumným indikátorom toho, že konkrétny formát alebo médium budú nejakým spôsobom podporované aj v budúcnosti. • K používaniu súkromných formátov súborov a neštandardných formátov médií by sa malo pristupovať s obozretnosťou. • Pri migrácii z jedného formátu na iný by sa malo zamedziť konverzii matričného digitálneho materiálu z bezstratového formátu (napr. TIFF v doméne obrazov) do stratového (napr. JPEG). Ak sa raz informácie stratia, nie je možné ich nahradiť. • Je nutné mať na pamäti, že každý formát súborov a/alebo každé úložné médium bude v dohľadnej budúcnosti zastaralé (možno v priebehu piatich rokov, pravdepodobne do desiatich rokov). • O tom, aká bude pravdepodobná realizovateľnosť migrácie z jedného úložného média na iné pri jeho zastarávaní, vypovedá veľkosť trhu s úložnými médiami. • Po vytvorení digitálneho materiálu by sa mali úložné médiá (napr. CD-R, DVD) periodicky obnovovať (jedenkrát za dva až tri roky), aby sa zabránilo strate údajov, to sa týka aj kopírovania všetkých údajov na nové médiá. • Status digitalizovaného materiálu, vrátane údajov o tom, kedy sa obnovoval nosič, by sa mali zaznamenávať v príslušnom protokole. Ak je to možné, kópie digitalizovaného materiálu sa majú uchovávať na viacerých miestach, čím sa zníži riziko straty údajov pri nehodách ako požiar, záplavy a pod. 77 13 Práce s původními digitálními dokumenty 13.1 Zaobchádzanie a práca s originálmi Táto časť za zaoberá tým, ako by sa v rámci projektu malo zaobchádzať s materiálom, ktorý sa digitalizuje. Zdrojový materiál je v mnohých prípadoch vzácny alebo hodnotný, preto sa musí minimalizovať negatívny vplyv, ktorý naň môže mať digitalizácia. V každom prípade je nutné zdôrazniť, že pre projektový tím budú cenné poznatky osôb, ktoré bežne zodpovedajú za zbierky. 13.2 Premiestňovanie a manipulácia s originálmi Definícia problému V mnohých prípadoch je materiál určený na digitalizáciu veľmi citlivý a krehký. Nahradenie bezprostredného prístupu on-line zverejnením je v prvom rade často dôležitým dôvodom projektu digitalizácie. Je kriticky dôležité, aby projekt prijal opatrenia, aby sa počas procesu digitalizácie materiál žiadnym spôsobom nepoškodil. Tieto opatrenia môžu mať podobu používania správneho nardvéru, zabezpečenia vyhovujúcej mikroklímy alebo presunu digitalizačného centra na miesto uloženia materiálu namiesto sťahovania dokumentov a predmetov. Pragmatické návrhy • Pred manipuláciou a prácou so zdrojovým materiálom sa poraďte s osobou, ktorá za materiál zodpovedá. • Vyžaduje sa určitá flexibilnosť - nevyhovenie z pohľadu projektu digitalizácie sa dá prekonať, zatiaľ čo poškodenie jedinečného artefaktu môže byť nenapraviteľné. • Ak to bude potrebné, digitalizačně zariadenie (digitálna kamera) sa môže preniesť k zdrojovému dokumentu alebo predmetu a nemusí sa prepravovať objekt určený na digitalizáciu. • Vyhnite sa rozväzovaniu kníh a spisov. Namiesto plošného skenera použite skener s knižnou kolískou alebo digitálnu kameru. • Vždy odstráňte skoby, spinky, svorky a iné spony; môžu poškodiť digitalizačně zariadenie i zdrojový materiál. • Pred prácou s originálom sa treba poradiť s odborníkom (napr. kurátorom dokumentu/predmetu určeného na digitalizáciu). • Konzultácie sa majú realizovať pred digitalizáciou, ideálne v čase výberu daného kusu na digitalizáciu. Pokyny by sa mali zaznamenať v báze poznatkov digitalizácie a mali by sa preštudovať pred premiestnením alebo digitalizáciou. Ak je to potrebné, schopnosti každého možného hardvérového riešenia by sa mali prekonzultovať s odborníkom. Poznámky/komentár Aj keď sú tieto odporúčania zrejmé, pri zaobchádzaní so zdrojovým materiálom je nutné a dôležité dodržiavať disciplínu 78 79