Digitalizace stručně Význam procesu digitalizácie v odbore knihovníctva Definícia digitalizácie a základné pojmy Digitalizácia v užšom zmysle je proces konverzie analógových dokumentov (text, obraz, zvuk, audio, video) do digitálneho formátu alebo priama tvorba dokumentov v digitálnej forme. Digitálny obsah, ktorý vzniká digitalizáciou je zaznamenaný v samostatných údajových jednotkách (nazývaných bity), ktoré je možné adresovať osobitne (zvyčajne v skupinách viacerých bitov zvaných bajty). Ide o binárne údaje (0, 1), s ktorými dokážu pracovať počítače a iné zariadenia s výpočtovou schopnosťou (napr. digitálne fotoaparáty, digitálne načúvacie pomôcky). Digitalizácia (digitisation) - Proces vytvárania digitálnych súborov snímaním (skenovaním, fotografovaním) alebo iným spôsobom konverzie analógových materiálov. Výsledná digitálna kópia, alebo digitálna náhrada sa označuje za digitálny obsah (digitálny materiál, digitálny dokument) je predmetom digitálneho uchovávania, podobne ako "digitálne narodené" materiály. Digitalizácia môže byť: · prevod informácií z analógového tvaru (analógového signálu, napr. elektrického napätia, zvuku, svetlosti, tlaku) do číslicového (=digitálneho) tvaru, spravidla do počítačových súborov; špecificky najmä: * snímanie a premena grafických tvarov do číslicových tvarov (spravidla pomocou skenera), * snímanie a premena písma do číslicového tvaru (spravidla pomocou skenera a softvéru OCR), * zaznamenávanie a prevod zvukových signálov do číselných tvarov (vzorkovanie, rozlišovanie vzorky), * snímanie a prenos rozmerov trojrozmerných predmetov do číslicového tvaru (spravidla pomocou 3D skenerov), prechod od analógovej techniky na digitálnu techniku, najmä v rámci modernizácie, špecificky napr.: * digitalizácia televízneho a rozhlasového vysielania Európska knižnica V Európe funguje Európska knižnica (The European Library), ktorá umožňuje cez svoj portál všetkým prístup do elektronických katalógov všetkých európskych národných knižníc z krajín Rady Európy. Europeana Digitalizáciou zbierok sa demokratizuje dostupnosť knižničných zbierok a používatelia sa dostávajú cez počítačové siete aj bez návštevy knižnice ku bežným ako aj k unikátnym knižničným zbierkam a dokumentom. - V Európe vznikol program digitalizácie Europeana, na ktorom sa zúčastňujú od r. 2008 aj subjekty z Čiech a Slovenska a cez ktorý sa sprístupňujú postupne digitálne objekty z európskych pamäťových a fondových inštitúcií. Európska knižnica umožňuje neobmedzený prístup ku katalogizačným záznamom európskych národných knižníc a Europeana sprístupňuje nielen katalogizačné záznamy o dokumentoch inštitúcií, čiže tzv. deskriptívne metadáta, ale aj samotné úplné dokumenty, texty, obraz, zvuk, video, ktoré spravujú v jednotlivých krajinách sektory, ako sú knižnice, archívy, múzeá, galérie a audiovizuálne archívy. Vznikajú digitálne knižnice a digitálne repozity, ktoré podstatne uľahčujú, zjednodušujú, urýchľujú a personalizujú komunikáciu medzi knižnicami a používateľmi ich služieb. Na národnej úrovni je partnerom Európskej knižnice spravidla národná knižnica a partnerom medzisektorovej Europeany aj iné národné inštitúcie. Základné pojmy Prístup, sprístupnenie (access) - priebežná a pretrvávajúca použiteľnosť digitálneho zdroja, pričom sa zachovajú všetky kvality hodnovernosti, presnosti a funkčnosti, ktoré sa považujú za podstatné z hľadiska účelu vytvorenia a/alebo získania digitálneho zdroja. Potvrdenie pravosti (authentication) - mechanizmus, ktorého cieľom je stanovenie hodnovernosti digitálnych materiálov v konkrétnom čase. Ide napríklad o digitálne podpisovanie. Hodnovernosť, autentickosť (authenticity) - Digitálny materiál je taký, aký sa zdá byť. V prípade elektronických záznamov sa tento pojem vzťahuje na dôveryhodnosť príslušného elektronického záznamu. V prípade "digitálne vytvorených" a zdigitalizovaných materiálov sa pojem vzťahuje na fakt, že pri citovaní akéhokoľvek zdroja je tento zdroj rovnaký ako keď bol vytvorený, pokiaľ sprievodné metaúdaje neuvádzajú zmenu. Dôvera v autentickosť digitálnych materiálov v čase je obzvlášť dôležitá vzhľadom na ľahkosť vykonania zmien. "Digitálne narodené, digitálne vytvorené" ("born digital") - Digitálne materiály, ktoré nemajú mať analógový ekvivalent, buď ako pôvodný zdroj, alebo ako výsledok konverzie do analógovej formy. Tento termín sa používa na rozlíšenie takýchto materiálov od 1) digitálnych materiálov, ktoré boli vytvorené ako výsledok konverzie analógových originálov (zdigitalizované); a od 2) digitálnych materiály, ktoré mohli vzniknúť z digitálneho zdroja, ale napr. sa vytlačili sa na papier. Digitálna archivácia (digital archiving) - Tento termín sa v rôznych oblastiach používa rôzne. Knihovnícka a archivárska komunita ho často používajú zameniteľne s termínom digitálne uchovávanie. Počítačoví odborníci majú sklon používať termín digitálna archivácia na označenie procesu zálohovania a priebežnej údržby na rozdiel od stratégií dlhodobého digitálneho uchovávania. Digitálna archivácia (digital archiving) - Tento termín sa v rôznych oblastiach používa rôzne. Knihovnícka a archivárska komunita ho často používajú zameniteľne s termínom digitálne uchovávanie. Počítačoví odborníci majú sklon používať termín digitálna archivácia na označenie procesu zálohovania a priebežnej údržby na rozdiel od stratégií dlhodobého digitálneho uchovávania. Digitálne materiály, digitálne zdroje (digital materials) - široký termín zahŕňajúci digitálne náhrady vytvorené ako výsledok konverzie analógových materiálov na digitálnu formu (digitalizácia), ďalej "digitálne vytvorené" materiály, pre ktoré neexistuje a nikdy nebude existovať analógový ekvivalent, a digitálne záznamy. Digitálne uchovávanie (digital preservation) - termín označujúci sériu riadených činností potrebných na zabezpečenie trvalého prístupu k digitálnym materiálom na taký dlhý čas, na aký to je potrebné. Digitálne uchovávanie má veľmi širokú definíciu a vzťahuje sa na všetky úkony požadované na udržanie prístupu k digitálnym materiálom až za hranice výdrže nosičov bez ohľadu na technologické zmeny. Môže ísť o záznamy vytvárané počas každodennej činnosti organizácie; o "digitálne narodené" materiály vytvorené na konkrétny účel (napríklad zdroje pre vzdelávanie); alebo výstupy projektov digitalizácie. Existuje možnosť využitia digitálnych technológií na uchovávanie originálnych artefaktov prostredníctvom digitalizácie. Dlhodobé uchovávanie - Dlhodobé uchovávanie je najkomplikovanejšia výzva digitálnej doby, a preto je to významná oblasť výskumu a praxe, ktorá je zameraná na dlhodobé uchovávanie digitálneho obsahu. Dlhodobosťou sa pritom rozumie 50 a viac rokov. Trvalý prístup k digitálnym materiálom, alebo aspoň k informáciám v nich obsiahnutým, na neurčitú dobu. (Napr. 100 rokov podľa Kongresovej knižnice USA) Strednodobé uchovávanie - Trvalý prístup k digitálnym materiálom presahujúci technologickú zmenu na určité obdobie (nie na neurčitú dobu). Krátkodobé uchovávanie - Prístup k digitálnym materiálom buď na určité obdobie, kým sa predpokladá ich využívanie, pričom toto obdobie nepresahuje predpovedateľnú budúcnosť a/alebo uchovanie na obdobie, kým sa materiály nestanú neprístupné vzhľadom na zmenu technológií. Emulácia (emulation) - Spôsob prekonávania technologického zastarávania softvéru vývojom techník na imitáciu zastaralých systémov v budúcich generáciách počítačov. Migrácia (migration) - Spôsob prekonávania technického zastarávania prevodom digitálnych zdrojov z jednej generácie hardvéru/softvéru na ďalšiu. Účelom migrácie je zachovať intelektuálny obsah digitálnych objektov a zachovať pre klientov možnosť získať, vyhľadať a používať bez ohľadu na meniace sa technológie. Migrácia sa líši od obnovovania skladovacích médií v tom, že nie vždy je možné vyrobiť presnú digitálnu kópiu alebo replikovať pôvodné vlastnosti a vzhľad a stále zachovať kompatibilitu daného zdroja s novou generáciou technológií. Význam digitalizácie Digitalizácia znamená podstatnú inováciu informačných služieb knižníc a iných informačných inštitúcií a systémov. Od katalógov smerom k úplným textom, obrazom, zvuku, audio, video. Digitalizácia umožňuje: · Plnotextové vyhľadávanie. Pridanou hodnotou digitalizácie kultúrnych a vedeckých objektov je možnosť vyhľadávania v plných textoch, indexoch či klasifikáciách, a tým aj efektívneho a rýchleho získavania potrebných informácií, údajov, odpovedí či znalostí, čo má nesmierny význam pri procesoch riadenia a rozhodovania, vzdelávania a ďalších ľudských činnosti v akejkoľvek sfére. · Zdroj poznania jazyka. Digitalizáciou sa vytvára jedinečný a obrovský masív digitálnych textov, čo umožní získať dôkladné a úplné vedomosti o vývoji jazyka (národný korpus jazyka, lexikografia, etymológia). · Retrospektívny zdroj informácií. Zdigitalizované archívne dokumenty okrem nezastupiteľnej úlohy zdroja retrospektívnych informácií pri zachovaní kontinuity rozhodovacích a riadiacich procesov pri výkone verejnej správy budú akcelerátorom rozvoja miestnej kultúry, prispejú k zvyšovaniu vedomostnej úrovne o vlastných dejinách, zohrajú významnú úlohu pri upevňovaní kultúrnej a občianskej identity, národných tradícií a rodovej rovnosti. · Historický výskum. Digitálna knižnica a digitálny archív bude rovnako nenahraditeľným zdrojom poznatkov a informácií pre historický výskum, pre tvorbu encyklopédií, výkladových slovníkov, odborných a vedeckých syntetických diel. · Digitálny obsah pre školy. Digitálna knižnica a digitálny archív sprístupní všetky diela, ako sú napríklad učebnice ako aj všetku vedeckú a odbornú literatúru potrebnú pre vzdelávanie na všetkých stupňoch škôl. · Antiplagiátorské systémy. Digitálna knižnica a digitálny archív je jedinečným masívom digitálnych textov, ktoré bude možné využiť na vysokých školách v antiplagiátorských systémocha tým podporí etiku publikovania. Bez digitálnej knižnice je antiplagiátorský systém nemysliteľný. · Osobné digitálne knižnice. Prezentačný systém Digitálnej knižnice a digitálneho archívu umožní používateľom tvorbu osobných digitálnych knižníca zdieľanie poznatkovpodľa tematického alebo komunitného princípu(Web 2.0, Web 3.0 a súvisiace služby). Digitalizácia umožňuje premenu pamäťových a fondových inštitúcií na moderné organizácie, ktoré dokážu reagovať na potreby a požiadavky spoločnosti sa spája predovšetkým s komplexnou digitalizáciou spravovaných fondov, hmotných artefaktov, či na rozmanitých nosičoch zachytených nehmotných súčastí kultúrneho dedičstva a znalostí o tomto bohatstve nadobudnutom počas existencie inštitúcií. Digitalizácia je teda prostriedok, ktorého pomocou inštitucionalizovaná kultúra dokáže získať lepšiu kontrolu nad kultúrnym dedičstvom. Prínosy digitalizácie v praxi · Digitálne zbierky môže ktokoľvek a kedykoľvek prehľadávať rýchlo, nezávisle a komplexne z akéhokoľvek miesta cez počítačovú sieť. · Ušetrí sa čas zamestnancov zodpovedaním najčastejšie kladených otázok na internetovej stránke. · Digitálne obrazy sa elektronicky môžu vylepšovať tak, aby sa dali prezerať a mohli byť lepšie zobrazené a čitateľné. · Digitalizácia zlepšuje a rozširuje možnosti využívania zbierok. · Digitalizácia napomáha vzdelávaniu a bádaniu: digitálne materiály vzácnych a ťažko dostupných digitalizovaných dokumentov sú použiteľné v školách priamo vo vzdelávacom procese. · Digitalizácia spojená s OCR umožňuje uskutočňovať fulltextové vyhľadávanie (napr. historické noviny a časopisy, projekt digitalizácie diplomových prác a dizertácií a pod.) · Digitalizácia umožňuje počúvať/prezerať zdigitalizované zvukové nahrávky a videozáznamy. · Digitalizáciou a vylepšením kvality sa sprístupní obsah záznamov na nosičoch, ktoré nie je možné prezerať/prehrávať pomocou bežných zariadení (mikrofilmy, negatívy atď.). · Digitalizácia umožňuje kvalitnejšiu intelektuálnu kontrolu cez tvorbu nových vyhľadávacích pomôcok, väzieb na bibliografické záznamy a vývoj indexov (registrov) a iných nástrojov. · Digitalizácia umožní lepšie a bohatšie využívanie materiálov, keďže umožní rozsiahly prieskum, manipuláciu s obrazmi a textami a skúmanie digitálnych obrazov v nových kontextoch. · Digitalizáciou sa dosiahne kvalitnejšie využívanie zbierok cez zlepšenú kvalitu obrazu (napríklad zlepšená čitateľnosť vyblednutých alebo poškvrnených dokumentov). · Digitalizácia umožní vytvárať „virtuálne zbierky“ na základe flexibilnej integrácie a syntézy rozličných formátov alebo obsahovo či tematicky súvisiacich materiálov nachádzajúcich sa na rôznych miestach. · Pri digitalizácii je zvýšená intelektuálna kontrola prostredníctvom vytvárania nových vyhľadávacích pomôcok, prepojenie na bibliografické záznamy, tvorba registrov a iných nástrojov · Zvýšené a obohatené využívanie na základe možnosti rozšíreného vyhľadávania, manipulácie s obsahom, štúdium rozmanitých zdrojov v nových kontextoch. · Podpora nového spôsobu využitia na vzdelávanie na základe poskytovania vylepšených zdrojov vo forme rozsiahleho rozširovania lokálnych a jedinečných zbierok, lepšie využívanie prostredníctvom zlepšenej kvality dokumentu, napríklad, lepšia čitateľnosť poškvrnených a vyblednutých textov, lepšia počuteľnosť, · Vytváranie "virtuálnych zbierok" prostredníctvom flexibilnej integrácie a syntézy rozmanitých formátov alebo virtuálne zbierky vzájomne súvisiacich materiálov roztrúsených na mnohých miestach Plánování a příprava procesu digitalizace Tabuľka Projekt digitalizáie. Opis projektu Projekt digitalizácie Opis projektu Názov projektu Inštitúcia Organizačný útvar inštitúcie (oddelenie, ústav, katedra ai) Vedecký manažér Priezvisko, Meno Telefón fax e-mail Vedecký manažér (expert alebo vedecká rada) je subjekt, ktorý je zodpovedný za výber materiálu na digitalizáciu a definovanie kvality metadát. Vo fáze výberu materiálu je podporovaný projektovým manažérom, najmä pokiaľ ide o kontrolu materiálu a právne aspekty. Manažér projektu Priezvisko, Meno Telefón fax e-mail Projektový manažér spolupracuje s vedeckým manažérom pri analýze právnych otázok, koordinuje činnosti digitalizácie a garantuje kvalitu metadát. Technický koordinátor Priezvisko, Meno Telefón fax e-mail Koordinuje technické a technologické procesy a spolupracuje s tímom, ktorý v systéme zabazpečuje využívanie, prevádzkyschopnosť a prevádzky Stručný popis zbierky určenej na digitalizáciu Stručný popis etáp projektu a osoby zodpovedné za etapy (názov etapy) Začiatok / Koniec Zodpovednosť Trvanie projektu: Začiatok - Koniec RRRRMMDD Začiatok Koniec Informácia o dokumentoch určených na digitalizáciu (knihy, noviny, časopisy, atlasy, mapy, fotografie atd.). Typ (znak) Počet Poznámka Tlačený text Rukopisný text Tlačené alebo rukopisné hudobniny Mapy Postery Pohľadnice Kresby Maľby Tlač (gravírovanie, leptanie atď.) Pergamen Negatív č / b Fotografia č / b Fotografia col. Snímka č / b Posúvač stĺpcov. Iné (špecifikuj) Maľby Forma dokumentov určených na digitalizáciu (nosič) voľné listy zrolované listy, zvitky zviazané Album na kartóne alebo iných materiáloch v ráme obálky Zložky krabice iné ?__ voľné listy Rozmery dokumentov Menšie ako A4 A4 A3 A2 A1 A0 Väčšie ako A0 Iná veľkosť - špecifikuj Celkový počet dokumentov na digitalizáciu Informácia o digitálnych objektoch Odhad počtu digitálnych objektov Ako je možné použiť digitálne objekty (plán) V sprístupnení sa musí dbať na práva duševného vlastníctva. Otvorený prístup je k deskriptívnym metadátam a môže byť aj k náhľadom objektov, voľným alebo osirelým dielam ap. Práva sprístupnenia sa môžu viazať na každý jednotlivý dokument alebo zbierku otvorený, voľný prístup na webe obmedzený prístup na webe prístup v lokálnej sieti CD-ROM alebo DVD Tlač iné (špecifikuj)___ Predbežná kontrola Zdroj dokumentov (odkiaľ pochádzajú) akvizícia áno - nie Dar áno - nie neviem áno - nie iné (špecifikuj)_ áno - nie Ak áno, aké boli výberové kritériá? historická a kultúrna hodnota áno - nie unikátnosť a rarita áno - nie často žiadaný áno - nie materiál bez právnych obmedzení prístupu alebo o získaným povolením na digitalizáciu a prístup áno - nie prístup obmedzený z dôvodu stavu ochrany, hodnoty alebo miesta áno - nie pridaná hodnota prostredníctvom online prístupu, áno - nie vytvárania virtuálnych zbierok áno - nie zvýšenie záujmu o výskum pre málo známy alebo neznámy materiál atď. iné (špecifikuj) áno - nie Bola vykonaná kontrola? áno – čiastočne - nie Existuje už digitalizovaná verzia? áno - nie Ak nie, tak vypíšte, v ktorých organizáciách ste vykonali kontrolu, či je dokument alebo zbierka digitalizovaná? Sú nejaké právne obmedzenia (copyright, ochrana súkromia, donorské práva atd)? áno – čiastočne - nie Podrobnejšie o obmedzeniach Sú už dokumenty katalogizované? áno – čiastočne – nie - neviem Ak áno, tak ako? tlačený zoznam elektronický zoznam tlačený katalóg elektronický katalóg tlačený archívny zoznam elektronický archívny zoznam iné (špecifikuj) V prípade, že ide o tlačený text, máte v úmysle robiť OCR ? (Optical Character Recognition)? áno – čiastočne – nie V prípade že ide o rukopisný text, máte v úmysle transkribovať, prepísať text dokumentov? áno – čiastočne – nie - neviem Približné náklady na digitalizáciu In-house náklady spolu: Náklady na technickú infraštruktúru, hardvér, softvér, úpravy, tovary, služby Prevádzkové náklady Outsourcing spolu Jednotkové ceny Autor opisu projektu Dátum Dolupodpísaní sú si vedomí, že musia pracovať v súlade s miestnymi predpismi o autorských právach. Vyhlasujú, že dokumenty tohto projektu sú (zaškrtnite jednu z možností): vo vlastníctve tejto inštitúcie a chránené platnými právnymi predpismi o autorských právach o priemyselnom vlastníctve vo vlastníctve tretích strán, ktoré však udelili inštitúcii právo tejto ich používať vo verejnej doméne Podpis vedeckého manažéra Podpis projektového manažéra Digitalizácia externou firmou alebo interne Outsourcovaná digitalizácia sa môže vykonať v priestoroch knižnice alebo na mieste vybranej spoločnosti. Ak sa digitalizácia vykonáva v spoločnosti, musí premiestnenie písomností povoliť štatutár inštitúcie a príslušný vedúci. Vrátenie písomností musí byť oznámené štatutárovi a supervízorovi. Tok činností súvisiacich s digitalizáciou mimo inštitúcie zahŕňa: · Definovanie parametrov snímania · Kvantifikácia · Vypracovanie štúdie uskutočniteľnosti alebo ponuky · Posúdenie technických a logistických aspektov · Usporiadanie dávky – technologické triedy · Príprava dokumentov - identifikátory · Školenie personálu a prevádzkovateľov zapojených do kontroly kvality · Vytvorenie prototypu digitalizácie (technologický model) · Kontrola kvality · Oprava chýb · Premiestnenie dokumentov · Dodávka produktu · Konečná kontrola kvality Tok in-house digitalizačných aktivít zahŕňa najmä: · Definovanie parametrov snímania · Nákup vybavenia · Školenie príslušných zamestnancov a operátorov · Preskúmanie technických a logistických aspektov · Usporiadanie dávky – technologické triedy · Príprava dokumentov - identifikátory · Vytvorenie prototypu digitalizácie · Kontrola kvality · Oprava chýb a chýb · Premiestnenie dokumentov Prehľad najlepšej praxe možno nájsť napríklad na stránke Minerva: http://www.minervaeurope.org/bestpractices/listgoodpract.htm Čo je objekt digitalizácie Pre potreby projektu digitalizácie v digitálnej knižnici vo všeobecnosti sú objektami všetky entity, ktoré majú v SVKBB samostaný identifikačný znak alebo ktoré môžu potenciálne predstavovať predmet používateľského záujmu, ako samostane identifikované jednotky. Pojem objekt v digitalizácii má dva hlavné významy: Objekt (predmet) digitalizácie (analógový dokument, ktorý je predmetom záujmu digitalizácie)Digitálny objekt[1],[2] (digitálna entita v digitálnom prostredí, v digitálnej sieti) je objekt alebo množina počítačových súborov, ktoré sú výsledkom digitalizácie analógových objektov. Ide o jeden súbor alebo množinu súborov, potrebných na prezentáciu jedného komplexného objektu. Jednotlivé súbory nie sú samostatnými objektami. Digitálny objekt je základná jednotka pre agregáciu informácií v repozite. Digitálny objekt v repozite musí obsahovať minimálne dva elementy: a) persistentný identifikátor, b) metadáta MARC alebo Dublin Core. Objekty v digitálnej knižnici textových dokumentov a knižničných zbierok sú najmä: 1. samostatné fyzické jednotky knižničného fondu, ktoré majú prírastkové číslo 2. fyzický zväzok tlačenej knihy (jeden fyzický zväzok viaczväzkového vydania titulu, napr. 1 zväzok encyklopédie) 3. zviazaný ročník novín a seriálu 4. číslo tlačených novín 5. číslo tlačeného časopisu 6. jednotlivý článok z tlačeného vedeckého alebo odborného časopisu a monografie s identifikátorom SICI 7. jednotlivý článok z tlačeného vedeckého alebo odborného zborníka so SICI 8. tlačená pohľadnica ako jednotka fondu 9. fotografia ako jednotka fondu alebo album 10. tlačená mapa ako jednotka fondu 11. tlačená hudobnina ako jednotka fondu 12. tlačená grafika ako jednotka fondu 13. počítačový súbor Plánování a příprava procesu digitalizace v knihovně Kultúrne inštitúcie, ako knižnice, múzeá, archívy a organizácie venujúce sa prírodnému a environmentálnemu dedičstvu sú hlavnými dodávateľmi digitálneho obsahu, no musia sa mobilizovať. Ich úsilie je potrebné koordinovať, aby sa čo najlepšie využili existujúce technológie a prispelo sa k tvorbe, využívaniu a poskytovaniu lokálneho kultúrneho obsahu, ktorý vyhovuje potrebám všetkých občanov. Prostredníctvom tohto aktualizovaného plánu je na realizáciu vízie Európskeho kultúrno-informačného priestoru sledovaných šesť cieľov, pričom sa berie do úvahy a ďalej rozvíja predchádzajúci Lundských zásady. Rovnako sa pri plánovaní digitalizácie využívajú aj zistenia a návrhy projektu Minerva a najlepšia prax inštitúcií, ktoré už majú s digitalizáciou praktické skúsenosti. Najdôležitejšie praktické vedomosti získané tímom pre najlepšie praktiky poskytuje projekt Minerva. Zameriava sa na praktické pravidlá, ktoré by mali organizácie zobrať do úvahy pri začatí, realizácii alebo riadení digitalizačných projektov vo sfére kultúry. Odporúčania sú rozdelené do nasledovných oblastí, z ktorých každá odráža nejakú etapu projektu digitalizácie: 1. Plánovanie projektu digitalizácie 2. Výber zdrojového materiálu na digitalizáciu 3. Príprava na digitalizáciu 4. Zaobchádzanie a práca s originálmi, workflow 5. Procesy digitalizácie, snímania 6. Uchovávanie originálneho digitálneho materiálu 7. Metaúdaje 8. Zverejnenie 9. Práva duševného vlastníctva a copyright 10. Manažment projektov digitalizácie Manažérske plánovanie projektu digitalizácie Plánovanie projektu je prvým krokom akéhokoľvek projektu digitalizácie. Čas venovaný plánovaniu sa oplatí tak, že sa uľahčí riadenie a realizácia projektu. Za normálnych okolností je potrebné odpovedať na nasledovné otázky: * Čo sa musí urobiť? * Kto to bude robiť? * Kde sa to bude robiť? * Kedy sa to bude robiť? * Ako sa to bude robiť? * Aké budú náklady? Projekt digitalizácie musí mať jasne špecifikované ciele, pretože majú priamy vplyv na výber, copyright a zverejnenie materiálu. Do projektu by mal byť zapojený vhodný personál s vyhovujúcimi vedomosťami a zručnosťami. Mal by zahŕňať aj plán školení, aby sa zaručila dostatočná odbornosť, ktorú môže projekt vyžadovať. Hardvér Je potrebné zabezpečiť vhodné technické zariadenia na digitalizáciu, akými sú zariadenia na snímanie digitálneho obrazu (digitálne fotoaparáty a kamery, skenery na knihy, dokumenty alebo mikrofilmy, audio a video hardvér) pripojené na vhodnú počitačovú platformu (počítač, operačný systém, sieť). Je možné rozlíšiť dve rôzne metódy digitalizácie: skenovanie a používanie digitálnych kamier/fotoaparátov. * Pred začatím digitalizácie sa musí nainštalovať vhodný hardvér a skontrolovať jeho kvalita a funkčnosť. * Na účely ohodnotenia zariadení na zhotovenie digitálneho obrazu by sa mali použiť relevantné skúšobné materiály. * Kým sa hardvérové prostredie úplne nepripraví a neodskúša na necitlivých materiáloch, nemali by byť prítomné žiadne analógové materiály určené na digitalizáciu. * Pre materiál, ktorý sa nepoškodí pritlačením o tvrdý povrch, bude vhodný plošný skener (napríklad rozviazaný tlačený materiál a rukopisy, fotografie) * Na účely projektu by sa mal zaobstarať čo najväčší skener. Nemalo by sa pristupovať k mozaikovitému skenovaniu alebo k skladaniu materiálov. Je potrebné mať na pamäti, že preprava veľkého skenera (napr. A0) nie je triviálna záležitosť. * Plošný skener by sa mal použiť len vtedy, ak je materiál plochý a nepoškodí sa pri pridržaní na plochom tvrdom povrchu. Pre mnohé viazané dokumenty bude vhodný skener s knižnou kolískou, až do príslušnej veľkosti. Mnohé materiály, ktoré nie sú ploché, ani vhodné pre knižnú kolísku, budú na zhotovenie obrazov vyžadovať digitálny fotoaparát/kameru. * Pri použití skenera by malo mať toto zariadenie aspoň taký rozsah, ako je veľkosť dokumentu/objektu, ktorý sa má skenovať. * Zhotovenie obrazu by sa malo realizovať pri čo najvyššom primeranom rozlíšení. Snímaním budú vznikať veľké súbory, z ktorých sa môžu derivovať menšie verzie - napríklad na účely prezentácie cez Web. Z obrazu s nižšou kvalitou snímania nie je možné získať obraz s vyššou kvalitou. * Definícia “primeraného” rozlíšenia závisí od povahy snímaného materiálu a od spôsobov využitia digitálnych obrazov. Napríklad, ak sa skenované obrázky majú použiť len ako miniatúrne náhľady, skenovať sa môže pri nižšom rozlíšení napr. do 300 dpi. Vo všetkých prípadoch však musí rozlíšenie umožniť zachytenie najvýznamnejších detailov dokumentu alebo predmetu. Je ťažké odôvodniť použitie vyššieho rozlíšenia, ak skenovanie s vyšším rozlíšením neposkytuje viac informácií ako skenovanie pri nižšom rozlíšení. Odporúča sa snímať v najvyššej dosiahnuteľnej kvalite. * Snímaním obrazu by sa mal vytvárať formát súborov, ktorý je bezstratový, čiže nekomprimovaný. Typicky sa používa formát TIFF (Tagged Image File Format). * Projekt by mal použiť čo najvýkonnejší a flexibilný snímač, digitálnu kameru (fotoaparát), akú je možné zaobstarať. Žiadnym ďalším spracovaním nie je možné prekonať obmedzenia digitalizačného zariadenia. Je potrebné poznamenať, že digitálny “zoom” neposkytuje lepšiu kvalitu obrazu, len sa ním zobrazuje menej bodov (pixelov) na jednotku plochy zobrazenia. Na zachytenie detailov sú najdôležitejšie tieto tri parametre: počet bodov (pixelov) v obraze, bitová hĺbka a kvalita použitých optických šošoviek. * Je dôležité mať k dispozícii vhodné stojany na uchytenie a pridržanie materiálov pri digitalizácii. * Mala by sa použiť digitálna kamera/fotoaparát s účelovým stojanom. Kamera alebo fotoaparát by mali byť nainštalovane na trojnohom statíve a podľa potreby by malo mať použité doplnkové osvetlenie, filtre a pod. * Fotografická rovina a rovina materiálu musia byť rovnobežné, aby sa obraz neskreslil. * Súčasťou fotografických príprav musí byť vhodné osvetlenie. Je málo pravdepodobné, že bude postačovať len okolité svetlo. Svetelné podmienky musia byť stabilné. * Na zníženie skreslenia farieb by sa mali použiť vhodné filtre. * K zariadeniam musí byť pripojený počítač s veľkým úložným priestorom. Údaje na tomto počítači by sa mali v krátkych a pravidelných intervaloch zálohovať. * Ak sa musí obraz skenovať po častiach, mal by sa ponechať priestor niekoľko centimetrov na prekrytie, aby sa zabránilo vzniku medzier medzi jednotlivými časťami. Pre všetky časti by sa mali použiť rovnaké nastavenia, aby nedošlo ku efektu „zlátaniny“. Formáty souborů[3] Ukládat je možné do těchto formátů: · GIF* — bezeztrátová komprese LZW, maximálně 256 barev (uložených v paletě), vhodný pro ukládání grafiky pro internet · JPEG — pouze True Color formát a v odstínech šedi, ztrátová komprese, skvělý na fotografie · PNG* — moderní univerzální formát, neztrátová komprese ZIP lepší než LZW, paletový i nepaletový, vhodný pro další zpracování obrázků, nepodporuje EXIF · TIFF* — klasický DTP formát, nejvariabilnější z bitmapových formátů, podporuje LZW, ZIP, JPEG, RLE a bez komprese, paletové i nepaletové uložení barev a CMYK barvy · TGA — tradiční formát · BMP — standardní formát Microsoft Windows, nejrozšířenější je varianta bez komprese, formát podporuje naprostá většina software · PCX — komprese RLE, vhodný pouze pro jednoduchou čárovou grafiku · JXR*, HDP — nejnovější formáty vycházející z JPEG formátu a rozšiřující jeho možnosti, umožňuje uložení obrázků v šestnáctibitové barevné hloubce · AVIF* – moderní formát, který vychází z open source formátu kódování videa AV1. Využívá ztrátovou i bezeztrátovou kompresi a obecně dosahuje lepšího kompresního poměru než např. JPEG, PNG nebo formát WebP. *tyto formáty podporují ukládání včetně průhlednosti. JPEG Prokládání – soubor bude uložen tak, aby již při jeho nahrávání bylo možné jej alespoň částečně zobrazit. Tato volba má smysl pouze pro publikování na internet. JPEG komprese – speciální ztrátová komprese vyvinutá pro úsporné ukládání fotografií. Míra komprese určuje i stupeň poškození obrázku. Pro kvalitní fotografie volte hodnoty nad 90, pro náhledy je možné zvolit méně např. 75. Kvalita komprese se odvozuje od charakteru obrázku, proto je důležité kontrolovat kvalitu výstupu v cílovém náhledu. Další informace viz Ztrátová komprese JPEG a bezztrátové operace. TIFF Formát podporující nejširší škálu barevných hloubek, barevných modelů i kompresí. RAW Zkratka, pod kterou se zahrnují formáty používané v digitálních fotoaparátech pro uložení nezpracovaných dat. Ve skutečnosti se jedná o skupinu různých formátů, mnohdy zcela odlišných. RAW formát z fotoaparátu obsahuje více informací než JPEG, čímž nabízí v počítači větší volnost při zpracování. Nevýhodou je nutnost časově náročnějšího zpracování a možnost různé interpretace uložených dat. ZPS Formát podporuje zachování vrstev a masek v Editoru. Můžete se tak kdykoliv k úpravám provedeným v Editoru vrátit. Workflow masovej digitalizácie Obr. Workflow digitalizácie 1 (Zdroj: Ivo Iossiger, Dušan Katuščák) · Obr. Workflow digitalizácie 1a (Zdroj: Ivo Iossiger, Dušan Katuščák) · Obr. Workflow digitalizácie (Zdroj: Ivo Iossiger, Dušan Katuščák) · Obr. Workflow digitalizácie (Zdroj: Ivo Iossiger, Dušan Katuščák) · Obr. Workflow digitalizácie (Zdroj: Ivo Iossiger, Dušan Katuščák) · Obr. Workflow digitalizácie (Zdroj: Ivo Iossiger, Dušan Katuščák) · · • Obr. Workflow digitalizácie (Zdroj: Ivo Iossiger, Dušan Katuščák) · Obr. Workflow digitalizácie (Zdroj: Ivo Iossiger, Dušan Katuščák) Druhy skenerov S pomocou skenera je možné digitálne snímať a následne po snímaní upravovať digitálne obrázky (napr. texty, fotografie, obrázky z časopisov a pod.). Výstupom je obraz predlohy vo forme binárneho obrázku, ktorý ovládač skenera umožňuje uložiť vo formáte bežne používanom iným softvérom (bmp, jpeg, tiff, pcx, png, gif a pod.). Súčasťou skenera je jeho ovládač, ako aj tzv. twain interface, ktorý umožní používať driver skenera a tým skenovať obrázok priamo do príslušnej aplikácie. Obvykle je ku skeneru pribalený aj jednoduchý softvér na úpravu a tlač obrázkov, niekedy tiež tzv. OCR softvér, slúžiaci na strojové čítanie textu (obrázok textu sa prekonvertuje na text). Ručný skener Tiež hand-held scanner. Prvou kategóriou skenerov sú ručné skenery, ktoré sa dnes používajú len v obmedzenom rozsahu – väčšinou len tam, kde je potrebné skener prenášať – mobilné riešenia. Zariadenie je podobné väčšej myši, ktorou užívateľ prechádza cez obrazovú predlohu a zosnímané dáta odošle do pripojeného počítača (alebo uloží do integrovanej pamäte). Výhodou sú malé rozmery, nevýhodou je hlavne nízka kvalita snímania a malá šírka snímania (~ 10 cm). Ručné skenery sú náročne na spôsob ovládania, pretože užívateľ musí pohybovať skenerom po predlohe ručne. Presnosť snímania je potom daná presnosťou, a plynulosťou pohybu ruky. Prechodový skener Prechodový skener sníma dokument na rovnakom princípe ako faxový prístroj. Predloha (obvykle len jeden hárok papiera štandardnej hrúbky) sa vloží do skenera, ktorý ho posúva cez štrbinu okolo CCD snímacieho prvku. Táto skupina skenerov je určená na snímanie papiera s formátom maximálne A4. Výhodou sú malé nároky na miesto, nevýhodou je nemožnosť snímania predlohy z časopisu alebo knihy. Obvykle sa s nimi stretávame iba ako so zabudovanou súčasťou iných zariadení (fax, tlačiareň a pod.) Plošný skener Flatbet scanner. V súčasnosti sú najrozšírenejšou skupinou stolné plošné skenery. Tieto snímajú predlohu, ktorá je položená na sklenenú dosku, pričom sa pod touto doskou pohybuje snímacia hlava. Plošné skenery sú konštrukčne náročné, ale poskytujú kvalitný výstup pri snímaní predlôh. Ich nevýhodou sú väčšie nároky na miesto. Plošné skenery sa vyrábajú vo formátoch A5, A4 a A3. Bývajú aj súčasťou multifunkčných zariadení, ktoré obsahujú navyše aj tlačiareň. Filmový skener Filmový alebo kinofilmový skener slúži na snímanie negatívov alebo diapozitívov. Na zosnímanie malého formátu obrázku z kinofilmu do vysokého rozlíšenia sa vyžaduje iná technológia snímania ako pri plošných skeneroch. Slúži pre snímanie jednotlivých políčok filmu s použitím vysokého rozlíšenia – minimálne 2400 dpi. Vzhľadom k špecifickému účelu sú používané iba profesionálne. Bubnový skener Drum scanner. Zvláštnou kategóriou sú bubnové skenery – sú určené pre profesionálne snímanie. Predloha sa vloží do skleneného bubna, ktorý sa otáča. V bubne sa nachádza snímacie zariadenie, ktoré predlohu sníma v kružniciach. Ich nevýhodou je vysoká cena, a preto sú používané hlavne pre snímanie veľmi veľkých predlôh, prípadne tam, kde je potrebná vysoká kvalita výsledku. Táto technológie je najstaršou snímacou technológiou. 3D skener Technológia umožňujúca pomocou laserových lúčov nasnímať trojrozmerný objekt. Využíva sa nie len snímanie povrchu objektov, ale laserom je zároveň odmeraná presná vzdialenosť k nim. Táto technológia sa používa pre získanie trojrozmerného obrazu snímanej predlohy napr. sochy, miestnosti a pod. Táto technológia je veľmi nákladná, a preto je vhodná pre opakované profesionálne využitie. Konštrukčné časti Najčastejšie používaným skenerom je plošný skener, ktorý býva aj súčasťou multifunkčného zariadenia. Obrázok Schéma procesu snímania skenerom Metaúdaje (metadáta)[4] Oblasť metadát je jedna z najaktívnejšie skúmaných a najdynamickejších v celej oblasti digitalizácie, rovnako aj v oblastiach, akými je informačný prieskum, vyhľadávanie na Webe, výmena údajov, integrácia rozličných aplikácií. atď. Zvolenie vhodného modelu metadát je obzvlášť dôležité, nakoľko ovplyvňuje výber atribútov na opísanie objektu a manipuláciu s objektom. Tab Metadáta. Využitie a štandardy Typ metadát Možná úloha metadát v programoch digitalizácie Štandardy Deskriptívne metadáta na popis zbierok alebo jednotiek Výber obsahu na digitalizáciu Podpora vyhľadania a získavania digitalizovaného obsahu Rozličné štandardy (MARC, MODS, Dublin Core, EAD, TEI Header, textMD) Identifikátory Dôsledná identifikácia obsahu počas celého procesu digitalizácie Balenie obsahu Podpora prístupu a opätovného použitia digitalizovaného obsahu Rozličné metódy a štandardy Technické metadáta o výsledkoch snímania (skenovania, fotografovania) Zaznamenávanie informácií o výsledkoch procesov snímania, napr. formáty súborov, farebnosť, kompresné algoritmy atď. Zaznamenávanie informácií o vylepšeniach obrazu vykonaných pred OCR, binarizáciou obrazu atď. NISO Z39.87, MIX Metadáta rozloženia strany Zaznamenávanie textu vytvoreného OCR pre konkrétnu stranu spolu so súradnicami umiestnenia slova a odseku, bloku textu a ilustrácie ALTO (a rozšírená schéma METS) Kódovanie (značkovanie) textu Identifikácia štrukturálnych prvkov textov TEI, TEI-Lite Balenie obsahu Umožnenie spoločného ukladania komplexných balíkov digitalizovaného obsahu (napr. Prepojenie viacstranových obrázkov s priradeným textom OCR, metadát) na správu a prístup pre koncových používateľov (balíček obsahuje konzistentný digitálny obsah zodpovedajúci analógovému dokumentu) METS, MPEG-21 DIDL, OAI-ORE Ochranné metadáta Technické informácie, ktoré môžu pomôcť podporiť dlhodobú udržateľnosť digitalizovaného obsahu PREMIS Data Dictionary, NLNZ Preservation Metadata, LMER (DNB) Administratívne metadáta Zaznamenávanie informácií o samotnom procese digitalizácie, napr. dokumentovanie možností výberu obsahu, používanie konkrétnych nástrojov na vylepšenie obrazu alebo OCR, použité jazykové slovníky atď. Metadáta na opis dokumentu (deskriptívne metadáta) Deskriptívne metadáta sú de facto bibliografické metadáta používané na popis bibliografických jednotiek i použitie popisov v bibliografiách a katalógoch. Pred výberom modelu metadát pre projekt digitalizácie by sa mal skontrolovať dokument alebo iný predmet opísaný prostredníctvom príslušných metadát. * Použitie vhodných metadát je veľmi dôležité pre to, aby bolo možné nájsť a získať materiál z digitálnych repozitárov. * Existuje niekoľko modelov metadát. Preto sa musí pre každý projekt vybrať model metadát v súlade s jeho cieľmi. Odporúča sa, aby sa nevytváral nový model, pokiaľ požiadavkám projektu vyhovuje existujúci štandardný model metadát. * Mali by sa identifikovať príslušné riadené slovníky. Už existuje niekoľko takýchto slovníkov, resp. súborov autorít, ktoré môžu vo veľkej miere zvýšiť úspešnosť vyhľadávaní. Osobitný význam majú metadátové modely, ktoré sa majú vybrať pre projekt digitalizácie; ide rozhodnutie o tom, ktoré množiny atribútov sa použijú na charakterizáciu diel a dokumentov/objektov, ktoré sa majú digitalizovať, a výsledných obrazov, na opis spracovania, techník a technológie a na riadenie práv. Vyhovujúce štandardy pre metadát Pre metadáta už existujú určité dôležité štandardy. V bibliografickej doméne (a v zvyšujúcej sa miere aj v kultúrnej neknihovníckej doméne) má veľký význam štandard Dublin Core (Dublinské jadro). * Pred vytvorením vlastného modelu je nevyhnutné zoznámiť sa s existujúcimi štandardami a modelmi pre metadáta, a napríklad, ak je to nevyhnutné, rozšíriť Dublin Core * Odporúča sa vyhnúť vytváraniu nového modelu metadát pre kultúrne zbierky * Je pravdepodobné, že pre projekt digitalizácie už existujú relevantné modely metadát, ktoré sú výsledkom práce na podobných projektoch. Medzi projektmi v oblasti kultúry sa modely metadát dobre prenášajú. * Do modelu metadát by sa mali zahrnúť elementy Dublin Core, pokiaľ neexistuje rozumný dôvod neurobiť tak. Aj keď múzeá môžu zistiť, že ich zbierkam lepšie vyhovuje model CIMI, mal by sa sledovať cieľ existencie jadra množiny elementov, ktoré umožní vyhľadávanie vo viacerých zbierkach súčasne. * Ak sa má použiť privátny model metadát, mal by sa vyvinúť spôsob mapovania prvkov tohto modelu do Dublin Core. * Aj keď sú schémy dát alebo národné konvencie pomenúvania niekedy užitočné, je lepší úplný model metadát (napr. MODS, teda presný model záznamu MARC), aj s ohľadom na množstvo údajov o dokumente/predmete a na umožnenie presnejšieho vyhľadávania a spolupráce s inými projektmi a inými krajinami. Existuje veľký počet štandardov, ktoré pokrývajú rôzne aspekty metadát. Medzi jednotlivými štandardmi je však veľké prekrývanie a niektoré modely sú špecifické len pre určité inštitúcie a systémy. Zverejnenie Príprava na zverejnenie zahŕňa spracovanie novo vzniknutého digitálneho obsahu ešte pred samotným zverejnením. Zverejnenie znamená vystavenie digitálneho obsahu na internete alebo v lokálnej sieti a spracovanie znamená typicky redukciu kvality textu, obrazu, zvuku, videozáznamu, kvôli tomu, aby sa digitálne objekty prispôsobili prevádzkovým podmienkam na internete alebo aby bolo možné sprístupniť digitálny obsah v rôznej kvalite. Zpřístupňování digitalizovaných děl Na prístupňovanie digitálneho obsahu slúžia digitálne repozitáre. Uvedieme niektoré z nich. Islandora 8 (https://islandora.ca/islandora8). Islandora 8 (predtým Islandora CLAW) je nová generácia Islandory. Tento významný upgrade Islandora 8 je compatibilný s Drupal 8[5] (to je redakčný systém) a Fedora 5[6] DSpace https://duraspace.org/dspace/ DSpace je softvér určený pre akademické, neziskové a komerčné organizácie, ktoré budujú otvorené digitálne archívy. Inštalácia „po vybalení z krabice“ je jednoduchá a ľahká a úplne prispôsobiteľná potrebám každej organizácie. DSpace zachováva a umožňuje jednoduchý a otvorený prístup ku všetkým typom digitálneho obsahu vrátane textu, obrázkov, pohyblivých obrazov, súborov mpeg a dátových súborov. Vďaka neustále rastúcej komunite vývojárov sa softvér rozširuje a vylepšuje. Invenio (CERN) https://invenio-software.org https://invenio-software.org/showcase/ Open-source digitálny repozit rozšírený najmä vo vedeckej komunite. Greenstone http://www.greenstone.org Greenstone je softvérový balík na vytváranie a distribúciu zbierok digitálnych knižníc. Poskytuje spôsob usporiadania informácií a ich publikovania na webe alebo na vymeniteľných médiách, ako sú DVD a USB flash disky. Greenstone sa používa v digitálnej knižnici Nového Zélandu na Waikato University a v mnohých iných inštitúciách; vyvíja a distribuuje sa v spolupráci s UNESCO. Je to viacjazyčný softvér s otvoreným zdrojovým kódom, ktorý sa poskytuje na základe podmienok Všeobecnej verejnej licencie GNU. ________________________________ [1] The DOI System. http://www.doi.org/ [2] The Fedora Common. http://www.fedora.info/ [3] Online nápověda Zoner Photo Studia X. Formáty souborů – Online nápověda Zoner Photo Studia X [4] Day, Michael. IMPACT Best Practice Guide: Metadata for Text Digitisation & OCR. - UKOLN, University of Bath. Dostupné: http://www.impact-project.eu/uploads/media/IMPACT-metadata-bpg-pilot-1.pdf [5] Drupal je oblíbený redakční systém. Je snadno rozšiřitelný pomocí modulů, a to ho činí flexibilním. Tato rozšiřitelnost z něj dělá velmi dobrý redakční systém, který můžete použít jak pro weblog, tak pro diskusní fórum. Drupal je naprogramovaný v jazyce PHP a využívá databázi MySQL nebo PostgreSQL. https://www.cesky-hosting.cz/webhosting/open-source/drupal/?&gclid=Cj0KCQjw5rbsBRCFARIsAGEYRweetX3x jsoZl4FPh2ei9RORk8qhRHkdLmO_-HRfunpewuzjjPBwWkgaAqKnEALw_wcB [6] Fedora je robustný, modulárny, open source repository system určený na manažment a šírenie digitálneho obsahu.