Štandardné metadáta v digitálnych knižniciach Úvod do implementácie METS, MODS, PREMIS a MIX Rebecca Guenther, Library of Congress (2007) Dušan Katuščák, Slezská univerzita Opava (2018) Prehľad problematiky metadát •Hlavné študijné zdroje: http://www.getty.edu/research/conducting_research/standards/intrometadata/ http://www.loc.gov/standards/marcxml •Deskriptívne metadáta (AACR2, MARC21) •Úvod do metadát METS, MODS, PREMIS, MIX •Používanie METS a MODS na prezentáciu obsahu •METS, MODS a PREMIS a ich integrácia do štandardov digitálnych knižníc Štandardy metadát v digitálnych knižniciach •XML je de-facto štandard pre popis metadát na internete •Interoperabilita a výmena informácií o objektoch si vyžaduje, aby existovali a používali sa štandardy •Digitálne objekty sú komplexné a skladajú sa z viacerých súborov •Na komplexné spracovane digitálnych objektov je potrebných viac foriem metadát •Popisné (Descriptive) •Technické (Technical) •Digitálna proveniencia (Digital provenance/events) •Štrukturálne (Structural) •Prístupové práva (Rights/Terms and conditions) Deskriptívne metadáta: MARCXML •V tradičných formátoch MARC existujú desiatky miliónov kvalitných popisných bibliografických záznamov •Všetky tieto záznamy je možné znovu použiť v digitálnom prostredí (digitálnej knižnici) vo formáte XML •Aby to bolo možné, musí sa použiť konvertor MARCXML •MARCXML používa údaje MARC (nie v štruktúre ISO 2709) ale v syntaxi XML! Deskriptívne metadáta: MARCXML •Zabezpečuje sa tak interoperabilita s inými schémami XML a voľne šírenými nástrojmi XML •Použitie XML umožňuje kolaboratívny prístup ku metadátam (napr. OAI) •Konverzia MARCXML umožňuje ďalej tvoriť kvalitné deskriptívne metadáta a súčasne ich podľa potreby používať v digitálnych knižniciach (na internete) MARC 21 – prechod XML MARCXML •MARCXML záznam –XML je presný ekvivalent záznamu MARC (2709) –Ide o bezstratovú konverziu z jedného formátu do druhého – aj obojsmerne –Schéma XML je flexibilná, nie je potrebné ju komplikovane meniť, ak sa zmení niečo vo formáte MARC 21 –Prezentácia XML je cez štýly XML (XML/XSL stylesheets) –LC poskytuje konvertor ako open source http://www.loc.gov/standards/marcxml/ Cvičenie: urobiť záznam v M21-prekonvertovať pomocou MARCXML do XML, analyzovať zdrojový a cieľový formát (zobraziť zdroj cez prehliadač) Čo je to MODS? •Skratka=Metadata Object Description Schema •Je to XML štandard pre deskriptívne metadáta •MODS je odvodený/derivovaný z formátu MARC •Používa rovnaký popis tagov •Obsahuje rovnaké údaje, polia a podpolia ako MARC •Reorganizuje údaje tak, aby sa odstránili redundancie •MODS neobsahuje žiadne špecifické pravidlá popisu objektov •Súbor elementov, ktorý vznikne v MODS sa aplikuje pri popise digitálnych objektov Použitie MODS •Rozšírenie pre schému METS –Úplný popis korešponduje s hierarchiou objektov METS •Reprezentácia metadát pre účely harvestovania (OAI) –Tagy založené na jazyku sú používateľsky komfortnejšie •Špecifický XML formát pre SRU (prieskum/vyhľadávanie cez URL) •Základný súbor prvkov pre konvergenciu medzi MARCXML popismi a ne-MARCXML popismi •Popis pôvodných zdrojov v syntaxi XML, ktorá je jednoduchšia než úplný popis MARC Prvky MODS najvyššej úrovne •Názov •Meno •Typ zdroja •Žáner •Originál •Jazyk •Fyzický popis •Abstrakt •Obsah •Používatelia •Poznámka •Predmet •Klasifikácia •Súvisiaca jednotka •Identifikátor •Lokácia •Podmienky prístupu •Časť •Rozšírenie •Informácie o zázname Music record in MODS Vývoj MODS •Vyvinuté v 2002 prostredníctvom diskusie potenciálnych implementátorov (koordinovala Library of Congress) •Verzia 1 koncom 2002; teraz verzia 3.2, kompletizuje sa verzia 3.3 •Sprevádza autoritatívne metadáta (MADS) - verzia 1.0 (2005) •Harmonizuje s rozšírenou schémou METS v časti popisných metadát •Registrované v NISO (národná štandardizačná organizácia – USA) •Široké využitie v projektoch digitálnych knižníc •MODS Register implementácií: http://www.loc.gov/mods/registry.php Čo je METS? •METS zaznamenáva hierarchickú štruktúru digitálnych objektov, názvy a lokácie súborov, ktoré obsahujú takéto objekty a súvisiace metadáta •Kontajner smerníkov (pointers) pre metadáta a súbory •Dokument METS môže byť jednotkou formátu na uchovávanie alebo prenos •METS je flexibilná a modulárna schéma, môžu sa do nej pripájať prvky iných schém •METS používa prostriedky XML Schémy na kombináciu slovníkov z rôznych menných priestorov (namespaces) Čo je PREMIS? •Slovník metadát, ktoré podporujú dlhodobé uchovávanie digitálnych objektov –Prvok nevyhnutnej infraštruktúry na implementáciu spoľahlivých a trvalo udržateľných programov uchovávania •Podporný implementačný súbor XML schém v širokom spektre kontextov •Činnosť riadená Kongresovou knižnicou vrátane Implementačnej skupiny a Redakčného výboru Čo sú konzervačné metadáta •Proveniencia: –Kto sa stará o/vlastní digitálny objekt? •Autentickosť: –Spĺňa digitálny objekt to, čo sa od neho očakáva? •Uchovávanie: –Čo je potrebné urobiť na uchovanie digitálneho objektu? •Technické prostredie: –Čo je potrebné na sprístupňovanie a využívanie digitálneho objektu? •Riadenie práv: –Aké intelektuálne práva sa musia brať do úvahy? ØUskutočňujú „samo-dokumentáciu“ digitálnych objektov v čase Obsah Konzervačnémetadáta ďalších 10 rokov ďalších 50 rokov Navždy! Základné princípy a predpoklady … •“Schopnosť implementácie, jadro, konzervačné metadáta”: –“Konzervačné metadáta”: udržiavať životaschopnosť, poskytovanie, zrozumiteľnosť, autentickosť, identita v kontexte uchovávania –“Jadro”: Čo musia repozity vedieť v oblasti dlhodobého uchovávania digitálnych objektov –“Schopnosť implementácie”: dôsledne definované; podporené štandardami/odporúčaniami; dôraz na automatizáciu pracovných postupov (workflows) •Nezávislosť z pohľadu implementácie: –Žiadne hypotézy o špecifickej implementácii –Podpora flexibility/interoperability –Zameranie na sémantické jednotky: čo musíte vedieť (nezávislé od implementácie) vs. metadátové prvky: ako ich zaznamenáte (špecifické pre implementáciu) –Informácie, ktoré je potrebné „znovu získať“ z digitálneho archívneho systému, nezávislé od lokálnej implementácie Pôsobnosť •Čo PREMIS je : –Všeobecný dátový model na organizovanie/navrhovanie konzervačných metadát –Vedenie lokálnych implementácií –Štandard na výmenu informačných súborov medzi repozitmi •Čo PREMIS nie je : –Nekonformné riešenie: potreba tvorby inštancií metadátových prvkov v repozitnom systéme –Všetky potrebné metadáta: výnimkou sú praktické pravidlá, špecificky formátované technické metadáta, deskriptívne metadáta na umožnenie sprístupnenia, doplnkové (non-core) konzervačné metadáta –Riadenie životného cyklu objektov mimo repozitu –Riadenie práv: obmedzené na oprávnenia s ohľadom na činnosti v rámci repozitu Dátový model PREMIS Intelektuálne entity Objekty Práva Agenti Udalosti Sémantické jednotky vzťahujúce sa k objektom: technické metadáta •objectIdentifier •preservationLevel •objectCategory •objectCharacteristics •creatingApplication •originalName •storage •environment •signatureInformation •relationship •linkingEventIdentifier •linkingIntellectual Entity Identifier •linkingPermission StatementIdentifier Sémantické jednotky vzťahujúce sa k udalostiam: proveniencia a konzervačné činnosti •eventIdentifier •eventType •eventDateTime •eventDetail •eventOutcome •eventOutcomeDetail •linkingAgentIdentifier •linkingObjectIdentifier Sémantické jednotky vzťahujúce sa ku právam: podmienky sprístupnenia ·permissionStatement ·permissionStatementIdentifier ·relatedObject ·grantingAgent ·grantingAgreement ·permissionGranted ·act ·restriction ·termOfGrant ·permissionNote Sémantické jednotky vzťahujúce sa k agentom •agentIdentifier •agentName •agentType PREMIS – vedenie a údržba •Prvá revízia Slovníka dát (PREMIS 2.0) –Dokumentácia chýb a navrhovaných revízií Slovníka (spätná väzba s PIG) –http://www.loc.gov/standards/premis/changes.html •PREMIS – Register implementácií –http://www.loc.gov/standards/premis/premis-registry.html •Konzultácie (gestor Library of Congress): –Právne otázky digitálneho uchovávania (Karen Coyle) –PREMIS – návod a odporúčania na implementáciu (Deborah Woodyard-Robinson) •PREMIS konzultanti: –Glasgow, Boston, Stockholm, Albuquerque, Washington Čo je MIX? •Metadáta pre obrazy v XML •XML schéma určená na vyjadrenie technických metadát pre digitálne statické obrazy •Založená na štandarde NISO Z39.87 Slovník dát – Technické Metadáta pre digitálne statické obrazy •Používa sa na vyjadrenie atribútov digitálnych obrazov, napr. formát súboru, veľkosť súboru, rozmery, rozlíšenie, kompresia atď. •Verzia 1.0 (aktuálna) zahŕňa podporu pre GIS obrazy a JPEG 2000 obrazy; mená údajových prvkov harmonizované s PREMIS •Môže sa použiť samostatne alebo ako rozšírená schéma s METS Ako tieto štandardy spolupracujú v digitálnych knižniciach? •Formát METS umožňuje „balíčkovanie“ foriem metadát spolu s objektmi alebo so smerovníkmi (pointers) k objektom •Existuje 5-ročná experimentálna skúsenosť používania METS v kombinácii s inými štandardami na riadenie a používanie digitálnych objektov v digitálnych knižniciach •Uvedené štandardy sú voľne dostupné •METS podrobne popisuje, ako sa používa pre konkrétne typy objektov alebo aplikácií •Potrebná je najlepšia prax (a jej vývoj) na používanie METS a MIX •Použitie METS, MODS, PREMIS a MIX: http://www.loc.gov/premis/louis.xml