Slezská univerzita v Opavě Filozoficko-přírodovědecká fakulta v Opavě Ústav bohemistiky a knihovnictví Pořádání informací a věcné pořádací systémy Aleš Hrazdil Opava 2017 Studijní program N 7201 Informační studia a knihovnictví; obor Knihovnictví se zaměřením na veřejné knihovny komunitního typu Obsah MODULU POŘÁDÁNÍ IMFORMACÍ a VĚCNÉ POŘÁDACÍ SYSTÉMY 1 Úvod DO PoŘÁDÁNÍ INFORMACÍ 9 1.1 Smysl a účel pořádání 9 1.2 Dokumentační a obsahová analýza. 10 1.2.1 Automatická indexace, automatická obsahová analýza. 11 1.3 Základní druhy věcného pořádání informací 12 2 ZÁKLADY Pořádacích systémů V LINGVISTICE.. 14 2.1 Jazyk, podstata a funkce jazyka, druhy jazyků. 14 2.2 Selekční jazyky. 14 2.2.1 Druhy a typy selekčních jazyků (pořádacích systémů) 15 3 ZÁKLADY pořádacích systémů V LOGICE. 18 3.1 Aplikace teorie množin. 18 3.1.1 Množiny. 18 3.1.2 Názvy a pojmy. 19 3.2 Klasifikace věd. 21 3.2.1 Tři etapy vědeckého poznání z hlediska klasifikace. 21 3.2.2 Subjektivní a objektivní klasifikace. 22 3.2.3 Vývoj klasifikací věd. 22 4 ZÁKLADY pořádacích systémů v SÉMIOTICE.. 25 4.1 Sémiotika. 25 4.2 Typologie znaků. 25 4.3 Význam znaku v selekčních jazycích. 25 4.3.1 Asymetrie jazykových znaků. 26 4.3.2 Další nejednoznačnosti slovníku přirozeného jazyka. 27 4.3.3 Vztahy mezi slovními znaky. 27 4.3.4. Paradigmatické vztahy v řízených slovnících. 29 4.3.4 Sémantika pořádacích znaků. 29 5 Systematické pořádání a teorie Knihovnicko-bibliografických klasifikací 32 5.1 Systematické pořádání 32 5. 2 Systematický selekční jazyk (jazyk knihovnicko-bibliografických klasifikací) 33 5.3 Vývoj hierarchických a fasetových klasifikací 35 5.4 Mezinárodní desetinné třídění 36 5.5 Další klasifikace. 40 5. 6 Propojovací selekční jazyky a makroindexace. 43 6 Předmětové pořádací systémy a teorie předmětových poŘádacích systémŮ 45 6.1 Teorie a vývoj předmětových pořádacích systémů. 45 6. 2 Pořádací systémy založené na slovech z názvu dokumentu. 46 6.2.1 Názvy publikací 46 6.2.2 Předmětové pořádací systémy založené na názvech dokumentů. 47 6. 3 Pořádací systém předmětových hesel 47 7 Postkoordinované předmětové pořádací systémy.. 52 7.1 Postkoordinované pořádání 52 7.2 Volná a řízená indexace. 52 7.3 Unitermy. 53 7.4 Deskriptorový selekční jazyk (pořádací systém) 54 8 PoŘádací systémy v bibliografických databázích.. 58 8.1 Databáze a katalogy. 58 8.2 Zápis ve výměnném formátu. 59 Rychlý náhled do problematiky MODULU POŘÁDNÍ INFORMACÍ A VĚCNÉ POŘÁDÁcí SYSTÉMY Rychlý náhled 1. Pořádání informací a informační analýza dokumentů Vás uvede do celého předmětu a vysvětlí, co pořádáme, jak pořádáme a proč pořádáme. Úvodní etapou věcného pořádání je obsahová analýza dokumentu, proto stručně poznáte, jak vypadá její intelektuální proces i snaha o automatizaci analýzy i celé indexace. 2. Základy pořádacích systémů v lingvistice Vám představí selekční jazyky jako systém znaků přirozeného, formalizovaného nebo zcela umělého jazyka, dozvíte se, že jde o specifický informační jazyk, seznámíte se s jeho druhy a typy. 3. Základy pořádacích systémů v logice se budou zabývat především množinami a jejich vztahy, operacemi na množinách (Booleovskými operátory) a jejich rozkladem, názvy a pojmy, klasifikací; neopomineme ani klasifikaci věd, její historické etapy a chronologický přehled myslitelů, kteří se problematikou zabývali. 4. Základy pořádacích systémů v sémiotice Vám představí znaky, ale hlavně se budete pohybovat v říši významu znaků, jazykových asymetrií, vágnosti slov, nevýznamných slov apod. Opomenout nesmíme ani paradigmatické vztahy mezi lexikálními jednotkami. 5. Klasifikace (resp. knihovnicko-bibliografické klasifikace) a umělé selekční jazyky je část, kde se seznámíte s ryze umělými selekčními věcnými jazyky, nahlédneme do jejich vývoje, dozvíte se, které se ve světě nejvíce používají, ale hlavně se seznámíte s Mezinárodním desetinným tříděním, protože to má v našich knihovnách stále velký význam. 6. Předmětové pořádání informací a systémy na bázi přirozeného jazyka jsou počátkem snad nejobsáhlejší kapitoly opory, neboť tyto systémy pořádání jsou nyní v informačních institucích i v bibliografických databázích nejpoužívanější. Samozřejmě nechybí teoretický úvod, pak se dovíte o využití slov z názvu k věcnému pořádání, o pořádacím systému předmětových hesel. 7. Postkoordinované předmětové pořádací systémy jsou pokračováním látky. Tentokráte Vás provedou moderními systémy pořádání. Volnou a řízenou indexací, unitermy a především deskriptory. 8. Automatizace ve věcném pořádání je stručným shrnutím toho, kde všude se s věcnými pořádacími systémy můžete setkat, jak se používají v databázích a konečně jak se zapisují. Úvodem modulu POŘÁDáNÍ INFORMACÍ A VĚCNÉ POŘÁDÁCÍ SYSTÉMY Studijní opora je určena studentům bakalářského oboru knihovnictví. Pro zvládnutí látky není nutné mít průpravu z jiných odborných předmětů, budete navazovat na Vaše středoškolské znalosti na úrovni gymnázia. Studiem opory získáte základní nutné poznatky z teorie oborů, o něž se pořádání informací opírá (resp. na něž teoreticky navazuje), tedy z jazykovědy, logiky a sémantiky. Samozřejmě se přitom po stránce teoretické seznámíte i se pořádacími systémy samotnými. Krátké exkurzy do historie Vám ozřejmí, na co obor dnes navazuje. Takto vyzbrojeni se pak seznámíte s jednotlivými věcnými systémy pořádání informací (věcnými selekčními jazyky, které slouží pro věcné pořádání informací), tedy především knihovnicko-bibliografickými klasifikacemi a slovními (předmětovými) věcnými pořádacími systémy. Poznáte zejména ty, s nimiž se můžete v knihovnické praxi setkat. U těch nejdůležitějších pak vyzkoušíte i některé praktické dovednosti, abyste mohli zkoušet sami věcně katalogizovat (indexovat). Je zřejmé, že opora Vám nenahradí přímý nácvik indexace (věcné katalogizace), resp. věcné zpracování pod dohledem pedagoga, ale pochopíte, kde se pořádací znaky hledají, jak se sestavují selekční údaje a které je vhodné při konkrétním informačním požadavku volit. Pokud byste se chtěli stát indexátory (katalogizátory), musíte si osvojené poznatky prohloubit především prakticky – alespoň pod vedením zkušeného a erudovaného pracovníka. V textu se obvykle nesetkáte s přesnými oficiálními výklady odborných termínů, kterých je zde nepočítaně. Lze předpokládat, že při prvním seznámení s problematikou by byly pro Vás velmi náročné a obsáhlé. Proto se opora snaží výklad nových pojmů Vám co nejvíce přiblížit, ale předpokládá se, že samozřejmě si osvojíte i výklady (definice) z Výkladového terminologického slovníku, který je citován v první kapitole. K některým pojmům a termínům se v tomto materiálu budeme vracet „ve spirále“, je to záměrem, ne každý pojem je možno hned vysvětlit úplně, je proto třeba se k němu vracet znovu a ozřejmit jej podrobněji nebo z jiného úhlu. Cíl modulu POŘÁDANÍ INFORMACÍ A VĚCNÉ POŘÁDÁCÍ SYSTÉMY Po úspěšném a aktivním absolvování tohoto MODULU Budete umět: · Analyzovat obsah dokumentu a vybrat klíčové pojmy, převést je do lexikálních jednotek předmětových pořádacích systémů nebo do klasifikačních znaků mezinárodního desetinného třídění. · Na základě poznatků z logiky, sémiotiky a jazykovědy budete umět pracovat s věcnými pořádacími systémy. Porozumíte principům klasifikace věd, vztahům mezi názvem a pojmem, úskalím homonymie, synonymie a vágnosti a odstraňování asymetrie a podobných jevů v předmětových selekčních jazycích. Budete umět Získáte: • Teoretické znalosti i praktické dovednosti z oblasti věcné katalogizace a věcných pořádacích systémů, resp. celého věcného pořádání informací, pochopíte: • co je předmětem zpracování dokumentů a knihovního fondu, proč pořádáme dokumenty a informace v nich obsažené, co je předmětem katalogizace • co je dokumentační a zejména obsahová analýza dokumentu, jak a proč je třeba tuto analýzu provádět a co se pomocí ní dá získat • co jsou to knihovní katalogy, jak je můžeme třídit, k čemu všemu katalogy slouží • jak je možno proces katalogizace usnadnit a zracionalizovat • co je to věcné pořádání (věcná katalogizace), v čem spočívají principy systematické a předmětové katalogizace a jaký zásadní rozdíl je mezi nimi • co je to Mezinárodní desetinné třídění a s jakými jinými knihovnicko-bibliografickými klasifikacemi se ještě můžete setkat • jaké jsou zásady předmětové katalogizace a k čemu jsou předmětové katalogy • jak se tvoří Předmětová hesla Národní knihovny ČR • co je to řízená indexace, co jsou to řízené slovníky a soubory věcných autorit a jak je užívat • co je to volná indexace a proč není dostatečná pro věcnou katalogizaci • kde všude se věcné pořádací systémy používají a jak se zapisují znaky selekčních jazyků Získáte Budete schopni: • Rozpoznávat jednotlivé pořádací systémy (selekční jazyky) zejména věcné pořádací systémy. Umět efektivně vyhledat relevantní dokumenty a informace podle tématu, jehož se týkají (podle předmětu). Sami katalogizovat jednoduchá témata a další prací i studiem se stát případně odborným pracovníkem v oboru věcné katalogizace (indexátorem). • Naučíte se používat klasifikační znaky Mezinárodního desetinného třídění, vyhledat si je v elektronických tabulkách, poznat tvorbu Předmětových hesel Národní knihovny a používat a chápat řízené slovníky předmětových pořádacích systémů. Budete schopni Čas potřebný ke studiu Studium této opory je rozvrženo na dva semestry. Celkový čas je orientačně možno odhadnout na minimálně 60 učebních hodin. Klíčová slova modulu POŘÁDÁNÍ INFORMACÍ A VĚCNÉ POŘÁDÁcÍ systémy věcné pořádání informací, dokumentační analýza, obsahová analýza, automatická indexace, formalizované jazyky, umělé jazyky, selekční jazyky, množiny, pojmy, klasifikace, homonymie, polysémie, synonymie, paradigmatika, věcná katalogizace, předmětová katalogizace, systematická katalogizace, indexace, předmětové pořádací systémy, systematické pořádací systémy, Mezinárodní desetinné třídění, předmětová hesla, indexace, řízené slovníky, soubory věcných autorit, bibliografické databáze. 1 Úvod DO PoŘÁDÁNÍ INFORMACÍ 1.1 Smysl a účel pořádání Pořádání informací zahrnuje vytváření organizovaných souborů identifikačních a obsahových informací získaných informační analýzou dokumentu podle předem stanoveného systému. Podle typu vstupních informací se vyčleňuje identifikační pořádání informací a věcné pořádání informací.[1] Zjednodušeně je pořádání informací jejich zatřiďování mezi ostatní informace tak, aby se daly kdykoli vyhledat. Vidíte, že proložený výklad termínu je poněkud obsáhlý a složitý. V dalším textu proto opustíme tyto odborné výklady z Výkladového terminologického slovníku. Dále si tyto přesné výklady kdykoli můžete vyhledat sami na základě citace uvedené v odkazované literatuře. Budeme si uvádět jen zjednodušené výklady, kterým snad snáze porozumíte. Při pořádání jde o to, že informace sdělované tvůrcem (původcem) a obsažené v dokumentu zpracujeme tak, aby se zatřídily mezi ostatní informace takovým způsobem, aby je bylo možno kdykoli vyhledat podle různých potřeb a hledisek. Můžeme pořádat přímo dokumenty, nebo tzv. záznamy o nich. Jak jste si mohli všimnout ve výše uvedeném výkladu, rozeznáváme identifikační pořádání, neboli popisnou katalogizaci, kdy si všímáme jmenných neboli popisných (identifikačních, formálních) údajů, kterými rozlišíme jednotlivé dokumenty (autor, název, pořadí vydání, počet stran apod.) a věcné pořádání, kdy formulujeme obsahové údaje o dokumentu, tedy vyjadřujeme věc, o které jedná. Podle způsobu vyjádření obsahu (organizace informací) rozlišujeme systematické pořádání (systematické třídění, klasifikace) a předmětové pořádání (indexace v užším smyslu). Pořádáme vlastně proto, že uživatelé nejsou schopni číst všechny plné texty dokumentů. Jsou jim proto zprostředkovávány pomocí jakéhosi obrazu dokumentu, který jej jednak představuje, jednak odlišuje v množině ostatních dokumentů. Nepořádáme tedy jen dokumenty na policích, ale vytváříme sekundární (druhotné, odvozené) dokumenty podávající velice zhuštěné informace, říkáme, že tvoříme k dokumentům příslušné záznamy. Musíte si uvědomit, že jde o zredukované (velmi zhuštěné) množství zásadních informací původního (primárního) pramene. Tyto katalogizační, resp. bibliografické, dokumentační záznamy obsahují tzv. selekční údaje, podle nichž je lze vyhledávat. Metadata pak jsou strukturovaná data, která nesou informace o primárních datech, informace, jejichž prostřednictvím má uživatel možnost organizované (uspořádané) informace vyhledávat a využívat. Jednak jde o informace, které jsou přímo součástí těchto dokumentů (např. údaje na titulním listu knihy), jednak jsou to údaje, které jsou uloženy mimo vlastní dokument v nějakém systému, ve kterém tento dokument zastupují (např. údaje uložené v záznamu v knihovním katalogu) text Úkol k zamyšlení] Uživatelé (čtenáři) celkem samozřejmě katalogy a dokumenty uspořádané oborově na policích využívají. Myslíte si, že vědí, že knihovníci vynakládají nemalé úsilí na efektivní pořádání informací, nebo katalogy a pořádání považují za samozřejmost a knihovníky pouze za obsluhu ? Odpověď: Laická veřejnost bere většinou katalogy a uspořádané dokumenty jako samozřejmost a o práci katalogizátorů (zázemí služeb čtenářům, resp. půjčovny) vůbec nemá tušení. 1.2 Dokumentační a obsahová analýza Z hlediska informačních pracovníků (knihovníků) můžeme vidět, že mezi tvůrci informací (původci, autory) a okruhem uživatelů informací (čtenářů) se vytváří sféra těchto pracovníků (katalogizátora). Katalogizátor analyzuje dokumenty a vytváří (syntetizuje) soubory záznamů o nich, které jsou pak z různých hledisek pořádány. Analytická etapa jeho práce se nazývá dokumentační analýza. Můžeme ji rozdělit na dvě části. Na analýzu identifikační (formální), kdy se pracovník soustředí na popisné (identifikační) údaje jako je (jak už jsme si říkali) název díla, označení vydání, místo vydání atd. (tedy údaje, které pomáhají dílo bezpečně určit, identifikovat, rozpoznat od ostatních). Tato analýza slouží jako základ popisného (identifikačního, jmenného) záznamu. O něm se více dozvíte v jiném modulu. Další částí je analýza obsahová (věcná), kdy se snaží indexátor (katalogizátor) vytěžit obsahové údaje o díle, informace v něm obsažené, zjistit, o čem jedná. Kromě vlastní tématiky (věci), si musí všímat i časového vymezení tématiky a jejího prostorového (geografického) omezení i některých dalších, formálních hledisek. Především formy díla a čtenářského určení, doby vydání. Tedy např. že jde o jazykovou učebnici na CD-ROM, nebo středověký rukopis, či pohádky pro děti. Musíte si uvědomit, že tato analýza je složitým myšlenkovým procesem, jen málokdy se omezuje na pouhé převzetí klíčových slov z názvu nebo textu dokumentu (takzvaná odvozená, neboli slovní indexace). Skutečná obsahová analýza spočívá v tom, že indexátor ve své mysli vytváří klíčové pojmy vystihující nejpodstatnější informace dokumentu. Ty pak ale většinou k pořádání nepoužívá přímo (v tzv. přirozeném jazyce, kterým o dokumentu přemýšlí, nebo kterým píše autor). Musí je upravit, přeložit do tzv. selekčního jazyka neboli znaků poř. systémů, do tvaru, v němž je bude možno účelně pořádat a jednoznačně vyhledat. Obsahová analýza se používá také při sestavování redukovaných textů připojovaných k záznamům – anotací a referátů. Ty nás ale v tomto modulu zajímat nebudou. Pro správný postup analýzy existuje ČSN 010174=ISO 5963 Metody analýzy dokumentu[2]. V normě se např. vyjmenovávají neopomenutelné položky klasického (tedy tištěného) dokumentu, které musí indexátor prohlédnout. Jsou to: - název - referát, anotace na obálce - obsah - úvod, úvodní věty, závěr - ilustrace, tabulky, grafy - zvýrazněná slova, podtržená, jiný druh písma Nesnadnější jsou dokumenty netradiční, netištěné (filmy, videozáznamy, optické disky), tam někdy nemáme technické zařízení ani časovou možnost prohlédnout celý dokument, musíme se spolehnout na název, anotaci či výtah na obálce a jiné doprovodné texty. Norma dále klade velký důraz na kvalitu analýzy a následné indexace. Chcete-li dobře věcně katalogizovat, musíte si normu prostudovat celou. 1.2.1 Automatická indexace, automatická obsahová analýza Již od minulého století se konají pokusy intelektuální proces zautomatizovat, nahradit člověka strojem. V některých případech a pro některé účely se to daří. Zřejmě se časem podaří selekční jazyky zcela nahradit přímým automatizovaným vyhledáváním, jak bude ještě zmíněno. Principálně jde o dva postupy – automatickou extrakci, kdy počítač vybírá z textu dokumentu přímo indexační (selekční) termíny, tedy klíčová slova, proto se někdy této metodě také říká slovní indexace. A automatické přiřazování, což je již složitější proces, kdy se termíny z textu nepoužívají přímo, ale porovnávají se s tzv. řízeným slovníkem, nebo znalostní databází a používají se pak až teprve termíny z tohoto slovníku. Pracuje se tedy s pojmy, pro které se hledají povolené (preferované) termíny, proto se této metodě také říká pojmová indexace. Většina systémů pracuje na jednodušším principu automatické extrakce. K výběru významných (klíčových) slov z dokumentu lze použít více metod, např. můžeme rozlišovat: · sémantickou analýzu - v paměti počítače je slovník významných slov, kterých si má v textu všímat - počítač zpracovávaný text porovnává se slovníkem a pokud nalezne slovo ze slovníku, tak ho označí - původní text je redukován na soubor významných slov a sousloví · statistickou analýzu textu (frekvenční) - vychází z úvahy, že nejčastěji opakovaná slova v textu jsou nejvýznamnější - nejběžnější metoda – znakem významnosti slova je jeho četnost · metodu statistické zákonitosti výskytu slov v textu - vychází z úvahy, že příliš frekventovaná slova jsou zbytečná - nejdůležitější slova leží mezi nejvyšší a nejnižší četností = relativní frekvence - podle koeficientu relativní frekvence se vybírají významná slova · současný výskyt dvou nebo více slov v textu - vychází z úvahy, že sousloví jsou sémanticky významná - hledají se věty s určitým slovním spojením, které se pak vybere (statistické a syntaktické metody) · syntaktická analýza - hledá důležité větné členy - metoda se dá uplatnit spíše na krátké texty a referáty - vychází ze vztahu mezi syntaxí slov a informací Automatická extrakce z plných textů je dnes nejobvyklejší a nejkomplexnější z metod extrakce - do paměti počítače se ukládá každé významové slovo jedno po druhém, nebo jde o digitalizovaný text. Slova se musí identifikovat lexikální analýzou (tokenizací) , kdy jsou rozpoznána jednotlivá slova a sousloví, hranice slov se nejčastěji identifikují pomocí mezer; zavádí se tzv. negativní slovník (stopslovník) – počítač vyřazuje nevýznamová či nevýznamná slova; pro zmenšení rozsahu slovníku se používá tzv. lemmatizace (stemming) - všechna ohýbaná slova se převádějí na základní tvar (1. pád), nebo se používá derivace – z každého slova se hledají všechny tvary; vážení je proces stanovení důležitosti slov podle jejich pozic, nebo frekvence. Všimněte si analogie metod s principy práce internetových vyhledávačů. Automatické přiřazování se snaží simulovat intelektuální indexaci (proces práce člověka), tedy obsahová analýza dokumentu, identifikace vhodných (selekčních) termínů, přiřazení k pojmům a výběru správných (preferovaných) termínů z řízeného slovníku. Pracuje se buď s výsledky automatické extrakce, nebo s plným textem metodami hledání významných slov. Užívají se různé modely z oblasti matematické statistiky apod. Existence řízeného slovníku, s nímž může pracovat počítač, je podmínkou. (tezaurus, ontologie, sémantické sítě, znalostní báze). Principy plnotextových metod a automatické indexace vůbec vyúsťují nyní ve snahu obejít se bez věcných selekčních jazyků v podstatě úplně a uplatnit tzv. dotazování v přirozeném jazyce, ptát se celou větou. V ČR byly prováděny výzkumy na systému M-CAST – interaktivním dialogovém vyhledávacím systému. [Úkol k zamyšlení] Je automatická indexace v univerzálních knihovnách nebo v knihovnách municipálního typu již samozřejmostí ? Odpověď: Automatická indexace je užívána je v odborných menších knihovnách, experimentálně ve velkých univerzálních knihovnách odbornými týmy, protože stále jde ještě o složitý proces. 1.3 Základní druhy věcného pořádání informací Existují dva základní typy věcného pořádání informací, dva typy pořádacích systémů, ale i typy smíšené. Při systematickém pořádání informací (též klasifikace, systematické třídění) se katalogizátor (indexátor) snaží slovní vyjádření tématu dokumentu (zatím jen v jeho mysli) vřadit do předem určeného více či méně hierarchického sytému, který odráží celé (univerzum), nebo část lidského poznání a praxe. Pořadí v takovém systému ovšem nemůže být abecední, proto se pojmy musí vyjádřit notací (symbol vyjádřený umělou soustavou znaků pro dané schéma). Hierarchický znamená určující pořadí od jednoduchého ke složitému, od nadřazeného k podřazenému, od obecného ke speciálnímu. Můžete si ji představit např. na systému feudální šlechty, nejvýše je jeden král, pak nejvyšší šlechta a postupujeme dolů až k jednotlivým rytířům a zemanům. Nám jde (jak jsme si řekli) ale o systém lidského poznání a praxe odvozený od klasifikování vědních oborů. Při předmětovém pořádání informací vystačíme se slovním vyjádřením předmětu (pojmů). Řazení je abecední, bez ohledu na to, co které slovo znamená. Musíme pouze všechny pojmy vyjádřit ve stejném přirozeném (národním) jazyce. Předmětové pořádání nazýváme též indexace, heslování; indexací obecně rozumíme též jakékoli vyjádření obsahu dokumentu pomocí sel. jazyka, tedy i systematickými SJ (v klasifikacích). • Systematické pořádání se lépe uplatní tam, kde potřebujeme vyhledat problematiku určitého oboru a předem ani nemusíme vědět přesně, co vše chceme zkoumat. Uživatel se ale musí seznámit s notací. Vše z jednoho oboru je pohromadě, napřed obecně, pak stále konkrétněji až k jednotlivostem. • Předmětové pořádání je výhodnější tehdy, když hledáme přesně pojmenovaný problém, který můžeme zkoumat z různých hledisek. Uživatel ale musí počítat s tím, že nepozná souvislosti s jinými pojmy v oboru a příbuznými obory. Termíny jsou z hlediska obsahu „rozházeny“ po abecedě. [Úkol k zamyšlení] Budete-li hledat téma rodinné domy, je lepší použít klasifikační znaky systematického pořádání pro architekturu obytných budov, nebo vyhledáte téma raději přímo pod heslem „rodinné domy“? Budete-li hledat publikace, v nichž se pojednává o širší tématice, tedy o rodinných domech, chatách, chalupách, vilách, nebudete mít tedy úplně přesnou představu, hesla tedy mohou být různá. Pak budete zkoušet různá hesla, nebo vše vyhledáte najednou pod znakem systematického pořádání pro architekturu obytných budov? Odpověď: Budeme-li hledat přesně jen rodinné domy, je výhodnější hledat přímo abecedně pod heslem „rodinné domy“. Budeme-li hledat širší tématiku, kterou nelze vystihnout jediným termínem, zvolíme znak systematického pořádaní, který znamená architekturu obytných budov (v MDT 728). 2 ZÁKLADY Pořádacích systémů V LINGVISTICE 2.1 Jazyk, podstata a funkce jazyka, druhy jazyků Jazyk je znakový systém, kód, sloužící k myšlení, poznávání a sdělování poznatků, pocitů, prožitků, řeč je na rozdíl od jazyka činnost komunikování, při níž funguje zvukový jazyk. Vlastní, přirozený jazyk (PJ), čili jazyk v užším smyslu slova, je zvukový jazyk slov, sloužící k dorozumívání mezi lidmi, z tohoto přirozeného jazyka jsou všechny ostatní jazyky odvozeny, vycházejí z něj a jsou do něj zpět překládány. Lidské myšlení se děje vždy v přirozeném jazyce, nelze je od něj odtrhnout, umělými jazyky lze komunikovat nikoliv myslet. Pomocnou roli při řeči má neverbální komunikace (mimika, gestikulace). Vysloveně umělé deduktivní jazyky jsou kódy a systémy matematických a logických znaků. Vysoce odborné publikace používají jazyka formalizovaného s pevnou terminologií, případně i s neverbálními symboly. Umělý jazyk (UJ) v širokém slova smyslu je jakýkoliv jazyk vytvořený lidmi na základě PJ pro jakékoli v speciální cíle. Umělé jazyky užíváme všude tam, kde nám PJ nevyhovuje. Takové jazyky mají víceméně umělou gramatiku i umělou slovní zásobu. Kvazipřirozené jazyky (mezinárodní jazyky) jsou UJ vytvořené proto, aby nahradily PJ, např. esperanto, těmi se zabývat nebudeme.. Postup, kdy nějaký jazyk měníme a zpřesňujeme pro nějaké účely, se nazývá formalizace jazyka, zároveň je to první stupeň přetváření PJ na UJ. Nejnižším stupněm formalizace je zpřesňování jazyka na tzv. přesný jazyk. K přesným jazykům počítáme i jazyk vědy. Zpřesňování jazyka se nazývá explikace, nahrazení nepřesného pojmu přesným. Formalizovaný jazyk ve smyslu přesného jazyka je jazyk oproštěný od všech prvků citových a volních, od všeho co umožňuje individuální přístup k termínům. Každé slovo má přiřazen pouze jediný přesný význam a opačně, každý pojem je označen jediným termínem. Také gramatika je někdy formalizována, aby vztah a stavba slov a jejich skládání ve větné celky připouštěla jen jednoznačný výklad. Slovní zásoba je jen částí slovníku přirozeného jazyka, z něhož vychází. Byla provedena tzv. terminologická kontrola a vzniká tzv. řízený slovník. Další formalizací přicházíme k zcela UJ. UJ v užším slova smyslu (s vyšším stupněm formalizace) má vlastní víceméně nezávislou slovní zásobu a gramatiku odlišnou od prostředků PJ, není to tedy upravený PJ, neboli národní jazyk, ale svébytný systém. Pro jeho chápání je nutný překlad do PJ. 2.2 Selekční jazyky V současné době má termín selekční jazyky jen malé využití, pod vlivem anglické (mezinárodní) terminologie užíváme spíš název systémy pořádání informací, nebo pořádací systémy (PS). V této kapitole ale zkoumáme předmět skutečně z pozice jazyka. Je nutné mít dispozici jazyk, který slouží k zakódování ukládaných informací a umožní jejich opětovné vyhledání (selekci) uživatelem. K tomu slouží takzvaný selekční jazyk. Ten má dvě základní funkce – identifikaci (umožnění vyhledání podle identifikačních údajů a šířeji abecední vyhledávání a klasifikaci (seskupování podobných informací). Mezi umělé jazyky patří i informační jazyky. Informační jazyky jsou jazyky používané ke zpracování informací. Podle funkcí, k nimž jsou určeny, rozeznáváme 3 druhy: * algoritmické informační jazyky = programovací jazyky určené k zápisu příkazů člověka stroji * logické informační jazyky - formalizují pojmy různých oblastí poznání pomocí aparátu matematické logiky * selekční jazyky - určeny k pořádání, ukládání a vyhledávání informací Selekční jazyk je tedy, nejjednodušeji řečeno, umělý informační jazyk, používaný k vyjádření identifikačních nebo obsahových selekčních údajů za účelem pořádání, ukládání a vyhledávání dokumentů nebo informací v nich uložených 2.2.1 Druhy a typy selekčních jazyků (pořádacích systémů) Základní druhy SJ jsou: * Identifikační SJ - pro identifikační pořádání (popisné pořádání, jmenné pořádání, bibliografický popis), zapisujeme v něm identifikační (popisné) údaje o dokumentu * SJ signatur - speciální jazyk určený pro ukládání a vyhledávání dokumentů v knihovním fondu. Signatura je dohodnutý znak v UJ (lokační značka), který stanoví místo určité knihovní jednotky ve fondu, umožňuje její vyhledání a řazení. Má lokační, identifikační a obsahovou funkci, každá informační instituce si vytváří vlastní slovník pro přidělování signatur, podle toho, jak staví fond. * Věcné SJ - užívané pro věcné pořádání. Rozeznáváme 2-3 základní druhy: * systematický SJ - při systematickém pořádání (např.MDT), záznamy nebo dokumenty jsou řazeny na příslušné místo systematicky uspořádaného souboru lidského poznání nebo jeho části, * předmětový SJ- při předmětovém pořádání, pořádá se abecedně, podle slovních lexikálních jednotek, jako jsou hesla, klíčová slova apod. * integrovaný SJ (resp. jazyk integrovaných pořádacích systémů) – spojuje určitým způsobem principy obou předchozích Základní typy SJ jsou: Podle stupně transformace jazyka: * přirozené SJ -zachovány výrazy přirozeného jazyka (především SJ založené na názvu) * na bázi PJ – normalizované, kdy klíčové výrazy získané obsahovou analýzou jsou zapisovány podle určitých normativních pokynů (norem, pravidel, standardů) a formalizované, které dosahují terminologické jednoznačnosti pomocí řízeného slovníku. Ztrácejí se tradiční syntaktické vazby mezi slovy. V řízeném slovníku je odstraněna synonymie a homonymie, mohou být objektivizovány skryté významové vazby mezi slovy, příbuznost, hierarchie- např. malířství, viz též výtvarné umění (úhrnem tzv. paradigmatika) * umělé SJ - mají na PJ nezávislou syntaxi, tvarosloví i lexiku, obvykle jsou mezinárodně srozumitelné, nezávislé na PJ, zapisují se nějakou notací, tzn. pomocí symbolů převzatých z abecedy, číslic, matematických znamének apod.; patří mezi systematické SJ * Jazyky integrovaných PS - mají některé vlastnosti umělých i přirozených jazyků, používají jak slova, tak notaci Podle koordinace/syntaxe: * prekoordinované SJ – starší, užívaly se již v lístkových katalozích, neskládají se pouze ze slov, resp. sousloví, nebo z předem sestavených klasifikačních znaků, ale mají i svou vlastní syntaxi, skládají se z řetězců slov sestavených indexátorem. Slova (znaky) jsou v „umělých větách“ uspořádána již při pořádání informací ještě před uložením tématu do informační paměti (katalogu, elektronického katalogu, báze). Dá se dobře vystihnout složené téma dokumentu, ale špatně se vyhledává v rejstřících, protože dotaz lze snadno zformulovat v jiném pořadí slov = otázka vstupu do řetězce. Řetězce se budují podle přesně stanovených pravidel Příklad:. děti na Aljašce onemocněly záškrtem a sérum jim bylo dovezeno psím spřežením (starší typy hesel s delšími řetězci): záškrt – sérum – doprava – Aljaška - r. 1925 - vyprávění spřežení psí – výpravy – Aljaška - r. 1925 - vyprávění * postkoordinované SJ - návaznost na předchozí příklad o dětské infekční nemoci v nedostupné končině. Slova nebo slovní spojení vystihující téma (předmět) dokumentu se nespojují žádnou syntaxí, ale ukládají se k záznamům samostatně. Při vyhledávání pak obvykle počítač hledá libovolné zadané kombinace termínů (lexikálních jednotek) přidělených dokumentu. Příklad: vložíme: : záškrt; očkovací séra; dětské infekční nemoci; nemocné děti; mateřské školy; Aljaška; záchranné výpravy; psí spřežení; výpravy atd. Po zadání několika těchto lexikálních jednotek počítač hledá jejich společnou kombinaci, záznamy, kde se vyskytují současně, koordinuje je. Jde o nové, netradiční jazyky. Užívají se tedy vzájemně izolovaná slova nebo znaky, příp. nejnutnější sousloví; témata se skládají teprve při selekci na podkladě dotazu uživatele. Do informační paměti slova vstupují jednotlivě, dotaz může být ale různě formulován, složené téma může dostat jiný význam, může dojít k porušení spojů a rolí. Pro role např. pokousání člověka psem; pokousání psa člověkem. Pro spoje např. rušení větrných elektráren, výstavba atomových elektráren, rušení atomových elektráren, výstavba větrných elektráren. Další druhy: * tradiční - v tradičních, především lístkových katalozích nebo kartotékách – známé v minulém století, tyto se mohou používat i v mechanizované a automatizované a mechanizované selekci. * nové -od 50. let 20. stol. se používají nové SJ, které nemohou v tradičních pamětech fungovat * univerzální - určeny pro pořádání a selekci informací z celého spektra lidského poznání a praxe * speciální - určeny pro pořádání a selekci informací z určitého vymezeného úseku poznání nebo praxe * SJ pro určité druhy dokumentů, např. SJ určené pro třídění norem nebo patentů * dokumentografické – pro pořádání dokumentografických informací * faktografické – pro pořádání faktografických informací [Úkol k zamyšlení] Mezinárodní desetinné třídění používá k zápisu znaků výhradně číslice. O jaký jazyk podle stupně transformace jazyka jde? Odpověď: Protože nejde vůbec o slova, ale o zcela umělé znaky, které musíme do slov překládat, jde o zcela umělý jazyk. 3 ZÁKLADY pořádacích systémů V LOGICE 3.1 Aplikace teorie množin 3.1.1 Množiny Nejdůležitější oblastí z hlediska teorie pořádání informací je teorie množin, teorie logických tříd a pojem klasifikace. Množina je hmotné nebo myšlenkové shromáždění předmětů neboli prvků, které mají zřetelný společný rys, který může rozhodnout, zda prvek k množině patří nebo nepatří; prvky jsou ekvivalentní, tzn. mají stejnou mohutnost. Z hlediska logiky zavádíme pojem logické individuum - předmět myšlení, který je v určité dané souvislosti rozlišitelný od jiných předmětů a není dále rozkládán. Množina neboli logická třída je soubor logických individuí, která mají v dané souvislosti společnou vlastnost nebo skupinu společných vlastností; základním vztahem je vztah členství v množině. Prvek množiny je logické individuum, které je členem dané množiny. Množinu lze určit a definovat jen tehdy, pokud lze rozhodnout, která logická individua do ní patří. Množiny se určují dvěma způsoby: * uvede se charakteristická vlastnost, kterou mají všechny prvky množiny, tj. tzv. obsahová definice množiny (intenzionální) * provede se výčet jejích prvků, tzv. rozsahová definice množiny (extenzionální) Hierarchie množin - rozeznáváme: množiny I. řádu, jejich prvky jsou logická individua, množiny II. řádu, jejich prvky jsou množiny I. řádu, množiny III. řádu … a množiny n-tého řádu, jejich prvky jsou množiny n-1-tého řádu. Pokud jde o PS, je nejvyšší množinou universum lidského poznání a praxe. Základní druhy množin: neprázdné množiny - obsahují aspoň 1 prvek, jednotkové množiny - obsahují právě 1 prvek, např. národní knihovny státu, Miss world, prázdné množiny - neobsahují žádný prvek, např. množina čtyřnohých ptáků, univerzální množiny - zahrnují všechny prvky dané oblasti, nekonečné množiny - nekonečný počet prvků, konečné množiny - počet prvků vyjádřený konečným číslem Vztahy mezi množinami - inkluze množin -množina je podmnožinou jiné množiny jen tehdy, když všechny její prvky jsou prvky dané množiny, noninkluze množin - množina není podmnožinou jiné množiny, když existuje alespoň 1 prvek, který není prvkem dané množiny, ekvivalence množin - množina je ekvivalentní s danou množinou jen tehdy, obsahuje-li stejné prvky, disjunkce množin - množina je disjunktní s jinou množinou, když neexistuje žádný prvek, který by byl oběma společný, např. množina samečků a samiček Operace na množinách (Booleova algebra) a U b = c „or“ (logický součet, sjednocení množin) – výsledné prvky patří alespoň jedné z obou množin, tedy jedné, druhé, oběma (rozšiřujeme formulaci dotazu), např. lékaři, nebo homeopati a ∩ b = c „and“ (logický součin, průnik množin) – výsledné prvky patří pouze současně oběma množinám (menší rozsah, zužujeme formulaci dotazu) než obě množiny, např. lékaři, kteří jsou současně homeopati a ⌐b = c „not“ (rozdíl množin, negace) – výsledné prvky patří do jedné z množin a současně nepatří do druhé (zužujeme formulaci), např. lékaři, kteří odmítají homeopatii. C D Z inkluze CÌ D ekvivalence C = D disjunkce C=/ D součet C U D součin C ∩ D rozdíl C ⌐ D Klasifikace vychází ze vztahu inkluze, disjunkce a hierarchie množin. Klasifikování (rozklad) znamená dívat se na předměty z hlediska ekvivalence, rovnocennosti. Věci si podobné, ekvivalentní tvoří třídu. Při klasifikaci se dá sledovat, na kolik podmnožin se dá množina rozložit, podle toho lze rozdělit všechny klasifikace i klasifikace PS na: * homogenní - rozkládá každou množinu na stejný počet podmnožin, platí přitom konstantní pravidla pro inkluzi množin, každou podmnožinu, která vznikla rozkladem, lze chápat jako další samostatnou množinu, pak je možno i tuto rozložit na stejný počet podmnožin jako první množinu, tak je možno pokračovat do nekonečna rozkládá-li se množina pravidelně na: 2 podmnožiny, pak jde o dichotomickou klasifikaci; 3 podmnožiny, pak jde o trichotomickou klasifikaci atd. * heterogenní - rozkládá každou z daných množin na nestejný, předem neurčený a nestanovený počet podmnožin, některá množina je dichotomická, následuje třeba trichotomická nebo tetratomická atp. Historické i současné systematické pořádací systémy mají charakter víceméně heterogenních klasifikací, při klasifikaci lidského poznání je možno jen těžko určit předem, na kolik podmnožin mají být rozdělené jednotlivé úrovně, aplikace homogenních rozkladů, která je v plánu mnohých knihovnicko-bibliografických klasifikací, je vlastně znásilňováním klasifikovaného materiálu, tj. předmětů a jevů světa a jeho odrazu v lidském vědomí, jak je fixován v dokumentech. Opakem klasifikace, tedy dělení celku na části (analýza) je kategorie, tedy zařazování částí do vyššího celku (syntéza), nověji se setkáte i s termínem cluster (klastr), tj. shluk, svazek. 3.1.2 Názvy a pojmy Zásady teorie množin a klasifikace množin lze použít také na jména, neboli názvy tříd, tedy na slova, jimiž jsou označovány pojmy. Každé slovo je vlastně jméno neboli název nějaké třídy předmětu, každé slovo označuje nějaký pojem; pojmy a jejich názvy mohou být také definovány extenzionálně nebo intenzionálně a lze je rozkládat. Stejně jako u množin je rozsah jmen a názvů určen extenzionálně (rozsahově) vypočítáváním názvů všech předmětů a jevů, které jsou v názvu zahrnuty. Intenzionálně (obsahově) je název určen tak, že udáme podstatnou nebo charakteristickou vlastnost, která je společná všem názvům pojmenovávajícím předměty a jevy v názvu zahrnuté. Pro tyto jevy používáme termíny: · denotáty jmen a názvů, jsou analogické prvkům množin, denotát je každý prvek množiny denotace, označený předmět nebo jev · denotace je množina předmětů, které jsou termínem označeny, je to souhrn předmětů nebo jevů, označených pojmenováním Druhy názvů: prázdné názvy - nemají denotát, např. permoník; neprázdné názvy, mají alespoň jeden denotát, např. pilný student; jedinečné názvy - mají jediný denotát, např. Ostrava, Václav Klaus (jde o vlastní jména); obecné názvy - mají více denotátů, např. kniha. Názvy, které mají různý obsah/intenzi, mohou mít stejný rozsah/extenzi, např. rovnostranný X rovnoúhlý trojúhelník, Jitřenka X Večernice X Venuše Vztah název – pojem. Každý pojem je v PJ vyjádřen nějakým jazykovým výrazem (názvem), pojem je významem názvu! Význam názvu je dán jeho obsahem. Pojem je tedy intenzionální určení názvu. Analogicky jako u množin se u názvů provádí rozklad, klasifikace. Mluvíme o názvech a pojmech nadřazených, podřazených, souřadných. V tomto vztahu se uplatňuje vztah rododruhový a druhorodový. Podmínky pro vztah rod a druh: názvy jsou druhy rodových názvů tehdy, pokud: 1. druhy jsou neprázdné názvy, označují alespoň jeden denotát (vosy, včely, mravenci, sršni) 2. sjednocení všech druhů dává rod (blanokřídlí) 3. druhy jsou disjunktní, tzn. nemají společný denotát (patří např. současně do včel i vos) Souřadné názvy jsou takové názvy, které tvoří druhy příslušného rodového názvu, stojí na stejné úrovni hierarchické pyramidy pojmů. Z hlediska logiky vytvářejí množiny, které se rozkládají na podmnožiny vytvářené souřadnými pojmy. Tak vznikají hierarchické úrovně pyramidy pojmů. Jde o to, že každý souřadný pojem je dále rozkládán, klasifikován, takže vznikají další úrovně hierarchické pyramidy. Nakonec dojdeme na základnu pyramidy (nejnižší hierarchickou úroveň). Zde jsou umístěny jedinečné pojmy. Jedinečné pojmy mají nejužší rozsah (extenzi,) ale bohatou intenzi (obsah) – dají se přesně popsat. Na vrcholu jsou nejobecnější pojmy s širokým rozsahem(extenzí) a chudým obsahem (intenzi) Takové nejobecnější pojmy se nazývají kategorie (třídy). Hierarchie pojmů [Úkol k zamyšlení] Jak byste rozsahově (extenzionálně) definovali název planety ? Odpověď: Planety jsou Merkur, Venuše, Země, Mars, Jupiter atd. 3.2 Klasifikace věd Systematické pořádací systémy jsou závislé vždy na nějaké klasifikaci věd, nebo z ní přebírají pojmový aparát. Systematické PS (knihovnicko-bibliografické klasifikace) ale nejsou totožné s klasifikací věd, protože slouží k jiným účelům. Klasifikací věd se určují vědní obory, systematické pořádání (SJ) třídí dokumenty a informace v nich obsažené → třídí témata dokumentů na základě nadřazenosti, podřazenosti a spolupodřazenosti pojmů. Slovo klasifikace vzniklo z latinského CLASSIS – třída a FACERE – činit – je to uplatnění logické operace dělení rozsahu pojmů. Při klasifikování protřiďujeme věci a jevy do skupin na základě jejich vzájemné podobnosti (příbuznosti). Při klasifikačním rozkladu se na předměty díváme z hlediska ekvivalence (rovnocennosti), pro každý předmět nebo jev hledáme jeho třídu, věci si podobné (ekvivalentní) tvoří skupinu (třídu), klasifikaci pokládali od antiky za základní nástroj vědy, již Platon pokládá za dokonalé poznání věcí zařazení do správných tříd, jeho teorie forem byla klasifikačním schématem; Aristoteles teorii forem překonal metodou dělení na rody a druhy. 3.2.1 Tři etapy vědeckého poznání z hlediska klasifikace Ve starověku věda klasifikována nebyla, vše co se týkalo vědy, bylo zahrnováno pod filozofii, teprve ve středověku se oddělovaly jednotlivé vědy a tzv. přirozené klasifikace se vyskytovaly až v novověku. * 1. stupeň rozvoje poznání - existuje jediná nediferencovaná věda – filozofie. Svět je poznáván celkově, jednotlivosti nevystupují do popředí, příroda chápána jako celek, proto se v období řecké filozofie nerozvíjely samostatné přírodní vědy, přírodověda v rámci filozofie se nazývala fyzika a byla tedy součástí filozofie přírody. V helenistickém (alexandrijském) období se začínají oddělovat exaktní vědy (geometrie, matematika, astronomie a mechanika → později chemie ovšem pod názvem alchymie). * 2. stupeň poznání - vyčleňování věd z filozofie → diferenciace věd→ analytický stupeň. V prvních stoletích našeho letopočtu se začínají oddělovat vědy a s nástupem křesťanství diferenciace věd zastavuje (ranný středověk). V ranném středověku se stávají centrem vzdělanosti kláštery. V klášterech se pěstuje teologie, která se podrobně diferencuje, ostatním vědám se říkalo vědy světské → sloužily k polemice nebo k přípravě pro další studium. Naplno se diferenciace věd rozbíhá v renesanci. Vzkvétají především přírodní vědy. Tomuto období se říká také metafyzické období (jde o nedialektické poznání, nehledají se souvislosti mezi vědami a jevy). Současně jde o tzv. analytické období → zkoumané předměty se rozkládají na různé části a stránky celku. Výsledkem analytického (metafyzického) období je hluboká diferenciace věd. Tj. rozvoj mechaniky pozemských i nebeských těles, rozvoj matematiky, osamostatnění fyziky, chemie, geologie, fyziologie. Tehdejší vědy byly poznamenány neschopností pochopit souvislosti a vztahy mezi předměty a jevy, příroda je rozdělena na jednotlivé oblasti vzájemně oddělené. Klasifikace věd pomáhá diferencovat (roztřiďovat) poznatky, analýza pomohla určit předmět jednotlivých věd, pomáhalo to klasifikaci a splňovalo to požadavky formální logiky, vědy se od sebe odtrhávaly i když mezi nimi existovaly vztahy a přechody, nakonec metafyzický přístup zpomaloval proces poznávání přírody a stával se jeho brzdou, v 19. století se zjistilo, že je stav je neudržitelný (v bibliografických klasifikacích stav trvá až do konce 19. století). * 3. stupeň rozvoje poznání - trvá do současnosti - Ukončena etapa poznání vědy jako celku i etapa rozpadu na jednotlivé disciplíny. Je třeba provést syntézu tak, aby byly vidět vnitřní organické souvislosti a přitom být respektovány jednotlivosti. Silná tendence k syntéze věd. - tzv. analyticko-syntetické období. Další pokrok je možný jen jako vnitřní jednota obou protikladů (diferenciace vědeckých poznatků a zároveň jejich integrace). Tímto způsobem vznikají stále nové a nové vědní disciplíny, které se navzájem obohacují a tak vyvíjejí. Takovým vědám se říká mezioborové disciplíny, nebo interdisciplinární obory → na rozhraní 2 nebo více oborů (např. neuroetika, psychologie sportu). Vznikají také multidisciplinární vědy → spolupráce více oborů, které se ale neslučují, zkoumá se z více hledisek (např. enviromentalistika) a transdisciplinární obory → vědy se někde překrývají, smazávají se hranice (např. kybernetika nebo informační věda). Takové vzájemné ovlivňování a prolínání věd, vznik nových oborů klade na indexátory značné nároky. Musejí rozpoznat novou nauku a její název. 3.2.2 Subjektivní a objektivní klasifikace Subjektivní klasifikace - dělení podle subjektivního principu. Charakterizováno pravidelným rozkladem, zachováním principů formální logiky, neodrážejí vývoj a souvislosti věd, přírody a vývoj světa, vycházejí většinou z člověka, z jeho poznávacích schopností nebo z jiných formálních hledisek. Objektivní klasifikace - ztotožňují se s principy dialektiky a evoluce, odrážejí objektivně poznaný svět, nevycházejí z člověka a jeho poznávacích schopností, vyšší se vyvíjí z nižšího, složité z jednoduchého. Oba typy klasifikace jsou protikladné 3.2.3 Vývoj klasifikací věd Pythagorejci – první, kteří se pokusili klasifikovat vědy, žili v 6. století před Kristem, uznávali sesterské vědy (geometrii, astronomii, aritmetiku a hudbu), což ve středověku tvořilo základ kvadrivia. Platón - žil v 5.- 6. stol před Kristem, podle něj poznává člověk třemi schopnostmi - rozumem, smysly a vůlí, tomu odpovídá klasifikace na filozofii, resp. dialektiku (logiku), na základě rozumu, fyziku, což je produkt smyslů (zkoumá přírodu) a etiku, ta je produktem vůle (zkoumá chování). Toto dělení podle Platona se značně rozšířilo. Aristoteles - 4. stol př. Kr., klasifikuje filozofii podle toho, kam směřuje lidské myšlení: k pozorování, k jednání, k tvoření. Podle toho rozeznává vědy teoretické, praktické, poetické. Je to první skutečná klasifikace věd, je trichotomická (trojčlenná). Dodnes se traduje dělení věd na teoretické a praktické. Porfyrius - novoplatonský filozof - 3. století po Kristu Poryfiriův strom - dělí vše dichotomicky (na 2 části) – výrazně umělá homogenní klasifikace - vychází ze substance – tělesná a netělesná, tělo – živé a neživé Raný středověk - školství, které bylo na počátku, bylo poznamenáno náboženstvím a teologií, nejdříve církevní, pak měšťanské. Ve středověku vzniká septem artes liberales (7 svobodných umění): a) trivium (gramatika, rétorika a dialektika – vše se týká projevu), b) kvadrivium (geometrie, astronomie, aritmetika a hudba). Systém svobodných umění se odrazil v pořádacím systému bibliografií, v knihovnách ap. Klasifikace byla ovlivněna i systémem vysokoškolského studia; univerzity od počátku 12. století a ustálil se zde systém 4 fakult (teologická, právnická, lékařská a filozofická /artistická/). Roger Bacon - středověk (13. století), pochopil nutnost aplikovat teoretické poznatky, přiřazoval k nim aplikované vědy, které z nich vycházely, hlavně chtěl aplikovat matematiku a fyziku Francis Bacon - filozof, 16. – 17. století, klasifikuje vědy podle toho, kterými schopnosti poznával člověk; poznává svět rozumem - je základem vědeckého poznání, pamětí - je základem historie, fantazií - je základem poezie. Tato klasifikace ovlivnila především francouzské encyklopedisty. Bacon je zakladatelem novodobé experimentální vědy. Z F. Bacona vycházel W. T. Harris. Francouzští encyklopedisté - konec 18. století - Denis Diderot a Jean d´Alembert - hlavní redaktoři francouzské encyklopedie Racionální slovník věd, umění a řemesel, vycházejí z Bacona, svým tříděním ovlivňují tehdejší vědění. Jan Amos Komenský -17. století, klasifikace pro jeho pedagogické záměry vychází z cíle, k němuž člověk směřuje; poslání člověka je trojí: a) znát sebe a všechno - člověk potřebuje rozum, řeč a práci, tomu v klasifikaci odpovídá věda; b) řídit sebe a všechno - člověk potřebuje etiku; c) obracet sebe a všechno k Bohu - člověk potřebuje teologii Henri Claude Saint-Simon -18. - 19. století, vytvořil první přirozenou klasifikaci, nehledá klasifikaci v člověku a jeho schopnostech, ale v narůstající složitosti jevu, jak je člověk pozoruje v přírodě. Člověk se nejdříve zabýval astronomickými vědami, protože se mu zdály nejjednodušší, následovaly vědy chemické a biologické, teprve pak vědy o společnosti, z toho vyvodíme tuto klasifikaci věd: vědy o vesmíru jako celku, vědy o sluneční soustavě, vědy o neorganické (neživé) přírodě, vědy o organické přírodě, vědy o společnosti, považováno za objektivní princip, je to evoluční princip. Auguste Comte - filosof, 18. – 19. století, přešel k subjektivní klasifikaci, vychází z úrovně abstrakce vědeckých disciplín, dělí vědy na teoretické a praktické. Provedl jen klasifikaci teoretických věd na abstraktní a konkrétní. Tato klasifikace byla velmi populární a ovlivnila celé generace vědců a filozofů (např. T.G. Masaryka; rozpracoval klasifikaci praktických věd a navrhl Ladislavu Janu Živnému 10 základních věd pro systematický selekční jazyk). Herbert Spencer -19. stol., sociolog, pozitivista. Napsal Systém syntetické filozofie. Byl ovlivněn Comtem, jeho klasifikace je pod vlivem evolučních principů. Georg Wilhelm Friedrich Hegel - přelom 18. a 19. století, základní myšlenkou Hegelovy klasifikace věd je idea vývoje (tzv. absolutní neboli čisté ideje), jeho systém klasifikace tvoří 3 části: logika, filozofie přírody, filozofie ducha. 4 ZÁKLADY pořádacích systémů v SÉMIOTICE 4.1 Sémiotika PS, respektive jejich jazyky (selekční jazyky) jsme si definovali jako znakové soustavy. Znaky SJ jsou převzaty z přirozených, formalizovaných nebo umělých jazyků (slova, řízená lexika, notace). Znaky a znakovými systémy se zabývá sémiotika. Sémiotika se dělí obvykle na 3 disciplíny: syntaktiku - rozbor vzájemných vztahů mezi znaky, kterými se sdělují poznatky; zkoumá způsob spojování znaků podle předem stanovených pravidel, nejde o význam, ale o použití znaků, jejich formální spojování, uspořádání, tvar; sémantiku - zabývá se významem znaků, tzn. vztahem znaků a předmětů, jevů a procesů, které jsou označeny, jde o vztah označujícího a označeného; pragmatiku - ta se zabývá vztahem znaků k jejich uživatelům, zkoumá účel, k němuž lidé znaky používají a způsob, jakým to dělají. Znak je smyslově vnímatelný předmět, jev nebo proces, který při komunikaci a poznávání zastupuje nějaký jiný předmět, jev nebo proces. 4.2 Typologie znaků Podle Husserla a Schaffa rozeznáváme : · znaky přirozené (symptomy/příznaky) - nebyly vytvořeny člověkem za účely komunikace, lidé je pouze interpretují na základě svých zkušeností, tj. přírodní, fyzikální úkazy, procesy (např. zamrzlá kaluž); · znaky umělé, neboli vlastní, konvenční, vytvořeny člověkem za účelem komunikace, mají význam a jsou smyslově vnímatelné. Mimojazykové (umožňují komunikaci mimojazykovými prostředky): signály - všechny domluvené znaky, které jsou vysílány záměrně, aby u příjemce vyvolaly reakci, předměty nebo jevy určené, nebo užívané lidmi, aby začaly nebo skončily lidské aktivity, mají smluvený význam a potřebují určitou interpretaci, aby měly funkci, např. zvonění zvonku, barva na semaforu, zvuk sirény, symboly - materiální předměty, které zastupují abstraktní pojmy a obsahy, lze je pochopit jen na základě určitých kulturně historických souvislostí (např. křesťanský kříž), ikony - zobrazení, podobizny, výtvarná díla, zjevná podobnost označujícího a označeného. Jazykové (znaky přirozeného i umělého jazyka) pro přirozený jazyk je znak slovo, pro umělý je znak odvozený z přirozeného jazyka. V SJ znakům říkáme pořádací znaky. 4.3 Význam znaku v selekčních jazycích Znak je označující, předměty, jevy a procesy jsou označované, označované nazýváme denotát, denotace je význam znaku, předměty, jevy a procesy, které jsou označeny, extenze, rozsah znaku. Smysl znaku je jeho myšlenkový obsah, intenze např. Venuše, Jitřenka, Večernice – stejná extenze znaku. Prázdné znaky nemají žádnou extenzi, mají jen obsah (Rusalka – není, ale máme představu, jak vypadá). Význam (denotace) znaku nás uvádí do oblasti jazykových nejednoznačností přirozeného jazyka, s nimiž se musí PS vyrovnat. 4.3.1 Asymetrie jazykových znaků · Synonymie - jazykový jev, při němž různé znaky, mají stejný denotát, pro jeden denotát existuje více než jeden znak. Rozlišujeme synonyma lexikální, kdy na označení denotátu lze použít 2 nebo více slov s rozdílnými kmeny, např. měsíc – luna, lůžko - postel a gramatická, která mají stejný kmen, ale jinou morfologii, např. prát – praní. V rámci lexikálních synonym rozlišujeme kontextuální (frazeologická) synonyma, jsou zaměnitelná jenom v určitém větném kontextu, vždycky mezi nimi existuje jemný sémantický rozdíl, nemají pro SJ velký význam, např. dívka je kočka, kost, krasavice; tematická synonyma – mají z hlediska SJ velký význam, jde oslova označující velmi široké téma, např. vozidla (automobily, tramvaje, autobusy, kola...). Jde tedy o nadřazený pojem rodový a k němu podřazený pojem druhový. Nadřazené pojmy nazýváme nadpojmy = hyperonyma, např. obilí, podřazené pojmy nazýváme podpojmy = hyponyma, např. pšenice, spolupodřazené pojmy = kohyponyma, např. žito a oves. Pravá synonyma (v užším slova smyslu) - různě znějící, ale mající stejný význam, smysl i denotaci, jedna podoba je neutrální, ostatní jsou zbarvena citově nebo historicky, např. postel a lože. Mezijazyková synonyma (interlingvistická) - převzatá slova z cizího jazyka a domácí slova, např. nádor – tumor, květena – flora, gladiola – mečík. Odstraňování synonymie se děje pomocí formalizace jazyka. Používáme vylučovací metodu, odkazy - viz, nepreferovaný termín, deskriptory… apod.,např. vepři – viz. prasata, andulka – viz. papoušek vlnkovaný, jakost – preferovaný výraz, kvalita – nepreferovaný výraz. Nepravá synonyma – kvazisynonyma - zkřížené pojmy, částečně podobné pojmy, např. Latinská Amerika – viz. též Jižní Amerika a opačně, výsadkáři viz též parašutisté a opačně. · Protikladnost významů - antonyma a opozita. Nepatří mezi asymetrie, ale z hlediska našeho problému v SJ, mají obdobné řešení. Antonyma, tj. protikladná slova, např. těsnost, netěsnost. Lze někdy řešit jen použitím jednoho termínu těsnost (má různé stupně, kvality, těsnosti), někdy musíme ponechat oba termíny, např. kovové x nekovové materiály, obvykle s nimi tedy zacházíme jako s kvazisynonymy. Opozita, tj. slova protivná, opačná, např. krása x ošklivost, černý x bílý, tvrdost x měkkost, obvykle v řízených slovnících zacházíme také jako s kvazisynonymy, tedy užíváme odkazy na příbuznost (přidružovací – viz též). · Homonymie a polysémie – obvykle se rozlišuje mezi oběma termíny. Homonymie = jeden znak označuje dva nebo více zcela různých významů, jejichž souvislost není patrná, jeví se zcela nahodilá, slovo může mít i několik významů, souzvučnost slov, slova, která mají více než jednu denotaci, více než jednu množinu označených, např. řád, matka, kolej, zámek. Od pravých homononym rozlišujeme dále homoformy - slova, která se shodují jen v některých tvarech, např. pila v lese – nástroj, nebo příjem nápoje; homofony - souzvučné výrazy, které stejně zní, ale při psaní je rozdíl záměny, přicházejí v úvahu při telefonování nebo při řečové interakci s PC, např. jed/jet, plod/plot; homogramy – v češtině vzácné, např. panický strach (od panic, nebo panika), v úvahu přichází při ztrátě diakritiky v sms, mailech ap. Polysémie = jev, kdy mezi denotáty příslušných slov jsou zjevné funkční nebo tvarové shody, např. křídlo, lopatka. Z hlediska SJ nás tento rozdíl mezi homonymií a polysémií nezajímá. Odstraňování homonym se děje třemi způsoby: · pomocí adjektiva, např. zdravotní sestry, řádové sestry, sestry; nebo divadelní programy, počítačové programy, grantové programy (tento způsob je nejprogresivnější) · závorkový výklad (kvalifikátor, relátor), např. matky (součástky); zámky (budovy), zámky (zámečnictví) · nahrazení homonyma synonymem, např. cukrovka = diabetes mellitus x cukrová řepa [Úkol k zamyšlení] Najděte ve větě: Fin si koupil dva losy jazykovou nejednoznačnost a pokuste se ji odstranit. Najděte ve větě Hasiči použili požární žebřík jazykovou nejednoznačnost a pokuste se ji odstranit. Odpověď: los je homonymum, proto je nutno v SJ napsat: los (savec), los (výherní šek). Ale protože, jak se dozvíte, většina předmětových SJ používá 1. pádu množného čísla, jeví se slovo jako homoform a ve tvaru losi X losy nám již nečiní problém. Odpověď: hasiči mají synonymum požárníci, proto je nutno požárníky jako nepreferovaný výraz „odstranit“, např. odkazem požárníci viz hasiči 4.3.2 Další nejednoznačnosti slovníku přirozeného jazyka · Vágní slova - při interpretaci slov existují pochybnosti, které denotáty přesně označují, problém vymezení hranic pojmu. Většinou jde o termíny označující kvalitu. Např. velký, malý, chvíle, moderní, současný. V některých oborech jsou vágní slova kvantifikována interpretační normou, dojde ke kvantifikaci pojmu (stanoví se rozsah). Např. vysoké napětí el. proudu, definice malých podniků apod. Vágním slovům, která nelze kvantifikovat, se snažíme vyhnout (např. místo moderní píšeme roky). · Slova s malou informační hodnotou (nespecifická slova) - mají minimální selekční sílu, např. principy, problémy, základy, metody (tzv. „knihovnická vata“). · Slova a nulovou informační hodnotou (nevýznamová slova) - pomocná slova, vyjadřují pouze gramatické vztahy, např. spojky, částice, předložky, členy. 4.3.3 Vztahy mezi slovními znaky · Syntagmatické (syntaktické, aposteriorní) - lineární vztahy mezi prvky v řadě. Jde o vztahy mezi jazykovými jednotkami, které tvoří vyšší jednotku. Syntagmatické vztahy mezi hláskami tvoří slovo, vztahy mezi slovy tvoří větu, mezi větami souvětí. Nejčastěji se zkoumají vztahy mezi slovy ve větě, tyto vztahy souvisí se syntaxí, slova ve větě vytvářejí syntagma – sklad, větné dvojice. V postkoordinovaném SJ syntagmatické vztahy nejsou vyjádřeny, v prekoordinovaném ano. · Paradigmatické (apriorní, sémantické) - intratřídní vztahy – uvnitř třídy, v přirozeném jazyce vytvářejí dílčí systémy, např. systém samohlásek, systém časů, skloňování jmen. Paradigmatika v SJ zkoumá vztahy mezi slovy, založené na mimojazykových faktorech – logické vztahy mezi pojmy. Slova označují nějaké předměty, jevy, označované jsou navzájem spjaty nějakými vztahy a ty se odrážejí ve vztazích mezi označujícími (slovy), jde o vztahy mezi označujícími, které se zakládají na existenci vztahů mezi označovanými (denotáty), např. matka – dítě -> Čech chápe spojitost, jelikož mluví česky. Cizinec to nepochopí, slyší jen dva zvuky, ale vztah stále existuje. Tyto vztahy jsou nezávislé na konkrétním dokumentu obecně uznávány, dají se ověřit, např. v encyklopedii. Slova sdružená na základě určitých sémantických příznaků se sjednocují v paradigmata, např. paradigmata, která jsou kvazisynonymy · p. jehličnatých stromů x p. stálezelených stromů borovice borovice smrk smrk jedle jedle modřín cesmína 4.3.4. Paradigmatické vztahy v řízených slovnících * synonymie = (ekvivalence) - shoda označovaných při rozdílnosti označujících * homonymie = (homografy a polysémy) – shoda označujících při rozdílnosti označovaných * hierarchie = nadřazenost a podřazenost: * generický vztah = rod-druh, druh-rod (hlodavci-myši; švestka-peckoviny), nadpisové položky (letadla – dopravní letadla, vojenská letadla, lékařství – sportovní lékařství, vojenské lékařství) * partitivní vztah = celek-část, část-celek (oběhový systém-tepny a žíly; motor, podvozek- automobil; Kanada – Ontario, Ottawa, Toronto; divize-pluk, prapor-rota) * podřízenost (kauzální vztah) = (pohoří-Alpy) Alpy jsou konkrétním případem pohoří * vztah polyhierarchie = příslušnost pojmu do dvou, nebo více kategorií současně (autobusy patří do silničních vozidel i do motorových vozidel; lebka patří do kostry i do hlavy) * asociace (příbuznost): * jednotky téže kategorie (v kategorii plavidla jsou si příbuzné: lodi a čluny…; mezi lichokopytníky jsou si příbuzní: koně, mezci, muly) * disciplína a její objekt (hutnictví a kovy; ornitologie a ptáci) * předmět a použití (regulace teploty a termostaty; kosa a senoseč) * činnost a výsledek (tkaní a plátno; dojení a mléko) * předmět (objekt) a činnost ( obilí a žně; žáci a výuka) * předmět a vlastnost (jedy a toxicita; kovy a kujnost) * předmět a původ (Britové a velká Británie) * příčina a následek = kauzalita (nemoci a léčení; zločin a trest; blesk a hrom) * *předmět a látka proti němu (rostliny a herbicidy) * *jev a jednotka měření (elektrický proud a ampér) * *podobnost (dým a pára; jezero a moře) v řízených slovnících se obvykle nedokazuje * rozšířené výrazy a výchozí substantivum (fosilní plazi a plazi, hokej, pozemní hokej – odlišné od nadpisových položek) *pro řízené slovníky nepodstatné 4.3.4 Sémantika pořádacích znaků Index = pořádací znak není vlastně pojem v pravém slova smyslu, ale téma, třída ekvivalence dokumentů, informací vyznačujících se obsahovou příbuzností (pojednávají o tomtéž). Obsahová příbuznost je dána sémantikou indexu. Ať se tedy k věcnému pořádání používá jakýchkoli znaků, charakterizujeme nikoli předměty a jevy objektivní skutečnosti, ale obsah dokumentu. Proto je význam pořádacího znaku (indexu) vždy odlišný od významu slova v přirozeném jazyce a to i tehdy, je- li pořádací znak se slovem formálně shodný. Termín v SJ nemá týž smysl a denotaci jako slovo, pouze pojednává o slovu s tím smyslem a denotací. Počítač je slovo pro určitý předmět. Pořádací znak počítač znamená informaci, dokument o počítačích. Pořádací znak má tématický význam (jaké téma), množinový (jakou množinu zastupuje) a systémový (jakou roli má v systému ostatních pořádacích znaků). [Úkol k zamyšlení] Jaký druh sémantického (paradigmatického) vztahu je mezi termíny selekční jazyk a systematický selekční jazyk ? Odpověď : Jde o hierarchii, systematický selekční jazyk je podřazen selekčnímu jazyku, můžeme jej blíže považovat za generický vztah typu nadpisové položky. Shrnutí modulu Pořádání informací avěcné pořádací systémy I V této části jste se dozvěděli, co je pořádání informací, jaké druhy pořádání známe a jaký je rozdíl mezi systematickým a předmětovým pořádáním. Seznámili jste se s obsahovou analýzou dokumentů, víte již, proč je důležitá, jak se provádí a co je jejím výsledkem. Také je vám již známo, že se více méně úspěšně realizuje i automatizovaně pomocí počítačů v rámci automatické indexace. Selekční jazyky můžeme zkoumat z hlediska jazykovědy; tak jste poznali nejen, jaký je rozdíl mezi PJ a umělým informačním jazykem, ale především jste se seznámili s druhy a typy SJ. Logika nám pomáhá SJ poznat z jiné stránky, proto jste si zopakovali některé pojmy z teorie množin, vztahy mezi nimi, základní operace na množinách a podrobněji jste se seznámili s klasifikací věd. Sémiotika, zejména sémantika je pro SJ velmi důležitá; indexační znaky, zejména verbální lexikální jednotky si z PJ nesou mnohé nejednoznačnosti, asymetrie. Proto jsme si přiblížili polysémii (homonymii), synonymii a vágnost slov a víte již, jak se dá v SJ odstranit. Tím jsme se přiblížili k druhé části této opory, proto bylo na závěr nutno v přehledu ukázat především paradigmatické vztahy mezi lexikálními jednotkami v řízených slovnících. Shrnutí modulu Další zdroje ke kapitolám 1-4 BERTRAM, J. Einführung in die inhaltliche Erschliessung: Grundlagen, Methoden, Instrumente. Würzburg: Ergon Verlag, 2005. 315 s. ISBN 3-89913-442-7. ČERNÝ, J. a J. HOLEŠ. Sémiotika. 1. vyd. Praha: Portál, 2004. 363 s. ISBN 80-7178-832-5. KOVÁŘ, B. Věcné pořádání informací a selekční jazyky. 2. vyd. Praha: ÚVTEI, 1984. 250 s. KUCIANOVÁ, A. Informačná analýza - klasifikácia a indexovanie 1 [elektronický zdroj]. Martin: Slovenská národná knižnica, 2007- [cit. 20. 4. 2017]. Dostupné z: http://www.snk.sk/?Pr PALÁTOVÁ, R. a B. KOVÁŘ. Informačné selekčné jazyky 2. 1. vyd. Bratislava: Slovenské pedagogické nakladatelství, 1985. 227 s. ČSN ISO 5127-6 (01 0163). Dokumentace a informace: slovník. Část 6: selekční jazyky. 1994. (zrušená norma). 5 Systematické pořádání a teorie Knihovnicko-bibliografických klasifikací 5.1 Systematické pořádání Jen zdánlivě složitějším než předmětové pořádání je pořádání systematické (klasifikace). Ve skutečnosti mají lidé spíše tendenci zařazovat informace, tedy i dokumenty do oborů, je jim tedy bližší než předmětové. Klasifikace explicitně zachycují paradigmatické vztahy mezi klasifikovanými pojmy (mezi lexikálními jednotkami). Při systematickém pořádání řadíme informace do určitého systému – logicky uspořádaného uzavřeného celku buď celého lidského vědění a praxe, nebo jeho části (konkrétní oblasti). Příbuzné pojmy se shlukují do oborů – tříd. Třídy jsou do určité míry podobné vědním oborům (klasifikaci věd), netřídíme ovšem poznání, ale dokumenty a informace v nich. Užíváme přitom více méně hierarchii pojmů uvnitř tříd. Např.: • Přírodní vědy • Zoologie • Obratlovci • Savci • Šelmy • Kočkovité šelmy • Malé kočkovité šelmy • Kočka domácí • Kočka domácí Micka Potřebujeme ovšem, aby pořadí bylo patrné, abychom mohli řadit automaticky a nemuseli my, ani uživatel přemýšlet, kam pojem a tím i dokument v hierarchii patří. Proto používáme notaci - „kódujeme“ v umělém jazyce (stupňovité indexy): • ZOOB • ZOOBSA • ZOOBSAŠE • ZOOBSAŠEKO • ZOOBSAŠEKOMK • ZOOBSAŠEKOMKKD • ZOOBSAŠEKOMKKDMicka Takový kód, správně notace, je ještě dosti nepohodlná, proto se používají jednodušší druhy notace, např. číselná: • 59 Zoologie • 599 Savci • 599.74 Masožravci • 599.742 Šelmy • 599.742.7 Šelmy kočkovité • 599.742.7 Micka Slovní vyjádření ovšem již při pořádání nezapisujeme, bylo by to zdlouhavé. Požívají se speciální slovníky – klasifikační tabulky, kde najdeme ke znakům notace slovní významy a v předmětovém rejstříku ke slovním heslům příslušné klasifikační znaky (notaci). 5. 2 Systematický selekční jazyk (jazyk knihovnicko-bibliografických klasifikací) Jde o selekční jazyk používaný při realizaci procesu systematického pořádání informací jako jeho výrazový a vyjadřovací prostředek. Je určen k indexování obsahových údajů o dokumentech, jejich částech, jednotlivých informací a uložení těchto údajů do nějaké informační paměti. Selekčními údaji jsou u systematických selekčních jazyků (SSJ) znaky umělého jazyka. V klasifikacích jsou vřazovány záznamy o dokumentech na příslušné místo systematicky pořádaného souhrnu lidského poznání, nebo jeho části. V klasifikacích se uplatňují rodo-druhové vztahy, teorie množin, teorie klasifikace věd. Notace - pro klasifikace je typické, že výrazy přirozeného jazyka, kterými je vyjádřen obsah dokumentu, převádějí do výrazů jazyka umělého. Notace je systém znaků umělého jazyka, který v určitém selekčním jazyce (v klasifikaci) umožňuje vyjadřovat téma dokumentu, často i velmi složené a překládat vyjádření tohoto tématu z přirozeného do umělého jazyka. Druhy notace podle použitých znaků: * číselná (numerická) * písmenná (alfabetická) * písmenně číselná (alfanumerická) * smíšená – z různých druhů znaků, např. různých abeced, římských a arabských číslic, nejčastěji alfanumerická * čistá – pouze z jednoho druhu znaků (1 druh abecedy, číslic) Dále existují tyto zvláštní typy: * expanzivní notace – je to otevřená notace, která umožňuje stávající hierarchii doplňovat o nové poznatky, tedy o nové znaky (notace), aniž se naruší jednota schématu * uzavřená notace – doplňování neumožňuje * enumerativní notace – vlastnost, která umožňuje vypočítávat, vyjmenovat na různých místech hierarchického systému jednotlivá, i složená témata dokumentů v podobě znaků umělého jazyka. * mnemotechnická (mnemonická) notace – splňuje podmínku snadné zapamatovatelnosti, třídy hierarchického systému jsou označeny takovými alfabetickými znaky, jež odpovídají počátečním písmenům nebo zkratkám názvů těchto tříd v přirozeném jazyce, nebo uplatněna zásada, že určitý znak znamená na různých úrovních, nebo v určité kombinaci vždy totéž, např. 0 na začátku vždy znamená teoretické základy, všeobecnosti Klasifikační znaky Pomocí notace vyjadřujeme klasifikační znaky, což jsou lexikální jednotky systematických SJ. Rozlišujeme : Základní znaky – označují hlavní třídu celého hierarchického systému., hlavní (jednoduché) znaky – vznikly postupným rozkladem základního znaku a jsou obsaženy v systematicky uspořádaných klasifikačních tabulkách na různých hierarchických úrovních, složené znaky – označují složená témata dokumentů a vznikají spojením dvou anebo více základních nebo hlavních znaků pomocí tzv. spojovacích symbolů, rozvinuté znaky – označují předmět ve smyslu tématu dokumentu, o němž se pojednává z nějakého hlediska, píše se o něm v nějakém jazyce apod. Jsou vytvářeny tak, že k základnímu nebo hlavnímu znaku je připojen tzv. pomocný znak. Pomocné znaky dělíme na: všeobecné pomocné znaky – mohou být použity v celém rozsahu systematických tabulek, v kterékoli třídě a zvláštní (specifické) pomocné znaky – mohou být použity jen v určitých třídách, tam, kde jsou uvedeny a hierarchicky níže, např. 616-07 je diagnostika, 616.1 je znak pro kardiovaskulární onemocnění, 616.1-07 lze vytvořit, ale ke znaku 629.331 technika automobilů -07 nelze připojit, jde o jinou podtřídu ! Tabulky knihovnicko-bibliografických klasifikací Klasifikační tabulky systematických pořádacích systémů jsou vlastně slovníkem, který umožňuje překládat ze znaků umělého jazyka do výrazů přirozeného jazyka a naopak. Mívají dvě části – první část (nezbytná) obsahuje systematicky uspořádané lexikální jednotky v umělém jazyce (zápis notací) a vedle nich uvádí jejich ekvivalenty v přirozeném jazyce. Součástí bývá také soupis pomocných znaků s verbálními ekvivalenty. Druhá část (obvyklá) je pomocný prostředek umožňující vstup do systematické části, obsahuje abecedně uspořádané verbální ekvivalenty ke znakům umělého jazyka a odkazuje na ně, tj. předmětový rejstřík.. Existují různé druhy tabulek knihovnicko-bibliografických klasifikací: základní tabulky – soubor znaků, které hodlá nějaká agentura stále udržovat, úplné tabulky – obsahují všechny znaky, které byly schváleny pro danou klasifikaci, střední tabulky – také zkracují počet znaků klasifikace, ale v menší míře než tabulky zkrácené, zkrácené tabulky – zahrnují celé spektrum znaků dané klasifikace, ale jejich počet krátí rovnoměrně na předem stanovený rozsah, speciální (odvětvové, oborové) tabulky – zaměřeny na určitý obor, zpracovávají jej velmi podrobně, zatímco ostatní obory podstatně zkracují. Použití knihovnicko-bibliografických klasifikací Systematický katalog už v knihovnách a informačních institucích není nejdůležitější, jak se tvrdilo, s nástupem počítačů jsou systematické katalogy částečně vytlačeny postkoordinovanými předmětovými systémy pořádání (např. klíč. slovy). Nyní zažívá systematické pořádání určitou renesanci, protože má méně jazykových problémů, je již částečně postkoordinované, dá se kombinovat s jiným vyhledáváním, nejčastěji se používá jako propojovací jazyk k makroindexaci, tedy „hrubší“ znaky bez pomocných znaků, používané k pořádání fondů na policích, k roztřiďování bibliografií a výměně větších souborů. Uživatelé klasifikací se někdy k nim staví vstřícně a znají svůj obor, někdy naopak. Odmítají porozumět. Světově aktuální klasifikace: Deweyho desetinné třídění (DDT) – Dewey decimal classification (DDC) – nejrozšířenější, Mezinárodní desetinné třídění (MDT) – Universal decimal classification (UDC), Třídění kongresové knihovny USA (TKK) – Library of Congress classification (LCC), Blissovo bibliografické třídění (BBT) – Bliss classification (BC 1,BC 2) – spíše inspirace ostatním. [Úkol k zamyšlení] Potřebují klasifikační tabulky i uživatelé, když chtějí vyhledávat podle klasifikačních znaků ? Odpověď: Ano, stejně jako u jazykových překladů slouží překladové slovníky, slouží klasifikační tabulky katalogizátorům, aby přidělili znaky vyjadřující téma dokumentu, ale také je musí mít k dispozici uživatelé, aby svůj dotaz mohli „přeložit“ (vyjádřit) notací , a tak si jej mohli vyhledat. Prakticky se ale mohou poradit s knihovníkem, nebo mají nápovědu napsanou u katalogů a na regálech s volným výběrem. 5.3 Vývoj hierarchických a fasetových klasifikací Systematické pořádání informací je nejstarší pořádání informací vůbec. Knihy (svitky) byly nejprve stavěny podle oborů. Nejstarším druhem katalogů jsou také katalogy systematické. Kallimachos z Kyrény (3. stol. př. Kr.) byl autorem pořádacího systému v Alexandrijské knihovně : „Seznam těch, již vynikli ve všech oborech lidských vědomostí, a jejich spisů!. Jeho katalog měl údajně na 120 svazků. Středověké systematické katalogy měly povahu inventáře nebo místního seznamu, což dokazuje i katalog knihovny Karlovy koleje pražské univerzity. Přibližně 200 knih je uloženo oborově do dvou skříní, nebylo-li již místo v jednom oboru, zařadila se kniha tam, kde bylo nejblíže místo. Vynálezem knihtisku došlo k prudkému nárůstu literatury a rozšiřování knihoven, což vyvolávalo potřebu třídit abecedně i systematicky. Conrad Gesner, též Gessner (16. stol.) je autorem univerzální bibliografie, uspořádané jak abecedně, tak systematicky – Bibliotheca universalis, obsahuje tehdy známou literaturu řeckou, latinskou a hebrejskou. Ve druhém díle klasifikuje literaturu, za základní vědu přitom považuje filozofii, která je souhrnem všech věd a umění. Filozofii člení takto: vědy podstatné a přípravné – na nutné a ozdobné. Každá z hlavních skupin je klasifikována na další hierarchické úrovně, takže vzniká celkem propracovaný systém, v němž se uplatňuje vliv Aristotela, sedmi svobodných umění a dichotomický princip. Gabriel Naudé [nodé] (17. stol.) byl francouzský knihovník, bibliograf a lékař, který navazoval na Gesnera. Literaturu pořádal podle organizace vysokoškolského studia. V 19. století se objevuje nový typ bibliografií vydávaných v souvislosti s potřebami knihkupců, nakladatelů, knihtiskařů. Některé z nich mají vysokou odbornou úroveň – např. Jacques-Charles Brunet [Brine] vydal bibliografii pod názvem Příručka knihkupce a sběratele knih. Bibliografie má pět základních tříd, ty jsou pak rozpracovány do čtyř hierarchických úrovní. Brunet používá dosti propracovanou notaci, která zahrnuje jako znaky římské číslice, arabské číslice, písmena, zvláštní znaménka, jako např. hvězdičky. Jde o první použití smíšené notace v dějinách systematických selekčních jazyků. Brunetova klasifikace byla velmi oblíbena a používala se např. v pařížské Národní knihovně, v knihovně Britského muzea v Londýně a částečně pod jejím vlivem byl vypracován i systematický selekční jazyk Knihovny Kongresu USA ve Washingtonu. Poměrně propracovaná je klasifikace Josefa Jungmanna (19. stol) obsažená v Historii literatury české, aneb soustavném přehledu spisů českých…. Jde o systematický selekční jazyk určený pro účely bibliografie. Prvním principem třídění je chronologický, rozlišuje šest oddílů. Teprve pak se vychází z charakteru díla, jazyka a slovesnosti. Hlavní třídy jsou označeny velkými písmeny, ve druhé úrovni malá písmena, dále písmena řecké abecedy a někde i číslice. Značný význam měla klasifikace, kterou zpracoval pro knihovny Veřejné školy v St. Louis William Torrey Harris. Vyšel z Baconovy klasifikace věd, ale převrátil jejich pořadí. Harrisův jazyk silně ovlivnil výběr deseti hlavních tříd Deweyho desetinného třídění, a tím také strukturu pozdějšího MDT. Částečně v opozici k Deweyho klasifikaci vytvořil Charles Ami Cutter pro knihovnu bostonského Athenea tzv. expanzivní klasifikaci. Expanzívnost chápe tak, že SSJ má umožňovat použití pro malé knihovny (100 svazků) i pro velké knihovny. Navrhl proto sedm variant SSJ, první varianta pro knihovnu se 100 svazky, sedmá varianta pro knihovny s 10 miliony svazků. Hlavní třídy označil velkými písmeny. Cutter jako první použil pomocné znaky, a to pomocné znaky formy (jednomístná číslice) a pomocné znaky geografické (dvoumístná číslice). Melvil Dewey – Deweyho desetinné třídění (DDT, angl. DDC). Desetinný princip – lidské poznání tříděno do 10 tříd. Notace vychází z desetinných čísel (zlomků). Sestaveno koncem 19. stol. v Amherstu (USA). Rozvíjejí a používají hlavně anglicky hovořící země (asi 135 zemí). Nyní 23. vyd. i elektronické. Viz kapitola 5.5 5.4 Mezinárodní desetinné třídění V České republice je nejrozšířenějším systematickým selekčním jazykem Mezinárodní desetinné třídění (MDT), v angličtině UDC = Universal decimal classification. Toto třídění vzniklo z DDT = Deweyho desetinného třídění , které má mezinárodní (anglický) název DDC = Dewey Decimal Classification. Melvil Dewey (1851 - 1931) byl významný americký knihovník, který mimo jiné pro knihovnu Amherest College vymyslel originální knihovnické třídění založené na desetinném principu. Notace je číselná a využívá číslic 0-9. Umožňuje logický rozklad předmětu dokumentu na stále nižší podtřídy (oddíly). Každé číslo notace je chápáno jako desetinný zlomek, číslo s vypuštěnou desetinnou čárkou. Vznik MDT je spjat s Mezinárodním bibliografickým ústavem v Bruselu, kde působili Paul Otlet, a H. La Fontain. Ti na počátku 20. století upravili Deweyho desetinné třídění pro pořádání světové literární produkce v Ústavu. Pozměnili zápis notace, přidali soustavu pomocných znaků, kterými vyjádřili různá hlediska dokumentu a tak vzniká samostatné třídění, samostatný selekční jazyk. Ústav změnil sídlo i název a zaměřil se později pouze na údržbu a aktualizaci MDT. Nejdéle si podržel název Mezinárodní federace pro dokumentaci = FID (mezinárodní zkratka). Pracují v něm různé komise a podkomise. Vydává a schvaluje nejen tabulky, ale i Změny a doplňky MDT (Exstensions and Corrections to UDC).[3] V roce 1991 rezignuje FID na finančně náročnou správu MDT (tzv. úplné vydání tabulek mělo rozsah cca 200.000 znaků) a vzniká Consortium UDC Hague (UDCC) = Konsorcium pro MDT v Haagu, které nyní vydává každoročně aktualizované MDT-MRF = Master Reference File - cca 70.000 znaků. Národní knihovna ve spolupráci s AiP Beroun vydávala české překlady tabulek MDT-MRF na CD-ROM a na www – 5. vydání[4] a kromě toho Vybrané znaky MDT NK ČR 1999- tištěné tabulky - cca 1.600 znaků. Aktualizace Vybraných znaků z roku 2002 naleznete jen na www NK ČR[5]. Nyní je k dispozici funkční online český překlad MRF na URL: http://cz.udc-hub.com/cs/login.php[6], zde se ovšem musíte přihlásit pod heslem, na URL: http://www.udcsummary.info/php/index.php[7]^ naleznete přístup do systematické části tabulek bez hesla. (Stačí do internetových vyhledávačů zadat České MDT online, nebo UDC Summary).^ Vybrané znaky používají univerzální knihovny, které nepřikládají váhu vyhledávání podle MDT, nebo používají tuto klasifikaci hlavně pro stavění odborných publikací ve volném výběru, tam jim makroklasifikace (hrubé třídění) zcela stačí. Ve starých systematických katalozích se můžete setkat s tzv. Tropovského úpravami vzniklými v bývalém Sovětském svazu z výlučně ideologických důvodů, jde o nesystémové vnesení písmen do třídy 1 a 3, tedy vnesení alfanumerické notace do MDT. Zcela opuštěno. Struktura MDT: Hlavní třídy – základní znaky • 0 Obecnosti • 1 Filozofie, Psychologie • 2 Náboženství • 3 Společenské vědy • 4 nyní volná (možná obsadí lékařství) • 5 Matematika a přírodní vědy • 6 Užité vědy. (Lékařství. Technika aj.) • 7 Umění. Sport. Hry • 8 Jazyky. Jazykověda. Krásná literatura • 9 Geografie. Životopisy. Dějiny Hierarchická pyramida - třída 6 • 6 Užité vědy • 62 Technika • 621 Strojírenství • 621.9 Obrábění • 621.95 Vrtačky • 621.952.8 Vrtačky na hluboké díry Struktura třídy 6 - podtřídy • 60 Společné otázky 65 Technika obchodu a dopravy • 61 Lékařství 66 Chemický průmysl • 62 Technika 67 Rozličné průmysly • 63 Zemědělství 68 ….a řemesla 64 Domácí hospodářství 69 Stavitelství Základní rozdělení podtřídy 62: • 620 Zkoušení materiálu • 621 Všeobecné strojírenství • 622 Hornictví • 623 Voj. technika • 624 Stavebnictví • 625 Dopravní technika • …atd. Tabulky vydávané FID a UDCC: Úplné tabulky – cca 200 000 znaků, základní (MRF) – cca 70 000 znaků, střední – cca 40 000 znaků, zkrácené – cca 10 000 znaků, výtahy z MDT - dle účelu, např. Vybrané znaky MDT – cca 1 600 znaků. Neexistuje žádná průměrná délka znaku, záleží na tom, do které třídy znak patří. Znaky tříd nazýváme základní, jejich dělením (přidáváním dalších číslic) vznikají znaky hlavní, najdeme je v klasifikačních tabulkách, o nichž jste se dozvěděli již výše. Obsah dokumentu nelze vždy vyjádřit jediným hlavním znakem. Proto je klasifikační schéma doplněno spojovacími symboly + / : jimiž se vyjadřuje vztah hlavních znaků. Všem znakům, které „pomáhají“ hlavním a základním znakům vyjádřit něco navíc, říkáme pomocné a uvozují je znaménka vypůjčená z matematiky. Další znaménka po vyjmenovaných spojovacích symbolech uvozují ostatní pomocné znaky, které vyjadřují různá hlediska přidávaná k hlavním znakům. Jsou dvojího druhu : všeobecné pomocné znaky a zvláštní (specifické) pomocné znaky. Přiklady: • znak vztahu (spojovací) : např. 004:02 znamená počítače v knihovnictví (použili jsme dva hlavní znaky v logickém vztahu) • znak místa (všeobecný) (437.3) např. 02(437.3) knihovnictví v Česku (použili jsme hlavni znak a pomocný znak místa) • znak pro lékařskou diagnostiku a symptomy (specifický) 616-07 např. 616.126.32-07 diagnostika nedomykavosti chlopní. Znak -07 nemůžeme použít mimo patologii 616 (použili jsme hlavní znak a specifický pomocný znak pro diagnostiku) Pokud hlavní znak upřesníme pomocným, vzniká tzv. rozvinutý znak. Některé všeobecné pomocné znaky mohou stát i samostatně, pak jim říkáme nezávislé pomocné znaky. Notace MDT je číselná, desetinná, před každým znakem si pro hledání a řazení můžeme představit 0, ! Pro přehlednost se za každou třetí číslicí píše tečka. Čísla 5 197, 6, 6 217 a 8 jsou seřazena špatně dle velikosti. Pokud budou ale desetinnými zlomky, je situace jiná: 0,5197; 0,6; 0,6217 a 0,8 jsou seřazena správně. Proto je správné řazení znaků MDT: 519.7; 6; 621.7 a 8. [Cvičení] Seřaďte správně tyto znaky MDT: 8; 941; 914; 004 Seřaďte správně tyto znaky MDT: (nápověda - rozvinutý znak, tj. znak s pomocným znakem v závorce, se řadí až za hlavní znak bez závorky) 2; 61; 61(091); 612; 8 Na URL uvedené výše zvolte nabídku „Text“ vyhledat a najděte pomocný znak MDT pro Česko; hlavní znak pro bubnové pračky. Nebo volte v notaci MDT znak 6, dále 64 a najděte význam znaku 641 Řešení: 004; 8; 914; 941 2; 61; 61(091); 612; 8 (437.3) Česko; 648.235 Bubnové pračky; Jídlo. Potraviny. Kuchařství. Nádobí 641 5.5 Další klasifikace Mezinárodní desetinné třídění je rozšířeno především v Evropě. Od r. 1956 je UNESCO doporučuje pro střední Evropu, ale v naší republice má tradici již před druhou světovou válkou. Dnes kromě Velké Británie a dalších výjimek je v Evropě i ve světě stále užíváno (cca 60 zemí a 25 jazyků). Nejrozšířenějším knihovnicko-bibliografickým tříděním ve světě je však Deweyho desetinné třídění – Dewey decimal classification (DDT/ DDC) cca 140 zemí a 40 jazyků). (Opakujeme) Melvil Dewey patří k nejvýznamnějším představitelům amerického a světového knihovnictví. Své třídění poprvé uplatnil v knihovně koleje, kde studoval- Amherst, a první vydání Deweyho klasifikace vyšlo v roce 1876. Toto třídění je nejrozšířenější na světě, rozvíjejí jej hlavně anglosaské země, mj. v rámci programu OCLC, poslední je 23. vydání, v elektronické podobě a vystavené na webu. Toto třídění podléhá také revizím a změnám, uvádí jej i Kongresová knihovna, která má jinak vlastní systém, DDC vychází i ve francouzštině, italštině a mnoha dalších jazycích. Ve struktuře DDC hraje významnou roli pořadí hlavních tříd. Dewey vychází z Harrise, a ten z Bacona. Harris obrátil pořadí věd, takže vznikl tzv. převrácený baconovský systém: filozofie – poezie (umění) – historie. Dewey zavádí číselný desetinný princip a používá jej v notaci SSJ. Rozlišuje deset hlavních tříd, které dělí na deset skupin, takže vzniká sto skupin 000-990. Např. 540 – Chemie, 541 – Teoretická chemie. Připojují-li se při jemnějším členění další číslice, za každou třetí číslicí se dělá tečka. Velký přínos je také v tzv. relativním indexu. Jeho pomocí se vstupuje do systematické části tabulek, která je uspořádána logicky podle znaků umělého jazyka, prostřednictvím abecedně uspořádaných a přirozeným jazykem vyjádřených pojmů. Podává abecední soupis všech tříd, skupin a podskupin uvedených v systematické části. Dewey se také zabýval hlediskem, z jakého se na daný problém díváme. Dewey proto uvádí u názvů znaky různých míst systematických tabulek, kde o zařazení znaku rozhoduje právě hledisko. Dewey také zavedl systém pomocných znaků, které jsou proti MDT zpočátku ještě nedokonalé. Umožňují vyjádřit formu, v níž se o předmětu pojednává, popřípadě jeho zeměpisné zarámování a jazykové nebo národnostní skutečnosti. Jedná se např. o tyto znaky formy: 01 Teorie, 02 Kompendia, 03 Slovníky. Encyklopedie apod. Tyto znaky se pak připojují k hlavním znakům. DDC umožňuje i jemnější klasifikaci předmětů podle jazykových, etnických a zeměpisných hledisek, a to tak, že znak třídy, do níž příslušný předmět patří, se kombinuje se znaky tříd filologie a historie. Např. 920 – Životopisy, za tečku se pak přidá znak z určité oblasti (třídy), např. 920.1 – Životopisy filozofů. Dnes existuje již 7 tabulek pomocných znaků. Třídění Kongresové knihovny ve Washingtonu - Library of Congress Classification (TKK/LCC) Knihovna Kongresu USA ve Washingtonu patří k největším a nejvýznamnějším světovým knihovnám. R. 1900 bylo rozhodnuto vytvořit pro Knihovnu Kongresu vlastní klasifikaci, lze v ní zaznamenat výrazný vliv Cutterův, ale i Brunetův. LCC je „šitá na míru“ Kongresové knihovně. Užívají ji zejména akademické knihovny v USA a Velké Británii (cca více než 1.500 informačních institucí). Třídění Knihovny Kongresu USA má nyní nejlepší předmětové rejstříky (hesláře), které zpracovává agentura OCLC, neustále se vyvíjí a aktualizují. Jednotlivé hlavní třídy vycházejí ve zvláštních svazcích. LCC má i pomocné znaky k jednotlivým svazkům tříd, má i pomocné svazky, 48 svazků tříd. Vyšlo již několikáté vydání, klasifikace je neustále doplňována a vylepšována. Některé hlavní třídy mají vedle systematických tabulek také rejstříky, ale celkový rejstřík dosud vydán nebyl. V LCC rozlišujeme pět komplexů věd (všeobecnosti, filozofie, teologie, sociální, přírodní, užité vědy). Hlavní třídy jsou označeny velkými písmeny, druhá hierarchická úroveň je označena zdvojenými písmeny, další úrovně jsou numerické, podle potřeby několikamístné, přičemž je ponechán prostor pro nové pojmy. Počet tříd druhé hierarchické úrovně je značně nerovnoměrný a uplatňuje se v ní princip mnemotechničnosti notace. Systém jde do značné hierarchické hloubky. (V LCC se uplatňuje také katerizace [podle Cuttera], kdy dokument dostává ještě znak složený z velkého písmene a číslice zaznamenávající údaje o autorovi (např. E 5 – autor Einandi, protože „i“ znamená 5). Blissovo bibliografické třídění – Bliss classication (BBT/BC) Bliss byl knihovníkem v newyorské knihovně. Zabýval se hlavně problematikou bibliografické klasifikace, kterou však chápal jako systematický selekční jazyk určený pro účely bibliografické i knihovnické. Jeho třídění bylo spíše považováno za intelektuálskou klasifikaci bez nadějí na praktické použití, obnoveně se pak vydává za britsko-německé spolupráce, má být vzorem pro lékařství v MDT. Do Blissovy klasifikace se vkládaly velké naděje, že nahradí MDT a DDT. Ovlivnilo Ranganathana. Rozlišujeme: Bliss classification 1 – roky 1940 – 1953 – klasická klasifikace, Bliss classification 2 – r. 1977- plně fasetová klasifikace, spravuje Blissova klasifikační asociace. Bliss nazírá na universum lidského poznání ze čtyř paralelních hledisek, u každé vědy rozeznává horizontálně následující hlediska: filozofie – věda – dějiny vědy – technika a umění. Rozlišuje řadu základních tříd označených velkými písmeny, další hierarchické úrovně jsou rovněž označeny velkými písmeny, druhá úroveň má dvě velká písmena, třetí tři velká písmena. Existují i tabulky pomocných znaků. V Blissově třídění se uplatňuje princip alternativnosti – v literatuře se píše o různých předmětech z různých hledisek a připouští se alternativně uvádět takový předmět na tolika místech tabulek, kolik je potřeba k vyjádření všech hledisek. Ranganathanovo Dvojtečkové třídění a fasetové klasifikace - nazývá se též dvojtečková klasifikace (Colon classification – CC). Ranganathan patřil k nejvýznamnějším představitelům světového knihovnictví a vznikla celá škola jeho stoupenců a následovníků, kteří vytvořili tzv. Skupinu pro výzkum klasifikace. Byl knihovníkem univerzitní knihovny v Madrásu (Indie), kde uplatnil svou klasifikaci, založil zde také první knihovnickou školu v Indii. V oblasti selekčních jazyků jsou směrodatné dvě práce: Dvojtečková klasifikace a Úvod do knihovnické klasifikace. Ranganathan vystoupil proti tzv. enumerativním klasifikacím, které se snažily všechny jevy vyjmenovat, a místo toho použil tzv. kombinační princip, který umožňuje pomocí dvojtečky kombinovat různé pojmy, z nichž každý patří do jiné třídy. Ranganathanova klasifikace je postkoordinovaná klasifikace se slabou hierarchií. Ranganathan určil hlavní třídy označené velkými písmeny (A-Z), ale další klasifikaci (rozklad) již neprovádí. Místo hierarchického rozkladu podává řadu tabulek, v níž se uplatňují různé klasifikační charakteristiky. Provádí se fasetová analýza. Faseta je skupina nebo hledisko, předmět, který se z různých hledisek rozkládá do faset. Faseta je množina podtříd pro jednu členící charakteristiku, pro jedno hledisko - např. vozidla: faseta pro druhy vozidel (jednokolová, motorová...) faseta pro části vozidel (motor, kola...) apod. Z těchto faset se pak syntetizují komplexy předmětů. Znak se tedy tvoří ze znaku pro třídu a z faset. Fasety jsou shromážděny do kategorií, které určují pořadí, tvoří se tzv. fasetová formule. Vedle tabulek hlavních tříd a tabulek pomocných znaků existují nutně tabulky faset jednotlivých vědních oborů. Ranganathanova klasifikace se nazývá též analyticko-syntetickou. Jeho systém je složitý a náročný, ale zejména teorie fasetové analýzy má vliv na současné systematické SJ- jejich fasetizaci. Příklad znaku: L 25 : 42 : 3 . L je třída pro medicínu, následují fasety pro střeva, infekční nemoci a diagnostiku, tedy diagnostika infekčních nemocí střev. Knihovnicko-bibliografické třídění – Bibliotečno-bibliografičeskaja klassifikacija (KBT/BBK) Knihovnicko bibliografické třídění vzniklo v bývalém Sovětském svazu, protože MDT ideologicky nevyhovovalo. Vzorem byla sovětská marxistická klasifikace věd dle Kedrova. Základní třídy - velká písmena azbuky, poté pokračují čísla. Azbuka způsobila v mnohých zemích (včetně neazbučných zemí SSSR) značné problémy, proto byla později převáděna na numerickou notaci. Pokusy o zavedení byly i v ostatních satelitních zemích bývalého SSSR. Klasifikace speciálních druhů dokumentů: Klasifikační systémy norem a patentů * Normy ČSN - české normy se označují šestimístným číslem, které má tento význam: 1. a 2. číslo – třída (výrobní obor), je jich 100 (0-99), 3. číslo – skupina, 4. číslo – podskupina, 5. a 6. číslo – pořadové číslo normy. Např. ČSN 01 01 97 Bibliografické citace pojmy poř. číslo Mezinárodní normy ISO nemají jednotnou klasifikaci. Číslo za zkratkou ISO označuje pouze pořadové číslo normy. obecnosti * ISO normy (International classification for standards ICS) Mezinárodní klasifikace norem používá hierarchický pořádací systém, který má tři podřazené úrovně. 1. úroveň – pole, 2. úroveň - skupiny a 3 úroveň - podskupiny. Každé pole je tedy rozděleno do skupin a ty do podskupin. Notace je číselná = arabské číslice a slovní vyjádření. Pole je dvoumístné, nižší úrovně zahrnují notaci vyšší úrovně (stupňovité indexy). Pole mohou zahrnovat tyto oblasti: sektor ekonomický, technologie, činnost a věda. Nyní je polí 40. Klasifikace je obsažena jen v katalogu norem, tedy pro vyhledávání, není součástí čísla ISO normy. * Mezinárodní patentové třídění - patentová literatura je dosti rozsáhlá, a proto je potřeba ji třídit. Původně se tyto klasifikace vyvíjely podle specifických podmínek rozvoje průmyslu té, které země bez závislosti na ostatních tříděních a standardech ostatních zemí. Objevily se snahy po sjednocení třídění a vytvoření nového třídícího systému. Roku 1971 bylo vytvořeno Mezinárodní patentové třídění - MPT, označované jako „Int.Cl.“ (International Classification). postupně uvedeno v platnost. Bývá uváděno na titulním listě patentových spisů. Vycházely aktualizované tabulky každých 5 let, neměly rejstříky, 8. vydání z roku 2006 je již elektronické a byl aktualizováno průběžně.V letech 2006-2010 vychází v základní a úplné verzi. Od r. 2011 (9. vyd.) rozdělení ukončeno a tabulky revidovány každoročně – internetová verze: www.wipo.int/classificatoin/ipc[8] Je to notace smíšená, alfanumerická. Na první hierarchické úrovni se skládá z 8 sekcí, dále se dělí na třídy označené dvoumístným číslem, podtřídy označené dalším písmenem, pak následuje vlastní jemné třídění oddělené lomítkem (např. A01B1/24 = A - sekce, 01 - třída, B - podtřída, 1 - skupina, 24 - podskupina). 5. 6 Propojovací selekční jazyky a makroindexace Po 2. sv. válce šel vývoj pořádacích systémů, zejména univerzálních systematických i předmětových, rychle kupředu. Příznivci jednotlivých PS se přeli se svými konkurenty o přednostech svých systémů a nedostatcích ostatních. Nebylo ještě tehdy tolik složených témat, aby odborníci museli budovat něco zcela nového. Počet dokumentů se složenými a složitými tématy však rostl a na ně běžná předmětová pořádání a systematická - např. MDT nebo DDT, vždy prekoordinovaná, již nestačily. Reakcí byl vznik oborových - speciálních a postkoordinovaných předmětových PS. Do 70. let se velmi rozvíjely hlavně specializované deskriptorové systémy (tezaury). Zjistilo se ale, že používání specializovaných, resp. národních PS vede k dezintegraci informačních systémů, k bariérám v bibliografické komunikaci. K orientaci v PS bylo třeba nastudovat alespoň rámcově příslušný obor, resp. rozumět národnímu jazyku. Problém byl řešen tvorbou vícejazyčných tezaurů a univerzálních makrotezaurů, které by pojímaly celé univerzum lidského poznání. Řada termínů má však v různých oborech různý význam, obory mají především různou hierarchii pojmů. Jako výhodnější se ukázalo, že jedna univerzální klasifikace může spojovat jednotlivé specializované PS. Ty ale již nemají být enumerativní. Nejsou určeny k mikroindexaci, leč k makroindexaci - hrubému pořádání dokumentů, nebo k výměně velkých souborů, k třídění bibliografií apod. Vzniká nová rodina systémů makroklasifikací, jejichž zákl. principy jsou: Používají univerzální systematický PS hierarchického nebo fasetového typu. Mají jen několik hierarchických úrovní (zpravidla 3, maximálně 6); nejsou tedy dost jemné na podrobnou klasifikaci. (mikroklasifikaci). Notační báze nejvyšší hierarchické úrovně, neboli základní třídy jsou velmi široké (většinou 100 hlavních. tříd). Mnohé třídy nejsou obsazeny, ale rezervovány pro expanzi nových pojmů v budoucnosti. Hlavní třídy odpovídají současnému stavu poznání a praxe. Je zde daleko více místa pro užité vědy (výrobní činnosti) a interdisciplinární vědy (kybernetika, biomechanika). Některé tyto systémy umožňují rozvíjet svou strukturu a znaky dále a vytvářet tím specializované PS enumerativního typu - z makroindexace přejít na mikroindexaci. Mnohé z těchto klasifikací jsou zamýšleny jako propojovací SJ, např. k propojení různých národních i mezinárodních mikrojazyků, takže umožňují kompatibilitu informačních systémů. Postupně byly vybaveny tyto klasifikace spojovacími symboly, fasetami a nebo pomocnými znaky. Mezi nové typy univerzálních pořádacích systémů patří: Rubrikátory - klasifikační systém hierarchického typu, uplatňován v bývalých socialistických státech, rubrikátory vznikly v SSSR v souvislosti se soupisem rubrik, tj. označení tematických celků obsažených v referátovém časopisu VINITI. Vznikl tak Rubrikátor Mezinárodního systému vědeckých a technických informací (RMSVTI), což byla klasifikace oblastí vědy a techniky, národního hospodářství. Je to polytematická klasifikace s maximálně třemi úrovněmi hierarchie. Broad System of Ordering – klasifikace BSO - byla vytvořena pro systém UNISIST (pod UNESCO). Měla být opozicí k MDT, měla sloužit jako propojovací selekční jazyk „esperanto selekčních jazyků“, ale očekávání s touto klasifikací spojená se nesplnila. Představa, že by ji užívaly všechny významné knihovny světa, se tak stala utopií. Propojování pořádacích systémů jde spíše cestou vícejazyčných tezaurů a softwarového propojení katalogů velkých různojazyčných (jinonárodních) knihoven. Propojovače pořádacích systémů tohoto typu jsou již jen historií. BSO lze charakterizovat jako hrubou klasifikaci se slabou hierarchií, do značné míry se v ní uplatňuje fasetový princip. Klasifikace BSO je členěna do tří základních skupin věd: metodologické vědy, vědy podle stoupající komplexnosti, technika a produkty lidské činnosti. Notace je čistě numerická (kvůli mezinárodní srozumitelnosti), jen pro jména zemí je přijímán alfabetický kód. První hierarchická úroveň je trojmístná, druhá a třetí dvoumístná. Úrovně se oddělují čárkami. Notace tak má strukturu 3,2,2. BSO nemá pomocné znaky, ale tři fasety – času, místa a typu informačního pramene. Připisují se jako pomocné znaky. Jednotlivé znaky lze vzájemně kombinovat, spojovat pomocí spojovníku a nuly. Potenciálně velmi přesahuje možnosti hrubého systematického selekčního jazyka a lze jej dále rozvinout. Integrované pořádací systémy, resp. zvláštní druhy pořádacích systémů Spojují principy systematických PS a předmětových PS. * Věcné autority NK ČR mají slovní vyjádření spojené vždy se znakem MDT a skupinou Konspektu. * Pořádací systém Konspektu má 3 hierarchické úrovně, tj. 24 (v ČR 26) kategorií, cca 600 skupin, na nejnižší úrovni jsou pak předměty - podrobné slovní vyjádření, ty se ale v českých poměrech neuplatňují. Spojeny se slovním vyjádřením. Je to důležitý akviziční nástroj a nástroj ukazující profil fondu. Kategorie vytvořeny pro Konspekt, skupiny převzaty z DDC, u nás konvertovány do UDC (MDT). [Úkol k zamyšlení] Deweyho desetinné třídění užívají mimo jiné velmi bohaté a vyspělé země světa. Co je tedy pravděpodobnější? Bude se toto třídění dále užívat a šířit do dalších zemí, nebo spíše ustoupí jiným klasifikacím, o které nepečuje tolik bohatých zemí, ale jsou tam velmi oblíbené, například Mezinárodnímu desetinnému třídění ? Odpověď: Deweyho desetinné třídění má zřejmě dobrou perspektivu, finanční zázemí je důležité, je dokonce teoreticky možné, že zatlačí MDT z jeho tradičních knihoven a zemí. 6 Předmětové pořádací systémy a teorie předmětových poŘádacích systémŮ 6.1 Teorie a vývoj předmětových pořádacích systémů Víte již, že druhým základním typem věcného pořádání je předmětové pořádání (verbální pořádání) informací. V tomto případě se slovně vyjádřený obsah dokumentu nebo jeho části, informace v dokumentu obsažené, převádí do více či méně normalizovaných hesel nebo lexikálních jednotek (nepřesně jim běžně knihovníci říkají klíčová slova), která jsou v katalogu, databázi, rejstříku, kartotéce uspořádána abecedně. Při předmětovém pořádání informací i jejich vyhledávání je obsah dokumentu nebo informačního dotazu formulován pomocí jednoho či více slov. Obsahem dokumentu nebo informačního dotazu je míněn předmět ve smyslu tématu, popř. ve smyslu více témat nebo i jednotlivých informací. Předmětem dokumentu je téma, jímž se dokument zabývá, tedy vše, co je objektem zkoumání a literárního zpracování. Charakteristickými hledisky předmětu mohou být jeho dějiny, tj. okolnosti vzniku a vývoje, struktura, složení apod. Všímáme si i místa a doby, kde a kdy se věc udála. Důležitá je i forma, jakému okruhu čtenářů je dokument určen. Je třeba odlišovat hlavní téma dokumentu od vedlejšího tématu (témat). (Např. hlavním tématem je čištění důlních vod, vedlejším tématem použití biologických filtrů, háček je v tom, že uživatele některé knihovny mohou zajímat právě ty filtry, pak s pořadí důležitosti témat mění.) Od předmětové katalogizace se vyžaduje, aby jejím výsledkem bylo stanovení tématu dokumentu prostřednictvím tzv. nejužšího pojmu, jinak vyjádřeno dostatečně specifického pojmu, což je pojem, který je nejvěrohodnějším vyjádřením tématu dokumentu v tom smyslu, že byl zvolen právě tento pojem, a ne obsahově širší nebo užší. Kdyby indexátor volil širší, obecnější pojmy (což mají mnozí laikové touhu dělat), bude pod nimi zařazeno tolik záznamů, že uživatel ztratí přehled, navíc neví, jak obecný pojem indexátor zvolil, nemůže se „strefit“ do stejné úrovně. Neřadíme do oboru, na to je systematické pořádání, řadíme pod konkrétní předmět. Předmětové pořádání je velmi úzce spjato s problematikou jazyka, cílem je slovní vyjádření předmětu dokumentu. Proto považujeme předmětové pořádání za zřetelný jazykový problém. Význam mají otázky synonymie, homonymie a neurčitosti přirozeného jazyka. (To můžete blíže nastudovat v učebnicích češtiny nebo sémantiky.) Připomínám látku z první části opory. Jde o slova, která různě znějí, ale znamenají totéž (požárníci, hasiči, postele, lůžka), nebo slova, která se píší stejně, ale mají rozdílný význam (zámek u dveří, zámek jako budova, koleje jako internáty, koleje jako součást železničního svršku), slova jako moderní, chvíle, malý. Tyto jevy mohou činit potíže, důležité je, aby nebyl setřen původní význam sdělení autora a zároveň, aby nebyl setřen původní význam uživatelského dotazu. Oba používají přirozeného jazyka zatíženého vyjmenovanými vadami, mohou se lišit v terminologii. Proto se přirozený jazyk formalizuje a vytváří se řízený slovník, v němž je např. odstraněna synonymie pomocí odkazů, vysvětlena homonyma, ukázána příbuznost slov. Hlavní zásady pro předmětové pořádací systémy: Lexikální jednotky (slova) jsou tvořeny zpravidla podstatným jménem, nebo spojením podstatných jmen, podstatného a přídavného jména (výjimečně příslovce). Např.: plavání, šerm kordem, cvičení s kužely, česká házená, zrakově postižení. Slovesa se převádějí na podstatná jména: plavání, praní, čištění. Slova uvádíme v 1. pádě č. mn., není-li to nemožné, nebo neobvyklé - větry. Spojení slov (sousloví) tvořené přídavným a podstatným jménem nepíšeme s přídavným jménem na druhém místě, neinvertujeme. Výjimku tvoří nomenklaturní (odborné) názvy jako kyselina sírová, hřib smrkový a u většiny systémů též zeměpisná jména s označením světových stran, pokud nejsou součástí názvu, např.: Evropa jižní, Morava severovýchodní = tzv. substantivní inverze, ale (!) Jižní Amerika (jde o název kontinentu). Jména osob a korporací se zapisují podle pravidel RDA. Zeměpisné názvy podle pravidel pro geografické autority Národní knihovny ČR. Je třeba omezovat výrazy bez klíčového významu (s malou informační hodnotou), např.: základy, problémy, metody, principy x pozor: neplatí pro terminologická sousloví: např.: Dopplerův princip, metoda Monte Carlo. Vyhýbáme se neurčitým (vágním slovům). [Úkol k zamyšlení] Je vhodné použít k označení tématu dokumentu termín (heslo) moderní oděvy ? Bude toto heslo aktuální třeba za deset let, nemůže čtenáře spíše zmást ? Není lepší použít heslo oděvy – 2011 ? Lze použít pro označení tématu dokumentu termín (heslo, klíčové slovo) malé podniky, když máme přesně v poznámce vymezeno, co termín znamená, tj. kolik mají zaměstnanců, jaký mají roční obrat, nebo musíme termín považovat za neurčitý (vágní) a musíme se mu proto vyhýbat ? Odpověď: Slovům s neurčitým významem se musíme vyhýbat, protože mohou uživatele mást, znejišťovat. Slovo moderní lze nahradit konkrétním časovým údajem, např. oděvy a rok 2011. Pokud můžeme poznámkou pro uživatele přesně význam vymezit (kvantifikovat, interpretovat), pak užití takového slova nic nebrání, to platí i pro malé podniky. 6. 2 Pořádací systémy založené na slovech z názvu dokumentu 6.2.1 Názvy publikací Název je identifikační prvek a u populárních publikací je jako obsahová charakteristika problematický. Názvy mohou být obrazné nebo nevýstižné. U názvů naučných publikací nelze hovořit o zcela přirozeném jazyce, jazyk autora je slovníkově a stylisticky normalizován určitými předpisy redakce a terminologií dané vědy. Záleží také na době vzniku, terminologie se postupně vyvíjí. Odborná terminologie autora může být obecně přijímána, může být originální, nebo subjektivní. Podle stupně formalizace rozlišujeme názvy: a) logicko-matematické vědy (nejvíce formalizováno), b) přírodní, technické a některé společenské vědy jako lingvistika nebo právo, c) ostatní společenské vědy - základní masa termínů je užívaná jen praxí, bez podložení obecně užívanou definicí, tzv. nepřesné vědy. Účel názvu: vyjadřovat stručně tematiku dokumentu, nápadnou stylizací upoutat pozornost čtenáře, ztráta přesnosti bývá kompenzována podnázvem, existuje snaha unifikovat názvy prostřednictvím požadavků na autora; v názvu a podnázvu je obsaženo až 80 % klíčových slov a jejich užitím můžeme získat až 90 % relevantních záznamů, u publikací s širší tematikou může relevance klesnout až na 30 %, v technických vědách je výstižnost názvu až 86 %, ve společenských vědách 46 %. Tyto poměry označujeme jako informační sílu názvu. 6.2.2 Předmětové pořádací systémy založené na názvech dokumentů * Názvové katalogy a názvové rejstříky – u beletrie pomáhají názvové katalogy pouze při identifikačním pořádání a selekci podle slov z názvu – pomocná funkce; u naučné literatury v některých zemích byly i hodnotným věcným katalogem jako tzv. Stichwortkatalogy nebo Stichwortregistry, resp. součást slovníkových (křížových) katalogů (dictionary catalogue). Název se v katalogu vyskytne tolikrát, kolik významných (klíčových) slov obsahuje. Každé klíčové slovo se musí ocitnout v záhlaví. Např. (převedeno do češtiny) název dokumentu Význam distančních studijních opor pro knihovníky : Význam distančních studijních opor pro knihovníky - Distančních studijních opor pro knihovníky, význam - Studijních opor pro knihovníky, význam distančních - Opor pro knihovníky, význam distančních studijních - Knihovníky, význam distančních studijních opor pro. * Rotované rejstříky - označujeme je též jako cyklické, permutované rejstříky. Stejný princip posloužil k počítačově zpracovávaným rejstříkům k bibliografiím, tezaurům apod. Byly velmi rozšířené, dnes při online bázích jsou již dosti na ústupu. Nejznámější jsou rejstříky KWIC (Key Word in Context) – základem jsou názvy dokumentů, které jsou sepisovány pro účely nějaké bibliografie. Tyto rejstříky vycházejí opět z přesvědčení, že název vědeckého dokumentu vyjadřuje v dostačující míře obsah. Z názvu dokumentu jsou vybírána tzv. klíčová slova, která mají funkci selekčního údaje a jsou uspořádána abecedně. Klíčové slovo je obklopeno kontextem názvu, předcházejícími i následujícími slovy. Každý název je uveden v rejstříku tolikrát, kolik má klíčových slov. Klíčová slova jsou umístěna zhruba na počátku druhé poloviny textu za mezerou (optická řeka). První rejstřík KWIC u nás sestavil Výzkumný ústav hygieny záření (60. léta). Dále KWOC (Key Word Out of Context) – klíčové slovo vyňato z názvu, uvedeno na zvláštním řádku, většinou posunuto doleva, nebo jinak zvýrazněno. Pod ním následují v abecedním sledu všechny názvy, v nichž se dané klíčové slovo vyskytuje. Obvyklý je tzv. negativní slovník vylučující nevýznamná a nevýznamová slova. K nedostatkům těchto předmětových selekčních jazyků patří: název vždy nevystihuje v postačující míře obsah dokumentu, jako klíčová slova jsou používána různá pojmenování téže věci, tedy synonyma, je třeba hledat pod různými synonymy, nejsou vyjádřeny hierarchické vztahy, v informační paměti mají příliš velký rozsah. Výhody: krátkost času, v němž jsou rejstříky zpracovány, klíčové slovo vidíme hned v kontextu s celým názvem. S rozvojem plnotextového vyhledávání rejstříky ustupují z používání 6. 3 Pořádací systém předmětových hesel Předmětová hesla jsou tradičním předmětovým selekčním jazykem. Hesla se skládají z jednoho nebo několika výrazů – členů. Jednotlivé členy oddělujeme pomlčkou. Každý člen může být jednoslovný, nebo může být tvořen slovním spojením. Hlavní (nejdůležitější, obsah nejvíce vystihující) pojem hesla stojí na prvním místě, může být dalšími členy zužován postupně.(upřesňován). Obvykle se ještě vyjadřuje formálním podheslem forma nebo typ dokumentu. Předmětové lístkové katalogy v Česku byly založeny na zásadách ČSN 01 0188 Tvorba předmětových hesel vydané v roce 1982[9]. Norma byla bez náhrady zrušena v r. 2003. Tato hesla používala tzv. substantivní inverzi (obrácený slovosled) v souslovích = podstatné jméno je první, přídavné jméno jako druhé. To mělo zajistit, aby hesla byla řazena podle hlavního významu a přívlastek vyjádřený přídavným jménem byl druhý v pořadí. Např: letadla bojová, bombardovací, dopravní, nákladní, sportovní , vojenská…. Nyní předmětová hesla u nás používají jen velké knihovny a pravidla jsou jiná, slovosled v sousloví je přirozený. Hesla jsou kratší a používají více sousloví. Metodikou nebo vzorem jsou jim PHNK = Předmětová hesla Národní knihovny, která tato knihovna začala užívat od r. 1998, kdy opustila ČSN. Vzorem (nikoli důsledně dodržovaným) pro tato hesla jsou LCSH = Library of Congress Subject Headings – podle amerických pravidel z r.1991. Hesla jsou užívána nebo jsou vzorem ve více než ve 20 zemích světa, tvůrcem Kongresová knihovna ve Washingtonu, má nad 5 milionů hesel. Počítá se s tím, že se hesla budou fasetovat a vznikne metatezaurus (univerzální tezaurus, heslář). Byla opuštěna (s určitými výjimkami ) inverze a heslo se proti české normě zkracuje. Pravidla: LC Subject Cataloguing a Manual : subject Headings, Washington, 1991. I tato hesla se vždy mohou skládat z řetězců, předem uspořádaných částí oddělených pomlčkou. Maximálně však tříčlenných. Části po pomlčce říká Národní knihovna zpřesnění (tématická, chronologická, geografická). Formální podheslo se podle metodiky Národní knihovny píše do zvláštního pole a je nazýváno formální deskriptor. Struktura hesla: kurzívou uvedeny pouze příklady • téma sociální péče • téma - téma nemocnice - financování • téma – čas česká architektura – 21. století • téma – místo – čas hudba – Česko – 16. století • místo – téma - čas Polsko – dějiny - 1900-1945 Úplný výčet možných kombinací v hesle: téma; téma - téma; téma – místo; téma – čas; téma – místo – čas; místo; místo – téma; místo – čas; místo – téma- čas; téma – téma – čas. Zpřesnění, tedy podhesla (zpřesňující části po pomlčce), jsou pevně daná v souboru vystaveném Národní knihovnou: http://autority.nkp.cz/vecne-autority/soubor-tematickych-autorit/tematicka-zpresneni[10] Substantivní inverze – první je uváděno podstatné jméno a druhé přídavné jméno. V některých přirozených jazycích se začíná podstatným jménem přirozeně ( např. polština, románské jazyky). Ve 20. století se i u nás uplatnila substantivní inverze, vychází z názoru, že podstatné jméno je hlavním nositelem významu a přídavné jméno je jen přívlastkem. (Výjimku mohou tvořit terminologické frazeologismy, např. slaměná vdova, bílý trpaslík, černá díra, naopak obecně přijímána je inverze v nomenklaturních názvech (odborném názvosloví typu medvěd hnědý, smetánka lékařská, kyselina sírová). Koncem 20. století se ovšem prosadila myšlenka, že je to zbytečná a nepřirozená formalizace jazyka. Nástupem počítačů se usnadnilo hledání i druhého slova z výrazu. Proto se v současné době prosadil přirozený slovosled ! Předmětový heslář Heslář je slovník (seznam, báze) lexikálních jednotek SJ používaný k prekoordionovanému pořádání a vyhledávání dokumentů (může být řešena synonymie, homonymie a asociace). Předmětový heslář (abecední seznam použitých prvků předmětových hesel) byl nezbytnou pomůckou pro vytváření předmětových hesel, s nástupem elektronických katalogů se přestal používat, místo toho se buduje soustava věcných autorit, resp. se konzultuje soubor národních věcných autorit viz: http://sigma.nkp.cz/F/?func=file&file_name=find-a&local_base=aut[11], resp. na stránkách NK ČR najděte: Další databáze NK ČR a tam bázi Národní autority (AUT). Mezi hesláře vlastně patří Vám již známý patří i LCSH (Library of Congress Subject Headings) a PSH (dozvíte se později) nebo MACS (Multilingual Access to Subjects) přímé propojení tří polytematických heslářů LCSH =angličtina RAMEAU (Répertoire d’autorité-matiére encyklopedique…. = francouzština a SWD Schlagwortnormdatei) - němčina) Autorita – závazná forma zápisu selekčního údaje vybavená odkazy a poznámkami. Soubor autorit – abecedně uspořádaný slovník selekčních údajů vytvářený katalogizační agenturou, který je určen k pořádání a vyhledávání dokumentů. Obzvláště je výhodný při sdílené katalogizaci. Např.: autorita: krajinná ekologie nadřazený výraz: krajina ekologie nepreferovaná forma: ekologie krajiny zdroj: (encyklopedie, slovník) Stručné dějiny hesel: Předmětová hesla jsou mladší než systematické pořádací systémy (klasifikace), s předmětovými hesly v pravém slova smyslu a s jejich teorií se setkáváme až v 19. století. Počátky lze vidět v řazení anonymních děl, která se zařazovala pod nejdůležitějším slovem názvu, k systematickým katalogům se vytvářely předmětové rejstříky. Vznik předmětového katalogu je spojován se jménem Adrien Baillet (17. stol.), který zpracoval soukromou knihovnu předsedy francouzského soudu a sestavil pravidla katalogu. Vzhledem k obsahu právnické literatury zvolil právě PK. Na něj navazuje především Martin Schrettinger (17./18. stol.) ve dvorní knihovně v Mnichově. Napsal dvoudílnou příručku. Ve 2. díle je část Realkatalog věnovaná PK. Uvědomuje si subjektivitu při jeho tvorbě, a proto kromě pravidel požaduje, aby jej vytvářela jen jedna osoba. U mezijazykových synonym dává přednost němčině před latinou, požaduje dodržovat nejužší pojem. Považován za zakladatele teorie PK. Důležitý je pak vývoj v USA, zde Charles Ami Cutter vydal v r. 1876 Rules for dictionary catalogue, tedy pravidla slovníkového (křížového) katalogu (jeho součástí je i PK). V pravidlech nalezneme podrobná pravidla pro PK. Opět razí zásadu nejužšího pojmu a určuje pravidla pro jednotlivé druhy hesel, řeší synonymii, zabývá se inverzí přídavného jména. Pražská univerzitní knihovna měla již v 19. století rozsáhlý (ale německý) předmětový katalog. Zásluhu má ředitel Antonín Spirk. Byl nejen největší své doby, ale budován více generacemi knihovníků, ne jedou osobou. Značně propojen odkazy. Ve vývoji jazyka předmětových hesel u nás rozlišujeme tři mezníky: * Období 1. republiky: První český katalog založil Jaromír Borecký, první ředitel české Univerzitní knihovny v Praze. Vydání prvních českých pravidel: Pravidla heslového katalogu z r. 1924[12]. Jsou určena pro vědecké a administrativní knihovny, protože autor byl ředitelem knihovny parlamentu. Vlastně šlo o překlad německých pravidel Gottfrieda Zedlera. Dočkala se více vydání. * Období, kdy se prosazovala substantivní inverze v souslovích: Prozatímní pravidla předmětového seznamu z roku 1952[13] - vychází z nich většina lístkových předmětových katalogů v našich knihovnách, uplatňovala již substantivní inverzi. Drtinův předmětový katalog z roku 1957 - polemická práce, která se snaží vyhovět našim pravidlům a sovětským vzorům, neměla příliš praktický význam pro katalogizaci. ČSN 01 0188 Tvorba předmětových hesel – poslední české standardy, jak jste se již dozvěděli, platnost normy vypršela, nová pravidla na mi nenavázala, NK ČR jako nejvyšší metodické pracoviště upřela svou pozornost jinam. Norma je zcela v duchu substantivní inverze, kontinuita zpracování podle Prozatímních pravidel není vlastně ale přerušena.^ * Období zcela nových hesel ovlivněných LCSH:^ PHNK – ^ předmětová hesla Národní knihovny (koncem 90. let 20. stol.) – nový trend podle LCSH, řídí se jen metodickými pokyny NK; dodržuje se přímý slovosled ve spojení substantivum, adjektivum.^ [Cvičení] 1. PHNK může mít strukturu místo – téma – čas. Zkuste vytvořit heslo na téma dějiny Maďarska v 19. až 20. století. Časové rozpětí pište ve tvaru: 19.-20. stol. Jde o vysokoškolskou učebnici, v jakém čísle bude formální deskriptor (podheslo) ? 2. Jiná struktura pro PHNK je téma – místo – čas. Zkuste vytvořit heslo na téma hudba na Slovensku v 16. století, jedná se o studii. 3. Kratší řetězec PHNK může mít strukturu téma – téma. Vytvořte heslo s tématikou psychologické problémy výživy. Pro výživu použijte termín řízeného slovníku (tzv. věcnou autoritu) výživa člověka. Pro psychologické problémy řízený termín tématického zpřesnění (autoritu) psychologické aspekty, jinak řečeno, sousloví psychologické problémy PHNK nepoužívají, nahraďte je proto doporučeným souslovím psychologické aspekty. Jedná se o populárně naučnou publikaci. Řešení 1. Maďarsko – dějiny – 19.-20. století učebnice vysokých škol (mn. číslo) 2. hudba – Slovensko – 16. století studie 3. výživa člověka – psychologické aspekty populárně-naučné publikace 7 Postkoordinované předmětové pořádací systémy 7.1 Postkoordinované pořádání Princip koordinovaného (postkoordinovaného) indexování má velmi staré předchůdce, již ve starém Sumeru na hliněných tabulkách se našlo pořádání nemocí podle příznaků. Stejný princip koordinovaného indexování v nové době používal i americký ornitolog H. Taylor, který získal v r. 1915 patent na průhledové karty. Jedním z prvních, kdo tuto metodu užili k vyhledávání informací, byl W. E. Batten, vytvořil selekční systém pro patenty pomocí průhledových karet v r. 1939. Americký matematik C. Mooers si nechal v r. 1947 patentovat systém mechanické selekce dokumentů, jako první použil výraz deskriptor. Je tvůrcem i dalších názvů, jako vyhledávání informací (information retrieval), selekční systém (information retrieval system), selekční jazyk (retrieval language). O rozvoj koordinovaného indexování se zaloužil i M. Taube se svým systémem unitermů. – r. 1951. Poskoordinované indexování se s předmětovými hesly shoduje pouze v tom, že i u nich je téma dokumentu získáno obsahovou analýzou a vyjádřeno množinou slov z přirozeného jazyka. Zásadní rozdíl oproti předmětovým heslům je v tom, že tato množina není uspořádána v záznamu dokumentu, ale naopak jednotlivá slova a slovní spojení vystupují do informační paměti nezávisle, neuspořádaně. Výhody se pak projeví na výstupu, při selekci informací. I uživatelský dotaz je takto formulován. Koordinované indexování však může vést k tzv. selekčním šumům. V neuspořádané množině klíčových slov nemusí být vůbec zřejmé, jak jsou slova mezi sebou propojena, a vyhledán tak může být dokument, který neodpovídá dotazu. Aby se tomu zabránilo, zavádějí se tzv. spoje a role, neboli indikátory spojů a rolí. Poukazují na to, která klíčová slova k sobě patří. Podle toho, jak důkladně jsou selekční jazyky tohoto typu vybaveny gramatikou, rozlišujeme selekční jazyky s gramatikou a bez gramatiky (jednodušší, proto daleko obvyklejší). 7.2 Volná a řízená indexace Menší knihovny a odborné knihovny nepoužívají zápis v řetězcích (hesla), ale používají jednotlivé slovní lexikální jednotky (nepřesně nazývané klíčová slova) (jde o postkooordinovaný systém) ukládané do paměti počítače, které se dají různě při vyhledávání dokumentu kombinovat operátorem „and“ (zároveň) a „or“ (nebo). Pokud jde o univerzální knihovny, pak jde buď o tzv. volně tvořená, nebo řízená „klíčová slova“ – volnou indexaci, nebo řízenou indexaci. Vždy ale je třeba dodržovat základní zásady předmětové katalogizace: Za lexikální jednotku vždy volíme substantivní tvar buď jednoslovný, nebo rozvinutý (pastevečtí psi, francouzská literatura), může jít i o předložkovou vazbu nebo vazbu se spojkou (práce se čtenářem, cvičení na nářadí). Problematice spojů a rolí se obvykle vyhýbáme dodržováním komplexností termínů jako u národních věcných autorit (rodina a škola, křesťanství a filozofie). Dodržujeme přirozený slovosled. Upřednostňujeme nejnovější pravopis, cizí slova v jiném písmu se přepisují do latinky, počitatelná substantiva se uvádějí v plurálu, abstrakta, názvy vědních oborů apod. v singuláru. Cizojazyčné výrazy ve většině knihoven užíváme jen, neexistuje-li rovnocenný český výraz, je-li termín běžně používán. Zkratky se obvykle rozepisují a odkazují. Pro lexikální jednotky všech předmětových PS je důležitý model IFLA FRBR = Functional Requirements for Bibliographic Records (Funkční požadavky na bibliografické záznamy) , kterou publikovala IFLA (International Federation of Library Associations and Institutions) a modely FRAD = Functional Requirements for Authority Data (Funkční požadavky na autoritní data/záznamy), FRSAD = Functional Requirements for Subject Authority Data (Funkční požadavky na předmětová autoritní data/záznamy). Volná indxace: Lexikální jednotky postkoordinovaného selekčního jazyka (jedno, nebo víceslovné) vyjadřující obsah dokumentu (základní i dílčí tématiku). Tvořeny indexátorem na základě obsahové analýzy (někdy i bez ní) dokumentu a neopírající se o řízený slovník. V případě volně tvořených klíčových slov indexátor (katalogizátor) neodstraňuje nepřesnosti přirozeného jazyka vůbec. Práci při volné indexaci máte tedy daleko snazší, ale její výsledky nejsou valné. Lexikální jednotky mohou být vybírány přímo z názvu a textu, tomu se pak říká odvozená indexace, slovní indexace, skutečně se jedná o klíčová slova z textu. Řízená „klíčová slova“ - řízená indexace: Indexátor se po obsahové analýze snaží odstranit pragmaticky nejdůležitější nejednoznačnosti: nepoužitá synonyma, vysvětlit homonyma,vyjádřit důležité nadřazené a podřazené výrazy, používá tzv. řízený slovník. Např. dětské lékařství – nepreferovaný výraz pediatrie, nadřazený výraz lékařství, příbuzný výraz děti, dětské infekční nemoci; nebo zámky - zámky (zámečnictví), zámky (budovy), příbuzný výraz hrady, příbuzný výraz paláce atd.. Termíny jsou tedy vybírány z předem definovaného selekčního jazyka (ze slovníku), proto se metoda nazývá pojmová indexace; vybíráme jen pojmy, ale vyjadřujeme slovy z řízeného slovníku. Univerzální veřejné knihovny se nemusí trápit s vytvářením řízeného slovníku samy, mohou přejímat termíny, nebo se alespoň ve své práci inspirovat řízeným slovníkem, který se nazývá národní věcné autority a který vytváří v součinnosti s dalšími knihovnami Národní knihovna ČR: http://sigma.nkp.cz/F/?func=file&file_name=find-a&local_base=aut[14] . O tom jsme již hovořili při tvorbě předmětových hesel. [Úkol k zamyšlení] Pokud katalogizátoři používají volnou indexaci, jsou většinou silně ovlivněni slovníkem autora nebo svým vyjadřováním. V takovém katalogu pak jednou dokumenty jsou zařazeny pod hasiče, jindy pod požárníky, jednou pod kvalitu, jindy pod jakost. Pod slovem koleje jsou budovy i konstrukce železnice. Co musí udělat uživatel, chce-li vidět záznamy všech dokumentů? Odpověď Uživatel je nucen přemýšlet, jakými všemi termíny může být předmět dotazu označen, pokud jde o homonyma, pak musí podle názvu odhadnout, o jaký význam slova v kterém záznamu dokumentu jde, vlastně prohlédnout všechny záznamy pod homonymem. 7.3 Unitermy S unitermy se seznámíme spíše jen pro doplnění historického vývoje postkoordinovaného pořádání. Rozdíl mezi unitermy a deskriptory (o těch se dovíte v následujícím oddíle) je v tom, že unitermy nikdy nepoužívají plně řízený slovník a všechny jsou na stejné hierarchické úrovni. K jejich rozvoji přispěl Američan Mortimer Taube. Uniterm je klíčové slovo, které spolu s dalšími slovy vyjadřuje obsah dokumentu. Někdy je převzato z názvu, jindy formulováno na základě obsahové analýzy. Většinou jsou vyjádřeny jediným slovem, slovní spojení se připouští jen ve zdůvodněných případech. Mohou (ale nemusí) být vybaveny odkazy, odstraňující synonymii a homonymii. Všechny stojí na stejné hierarchické úrovni. Systém unitermů je většinou používán pro pořádání, ukládání a vyhledávání dokumentů z vymezené oblasti, kdy je možné vystačit s omezeným počtem unitermů, tedy ve specializovaných odborných informačních institucích. Každý dokument dostane adresu, nebo kód v podobě několikamístné číslovky a je jím zapisován na zvláštní unitermovou kartu s jedniným unitermem.. Karty jsou uspořádány abecedně podle unitermů. Při vyhledávání se porovnává soubor unitermů dotazu se souborem unitermů, jimiž byl vyjádřen obsah dokumentu, hledají se shodné kódy (čísla). Takto se realizovalo nejčastěji mechanizované vyhledávání, lze ovšem využít i při automatizovaném vyhledávání, ale přednostně se v automatizaci používá následující systém. 7.4 Deskriptorový selekční jazyk (pořádací systém) Odborné knihovny řízený slovník selekčního jazyka potřebují vést velmi přísně a přesně, aby řazení a následné vyhledávání bylo co nejúčinnější, aby se odborník při svém dotazu vždy „strefil“, tedy nalezl dokumenty, informace relevantní svému dotazu. Takovému přísně řízenému slovníku, v němž jsou zachyceny všechny potřebné vztahy mezi lexikálními jednotkami (mezi termíny) včetně ukázání hierarchických vztahů mezi lexikálními jednotkami a vysvětlena homonyma (slova, která mohou nabývat více významů), se říká tezaurus a selekčnímu jazyku, kterému slouží, pak deskriptorový jazyk. Tezaurus pak je abecedně uspořádán, deskriptory vytvářejí samostatné odstavce, v nichž jsou pod vlastními deskriptory uvedena jejich synonyma (ekvivalenty, nedeskriptory) a dále slova a slovní spojení spjatá s deskriptorem vztahem nadřazenosti, podřazenosti, příbuznosti (paradigmatika). U každého z nedeskriptorů je odkázáno na příslušný deskriptor, rovněž u asociovaných deskriptorů je uveden deskriptor. Rozeznáváme jednojazyčné a vícejazyčné tezaury, resp. i víceoborové makrotezaury. Tezaurus se skládá z úvodní části (obsahuje titulní list a vlastní úvod) a slovníkové části. Slovníková část se skládá ze soupisu lexikálních jednotek (tedy deskriptorů a nedeskriptorů), uspořádaných podle různých hledisek. Musí obsahovat soupis všech lexikálních jednotek, který tvoří deskriptorové a nedeskriptorové odstavce v abecedním pořadí. Doplňkovými prvky jsou systematický rejstřík, resp. i rotovaný rejstřík, jiné rejstříky nebo seznamy, grafická pole, sémantické mapy apod. Lexikální jednotky tezauru musí být uváděny ve standardní gramatické formě a musí být doprovázeny odkazy na své vztahy (vztahy ekvivalence, hierarchie, asociace). Ukázka odstavce z tezauru podle ČSN 01 0193 Pokyny pro vypracování a rozvíjení jednojazyčných tezaurů[15]. V závorkách je vysvětlení, které pochopitelně v tezauru nenajdete. Velkými písmeny jsou psány deskriptory, tedy termíny, které se užívají k indexaci, malými písmeny pak nedeskriptory, vyloučené termíny, synonyma, ekvivalenty: • LETADLA TĚŽŠÍ VZDUCHU • ekv aerodyny (synonymum) • nd LETADLA (nadřazený termín) • pd BEZMOTOROVÉ LETOUNY (podřazené termíny) • LETOUNY • VRTULNÍKY • ad LÉTÁNÍ (příbuzný termín) Tvorba tezaurů: · deduktivní metoda - lexikální jednotky se excerpují z dokumentů v přípravné fázi. Vyberou se tématická synonyma a přiřazují se užší termíny. · induktivní metoda - lexikální jednotky jsou vřazovány v procesu indexace a hledají se nadřazené termíny. Normy pro jednojazyčné i vícejazyčné tezaury jsou revidovány a sloučeny do nové ISO 25964[16] Zatímco přírodovědci jsou zvyklí v souvislosti s klasifikací a pořádáním názvů organismů na termín taxonomie, IT (specialisté na informační technologie) odborníci prosazují v prostředí internetu termín ontologie. Ontologie umožňují představovat nejbohatší strukturu obsahů (pojmů) a vztahu mezi nimi. Je to také jakýsi slovník, který se skládá z glosáře (definice pojmů) a tezauru (definice vztahů mezi jednotlivými pojmy). Vlastním zájmem ontologie je realita, kterou se snaží vyjádřit natolik explicitně, aby to bylo srozumitelné i počítačovým programům. Touto ambicí se ontologie přibližují k oblasti umělé inteligence. Naproti tomu nejjednodušší pořádání odborné terminologie, resp. odborných informací je tzv.folksonomie. Princip, kdy sami uživatelé na internetu, nebo v katalogu označují pojmy, tedy věcný obsah dokumentů tzv. tagy (popisky, laickými klíčovými slovy) a sami si termíny případně i řídí. (Folksonomie je součástí fenoménu Web 2.0.) Tezaury jsou úzce vázány na odbornou terminologii, makrotezaury (metatezaury) zahrnující celé poznání (více než jeden obor) narážejí na velké obtíže. Jednou z cest, jak vytvořit řízený slovník podle jednodušších zásad, než je ČSN 01 0193, může být Polytematický strukturovaný heslář (PSH) Národní technické knihovny: „ Polytematický strukturovaný heslář je česko-anglický řízený a měnitelný slovník lexikálních jednotek. Slouží k vyjádření věcného obsahu dokumentů a ke zpětnému vyhledání dokumentů na základě věcných kritérií a je určen především pro knihovny s polytematickými fondy.“ Můžete si jej prohlédnout na: http://www.techlib.cz/cs/katalogy-a-databaze/psh/prohlizeni-psh/[17] Heslář je zdarma poskytován do knihoven, pokud knihovna nechce pracovat se souborem národních autorit, je možno stáhnout si do katalogu tento heslář. Takže možností, jak používat kvalitní řízené slovníky, je více, uchylovat se k volnému indexování není zřejmě nutné, i když katalogizátoři bývají obvykle v časové tísni. [Cvičení] Řízený slovník má vždy za základ preferovaný (použitý) termín a pod ním nalezne uživatel odkazy na termíny nadřazené, podřazené, příbuzné a nepreferované (nepoužité, vyloučené, zakázané). Ne vždy ovšem všechny tyto odkazy lze použít. Tučně Vám uvádím preferovaný termín a k němu termíny, které s ním významově nějak souvisí, určete prosím, jak. Na výběr máte: nadř. termín, podř. termín, příbuzný termín, nepreferovaný termín. Například zadáme: středoškolští studenti k tomu studenti, talentovaní středoškolští studenti, středoškolští učitelé, žáci, střední školy, studenti středních škol. Sestavte do slovníku. Výsledek : středoškolští studenti nadř. t. studenti podř. t. talentovaní středoškolští studenti příb.t. střední školy příb.t. středoškolští učitelé příb.t. žáci netref. t.studenti středních škol Někdy píšeme i poznámku k významu termínu (tu po Vás nikde nechci, zde ale někdy je nutná) např. u termínu žáci: Žáci jsou v nejširším smyslu všichni, kdo se vzdělávají ve školských zařízeních, v užším smyslu děti navštěvující základní a střední školu. Užíváme pouze ve smyslu žáci základních škol. Váš úkol: Vřaďte do struktury řízeného slovníku lžíce, k nim přiřaďte termíny: příbory, nože, vidličky, stříbrné lžíce, čajové lžičky Vřaďte do struktury řízeného slovníku zámky (budovy), k nim přiřaďte termíny: hrady, paláce, tvrze , budovy Vřaďte do struktury řízeného slovníku drůbež, k ní přiřaďte termíny: domácí ptactvo, slepice, husy, kachny, krůty, domácí zvířata. Vřaďte do struktury řízeného slovníku Venuše (planeta), k ní přiřaďte termíny: planety sluneční soustavy, Jitřenka (planeta), Večernice. Je Venuše (bohyně) příbuzný termín ? Rešení: Lžíce – nadř.↑ příbory; příb. nože, vidličky, čajové lžičky, podř. stříbrné lžíce (případně sem lze přesunout i čajové lžičky) Zámky (budovy) – nadř. budovy; příb. hrady, paláce, tvrze Drůbež – nadř. domácí zvířata; nepref. domácí ptactvo; příb. slepice, husy, kachny, krůty Venuše (planeta) – nadř. planety sluneční soustavy; nepref. Jitřenka (planeta), Večernice; pokud rozlišíme homonymum Venuše závorkovým výkladem, je příbuznost obou Venuší velmi vzdálená (jen v mytologii) 8 PoŘádací systémy v bibliografických databázích 8.1 Databáze a katalogy V současnosti se věcné pořádací systémy používají především v bibliografických databázích. Bibliografické databáze jsou charakteristické tím, že datovou základnu tvoří bibliografické informace, obsahují bibliografické záznamy, případně i plné texty dokumentů. Jde jednak o elektronické katalogy knihoven a jednak o oborové databáze (včetně plnotextových) zpřístupňované databázovými centry, resp. zdroje na internetu. V národním Souborném katalogu ČR (CASLIN), resp. i v katalozích velkých knihoven (především krajských knihoven), které mají v tomto katalogu nejvyšší váhu, najdeme vlastně kompletní soubor systémů pořádání u nás užívaných. Jednak znak Konspektu (předmětovou skupinu), což je typická makroklasifikace; dále znak MDT, buď jde o znak z tabulek MDT-MRF, nebo o hrubší třídění z tabulek Vybraných znaků; dále zde najdeme předmětová hesla podle metodiky PHNK a případně i lexikální jednotky řízené indexace (tedy postkoordinovaný jazyk), oba předmětové PS používají termíny ze souboru národních věcných autorit. Pokud tyto knihovny dokument nemají, pak se teprve v souborném katalogu ocitají záznamy jiných knihoven s nižší váhou a s odlišným věcným zpracováním. Především zde chybí prekoordinovaná předmětová hesla. Obecně se dá říci, že menší univerzální knihovny používají „klíčová slova“, čímž jsou myšleny lexikální jednotky řízené, v horším případě volné indexace. Speciální knihovny většinou používají systém deskriptorů, které se opírají o oborové tezaury, jež zpřístupňují jejich ústřední knihovny nebo databázová centra. Případně mohou užívat MDT v různém rozsahu (různé tabulky), Mezinárodní patentové třídění apod. Česká národní bibliografie Knihy vychází z katalogu NK ČR, u článkové národní bibliografie je situace obdobná jako v Souborném katalogu ČR. Odborné elektronické bibliografické databáze (on line, nebo na CD-ROM) používají většinou vlastní věcné systémy pořádání, výjimečně MDT a v poslední době lze hledat i podle „klíčových slov“ přirozeného jazyka, volného slovníku. Pokud jde o systematické PS, pak se používají jen klasifikace pro hrubé třídění oborů (makroklasifikaci), tyto klasifikace vznikly z označování témat v referátových časopisech. Jemné vyhledávání se provádí podle tezaurů (PS deskriptorového typu). Chceme-li s databází pracovat, musíme znát deskriptory. Např. Národní lékařská bibliografie používá tezaurus MeSH (Medical Subject Headings). Tento tezaurus vznikl v Národní lékařské knihovně v Bethesdě (USA). Tezaurus pochází z databáze MEDLINE (z časopisu Index Medicus). Struktura MeSH je hierarchická, k deskriptorům existují podhesla (podřazené deskriptory) a numerické kódy. V českých univerzálních plnotextových databázích můžeme obvykle vyhledávat klíčovými slovy přirozeného jazyka se všemi jeho nedostatky, nebo využít plnotextového vyhledávání inteligentního typu, tzv. pojmové vyhledávání TOPIC (pojmově orientovaný vyhledávací systém). Tématické oblasti se rozkládají na podtémata a ty na témata, na pojmy a podpojmy. Zde se již ale dostáváme na půdu metodiky tvorby rešerší a rešeršní strategie. [Cvičení] Na stránkách Národní pedagogické knihovny Komenského http://www.npkk.cz si najděte Katalog a tam si vyhledejte jakýkoli nový záznam z posledních let pod hyperlinkem Detail. Podívejte se, v jakých věcných PS jsou zapsány selekční údaje. Řešení : Naleznete zde Pedagogický tezaurus (tedy deskriptory) a MDT, většinou i volně tvořený termín. Jde o nabídku typickou pro ryze odbornou knihovnu. 8.2 Zápis ve výměnném formátu Zápis věcných selekčních údajů do určité míry závisí na automatizovaném knihovním systému, jehož je elektronický katalog součástí (modulem). S ohledem na usnadnění výměny dat mezi informačními institucemi zapisujeme jednotlivé znaky pořádacích systémů do jednotlivých polí a podpolí, označujeme (kódujeme) je různými indexy, tak, aby je počítač jednoznačně identifikoval – používáme výměnné formáty. Nejznámější jsou formáty MARC = Machine Readable Cataloging = Strojem čitelná katalogizace. Z nich se u nás nejdříve užíval UNIMARC = Universal MARC, nyní se prosazuje MARC 21. Proto je třeba znát formát MARC 21 alespoň rámcově: Zápis věcných údajů ve formátech MARC UNIMARC MARC 21 osobní jméno jako předmět 600 600 korporace, akce 601 610 (korporace) 611 (akce) jméno rodiny,rodu 602 600 + indikátor 3 jméno/název jako předmět 604 600, 610, 611+ podpole $t název jako předmět 605 630 věcné téma (PH) 606 650 geografické jméno 607 651 forma, žánr 608 655 klíčové slovo (postk. index.) 610 653 konspekt 615 072 chronologický údaj 965 648 kód geogr. oblasti 660 043 Kód časového obd. 661 045 MDT 675 080 Shrnutí modulu pořádaní informací a věcné pořádací systémy II V této části jste se dozvěděli, jak vypadá systematické pořádání, především klasifikace Mezinárodní desetinné třídění, jak se podle něj pořádá a jak se řadí klasifikační znaky. O jiných systematických pořádacích systémech (klasifikacích) jste se dozvěděli jen tolik, abyste je uměli poznat a případně si o nich nastudovat sami něco více. Dále už jste se seznamovali se zásadami předmětového pořádání. Kromě obecných zásad, které je nutno dodržovat, jsou systémy pořádání (jednotlivé jazyky) velmi rozdílné. Národní knihovna a knihovny jí blízké používají Předmětová hesla Národní knihovny a Vy již víte, jak se tvoří a jak vypadají. Menší knihovny používají jen jednotlivá slova nebo sousloví (lexikální jednotky), obvykle nazývané klíčová slova. Dozvěděli jste se, že volná indexace je nepřesná i když je to zdánlivě pohodlný způsob předmětové katalogizace, daleko vhodnější je používat tzv. řízené slovníky, tedy indexovat řízeně a tak vyloučit nevyhledání termínů způsobené nepřesnostmi přirozených jazyků. Poznali jste jazyk deskriptorů, Polytematický strukturovaný heslář, soubory věcných autorit. V rekapitulaci jste si ujasnili, v kterých katalozích a databázích se používají konkrétní věcné selekční jazyky (systémy pořádání). Shrnutí modulu Další zdroje ke kapitolám 5-8 BAKO, M. Informačné selekčné jazyky 3. 1. vyd. Bratislava: Slov. pedagog. nakl., 1984, s. 83 – 208. . BALÍKOVÁ, M. Věcné údaje - pravidla RDA. Praha: Národní knihovna ČR, 2015. 93 s. HEDDEN, H. The accidental taxonomist. Second edition. Medford: Information Today, [2016], ©2016. xxxi, 464 s. KTD: Česká terminologická databáze knihovnictví a informační vědy (TDKIV) [online]. Praha: Národní knihovna České republiky, 2003 [cit. 10. 9. 2010]. Dostupné z: KOVÁŘ, B. Selekční jazyky dialogově zpřístupňovaných bází dat. Praha: Novinář, 1987. 113 s. KOVÁŘ, B. Věcné pořádání informací a selekční jazyky. 2. vyd. Praha: Ústředí věd., techn. a ekon. inform., 1984. 250 s. PALÁTOVÁ, R., B. KOVÁŘ. Informačné selekčné jazyky 2. 1. vyd. Bratislava:Slov. pedagog. nakl., 1985. 227 s. RAJU, Java, Reggie RAJU. Descriptive and subject cataloguing : a workbook. Oxford: Chandos, 2006. 133 s. ________________________________ [1] KTD: Česká terminologická databáze knihovnictví a informační vědy (TDKIV) [online]. Praha: Národní knihovna České republiky, 2003 [cit. 10. 9. 2010]. Dostupné z: [2] ČSN ISO 5963 (01 0174). Dokumentace: metody analýzy dokumentu. 1996. [3] Extensions and corrections to the UDC . Hague: UDC Consortium, [1950-] - sv. Vychází nepravidelně. [4] Mezinárodní desetinné třídění [online]. 5. vyd. [Praha]: Národní knihovna České republiky, 2003 [cit. 10. 9. 2010]. Česká verze. Dostupné z: [5] Národní knihovna České republiky [online]. [Praha]: Národní knihovna České republiky, 17. 1 . 2006 [cit. 10. 9. 2010] [6]Vybrané znaky – aktualizace [online]. [Praha]: Národní knihovna ČR, 2002 (cit. 10. 9. 2010). Dostupné z: České MDT Online [online]. Hague: UDC Consortium, 2016 [cit. 29. 2. 2016]. Dostupné z: http://cz.udc-hub.com/cs/login.php [7] Universal Decimal Classification [online]. Hague: UDC Consortium, 2013 [cit. 29. 2. 2016]. Dostupné z: http://www.udcsummary.info/php/index.php^ [8] International Patent Classification (IPC) [online]. WIP IP Services [cit. 20. 9. 2012]. Dostupné z : [9] ČSN 01 0188. Tvorba předmětových hesel. 1982. [10] NA ČR: Národní autority ČR [online]. [Praha]: Národní knihovna České republiky, c 2007-200 (cit. 10. 9. 2010]. Tématická zpřesnění. Dostupné z : [11]AUT - Databáze národních autorit NK ČR [online]. Praha: Národní knihovna České republiky, 2005 [cit. 10. 9. 2010]. Dostupné z: [12] Pravidla heslového katalogu. Uspoř. Z. V. Tobolka. Praha: Knihovna Národního shromáždění Republiky Československé, 1924. 24 s., 6 l. [13] Prozatimní pravidla předmětového seznamu. Sest. J. Drtina, R Pittermann. Praha: SPN, 1952. 26, [2] s. [14] AUT - Databáze národních autorit NK ČR [online]. Praha: Národní knihovna České republiky, 2005 [cit. 10. 9. 2010]. Dostupné z: [15] ČSN 01 0193. Dokumentace. Pokyny pro vypracovávání a rozvíjení jednojazyčných tezaurů. 1995. [16] ISO 25964-1:2011. Information and documentation – Thesauri and interoperability with other vocabularies – Part 1: Thesauri for information retrieval. 1st ed. Geneva: International Organization for Standardization, 2011-08-08. 152 s. ISO 25964-2:2013. Information and documentation – Thesauri and interoperability with other vocabularies – Part 2: Interoperability with other vocabularies. 1st ed. Geneva: International Organization for Standardization, 2013-03-04. 99 s. [17]NTK: Národní technická knihovna [online]. [Praha] : Národní technická knihovna, c2006-2009 [cit. 10. 9. 2010]. PSH: Polytematický strukturovaný heslář. Dostupné z: < http://www.techlib.cz/cs/katalogy-a-databaze/psh/prohlizeni-psh>