Ústav informatiky Doplňování a zpracování knihovního fondu 2 – věcné zpracování dokumentů Studijní opora PhDr. Jindra Planková, Ph.D. jindra.plankova@fpf.slu.cz Opava 2018 Předmluva Tento text je určen studentům kurzu Doplňování a zpracování knihovního fondu 2 bakalářského studijního oboru „Informační a knihovnická studia“ na Slezské univerzitě v Opavě. Předpokládá základní orientaci v akvizičních postupech a procesech, znalost bibliografického zpracování dokumentů a praktické dovednosti vyžadované při vstupním zpracování dokumentů v knihovnách. Úvodní část kurzu seznamuje studenty s problematikou systematických a předmětových selekčních jazyků, včetně normativních materiálů pro věcné zpracování dokumentů. Cílem kurzu je stanovit potřebné teoretické základy v oblastech systematického a předmětového zpracování dokumentů a jejich další rozvoj v oblastech praktického využití a zvládnutí potřebných dovedností v návaznosti na knihovnickou praxi v ČR. Další části textu jsou věnovány základním charakteristikám tvorby, zpracování a následného využití redukovaných textů, ve formě anotací, referátů, výtahů, aj. Pro oblast selekčních jazyků existuje v současné době mnoho monografií, učebních materiálů, článků i příspěvků, či ucelených textů. Účelem tohoto textu není pokrýt celou problematiku věcného zpracování dokumentů. Mnohé oblasti jsou pouze stručně nastíněny, některé informace naznačeny a uvedeny do souvislostí. Pro hlubší seznámení s problematikou proto odkazuji na použitou literaturu, která byla podkladem pro tvorbu daného textu. Z důvodu další propojitelnosti textu je výklad doprovázen odkazy na informační zdroje a vysvětlivkami pod čarou. Vzhledem k rozsáhlosti problematiky, jejímu vývoji při organizování informací v prostředí internetu a odkazům na mnohé informační zdroje je možné, že se v textu budou vyskytovat chyby. Proto přivítám upozornění na případné chyby a také připomínky k samotnému textu. Jindra Planková V Opavě, 08. 03. 2018 Obsah ÚVOD .......................................................................................................................................................................1 1. SYSTÉMY A JEJICH PROCESY ............................................................................................................................3 1.1. INFORMAČNÍ SYSTÉM .....................................................................................................................................4 1.2. INFORMAČNÍ ANALÝZA ...................................................................................................................................5 1.2.1. Identifikační analýza ........................................................................................................................6 1.2.2. Obsahová analýza ............................................................................................................................6 1.3. DOKUMENTY A INFORMACE.............................................................................................................................7 2. SELEKČNÍ JAZYK..............................................................................................................................................10 2.1. SELEKČNÍ JAZYK – PODSYSTÉM INFORMAČNÍHO SYSTÉMU ....................................................................................11 2.2. TYPOLOGIE SELEKČNÍCH JAZYKŮ......................................................................................................................12 2.2.1. Druhy a typy selekčních jazyků.......................................................................................................14 3. ZÁKLADY VĚCNÝCH SJ V LOGICE A SÉMIOTICE..............................................................................................16 3.1. ZÁKLADY V LOGICE.......................................................................................................................................16 3.2. ZÁKLADY V SÉMIOTICE..................................................................................................................................21 4. SYSTEMATICKÉ SELEKČNÍ JAZYKY – TEORIE, HISTORIE, METODIKA .............................................................23 4.1. ÚVOD DO PROBLEMATIKY .............................................................................................................................23 4.2. KLASIFIKACE VĚD – ZÁKLAD SSJ V TEORII A HISTORICKÉM VÝVOJI...........................................................................24 4.2.1. Tři etapy poznání světa člověkem a jejich odraz v klasifikaci věd – historický pohled ...................25 4.2.2. Stručný přehled klasifikací věd v historickém vývoji.......................................................................26 4.3. TEORIE SYSTEMATICKÝCH SELEKČNÍCH JAZYKŮ...................................................................................................32 4.3.1. Systematický selekční jazyk hierarchického typu ...........................................................................33 4.3.2. Princip třídění a fazety....................................................................................................................34 4.3.3. Notace jako soustava znaků umělého jazyka.................................................................................35 4.3.4. Tabulky systematických selekčních jazyků .....................................................................................36 4.3.5. Přednosti a nedostatky systematických selekčních jazyků .............................................................36 5. DĚJINY SYSTEMATICKÝCH SELEKČNÍCH JAZYKŮ – OD STAROVĚKU PO SOUČASNOST.................................39 ZÁVĚR.....................................................................................................................................................................42 DOPORUČENÁ LITERATURA: .................................................................................................................................43 1 Úvod Pokrok společnosti je bezprostředně spojen s kvantitativním nárůstem toku informací, které vznikají a dále se přetvářejí v procesu výroby, v průběhu řešení výzkumných a vývojových úkolů a také v rámci společenské komunikace. Efektivnost lidské činnosti je určována podle toho, jak jsme schopni a jak umíme zpracovávat a využívat informace. Současný koloběh informací se stává vážným problémem informační společnosti, protože klade vysoké nároky nejen na vlastní tvorbu informací, ale také jejich přenos a efektivní využití, resp. kumulaci do podoby poznatků. Naplnění vlastní podstaty informační společnosti vyžaduje důslednou orientaci na růst efektivnosti a kvality informační práce a informačních činností. Tohoto cíle lze dosáhnout důsledným využíváním poznatků vědy a techniky. K danému cíli směřují také opatření na zdokonalení procesů řízení v informační společnosti, přičemž podstatnou roli zde sehrávají informační systémy. Vlastní práce s informacemi totiž vyžaduje zdokonalování informační soustavy tak, aby bylo možné soustavně analyzovat jednotlivé faktory růstu efektivnosti reprodukčního informačního procesu jako celku. Jednou ze základních složek každého informačního systému je jeho informační jazyk. Nejedná se o programovací, ani algoritmický jazyk, ale jazyk, který plní funkci popisu, uložení a komunikace informací. Zavedením informačních a komunikačních technologií do sféry zpracování a zprostředkování informací se význam informačních jazyků stal středem pozornosti výzkumu. Informačním jazykem se zabývají mnozí informační pracovníci, a to jak z teoretického, tak i praktického hlediska. Jedná se především o výzkumy informačního jazyka na bázi přirozeného jazyka a samotný přirozený jazyk ve funkci informačního jazyka. Přirozený jazyk je velmi složitý, univerzální, znakový systém a plní různé funkce. Umělé informační jazyky představují kódový systém, do kterého je potřeba informace při komunikaci s informačním systémem zakódovat a dekódovat. Přirozený jazyk to ovšem nevyžaduje, protože je srozumitelný každému uživateli informačního systému. Umožňuje uživateli informačního systému přímo využívat přirozený jazyk, ve kterém jsou informace vyjádřeny. Přednášky jsou koncipovány tak, aby posluchači byli seznámení s problematikou systematických a předmětových selekčních jazyků, včetně normativních materiálů pro věcné zpracování dokumentů. Pokusíme se tedy stručně a výstižně charakterizovat problematiku 2 selekčních jazyků a postihnout její vztahy a souvislosti. Podstatné praktické aplikace jednotlivých systematických a předmětových klasifikací budou probrány v návazném předmětu Věcné zpracování dokumentů II, jejich popis, charakteristika a možnosti využití v praxi budou součástí dalšího studijního textu 3 1. Systémy a jejich procesy Každá z lidských činností vyžaduje informace. Na druhé straně však výsledkem každé činnosti, ať už hlavním nebo vedlejším, jsou opět informace, které mohou být použity jako vstupy pro jiné činnosti. Problém je v tom, že mezi místem a časem vzniku informací a místem a časem užití informací je mnoho překážek (např. čas a prostor, struktura informací, věcná odbornost, informační odbornost, atd.). Studiem odborných publikací, slovníků, teorií systémů, metodologických postupů, vedoucích ke klasifikaci systémů dospějeme k závěru, že různí autoři shodně definují systém „jako souhrn prvků, jevů, poznatků, které na sebe vzájemně působí a navenek vystupují jako celek“. Za systém lze tedy považovat „složitý reálný nebo abstraktní objekt, v němž rozlišujeme části, vztahy mezi nimi, vlastnosti“. Vůči okolí vystupuje systém jako celek. Části systému jsou ve vzájemné interakci a interaguje i se systémem jako celkem. Označujeme je jako prvky systému a vztahy mezi nimi nazýváme vazbami systému. Systémová věda důsledně rozlišuje pojmy systém a určitý reálný objekt, který je systémem odrážen. Jestliže v praxi použijeme pojem dopravní systém, dopouštíme se chyby a hned vysvětlím proč. Pojem dopravní systém předpokládá určitou míru abstrakce, vymezení jeho jednotlivých prvků a vazeb mezi nimi, případně vazby mimo systém. Pojem dopravní systém použitý pro reálný popis je spíše než systémem zdůrazněním systémového pohledu na oblast dopravy. To, že se o určitém reálném objektu vyjadřujeme jako o systému, je dáno především naším přístupem k tomuto objektu. Toto tvrzení si vysvětlíme na následující situaci: lidské tělo je pro každého z nás určitým reálným objektem, o kterém – někdo více, někdo méně – víme, jak funguje. Víme, že je třeba tělu dodávat potravu, kyslík, vitamíny, že se tělo zbavuje vyměšováním těch látek, které ke své existenci nepotřebuje. Obvykle však už nevíme, proč a jakým směrem v něm probíhají určité procesy. Pokud tedy máme nějaké problémy se svým tělem, zajdeme k lékaři, který se díky svému studiu a znalostem dívá na naše tělo jako systém, zná jeho jednotlivé prvky a vazby mezi nimi. A proto může naše tělo léčit. Stejná úvaha platí pro pohled na jiný objekt, kterým je například automobil. Pro uživatele je automobil reálným objektem, kterému dodáváme benzín, olej, hustíme pneumatiky a jinak se o něj staráme. Jestliže nám však vypoví poslušnost a nejede, zajedeme do opravny. Opravář je schopen automobil opravit, protože je pro něj auto systém s prvky a 4 vazbami mezi nimi. Tedy pro to, abychom nějaký reálný objekt považovali za systém, je rozhodující máš přístup k tomuto objektu, nikoliv věcná povaha objektu. Naše použité příklady, tj. lidské tělo a automobil jsou v daném čase neměnné, ale pohled člověka, uživatele se liší od pohledu lékaře a opraváře. 1.1. Informační systém Informační systém se skládá z mnoha dílčích, na sebe navazujících a vzájemně působících procesů a operací. Informační systém můžeme metodologicky odvodit na základě systémové teorie jako: „systém představující souhrn informačních prvků, jevů a informačních složek, které svými vlastnostmi a vztahy tvoří uspořádaný celek“. Z hlediska informační vědy je v nejširším slova smyslu informační systém charakterizován jako: „systém, jehož vazby se definují jako potenciální informace (fyzikální, biologické, sociální) a prvky jako místa transformace těchto informací“. Soubor těchto prvků spolu s jejich vlastnostmi tvoří celek, který plní informačně-komunikační úlohu. V užším slova smyslu jde o systémy umožňující shromažďování, zpracování, a transformaci informací a jejich zprostředkování uživateli nezávisle na jejich časovém a prostorovém rozptylu. Informační systém můžeme také definovat jakou souhrn prvků, které jako celek slouží k získávání, uchovávání a šíření informací. Tato definice nám pak dovoluje zahrnout mezi informační systémy celou oblast zpracování informací, informační vědu a knihovnictví. Jako každý systém zahrnuje také informační systém v pojetí knihovnictví a informační vědy procesy, které v něm probíhají. Jedná se o tyto následující informační procesy:  výběr a akvizice informací/dokumentů  vstupní zpracování informací/dokumentů  uložení informací/dokumentů  výstupní zpracování informací/dokumentů. Propojení a návaznost jednotlivých informačních procesů, které představují celkový komunikační proces a zabezpečují informovanost, můžeme schematicky znázornit následujícím způsobem: V S T U P komunikace P A M Ě Ť komunikace V Ý S T U P 5 Z P R A C O V Á N Í Vstupní zpracování přetváří obsah dokumentu a požadavky uživatele z přirozeného jazyka do jazyka systému, který označujeme jako selekční jazyk. Paměť představuje fond uložených informací v jakékoliv podobě. Výstupní zpracování zabezpečuje převod vyhledaných informací z selekčního jazyka do podoby přirozeného jazyka. Prvotní informační proces, tj. akvizice – předchází všechny další procesy a jeho vazby a vlivy jsou zřetelné ve všech informačních procesech informačního systému. Tento proces určuje rozsah zpracovávaných informací na vstupu do systému, rozsah jejich uložení a také možnost nalezení relevantní informace na výstupu z informačního systému. V rámci vstupního zpracování informací/dokumentů pak probíhá množství dílčích procesů, mezi kterými jsou úzké vztahy, vazby, souvislosti a návaznosti. Samotné zpracování informací je pak především závislé na informační analýze. Co to tedy informační analýza je? K čemu slouží? Jaký má význam v selekčních jazycích? 1.2. Informační analýza Informační analýza je v širším slova smyslu charakterizována jako: „průzkum dokumentů za účelem výběru informací či informačních zdrojů vztahujících se k informačnímu požadavku uživatele (rešeršní činnost) nebo extrahování informací s cílem vytvoření analytické studie na téma zadané uživatelem“. Informační analýza hlubších struktur dokumentů se používá např. v bibliometrii, scientometrii apod. V užším slova smyslu rozumíme informační analýzou metodu knihovnicko-bibliografického zpracování dokumentů. Informační analýza působí v celém procesu geneze informace, od jejího vzniku, až po její využití. V rámci takto široce definované působnosti se omezíme pouze na procesy, které se týkají konkrétního zpracování, uložení, uchování a využívání dokumentů a v nich obsažených informací. V takto omezeném pojetí je pak předmětem informační analýzy dokument jako celek, který vstupuje do informačního systému a v průběhu jeho procesu se podrobuje odborné obsahové, lingvistické a logické analýze. Cílem informační analýzy je pak množina slov přirozeného jazyka, která představuje obraz či profil dokumentu a reprezentuje ho při vstupní a také výstupní komunikaci informačního systému. 6 Z hlediska přístupu a použitých metod, resp. výsledků, které informační analýzou získáme, rozlišujeme dva základní druhy informační analýzy. Z obou druhů pak vycházejí i dva druhy zpracování informací. 1.2.1. Identifikační analýza V množině slov, které představují obraz dokumentu, je možné rozlišit tzv. podmnožinu identifikačních údajů, které identifikují dokument, tak aby byl odlišitelná od jiných dokumentů. Identifikační analýzu lze charakterizovat jako: „analýzu dokumentu z hlediska jeho morfologických znaků, a to na podkladě údajů titulního listu, patitulního listu, tiráže, obsahu, předmluvy, úvodu a doslovu, za účelem vytvoření jmenného (identifikačního) záznamu“. Z identifikační analýzy vychází identifikační zpracování informací, které se řadí k prvním dílčím procesům vstupní komunikace. Předmětem identifikačního zpracování je vytvoření identifikačního popisu dokumentu s cílem přesně určit jednotlivé nosiče informací a odlišit je od ostatních podobných nosičů, nebo odlišit informace jednu od druhé. Informační popis charakterizuje dokument z hlediska jeho vnějších znaků, řeší formální aspekty a splňuje identifikační funkci vůči zpracovávanému dokumentu. Výsledkem praktické identifikace dokumentu je identifikační záznam, jehož všechny údaje lze seskupit do určitých celků – bloků (autorské, původcovské, názvové, vydavatelské údaje, knihopisná poznámka, apod.). Jednotlivé bloky tvoří rámcové schéma identifikačního záznamu, které je platné pro všechny druhy a typy zpracovávaných dokumentů. Na základě identifikačního zpracování informací vzniká identifikační selekční jazyk, který na základě identifikačních znaků umožňuje v informační paměti knihovny nalézt konkrétní dokument. Jeho nalezení probíhá v zájmu plného využití dokumentu i v rámci uspokojování potřeb uživatelů. Identifikační analýza určuje identifikační (formální) údaje o dokumentu. 1.2.2. Obsahová analýza Východiskem pro přípravu informací do podoby organizovaných fondů je obsahová analýza dokumentu. Na jejím základě se obsah dokumentu přenáší na nosiče, tj. jedná se o paměťová zařízení určitého typu. Nosiče jsou nositeli informace o obsahu organizovaného fondu a jejích částí. Tyto nosiče rovněž slouží k uchování informací a ulehčují přístup uživatele k jednotlivým informacím. 7 Obsahovou analýzu můžeme definovat jako: „analýzu obsahu dokumentu zahrnující metody a pravidla pro stanovení tematiky dokumentu, příp. časového a prostorového hlediska, čtenářského určení a formy dokumentu“. Slovní vyjádření obsahu dokumentu v přirozeném jazyce je transformováno do věcných selekčních údajů v procesu věcného pořádání, nebo do vět v procesu sémantické redukce textu dokumentu. Výsledkem obsahové analýzy je informační popis, který svými výsledky představuje vysoký stupeň redukce informací z původního dokumentu. Informační popis pochopitelně nestačí k uspokojování informační potřeby uživatele, a proto se v zájmu zmírnění této vysoké redukce používá věcná obsahová analýza dokumentu. Věcná obsahová analýza dokumentu je vyjádřena procesy klasifikace a indexování. Zatímco v identifikační analýze jde o relativní jednotnost údajů z dokumentu, pracuje věcná obsahová analýza s nepoměrně složitější problematikou. Vyžaduje studium celého textu, ze kterého vybírá množinu slov, která určují jeho zkrácený, ale zachovaný informační obsah. Obsahová analýza dokumentu je samostatná pracovní operace, která je v informačním systému jádrem vstupní komunikace. V procesu věcné obsahové analýzy jde v podstatě o transformační proces. Už samotné vyjádření informace v přirozeném jazyce a její zaznamenání v dokumentu představuje určitou transformaci poznatků a myšlenkových pochodů. Aby bylo možné takovéto informace později využít, je potřeba dokument uložit a v případě potřeby jej znovu vyhledat. Obsahová analýza slouží k získávání dvojího druhu údajů: obsahových údajů a obsahových charakteristik. Obsahové údaje zpřístupňují uživateli přímo informace z obsahu dokumentu ve slovní formě (referát, anotace, atd.). Zatímco obsahovou charakteristickou zprostředkujeme uživateli nepřímé informace z dokumentu, kterými jsou znaky selekčního jazyka (notace, předmětové heslo, klíčové slovo, deskriptor, atd.) 1.3. Dokumenty a informace Protože v průběhu celého semestru se budeme zabývat otázkami zpracování dokumentu a v nich obsažených informací, pokládám za potřebné se v krátkosti zastavit u definování daných pojmů. Typologie dokumentů přináší mnohé koncepce výkladu pojmu dokument. Z nich jsou pro nás podstatné následující: 8  Dokument je prostředkem sociální komunikace tvořený množinou materiálně fixovaných a uspořádaných dat nebo informací. Termínem dokumenty označujeme hmotné předměty, které jsou výsledkem lidské činnosti, vznikají zaznamenáním obsahu lidského myšlení a vznikají proto, aby se tento obsah uchoval v čase a přenesl v prostoru. Jde o libovolný komunikát zaznamenaný libovolným způsobem, ale na určitém nosiči.  Dokument je informační pramen tvořený nosičem informací a množinou informací na něm fixovaných a sloužící k přenosu dat v čase a prostoru. Dokumenty se dělí podle řady kritérií, např. podle způsobu záznamu dat (písemné, obrazové, zvukové, audiovizuální, strojem čitelné – elektronické či digitální), podle odvozenosti obsahu (primární, sekundární a terciární), podle kontinuity (periodické a neperiodické), podle stupně zveřejnění (zveřejněné, nezveřejněné, interní). Vlastní rozbor a výklad pojmu informace není předmětem našeho předmětu. Charakteristika informace a její vlastnosti mají svoje specifika a jsou předmětem studia samostatné vědní disciplíny, vědy o informacích. Z různých přístupů jsem však vybrala ty charakteristiky, podle kterých se rozlišují druhy informací – dokumentové, dokumentografické, faktografické. Potřeby odlišit informace o dokumentu od informací, které přímo zpřístupňují fakta, vedly již v minulosti k terminologickému odlišení těchto typů informací:  Dokumentografické informace jsou charakterizovány jako úplné, nebo zkrácené informace o dokumentu. Získávají se v procesu dokumentové analýzy, ve které se vytváří reprodukovaný obraz původního dokumentu, tzv. sekundární dokument.  Dokumentografickou informaci můžeme také charakterizovat jako druh sekundární informace, obsahující reprezentaci dokumentu nebo jeho části. Základní jednotkou bibliografické informace je bibliografický údaj, který obsahuje hodnotu jednoho atributu dokumentu. Prostřednictvím hodnot bibliografických údajů může bibliografická informace vstupovat do vztahů s dalšími bibliografickými informacemi (díla téhož autora, časopis - číslo - článek apod.). V komunikačním procesu plní funkci indikativní (informace o existenci dokumentu), identifikační (odlišení dokumentu od ostatních) a popisnou; ty mohou být dále rozšířeny o funkce selekční, lokační a hodnotící. 9  Faktografická informace obsahuje nejrůznější odborné poznatky, skutečnosti, jevy a zkušenosti charakterizované určitými svými vlastnostmi, údaji, ukazateli, parametry, hodnotami, nebo definicemi. Mohou být vyjádřeny číselnou či slovní formou a mohou vyjadřovat kvantitativní či kvalitativní závislosti příslušných jevů pomocí krátkého textu, formou tabulky, diagramu nebo jiného grafického znázornění. Faktografické údaje nejsou pouze údaje bez jakéhokoliv větného spojení, nebo vysvětlení. Charakteristickými rysy faktografických informací jsou kvantifikovatelnost a konkrétnost. Kvantifikovatelnost se odvozuje od termínu data, údaj.  Faktografická informace je informace vyznačující se tím, že reprezentuje konkrétní údaje (fakta). Často se vymezuje komplementárně k bibliografické informaci, která poskytuje pouze odkaz na zdroj informace. Na základě diferencování informace můžeme také hovořit o dokumentografickém a faktografickém fondu, s tím, že k jednotlivým fondům můžeme diferencovaně přistupovat, pomocí vyhledávacího jazyka. Na základě tohoto předpokladu rozlišujeme dokumentografické selekční jazyky a faktografické selekční jazyky (i když je pravda, že pro vyhledávání faktografických informací může stačit i dokumentografický selekční jazyk). Závěrem je potřeba upozornit na fakt, že podstatný rozdíl mezi faktografickými a dokumentografickými informacemi je dán především délkou záběru a hloubkou zpracování dané problematiky, odlišnými metodami rozboru zpracovávaného materiálu, metodami postupu a odlišnými požadavky na výsledek zpracování. 10 2. Selekční jazyk Pro potřeby knihovnicko-informačního systému je potřeba zobrazit obsah dokumentů a odborných textů ve zkrácené formě a to i za cenu určité ztráty původních informací. Dále je nutné vyjádření obsahu normalizovat, aby se sjednotil způsob vyjádření výsledků informační analýzy. K těmto účelům se používá informační jazyk, jako soubor uspořádaných znaků a předem smluvených syntaktických prostředků. Informační jazyk se vytváří na základě přirozeného jazyka, zachovává si většinu jeho vlastností, odlišuje se od něho většinou logickou propracovaností termínů a vztahů mezi nimi. Informační jazyk se dá charakterizovat podle funkcí, které splňuje. Podle toho potom rozeznáváme:  algoritmické informační jazyky – programovací jazyky, určené na zápis příkazů člověka stroji  logické informační jazyky – formalizují pojmy různých oblastí poznání, pomocí matematické logiky  selekční informační jazyky – jsou určeny pro zápis, třídění, uložení a vyhledání informací Termínem selekční jazyk rozumíme třídící a vyhledávací jazyk, jehož pomocí se dá vyjádřit struktura formálních a sémantických vlastností dokumentu a uživatelského požadavku. Je to určitý specializovaný umělý jazyk, který také chápeme jako spojovací článek mezi uživatelem a jeho informačním systémem. Bohužel současná terminologie nemá pro tento třídící a vyhledávací jazyk, kterým chápeme soustavu znaků přirozeného, formalizovaného, normalizovaného či jiného umělého jazyka, ustálený, jednotný termín. Pro významově stejné termíny se používají následující označení: informační jazyk, informační selekční jazyk, informačně-selekční jazyk, selekční jazyk, průzkumový jazyk, dokumentační jazyk, rešeršní jazyk, informačně-vyhledávací jazyk, bibliografický jazyk či jazyk katalogizace, apod. V českém terminologickém prostředí se nejčastěji používá termín selekční jazyk, který je možné chápat jako: „umělý informační jazyk používaný k vyjádření identifikačních nebo obsahových selekčních údajů za účelem pořádání, ukládání a vyhledávání dokumentů“. V uvedené definici se o selekčním jazyku hovoří jako o umělém informačním jazyce a proto 11 je nutné zdůraznit, že selekční jazyk je charakterizován také jako druh informační jazyka, který slouží:  k formalizaci identifikačních a obsahových údajů o dokumentech a informací v nich obsažených, na vstupu do informačního systému  k uložení dokumentů, nebo jejich záznamů do jakékoliv informační paměti  k formalizaci překladu (zpětného převodu) informačního dotazu uživatele na výstupu z informačního systému  k vyhledávání relevantních 1 a pertinentních 2 dokumentů a informací průzkumem v informační paměti  k distribuci informací na výstupu z informačního systému Schopnost vyjádření specifických hledisek informací obsažených v dokumentech pomocí znaků selekčního jazyka a možnost vyjádření specifického hlediska informačního požadavku pomocí těch stejných znaků ukazuje, že selekční jazyk je jednoznačně jazykem určitého knihovnicko-informačního systému, který plní funkci komunikativního prostředku a zároveň je výrazovým a vyjadřovacím prostředkem klasifikace a indexování. 2.1. Selekční jazyk – podsystém informačního systému Věcné zpracování informací, včetně samotného třídění informací můžeme považovat za podsystém knihovnicko-informačního systému. Společnou vlastností podsystémů informačního systému je právě selekční jazyk. Je zřejmé, že aby informační systém poskytl uživateli relevantní nebo dokonce pertinentní informaci, je potřebné, abychom stejné obsahy, tematiku a předmětu dokumentů označili stejnými soupisnými údaji společného selekčního jazyk při třídění, uložení a vyhledávání informací. V informačním systému jsou nejjasněji identifikovatelné vztahy mezi tříděním a vyhledáváním informací. Nesmíme přitom zapomenout na vztah těchto procesů k uložení informací. Tento vztah je natolik blízký, že analýza celkového procesu zpracování informací vyžaduje, aby se už dopředu počítalo s vyhledáváním informací, popř. s uložením informací a naopak. Tento fakt vede k tomu, že se mnohdy ztrácí rozdíl mezi subsystémy informačního systému, tj. třídícím a selekčním systémem. Selekční jazyk je pak chápán jako třídící systém. 1 relevance = významnost, důležitost, závažnost, platnost určitého termínu 12 V souvislosti s třídícím, ukládacím a vyhledávacím subsystémem informačního systému se vždy řeší otázky selekčního jazyka. Selekční jazyk je proto prvkem i prostředkem, který spojuje třídící, ukládací a vyhledávací subsystémy informačního systému. Ve všech uvedených subsystémech se musí použít stejný selekční jazyk. 2.2. Typologie selekčních jazyků Selekční jazyky jsou tvořeny skupinou identifikačních a věcných selekčních jazyků. Věcné selekční jazyky se dále dělí na systematické selekční jazyky a předmětové selekční jazyky. Ty se historicky vyvíjely paralelně vedle sebe a soutěžily o prvenství. V jejich teoretickém vývoji lze vysledovat nejrůznější klasifikační přístupy, které ovšem ne vždy byly použity správně. Na základě daných historických přístupů rozeznáváme tři druhy selekčních jazyků: knihovnicko-bibliografickou klasifikaci; abecedou předmětovou klasifikaci a jazyky deskriptorového typu. Třídit, diferencovat či klasifikovat selekční jazyky je možné z různých hledisek a podle toho se také přistupuje ke jejich typologii. Nyní se pouze stručně zmíníme o jednotlivých hlediscích třídění selekčních jazyků: Z hlediska šíře záběru hovoříme o univerzálním selekčním jazyku – určeném pro zpracování informačních fondů univerzálního charakteru; a speciálním selekčním jazyku – určen pro zpracování oborově specializovaných fondů, informace pokrývají pouze jistou část celkového univerza vědy. Z hlediska vnitřní struktury rozeznáváme o otevřeném/pohyblivém selekčním jazyku – jsou založeny na volné, pohyblivé a otevřené struktuře, se schopností přidávat nově vznikající pojmy (příkladem je abecední předmětová klasifikace a analyticko-syntetická klasifikace); a uzavřeném/hierarchickém selekčním jazyku – jehož vnitřní stavba spočívá na pevně uzavřené struktuře, která má do jisté míry omezenu možnost přidávat nové pojmy (je to hierarchická klasifikace). 2 pertinence = shoda subjektivního požadavku uživatele s obsahem informace či dokumentu 13 Podle stupně formalizace jazyka hovoříme o formalizovaných selekčních jazycích – dosahují terminologické jednoznačnosti (př. deskriptorové tezaurové jazyky); a normalizovaných selekčních jazycích – množinu slov získanou v procesu obsahové analýzy vyjadřují podle přesně stanovených normativních pokynů (př. předmětové jazyky a předmětová hesla). Dokonalost jazyka uvádí typ selekčního jazyk s gramatikou nebo bez gramatiky. Diferenciace podle vytváření tříd ekvivalence 3 rozlišuje prekoordinovaný selekční jazyk – obsahuje lexikální jednotky vyjadřující složené pojmy, které jsou používány pro indexaci i vyhledávání (př. předmětová hesla, MDT); a postkoordinovaný selekční jazyk – je jazyk, jehož lexikální jednotky vyjadřují jednoduché pojmy, při indexaci jsou do selekčního obrazu dokumentu zařazovány nezávisle na sobě a k jejich kombinaci dochází až v průběhu vyhledávání (př. tezaurus, fasetový klasifikační systém). Při kategorizaci selekčních jazyků se pokládá za významný princip koordinace. Co ovšem tento pojem znamená a jak je využíván? Koordinovat znamená sjednotit, seskupit. Selekční jazyky, ve kterých se uplatňuje koordinované indexování, umožňují používat pro popis předmětů a jevů nevelké, mezi sebou propojené stavební bloky a jejich kombinací mohou vytvořit nejrůznější seskupení. Koordinované indexování zabezpečuje analyticko-syntetické zpracování informací a dokumentů; a vyjádření v nich obsažených vztahů. Vyžaduje analýzu (volbu pojmů, deskriptorů) a syntézu (sloužení, seskupení, koordinace pojmů). Koordinované indexování zabezpečuje také vícerozměrnou klasifikaci, která umožňuje vícerozměrný přístup k obsahu dokumentu. Ten zabezpečí hloubkové indexování a koordinovaný selekční jazyk je schopen jednoduše vyjádřit polytematický obsah dokumentu. Na základě takto stanovených vlastnosti hovoříme o prekoordinovaném a postkoordinovaném selekčním jazyku. Prekoordinovaný selekční jazyk se vyznačuje tím, že slovník slov se skládá nejen z jednotlivých slov, ale i slovních spojení, popř. vět. Koordinace pojmů, klíčových slov se zde uskutečňuje před indexováním, nebo v procesu indexování. To značí, že slovník slov se skládá jak z názvů složených předmětů a složených tříd, ale i jednotlivých slov syntakticky uspořádaných před nebo v průběhu indexování. Označení dokumentů, především složené 14 tematiky příslušnými soupisnými údaji, pojmy, slovy, znaky, se dělá před uložením do informační paměti. Tento typ selekčního jazyka má mnohé výhody při indexování složité problematiky a při jejich uložení do informační paměti. Naproti tomu jsou tyto jazyky méně výhodné pro vyhledávání dokumentů či informací. Typickými představiteli jsou – DDT, MDT, předmětová hesla. Postkoordinovaný selekční jazyk vychází ze vzájemně izolovaných slov, či slovních spojení a skládá z nich tematiku dokumentu a informačních požadavků až v procesu vyhledávání, na základě informačního požadavku. Slovník slov se skládá ze vzájemně izolovaných slov, pojmů či znaků. Takto izolovaná slova, pojmy či znaky se jako soupisné údaje, nezávisle na sobě ukládají do informační paměti. Proto jsou vhodné pro vyhledávání dokumentů a informací, na základě různě formulovaného uživatelského dotazu. Do tematiky dokumentu se dá vstoupit neuspořádanou či libovolně uspořádanou množinou slov informačního požadavku. Nevýhodné jsou při formulování složené tematiky dokumentů, pokud má být obsah dokumentu vystižen množinou syntakticky svázaných slov, nebo znaků umělého jazyka. Příkladem jsou – Ranganathanova klasifikace, deskriptorové jazyky. 2.2.1. Druhy a typy selekčních jazyků Z různých typologických přístupů je možné za jediné a správné, jednoznačné a srozumitelné rozlišování věcných selekčních jazyků z hlediska jejich dvou základních druhů na systematické selekční jazyky a předmětové selekční jazyky. V rámci nich podle charakterových vlastností je jim třeba přisuzovat příslušné typy: A. Systematické selekční jazyky - hierarchického typu prekoordinované - fazetového typu postkoordinované B. Předmětové selekční jazyky - typu předmětových hesel prekoordinované - deskriptorového typu postkoordinované 3 ekvivalence = rovnocennost 15 Kategorizace věcných selekčních jazyků ukazuje, že jak systematické, tak i předmětové jazyky mohou být prekoordinované i postkoordinované. 16 3. Základy věcných SJ v logice a sémiotice Při zkoumání problematiky věcných selekčních jazyků se řeší mnohé významné otázky, které svojí povahou patří do logiky a mají přitom bezprostřední vztah k jazyku a k znakovým soustavám. Proto je potřeba postavit teorii věcných selekčních jazyků na dosud objevených znalostech logiky, sémiotiky a případně i lingvistiky. 3.1. Základy v logice Pro naše další zkoumání problematiky má velmi podstatný význam poznatkový aparát logiky, především teorie množina logických tříd a dále výklad pojmu klasifikace. Proto se zde ve stručnosti zaměříme na jejich objasnění a uvedení do souvislosti pro studium věcných selekčních jazyků. Logické individuum je předmět myšlení, který je v určité dané souvislosti odlišitelný od jiných předmětů a v této souvislosti se dále nerozkládá. Množina (logická třída) je souborem logických individuí, které mají v určité dané souvislosti společnou vlastnost, nebo skupinu společných vlastností. Základním vztahem v teorii množin je vztah členů k množině. Pokud je logické individuum členem určité množiny, nazývá se prvkem dané množiny. Množinu je možné určit a přesně definovat pouze tehdy, pokud lze rozhodnout, která logická individua do ní patří. Určení množiny je možné provést dvojím způsobem: 1. extencionálně – množina se definuje výčtem jejich prvků; počet prvků množiny je konečný a existuje tak možnost tento konečný počet prvků skutečně vypočítat (množina žáků třídy, množina pedagogů SU, množina dnů v týdnu, atd.). 2. intencionálně – množina se definuje tak, že se uvede určitá charakteristiky, charakteristická vlastnost, kterou mají všechny prvky množiny (množina studentů 1. ročníku oboru IKS, množina sudých čísel, množina žen ve věku od 25–35 let v ČR, atd.). Dalším důležitým předpokladem správného pochopení množin pro věcné selekční jazyky je znalost základních druhů množin. V zásadě rozeznáváme následující druhy: a) neprázdná mn. – obsahuje alespoň jeden prvek (množina PC, množina květin, množina knih, množina spisovatelů, atd.). 17 b) jednotková mn. – obsahuje právě a pouze jeden prvek (množina moje maminka; množina hlavní město ČR, atd.). c) prázdná mn. – neobsahuje žádný prvek (množina strašidel, množina čertů, množina dinosaurů, atd.). d) univerzální mn. – zahrnuje všechny prvky daného, přesně vymezené oblasti zkoumání, nebo úvahy (př. množina oboru LIS, množina spojená s dokončením DP, atd.). Pro potřeby selekčních jazyků je podstatný pojem prázdné množiny, protože v knihovnách nacházíme knihy o vílách, perpetuum mobile, atd. Tyto předměty a jevy v objektivním materiálním světě neexistují, ovšem z pohledu ontologie (nauka o jsoucnu) jde o prázdné množiny. Proto je potřeba počítat s tím, že tematikou dokumentů mohou být předměty a jevy, které reálně neexistují, avšak v dokumentech se o nich reálně píše. V knihách je potřeba tyto pojmy zařadit do univerzálního systému lidského poznání a najít pro ně v hierarchii selekčního jazyk příslušné místo. Také pojem univerzální množiny má obrovský význam z hlediska teorie selekčních jazyků. Na základě jejího definování je nutné si položit otázku, zda jsou selekční jazyky schopny splnit podmínku, danou pro definování univerzální množiny. Prakticky žádný systematický selekční jazyk nemůže být natolik enumerativní, aby uváděl všechny pojmy, vzniklé klasifikací. Je to jeden z důvodů, proč tyto jazyky selhávají při vyhledávání relevantních informací na základě velmi speciálních uživatelských dotazů. Vypočítat lze pouze prvky takové univerzální množiny, jejichž počet je zároveň konečný. Podstatné z teorie množin jsou ještě vztahy mezi množinami: a) inkluze – jedna množina je podmnožinou druhé (pes – savci) b) noninkluze – množina není podmnožinou druhé (básníci – prozaici) c) ekvivalence – jedna množina je ekvivalentní s druhou, pokud obsahuje stejné prvky (moje maminka, syn) d) disjunkce – jedna množina je disjunktní s druhou, pokud neexistuje žádný prvek, který by patřil současně do obou množin (sudá – lichá čísla) Z hlediska selekčních jazyků má také význam sledovat, na kolik podmnožin se daná množina rozkládá (klasifikuje). Podle toho, kolik vznikne rozkladem podmnožin, můžeme všechny klasifikace rozdělit na tzv. homogenní a heterogenní. 18 Homogenní klasifikace – jsou takové klasifikace, které rozkládají každou množinu na stejný počet podmnožin. Pokud se každá daná množina rozkládá vždy a pravidelně na dvě podmnožiny, jde o dichotomickou klasifikaci; pokud se rozkládá na tři podmnožiny, jde o trichotomickou klasifikaci; a v případě členění na čtyři části je to tetratomická klasifikace, atd. Heterogenní klasifikace – je potom klasifikací, která rozkládá každou z daných množin na nestejný, dopředu neurčený a nestanovitelný počet podmnožin. To znamená, že některá množina se na libovolné hierarchické úrovni rozkládá např. dichotomicky, trichotomicky, atd. Historickým průzkumem i pohledem na současný stav systematických selekčních jazyků zjistíme, že mají většinou charakter heterogenních klasifikací. Je to pochopitelné, vzhledem ke skutečnosti, že při klasifikaci celého univerza lidského poznání není možné dopředu určit, na kolik podmnožin mají být rozloženy množiny jednotlivých hierarchických úrovní. Určením, že se množiny budou pravidelně rozkládat dichotomicky, či trichotomicky, bychom šli proti podstatě vlastní povahy klasifikovaného materiálu, předmětu či jevu objektivního světa. Povaze klasifikovaného materiálu mnohem lépe odpovídá heterogenní klasifikování, které odpovídá objektivnímu obrazu světa a jeho zobrazení v lidském vědomí. Mezi homogenní systematické selekční jazyky patří některé velmi známé a rozšířené selekční jazyky. Například MDT ve svém původním návrhu, který vycházel z DDT, bylo založeno na pravidelném rozkladu každé množiny na deset podmnožin, i když ve všech případech, na všech hierarchických úrovních a u všech množin se nemusí využít všech deset možností. Některé z nich se nechávají volné, pro případné pozdější využití. V této souvislosti je ještě potřeba si zapamatovat, že vlastně všechny homogenní klasifikace, včetně desetinných, jsou klasifikacemi umělými. Odpovídají požadavkům formální logiky i rozkladu (klasifikaci) množin a nejsou objektivním zobrazením toho, jak jsou věci, předměty, jevy a procesy uspořádány v objektivním, reálném světě. Z hlediska teorie i praktických potřeb systematických i předmětových selekčních jazyků je důležité, že hlavní zásady teorie množin a klasifikace množin můžeme aplikovat také na jména, či názvy tříd, na jazykové výrazy, kterými se označují pojmy. Také o nich totiž platí, že se mohou definovat extenzionálně a intencionálně. 19 Extenzionální a intencionální určení (definice) jmen, či názvů není možné dělat bez vědomí, že jména a názvy, jako jazykové kategorie mají vztah k mimojazykovým entitám, které označují. Mimojazykovými entitami jsou potom předměty, věci, jevy a procesy objektivního materiálního světa. Význam jazykových výrazů je určena právě vztahem jazykových výrazů k předmětům, jevům a procesům materiálního světa, které označují. Analogicky jako v případě množin jsou extenze, nebo rozsah jmen a názvů určovány extenzionálně tak, že se vypočítávají jména, nebo názvy všech předmětů a jevů, které jsou ve jméně, nebo názvu zahrnuty. Naproti tomu intencionálně jsou jména, nebo názvy určovány tak, že se udává podstatná, charakteristická vlastnost, která je společná všem jménům a názvům, kterými pojmenováváme předměty, jevy a procesy zahrnuté v daném jménu, nebo názvu. Označují se denotát (vztah mezi výrazem a tím, co označuje) a o denotátech jmen a názvů můžeme uvažovat analogicky, jako o prvcích množin. Stejně i pro určení druhů jmen a názvů můžeme použít analogická kritéria, jako při určení druhů množin:  prázdný název – název, který nemá denotát (př. perpetuum mobile, strašidlo, víla, čert, atd.)  neprázdný název – název, který má alespoň jeden denotát (škola, učebna, maminka, kniha, atd.)  jedinečný název – je název, nebo jméno, které má právě jeden denotát (medvídek pú, tráva, slunce, atd.)  všeobecný název – název, který má více než jeden denotát (list, klíč, auto, atd.) Názvy, které mají různý obsah (intenzi) mohou mít také rozsah (extenzi). Například názvy „rovnoramenný trojúhelník“ a „rovnostranný trojúhelník“ mají různý obsah, protože každý z nich je určován intenzionálně uvedením jiné podstatné vlastnosti jejich denotátů, ale mají stejná rozsah, protože mají stejné denotáty. To stejné platí o například o názvech „hlavní město ČR“ a „nejlidnatější město ČR“, atd. Pokud jde o vztah mezi názvem a pojmem, je potřebné vědět, že každý pojem se v přirozeném jazyce vyjadřuje nějakým jazykovým výrazem. Pojem je vlastně významem názvu. A protože význam názvu je dán jeho obsahem, jde u pojmů o intenzionální (obsahové) určení (definici) názvu. V této souvislosti se můžeme zeptat, zda je možné hovořit o obsahu a rozsahu pojmu. Denotátem pojmu je v každém případě denotát názvu, 20 kterým byl pojem pojmenován. Proto je oprávněné hovořit o rozsahu (extenzi) pojmu v takovém smyslu, v jakém se hovoří o rozsahu (extenzi) názvu. Všechny uvedené poznatky z teorie množin mají praktický význam pro systematické i předmětové selekční jazyky. Systematické selekční jazyky třídí předměty, jevy a procesy objektivního světa, avšak prostřednictvím jejich odrazu v lidském vědomí a myšlení, které se vyjadřuje výrazy přirozeného jazyka reprezentujícími nějaké pojmy, tedy význam, nebo obsah názvů. Z pojmů, které byly pojmenovány nějakými jazykovými výrazy, kterými se na základě obsahové analýzy vyjádřil obsah dokumentu, a které se transformovaly do znaků umělého selekčního jazyka, můžeme sestavit stupnici, která je hierarchicky uspořádána na základě rozsahu (extenze) a obsahu (intenze) pojmů. Tuto stupnici si můžeme představit jako pyramidu univerza lidského poznání a praktických činnosti. Na vrcholu jsou umístěny nejvšeobecnější pojmy se širokým rozsahem (extenzí) a s velmi malým obsahem (intenzí). Tyto nejvšeobecnější pojmy se nazývají kategorie. Z logického hlediska vytvářejí množiny, které se rozkládají na podmnožiny, vytvářené souřadnými pojmy. Vznikají tak různé úrovně hierarchické pyramidy pojmů. Každý se souřadných pojmů, který vznikl, jako druh příslušného rodu se dále rozkládá, tak vzniká velké množství úrovní hierarchické pyramidy. Nakonec se dojde k základně pyramidy, na nejnižší hierarchickou úroveň, kde jsou umístěny jedinečné pojmy, které mají velmi úzký rozsah (extenzi), ale velmi bohatý obsah (intenzi). Předmětové selekční jazyky se vyznačují tím, že jejich vlastním cílem je slovní jazykové vyjádření obsahu dokumentu, ve smyslu pojmenovaných předmětů a jevů objektivního světa, prostřednictvím jejich odrazu v lidském vědomí. V zásadě jsou předmětové selekční jazyky charakterizovány principem abecedního řazení hesel. Hierarchické, rodově-druhové, či druhově-rodové vztahy mezi názvy nehrají při vlastním uspořádání roli. Jsou pomocným prostředkem, který odstraňuje závažné nedostatky předmětových selekčních jazyků, a to především ty, které v abecedním pořadí pojmů ztrácejí všechny jiné, než formální abecední vztahy. Za účelem zachování hierarchického principu vztahů se využívá systému vylučovacích a přidržovacích odkazů v předmětovém katalogu a v rejstřících. Deskriptorové selekční jazyky jsou významnými předmětovými selekčními jazyky a vyznačují se tím, že u nich hraje důležitou roli pojem ekvivalence. Lexikální jednotky zde 21 vytvářejí třídu podmíněné ekvivalence, do které patří jazykové výrazy odrážející nějaké pojmy, které v dané souvislosti, v daném konkrétním oboru, jsou vzhledem k deskriptoru ekvivalentně podmíněny. Deskriptor se vybírá z řady jazykových výrazů, které se v dané souvislosti pokládají za ekvivalentní a povýší se na sémantickou dominantu tohoto řádu, tj. na deskriptor, který zároveň pojmenovává tuto třídu podmíněné ekvivalence. Poznatkový aparát logiky, především znalosti z teorie množin, je podstatný a významný pro teorii i praxi věcných selekčních jazyků. Ovšem je potřeba zdůraznit, že při práci s věcnými selekčními jazyky si nevystačíme pouze se znalostí teorie množin, ale je potřeba chápat i následující vztahy a souvislosti, které vyplývají ze sémiotiky. 3.2. Základy v sémiotice Na základě informační analýzy se věcné selekční jazyky využívají pro zatřídění, uložení a vyhledávání informací, k formulaci soupisných údajů. Soupisnými údaji jsou potom prvky, nebo soubory, převzaté ze znakových systémů přirozených formalizovaných, či umělých jazyků. Systematické selekční jazyky nahrazují slovní formulaci obsahu dokumentu znaky umělého jazyka. Znakem rozumíme charakteristiku objektu, která umožňuje určit příbuznost (shodu), nebo rozdílnost ve vztahu k jiným předmětům. Znakem a znakovými systémy se zabývá sémiotika. Sémiotika je věda o jazykových a nejazykových systémech, zabývající se všeobecnou teorií znaku a jeho významu. Jejími dílčími oblastmi zkoumání jsou – syntaktika, sémantika, pragmatika. Syntaktika se zabývá tvarem a uspořádáním jazykových výrazů. Zkoumá způsob jejich spojení podle dopředu určených pravidel a tato pravidla formuluje. Syntax je řeckého původu a znamená se-řazení. V syntaxi jde o určité řazení symbolů na lineární ose hovoru. Syntax jako složka sémiotiky zkoumá, jakým způsobem se ze základních termínů vytváří složené výrazy. 22 Sémantika zkoumá význam základních termínů a jejich kombinaci (význam výroků). Zabývá se významem znaků ve smyslu jejich vztahu k předmětům. Sémantika se zajímá o vztah jazyka k objektům, o kterých tento jazyk vypovídá. Pragmatika se zabývá vztahem uživatele jazyka k jazykovým výrazům, jako znakům, které lidé používají. Zkoumá účel a způsob jejich použití. Znaky se v podstatě rozlišují na přirozené (úkazy v přírodě – zmrzlá voda => teplota klesla pod nulu) a umělé, které vytvořil člověk záměrně za účelem komunikace. Dále členíme znaky na mimojazykové a jazykové. Mimojazykové umělé znaky se používají pro komunikaci mimojazykovými prostředky, vyznačují se hlavně signály a symboly. Signály jsou materiální předměty, nebo jevy, které lidé využívají pro to, aby začaly a ukončily určité lidské aktivity. Jejich domluvený význam vystupuje zřetelně do popředí. Potřebují domluvenou interpretaci, aby mohly vystupovat ve funkci znaku. Typickým příkladem signálů jsou semafory, atd. Symboly reprezentují a zastupují abstraktní pojem a abstraktní obsah. Například symbolem lásky je srdce, symbolem míru bílá holubice, atd. Jazykové umělé znaky jsou znaky přirozeného i umělého jazyka, který se používá ve společnosti. Znaky přirozeného jazyka jsou prvky znakových soustav, podle kterých se dorozumívají národy mezi sebou. Znaky umělého jazyka se odvozují od znaků přirozeného jazyka, soubor takových znaků se nazývá metajazyk. Třídící znak je znakem selekčního jazyka, může se prezentovat znaky přirozeného i umělého jazyka. Pokud definujeme selekční jazyk jako soustavu znaků přirozeného formalizovaného či umělého jazyka, tak se vytváří ze znakových systémů těchto jazyků. Znak, který v procesu třídění (klasifikace) zvolíme za hlavní, je určujícím třídícím znakem. Ve formální logice se nazývá principem třídění (principium divisionis). 23 4. Systematické selekční jazyky – teorie, historie, metodika Systematické selekční jazyky jsou nejstarší a pro svou logickou strukturu i nejčastěji používané. Od nejstaršího období se používaly pro třídění a vyhledávání knih a jejich záznamů v knihovnách a bibliografiích. Systematické selekční jazyky třídí a uspořádávají dokumenty a v nich obsažené informace od systematicky uspořádaného souhrnu lidského poznání v univerzálním, nebo speciálním smyslu. 4.1. Úvod do problematiky Z již probraného víme, že selekční jazyk se chápe jako výrazový a vyjadřovací prostředek klasifikace a indexování. Proto si nejprve vyložíme dané pojmy, které jsou v teoretickém i praktickém ohledu velmi odlišně charakterizovány. Klasifikace (z lat. classis=třída + facere=dělat) je specifickým případem uplatnění logické operace dělení rozsahu pojmu, představující určitý souhrn třídy, oblasti, druhu. Klasifikace znamená zatřídění věcí, předmětů a jevů do skupin na základě jejich vzájemné podobnosti, nebo příbuznosti, které jsou vztahovou vlastností. Podobnost může být čistě formální, na základě verbálních znaků (abecední řazení), nebo může být vyjádřena vztahem nadřazenosti a podřazenosti (hierarchie vztahů). Třídit, klasifikovat (rozkládat) znamená, dívat se na předměty z hlediska jejich rovnocennosti, kterou nazýváme ekvivalencí. Pod pojmem třídění rozumíme hledání třídy k danému předmětu, nebo jevu. Věci, kterou jsou podobné, ekvivalentní, tvoří určitou skupinu – třídu. Klasifikace je od starověku považována za základní nástroj vědy. V současnosti rozlišujeme především vědeckou klasifikaci (klasifikaci věd), kterou od nejstarších dob vyjadřovaly filozofické systémy třídění věd, ovlivněné světonázorem svých tvůrců. Dále z ní vycházející systémovou klasifikaci, která představuje klasifikaci informačního obsahu, údajů a poznatků v jejich vývoji i ve věcné, časové, druhové a prostorové komplexnosti ve vztahu k příslušnému tvořivému procesu. Poslední je účelová klasifikace, která jistým způsobem simuluje informační paměť. Systémová klasifikace se odlišuje od účelové klasifikace tím, že 24 se používá pro zatřídění a organizování informací v konkrétních informačních fondech, čímž tvoří teoretický základ jakékoliv účelové klasifikace. Termínem indexování můžeme chápat celý postup zpracování dokumentu od jeho vstupu, přes celý proces analyticko-syntetického zpracování, až po výstup informace ze systému. Indexování se chápe jako překlad z přirozeného jazyka do informačního jazyka. Všeobecně se používá definice, která indexování chápe jako přiřazování souboru znaků, klíčových slov, termínů, nebo deskriptorů k dokumentu, za účelem jeho popisu a uložení, pro potřeby následného vyhledávání. Indexování, ve kterém se přiřazuje k dokumentům soubor indexačních termínů, můžeme považovat za klasifikační proces. Závěrem můžeme říci, že na základě mezinárodní normalizace byla vytvořena a je uplatňována v praxi jednoznačná definice, ve které se klasifikací rozumí jakákoliv metoda vytváření, nebo zachycení rodových, či jiných vztahů, mezi jednotlivými sémantickými jednotkami informací (pojmy), bez ohledu na stupeň hierarchie obsažený v klasifikačních systémech a způsob využití systému. Pojmy klasifikace a indexování je možné chápat skoro jako synonyma a vysvětlovat jimi metodické postupy v procesu transformace dokumentů a informačních požadavků, které jsou předpokladem pro vytvoření selekčního jazyka. Definice ovšem vysvětluje i to, že pokud pod indexováním rozumíme proces, ve kterém se na základě obsahové analýzy přiřazují lexikálním jednotkám příslušné symboly, v klasifikaci jde o definování vztahů mezi nimi. Na závěr ještě zůstává zdůraznit vztah klasifikace a indexování k selekčnímu jazyku a naopak. Pokud budeme selekční jazyk definovat jako prostředek, který dovoluje realizovat klasifikaci a indexování, můžeme zpětně považovat selekční jazyk jako nástroj klasifikace a indexování. 4.2. Klasifikace věd – základ SSJ v teorii a historickém vývoji Význam formální logiky je v tom, že je prostředkem pro poznání struktury myšlení a umožňuje vybudovat i umělé, formalizované jazyky, které mají význam právě v informační činnosti. Především svou teorií tříd je sice důležitá pro teorii i praxi selekčních jazyků, ovšem jako každá specifická metoda poznání je omezená. Studuje formální stavbu myšlenek, vztahy 25 dané formou výrazů a různé typy pravděpodobnostního usuzování, přitom je však její pohled v podstatě statický. Vyjadřovací systém chápe jako soustavu pevně danou a ne jako historicky se vyvíjející jazyk. Proto pro vytýčení zásad teorie zejména systematických selekčních jazyků sama nestačí a ukazuje se tady potřeba použít především zásady klasifikace věd, které jsou obsaženy v logice. 4.2.1. Tři etapy poznání světa člověkem a jejich odraz v klasifikaci věd – historický pohled Při hodnocení lidského poznání objektivní reality a jejího odrazu v dějinách vědy a klasifikace věd se uplatňuje historický přístup. V dějinách vědy se projevují a v různých etapách různě vystupují dvě protikladné tendence, a to na jedné straně tendence k integraci poznatků, k jejich sjednocení do univerzálního systému, ve kterém se odhalují jejich vzájemné vztahy a na druhé straně tendence k diferenciaci poznatků, k jejich dalšímu rozvětvení, k odlučování jedné skupiny poznatků od druhé. Proces tendence k integraci a diferenciaci poznatků a vědy můžeme všeobecně znázornit modelem aplikace analytické a syntetické metody na jednotlivých stupních lidského poznání. Analytická metoda je adekvátní tendenci k diferenciaci poznatků, syntetická metoda je adekvátní tendenci k integraci poznatků. Na základě těchto dvou tendencí a na základě zavedení analytických a syntetických postupů v poznání můžeme znázornit vývoj lidského poznání objektivního světy, vývoj vědy a z nich odvozený vývoj klasifikace věd v historickém průřezu následujícím způsobem: První stupeň vývoje poznání je charakterizován tím, že diferenciace věd neexistuje vůbec, nebo jen v zárodku. V podstatě existuje jediná nediferencovaná věda s výrazně filozofickým charakterem. Člověk nejprve sestavuje všeobecnou mapu světa, příroda se chápe jako celek. První příznaky diferenciace věd se objevují až v alexandrijském období. V dané situaci nemohl vzniknout problém klasifikace věd ve vlastním smyslu, protože jednotlivé vědy se neoddělily od jediné vědy filozofického charakteru. První známky diferenciace věd se v alexandrijském období projevily tím, že se od jediné filozofické vědy oddělila skupina exaktních věd, mezi kterými už byly zjevné vztahy, a to matematika, mechanika a agronomie, dále se odděluje chemie a alchymie. Druhý stupeň rozvoje poznání charakterizuje proces diferenciace věd, tj. jejich vyčleňování z původní jediné filozofické vědy. Ve středověku se tento proces zastavil, ovšem mnohem rychleji pak probíhal v období renesance. Období, ve kterém se nacházejí přírodní 26 vědy té doby, můžeme charakterizovat jako metafyzické. Převládá jednostranně analytické metoda výzkumu. Zkoumané předměty se rozkládají, člení na části, různé stránky celku. Druhé období je tedy stupněm analýzy. Analytický přístup vedl k hluboké diferenciaci věd, nastává rozvoj mechaniky, pozemských i nebeských těles, rozvoj matematiky, osamostatňují se fyzika a chemie, vzniká fyziologie a geologie. Třetí stupeň rozvoje poznání – je zároveň třetím obdobím klasifikace věd a trvá do současnosti. Po pohledu na přírodu jako celek a prvotním rozčlenění a analytickém zkoumání do jednotlivých vědních disciplín dospěli vědci ve třetím období před novou úlohu, a to sestavit mapu přírody synteticky. Cílem bylo odhalit vnitřní, organické souvislosti mezi jevy, přičemž musely být současně respektovány jednotlivosti poznání při analytickém způsobu výzkumu. V této etapě se projevuje tendence k syntéze věd. Pokrok vědy v daném období byl svázán s realizací myšlenky vnitřní jednoty dvou protikladných tendencí, tj. diferenciace vědeckých poznatků na jedné straně a jejich integrace na straně druhé. 4.2.2. Stručný přehled klasifikací věd v historickém vývoji Ve starověku se idea klasifikace věd zrodila v zemích starověkého Orientu, společně s prvními počátku vědeckých poznatků. Všechny klasifikace věd v daném období mají charakter subjektivních klasifikací. Pro charakteristiku, podle které se klasifikovaly předměty, jevy a procesy objektivního světa se vybíraly náhodné, ne však podstatné vlastnosti, či schopnosti, podle kterých člověk poznával účel, ke kterému směřovalo lidské poznání. Ve starověku existovala jedna nediferencovaná věda s výrazně filozofickým charakterem. Výrazně se s problémem klasifikace věd začalo pracovat v období starověkého Řecka, kde se začaly hromadit vědecké poznatky a byly zkoumány otázky důležitosti a pořadí jednotlivých vědeckých poznatků. Poprvé tuto otázku otevřeli pythagorejci, kteří byli nuceni vytvořit jisté pořadí mezi „sesterskými vědami“, tj. aritmetikou, geometrií, astronomií a hudbou. Pythagorejská stupnice věd se stala důležitá tím, že dala základ středověkému kvadríviu. Platón vytváří typicky subjektivní klasifikaci věd – člověk poznává třemi způsoby – rozumem, smysly, vůlí. Dle toho lze jednu filozofickou vědu klasifikovat na: dialektiku (produkt mozku); fyziku (produkt smyslů) a etiku (produkt vůle). Xenokratés rozděluje filozofickou vědu trichotomicky na logiku, fyziku a etiku. 27 Aristoteles pociťoval potřebu přesnějšího rozdělení vědy, přistupuje ke klasifikaci poznatků subjektivně a to na základě účelu, ke kterému směřuje lidské myšlení. Jeho třídění věd je považováno za první klasifikaci věd. Vědy rozděluje na teoretické, praktické a poetické. Teoretické mají cíl samy o sobě, dále dělí na matematiku, fyziku a metafyziku; praktické vědy pak pohlíží na činnost jako celek a člení se na politiku, etiku a ekonomiku, poetické vědy jsou členěny na poetiku, rétoriku a umění. Schematicky lze třídění zaznamenat následujícím způsobem: teoretické vědy praktické vědy poetické vědy matematika etika poetika fyzika ekonomika rétorika metafyzika politika umění Aristotelova klasifikace věd je trichotomická a stala se vzorem pro klasifikace v období starověku a středověku. V pozdějším novoplatónském období přichází se svou klasifikací věd filozof Porfyrios, který vytvořil vědecké třídění, jehož charakter je čistě teoretický a spekulativní. Zabývá se problematikou obsahu a rozsahu pojmu a s tím související pojmovou hierarchií. Vychází z nejširšího a nejvšeobecnějšího pojmu (podstaty) a třídí rozsah pojmu podle toho, zda má či nemá vlastnost, kterou nazývá tělesností. Typické pro jeho třídění je dichotomie, s podvojným členěním pojmů. Následovníci Porfyria se pokusili znázornit jeho myšlenky v tzv. Porfyriově stromu. Substance tělesná netělesná Tělo živé neživé Živé tělo citlivé necitlivé Živočich rozumný nerozumný Člověk Sokrates, Platón, aj., 28 Na počátku středověku byla klasifikace věd pod vlivem teologie. Církevní dogma bylo východiskem a základem veškerého myšlení. Dochází tedy k podrobnému členění teologie a postupně se přiřazují i světské vědy, které na školách tvořily obsah úvodního studia teologie. V tomto období byla vtvořena soustava sedmi svobodných umění (lat. septem artes liberales). Základ tvořilo kvadrivium – aritmetika, geometrie, astronomie a hudba; k němu přistoupilo trivium – gramatika, rétorika a logika (dialektika). Toto třídění se udrželo, nebo s určitými obměnami stále opakovalo u středověkých učenců a pro svou praktičnost se začalo používat také v knihovnách. Postupem času dochází v některých částech Evropy k jistému kulturnímu rozmachu. Vedle soustavy sedmi svobodných umě í ovlivnila středověkou klasifikaci věd i soustava vysokoškolského studia. První vysoké školy vznikají na počátku 12. století. Od 13. století pak vznikají univerzity s více fakultami – teologickou, právnickou, lékařskou a filozofickou. Výuku ovládala scholastika. V městech rostl zájem o vědu a literaturu, všeobecně stoupá zájem o knihu, vznikají soukromé a šlechtické knihovny => klášterní knihovny již nejsou jedinými centry knižní kultury. Nejpodstatnější pro vědeckou klasifikaci v období 12. až 14. století byla systematika vědy Rogera Bacona. Význam této klasifikace tkví v tom, že upouští od starých feudálních středověkých tradic a vrací se k antickým filozofům. Bacon ve své klasifikaci zahrnul a podstatně doplnil středověkou systematiku, otevřel cestu k dalšímu rozvoji věd. Pochopil možnost a nevyhnutelnost aplikací teoretických poznatků a přiřadil k teoretickým vědám aplikované vědy, které z nich vycházely. Zdůrazňoval možnosti praktické aplikace matematiky a fyziky. Základními vědami v jeho klasifikaci byly: filologie, matematika, fyzika a etika. Odkaz antické filozofie se neomezuje pouze na Evropu, ale také v Asii se objevují její nositelé. Avicena (Abu Ali Ibn Siná) vytvořil princip třídění, ve kterém jsou vědy zásadně rozděleny na teoretické a praktické. Dále dělí vědy na základě svého učení o třech poznávacích schopnostech člověka – paměť, fantazie a rozum. Jak můžeme vidět, tak středověké klasifikace byly v zásadě subjektivní a uměle vytvořené. To je možné také říci o klasifikacích věd, které vznikly na počátku novověku. To se týká také klasifikace Francise Bacona, který zdůrazňoval, že technické vynálezy podmiňující hmotný pokrok, bezpodmínečně předpokládají poznání přírodních sil. Na tomto 29 základě hlásal empirickou metodu ve vědě, a proto také vyzdvihl důležitost výzkumu přírodního dění. Snažil se podporovat myšlenku, že věda není jen pro vědu, ale jejím prostřednictvím je třeba zvětšovat moc člověka nad přírodou. Úlohou vědy je ovládat život. V pojetí Bacona bylo v případě klasifikace vědy potřeba vycházet výlučně ze zkušeností a z konkrétních faktů. Pouze organizovaným výzkumem a metodicky vedenou indukcí, se možné dosáhnout hodnotných poznatků o světě. Induktivní metoda měla být univerzálně platná pro všechny obory poznání a právě v objevení této metody lidského myšlení a poznávání je největší význam Baconova díla. Rozhodujícím činitelem v poznání světa lidský rozum, který přivádí člověka k vědeckému poznání skutečnosti. Přístup ke klasifikaci věd vysvětluje následujícím způsobem: paměť je základem historie, fantazie základem poezie a rozum základem vědeckého poznání. Nyní si uvedeme zkrácenou formu jeho klasifikace věd: 1. historie (paměť) a) přírodní dějiny - dějiny generační (nebeská tělesa, krajiny, moře, botanika, zoologie) - nepravidelnosti přírody - dějiny umění b) dějiny lidstva - církevní dějiny - vlastní dějiny lidstva - literární historie (dějiny literatury) 2. poezie (fantazie) a) epická b) dramatická c) mytologická – parabolická (bajky, alegorie) 3. věda, filozofie (rozum) a) přírodní teologie b) filozofie přírody - spekulativní (prvotní filozofie, fyzika a v ní i astronomie) - operativní, praktická (mechanika, magie a matematika) 30 c) filozofie lidská - filozofie člověka (člověk jako individuum, poměr duše a těla) - fyziologie (lékařství, tělovýchova, malířství, hudba) - filozofie ducha (rozum, smysly, logika, etika) d) filozofie společenská - konverzace (etika a způsoby chování) - konání/činnosti (vedení obchodu, osobních záležitostí) - státní správa (politika) Francouzská Encyklopedie Nebývalý rozmach věd a nové objevy v přírodních vědách vyvolaly potřebu diferenciace věd a nevyhnutelnost její klasifikace. Proto se za účelem skutečného vědeckého poznání se přistupuje k systemizaci a klasifikaci těchto poznatků. V daném období vzniká ve Francii významné dílo – Encyklopedie, jejímž zakladatelem a redaktorem se stal Denis Diderot a nejbližšími spolupracovníky byli Jean d´Alembert. V díle byla publikována Rozprava přípravy, která podává klasifikaci věd a je spojena právě se jménem d´Alemberta. Na sestavení Encyklopedie se dále podíleli Claudie Adrien Helvétius, Paul Henri Holbach, Francois Marie Arout Voltaire a Jean Jacques Rousseau. V daném období publikovali svá zevšeobecnění poznatků z přírodních věd i další významní filozofové. V tomto čase vyvolali významné obraty v názorech na svět objevy G. Galileiho a I. Newtona – v mechanice nebeských a pozemských těles, Boyla – v chemii, Rediho, Hooka, Harveye – v biologii. Mezi známé klasifikace věd patří i klasifikace Jana Amose Komenského, která byla určena především pedagogickým a didaktickým záměrům. Komenský touto svou klasifikací vstupuje do dějin jako zakladatel nové pedagogiky a uvádí dvě varianty této klasifikace – první je deska učiva a dále účel člověka. Při klasifikaci vycházel z konečného cíle, ke kterému člověk směřuje. V umělé a subjektivní klasifikaci Komenský vycházel z trojího poslání člověka: - poznat sebe a všechno – ke splnění tohoto cíle člověk potřebuje rozum (v klasifikaci zahrnuje metafyziku, fyziku, optiku, astronomii, geografii, chronologii, historii, ekonomika a politiku), dále řeč (gramatika, rétorika, politika) a v neposlední řadě i 31 práci (dialektika, aritmetika, geometrie, statika, hudba, řemesla, mechanika, malířství, písmo) - řídit sebe a všechno – ke splnění této oblasti člověk potřebuje člověk mravy a činnost (etika) - obracet sebe a všechno k bohu – zde člověk potřebuje zbožnost (teologie). Komenského klasifikace se nepoužívá v systematických selekčních jazycích a její význam vidíme hlavně v souvislosti s pedagogickými snahami Komenského. Saint-Simonův pokus o vědecký zdůvodněnou klasifikaci Rozvoj především přírodních věd přinesl výrazné změny v uplatnění metafyzického názoru na svět. Rozvojem biologického zkoumání padly hranice mezi jednotlivými vědami a naopak, ukázala se jejich vzájemná souvislost. V této době vytvořil první objektivní klasifikaci věd Henri Claudie Saint-Simon, který poprvé překonal subjektivní a umělé klasifikace. Jeho třídění věd vycházelo z materialistického poznávání. Objektivnost klasifikace věd spočívá ve faktu, že nehledá klasifikační charakteristiky v člověku a v jeho poznávacích schopnostech, ale v samotné skutečnosti. Klasifikuje předměty, jevy a procesy tak, jak v objektivní skutečnosti spolu souvisí a za sebou následují. Jeho uspořádání není umělé, ale zakládá se na skutečnosti, že v přírodě můžeme pozorovat narůstající složitost jevů, která má i svůj odraz ve vědeckém poznání. Náčrt posloupnosti věd Saint-Simona je: 1. vědy o vesmíru jako celku 2. vědy o sluneční soustavě 3. vědy o neorganické přírodě 4. vědy o organické přírodě 5. vědy o společnosti Význam Saint-Simonovy klasifikace věd spočívá v tom, že poprvé v dějinách klasifikace věd přináší objektivní materialistický princip, že je v ní vyjádřena jednota přírodních věd a souvislost mezi vědami vůbec, že je v ní objektivně určené pořadí věd podle uspořádání předmětů, jevů a procesů v samotné přírodě. Základní principy první objektivní klasifikace věd přebral francouzský filozof August Comte, který postupuje v klasifikaci věd od vnějšího světa, od přírody k člověku. Ve své 32 klasifikaci uplatňuje v zásadě umělý, subjektivní klasifikační princip. Klasifikuje vědy na teoretické a praktické; teoretické vědy dále dělí na abstraktní – hledají zákony jevů a konkrétní – které dané zákony aplikují na danou skutečnost. Praktické vědy jsou podtřídou k teoretickým vědám a v teoretických vědách konkrétně abstraktním, tj. abstraktní vědy tvoří základ celé klasifikace. Význam Comtovy klasifikace je v tom, že jsou v ní vyčleněny základní vědy, kterým reálně odpovídají základní formy pohybu hmoty v přírodě a společenský forma pohybu. Dále je možné význam vidět v tom, že uvádí vědy do správné, i když vnější souvislosti mezi sebou, ale ve stejné posloupnosti, v jaké se jedna z druhé vyvíjely. Jedinou slabinou je, že ignoruje všeobecné vývojové souvislosti. Pořadí věd v Comtově klasifikaci: (z roku 1830) – matematika, astronomie, fyzika, chemie, fyziologie, sociologie a (z roku 1851) – přírodní filozofie, kosmologie, matematika, astronomie, fyzika, chemie, biologie, sociologie. Z Comtovy klasifikace věd vycházela řada významných myslitelů, učenců a filozofů. U nás byl takto výrazně ovlivněn Tomáš Garrique Masaryk, který rozpracoval klasifikaci nejen teoretických, ale i konkrétních věd. Z hlediska systematických selekčních jazyků je však zajímavé, že TGM na žádost Ladislava Jana Živného navrhl deset základních věd pro účely knihovnického třídění, a to matematiku, mechaniku a fyziku, chemii, biologii, psychologii, sociologii, jazykovědu (jazykozpyt), estetiku, náboženskou vědu a filozofii (logiku, metafyziku). Další významné místo při tvorbě nových principů klasifikace věd má Georg Wilhelm Fridrich Hegel, základní myšlenkou jeho klasifikace věd je idea vývoje a ne idea vývoje přírody, ale absolutní, čisté idey. Příroda je pro Hegera jen záminkou a zkušební kámen poznání. Hegerův filozofický systém tvoří tři části – logika, filozofie přírody a filozofie ducha. 4.3. Teorie systematických selekčních jazyků Z toho, co jsme si vysvětlili je zřejmé, že dlouho v dějinách lidské společnosti převládaly umělé, subjektivně vytvářené klasifikace věd, které většinou složily ke klasifikaci filozofie, jako základní vědy. Až v díle Saint-Simona se objevuje první princip objektivního pohledu na klasifikaci věd a tím byla vytvořena cesta ke vzniku objektivních klasifikací věd, které v mnohém zahrnovaly vývojový a hmotný princip. 33 4.3.1. Systematický selekční jazyk hierarchického typu Pro účely teorie selekčních jazyků a především systematického selekčního jazyka hierarchického typu má význam hierarchie množin. V tomto smyslu se rozeznávají množiny prvního řádu, jejichž prvky jsou logickými individuy, dále množiny druhého řádu, jejichž prvky jsou množinami prvého řádu, množiny třetího řádu, jejichž prvky jsou množinami druhého řádu. Tak by bylo možné pokračovat, až bychom dospěli hierarchické stavbě množin, k hierarchicky nejvýše postavené množině množin, množině n-tého řádu. V tematickém okruhu selekčních jazyků se může rovnat univerzu lidského poznání a praxe. Systematický selekční jazyk hierarchického typu je pojmový jazyk, který spočívá na hierarchické klasifikaci, řídí se v podstatě rodově-druhovými vztahy a vychází z klasifikační analýzy. Klasifikační analýza si z množství objektivních vztahů mezi předměty a mezi předměty a jevy všímá pouze vztahů rovnocennosti (ekvivalence) a obsažnosti (subsumpce). Ekvivalence předmětů, jevů a věcí se posuzuje na základě společné vlastnosti, která odráží podstatné znaky věcí. Tento vztah se často také nazývá rodovým vztahem, společná vlastnost pak klasifikační vlastností (charakteristikou), kvalitou. Soubor takových věcí, kterým můžeme přisoudit klasifikační vlastnost k, nazýváme třídou T. Třída je potom množina předmětů, jevů, věcí, které jsou ekvivalentní mezi sebou. Množství rovnocenných předmětů určuje rozsah třídy a společná klasifikační vlastnost určuje obsah třídy. Mezi třídami na různých stupních se vytváří vztah obsažnosti – která se projevuje ve vztahu podřízenosti tříd. Třída T1 je obsažena v třídě T2, proto třídy, které jsou ve vztahu obsažnosti, nazýváme podřazenými. Od nejvyšší třídy, která se nazývá hlavní třídou, se vyžaduje, aby sjednocovala všechny nižší třídy určité oblasti a aby vyhovovala principu klasifikovatelnosti, tj. aby byla jen jednou nejvyšší třídou dané oblasti. Spojení prvku souvislou posloupností podřazených tříd a hlavní třídou nazýváme klasifikačním řetězem. Každá třída v ní je článkem klasifikačního řetězu a sled přiřazených tříd v základní společné třídě nazýváme klasifikačním řádem. Pojmy a jejich hierarchie Systematický selekční jazyk hierarchického typu jsme si definovali jako pojmový jazyk, co ovšem tento termín znamená? Pojem je odrazem vědeckého zákona, je to odraz předmětů a jevů ve vědomí. Jedná se o odraz věcí, které vyjadřují podobnost, určité prvky, které jsou společné předmětům. 34 Systematický jazyk hierarchického typu pracuje s pojmy, to znamená, že předměty, jevy, poznatky, informace získané v procesu obsahové analýzy vyjadřuje v pojmech. Každý pojem má svůj obsah a rozsah. Obsah tvoří souhrn podstatných znaků a vlastností a rozsahem jsou třídy předmětů, které mají znaky daného pojmu. Oba jsou v nepřímém poměru. Čím je pojem všeobecnější, čím více předmětů, jevů a jejich vztahů zahrnuje, tím větší, širší je jeho rozsah a tím menší, užší je jeho obsah. Přitom hierarchické vztahy se vyvinuly ze vztahu mezi rozsahem a obsahem pojmu. 4.3.2. Princip třídění a fazety Ve smyslu tematiky dokumentu a jeho jednotlivých informací můžeme klasifikovat kterýkoliv předmět aplikováním nějaké charakteristiky. Této charakteristice říkáme principium divisionis (princip třídění). Tento princip třídění (klasifikační princip) se může uplatnit na kterémkoliv místě hierarchie tabulek libovolného systematického selekčního jazyka. Předmět ve smyslu tematiky dokumentu pokládáme za množinu. Uplatněním příslušné charakteristiky vznikají při klasifikaci podmnožiny, tyto podmnožiny se v teorii systematického třídění nazývají fazetami. Důležité je, že kterýkoliv předmět, který klasifikujeme, umožňuje aplikovat větší počet charakteristik. Vždy záleží na tom, která charakteristika je pro daný předmět podstatná, aby jejím uplatněním vznikla příslušná fazeta. Proto se vytváří fazetová analýza určité oblasti úvahy na základě znalostí a literatury o ní. Výsledkem je určitý vymezený soubor charakteristik. Každá z nich může vytvořit na libovolných hierarchických úrovních soubor podmnožin, nebo fazet. Přitom charakteristiky, pokud jich je v předmětu více, je třeba uplatnit v určitém pořadí. Vedle charakteristik, které se aplikují v jednotlivých předmětech ve smyslu tematiky dokumentů, poznáme i takové charakteristiky, které se netýkají jen jednotlivých předmětů, ale jsou společné pro všechny předměty daného systematického selekčního jazyka, nebo pro jeho většinu. Jsou to společné charakteristiky pro všechny třídy selekčního jazyka. Jedná se o kategorie, které je možné aplikovat v rozsahu celého univerzálního systematického selekčního jazyka. Jejich aplikací vznikají společné fazety, především fazety prostoru, času a formy. Příklad: Fazetu prostoru je možné aplikovat všude tam, kde je třeba předmět blíže určit a charakterizovat tak, že ho blíže prostorově vymezíme a omezíme. Fazetu času 35 aplikujeme všude tam, kde se předmět blíže charakterizuje chronologickým omezením a vymezením. Fazetu formy aplikujeme tam, kde je třeba blíže charakterizovat předmět, a to tak, že bude omezený a vymezený podle způsobu uspořádání zaznamenaných informací. 4.3.3. Notace jako soustava znaků umělého jazyka Sestavu znaků konkrétního selekčního jazyka nazýváme notací. Notace je základním nástrojem systematického selekčního jazyka, je to číselný, nebo písemný symbol, vyjadřující obsah (tematiku) dokumentu. Notaci používáme k zjednodušení složitého klasifikačního procesu na převod z relativně těžkopádného přirozeného jazyka do jednoduššího umělého jazyka. Její smysl je v tom, že každá třída, podtřída má svůj znak, symbol, a v procesu indexování nemusíme vyjmenovávat plné názvy tříd, podtříd, ale použijeme pouze odpovídající znaky (symboly). Proto ji chápeme jako symbolik tříd vyjádřenou symbolikou znaků. Použití notace zvýhodňuje systematický selekční jazyk při hloubkovém indexování a zkracuje zpracování dokumenty, především pokud jde o složenou tematiku, kterou je potřeba vyjádřit kombinací vícerých pojmů. Notace se může skládat z číslic, nebo písmen. Podle toho, zda je jen číselná (numerická), nebo písemná (alfabetická), hovoříme o čisté notaci. Předností číselné notace je její mezinárodní srozumitelnost. Při použití obou typů znaků jde o smíšenou (alfanumerickou) notaci. Požadavky na notaci jsou: - aby byla jednoduchá a lehce zapamatovatelná - aby byla logická, aby vyjadřovala vzestupnost tříd (hierarchii daného systematického jazyka) vzestupností znaků - aby byla expanzivní, umožňovala zařazení nově vznikajících pojmů, tak aby se daly tabulky příslušného systematického jazyka doplňovat o nové předměty, jevy a procesy objektivního světa, které se v průběhu lidského poznání objevují a popisují se v dokumentech. Výklad pojmu notace se přibližně kryje s kódem, který je chápán jako jakýkoliv systém symbolů uplatňujících se v komunikačním procesu. Kódem je systém pravidel, které umožňují přenést zprávu z jednoho jazyka do cílového jazyka, tj. jazyka kódů. V komunikaci 36 informací, v jeho klasifikačním procesu vysvětlujeme kód jako symbolický výraz pro třídy. Kódy poskytují zkratku, jsou tedy zkráceným vyjádřením tříd. 4.3.4. Tabulky systematických selekčních jazyků Tabulky systematických selekčních jazyků jsou vlastně slovníkem, který umožňuje překlad lexikálních jednotek daných jazyků, tj. ze znaků umělého jazyka je možné převést do výrazů přirozeného jazyka a naopak. Tabulky obvykle obsahují dvě části, první část obsahuje systematicky, rodově-druhové uspořádaní lexikálních jednotek konkrétního systematického selekčního jazyka ve smyslu znaků umělého jazyka a uvádí také jejich verbální ekvivalenty v přirozeném jazyce. Obvykle bývá součástí první části tabulek i systematicky uspořádaný soupis pomocných znaků s jejich verbálními ekvivalenty. Druhá část je pomocný prostředek, který umožňuje vstup do systematické části, obsahuje abecedně uspořádané verbální ekvivalenty k lexikálním jednotkám systematického selekčního jazyka, tj. ke znakům umělého jazyka, na které odkazuje. V praxi existují různé druhy tabulek systematických selekčních jazyků, které se od sebe odlišují úplností tabulek, tedy rozsahem zahrnutých znaků.  Úplné tabulky – obsahují v úplném rozsahu všechny znaky daného systematického selekčního jazyka.  Zkrácené tabulky – zahrnují také všechny znaky daného systematického selekčního jazyk, ale jejich počet je zkrátí na předem stanovený rozsah.  Střední tabulky – zkracují počet znaků systematického selekčního jazyka, ale v menší míře, než zkrácené tabulky.  Speciální (oborové, odvětvové) tabulky – zaměřují se na přesně vymezenou část lidského poznání a praxe, tato část je pak zpracována velmi podrobně, s tím, že zbytek univerza se pouze vyjmenuje, či se jejich znaky velmi podstatně zkrátí. 4.3.5. Přednosti a nedostatky systematických selekčních jazyků Základním kritériem pro posouzení selekčního jazyka je výsledek, který je dosažen při vyhledávání dokumentů a informací. Proto má každý selekční jazyk své přednosti a nedostatky, na jejichž základě se pak uplatňuje v praxi. Proto se seznámíme se základními klady a zápory selekčního jazyků (především hierarchického typu). 37 Přednosti: - princip třídění je obyčejně používanou metodou lidí k určování předmětů či jevů (třídíme, aniž bychom si to uvědomovali) - tematické seskupení pojmů na základě obsahové podobnosti a příbuznosti soustřeďuje hledanou tematiku na jedno místo - poskytuje dvojjazyčný slovník, který se vytváří transformací z přirozeného jazyka do znaků selekčního jazyka - použití tabulek přibližuje jazyk k částečné formalizaci - výhodou je jednotné užití v celé síti knihoven, a to jak v národním, tak mezinárodním měřítku = vytváří se tím podmínky pro vzájemnou výměnu záznamů, s možností jejich zařazení bez potřeby přeindexování Nedostatky: - hierarchický princip omezuje vyjádření vztahů, připouští pouze vztah nadřazenosti a podřazenosti - indexování je možné vždy pouze z jediného hlediska - enumerativní charakter omezuje rozšiřitelnost daného jazyka, v důsledku nových objevů vyvolává těžkosti přizpůsobení nejnovějších pojmů vědy a lidského poznání – týká se to především zařazování informací z hraničních disciplín - nově vznikající vědecké disciplíny, které se ve vědě dostávají na úroveň tříd, v hierarchických klasifikacích se dostávají až na konec hierarchického řetězce - klasifikační struktura i tabulky jsou poznamenány dobou svého vzniku a těžko se přepracovávají, proto musí selekční jazyk předvídat další rozvoj poznání. Systematické selekční jazyky patří mezi nejstarší selekční jazyky a dodnes je jejich využití velmi široké. V současnosti je ukazují jeho přednosti při počítačovém zpracování informací, kdy systematické soupisné údaje jsou zapisovány do počítačových pamětí a umožňují tak široce spektrální vyhledávání celých katalogizačních či bibliografických záznamů. Na bázi počítačového zpracování umožňují systematické selekční jazyky jednodušší zpracování a vydávání bibliografických soupisů a dalších sekundárních informačních zdrojů. Podle znaků systematického selekčního jazyka je také možné zlepšit přístupy k informačním službám knihoven – poskytování rešeršních, referenčních, atd. služeb, kde na základě 38 specificky zaměřených požadavků uživatelů dochází k jednoduchému převodu určité tematiky, či předmětu do znaků systematického selekčního jazyka. 39 5. Dějiny systematických selekčních jazyků – od starověku po současnost O třídění nejstarších starověkých knihoven máme dnes málo zpráv, stejně jako o jejich existenci. O nejstarších knihovnách Egypta, Babylónie, Indie a Číny, stejně tak o evropských civilizacích se dovídáme především z archeologie. Přestože chybí dostatek přímých důkazů o knihovnách a jejich členění, ze zachovaných pramenů je možné usuzovat, že tyto knihovny měly už své katalogy a také používaly pro třídění literárních dokumentů systematické uspořádání a zpravidla se jednalo o systematické uspořádání podle vědních oborů uložených literárních pramenů. Z nečetných zpráv a hlavně dle archeologických vykopávek je možné usuzovat, že knihovna v Nippuru používala systematické třídění knih, kde byly literární prameny rozděleny následujícím způsobem: matematika, astronomie, medicína, lingvistika, historie, mytologie, astrologie, teologie. Rovněž je známo, že v některých částech Assurbanipalovy knihovny v Ninive byly hliněné destičky uspořádány podle obsahu a jednotlivá oddělení knihovny by mohla v dnešním slova smyslu zastupovat jednotlivé vědní disciplíny, třídy. Kromě knižního materiálu, zde byly uloženy také archivní materiály a podle dochovaných zpráv se usuzuje, že třídění materiálů odpovídalo následujícímu schématu: historie, zákon, věda, magie, dogma, legendy. O třídícím systému alexandrijské knihovny se dovídáme ze zpráv tehdejších historiků. Funkci knihovníka a bibliografa v alexandrijské knihovně zastával Zenodotos Kallichamos, který ve svém katalogu podal přehled celého fondu alexandrijské knihovny, která měla obsahovat cca 300.000 jednotek. Katalog byl používán jako kritická bibliografie tehdejšího řeckého písemnictví. Katalog byl rozdělen na: poezii, právo, filozofii, historii, rétoriku a různá díla. Středověké knihovny byly nejprve zakládány v kostelech, chrámech, klášterech a jiných církevních institucích, teprve později také na univerzitách. Dodnes se zachovaly katalogy středověkých klášterních knihoven, které ukazují, že tyto knihovny upřednostňovaly náboženskou a teologickou literaturu a světskou literaturu shromažďovaly pouze jako pomůcku k přípravě teologického studia. Katalogy středověkých 40 knihoven měly povahu systematického katalogu, protože knihy byly na policích uspořádány podle oborů. Tyto katalogy lze spíše chápat jako inventáře či místní seznamy. Obsahově bohatší byly knihovny středověkých univerzit, kde náboženská literatura byla postupně vytlačována literaturou mnoha oborů. Zásluhou knihtisku a jeho rozšířením v novověku velmi vzrostla knižní produkce. Zakládají a rozšiřují se knihovny, vznikají národní literatury psané v národním jazyce. Nahromaděná literární produkce podněcuje k mnohým pokusům o soupis veškeré světové a později národní knižní produkce. Tímto problémem se zabýval Conrad Gesner, který sestavil univerzální bibliografii a její uspořádání bylo abecední a systematické. V letech 1545–1555 vydává dílo „Bibliotheca universalis“ – univerzální bibliografie, ve které zpracoval a systematicky roztřídil veškerou jemu známou produkci a přístupnou literaturu v řečtině, latině a hebrejštině. Druhý díl bibliografie je zpracován systematicky a stal se vzorem pro mnohých dalších bibliografických systémů. Odráží vliv Aristotela a středověkého tříděni na trivium a kvadrivium. Na tomto místě je vhodné připomenout druhou velkou knihovnickou klasifikaci, kterou sestavil francouzský bibliograf Francoise Grudé de la Croix du Maine. Klasifikaci navrhl v roce 1583 jako projekt na zařízení knihovny Jindřicha III. Vychází z návrhu, že literatura bude uložena do 100 polic a v každé by mělo být 100 knih. Tento princip bývá některými autory chápan jako předchůdce desetinného třídění. Ovšem zde je nutné podotknout, že takto navržená klasifikace se nepřidržovala přísně desetinného principu v praxi a kromě toho, ve svém schématu zavádí Maine 7 základních kategorií se 107 podskupinami. Na Gesnerovo dílo navázal Gottfried Wilhelm Leibnitz, který byl nejen filozofem a matematikem, ale i významným knihovníkem. Byl jedním z prvních autorů, kteří se v Německu zabývali otázkami knihovnické klasifikace. Jeho navržený klasifikační systém byl určen pro „ideální knihovnu budoucnosti“. K rozvoji knihovnické teorie přispěl i francouzský bibliograf a spisovatel Gabriel Naudé. Vypracoval dílo „Advis pour dresser une bibliothéque“, ve kterém publikoval klasifikační systém třídění podle organizace vysokoškolského studia. Dále je pro potřeby selekčních jazyků nutné zmínit jméno Jacques-Charles Brunet, který vytvořil „Příručku knihkupce a sběratele knih“. Pro potřeby bibliografie a užití v praxi 41 systém třídění, který rozpracovává pět základních tříd: teologii, právo, vědy a umění, krásná literatura, dějiny. Na počátku 19. století vznikla také u nás větší bibliografická klasifikace. Jejím autorem je Josef Jungmann, který v rámci díla „Historie literatury české“ vytvořil klasifikaci, která je příkladem toho, jak se má klasifikace přizpůsobit knihám a ne knihy klasifikaci. Klasifikační systém je velmi propracovaný a originální. Řídícím prvkem klasifikace je samotný zpracovávaný materiál a důležitým je hledisko zpracování literatury. Základními třídami jsou filologie, umění ostatní vědy, historie a zeměpis, matematické vědy, přírodní vědy a lékařství, celá soustava je zakončena tradičními vědami. Novinkou Jungmannovy klasifikace je také přepracování notace – základní třídy jsou označovány velkými písmeny, podtřídy malými písmeny a skupiny řeckou abecedou. Z uvedeného vyplývá, že již od nejstarších období byly v knihovnách využívány třídící systémy, které byly většinou založeny na systematickém uspořádání literárních fondů – tj. uplatňoval se v nich systematický jazyk. Zároveň v daných knihovnických klasifikacích spočívají základy dnešních informačních selekčních jazyků. V nich se odhalovaly principy a formovaly zásady první zákony systematických selekčních jazyků. Ve druhé polovině 19. století dosahuje knihovnická klasifikace nový, vyšší vývojový stupeň. V tomto období získává teorie klasifikace své první pevné základy, které už můžeme považovat za základy teorie systematického selekčního jazyka. Vznikají klasifikace nového typu s originálními strukturami, které umožňují třídit knihovní fondy různých velikostí a s rozličným posláním. Rozvoj klasifikace vyvolala potřeba rostoucích knihoven, ale i stoupající význam bibliografie a samotné informační služby. V daných podmínkách vznikly klasifikace, které se vyznačovaly novou charakteristikou strukturou a podnítily rozvoj klasifikační teorie. Na konci 19. století pronikají nové směry do samotného systematického selekčního jazyka. Např. Ezra Abbot vybudoval katalog, ve kterém třídil literaturu systematicko-abecedně, jednotlivé vědní obory se v klasifikaci nezařazují podle logické návaznosti, ale v abecedním pořadí. Další výčet a popis vznikajících klasifikační systémů v průběhu 19. a 20. století nalezneme v dalším studijním textu, který bude součástí návazného předmětu Věcné zpracování dokumentů II. 42 Závěr Lidská společnost si vytvořila v průběhu své existence kromě přirozených jazyků také jazyky umělé. Ty jsou vytvářeny a dále používány pro různorodé cíle a potřeby. Na rozdíl od přirozeného jazyka, jehož pravidla se vytvořila na základě dlouhodobých zkušeností s jeho používáním, umělé jazyky vznikají opačným způsobem. Tvoří se podle pravidel, které je potřeba vypracovat před vlastním použitím umělého jazyka. Proto je podstatné znát základní teorii, metodiku a tvorbu selekčních jazyků, které jsou částí umělých jazyků. Selekční jazyky jako druh informačních jazyků slouží také k optimalizaci komunikační funkce jazyka. Jejich hlavní úlohou je popsat a zaznamenat informace rozličného charakteru a druhu, které je třeba dále uchovávat a vyhledávat. Pro uplatnění selekčních jazyků je potřebné spojit historický pohled, teoretický přístup a vytvořit kompaktní celek, který je možné aplikovat v praxi. Cílem učebního textu je pomoci studentům pochopit podstatu a funkce selekčních jazyků. Uvědomit si jejich místo a opodstatnění při zpracování dokumentů. Studenti mají také možnost seznámit s užitím věcných selekčních jazyků při organizaci informací a poznání v prostředí internetu, resp. webu. 43 Doporučená literatura: 1. Aplikace LCSH v on-line katalogu University of Oxford. Dostupný z WWW: . 2. Aplikace PSH v on-line katalogu Státní technické knihovny v Praze. Dostupný z WWW: . 3. ČSN 010174 Metody analýzy dokumentů: určování jejich obsahů a výběr lexikálních jednotek selekčního jazyka. 1996. 4. ECO, U. Theory of semiotics, Bloomingtom: Indiana University Press, 1967. 5. FOSKETT, A.C. The subject approach to information. London: Library Association Publishing, 1996. 6. Katalogizační politika Národní knihovny ČR v Praze. Dostupné z WWW: . 7. KATUŠČÁK, D.; MATTHAEIDESOVÁ, M.; NOVÁKOVÁ, M.: Informační výchova: terminologický a výkladový slovník. Bratislava: SPN, 1998. 8. KOVÁŘ, B. Základy obecné metodiky věcného pořádání informací. Praha : ÚVTEI, 1978. 9. KOVÁŘ, B. Současný stav a vývojové tendence věcného pořádání informací a selekčních jazyků. Praha : Státní knihovna ČSR, 1979. 10. KOVÁŘ, B. Věcné pořádání informací a selekční jazyky. Díl 1. Praha : ÚVTEI, 1981. 11. KOVÁŘ, B. Věcné pořádání informací a selekční jazyky. Díl 2. Praha : ÚVTEI, 1982. 12. LANGRIDGE, D.W. Classification. Its Kinds, Elements, Systems and Applications. London: Bowker-Saur, 1992. 13. PALÁTOVÁ, R.; KOVÁŘ, B. Informačné selekčné jazyky II. Bratislava . Slovenské pedagogické nakladateľstvo, 1985. 14. ŘEPIŠOVÁ, Z. Selekční jazyky – interní materiál. 15. SOSIG : Social Science Information Gateway. Dostupný z WWW: . 16. TAYLOR, A. Introduction to cataloguing and classification. Chapter 20, Other Classification Systems. Englewood: Libraries Unlimited, Inc., 1992. 17. UDC Consortium. Dostupné z WWW: .