Týden 8
6.9 Systémovost ve slovní zásobě (teorie lexikálního pole, tezaurus)
6.9.1 PROMĚNY SLOVNÍ ZÁSOBY A SLOVOTVORBA (ZMĚNY VE SLOVNÍ ZÁSOBĚ A
JEJÍ OBOHACOVÁNÍ)
Výklad o způsobech doplňování slovní zásoby (nebo také popisy utváření slova v češtině)
můžeme v tomto textu chápat spíše jako témata k samostudiu (obvykle se z lexikologického
popisu vyčleňují jako samostatná nauka, s níž se lze seznámit v rámci slovotvorby, tedy morfonologie).
V tomto smyslu sledujeme arbitrárnost a motivovanost, úlohu slov značkových a popisných,
význam fundace a motivace, integrálnost slovní zásoby a různé anomálie. Nauka o
tvoření slov potom zahrnuje (především) formálně-významové (slovotvorné) vztahy. V souvislosti
s tím je třeba definovat slovotvorné prostředky, způsoby a postupy, odlišit slovotvorný základ,
slovotvorný formant – a úlohu morfému v takto pojatém širším výkladu. Dále postihujeme
základní onomaziologické kategorie (mutační, modifikační a transpoziční) a problematiku slovotvorných
tříd, řad, svazků a čeledí. Právě odvozování je v této souvislosti chápáno jako nejčastější
postup tvoření slov v češtině.
SAMOSTATNÝ ÚKOL
Úkoly k textu 6/7
Vypište si další výklad z literatury:
Poučení ke slovotvorbě najdete např. u M. Dokulila (1962); dále u F. Daneše, M. Dokulila
a M. Kuchaře (1967), popř. u J. Bauera (1997), v Příruční mluvnici češtiny (1995, s.67-69) nebo
u M. Ikové (2007).
6/8 ... k teorii lexikálního a sémantického pole porovnejte např.:Čejka 1992, s. 22-23
6/9... k problematice tezauru: Manuál 1995, s. 65, 112
6.9.2 Přehled některých způsobů utváření slov, obohacování a doplňování
slovní zásoby
Ve vývoji jazyka dochází ke změnám významů stávajících slov i ke vzniku slov nových –v
souvislosti s utvářením nových skutečností, které potřebují pojmenování. Nová slova (neoloSlovní
zásoba, její členění, vrstvy ve slovní zásobě a systém
63
gismy) vznikají různě, ale do jazykového úzu (a tedy do povědomí uživatele) pronikají zpravidla
po dobu desítek let (zdomácňují, neutralizují se apod.); a to ne vždy se stejnou úspěšností.
U sociolektů (např. slangů) je vývoj rychlejší. Prvotní původ slov (podobně jako u malých dětí,
u kterých se někdy projevuje žvatlavost: původně jde rovněž o spontánní zvuky, o náhodný
projev mluvidel) bývá autentický, nekonvenční. Takto vzniklé projevy postupně mohou nabýt
významu konvenčních znaků.
Proměny slovní zásoby dále ovlivňuje také expresivita (emocionální zabarvení pojmenování),
popř. i zapojení citoslovečnosti (interjekcí); některé zvuky, které vyjadřující emocionální
stav člověka, se ve slovní zásobě objevují častěji (specifickým projevem tohoto procesu je i
zpěv a hudba). Citoslovečnost bývá spojená s projevy onomatopoie (zvukomalebnosti; napodobování
zvuků z okolí: fičet, bručet). Aspekt zvukomalebnosti ovlivňuje i oblíbenost slov
vzniklých jinak (např. traktor, trabant, mašinka). U některých slov by snad bylo možné mluvit
též o „pohybomalebnosti“ (sklápět).
Expresivitu slov a slovních spojení lze odlišovat (nejčastěji) z trojího pohledu:
1. slova expresívní se vyznačují především na základě svého citového (emocionálního)
příznaku (viz výše; dále např. Hauser 1980), který se přidružuje k jejich základnímu významu
pojmenovávacímu. Tento příznak může být jak kladný, tak i záporný.
1.1 Jako expresiva s citově pozitivním příznakem chápeme:
a) zdrobněliny (deminutiva), tvořené deminutivními příponami typickými pro zdrobňování:
• dvoustupňové (voda – vodička, mléko - mlíčko, zajíc – zajíček)
• třístupňové (oko – očko – očičko, slunce – slunko – sluníčko);
b) slova důvěrná, familiární, užívaná v důvěrném styku osob (miláček, zlatíčko, srdíčko)
c) slova domácká, hypokoristika, která se užívají v rodinném prostředí pro označení členů
rodiny obecnými názvy (maminka, strýček, dědoušek), nebo domáckými podobami jmen vlastních
(Jaroušek, Mařenka)
d) dětská slova užívaná dětmi a dospělými v kontaktu s nimi (papat, hajat, bumbat, bacat,
paci paci, spinkat)
e) eufemismy: mají zjemňující funkci. Jedná se o slova nahrazující výrazy nepříjemné nebo
nevhodné ve společenském styku, např. zesnout, skonat, indisponovaný apod.
Expresíva s citově záporným příznakem mohou být:
Zbyněk Holub - Lexikologie
64
• slova hanlivá, pejorativní – barabizna, herka, chvastoun, křáp
• slova zveličelá (augmentativa) tvořená většinou typickými příponami, např. chlapisko,
chlapák, babizna, psisko, kapřisko, divous, mrňous, tlusťoch, příšerný, děsivý
• slova zhrubělá – kecat, žvanit, držka (drzý člověk), ožralec
• slova vulgární – chlastat, žrádlo, hajzl
• dysfemismy – opak eufemismů, jsou jimi hrubé výrazy typu chcípnout, mrzák apod.
2. Expresivitu (citový příznak) můžeme hodnotit i podle sepětí se slovem, s jeho stavbou
nebo s kontextem:
Pokud je expresivita pojmenování spjata přímo se slovem, s jeho stavbou a s jeho základním
významem (nelze ji vydělit, aniž bychom změnili význam slova; expresivita je nedílnou součástí
významu slova), pak se jedná o tzv. expresivitu inherentní (kecat, žvanit, dědoušek), tedy
lexikálně sémantickou. Mezi označení věcí vyvolávající citové hodnocení patří též citoslovce
vyjadřující emoce, vůli (ach, fuj, br, hybaj).
V případě, že expresivita vyplývá až z určitého užití slova v kontextu, kdy se projeví jako
potencionální „přidaná“ složka významu, jde o tzv. expresivitu adherentní (kočka, děcko);
tento typ expresivity je součástí významu (sémie) dané lexie určitého polysémního slova. Jeden
význam je expresívní, základní význam je neutrální (panák, fasáda). Patří sem i citoslovce zvukomalebná
(bú, mňau, haf, vrkú) a slova od nich odvozená (bučet, mňoukat, hafat).
V případě, že hovoříme pouze o expresivitě slova v určitém neobvyklém kontextu (která se
běžně neobjevuje ani u lexií polysémního slova), jedná se o expresivitu kontextovou (např.
význam slova stroj nezahrnuje expresivní složku. Ale pojmenování lze v určitém kontextu expresivně
užít; např. ironicky: „To je teda stroj!“ – s důrazem na slabice slova stroj). K tomu
dále: Zima 1961
3. Pojmenování rozlišujeme též podle expresívního příznaku jednotlivých jazykových
rovin:
• expresivitu hláskovou, kdy se ve slově objevují hlásková spojení, která nejsou
běžná ve slovech neexpresívních, např. kňučet, hňup, ňouma, ťulpas, čučet, čumět,
chlemtat;
• expresivitu slovotvornou, s níž se setkáváme u slov zdrobnělých a zveličelých tvořených
příponami -ek, -ka, -ček, -čka, -ička, -ičko a -isko, -as, -och, -oun, -ous, -dlo,
-na, -árna)
• expresivitu morfologickou, která se týká stylově příznakového užití určitých flektivních
tvarů (koncovek deklinačních nebo konjugačních: „oni to dělaj...“)
Slovní zásoba, její členění, vrstvy ve slovní zásobě a systém
65
• expresivitu syntaktickou, kolokační (u specifických slovních spojení: kulatý obdélníček,
u vět a souvětí: „...kdybych to byl býval věděl,tak bych tam nechodil...“)
apod. (dále: LEX-OU)
Změny významu slova zahrnují:
• změny expresivní či stylové, citové či postojové příznačnosti slova (srov. výše; například
posun z hanlivého nebo kladného hodnocení na neutrální - a naopak; ze stylistického
zabarvení hovorového /slangového/ na pojetí obecné nebo spisovné)
• změny konotací (asociací) spojených s významem slova představují rozšíření nebo
zúžení významu. V lexikologii rozlišujeme tři základní druhy přenášení pojmenování;
patří k nim:
6.9.2.1 METAFORA
Metafora je rozšíření nebo přenesení významu pojmenování na základě vnější podobnosti
denotátů, jejichž podobnost se může týkat především:
o tvaru, např. u slov zub (ústa – pila), hřeben (na česání – hory – drůbeže) apod.;
o barvy u adjektiv cihlový (dům – barva), krvavý, růžový, vínový, sněhový, čokoládový
ap.;
o umístění, např. pata (část nohy – hory), hlava (část těla – sloupu) ap.;
o rozsahu, např. chloupek, kapka – malé množství, hromada, kupa, hora – velké množství;
o funkce - hlava (státu, rodiny), ručička (u hodinek).
Časté jsou tu metafory odvozené z pojmenování částí těla (hlava rodiny, noha stolu). K metaforickému
přenášení dochází i mezi typickými skupinami entit, kdy se například pojmenování
o zvířat přenáší na rostliny (kočičky, kuřátka, lišky) nebo osoby (medvěd, slon, liška);
o věcí na osoby (klacek, buchta, pařez), části těla (lopatka, koš, bubínek, stolička);
o částí těla na věci (hlava, ucho, krk, rameno, hrdlo);
o zvířat na věci (beran, kůň).
K metaforickému přenášení pojmenování dochází i u jiných slovních druhů. Jedná se o:
o přídavná jména – ocelové srdce, olivová pleť, měkká povaha, horoucí láska;
o příslovce – vřele milovat, sladce se usmívat, ohnivě červený;
o slovesa, u nichž se metafora projevuje jako tzv. personifikace (tj. spojení sloves vyjadřujících
děje živých podmětů s podměty neživými), např. hodiny jdou, slunce vychází,
vítr hvízdá, čas utíká.
Zbyněk Holub - Lexikologie
66
6.9.2.2 METONYMIE
Metonymie spočívá v přenášení významu pojmenování na základě vnitřní souvislosti denotátů
(např. význam abstraktního pojmu profil se přenese na typ kovodělných polotovarů;
nebo z názvu činnosti /obchod/ se přenese na místnost, kde se činnost vykonává - ve významu
„prodejna“). Na rozdíl od metafory se vyskytuje pouze u substantiv.
Rozlišujeme tři základní typy:
Metonymie strukturní, která spočívá k přenášení pojmenování z abstraktních skutečností
na konkrétní předměty, kdy se např. pojmenování
• děje přenáší na osoby tento děj vykonávající (hlídka – hlídání, pak ti, kteří hlídají,
vláda – vládnutí, pak kabinet ministrů, stejně obrana, rada);
• děje na věc (psaní – děj, pak dopis, podobně práce, učení, čtení);
• děje na místo děje (zatáčka, západ, průjezd, vjezd, podchod);
• vlastnosti na nositele vlastnosti (mládí, sladkost, dobrota, nečistota, ostří, hloupost);
• povolání na místo jeho provozování (pekařství, řeznictví, cukrářství);
• materiálu na výrobky (zlato, hedvábí, liška, činčila, sklo, porcelán);
• nádoby na její obsah (mísa, pohár, sklenice).
Metonymie kontextová, spočívající v přenesení jména autora na název jeho díla (např. číst
Čapka, recitovat Seiferta, poslouchat Bacha), nebo zeměpisného jména na událost, která se tam
stala a později se stala symbolem (Waterloo, Bílá hora, Rubikon)
Metonymie etymologická (historická), kdy dochází k přenesení vlastních jmen osobních
a místních na obecné označení osob a věcí.
Vlastní jména osobní se stávají označením typu:
• jména historických osobností: donchuán, kasanova;
• jména mytologických postav: venuše, titán;
• jména náboženských postav: goliáš, david, lazar, jidáš;
• jména literárních postav: donkichot, romeo, otelo.
Vlastní jména osobní se stávají označením věci
• fyzikálních jednotek: watt, ampér, volt, hertz, pascal, ohm;
Slovní zásoba, její členění, vrstvy ve slovní zásobě a systém
67
• výrobku, vynálezu: rentgen, mansarda, bojkot, sendvič, lynč.
Vlastní jména místní se přenášejí na věci, které se tam vyrábějí, pěstují, apod.:
• látky, textilie: damašek, manšestr, kašmír;
• vína, alkoholické nápoje: malaga, bordó, burgund, šampaň, koňak, tokaj;
• sýry: ementál, eidam, parmazán, rokfór;
• jiné: míšeň, panama, havana, plzeň.
6.9.2.3 SYNEKDOCHA
Synekdocha je založena na přenášení pojmenování na základě rozsahových poměrů. Pojmenování
části denotátu může být zaměněno za pojmenování jeho celku, nebo naopak. Podle toho
rozlišujeme 2 typy synekdochy:
a) část za celek – např. výrazy hlava, krk, duše místo člověk; střecha, práh, pro celý domov
(„Ta noha už je zdravá a půjde dnes domů.“)
b) celek za část – např. tabák, kdy označení celé rostliny je užito jen pro část, podobně čaj,
bavlna, len („Seběhlo se celé město.“)... dále: LEX-OU
Specifickým případem metafory nebo metonymie je apelativizace, kdy slovo odvozené z
vlastního jména získá obecný význam (xerox, donkichot, šovinista).
O naplnění obsahu se jedná i v případě, kdy se do šíře pojmu (bez změny významu) „vejdou“
nové jevy, o jejichž existenci nebo vzniku původní uživatelé neměli tušení, a jádro významu se
přenese k nim (např. slovo letadlo ve staročeštině znamenalo ptáka).
V případě odvozování od původních slov může docházet k tvořivému přizpůsobování slov,
popř. k jejich komolení. Mění se i celkové tendence vývoje jazyka. Formální změny pojmenování
mohou mít charakter pravidelného i specifického procesu:
• disimilace – „rozdělení“ původně jediného slova na dvě - s různými významy, např.
utvoření slov legrace a rekreace z na základě původního pojmenování „rekrací“ (latinského
označení pro školní přestávku)
• pravidelné odvozování probíhá s pomocí afixů (přípon - sufixů, často flektivních,
tvarotvorných - koncovek; předpon - prefixů, popř. na základě jiného typu flexe)
• skládání (kompozice) slovních základů (kořenů, radixů; to je typické zejména pro
němčinu)
• spojování kořenových i nekořenových částí slov nesoucích významové asociace, kterých
nabyly v jiném celku (např. workoholismus vzniklo podobností s alkoholismem,
Zbyněk Holub - Lexikologie
68
standardní slovotvorbou by vznikl například workismus). To je typické pro zejména
americkou angličtinu, v níž je smysl pro klasickou etymologii oslaben. Může se jednat
o tzv. makaronismus (užívání prvků nebo pojmenování dvou nebo více jazyků v
jednom souvislém textu. Vzniklý (hybridní) jazyk se označuje jako makaronština.
• často jsou česká slova ovlivněna cizí (přejatou) příponou; v takovém případě se jedná
o proces hybridizace (jde o slova hybridní, např. s příponou –átor: vědátor, původně
také -ita: táborita)
Kombinované procesy mohou být rovněž různého druhu:
1. analogie – přizpůsobování slova nebo tvaru slovu s podobným významem (rozinka – hrozinka
podle slova hrozen; srov. výše: lidová etymologie)
2. kontaminace – dvě slova s podobným významem se vzájemně ovlivňují nebo splynou (tip a
typ, bujarý z bujný a jarý, rozřešení a rozhřešení, krumpáč z něm. der Krumm + kopáč, hřbitov
z břítov a hrob, hřbít... srov. výše).
3. tabuová slova – původní pojmenování označovala nebezpečné nebo mocné (transcendentní)
jevy. Měnila (zaměňovala) se; užití původní formy pojmenování bylo tabuizováno. Vznikaly
tak podoby:
▪ zkomolené (blecha, herdek, safra)
▪ opisné (medvěd, zmije, zubatá)
▪ eufemistické (boží posel pro blesk, hostec pro revma, zlom vaz)
4. Samostatným problémem je přejímání cizích slov a jejich postupné přizpůsobování hostitelskému
jazyku; jedná se o přizpůsobení (asimilaci) pravopisu, výslovnosti nebo tvarosloví:
4.1 přizpůsobení významově podobným hostitelským slovům (sexuální harašení - harashment)
4.2 „doslovné“ překládání cizích slov - kalky (například orto-grafie = pravo-pis)
Další tematické okruhy zahrnují problematiku kompozit a jejich dělení, tedy procesu kompozice,
ale též abreviace a ostatních způsobů kondenzace, popř. univerbizace a multiverbizace
v současné češtině. Dalším problémem je tu i internacionalizace a nacionalizace ve slovní zásobě
češtiny, popř. vliv neologie (neologismy: srov. výše; např. Martincová a kol. 1998). S tím
souvisí i charakteristika vývojových tendencí v současné slovní zásobě češtiny (např. Cuřín,
Novotný 1981). Obecně problematiku řeší i příslušné kapitoly (např.) Encyklopedického slovníku
češtiny (2002) nebo Příruční mluvnice češtiny (1995).
Slovní zásoba, její členění, vrstvy ve slovní zásobě a systém
69
Kvantitativní vztahy ve slovní zásobě sledujeme v souvislosti s frekvencí slov v češtině
(srov. např. Čermák, Křen 2004) a s možnostmi aplikace lexikální statistiky (základní pojmy
např.: Klimeš 1998, s. 39-52).
Uveďte všechny frekvenční hodnoty slov: hledat, kámen, stopa, vlas, dřevo. Vysvětlete, co
znamená spojení rankové označení – a najděte je pro uvedená slova; seřaďte tato slova podle
frekvenčních údajů (od nejčastěji po nejméně často užívané).
PRO ZÁJEMCE
Synchronní a diachronní přístup ve slovní zásobě
Synchronní a diachronní přístup představují dva základní přístupy k lexikonu. Diachronní
analýza zkoumá slovní zásobu z hlediska původu, hledá jednotlivé vrstvy a vývojové fáze. Synchronní
analýza se zabývá lexikonem v jeho definitivní podobě a zaměřuje se především na
celkové pojetí slovní zásoby.
Diachronní analýza byla v minulosti ovlivněna historicko-kritickou metodou. Zabývá se vývojem
slovní zásoby příslušného jazyka od jejích nejstarších podob po současný (ustálený) model.
Historicko-kritická metoda vedla nejprve k popisu vývoje lexémů na základě jednotlivých
pramenů. Postupně převládl komplexnější přístup. Lexikon je hodnocen z historického hlediska
(procesy vývoje lexikálních jednotek) i kriticky (s využitím objektivních vědeckých metod,
které umožňují hlubší odhalení smyslu užití lexémů). Při diachronní analýze lexikonu je kromě
výkladu historických okolností vývoje slova (slovního spojení) nutné sledovat okolnosti jeho
vzniku, všímat si jazykových zvláštností (popř. kontextu užití jednotky, ustálených obratů),
různých pojmenování pro stejnou skutečnost nebo postavu apod. Dále je nutné zkoumat historickou
relevanci kontextů (užití lexikální jednotky ve výpovědi). Historicko-kritická metoda
pomáhá objasňovat postupný vývoj pojmenování a transformace jeho sdělení s ohledem k měnící
se kulturně-historické a společenské realitě. Pomáhá odhalit jednotlivé vrstvy ve vývoji
lexému, jejich specifické sdělení, přepracování vrstev předchozích a změny paradigmatu. Diachronní
přístupy v poznání slovní zásoby může ovšem klást důraz i na paměť jazykového společenství,
na vliv tradice a stereotypů v běžné každodenní komunikaci, na význam klišé, na
specifické texty (např. na texty folklórní, na frazeologii, popř. na menší útvary- např.na
anekdoty)...
Synchronní analýza přistupuje k pojmenování v jeho současné podobě, vidí jednotku jako
strukturovanou koherentní veličinu. Jeho jednotlivé části stojí ve vztahu, nejedná se ale o uzavřený
systém, konkrétní lexém stojí ve vztahu k ostatním lexémům. Synchronní analýza hledá
význam pojmenování (sdělení) v jeho struktuře.
Pod synchronní analýzou rozumíme:
Zbyněk Holub - Lexikologie
70
• rozbor kontextu (kolokace) s ohledem na pojmenování
• sémantickou (popř. i pragmatickou, situační) analýzu
• analýzu funkce pojmenování
Při zkoumání slovní zásoby je možno se zaměřit na typickou strukturu slovní zásoby (centrum
– periferie, výběr slovní zásoby v současném kontextu, odchylky od ustáleného slovníku
/anomálie... apod.)
6.10 Kvantitativní vztahy ve slovní zásobě
Pojem kvantitativní lingvistika se ujal v rámci matematické lingvistiky, která se u nás konstituovala
po 60. letech 20. století při uplatňování tzv. nových metod v lingvistice. Již na začátku
první poloviny 20. století se tu z kvantitativních metod využívalo zvláště statistikya mluvilo
se někdy o tzv. statistické lingvistice. Pozdější termín kvantitativní lingvistika prošel složitým
vývojem zvláště v druhé polovině 20. století.1
Kvantitativní vztahy ve slovní zásobě sledujeme (v souvislosti s posledně zmíněným zákonem)
právě v oboru kvantitativní lingvistiky, o níž se někdy mluví též jako o Zipfově lingvistice;
podle amerického lingvisty německého původu George Kingsleye Zipfa (1902-1950) z
Harvardovy univerzity, který ve 20. a 30. letech 20. stol. zkoumal relativní frekvenci hlásek.
Zajímal se o psychologické a fyziologické faktory ovlivňující produkci a percepci řeči. Jeho
koncepce se však dostaly do popředí vědeckého zájmu až ve II. polovině 20.století. Podle Zipfa
1 Solidní základy k české kvantitativní lingvistice lexikální položil ovšem již v první polovině 20. století (jak po
stránce věcné, tak i metodologické) anglista a obecný lingvista Vilém Mathesius (l882–l945). Významným přínosem
pro vývoj kvantitativní lingvistiky byly též Teze Pražského lingvistického kroužku (l929), rozpracované
dále jeho členy následovníky. Na 6. mezinárodním kongresu lingvistů, který se konal ve dnech l9.–24. července
l948 v Paříži, se mimo jiné konstatovalo, že se v lingvistice dosud málo užívá kvantitativních metod a že kvantitativní
data chybějí v dosavadních popisech jazyků; také i v lexiku. Práce týkající se kvantifikace jazykových
jevů měly být proto nadále ústředně koordinovány a při sběru materiálu, jeho zpracování a analýze mělo být využito
zejména statistických metod a v dnešním slova smyslu i výpočetní techniky. Na zmíněném pařížském kongresu
byla zřízena i zvláštní sekce pro kvantitativní lingvistiku a jejím sekretářem byl zvolen prof. B. Trnka; byl
také pověřen sestavením první bibliografie kvantitativní lingvistiky (l950). Tyto celkem slibné perspektivy byly
v Československu přerušeny politickým vývojem. Využití statistických metod při studiu jazyka bylo pokládáno
za projev „mechanistického pozitivismu a formalismu“, a proto bylo odmítáno. Teprve 60. léta 20. století přinesla
„obrození“ české kvantitativní lingvistice uplatněním tzv. nových metod v lingvistice. Symptomem toho
bylo, že r. l96l mohl vyjít tiskem FSČ a v ÚJČ bylo r. l96l založeno oddělení matematické lingvistiky (podle
Marie Těšitelové).
Slovní zásoba, její členění, vrstvy ve slovní zásobě a systém
71
lze na lidský jazyk nahlížet prostě jako na sled entit podobných třeba atomům, přičemž využíváme
řeči čísel (dále ZIPF)
PRO ZÁJEMCE
Zipfovy zákony2
Základní Zipfův zákon předpokládá, že v přirozených jazycích platí určité statistické rozdělení.
Pokud je tento předpoklad správný, potom je hodnota součinu relativního pořadí slova v
textu a jeho frekvence (násobek výskytu slova) obvykle konstantní.
Například:
• z hlediska frekvence užití slov v textu může platit:
• nejčastěji se vyskytující slovo (X) je v textu obsaženo 100krát
• druhé slovo v pořadí (Y) bude tedy obsaženo přibližně 50krát
• třetí slovo (Z) 33krát
• čtvrté slovo (A) 25krát
• ... a tak dále...
Podobné rozdělení bychom zřejmě dostali při analýze jakéhokoliv textu. Především ve
střední části frekvenční škály (tj. mimo slova na úplném začátku a konci) vyhoví Zipfovu zákonu
jak Odysseus Jamese Joyce, tak i pražský telefonní seznam. Později byla k tomuto pravidlu
dodána celá řada upřesňujících modifikací, na kterých se výrazně podílel například slavný
otec fraktálů, francouzský matematik Benoßt Mandelbrot.
Základní Zipfův zákon tak vyjadřuje vztah mezi pořadím klíčových slov uspořádaných podle
frekvence jejich výskytu. Poukazuje na skutečnost, že základ lexikonu vytváří relativně malý
počet silně frekventovaných slov. Umožňuje vypočítat konstanty pro jednotlivá slova z vybraného
textu (podle frekvence a pořadí výskytu).
2 Obecněji lze ale říci, že zákonitosti růstu, rozptylu a stárnutí určitých souborů (tedy i lexikonu; nejčastěji však
obecně publikací) shrnují tzv. bibliometrické zákony:
•Bradfordův, který sleduje rozptyl informací
•Lotkův, jenž se týká měření autorské produktivity
•Zipfův (základní), který se vztahuje k lingvistické frekvenční analýze a k indexaci; dnes také též k modelům
vyhledávání v internetu.
Zbyněk Holub - Lexikologie
72
V širším smyslu se ovšem nejedná o jediný zákon, ale o komplex pouček. Hovoříme pak o
Zipfových zákonech, které upozornily na vztah:
• mezi frekvencí slov a jejich pořadím
• mezi frekvencí slova a počtem různých slov, která tuto frekvenci mají
• mezi frekvencí slova a počtem jeho významů
V souvislosti se Zipfovými zákony musíme odlišit jednotlivé typy analýzy:
Obsahová analýza se zaměřuje na porovnávání obsahů dvojic či trojic textů (ve smyslu
hloubkového vysvětlení jednotlivých pojmů)
Lexikografická analýza – sledujeme klíčová slova ve shodných textech.
Lingvistická analýza - každému pojmu z daného terminologického slovníku (vytvořeného
při lexikografické analýze), který by mohl nějakým způsobem odkazovat na praxi, přidělíme
číselnou hodnotu na základě počtu splněných kritérií (na stupnici hodnot v rozmezí 1 – 5, přičemž
1 = splněna všechna kritéria). Určíme kritéria, podle kterých se každý z vybraných pojmů
hodnotí...
Podle Zipfovy teorie existuje dále zákon zkracování (abreviace), který operuje ke zvýšení
účinnosti verbální komunikace. Redukce v délce slov je pro komunikaci natolik efektivní, že
kompenzuje pravděpodobnost konfúze, kterou mohou abreviace s sebou přinášet. Aby nějaká
zkratka byla přisvojena určitou částí populace, musí růst frekvence používaného termínu a komunikace
mezi jeho uživateli musí zajistit souhlas, pokud jde o její nejvýstižněji formu. Jestliže
abreviace není ustálena a je použita v komunikaci, dochází ke zkreslení či poškození vyslané
zprávy.
V této souvislosti lze připomenout (např.) počítačové metody hledání nesprávných slov v
textu (kontroly textu v počítačovém souboru).
Při kontrole textu se obvykle porovnává každé slovo textu se správnými slovy ve slovníku.
Pokud je slovo nalezeno, považuje se za správné, pokud ne, považuje se za chybné.
Kontrolu textu je možné rozčlenit:
• Neinteraktivní kontrolu, prováděnou dávkově naráz pro celý dokument
• Interaktivní kontrolu, prováděnou slovo po slově v čase psaní dokumentu
Neinteraktivní kontrola textu s použitím frekvenčního slovníku
Slovní zásoba, její členění, vrstvy ve slovní zásobě a systém
73
Tato metoda patří k nejjednodušším. Pro dokument se vytvoří tzv. frekvenční slovník, tedy
seznam slov obsažených v dokumentu, uspořádaný sestupně dle frekvence výskytu v dokumentu.
Na konci seznamu se nacházejí slova, která se v dokumentu vyskytovala velmi zřídka,
tedy
• slova vzácně se používající
• slova nesprávně zapsaná
Tato metoda může kromě oprav dokumentů sloužit i pro poloautomatické získání slovníku
správných slov. Slovník správných slov získáme na základě několika dokumentů následujícím
postupem:
1. Vytvoříme prázdný slovník správných slov
2. Pro předložený dokument vytvoříme frekvenční slovník slov, která se ve slovníku správných
slov nenacházejí.
3. Prohlédneme konec frekvenčního slovníku a vyřadíme chybná slova
4. Zbylá (správná) slova zařadíme do slovníku správných slov
5. Pokud máme k dispozici další dokument, pokračujeme bodem 2.; jinak proces ukončíme.
Neinteraktivní kontrola textu s použitím dvojitého slovníku
Pokud máme k dispozici slovník správných slov, je možné vytvořit pro kontrolovaný dokument
abecední seznam použitých slov a porovnat v něm obsažená slova se slovníkem správných
slov. Slova, která ve slovníku správných slov nejsou, se zařadí do výstupního seznamu.
Protože jsou oba slovníky seřazené dle abecedy, je možné porovnání slovníků provést v lineárním
čase vzhledem k součtu délek obou slovníků.
Interaktivní kontrola textu
Při interaktivní kontrole je nutné porovnávat každé napsané slovo zvlášť. Protože slovník
správných slov je obecně příliš veliký (řádově desítky až stovky tisíc slov) je i logaritmický
čas nutný pro vyhledání každého ze slov příliš dlouhý. Při realizaci interaktivní kontroly se
proto uplatňují různé urychlovací metody.
Hašování
Slovník je rozdělen pomocí hašovací funkce na několik menších slovníků, ve kterých se dohledává
v logaritmickém čase. Např. program spell, který je součásti systému OS Unix, používá
funkci, jež dává stejné hodnoty pro stejně dlouhá slova začínající stejnými dvěma znaky.
Strom
V tomto případě je slovník organizován jako strom. Kořen stromu má až 26 (pro anglickou
abecedu) potomků, které reprezentují různé první znaky slov ve slovníku. Každý z těchto uzlů
má dalších až 26 potomků pro možná druhá písmena slov atd.
Zbyněk Holub - Lexikologie
74
Protože některá správná slova mohou být prefixem jiných, každý z uzlů ve stromě si musí
„pamatovat“, zda v nich může či nemůže správně zapsané slovo končit.
Hierarchický slovník
V tomto případě se využívá faktu, že v jednom dokumentu nejsou všechna možná slova existující
ve slovníku a ty v dokumentu se vyskytující se vyskytují různě často. Tento fakt je základem
empirického Zipfova zákona.
Při porovnávání existují proto 3 slovníky
• Úplný slovník, obsahující několik desítek tisíc slov
• Slovník slov dosud nalezených v dokumentu, obsahující cca 2000 různých slov
• Slovník často používaných slov, obsahující cca 200 nejčastěji používaných slov
Nejmenší slovník je možné udržovat během kontroly v operační paměti počítače. V něm se
nalezne kolem padesáti procent všech slov v dokumentu. Dalších zhruba 45 procent slov se
nalezne až při následném prohledávání slovníku dosud použitých slov a jen v pěti procentech
případů je nutné prohledávat úplný slovník.
Pokud se slovo nenajde ani v největším slovníku, je považováno za chybně napsané.
Empirický Zipfův zákon je založen na pozorováních prováděných na velkých textových datech
(např. pro nějaký dokument můžeme sestavit frekvenční slovník uspořádaný podle klesající
frekvence slov, přičemž využijeme platnosti tohoto zákona).
Zipf přiblížil lingvistiku přírodním vědám ještě jedním způsobem. Nejen organismy v rámci
„darwinovské evoluce“, ale i jazyk je podle něj „selektován“ na ekonomičnost a úspornost.
Zipfův princip nejmenšího úsilí („Principle of Least Effort“) zhruba tvrdí, že mluvčí se snaží
své myšlenky vyjádřit tak, aby se při tom nemusel moc namáhat. V jistém ohledu je jeho konkurentem
naopak příjemce sdělení, jehož zájmem je maximální možné porozumění. Tady se
ovšem vnucuje námitka, že řada lidí mluví vysloveně pro vlastní potěšení - i tehdy, když nemají
vůbec co říci.
Zipfovy myšlenky se staly inspirací pro další vědní obory. Jeho přínos jazykovědě byl ovšem
objeven s určitým zpožděním. Teprve poté, co matematikové, fyzikové a další přírodovědci
odkryli ve svých oborech analogie k zákonům, které Zipf formuloval, prorazily jeho myšlenky
také v lingvistice; srov. např. Zipf (1949 aj.), Uhlířová (2002), Hřebíček (2002).
SAMOSTATNÝ ÚKOL
Úkoly kontrolní
Slovní zásoba, její členění, vrstvy ve slovní zásobě a systém
75
6/11... A. Najděte k následujícím pojmenováním ekvivalenty v cizích jazycích: kuchař, chlapec,
obličej, slečna, žák, hostinec, pozorovat, poslanec, křižovatka, košíková, hlediště, jaderný,
prázdniny
B. V této kapitole jste našli odkaz na výklad o slovotvorbě; prostudování příslušné literatury
bylo uloženo k samostudiu. V souvislosti s tím splňte následující úkoly:
6/12...Určete druh motivace u motivovaných pojmenování a odlište pojmenování nemotivovaná:
běloch, vysoké napětí, povaha, jed, zlý, vidět, židle, učitel, dům, šťastný, zeměkoule, krajíc,
pivo, krajka, bublina, prásk, les, kukat, kruh, brousit si zuby, stárnout, mostka, voda, strana,
sykot, malba, zeměkoule, vodovod, elektrický proud, minerální voda, hrádek
6/13... U následujících pojmenování určete (ne)motivovanost a sestavte slovotvorné řady,
svazky a čeledi: písnička, ruka, svoboda, výstavba, švec, znak, horal, noha, rozbitý, maličký,
astro, čerpadlo, jít, pravda, zajíc
6/14... Seřaďte příbuzná slova do skupin: mladočech, nápis, lidový, zavodnit, zmodrat, mládí,
písmo, lid, brát, vodní, hradit, pisatel, mladost, lidnatý, zavodnit, vybrat, nepřeberný, hráz, výbor,
písař, vodník, lidičky, modrý, čecháček, modřinka, píšící, dějepis, lidový, nápis, výběrčí,
mladičký, sbírat, povodí, nelida, vyhrazený, pravopis
ÚKOL K ZAMYŠLENÍ
6/15...
Pokuste se najít odpovědi na následující otázky:
1. Jakými dalšími způsoby lze interaktivní počítačové postupy aplikovat na lexikologii a
lexikografii?
2. Co vlastně znamená pojem hašování?
3. Jak se využívá (např.) programu spell, který je součásti systému OS Unix?
SHRNUTÍ
Zbyněk Holub - Lexikologie
76
Právě uzavřená kapitola představuje (co do rozsahu tématu) jeden z nejobsažnějších celků.
Text seznamuje čtenáře se stratifikací slovní zásoby: s jednotlivými vrstvami slov: v nespisovných
útvarech národního jazyka (s regionalismy, kolokvialismy, dialektismy a sociolektismy),
podle slohových příznaků (se slovy hovorovými, knižními, s termíny a s poetismy), podle časových
příznaků (s historismy, archaismy, neologismy), u slov expresívních na základě emocionálního
příznaku, podle sepětí se slovem, s jeho stavbou nebo s kontextem (inherentní, adherentní
a kontextová) nebo podle expresívního příznaku jednotlivých jazykových rovin… a u
slov původně cizích. Upozorňuje na možnostmi odlišení centra a periferie a připomíná projevy
její systémovosti (s ohledem na teorie lexikálního pole a na tezaurus); rovněž ve vztahu k postavení
jednotek aktivních a pasivních nebo k proměnám lexikonu: k jeho obohacování a doplňování,
při tvorbě obrazných vyjádření (k nimž řadíme metaforu, metonymii, synekdochu),
dále s ohledem na kombinované postupy a přejímání.
DALŠÍ ZDROJE
Akademický slovník cizích slov. Praha: Academia 1985.
BAUER, J., Dělení slov • Slovotvorba v praxi. Nakladatelství Olomouc, 1997
ČEJKA, M. Česká lexikologie a lexikografie. Masarykova univerzita, Brno 1992.
ČERMÁK, F., KŘEN, M., Frekvenční slovník češtiny. Nakladatelství Lidové noviny, Praha
2004
DANEŠ, F., DOKULIL, M., KUCHAŘ, J. a kol.: Tvoření slov v češtině 2. Odvozování podstatných
jmen. Praha: Academia, 1967.
DOKULIL, M.: Tvoření slov v češtině. 1. Praha: Academia, 1962.
ENCYKLOPEDICKÝ slovník češtiny. (Karlík, P., Nekula, M., Pleskalová, J. eds.). Nakladatelství
Lidové noviny, Praha 2002......... ESČ
FILIPEC, Josef - ČERMÁK, František: Česká lexikologie. Praha: Academia 1985.
GOLDEFUS, Filip: Syntaxe a sémantika programovacích jazyků. Teorie programovacích jazyků.
Vysoké učení technické, Brno 2007
HAUSER, Přemysl: Nauka o slovní zásobě. Praha: SPN 1980.
HLADKÁ, Zdeňka: Přenesená pojmenování rostlin v českých dialektech. Brno, Masarykova
univ. 2000
HŘEBÍČEK, L. Vyprávění o lingvistických experimentech s textem. Praha, Academia 2002
Slovní zásoba, její členění, vrstvy ve slovní zásobě a systém
77
Syntaxe a sémantika programovacích jazyků. Teorie programovacích jazyků. Vysoké učení
technické, Brno 2007)
IKOVÁ, M. Slovotvorba. Počátek 21. století. In: Karlík, P., Pleskalová, J., Večerka, R.,
KLIMEŠ, L., Úvod do vědecké práce v jazykovědné bohemistice : se zvláštním zřetelem k pracím
seminárním a diplomovým. Fakulta pedagogická, Vydavatelství Západočeské univerzity,
Plzeň 1998
MANUÁL LEXIKOGRAFIE (Čermák, F., Blatná, R. et al./ eds.). Jinočany: H&H, 1995.
MARTINCOVÁ, Olga a kolektiv: Nová slova v češtině: Slovník neologismů. Praha: Academia
1998.
OUŘEDNÍK, Patrik: Aniž jest co nového pod sluncem. Praha: Mladá fronta 1994.
OUŘEDNÍK, Patrik: Šmírbuch jazyka českého. Praha: Ivo Železný 1992.
PALA, Karel - VŠIANSKÝ, Jan: Slovník českých synonym. Praha: Lidové noviny 1994.
PŘÍRUČNÍ mluvnice češtiny. 2.vyd. Praha, Lidové noviny (např. 1996).
SLOVNÍK spisovné češtiny pro školu a veřejnost. Praha: Academia 1994.
ZIMA, J.. Expresivita slova v současné češtině. Rozpravy Československé akademie věd. Řada
společenských věd. Praha : Nakl. Československé akademie věd, 1961.
ZIPF, George Kingsley, Human Behavior and the Principle of Least Effort: An Introduction to
Human Ecology. Cambridge, Mass.: Addison-Wesley Press, Inc., 1949.
http://en.wikipedia.org/wiki/Zipf%27s_law (ZIPF)
http://www.fit.vutbr.cz/study/courses/TJD/public/0708TJD-Goldefus.pdf (GOLDEFUS, Filip:
Tálská, Ivana: Čeština po síti. Ostravská univerzita v Ostravě 2010; http://eridanus.
cz/id32402/jazyk/jazyky/indoevropske(1_jazyky/slovanske(1_jazyky/c(2es(2tina/
(LEX-OU