Lexikologie

Týden 8

6.9 Systémovost ve slovní zásobě (teorie lexikálního pole, tezaurus)

6.9.1 PROMĚNY SLOVNÍ ZÁSOBY A SLOVOTVORBA (ZMĚNY VE SLOVNÍ ZÁSOBĚ A

JEJÍ OBOHACOVÁNÍ)

Výklad o způsobech doplňování slovní zásoby (nebo také popisy utváření slova v češtině)

můžeme v tomto textu chápat spíše jako témata k samostudiu (obvykle se z lexikologického

popisu vyčleňují jako samostatná nauka, s níž se lze seznámit v rámci slovotvorby, tedy morfonologie).

V tomto smyslu sledujeme arbitrárnost a motivovanost, úlohu slov značkových a popisných,

význam fundace a motivace, integrálnost slovní zásoby a různé anomálie. Nauka o

tvoření slov potom zahrnuje (především) formálně-významové (slovotvorné) vztahy. V souvislosti

s tím je třeba definovat slovotvorné prostředky, způsoby a postupy, odlišit slovotvorný základ,

slovotvorný formant – a úlohu morfému v takto pojatém širším výkladu. Dále postihujeme

základní onomaziologické kategorie (mutační, modifikační a transpoziční) a problematiku slovotvorných

tříd, řad, svazků a čeledí. Právě odvozování je v této souvislosti chápáno jako nejčastější

postup tvoření slov v češtině.

SAMOSTATNÝ ÚKOL

Úkoly k textu 6/7

Vypište si další výklad z literatury:

Poučení ke slovotvorbě najdete např. u M. Dokulila (1962); dále u F. Daneše, M. Dokulila

a M. Kuchaře (1967), popř. u J. Bauera (1997), v Příruční mluvnici češtiny (1995, s.67-69) nebo

u M. Ikové (2007).

6/8 ... k teorii lexikálního a sémantického pole porovnejte např.:Čejka 1992, s. 22-23

6/9... k problematice tezauru: Manuál 1995, s. 65, 112

6.9.2 Přehled některých způsobů utváření slov, obohacování a doplňování

slovní zásoby

Ve vývoji jazyka dochází ke změnám významů stávajících slov i ke vzniku slov nových –v

souvislosti s utvářením nových skutečností, které potřebují pojmenování. Nová slova (neoloSlovní

zásoba, její členění, vrstvy ve slovní zásobě a systém

63

gismy) vznikají různě, ale do jazykového úzu (a tedy do povědomí uživatele) pronikají zpravidla

po dobu desítek let (zdomácňují, neutralizují se apod.); a to ne vždy se stejnou úspěšností.

U sociolektů (např. slangů) je vývoj rychlejší. Prvotní původ slov (podobně jako u malých dětí,

u kterých se někdy projevuje žvatlavost: původně jde rovněž o spontánní zvuky, o náhodný

projev mluvidel) bývá autentický, nekonvenční. Takto vzniklé projevy postupně mohou nabýt

významu konvenčních znaků.

Proměny slovní zásoby dále ovlivňuje také expresivita (emocionální zabarvení pojmenování),

popř. i zapojení citoslovečnosti (interjekcí); některé zvuky, které vyjadřující emocionální

stav člověka, se ve slovní zásobě objevují častěji (specifickým projevem tohoto procesu je i

zpěv a hudba). Citoslovečnost bývá spojená s projevy onomatopoie (zvukomalebnosti; napodobování

zvuků z okolí: fičet, bručet). Aspekt zvukomalebnosti ovlivňuje i oblíbenost slov

vzniklých jinak (např. traktor, trabant, mašinka). U některých slov by snad bylo možné mluvit

též o „pohybomalebnosti“ (sklápět).

Expresivitu slov a slovních spojení lze odlišovat (nejčastěji) z trojího pohledu:

1. slova expresívní se vyznačují především na základě svého citového (emocionálního)

příznaku (viz výše; dále např. Hauser 1980), který se přidružuje k jejich základnímu významu

pojmenovávacímu. Tento příznak může být jak kladný, tak i záporný.

1.1 Jako expresiva s citově pozitivním příznakem chápeme:

a) zdrobněliny (deminutiva), tvořené deminutivními příponami typickými pro zdrobňování:

• dvoustupňové (voda – vodička, mléko - mlíčko, zajíc – zajíček)

• třístupňové (oko – očko – očičko, slunce – slunko – sluníčko);

b) slova důvěrná, familiární, užívaná v důvěrném styku osob (miláček, zlatíčko, srdíčko)

c) slova domácká, hypokoristika, která se užívají v rodinném prostředí pro označení členů

rodiny obecnými názvy (maminka, strýček, dědoušek), nebo domáckými podobami jmen vlastních

(Jaroušek, Mařenka)

d) dětská slova užívaná dětmi a dospělými v kontaktu s nimi (papat, hajat, bumbat, bacat,

paci paci, spinkat)

e) eufemismy: mají zjemňující funkci. Jedná se o slova nahrazující výrazy nepříjemné nebo

nevhodné ve společenském styku, např. zesnout, skonat, indisponovaný apod.

Expresíva s citově záporným příznakem mohou být:

Zbyněk Holub - Lexikologie

64

• slova hanlivá, pejorativní – barabizna, herka, chvastoun, křáp

• slova zveličelá (augmentativa) tvořená většinou typickými příponami, např. chlapisko,

chlapák, babizna, psisko, kapřisko, divous, mrňous, tlusťoch, příšerný, děsivý

• slova zhrubělá – kecat, žvanit, držka (drzý člověk), ožralec

• slova vulgární – chlastat, žrádlo, hajzl

• dysfemismy – opak eufemismů, jsou jimi hrubé výrazy typu chcípnout, mrzák apod.

2. Expresivitu (citový příznak) můžeme hodnotit i podle sepětí se slovem, s jeho stavbou

nebo s kontextem:

Pokud je expresivita pojmenování spjata přímo se slovem, s jeho stavbou a s jeho základním

významem (nelze ji vydělit, aniž bychom změnili význam slova; expresivita je nedílnou součástí

významu slova), pak se jedná o tzv. expresivitu inherentní (kecat, žvanit, dědoušek), tedy

lexikálně sémantickou. Mezi označení věcí vyvolávající citové hodnocení patří též citoslovce

vyjadřující emoce, vůli (ach, fuj, br, hybaj).

V případě, že expresivita vyplývá až z určitého užití slova v kontextu, kdy se projeví jako

potencionální „přidaná“ složka významu, jde o tzv. expresivitu adherentní (kočka, děcko);

tento typ expresivity je součástí významu (sémie) dané lexie určitého polysémního slova. Jeden

význam je expresívní, základní význam je neutrální (panák, fasáda). Patří sem i citoslovce zvukomalebná

(bú, mňau, haf, vrkú) a slova od nich odvozená (bučet, mňoukat, hafat).

V případě, že hovoříme pouze o expresivitě slova v určitém neobvyklém kontextu (která se

běžně neobjevuje ani u lexií polysémního slova), jedná se o expresivitu kontextovou (např.

význam slova stroj nezahrnuje expresivní složku. Ale pojmenování lze v určitém kontextu expresivně

užít; např. ironicky: „To je teda stroj!“ – s důrazem na slabice slova stroj). K tomu

dále: Zima 1961

3. Pojmenování rozlišujeme též podle expresívního příznaku jednotlivých jazykových

rovin:

• expresivitu hláskovou, kdy se ve slově objevují hlásková spojení, která nejsou

běžná ve slovech neexpresívních, např. kňučet, hňup, ňouma, ťulpas, čučet, čumět,

chlemtat;

• expresivitu slovotvornou, s níž se setkáváme u slov zdrobnělých a zveličelých tvořených

příponami -ek, -ka, -ček, -čka, -ička, -ičko a -isko, -as, -och, -oun, -ous, -dlo,

-na, -árna)

• expresivitu morfologickou, která se týká stylově příznakového užití určitých flektivních

tvarů (koncovek deklinačních nebo konjugačních: „oni to dělaj...“)

Slovní zásoba, její členění, vrstvy ve slovní zásobě a systém

65

• expresivitu syntaktickou, kolokační (u specifických slovních spojení: kulatý obdélníček,

u vět a souvětí: „...kdybych to byl býval věděl,tak bych tam nechodil...“)

apod. (dále: LEX-OU)

Změny významu slova zahrnují:

• změny expresivní či stylové, citové či postojové příznačnosti slova (srov. výše; například

posun z hanlivého nebo kladného hodnocení na neutrální - a naopak; ze stylistického

zabarvení hovorového /slangového/ na pojetí obecné nebo spisovné)

• změny konotací (asociací) spojených s významem slova představují rozšíření nebo

zúžení významu. V lexikologii rozlišujeme tři základní druhy přenášení pojmenování;

patří k nim:

6.9.2.1 METAFORA

Metafora je rozšíření nebo přenesení významu pojmenování na základě vnější podobnosti

denotátů, jejichž podobnost se může týkat především:

o tvaru, např. u slov zub (ústa – pila), hřeben (na česání – hory – drůbeže) apod.;

o barvy u adjektiv cihlový (dům – barva), krvavý, růžový, vínový, sněhový, čokoládový

ap.;

o umístění, např. pata (část nohy – hory), hlava (část těla – sloupu) ap.;

o rozsahu, např. chloupek, kapka – malé množství, hromada, kupa, hora – velké množství;

o funkce - hlava (státu, rodiny), ručička (u hodinek).

Časté jsou tu metafory odvozené z pojmenování částí těla (hlava rodiny, noha stolu). K metaforickému

přenášení dochází i mezi typickými skupinami entit, kdy se například pojmenování

o zvířat přenáší na rostliny (kočičky, kuřátka, lišky) nebo osoby (medvěd, slon, liška);

o věcí na osoby (klacek, buchta, pařez), části těla (lopatka, koš, bubínek, stolička);

o částí těla na věci (hlava, ucho, krk, rameno, hrdlo);

o zvířat na věci (beran, kůň).

K metaforickému přenášení pojmenování dochází i u jiných slovních druhů. Jedná se o:

o přídavná jména – ocelové srdce, olivová pleť, měkká povaha, horoucí láska;

o příslovce – vřele milovat, sladce se usmívat, ohnivě červený;

o slovesa, u nichž se metafora projevuje jako tzv. personifikace (tj. spojení sloves vyjadřujících

děje živých podmětů s podměty neživými), např. hodiny jdou, slunce vychází,

vítr hvízdá, čas utíká.

Zbyněk Holub - Lexikologie

66

6.9.2.2 METONYMIE

Metonymie spočívá v přenášení významu pojmenování na základě vnitřní souvislosti denotátů

(např. význam abstraktního pojmu profil se přenese na typ kovodělných polotovarů;

nebo z názvu činnosti /obchod/ se přenese na místnost, kde se činnost vykonává - ve významu

„prodejna“). Na rozdíl od metafory se vyskytuje pouze u substantiv.

Rozlišujeme tři základní typy:

Metonymie strukturní, která spočívá k přenášení pojmenování z abstraktních skutečností

na konkrétní předměty, kdy se např. pojmenování

• děje přenáší na osoby tento děj vykonávající (hlídka – hlídání, pak ti, kteří hlídají,

vláda – vládnutí, pak kabinet ministrů, stejně obrana, rada);

• děje na věc (psaní – děj, pak dopis, podobně práce, učení, čtení);

• děje na místo děje (zatáčka, západ, průjezd, vjezd, podchod);

• vlastnosti na nositele vlastnosti (mládí, sladkost, dobrota, nečistota, ostří, hloupost);

• povolání na místo jeho provozování (pekařství, řeznictví, cukrářství);

• materiálu na výrobky (zlato, hedvábí, liška, činčila, sklo, porcelán);

• nádoby na její obsah (mísa, pohár, sklenice).

Metonymie kontextová, spočívající v přenesení jména autora na název jeho díla (např. číst

Čapka, recitovat Seiferta, poslouchat Bacha), nebo zeměpisného jména na událost, která se tam

stala a později se stala symbolem (Waterloo, Bílá hora, Rubikon)

Metonymie etymologická (historická), kdy dochází k přenesení vlastních jmen osobních

a místních na obecné označení osob a věcí.

Vlastní jména osobní se stávají označením typu:

• jména historických osobností: donchuán, kasanova;

• jména mytologických postav: venuše, titán;

• jména náboženských postav: goliáš, david, lazar, jidáš;

• jména literárních postav: donkichot, romeo, otelo.

Vlastní jména osobní se stávají označením věci

• fyzikálních jednotek: watt, ampér, volt, hertz, pascal, ohm;

Slovní zásoba, její členění, vrstvy ve slovní zásobě a systém

67

• výrobku, vynálezu: rentgen, mansarda, bojkot, sendvič, lynč.

Vlastní jména místní se přenášejí na věci, které se tam vyrábějí, pěstují, apod.:

• látky, textilie: damašek, manšestr, kašmír;

• vína, alkoholické nápoje: malaga, bordó, burgund, šampaň, koňak, tokaj;

• sýry: ementál, eidam, parmazán, rokfór;

• jiné: míšeň, panama, havana, plzeň.

6.9.2.3 SYNEKDOCHA

Synekdocha je založena na přenášení pojmenování na základě rozsahových poměrů. Pojmenování

části denotátu může být zaměněno za pojmenování jeho celku, nebo naopak. Podle toho

rozlišujeme 2 typy synekdochy:

a) část za celek – např. výrazy hlava, krk, duše místo člověk; střecha, práh, pro celý domov

(„Ta noha už je zdravá a půjde dnes domů.“)

b) celek za část – např. tabák, kdy označení celé rostliny je užito jen pro část, podobně čaj,

bavlna, len („Seběhlo se celé město.“)... dále: LEX-OU

Specifickým případem metafory nebo metonymie je apelativizace, kdy slovo odvozené z

vlastního jména získá obecný význam (xerox, donkichot, šovinista).

O naplnění obsahu se jedná i v případě, kdy se do šíře pojmu (bez změny významu) „vejdou“

nové jevy, o jejichž existenci nebo vzniku původní uživatelé neměli tušení, a jádro významu se

přenese k nim (např. slovo letadlo ve staročeštině znamenalo ptáka).

V případě odvozování od původních slov může docházet k tvořivému přizpůsobování slov,

popř. k jejich komolení. Mění se i celkové tendence vývoje jazyka. Formální změny pojmenování

mohou mít charakter pravidelného i specifického procesu:

• disimilace – „rozdělení“ původně jediného slova na dvě - s různými významy, např.

utvoření slov legrace a rekreace z na základě původního pojmenování „rekrací“ (latinského

označení pro školní přestávku)

• pravidelné odvozování probíhá s pomocí afixů (přípon - sufixů, často flektivních,

tvarotvorných - koncovek; předpon - prefixů, popř. na základě jiného typu flexe)

• skládání (kompozice) slovních základů (kořenů, radixů; to je typické zejména pro

němčinu)

• spojování kořenových i nekořenových částí slov nesoucích významové asociace, kterých

nabyly v jiném celku (např. workoholismus vzniklo podobností s alkoholismem,

Zbyněk Holub - Lexikologie

68

standardní slovotvorbou by vznikl například workismus). To je typické pro zejména

americkou angličtinu, v níž je smysl pro klasickou etymologii oslaben. Může se jednat

o tzv. makaronismus (užívání prvků nebo pojmenování dvou nebo více jazyků v

jednom souvislém textu. Vzniklý (hybridní) jazyk se označuje jako makaronština.

• často jsou česká slova ovlivněna cizí (přejatou) příponou; v takovém případě se jedná

o proces hybridizace (jde o slova hybridní, např. s příponou –átor: vědátor, původně

také -ita: táborita)

Kombinované procesy mohou být rovněž různého druhu:

1. analogie – přizpůsobování slova nebo tvaru slovu s podobným významem (rozinka – hrozinka

podle slova hrozen; srov. výše: lidová etymologie)

2. kontaminace – dvě slova s podobným významem se vzájemně ovlivňují nebo splynou (tip a

typ, bujarý z bujný a jarý, rozřešení a rozhřešení, krumpáč z něm. der Krumm + kopáč, hřbitov

z břítov a hrob, hřbít... srov. výše).

3. tabuová slova – původní pojmenování označovala nebezpečné nebo mocné (transcendentní)

jevy. Měnila (zaměňovala) se; užití původní formy pojmenování bylo tabuizováno. Vznikaly

tak podoby:

▪ zkomolené (blecha, herdek, safra)

▪ opisné (medvěd, zmije, zubatá)

▪ eufemistické (boží posel pro blesk, hostec pro revma, zlom vaz)

4. Samostatným problémem je přejímání cizích slov a jejich postupné přizpůsobování hostitelskému

jazyku; jedná se o přizpůsobení (asimilaci) pravopisu, výslovnosti nebo tvarosloví:

4.1 přizpůsobení významově podobným hostitelským slovům (sexuální harašení - harashment)

4.2 „doslovné“ překládání cizích slov - kalky (například orto-grafie = pravo-pis)

Další tematické okruhy zahrnují problematiku kompozit a jejich dělení, tedy procesu kompozice,

ale též abreviace a ostatních způsobů kondenzace, popř. univerbizace a multiverbizace

v současné češtině. Dalším problémem je tu i internacionalizace a nacionalizace ve slovní zásobě

češtiny, popř. vliv neologie (neologismy: srov. výše; např. Martincová a kol. 1998). S tím

souvisí i charakteristika vývojových tendencí v současné slovní zásobě češtiny (např. Cuřín,

Novotný 1981). Obecně problematiku řeší i příslušné kapitoly (např.) Encyklopedického slovníku

češtiny (2002) nebo Příruční mluvnice češtiny (1995).

Slovní zásoba, její členění, vrstvy ve slovní zásobě a systém

69

Kvantitativní vztahy ve slovní zásobě sledujeme v souvislosti s frekvencí slov v češtině

(srov. např. Čermák, Křen 2004) a s možnostmi aplikace lexikální statistiky (základní pojmy

např.: Klimeš 1998, s. 39-52).

Uveďte všechny frekvenční hodnoty slov: hledat, kámen, stopa, vlas, dřevo. Vysvětlete, co

znamená spojení rankové označení – a najděte je pro uvedená slova; seřaďte tato slova podle

frekvenčních údajů (od nejčastěji po nejméně často užívané).

PRO ZÁJEMCE

Synchronní a diachronní přístup ve slovní zásobě

Synchronní a diachronní přístup představují dva základní přístupy k lexikonu. Diachronní

analýza zkoumá slovní zásobu z hlediska původu, hledá jednotlivé vrstvy a vývojové fáze. Synchronní

analýza se zabývá lexikonem v jeho definitivní podobě a zaměřuje se především na

celkové pojetí slovní zásoby.

Diachronní analýza byla v minulosti ovlivněna historicko-kritickou metodou. Zabývá se vývojem

slovní zásoby příslušného jazyka od jejích nejstarších podob po současný (ustálený) model.

Historicko-kritická metoda vedla nejprve k popisu vývoje lexémů na základě jednotlivých

pramenů. Postupně převládl komplexnější přístup. Lexikon je hodnocen z historického hlediska

(procesy vývoje lexikálních jednotek) i kriticky (s využitím objektivních vědeckých metod,

které umožňují hlubší odhalení smyslu užití lexémů). Při diachronní analýze lexikonu je kromě

výkladu historických okolností vývoje slova (slovního spojení) nutné sledovat okolnosti jeho

vzniku, všímat si jazykových zvláštností (popř. kontextu užití jednotky, ustálených obratů),

různých pojmenování pro stejnou skutečnost nebo postavu apod. Dále je nutné zkoumat historickou

relevanci kontextů (užití lexikální jednotky ve výpovědi). Historicko-kritická metoda

pomáhá objasňovat postupný vývoj pojmenování a transformace jeho sdělení s ohledem k měnící

se kulturně-historické a společenské realitě. Pomáhá odhalit jednotlivé vrstvy ve vývoji

lexému, jejich specifické sdělení, přepracování vrstev předchozích a změny paradigmatu. Diachronní

přístupy v poznání slovní zásoby může ovšem klást důraz i na paměť jazykového společenství,

na vliv tradice a stereotypů v běžné každodenní komunikaci, na význam klišé, na

specifické texty (např. na texty folklórní, na frazeologii, popř. na menší útvary- např.na

anekdoty)...

Synchronní analýza přistupuje k pojmenování v jeho současné podobě, vidí jednotku jako

strukturovanou koherentní veličinu. Jeho jednotlivé části stojí ve vztahu, nejedná se ale o uzavřený

systém, konkrétní lexém stojí ve vztahu k ostatním lexémům. Synchronní analýza hledá

význam pojmenování (sdělení) v jeho struktuře.

Pod synchronní analýzou rozumíme:

Zbyněk Holub - Lexikologie

70

• rozbor kontextu (kolokace) s ohledem na pojmenování

• sémantickou (popř. i pragmatickou, situační) analýzu

• analýzu funkce pojmenování

Při zkoumání slovní zásoby je možno se zaměřit na typickou strukturu slovní zásoby (centrum

– periferie, výběr slovní zásoby v současném kontextu, odchylky od ustáleného slovníku

/anomálie... apod.)

6.10 Kvantitativní vztahy ve slovní zásobě

Pojem kvantitativní lingvistika se ujal v rámci matematické lingvistiky, která se u nás konstituovala

po 60. letech 20. století při uplatňování tzv. nových metod v lingvistice. Již na začátku

první poloviny 20. století se tu z kvantitativních metod využívalo zvláště statistikya mluvilo

se někdy o tzv. statistické lingvistice. Pozdější termín kvantitativní lingvistika prošel složitým

vývojem zvláště v druhé polovině 20. století.1

Kvantitativní vztahy ve slovní zásobě sledujeme (v souvislosti s posledně zmíněným zákonem)

právě v oboru kvantitativní lingvistiky, o níž se někdy mluví též jako o Zipfově lingvistice;

podle amerického lingvisty německého původu George Kingsleye Zipfa (1902-1950) z

Harvardovy univerzity, který ve 20. a 30. letech 20. stol. zkoumal relativní frekvenci hlásek.

Zajímal se o psychologické a fyziologické faktory ovlivňující produkci a percepci řeči. Jeho

koncepce se však dostaly do popředí vědeckého zájmu až ve II. polovině 20.století. Podle Zipfa

1 Solidní základy k české kvantitativní lingvistice lexikální položil ovšem již v první polovině 20. století (jak po

stránce věcné, tak i metodologické) anglista a obecný lingvista Vilém Mathesius (l882–l945). Významným přínosem

pro vývoj kvantitativní lingvistiky byly též Teze Pražského lingvistického kroužku (l929), rozpracované

dále jeho členy následovníky. Na 6. mezinárodním kongresu lingvistů, který se konal ve dnech l9.–24. července

l948 v Paříži, se mimo jiné konstatovalo, že se v lingvistice dosud málo užívá kvantitativních metod a že kvantitativní

data chybějí v dosavadních popisech jazyků; také i v lexiku. Práce týkající se kvantifikace jazykových

jevů měly být proto nadále ústředně koordinovány a při sběru materiálu, jeho zpracování a analýze mělo být využito

zejména statistických metod a v dnešním slova smyslu i výpočetní techniky. Na zmíněném pařížském kongresu

byla zřízena i zvláštní sekce pro kvantitativní lingvistiku a jejím sekretářem byl zvolen prof. B. Trnka; byl

také pověřen sestavením první bibliografie kvantitativní lingvistiky (l950). Tyto celkem slibné perspektivy byly

v Československu přerušeny politickým vývojem. Využití statistických metod při studiu jazyka bylo pokládáno

za projev „mechanistického pozitivismu a formalismu“, a proto bylo odmítáno. Teprve 60. léta 20. století přinesla

„obrození“ české kvantitativní lingvistice uplatněním tzv. nových metod v lingvistice. Symptomem toho

bylo, že r. l96l mohl vyjít tiskem FSČ a v ÚJČ bylo r. l96l založeno oddělení matematické lingvistiky (podle

Marie Těšitelové).

Slovní zásoba, její členění, vrstvy ve slovní zásobě a systém

71

lze na lidský jazyk nahlížet prostě jako na sled entit podobných třeba atomům, přičemž využíváme

řeči čísel (dále ZIPF)

PRO ZÁJEMCE

Zipfovy zákony2

Základní Zipfův zákon předpokládá, že v přirozených jazycích platí určité statistické rozdělení.

Pokud je tento předpoklad správný, potom je hodnota součinu relativního pořadí slova v

textu a jeho frekvence (násobek výskytu slova) obvykle konstantní.

Například:

• z hlediska frekvence užití slov v textu může platit:

• nejčastěji se vyskytující slovo (X) je v textu obsaženo 100krát

• druhé slovo v pořadí (Y) bude tedy obsaženo přibližně 50krát

• třetí slovo (Z) 33krát

• čtvrté slovo (A) 25krát

• ... a tak dále...

Podobné rozdělení bychom zřejmě dostali při analýze jakéhokoliv textu. Především ve

střední části frekvenční škály (tj. mimo slova na úplném začátku a konci) vyhoví Zipfovu zákonu

jak Odysseus Jamese Joyce, tak i pražský telefonní seznam. Později byla k tomuto pravidlu

dodána celá řada upřesňujících modifikací, na kterých se výrazně podílel například slavný

otec fraktálů, francouzský matematik Benoßt Mandelbrot.

Základní Zipfův zákon tak vyjadřuje vztah mezi pořadím klíčových slov uspořádaných podle

frekvence jejich výskytu. Poukazuje na skutečnost, že základ lexikonu vytváří relativně malý

počet silně frekventovaných slov. Umožňuje vypočítat konstanty pro jednotlivá slova z vybraného

textu (podle frekvence a pořadí výskytu).

2 Obecněji lze ale říci, že zákonitosti růstu, rozptylu a stárnutí určitých souborů (tedy i lexikonu; nejčastěji však

obecně publikací) shrnují tzv. bibliometrické zákony:

•Bradfordův, který sleduje rozptyl informací

•Lotkův, jenž se týká měření autorské produktivity

•Zipfův (základní), který se vztahuje k lingvistické frekvenční analýze a k indexaci; dnes také též k modelům

vyhledávání v internetu.

Zbyněk Holub - Lexikologie

72

V širším smyslu se ovšem nejedná o jediný zákon, ale o komplex pouček. Hovoříme pak o

Zipfových zákonech, které upozornily na vztah:

• mezi frekvencí slov a jejich pořadím

• mezi frekvencí slova a počtem různých slov, která tuto frekvenci mají

• mezi frekvencí slova a počtem jeho významů

V souvislosti se Zipfovými zákony musíme odlišit jednotlivé typy analýzy:

Obsahová analýza se zaměřuje na porovnávání obsahů dvojic či trojic textů (ve smyslu

hloubkového vysvětlení jednotlivých pojmů)

Lexikografická analýza – sledujeme klíčová slova ve shodných textech.

Lingvistická analýza - každému pojmu z daného terminologického slovníku (vytvořeného

při lexikografické analýze), který by mohl nějakým způsobem odkazovat na praxi, přidělíme

číselnou hodnotu na základě počtu splněných kritérií (na stupnici hodnot v rozmezí 1 – 5, přičemž

1 = splněna všechna kritéria). Určíme kritéria, podle kterých se každý z vybraných pojmů

hodnotí...

Podle Zipfovy teorie existuje dále zákon zkracování (abreviace), který operuje ke zvýšení

účinnosti verbální komunikace. Redukce v délce slov je pro komunikaci natolik efektivní, že

kompenzuje pravděpodobnost konfúze, kterou mohou abreviace s sebou přinášet. Aby nějaká

zkratka byla přisvojena určitou částí populace, musí růst frekvence používaného termínu a komunikace

mezi jeho uživateli musí zajistit souhlas, pokud jde o její nejvýstižněji formu. Jestliže

abreviace není ustálena a je použita v komunikaci, dochází ke zkreslení či poškození vyslané

zprávy.

V této souvislosti lze připomenout (např.) počítačové metody hledání nesprávných slov v

textu (kontroly textu v počítačovém souboru).

Při kontrole textu se obvykle porovnává každé slovo textu se správnými slovy ve slovníku.

Pokud je slovo nalezeno, považuje se za správné, pokud ne, považuje se za chybné.

Kontrolu textu je možné rozčlenit:

• Neinteraktivní kontrolu, prováděnou dávkově naráz pro celý dokument

• Interaktivní kontrolu, prováděnou slovo po slově v čase psaní dokumentu

Neinteraktivní kontrola textu s použitím frekvenčního slovníku

Slovní zásoba, její členění, vrstvy ve slovní zásobě a systém

73

Tato metoda patří k nejjednodušším. Pro dokument se vytvoří tzv. frekvenční slovník, tedy

seznam slov obsažených v dokumentu, uspořádaný sestupně dle frekvence výskytu v dokumentu.

Na konci seznamu se nacházejí slova, která se v dokumentu vyskytovala velmi zřídka,

tedy

• slova vzácně se používající

• slova nesprávně zapsaná

Tato metoda může kromě oprav dokumentů sloužit i pro poloautomatické získání slovníku

správných slov. Slovník správných slov získáme na základě několika dokumentů následujícím

postupem:

1. Vytvoříme prázdný slovník správných slov

2. Pro předložený dokument vytvoříme frekvenční slovník slov, která se ve slovníku správných

slov nenacházejí.

3. Prohlédneme konec frekvenčního slovníku a vyřadíme chybná slova

4. Zbylá (správná) slova zařadíme do slovníku správných slov

5. Pokud máme k dispozici další dokument, pokračujeme bodem 2.; jinak proces ukončíme.

Neinteraktivní kontrola textu s použitím dvojitého slovníku

Pokud máme k dispozici slovník správných slov, je možné vytvořit pro kontrolovaný dokument

abecední seznam použitých slov a porovnat v něm obsažená slova se slovníkem správných

slov. Slova, která ve slovníku správných slov nejsou, se zařadí do výstupního seznamu.

Protože jsou oba slovníky seřazené dle abecedy, je možné porovnání slovníků provést v lineárním

čase vzhledem k součtu délek obou slovníků.

Interaktivní kontrola textu

Při interaktivní kontrole je nutné porovnávat každé napsané slovo zvlášť. Protože slovník

správných slov je obecně příliš veliký (řádově desítky až stovky tisíc slov) je i logaritmický

čas nutný pro vyhledání každého ze slov příliš dlouhý. Při realizaci interaktivní kontroly se

proto uplatňují různé urychlovací metody.

Hašování

Slovník je rozdělen pomocí hašovací funkce na několik menších slovníků, ve kterých se dohledává

v logaritmickém čase. Např. program spell, který je součásti systému OS Unix, používá

funkci, jež dává stejné hodnoty pro stejně dlouhá slova začínající stejnými dvěma znaky.

Strom

V tomto případě je slovník organizován jako strom. Kořen stromu má až 26 (pro anglickou

abecedu) potomků, které reprezentují různé první znaky slov ve slovníku. Každý z těchto uzlů

má dalších až 26 potomků pro možná druhá písmena slov atd.

Zbyněk Holub - Lexikologie

74

Protože některá správná slova mohou být prefixem jiných, každý z uzlů ve stromě si musí

„pamatovat“, zda v nich může či nemůže správně zapsané slovo končit.

Hierarchický slovník

V tomto případě se využívá faktu, že v jednom dokumentu nejsou všechna možná slova existující

ve slovníku a ty v dokumentu se vyskytující se vyskytují různě často. Tento fakt je základem

empirického Zipfova zákona.

Při porovnávání existují proto 3 slovníky

• Úplný slovník, obsahující několik desítek tisíc slov

• Slovník slov dosud nalezených v dokumentu, obsahující cca 2000 různých slov

• Slovník často používaných slov, obsahující cca 200 nejčastěji používaných slov

Nejmenší slovník je možné udržovat během kontroly v operační paměti počítače. V něm se

nalezne kolem padesáti procent všech slov v dokumentu. Dalších zhruba 45 procent slov se

nalezne až při následném prohledávání slovníku dosud použitých slov a jen v pěti procentech

případů je nutné prohledávat úplný slovník.

Pokud se slovo nenajde ani v největším slovníku, je považováno za chybně napsané.

Empirický Zipfův zákon je založen na pozorováních prováděných na velkých textových datech

(např. pro nějaký dokument můžeme sestavit frekvenční slovník uspořádaný podle klesající

frekvence slov, přičemž využijeme platnosti tohoto zákona).

Zipf přiblížil lingvistiku přírodním vědám ještě jedním způsobem. Nejen organismy v rámci

„darwinovské evoluce“, ale i jazyk je podle něj „selektován“ na ekonomičnost a úspornost.

Zipfův princip nejmenšího úsilí („Principle of Least Effort“) zhruba tvrdí, že mluvčí se snaží

své myšlenky vyjádřit tak, aby se při tom nemusel moc namáhat. V jistém ohledu je jeho konkurentem

naopak příjemce sdělení, jehož zájmem je maximální možné porozumění. Tady se

ovšem vnucuje námitka, že řada lidí mluví vysloveně pro vlastní potěšení - i tehdy, když nemají

vůbec co říci.

Zipfovy myšlenky se staly inspirací pro další vědní obory. Jeho přínos jazykovědě byl ovšem

objeven s určitým zpožděním. Teprve poté, co matematikové, fyzikové a další přírodovědci

odkryli ve svých oborech analogie k zákonům, které Zipf formuloval, prorazily jeho myšlenky

také v lingvistice; srov. např. Zipf (1949 aj.), Uhlířová (2002), Hřebíček (2002).

SAMOSTATNÝ ÚKOL

Úkoly kontrolní

Slovní zásoba, její členění, vrstvy ve slovní zásobě a systém

75

6/11... A. Najděte k následujícím pojmenováním ekvivalenty v cizích jazycích: kuchař, chlapec,

obličej, slečna, žák, hostinec, pozorovat, poslanec, křižovatka, košíková, hlediště, jaderný,

prázdniny

B. V této kapitole jste našli odkaz na výklad o slovotvorbě; prostudování příslušné literatury

bylo uloženo k samostudiu. V souvislosti s tím splňte následující úkoly:

6/12...Určete druh motivace u motivovaných pojmenování a odlište pojmenování nemotivovaná:

běloch, vysoké napětí, povaha, jed, zlý, vidět, židle, učitel, dům, šťastný, zeměkoule, krajíc,

pivo, krajka, bublina, prásk, les, kukat, kruh, brousit si zuby, stárnout, mostka, voda, strana,

sykot, malba, zeměkoule, vodovod, elektrický proud, minerální voda, hrádek

6/13... U následujících pojmenování určete (ne)motivovanost a sestavte slovotvorné řady,

svazky a čeledi: písnička, ruka, svoboda, výstavba, švec, znak, horal, noha, rozbitý, maličký,

astro, čerpadlo, jít, pravda, zajíc

6/14... Seřaďte příbuzná slova do skupin: mladočech, nápis, lidový, zavodnit, zmodrat, mládí,

písmo, lid, brát, vodní, hradit, pisatel, mladost, lidnatý, zavodnit, vybrat, nepřeberný, hráz, výbor,

písař, vodník, lidičky, modrý, čecháček, modřinka, píšící, dějepis, lidový, nápis, výběrčí,

mladičký, sbírat, povodí, nelida, vyhrazený, pravopis

ÚKOL K ZAMYŠLENÍ

6/15...

Pokuste se najít odpovědi na následující otázky:

1. Jakými dalšími způsoby lze interaktivní počítačové postupy aplikovat na lexikologii a

lexikografii?

2. Co vlastně znamená pojem hašování?

3. Jak se využívá (např.) programu spell, který je součásti systému OS Unix?

SHRNUTÍ

Zbyněk Holub - Lexikologie

76

Právě uzavřená kapitola představuje (co do rozsahu tématu) jeden z nejobsažnějších celků.

Text seznamuje čtenáře se stratifikací slovní zásoby: s jednotlivými vrstvami slov: v nespisovných

útvarech národního jazyka (s regionalismy, kolokvialismy, dialektismy a sociolektismy),

podle slohových příznaků (se slovy hovorovými, knižními, s termíny a s poetismy), podle časových

příznaků (s historismy, archaismy, neologismy), u slov expresívních na základě emocionálního

příznaku, podle sepětí se slovem, s jeho stavbou nebo s kontextem (inherentní, adherentní

a kontextová) nebo podle expresívního příznaku jednotlivých jazykových rovin… a u

slov původně cizích. Upozorňuje na možnostmi odlišení centra a periferie a připomíná projevy

její systémovosti (s ohledem na teorie lexikálního pole a na tezaurus); rovněž ve vztahu k postavení

jednotek aktivních a pasivních nebo k proměnám lexikonu: k jeho obohacování a doplňování,

při tvorbě obrazných vyjádření (k nimž řadíme metaforu, metonymii, synekdochu),

dále s ohledem na kombinované postupy a přejímání.

DALŠÍ ZDROJE

Akademický slovník cizích slov. Praha: Academia 1985.

BAUER, J., Dělení slov • Slovotvorba v praxi. Nakladatelství Olomouc, 1997

ČEJKA, M. Česká lexikologie a lexikografie. Masarykova univerzita, Brno 1992.

ČERMÁK, F., KŘEN, M., Frekvenční slovník češtiny. Nakladatelství Lidové noviny, Praha

2004

DANEŠ, F., DOKULIL, M., KUCHAŘ, J. a kol.: Tvoření slov v češtině 2. Odvozování podstatných

jmen. Praha: Academia, 1967.

DOKULIL, M.: Tvoření slov v češtině. 1. Praha: Academia, 1962.

ENCYKLOPEDICKÝ slovník češtiny. (Karlík, P., Nekula, M., Pleskalová, J. eds.). Nakladatelství

Lidové noviny, Praha 2002......... ESČ

FILIPEC, Josef - ČERMÁK, František: Česká lexikologie. Praha: Academia 1985.

GOLDEFUS, Filip: Syntaxe a sémantika programovacích jazyků. Teorie programovacích jazyků.

Vysoké učení technické, Brno 2007

HAUSER, Přemysl: Nauka o slovní zásobě. Praha: SPN 1980.

HLADKÁ, Zdeňka: Přenesená pojmenování rostlin v českých dialektech. Brno, Masarykova

univ. 2000

HŘEBÍČEK, L. Vyprávění o lingvistických experimentech s textem. Praha, Academia 2002

Slovní zásoba, její členění, vrstvy ve slovní zásobě a systém

77

Syntaxe a sémantika programovacích jazyků. Teorie programovacích jazyků. Vysoké učení

technické, Brno 2007)

IKOVÁ, M. Slovotvorba. Počátek 21. století. In: Karlík, P., Pleskalová, J., Večerka, R.,

KLIMEŠ, L., Úvod do vědecké práce v jazykovědné bohemistice : se zvláštním zřetelem k pracím

seminárním a diplomovým. Fakulta pedagogická, Vydavatelství Západočeské univerzity,

Plzeň 1998

MANUÁL LEXIKOGRAFIE (Čermák, F., Blatná, R. et al./ eds.). Jinočany: H&H, 1995.

MARTINCOVÁ, Olga a kolektiv: Nová slova v češtině: Slovník neologismů. Praha: Academia

1998.

OUŘEDNÍK, Patrik: Aniž jest co nového pod sluncem. Praha: Mladá fronta 1994.

OUŘEDNÍK, Patrik: Šmírbuch jazyka českého. Praha: Ivo Železný 1992.

PALA, Karel - VŠIANSKÝ, Jan: Slovník českých synonym. Praha: Lidové noviny 1994.

PŘÍRUČNÍ mluvnice češtiny. 2.vyd. Praha, Lidové noviny (např. 1996).

SLOVNÍK spisovné češtiny pro školu a veřejnost. Praha: Academia 1994.

ZIMA, J.. Expresivita slova v současné češtině. Rozpravy Československé akademie věd. Řada

společenských věd. Praha : Nakl. Československé akademie věd, 1961.

ZIPF, George Kingsley, Human Behavior and the Principle of Least Effort: An Introduction to

Human Ecology. Cambridge, Mass.: Addison-Wesley Press, Inc., 1949.

http://en.wikipedia.org/wiki/Zipf%27s_law (ZIPF)

http://www.fit.vutbr.cz/study/courses/TJD/public/0708TJD-Goldefus.pdf (GOLDEFUS, Filip:

Tálská, Ivana: Čeština po síti. Ostravská univerzita v Ostravě 2010; http://eridanus.

cz/id32402/jazyk/jazyky/indoevropske(1_jazyky/slovanske(1_jazyky/c(2es(2tina/

(LEX-OU