UINK222 Zpracování přirozeného jazyka I

Filozoficko-přírodovědecká fakulta v Opavě
zima 2018
Rozsah
Přednáška 6 HOD/SEM, Seminář 3 HOD/SEM. 4 kr. Ukončení: z.
Vyučující
RNDr. Miroslav Langer, Ph.D. (přednášející)
RNDr. Miroslav Langer, Ph.D. (cvičící)
Garance
RNDr. Miroslav Langer, Ph.D.
Ústav informatiky – Filozoficko-přírodovědecká fakulta v Opavě
Omezení zápisu do předmětu
Předmět je nabízen i studentům mimo mateřské obory.
Mateřské obory/plány
Cíle předmětu
V úvodu se studenti seznámí se základními pojmy formalizovaného zpracování přirozeného jazyka, jako je gramatika, sémantika, pragmatika, slovník. Z aplikačních oblastí je kladen důraz na automatizaci indexování textů a lingvistické problémy, které to zahrnuje (rozpoznávání, lematizace a gramatická analýza slov i víceslovných termínů, vyhodnocení sémantických vztahů mezi nimi).
Osnova
  • 1. Obecné základy a souvislosti. Slovník, gramatika, sémantika (vymezení a vzájemné souvislosti pojmů). Přehled hlavních aplikačních oblastí (automatické indexování, generování tezaurů, automatické referování, komunikace s databází / s robotem / s expertním systémem ap., strojový a počítačem podporovaný překlad, naplňování bází dat / znalostí z textů, automatizovaná korektura textů). Spojitost s jinými informatickými obory.
    2. Lingvistické problémy automatického indexování textů. Rozpoznávání a určení míry relevance termínů.
    3. Řešení problému tvarosloví. Sémantické vztahy mezi termíny a možnosti jejich využití. Problémy homonymie.
    4. Automatizace tvorby a údržby tezaurů. Tezaurus jako datová struktura (realizace vhodným typem databázového systému). Automatizace získání relevantní slovní zásoby. Automatizace nalezení sémantických vztahů mezi termíny.
Literatura
    povinná literatura
  • Strossa. Počítačové zpracování přirozeného jazyka. Praha, 2011. ISBN 978-80-245-1777-3. info
Výukové metody
Přednáška s aktivizací
Přednáška s analýzou videozáznamu
Metody hodnocení
Zápočet
Informace učitele
Absolvování písemného testu.
Další komentáře
Předmět je dovoleno ukončit i mimo zkouškové období.
Předmět je zařazen také v obdobích zima 2009, zima 2010, zima 2011, zima 2012, zima 2013, zima 2014, zima 2015, zima 2016, zima 2017, zima 2019, zima 2020, zima 2021, zima 2022.