FPF:UIN2022 Zprac. přirozeného jazyka I - Informace o předmětu
UIN2022 Zpracování přirozeného jazyka I
Filozoficko-přírodovědecká fakulta v Opavězima 2019
- Rozsah
- 2/1/0. 4 kr. Ukončení: z.
- Vyučující
- RNDr. Miroslav Langer, Ph.D. (přednášející)
RNDr. Miroslav Langer, Ph.D. (cvičící) - Garance
- RNDr. Miroslav Langer, Ph.D.
Ústav informatiky – Filozoficko-přírodovědecká fakulta v Opavě - Rozvrh
- St 8:05–9:40 PED2
- Rozvrh seminárních/paralelních skupin:
- Předpoklady
- TYP_STUDIA(B)
- Omezení zápisu do předmětu
- Předmět je nabízen i studentům mimo mateřské obory.
- Mateřské obory/plány
- Informační studia se zaměřením na knihovnictví (program FPF, B7201 InSK)
- Informatika a výpočetní technika (program FPF, B1801 Inf)
- Cíle předmětu
- V úvodu se studenti seznámí se základními pojmy formalizovaného zpracování přirozeného jazyka, jako je gramatika, sémantika, pragmatika, slovník. Z aplikačních oblastí je kladen důraz na automatizaci indexování textů a lingvistické problémy, které to zahrnuje (rozpoznávání, lematizace a gramatická analýza slov i víceslovných termínů, vyhodnocení sémantických vztahů mezi nimi).
- Osnova
- 1. Obecné základy a souvislosti. Slovník, gramatika, sémantika (vymezení a vzájemné souvislosti pojmů). Přehled hlavních aplikačních oblastí (automatické indexování, generování tezaurů, automatické referování, komunikace s databází / s robotem / s expertním systémem ap., strojový a počítačem podporovaný překlad, naplňování bází dat / znalostí z textů, automatizovaná korektura textů). Spojitost s jinými informatickými obory.
2. Lingvistické problémy automatického indexování textů. Rozpoznávání a určení míry relevance termínů.
3. Řešení problému tvarosloví. Sémantické vztahy mezi termíny a možnosti jejich využití. Problémy homonymie.
4. Automatizace tvorby a údržby tezaurů. Tezaurus jako datová struktura (realizace vhodným typem databázového systému). Automatizace získání relevantní slovní zásoby. Automatizace nalezení sémantických vztahů mezi termíny.
- 1. Obecné základy a souvislosti. Slovník, gramatika, sémantika (vymezení a vzájemné souvislosti pojmů). Přehled hlavních aplikačních oblastí (automatické indexování, generování tezaurů, automatické referování, komunikace s databází / s robotem / s expertním systémem ap., strojový a počítačem podporovaný překlad, naplňování bází dat / znalostí z textů, automatizovaná korektura textů). Spojitost s jinými informatickými obory.
- Literatura
- povinná literatura
- Strossa. Počítačové zpracování přirozeného jazyka. Praha, 2011. ISBN 978-80-245-1777-3. info
- Výukové metody
- Přednáška s aktivizací
Přednáška s analýzou videozáznamu - Metody hodnocení
- Zápočet
- Informace učitele
- Aktivní účast na přednáškách a cvičeních (seminářích), absolvování písemného testu.
- Další komentáře
- Předmět je dovoleno ukončit i mimo zkouškové období.
- Statistika zápisu (zima 2019, nejnovější)
- Permalink: https://is.slu.cz/predmet/fpf/zima2019/UIN2022