UIN2022 Zpracování přirozeného jazyka I

Filozoficko-přírodovědecká fakulta v Opavě
zima 2021
Rozsah
2/1/0. 4 kr. Ukončení: z.
Vyučující
RNDr. Miroslav Langer, Ph.D. (přednášející)
RNDr. Miroslav Langer, Ph.D. (cvičící)
Mgr. Daniel Valenta, Ph.D. (přednášející)
Garance
RNDr. Miroslav Langer, Ph.D.
Ústav informatiky – Filozoficko-přírodovědecká fakulta v Opavě
Rozvrh
Po 19:45–21:20 PED2
  • Rozvrh seminárních/paralelních skupin:
UIN2022/A: Po 20. 9. až St 1. 12. St 17:15–18:00 PED2, M. Langer
Předpoklady
! UINK222 Zpracování přirozeného jazyka
Omezení zápisu do předmětu
Předmět je nabízen i studentům mimo mateřské obory.
Mateřské obory/plány
Cíle předmětu
V úvodu se studenti seznámí se základními pojmy formalizovaného zpracování přirozeného jazyka, jako je gramatika, sémantika, pragmatika, slovník. Z aplikačních oblastí je kladen důraz na automatizaci indexování textů a lingvistické problémy, které to zahrnuje (rozpoznávání, lematizace a gramatická analýza slov i víceslovných termínů, vyhodnocení sémantických vztahů mezi nimi).
Osnova
  • 1. Obecné základy a souvislosti. Slovník, gramatika, sémantika (vymezení a vzájemné souvislosti pojmů). Přehled hlavních aplikačních oblastí (automatické indexování, generování tezaurů, automatické referování, komunikace s databází / s robotem / s expertním systémem ap., strojový a počítačem podporovaný překlad, naplňování bází dat / znalostí z textů, automatizovaná korektura textů). Spojitost s jinými informatickými obory.
    2. Lingvistické problémy automatického indexování textů. Rozpoznávání a určení míry relevance termínů.
    3. Řešení problému tvarosloví. Sémantické vztahy mezi termíny a možnosti jejich využití. Problémy homonymie.
    4. Automatizace tvorby a údržby tezaurů. Tezaurus jako datová struktura (realizace vhodným typem databázového systému). Automatizace získání relevantní slovní zásoby. Automatizace nalezení sémantických vztahů mezi termíny.
Literatura
    povinná literatura
  • Strossa. Počítačové zpracování přirozeného jazyka. Praha, 2011. ISBN 978-80-245-1777-3. info
Výukové metody
Přednáška s aktivizací
Přednáška s analýzou videozáznamu
Metody hodnocení
Zápočet
Informace učitele
Aktivní účast na přednáškách a cvičeních (seminářích), absolvování písemného testu.
Další komentáře
Předmět je dovoleno ukončit i mimo zkouškové období.
Předmět je zařazen také v obdobích zima 1993, zima 1994, zima 1995, zima 1996, zima 1997, zima 1998, zima 1999, zima 2000, zima 2001, zima 2002, zima 2003, zima 2004, zima 2005, zima 2006, zima 2007, zima 2008, zima 2009, zima 2010, zima 2011, zima 2012, zima 2013, zima 2014, zima 2015, zima 2016, zima 2017, zima 2018, zima 2019, zima 2020, zima 2022.