UCJDAJK1 Architektura jazykového korpusu a kódování textu

Filozoficko-přírodovědecká fakulta v Opavě
léto 2018
Rozsah
1/0/0. 0 kr. Ukončení: dzk.
Vyučující
prof. Dr. Werner Wegstein (přednášející)
Garance
prof. Dr. Werner Wegstein
Ústav cizích jazyků – Filozoficko-přírodovědecká fakulta v Opavě
Omezení zápisu do předmětu
Předmět je nabízen i studentům mimo mateřské obory.
Mateřské obory/plány
Cíle předmětu
Uchovávání a další práce s dokumenty v elektronické a vícejazyčné podobě podobě se stává jednou z klíčových filologických, jazykovědných a překladatelských kvalifikací. K jejímu dosažení je nutno zvládnout nejen znalosti moderních technik strukturování elektronických textů (kódování textu), ale i zásadní pochopení výstavby velkých souborů lingvistických dat (korpusová lingvistika). Náplní předmětu je uchopení základních softwarových a lingvistických nástrojů nuntých k prokázání této kvalifikace formou vlastních projektů a jejich pezentace. Podmínkou pro připuštění ke zkoušce je řádné vypracování dílčích úkolů z každé tématické jednotky. 1. XML - standard 2. Práce s 'TEI Guidelines for text encoding' (P4 resp. P5) 3. Design, vytváření a zpracování XML-dokumentu 4. Principy formátování: XSL/XSLT 5. XML-projektování: monolingvální a multilingvální texové korpusy I-III 6. Architektura korpusu: Design, typologie, formát, annotation, archivování 7. Práce s korpusy I: Statististická analýza korpusových dat 8. Práce s korpusy II: Konkordance und kolokace Literatura: Bradley, Neil: The XML Companion, second edition, Harlow: Pearson Education Ltd., 2000 Sperberg -McQueen,Michael and Lou Burnard. Guidelines for Electronic Text Encoding and Interchange, XML-compatible edition. XML conversion by Syd Bauman, Lou Burnard, Steven DeRose, and Sebastian Rahtz, TEI Consortium Copyright (c), 2001. Erhältlich als 'The XML Version of the TEI Guidelines (March 2002)' from http://www.tei-c.org/P4X/ together with tutorials and guides to local practice. Text Tools and Corpora: Multext. Available from http://www.lpl.univ-aix.fr/projects/multext/ Tony McEnery and Andrew Wilson. Corpus Linguistics. Edinburgh: University Press, 1996 (2nd edition 2001) John Sinclair. Corpus Concordance, Collocation. OUP, 1991 Elena Tognini Bonelli. Corpus Linguistics at Work. Amsterdam: John Benjamins, 2001 Catherine N. Ball. Tutorial Concordances and Corpora. Available from: http://www.georgetown.edu/faculty/ballc/corpora/tutorial.html http://bowland-files.lancs.ac.uk/monkey/ihe/linguistics/contents.htm
Vyučovací jazyk
Němčina
Další komentáře
Předmět je dovoleno ukončit i mimo zkouškové období.
Předmět je zařazen také v obdobích léto 2008, léto 2009, léto 2010, léto 2011, léto 2012, léto 2013, léto 2014, léto 2015, léto 2016, léto 2017, léto 2019, léto 2020, léto 2021, léto 2022.