UCJDAJK1 Corpus architecture and text encoding

Faculty of Philosophy and Science in Opava
Summer 2009
Extent and Intensity
1/0/0. 0 credit(s). Type of Completion: dzk.
Teacher(s)
prof. Dr. Werner Wegstein (lecturer)
Guaranteed by
prof. Dr. Werner Wegstein
Institute of Foreign Languages – Faculty of Philosophy and Science in Opava
Course Enrolment Limitations
The course is also offered to the students of the fields other than those the course is directly associated with.
fields of study / plans the course is directly associated with
Course objectives (in Czech)
Uchovávání a další práce s dokumenty v elektronické a vícejazyčné podobě podobě se stává jednou z klíčových filologických, jazykovědných a překladatelských kvalifikací. K jejímu dosažení je nutno zvládnout nejen znalosti moderních technik strukturování elektronických textů (kódování textu), ale i zásadní pochopení výstavby velkých souborů lingvistických dat (korpusová lingvistika). Náplní předmětu je uchopení základních softwarových a lingvistických nástrojů nuntých k prokázání této kvalifikace formou vlastních projektů a jejich pezentace. Podmínkou pro připuštění ke zkoušce je řádné vypracování dílčích úkolů z každé tématické jednotky. 1. XML - standard 2. Práce s 'TEI Guidelines for text encoding' (P4 resp. P5) 3. Design, vytváření a zpracování XML-dokumentu 4. Principy formátování: XSL/XSLT 5. XML-projektování: monolingvální a multilingvální texové korpusy I-III 6. Architektura korpusu: Design, typologie, formát, annotation, archivování 7. Práce s korpusy I: Statististická analýza korpusových dat 8. Práce s korpusy II: Konkordance und kolokace Literatura: Bradley, Neil: The XML Companion, second edition, Harlow: Pearson Education Ltd., 2000 Sperberg -McQueen,Michael and Lou Burnard. Guidelines for Electronic Text Encoding and Interchange, XML-compatible edition. XML conversion by Syd Bauman, Lou Burnard, Steven DeRose, and Sebastian Rahtz, TEI Consortium Copyright (c), 2001. Erhältlich als 'The XML Version of the TEI Guidelines (March 2002)' from http://www.tei-c.org/P4X/ together with tutorials and guides to local practice. Text Tools and Corpora: Multext. Available from http://www.lpl.univ-aix.fr/projects/multext/ Tony McEnery and Andrew Wilson. Corpus Linguistics. Edinburgh: University Press, 1996 (2nd edition 2001) John Sinclair. Corpus Concordance, Collocation. OUP, 1991 Elena Tognini Bonelli. Corpus Linguistics at Work. Amsterdam: John Benjamins, 2001 Catherine N. Ball. Tutorial Concordances and Corpora. Available from: http://www.georgetown.edu/faculty/ballc/corpora/tutorial.html http://bowland-files.lancs.ac.uk/monkey/ihe/linguistics/contents.htm
Language of instruction
German
Further Comments
The course can also be completed outside the examination period.
The course is also listed under the following terms Summer 2008, Summer 2010, Summer 2011, Summer 2012, Summer 2013, Summer 2014, Summer 2015, Summer 2016, Summer 2017, Summer 2018, Summer 2019, Summer 2020, Summer 2021, Summer 2022.
  • Enrolment Statistics (Summer 2009, recent)
  • Permalink: https://is.slu.cz/course/fpf/summer2009/UCJDAJK1