FPF:UCJDAJK1 Corpus architecture and text e - Course Information
UCJDAJK1 Corpus architecture and text encoding
Faculty of Philosophy and Science in OpavaSummer 2008
- Extent and Intensity
- 1/0/0. 0 credit(s). Type of Completion: dzk.
- Teacher(s)
- prof. Dr. Werner Wegstein (lecturer)
- Guaranteed by
- prof. Dr. Werner Wegstein
Institute of Foreign Languages – Faculty of Philosophy and Science in Opava - Course Enrolment Limitations
- The course is also offered to the students of the fields other than those the course is directly associated with.
- fields of study / plans the course is directly associated with
- Corpus linguistics with specialization in English (programme FPF, P7310 Filo)
- Corpus linguistics with specialization in German (programme FPF, P7310 Filo) (2)
- Course objectives (in Czech)
- Uchovávání a další práce s dokumenty v elektronické a vícejazyčné podobě podobě se stává jednou z klíčových filologických, jazykovědných a překladatelských kvalifikací. K jejímu dosažení je nutno zvládnout nejen znalosti moderních technik strukturování elektronických textů (kódování textu), ale i zásadní pochopení výstavby velkých souborů lingvistických dat (korpusová lingvistika). Náplní předmětu je uchopení základních softwarových a lingvistických nástrojů nuntých k prokázání této kvalifikace formou vlastních projektů a jejich pezentace. Podmínkou pro připuštění ke zkoušce je řádné vypracování dílčích úkolů z každé tématické jednotky. 1. XML - standard 2. Práce s 'TEI Guidelines for text encoding' (P4 resp. P5) 3. Design, vytváření a zpracování XML-dokumentu 4. Principy formátování: XSL/XSLT 5. XML-projektování: monolingvální a multilingvální texové korpusy I-III 6. Architektura korpusu: Design, typologie, formát, annotation, archivování 7. Práce s korpusy I: Statististická analýza korpusových dat 8. Práce s korpusy II: Konkordance und kolokace Literatura: Bradley, Neil: The XML Companion, second edition, Harlow: Pearson Education Ltd., 2000 Sperberg -McQueen,Michael and Lou Burnard. Guidelines for Electronic Text Encoding and Interchange, XML-compatible edition. XML conversion by Syd Bauman, Lou Burnard, Steven DeRose, and Sebastian Rahtz, TEI Consortium Copyright (c), 2001. Erhältlich als 'The XML Version of the TEI Guidelines (March 2002)' from http://www.tei-c.org/P4X/ together with tutorials and guides to local practice. Text Tools and Corpora: Multext. Available from http://www.lpl.univ-aix.fr/projects/multext/ Tony McEnery and Andrew Wilson. Corpus Linguistics. Edinburgh: University Press, 1996 (2nd edition 2001) John Sinclair. Corpus Concordance, Collocation. OUP, 1991 Elena Tognini Bonelli. Corpus Linguistics at Work. Amsterdam: John Benjamins, 2001 Catherine N. Ball. Tutorial Concordances and Corpora. Available from: http://www.georgetown.edu/faculty/ballc/corpora/tutorial.html http://bowland-files.lancs.ac.uk/monkey/ihe/linguistics/contents.htm
- Language of instruction
- German
- Further Comments
- The course can also be completed outside the examination period.
- Enrolment Statistics (Summer 2008, recent)
- Permalink: https://is.slu.cz/course/fpf/summer2008/UCJDAJK1