Detailed Information on Publication Record
2024
Český supermodel na transkripciu bohemikálnych historických dokumentov; Opava_SGS_2024
KATUŠČÁK, Dušan, Vojtěch ŘÍHA and Lukáš NEMECBasic information
Original name
Český supermodel na transkripciu bohemikálnych historických dokumentov; Opava_SGS_2024
Name (in English)
Czech supermodel for transcription of Bohemian historical documents; Opava_SGS_2024
Authors
KATUŠČÁK, Dušan (703 Slovakia, guarantor, belonging to the institution), Vojtěch ŘÍHA (203 Czech Republic, belonging to the institution) and Lukáš NEMEC (203 Czech Republic, belonging to the institution)
Edition
1. vyd. Opava, 1000 pp. Datasety Transkribus, 2024
Publisher
ZENODO
Other information
Language
Czech
Type of outcome
Research report
Field of Study
50804 Library science
Country of publisher
Czech Republic
Confidentiality degree
is not subject to a state or trade secret
References:
Organization unit
Faculty of Philosophy and Science in Opava
Keywords (in Czech)
modely transkripce; historické rukopisy; transkripce českých dokumentů; transkripce slovenských dokumentů
Keywords in English
transcription models; historical manuscripts; transcription of Czech documents; transcription of Slovak documents; Transkribus platform
Changed: 8/1/2025 13:50, prof. PhDr. Dušan Katuščák, PhD.
V originále
ČESKÝ supermodel_SGS. Cvičná sada: 947 stran; Validačná sada: 93 s. Výsledky: Cvičná sada: 2,98 % Validačná sada: 5,83 % Výskumníci v projekte Študentské grantové súťaže (SGS) zvládli v priebehu niekoľkých mesiacov prácu na platforme Transkribus. Osvojili si metódy prípravy, nahrávanie, segmentáciu a vykonali množstvo čiastkových experimentov pri tvorbe vlastných modelov transkripcie. Získali znalosti a zručnosti a cenné know-how v transkripcii rukopisov. Lukáš Němec vytvoril na základe piatich rukopisných dokumentov Finale 2.0 (ID: 213733) s chybovosťou len CER 6,56 %. Ďalší skvelý model Agreg-8 (ID: 207993) vytvoril Vojtěch Říha s chybovosťou len 2,86%. Do studia jsme zařadili také popis a výsledky přípravy modelu ID 58379 s chybovostí jen 4,10% na transkripci strojopisných dokumentů Kláry Pohlové (POHLOVÁ, 2024) z projektu SGS v roce 2023. Jej parciálny model ID 58379 bol priložený do supermodelu ID78289 (SUPERMODELP SUPERMODELP 2024). Vybrané zbierky sú dostupné v rámci digitálnej knižnice Manuskriptorium (Vojtěch Říha): 1. Česká modlitební kniha (ČESKÁ, 1733-1766) 2. Cesta Svatocellenská (CESTA, 1733-1766) 3. Radostná cesta (RADOSTNÁ, 1829-1884) 4. Modlitby, písně a litanie (MODLITBY, 1826) 5. Modlitební knížka (MODLITEBNÍ, 1700-1750) Rukopisné dokumenty pre tvorbu modelu boli vybrané z ďalších možných vybraných (Lukáš Nemec): 1. Gallaš, Josef Heřman Agapit [Rukopis]: Mytické povídky o bozích a bohyních moravských Slovanů. (GALLAŠ, 1820) 2. Gallaš, Josef Heřman Agapit: [Rukopis]. [Fyzické] pamiatky mesta Hranice a okolia . (GALLAŠ, 1808-1811) 3. Gallaš, Josef Heřman Agapit [Rukopis] Walaši v kraji Přerovském (GALLAŠ, 1801-1804) 4. Polášek, František [Rukopis]: Pravé poznanie Boha aneb troje hodinky o dokonalých božských [Rukopis] (POLÁŠEK, 1800-1900) 5. Jaroš, Otakar [Rukopis]: Nauka o terénu [Školní sešit, čtverečkovaný/linkovaný papír]. (JAROŠ) V projekte SGS 2024 sme nakoniec vytvorili agregovaný CZECH supermodel_SGS (ID 220865) na základe vyššie uvedených parciálnych modelov, ktoré pripravili študenti Lukáš Němec a Vojtěch Říha, a to s chybami len 5,86%. S naším modelom je možné transkribovať podobné rukopisy s presnosťou 94,17%. Základom supermodelu CZECH supermodel_SGS je: 1. parciální model, jehož autorem je študent Lukáš Němec. Jedná se o model Finale 2.0 (ID: 213733). Bol vyrobený na základe menších vlastných piatich pracovných modelov: -Physical Absolut (IČO 213213); Valašský absolút (IČO 211773); Mystic Absolut (ID 210053); Franz II. (ID 204714); Ota 14 (IČO 182965); 2. parciální model, jehož autorem je student Vojtěch Říha. Jedná se o model Agreg-8 (ID: 207993); 3. 15 rukopisných strán GT z dokumentu Protokoly Matice slezské (ID:1663382).
In English
CZECH supermodel_SGS. Practice set: 947 pages; Validation set: 93 pages. Results: Practice set: 2.98% Validation set: 5.83% Researchers in the Student Grant Competitions (SGS) project mastered the work on the Transkribus platform within a few months. They mastered the methods of preparation, recording, segmentation and performed a number of partial experiments in creating their own transcription models. They gained knowledge and skills and valuable know-how in manuscript transcription. Based on five manuscript documents, Lukáš Němec created Finale 2.0 (ID: 213733) with an error rate of only CER 6.56%. Another great model, Agreg-8 (ID: 207993), was created by Vojtěch Říha with an error rate of only 2.86%. We also included in the study the description and results of the preparation of the model ID 58379 with an error rate of only 4.10% for the transcription of typewritten documents of Klára Pohlová (POHLOVÁ, 2024) from the SGS project in 2023. Her partial model ID 58379 was attached to the supermodel ID78289 (SUPERMODELP SUPERMODELP 2024). Selected collections are available within the Manuscriptorium digital library (Vojtěch Říha): 1. Czech prayer book (CZECH, 1733-1766) 2. Cesta Svatocellenská (ROAD, 1733-1766) 3. Joyful journey (JOYFUL, 1829-1884) 4. Prayers, songs and litanies (PRAYERS, 1826) 5. Prayer book (PRAYER, 1700-1750) Manuscript documents for the creation of the model were selected from other possible ones (Lukáš Nemec): 1. Gallaš, Josef Heřman Agapit [Manuscript]: Mythical stories about the gods and goddesses of the Moravian Slavs. (GALLAŠ, 1820) 2. Gallaš, Josef Heřman Agapit: [Manuscript]. [Physical] monuments of the city of Hranice and its surroundings. (GALLAŠ, 1808-1811) 3. Gallaš, Josef Heřman Agapit [Manuscript] Walaši v kraji Přerovském (GALLAŠ, 1801-1804) 4. Polášek, František [Manuscript]: Pravé poznanie Boha aneb troje hodiny o perfectičkych bohích [Manuscript] (POLÁŠEK, 1800-1900) 5. Jaroš, Otakar [Manuscript]: Nauka o terenu [School notebook, squared/lined paper]. (JAROŠ) In the SGS 2024 project, we finally created an aggregated CZECH supermodel_SGS (ID 220865) based on the above-mentioned partial models, prepared by students Lukáš Němec and Vojtěch Říha, with errors of only 5.86%. With our model, it is possible to transcribe similar manuscripts with an accuracy of 94.17%. The basis of the CZECH supermodel_SGS supermodel is: 1. partial model, the author of which is student Lukáš Němec. This is a Finale 2.0 model (ID: 213733). It was built on the basis of smaller own five working models: -Physical Absolut (IČO 213213); Wallachian absolute (IČO 211773); Mystic Absolute (ID 210053); Francis II. (ID 204714); Ota 14 (IČO 182965); 2nd partial model, the author of which is student Vojtěch Říha. This is the Agreg-8 model (ID: 207993); 3. 15 manuscript pages of GT from the document Protocoly Matice slezské (ID:1663382).