2023
Model automatické transkripce historického dokumentu s využitím platformy Transkribus a PERO.cz
KATUŠČÁK, Dušan a Klára POHLOVÁZákladní údaje
Originální název
Model automatické transkripce historického dokumentu s využitím platformy Transkribus a PERO.cz
Název česky
Projekt SG7/7/2023. Model automatické transkripce historického dokumentu s využitím platformy Transkribus a PERO.cz
Název anglicky
Projekt SG7/7/2023. Model of automatic transcription of a historical document using the platform Transkribus and PERO.cz
Autoři
KATUŠČÁK, Dušan (703 Slovensko, garant, domácí) a Klára POHLOVÁ (203 Česká republika, domácí)
Vydání
2023. vyd. SU OPAVA, 4 s. 1. ver. 2023
Nakladatel
SU FPF
Další údaje
Jazyk
čeština
Typ výsledku
Výzkumná zpráva
Obor
50804 Library science
Stát vydavatele
Česká republika
Utajení
není předmětem státního či obchodního tajemství
Kód RIV
RIV/47813059:19240/23:A0001367
Organizační jednotka
Filozoficko-přírodovědecká fakulta v Opavě
Klíčová slova česky
Transkribus; transkripcia; umelá inteligencia; historické texty
Klíčová slova anglicky
Transkribus; transcription; artificial intelligence; historical texts
Štítky
Změněno: 12. 12. 2024 14:00, prof. PhDr. Dušan Katuščák, PhD.
V originále
V projektu SGS byly dosaženy užitečné výsledky pro výzkum transkripce a pro vzděláváni na SU. Projekt byl zaměřen na pokračování experimentů s transkripcí rukopisného historického textu s velice slibným výsledkem. Transkribováná byla rukopisní kniha psaná německým kurentem. Výsledek transkripce je věřejne dostupný na stránce platformy Transkribus. Dále byly zkoumány možnosti automatické transkripce archivních dokumentů, ktoré jsou psány psacími stroji. (V archivech je takových materiálů ca 50-80%) 1. Provedena heuristika vhodných tiskopisných sbírek, které lze použít pro vytvoření nového přepisovacího modelu v platformě Transkribus. (Hledání bylo provedeno i v rámci praktické části diplomové práce). Výsledných 10 sbírek bylo oskenováno v archivu v Jeseníku (cca 12 stran z každé knihy), k čemuž byl použit skenovací stan ScanTent, který byl zapůjčen Slezskou univerzitou.Výsledné skeny byli poté nahrány do platformy Transkribus Expert Client. S každým dokumentem se pracovalo zvlášť. Nejprve u každé proběhla automatická segmentace, poté se manuálně přepisoval text ve zhruba 4 stran z každé knihy a s těmi se dále pracovalo v rámci přepisů. 2. Zkoušení nového programu pro přepis dokumentů, InkCapture. Písemné hodnocení nástroje transkripce InkCapture. (Připojeno) Vybrání
vhodného rukopisu, který lze použít pro potřeby skenu. Poté registrace uživatele v
programu a následná práce s přepsanými skeny. Sepsáno souhrné hodnocení
ohledně celé platformy InkCapture." Nástroj PERO.cz nebyl dostupný.