2021
Progress in making available blackletters typefaces and handwritten written heritage using artificial intelligence. Preprint
KATUŠČÁK, DušanZákladní údaje
Originální název
Progress in making available blackletters typefaces and handwritten written heritage using artificial intelligence. Preprint
Název česky
Pokrok při zpřístupňování písem typu blackletters a ručně psaného písemného dědictví pomocí umělé inteligence. Preprint
Autoři
Vydání
Researchgate, 2021
Další údaje
Typ výsledku
Článek v odborném periodiku
Obor
50802 Media and socio-cultural communication
Utajení
není předmětem státního či obchodního tajemství
Odkazy
Organizační jednotka
Filozoficko-přírodovědecká fakulta v Opavě
Klíčová slova anglicky
Digital humanities. OCR. READ-COOP. Transcription platform. Project Scriptor. Andrej Kmet. Blackletters typefaces. Read & Search.
Příznaky
Mezinárodní význam
Změněno: 16. 10. 2021 14:10, prof. PhDr. Dušan Katuščák, PhD.
V originále
Resumé Témou štúdie je vedecký a metodologický kontext európskeho projektu základného výskumu READ a aplikácia výsledkov tohto výskumu na Slovensku. Štúdia je súčasťou pokračujúcich aplikácií projektu READ. Ukazuje pokrok vo výskumoch, aplikáciách a experimentoch, ktorým sa venuje medzinárodná komunita digital humanities v rámci združenia READ-COOP od roku 2019. Súčasťou týchto aktivít je aj slovenský projekt aplikovaného výskumu s akronymom SKRIPTOR, plánovaný na roky 2020-2024. Na základe informačného prieskumu a výberu najnovších informačných zdrojov ukazuje pokrok vo výskume a aplikáciách v oblasti optického rozlišovania písma OCR . Jadro štúdie je zamerané na používateľský a nie informatický prístup k využitiu platformy Transkribus na automatické rozpoznávanie textov historických dokumentov. Popisuje skúsenosti a poznatky získané pri osvojovaní si platformy Transkribus, ktorá využíva umelú inteligenciu stroja OCR a metódu HTR+ . V štúdii sú vysvetlené a ilustrované jednotlivé hlavné kroky experimentov, proces učenia stroja až po vytvorenie nových modelov transkripcie a výsledkov automatickej transkripcie tlačenej fraktúry a rukopisných listov Andrej Kmeťa. Štúdia predstavuje aj prvý nový efektívny model transkripcie tlačeného historického tlačeného písma slovenskej fraktúry (švabachu) v platforme Transkribus. Najprv vysvetľuje unikátny experiment s transkripciou tlačených slovenských a českých textov fraktúry. Nasleduje popis pokročilej experimentálnej transkripcie rukopisných listov Andreja Kmeťa. Predstavuje možnosti sprístupnenia transkribovaných zbierok a dokumentov v lokálnych sieťach a na internete.
Anglicky
Summary The topic of the study is the scientific and methodological context of the European project of basic research READ and the application of the results of this research in Slovakia. The study is part of the ongoing applications of the READ project. It shows the progress in research, applications and experiments that the international community of digital humanities has been doing within the READ-COOP association since 2019. Part of these activities is also the Slovak project of applied research with the acronym SKRIPTOR , planned for 2020-2024. Based on information research and selection of the latest information sources, it shows progress in research and applications in the field of optical character recognition OCR . The core of the study is focused on a user and not an IT approach to the use of the Transcribus platform for automatic recognition of texts of historical documents. It describes the experience and knowledge gained in mastering the Transcribus platform, which uses the artificial intelligence of the OCR machine and the HTR + method. The study explains and illustrates the main steps of the experiments, the process of learning the machine up to the creation of new models of transcription and the results of automatic transcription of printed fractures and manuscripts by Andrej Kmeť. The study also presents the first new efficient model of transcription of the printed historical printed font of the Slovak blackletters typefaces in the Transkribus platform. First, it explains a unique experiment with the transcription of printed Slovak and Czech fracture texts. The following is a description of the advanced experimental transcription of Andrej Kmeť's manuscript letters. It presents the possibilities of making transcribed collections and documents available on local networks and on the Internet.