KATUŠČÁK, Dušan. Progress in making available blackletters typefaces and handwritten written heritage using artificial intelligence. Preprint. Researchgate. 2021, 25 pp.
Other formats:   BibTeX LaTeX RIS
Basic information
Original name Progress in making available blackletters typefaces and handwritten written heritage using artificial intelligence. Preprint
Name in Czech Pokrok při zpřístupňování písem typu blackletters a ručně psaného písemného dědictví pomocí umělé inteligence. Preprint
Authors KATUŠČÁK, Dušan.
Edition Researchgate, 2021.
Other information
Type of outcome Article in a journal
Field of Study 50802 Media and socio-cultural communication
Confidentiality degree is not subject to a state or trade secret
WWW URL
Organization unit Faculty of Philosophy and Science in Opava
Keywords in English Digital humanities. OCR. READ-COOP. Transcription platform. Project Scriptor. Andrej Kmet. Blackletters typefaces. Read & Search.
Tags International impact
Changed by Changed by: prof. PhDr. Dušan Katuščák, PhD., učo 52623. Changed: 16/10/2021 14:10.
Abstract
Resumé Témou štúdie je vedecký a metodologický kontext európskeho projektu základného výskumu READ a aplikácia výsledkov tohto výskumu na Slovensku. Štúdia je súčasťou pokračujúcich aplikácií projektu READ. Ukazuje pokrok vo výskumoch, aplikáciách a experimentoch, ktorým sa venuje medzinárodná komunita digital humanities v rámci združenia READ-COOP od roku 2019. Súčasťou týchto aktivít je aj slovenský projekt aplikovaného výskumu s akronymom SKRIPTOR, plánovaný na roky 2020-2024. Na základe informačného prieskumu a výberu najnovších informačných zdrojov ukazuje pokrok vo výskume a aplikáciách v oblasti optického rozlišovania písma OCR . Jadro štúdie je zamerané na používateľský a nie informatický prístup k využitiu platformy Transkribus na automatické rozpoznávanie textov historických dokumentov. Popisuje skúsenosti a poznatky získané pri osvojovaní si platformy Transkribus, ktorá využíva umelú inteligenciu stroja OCR a metódu HTR+ . V štúdii sú vysvetlené a ilustrované jednotlivé hlavné kroky experimentov, proces učenia stroja až po vytvorenie nových modelov transkripcie a výsledkov automatickej transkripcie tlačenej fraktúry a rukopisných listov Andrej Kmeťa. Štúdia predstavuje aj prvý nový efektívny model transkripcie tlačeného historického tlačeného písma slovenskej fraktúry (švabachu) v platforme Transkribus. Najprv vysvetľuje unikátny experiment s transkripciou tlačených slovenských a českých textov fraktúry. Nasleduje popis pokročilej experimentálnej transkripcie rukopisných listov Andreja Kmeťa. Predstavuje možnosti sprístupnenia transkribovaných zbierok a dokumentov v lokálnych sieťach a na internete.
Abstract (in English)
Summary The topic of the study is the scientific and methodological context of the European project of basic research READ and the application of the results of this research in Slovakia. The study is part of the ongoing applications of the READ project. It shows the progress in research, applications and experiments that the international community of digital humanities has been doing within the READ-COOP association since 2019. Part of these activities is also the Slovak project of applied research with the acronym SKRIPTOR , planned for 2020-2024. Based on information research and selection of the latest information sources, it shows progress in research and applications in the field of optical character recognition OCR . The core of the study is focused on a user and not an IT approach to the use of the Transcribus platform for automatic recognition of texts of historical documents. It describes the experience and knowledge gained in mastering the Transcribus platform, which uses the artificial intelligence of the OCR machine and the HTR + method. The study explains and illustrates the main steps of the experiments, the process of learning the machine up to the creation of new models of transcription and the results of automatic transcription of printed fractures and manuscripts by Andrej Kmeť. The study also presents the first new efficient model of transcription of the printed historical printed font of the Slovak blackletters typefaces in the Transkribus platform. First, it explains a unique experiment with the transcription of printed Slovak and Czech fracture texts. The following is a description of the advanced experimental transcription of Andrej Kmeť's manuscript letters. It presents the possibilities of making transcribed collections and documents available on local networks and on the Internet.
PrintDisplayed: 24/1/2022 17:10