2021
Pokrok v sprístupňovaní švabachu a rukopisného písomného dedičstva s použitím umelej inteligencie
KATUŠČÁK, DušanZákladní údaje
Originální název
Pokrok v sprístupňovaní švabachu a rukopisného písomného dedičstva s použitím umelej inteligencie
Název česky
Pokrok v zpřístupňování švabachem a rukopisného písemného dědictví s použitím umělé inteligence
Název anglicky
Progress in making available cockroaches and manuscript written heritage using artificial intelligence
Autoři
KATUŠČÁK, Dušan
Vydání
2021
Další údaje
Typ výsledku
Článek v odborném periodiku
Utajení
není předmětem státního či obchodního tajemství
Organizační jednotka
Filozoficko-přírodovědecká fakulta v Opavě
Klíčová slova česky
Digital humanities. OCR. READ-COOP. Platforma Transkribus. Projekt Skriptor. Andrej Kmeť. Švabach. Fraktúra. Read&Search.
Klíčová slova anglicky
Digital humanities. OCR. READ-COOP. Transcription platform. Project Script. Andrej Kmet. Švabach. Fracture. Read & Search.
Návaznosti
APVV-19-NEWPROJECT-17816, projekt VaV.
Změněno: 15. 10. 2021 13:39, prof. PhDr. Dušan Katuščák, PhD.
V originále
SKRIPTOR. Projekt APVV-19-NEWPROJECT-17816 (2020-2024). Inovatívne sprístupnenie písomného dedičstva Slovenska prostredníctvom systému automatickej transkripcie historických rukopisov. [Innovative disclosure of written heritage of Slovakia through the automatic transcription of historical manuscripts]. Riešiteľské organizácie: Univerzita Mateja Bela v Banskej Bystrici (zodpovedný riešiteľ doc. Imrich Nagy PhD); Štátna vedecká knižnica v Banskej Bystrici – partner (garant prof. PhDr. Dušan Katuščák, PhD) Témou štúdie je vedecký a metodologický kontext európskeho projektu základného výskumu READ a aplikácia výsledkov tohto výskumu na Slovensku. Štúdia je súčasťou pokračujúcich aplikácií projektu READ. Ukazuje pokrok vo výskumoch, aplikáciách a experimentoch, ktorým sa venuje medzinárodná komunita digital humanities v rámci združenia READ-COOP od roku 2019. Súčasťou týchto aktivít je aj slovenský projekt aplikovaného výskumu s akronymom SKRIPTOR, plánovaný na roky 2020-2024. Na základe informačného prieskumu a výberu najnovších informačných zdrojov ukazuje pokrok vo výskume a aplikáciách v oblasti optického rozlišovania písma OCR . Jadro štúdie je zamerané na používateľský a nie informatický prístup k využitiu platformy Transkribus na automatické rozpoznávanie textov historických dokumentov. Popisuje skúsenosti a poznatky získané pri osvojovaní si platformy Transkribus, ktorá využíva umelú inteligenciu stroja OCR a metódu HTR+ . V štúdii sú vysvetlené a ilustrované jednotlivé hlavné kroky experimentov, proces učenia stroja až po vytvorenie nových modelov transkripcie a výsledkov automatickej transkripcie tlačenej fraktúry a rukopisných listov Andrej Kmeťa. Štúdia predstavuje aj prvý nový efektívny model transkripcie tlačeného historického tlačeného písma slovenskej fraktúry (švabachu) v platforme Transkribus. Najprv vysvetľuje unikátny experiment s transkripciou tlačených slovenských a českých textov fraktúry. Nasleduje popis pokročilej experimentálnej transkripcie rukopisných listov Andreja Kmeťa. Predstavuje možnosti sprístupnenia transkribovaných zbierok a dokumentov v lokálnych sieťach a na internete.
Anglicky
SCRIPTOR. Project APVV-19-NEWPROJECT-17816 (2020-2024). Innovative access to the written heritage of Slovakia through a system of automatic transcription of historical manuscripts. [Innovative disclosure of written heritage of Slovakia through the automatic transcription of historical manuscripts]. Research organizations: Matej Bel University in Banská Bystrica (responsible researcher doc. Imrich Nagy PhD); State Scientific Library in Banská Bystrica - partner (guarantor prof. PhDr. Dušan Katuščák, PhD) The topic of the study is the scientific and methodological context of the European project of basic research READ and the application of the results of this research in Slovakia. The study is part of the ongoing applications of the READ project. It shows the progress in research, applications and experiments that the international community of digital humanities has been doing within the READ-COOP association since 2019. Part of these activities is also the Slovak project of applied research with the acronym SKRIPTOR, planned for 2020-2024. Based on information research and selection of the latest information sources, it shows progress in research and applications in the field of optical character recognition OCR. The core of the study is focused on a user and not an IT approach to the use of the Transcribus platform for automatic recognition of texts of historical documents. It describes the experience and knowledge gained in mastering the Transcribus platform, which uses the artificial intelligence of the OCR machine and the HTR + method. The study explains and illustrates the main steps of the experiments, the process of learning the machine up to the creation of new models of transcription and the results of automatic transcription of printed fracture and manuscript letters by Andrej Kmeť. The study also presents the first new efficient model of transcription of the printed historical printed font of the Slovak fracture (švabach) in the Transkribus platform. First, it explains a unique experiment with the transcription of printed Slovak and Czech fracture texts. The following is a description of the advanced experimental transcription of Andrej Kmeť's manuscript letters. It presents the possibilities of making transcribed collections and documents available on local networks and on the Internet.