2024年07月26日 12:52

熊本大学とTOPPANは、専門家でも解読が困難な難易度の高いくずし字で書かれた約5万枚の未解読の古文書(藩政記録)をAI-OCRを用いて短期間で解読。約950万文字のテキストデータを生成することに成功した。
古文書のなかには、防災や観光資源の創出・地域の活性化にもつながる貴重な情報が記されているものがある。しかし、古文書のほとんどは「くずし字」で書かれているため現代人にとって判読が困難であり、当時の記録・文献を活用する際の大きな障壁になっている。TOPPANは、これらの課題を解決する新たな手法として、2015年より人間文化研究機構 国文学研究資料館との共同研究を開始。以後、多数の研究機関等とくずし字AI-OCR技術の開発・実証を重ねてきた。
今回解読した古文書は、熊本大学が永青文庫から寄託を受けている歴史資料「細川家文書」のうち、細川家奉行所の執務記録である「奉行所日帳」など、合計約5万枚。また、くずし字AI-OCRにより作成したテキストデータに対して、今回「地震、大雨、洪水、虫、飢、疫」などの災害に関連するキーワードで検索・調査を実施。300件以上の記述を発見した。
今後、熊本大学とTOPPANは、「細川家文書」の解読と分析を進め、江戸時代の社会史研究の通時的深化に貢献。また新しく発見された災害関連の記録を活用することで、現代における防災意識の醸成、防災計画の策定等にも活用を目指す。