구마모토 대학과 인쇄 대기업 TOPPAN은 AI 기술을 융합시킨 광학 문자 인식으로 난이도가 높은 쓰레기로 쓰여진 문서를 해독하는 데 성공했다. 또한, 쓰레기자료의 해독시스템과 연동한 키워드 검색시스템을 구축하여 필요한 자료를 즉시 수집할 수 있도록 하고 있다.
구마모토 대학에 따르면, 해독에 성공한 것은 에도시대에 히고국(현재의 구마모토현)을 다스리고 있던 호소카와가의 문서 중, 번주 호소카와 타다리의 명령을 기록한 「봉서」, 참근중인 번주 가 국원에게 보낸 서장의 앞에 있는 「고쿠니 어서 안문」, 소봉행중으로부터 발행된 서장의 앞에 있는 「분들에게의 상공」 등 합계 약 5만장.
도쿄도 분쿄구에서 호소카와가에 관한 자료나 무구 등을 공개하고 있는 영청문고로부터 기탁을 받은 귀중한 역사 자료이지만, 난이도가 높은 쓰레기로 쓰여져 있기 때문에, 지금까지 해독할 수 없었다 . 그래서 구마모토 대학과 TOPPAN은 AI 기술을 융합시킨 광학 문자 인식을 사용하여 쓰레기 문자를 해독했다.
고문서는 전국에 수십억점 남아 있다고 하며 현대 사회과제에 직결되는 재해와 역병, 지역문화가 세세하게 기록되어 있다. 그러나 현대인이 읽기 어려운 쓰레기로 쓰여져 있기 때문에 당시의 기록을 방재나 관광 자원의 창출 등에 활용하기가 어렵다.
TOPPAN은 2015년부터 국문학연구자료관과 공동연구해 쓰레기를 읽을 수 있는 광학문자인식기술 개발을 진행해 왔다. 신기술을 탑재한 키워드 검색 시스템의 활용으로 고문서로부터 필요한 정보 수집이 용이해지고, 연구를 가속할 것으로 기대되고 있다.
참조 :【구마모토 대학】 구마모토 대학과 TOPPAN, 쓰레기 AI-OCR 활용한 고문서의 대규모 조사를 위한 독자적인 수법을 개발