교토대학 대학원 정보학연구과의 구로하시 요시오 교수와 과학기술진흥기구 정보기획부의 나카자와 토시아키 연구원들은 뉴럴네트워크※를 이용한 일중・중일과학기술논문기계번역시스템을 개발. 2018년 5월 8일부터 과학기술진흥기구의 HP로 시스템 제공을 시작했다.

 최근 중국에서 발표되는 과학기술논문수가 미국에 이은 세계 2위가 되어 중국어로 쓰여진 과학기술문헌 등을 일본어로 검색, 열람하고 싶다는 수요가 높아지고 있다.신속하고 저렴하게 처리가 가능한 기계번역의 보급이 기대되는 한편, 과학기술정보의 번역에서는 다양한 전문 용어나 최신기술을 나타내는 신어가 존재하기 때문에 기계번역의 고정밀화가 요구되고 있다 .

 이러한 현상을 배경으로 2013년부터 교토대학 대학원 정보학연구과, 과학기술진흥기구 정보기획부, 중국과학기술신식연구소가 연계하여 과학기술논문을 대상으로 한 고정밀 신경기계 번역 시스템의 실용화를 추진하는 '중일·중일 기계 번역 실용화 프로젝트'에 임해 왔다.

 프로젝트에서는 과학기술논문 등을 바탕으로 400만건 이상의 중국어・일본어 대역 코퍼스(=기계번역 훈련에 사용되는 교사 데이터)를 정비.이들을 이번에 개발한 신경기계번역 엔진으로 학습시켜 대역 사전의 정비에 의해 오역, 번역 누락을 저감시켰다.그 결과, 개발로 정한 평가 기준에 있어서 「대부분의 중요 정보가 포함된다」가 97%, 또 「정보에 과부족이 없어 용이하게 이해 가능」이 약 6할의 번역 정밀도를 달성.또, 2016년 12월에 개최된 아시아 언어를 대상으로 한 국제적인 기계 번역 워크숍 「WAT2016」에서의 평가에 있어서, 과학 기술 정보의 기계 번역 태스크로 1위의 정밀도를 나타냈다.

 일·중·중일 기계 번역 시스템은 향후 대역 코퍼스와 대역 사전의 정비를 통해 최첨단 기술 정보에 대해서도 정밀한 번역을 제공할 수 있을 것으로 기대되고 있다.

※뉴럴 네트워크란, 인간의 뇌세포에 있어서의 정보 전달의 구조를 모방해 고안된 계산 모델.컴퓨터가 복잡한 일을 이해하는 '심층 학습'에 사용되어 기계 번역에 한정되지 않고, 최근 고도의 화상 인식이나 바둑, 장기 등 매우 많은 분야에서 활용되고 있다.

교토

「자중 자경」의 정신에 근거해 자유로운 학풍을 기르고, 창조적인 학문의 세계를 개척한다.

자학 자습을 모토로 상식에 얽매이지 않는 자유의 학풍을 계속 지켜 창조력과 실천력을 겸비한 인재를 키웁니다.학생 자신이 가치 있는 시행착오를 거쳐 확실한 미래를 선택할 수 있도록 다양성과 계층적이고 다양한 선택사항을 허용하는 포용력이 있는 학습장을 제공합니다. […]

대학 저널 온라인 편집부

대학 저널 온라인 편집부입니다.
대학이나 교육에 대한 지견・관심이 높은 편집 스탭에 의해 기사 집필하고 있습니다.