오사카대학 산업과학연구소의 다케다 류조교 등의 연구그룹은 음성 대화 시스템에 필요한 '대화에 포함되는 미지어의 특정' 기술에 알고 있는 단어의 발음 구성 패턴에 기초한 '음 표현 단위 '를 사용하는 메커니즘을 도입했다.

 최근, 음성 응답을 하는 로봇이나 앱이 많이 공개되고 있지만, 기본적으로 사전에 등록된 단어만을 인식하는 구조다.그 이외의 단어(미지어)가 발화에 포함되면, 알고 있는 단어군으로 치환되어 버려, 「단어」로서 올바르게 인식할 수 없다.만약, 「모르는 단어」의 부분을 올바르게 인식할 수 있으면, 사람에게 듣고 그 의미를 학습하는 것도 가능하게 된다.

 연구에서는 자연언어처리 기술에 있어서의 「교사 없음 단어 분할」수법에 주목하여, 발화중의 미지어의 특정에 응용하였다.이 수법에서는 통상 쓰는 단어를 대상으로 해, 잘라내기의 단위는 「문자」가 되지만, 음성에 적용하는 경우는 「음 표현의 단위」로서 무엇을 사용해야 하는지, 무엇이 유효한지는 자명하지 않다.그 단위로서 음소(발음 기호)나 음절(히라가나) 등의 표현이 있다.

 개발된 방법에서는, 「단어다움」을 이용하여 계산된 「발음과 그 구성 패턴에 기초한 단위」를 「음 표현의 단위」로서 이용하고 있다.이 패턴은, 복수의 단어에 나타나는 공통의 발음과 출현 위치로부터 계산되어, 알고 있는 단어와 가까운 발음 구성의 미지어를 보다 특정하기 쉬워진다.음소의 인식은 바르게 할 수 있었다고 가정해, 일본어·영어의 대화 코퍼스로 미지어의 특정율을 각 단위로 검증하고 있다.

 이 성과는 개발자가 사전에 준비하거나 갱신하거나 하는 교환을 할 수 있을 뿐만 아니라, 인간과 이야기함에 따라 스스로 배워 점차 현명해져 가는 음성 대화 시스템의 실현에 필요한 기술이라고 한다.

논문 정보:【2018 IEEE Spoken Language Technology Workshop (SLT)】Word Segmentation from Phoneme Sequences based on Pitman-Yor Semi-Markov Model Exploiting Subword Information

오사카 대학

한사람 한사람의 「진가」를, 한대의 「진화」에.지역에 살아 세계로 늘어나는 대학에

오사카 대학은 11학부 23학과를 가진 연구형 종합대학. 1931년의 창설 이래, 「지역에 살아 세계에 성장한다」를 모토로, 고도의 교육 연구력, 교직원의 합의 힘, 그리고 전통의 무게와 오사카라고 하는 땅의 이익이 만들어내는 탁월한 「기반」과 「힘」을 가지고 있습니다.이 뛰어난 잠재력을 살려[…]

대학 저널 온라인 편집부

대학 저널 온라인 편집부입니다.
대학이나 교육에 대한 지견・관심이 높은 편집 스탭에 의해 기사 집필하고 있습니다.