쓰쿠바 대학생 생명 영역 학제 연구 센터의 마키노 아키지 교수와 국립 정보학 연구소 정보학 프린시플 연구계의 오노 준 타카준 교수 등의 연구 그룹은, 복수의 기기로 녹음한 복수의 사람의 겹친 음성으로부터 1명 한 목소리를 분리하여 여러 음성을 동시 인식할 수 있도록 하는 음성 신호 처리 기술을 개발했다.회의록의 자동 작성 등으로 활용이 기대되고 있다.

 쓰쿠바대학에 의하면 연구그룹은 별도의 기기로 녹음되어 동기가 없는 복수의 녹음신호를 녹음 후 동기시키는 새로운 신호처리기술을 개발했다.이에 국립정보학연구소의 오노연구실이 개발한 고속 블라인드 음원 분리 기술을 조합하여 다중화자의 음성이 섞인 대화를 개별 음성으로 분리한 후 음성인식을 적용, 인식 성능을 대폭 향상시키는 데 성공했다.
이 기술을 응용하면 회의 참가자가 개별 스마트폰으로 회의 내용을 녹음하고 있으면 회의록을 자동 작성하는 것도 가능해진다.

 음성인식 기능은 최근 대폭 향상되어 왔지만, 복수명의 말이 겹치는 대화나 회의에 이용하면 기능이 저하되는 것이 문제가 되고 있었다.
국립정보학연구소는 웹상의 시스템에 이 기술을 구현하는 연구도 진행하고 있다.연구 성과는 9월 8일부터 미국 캘리포니아주 샌프란시스코에서 열린 음성 분야의 국제회의에서 발표되었다.

筑波 大学

학제 융합·국제화에의 도전을 계속해, 지성과 인간성을 갖춘 인재를 육성

학문문화의 향기 높은 국제도시, 쓰쿠바사이언스시티의 핵심이 되는 녹지 넘치는 쓰쿠바대학.현재의 교육 체제는 9 학군·23 학류, 모든 분야로부터 전문 도입적인 과목을 이수할 수 있어, 창조적인 지성과 풍부한 인간성을 갖추는 것을 목표로 하고 있습니다.사혼 이재로 지구 규모 과제 해결 […]

대학 저널 온라인 편집부

대학 저널 온라인 편집부입니다.
대학이나 교육에 대한 지견・관심이 높은 편집 스탭에 의해 기사 집필하고 있습니다.