쓰쿠바 대학생 생명 영역 학제 연구 센터의 마키노 아키지 교수와 국립 정보학 연구소 정보학 프린시플 연구계의 오노 준 타카준 교수 등의 연구 그룹은, 복수의 기기로 녹음한 복수의 사람의 겹친 음성으로부터 1명 한 목소리를 분리하여 여러 음성을 동시 인식할 수 있도록 하는 음성 신호 처리 기술을 개발했다.회의록의 자동 작성 등으로 활용이 기대되고 있다.
쓰쿠바대학에 의하면 연구그룹은 별도의 기기로 녹음되어 동기가 없는 복수의 녹음신호를 녹음 후 동기시키는 새로운 신호처리기술을 개발했다.이에 국립정보학연구소의 오노연구실이 개발한 고속 블라인드 음원 분리 기술을 조합하여 다중화자의 음성이 섞인 대화를 개별 음성으로 분리한 후 음성인식을 적용, 인식 성능을 대폭 향상시키는 데 성공했다.
이 기술을 응용하면 회의 참가자가 개별 스마트폰으로 회의 내용을 녹음하고 있으면 회의록을 자동 작성하는 것도 가능해진다.
음성인식 기능은 최근 대폭 향상되어 왔지만, 복수명의 말이 겹치는 대화나 회의에 이용하면 기능이 저하되는 것이 문제가 되고 있었다.
국립정보학연구소는 웹상의 시스템에 이 기술을 구현하는 연구도 진행하고 있다.연구 성과는 9월 8일부터 미국 캘리포니아주 샌프란시스코에서 열린 음성 분야의 국제회의에서 발표되었다.