나고야공업대학의 국제음성언어기술연구소와 주식회사 테크노스피치는 인간의 성질, 버릇, 노래방법을 지금까지보다 정밀하게 재현할 수 있는 AI 가성합성시스템의 공동 개발에 성공했다고 발표했다.
음성 합성·가성 합성 기술의 연구·개발에 공동으로 임해 온 나고야 공업 대학과 테크노 스피치는, 지금까지, 업무용 노래방 기기 “JOYSOUND”나, 음성 창작 소프트웨어 “CeVIO Creative Studio” 등에, 음성 합성・가성 합성 기술의 도입을 진행해 왔다.
본 연구에서는, 특정 가창자에 의한 약 2시간의 가성 데이터베이스에 대해서, 심층 학습(딥 러닝) 등의 통계적인 기계 학습 기술, 즉 AI 기술을 적용함으로써, 가창자의 성질·버릇· 노래하는 법을 배우는 시스템을 개발했다.학습한 가성을 합성할 때는, 임의의 가사 첨부 악보를 입력하는 것만으로 좋고, 사람과 구별을 할 수 없을 정도의 초고품질인 가상 가수의 가성이 실현되었다고 한다.본 연구 성과는 2019년 3월에 개최되는 일본 음향 학회 2019년 춘계 연구 발표회에서 발표된다.
테크노 스피치는 나고야 공업대학이 중심으로 개발한 세계 최첨단 음성 관련 기술의 보급을 목적으로 설립된 벤처기업.동사와 대학은 본 연구 성과에 따라 음성 관련 기술의 제공·서비스의 추가적인 가치 향상을 목표로 하고 있다.
참조 :【주식회사 테크노 스피치】AI 기술에 의해 초고정밀한 가성 합성을 실현~버추얼 싱어의 가성은 사람과 구별할 수 없는 시대에~