도호쿠대학대학원 우유유스미 대학원생과 이토 아키노리 교수 등의 연구팀은 티켓 예약 등의 사람으로부터 부탁받은 태스크를 수행하기 위한 시스템을 보다 현명하게 하는 대화형 인공지능(AI)의 새로운 수법을 개발. AI 자체가 시스템 학습 시 보상을 받고 새로운 상황을 탐구하기 위한 '호기심'을 가짐으로써 효율적인 대화가 가능해진다.

 ChatGPT 등으로 대표되는 자연 언어를 사용하는 대화형 AI 기술은 지난 몇 년간 극적으로 발전하여 채팅봇을 비롯한 다양한 시스템에 활용되는 등 일상 작업의 자동화 및 효율화 하지만 진행되고 있다. 그러나, 현재의 대화형 AI는, 태스크 달성에 불필요한 질문을 해 버리는 등, 반드시 태스크 달성의 효율이 충분하지 않았다.

 대화 시스템이 적절하게 행동하기 위한 시스템 개발 수법에 장기나 바둑의 AI에도 사용되고 있는 강화 학습이 있다. 이번 연구에서는 강화 학습에 「호기심 구동형의 탐색 방법」을 도입. 이것은, 시스템이 새로운 응답을 시도했을 때에 「호기심 보상」(피드백)을 주는 것으로, 시스템이 적극적으로 새로운 대응 방법을 탐색할 수 있는 구조이다.

 또한, 복수의 에이전트(로봇 등의 행동 주체) 후보를 준비해, 그 중에서 가장 균형 잡힌 행동을 하는 에이전트를 선택하는 구조를 채용했다. 에이전트를 교환하는 구조도 도입.

 이번 연구 성과에 따라 태스크를 달성하는 유형의 채팅봇(접수, 안내, 예약 등)의 성능이 향상되어 적절한 응답을 돌려주면서 짧은 대화로 작업을 종료할 수 있게 된다고 한다.

논문 정보:【IEEE Access】A replaceable curiosity-driven candidate agent exploration approach for task-oriented dialog policy learning

도호쿠 대학

혁신의 원천이 되는 뛰어난 연구 성과를 창출해, 차세대를 담당하는 유능한 인재를 육성

도호쿠 대학은 개학 이래의 「연구 제일주의」의 전통, 「문도 개방」의 이념 및 「실학 존중」의 정신을 바탕으로, 풍부한 교양과 인간성을 가져 인간·사회나 자연의 사상 에 대해 「과학하는 마음」을 가지고 지적 탐구를 하는 행동력이 있는 인재, 국제적 시야에 서 다양한 분야에서 전문성을 발휘해 지도적

대학 저널 온라인 편집부

대학 저널 온라인 편집부입니다.
대학이나 교육에 대한 지견・관심이 높은 편집 스탭에 의해 기사 집필하고 있습니다.