도쿄 이과 대학과 사이타마 대학 대학원의 연구 그룹은 복수 언어의 감정 개념을 해석하고 인간의 감정 개념과 관계가 깊은 중심적 감정이 「GOOD」 「WANT」 「BAD」 「LOVE」의 4개이다 밝혔다.
감정과 감정과 관련된 개념은 커뮤니케이션이나 자연언어 처리, 감정분석에 중요한 역할을 한다. 감정 분석이란 문장이나 발언으로부터 감정이나 의견을 추출해 해석하는 것. 긍정적, 부정적, 중립적인 의견 등 텍스트나 음성 정보로부터 감정을 추정할 수 있어 SNS 모니터링, 상품 리뷰 분석 등에 도움이 된다.
colexification(콜렉시피케이션)이란 하나의 단어가 복수의 개념을 의미하는 현상으로, 분석에 의해 언어가 개념을 어떻게 파악해 표현하고 있는지를 이해할 수 있다. colexification을 나타내는 복수의 개념을 네트워크로 파악하고 해석하고, 다양한 감정에 관한 개념간의 관련성을 복수의 언어로 조사했다.
그 결과 다른 많은 감정과 관련성이 높은 허브가 되는 중심적 개념 'GOOD', 'WANT', 'BAD', 'LOVE'를 발견했다. 다음으로, 이 4개의 허브와 다른 감정 개념의 관련성의 높이에 따라 6계층으로 분류하고, 같은 계열의 감정 개념을 5개의 커뮤니티로 정의했다. 그 결과, 허브에 가까운 계층의 감정 개념의 대부분은 허브와 같은 커뮤니티였지만, 「HOPE」, 「HAPPY」, 「GLOOMY」 등, 허브와 같은 커뮤니티에서도 허브와의 관련성이 낮은 개념도 있었다 .
또 정반대의 'GOOD'와 'BAD'의 두 개념과 관련된 개념으로 'BIG', 'SMALL', 'ANIMAL', 'WHITE', 'SICK', 'BRAVE'의 6개를 확인했다. 예를 들어, 영어의 'BRAVE'에는 '훌륭함'과 '무모' 등 'GOOD'과 'BAD'와 관련된 요소를 포함한다.
이번 연구를 발전시킴으로써 혁신적인 자연언어 처리, 감정 분석 방법의 확립에 공헌할 것으로 기대된다고 한다.
논문 정보:【Scientific Reports】Central emotions and hubs in a colexification network