쓰쿠바대학의 연구그룹은 일본어 모어 화자가 영문을 독해했을 때 총 41만 어 이상에 대한 안구운동 데이터 세트를 수집하여 Tsukuba Eye-tracking Corpus(TECO)로 구축·공개했다.

 문장 독해중의 안구운동 데이터는 인간이 글쓰기를 처리·이해하는 과정을 밝히는데 유용하다는 것이 밝혀졌다. 그 때문에 최근 시선 계측이라고 하는 방법으로 수집된 모국어나 외국어로의 독해에 있어서의 대규모 안구 운동 데이터를 체계적으로 정리하여 시선 계측 코퍼스(eye-tracking corpus)로서 공개하는 대처가 진행되고 있다 있습니다. 그러나 영어 학습자의 데이터는 유럽과 그 주변 지역에서 수집된 것이 중심이며, 아시아권의 데이터가 부족했다.

 그래서 본 연구 그룹은 일본어를 모어로 하는 영어 학습자의 대학생·대학원생 41명을 협력자로 하여 영어 검준 2급~준 1급에 상당하는 영어 문장을 독해했을 때의 1명 당 약 1만어(총계 약 41만어 이상)에 대한 안구운동 데이터를 수집하였다.

 본 데이터세트에는 문장에 포함된 각 단어에 대해 주시의 총 횟수, 주시의 총 지속시간, 최초로 일어난 시선의 지속시간, 다음 단어를 읽을 때까지의 시선의 지속시간, 리턴을 포함한다 다음 단어를 읽을 때까지의 시선 지속 시간, 건너 뛰기 유무, 후속 단어에서 다시 읽는 유무, 두 번째 주시 유무, 두 번째 읽기 유무의 총 2 개의 지표 포함 있습니다. 이들을 분석한 결과, 수집한 안구 운동 데이터의 신뢰성, 타당성이 유지되고 있는 것이 확인되었다.

 수집한 데이터는, Tsukuba Eye-tracking Corpus(TECO)로서 오픈 사이언스의 플랫폼에서 공개하고 있어, 문장 이해나 언어 습득의 연구에 활용될 것이 기대된다. 또한 자연언어 처리와 AI 연구 등을 포함한 폭넓은 학술 분야에 대한 파급 효과도 생각할 수 있다고 한다.

논문 정보:【Research Methods in Applied Linguistics】TECO: An Eye-tracking Corpus of Korean L2 English Learnersʼ Text Reading

筑波 大学

학제 융합·국제화에의 도전을 계속해, 지성과 인간성을 갖춘 인재를 육성

학문문화의 향기 높은 국제도시, 쓰쿠바사이언스시티의 핵심이 되는 녹지 넘치는 쓰쿠바대학.현재의 교육 체제는 9 학군·23 학류, 모든 분야로부터 전문 도입적인 과목을 이수할 수 있어, 창조적인 지성과 풍부한 인간성을 갖추는 것을 목표로 하고 있습니다.사혼 이재로 지구 규모 과제 해결 […]

대학 저널 온라인 편집부

대학 저널 온라인 편집부입니다.
대학이나 교육에 대한 지견・관심이 높은 편집 스탭에 의해 기사 집필하고 있습니다.