도호쿠대학대학원의 소창조 조교 등의 연구그룹은 선행연구에서 고성능을 달성한 심층학습모델의 주목영역과 의사의 진단에 근거한 중요영역을 비교한 결과 주목영역의 30% ~80%는 의학적 중요영역과 무관하며 양자에게 큰 뾰족함이 있음이 밝혀졌다.
심층학습 등 인공지능(AI)은 진보가 현저하고 의료 영상 진단에의 응용이 진행되고 있다. 그러나, 심층 학습 모델이 주목한 의료 영상의 특징이 의학적 소견과 어느 정도 일치하는지 등의 타당성의 검증은 불충분하고, 임상에서 의사의 진단 결과와의 괴리를 일으킬 가능성이 있다 위태롭다.
연구 그룹은 법의학의 사후 영상을 이용한 익사 진단을 예로 들어, 선행 연구에서 고성능을 달성한 심층 학습 모델의 의학적 타당성을 검증했다. 심층 학습 모델이 주목한 화상 특징을 가시화 기술로 특정해 「주목 영역」으로 하고, 방사선 진단 의사의 화상 소견에 근거해 주석한 화상 영역을 의학적 「중요 영역」이라고 정의하고, 모델의 주목 영역과 비교했다.
그 결과 모델의 주목 영역은 적은 경우라면 30%밖에 의학적 중요 영역과 일치하지 않았다. 또한, 80% 정도 일치하는 경우에도, 영역 중에서 중요시하는 위치가 다르다. 검증된 심층 학습 모델이 선행 연구에서 90% 이상의 높은 정답률로 익사를 분류 가능하다고 보고되고 있는 것으로부터 생각하면, 모델과 임상상의 의학적 소견의 사이에 예기치 않게 큰 뻔뻔이 있었다고 할 수 있다.
연구는 AI에 의한 의료 영상 진단의 의학적 타당성에 우려가 있음을 나타내고 있으며, 향후 새로운 훈련법의 개발 등 검증과 대책을 진행함으로써 안전성이 높은 AI의 임상 응용이 기대 될 것입니다.