Technology: Interaction data may allow identification of anonymized individuals over time

 
개인 간의 교류 기록을 사용하면 장기간에 걸쳐 익명화 데이터 세트에서 특정 개인을 식별 할 수 있음을 시사하는 논문이자연 통신 에 게재된다.이번 지식은 이러한 종류의 데이터 취급에 관한 현재의 실무가 유럽연합의 일반 데이터 보호규칙에 정하는 익명화의 기준을 충족하지 않을 가능성이 높다는 것을 시사하고 있다.

개인 간의 교류에 관한 상세한 데이터는 메시징 앱, 휴대전화 경력, 소셜 미디어 제공자 및 기타 앱에 의해 수집되어 이들 서비스의 운영 및 연구 목적으로 이용되고 있다.이러한 데이터는 지금까지 개인의 교류 패턴의 연구, 유행성 질환의 공간적 확산의 예측, 친구 관계가 정치 동원에 미치는 영향의 연구에 이용되어 왔다.현행 데이터 보호 규제에서는 개인 간의 교류 데이터가 익명화되어 있으면 사용자의 동의 없이 공동으로 사용할 수 있고 매각할 수 있게 되어 있다.

이번 Yves-Alexandre de Montjoye, Ana-Maria Cretu는 개인 간의 교류 데이터가 장기간에 걸쳐 안정적이며 익명화 데이터 세트에서 특정 개인을 식별하는 데 사용할 수 있음을 밝혔다.저자들은 심층 학습 기술을 이용한 모델을 개발하고 이를 개인의 교류 네트워크를 기반으로 개인을 식별하도록 훈련하여 서로 다른 기간 동안 수집된 총 4만 명 이상의 데이터 세트 에 적용했다.이 모델은 홉 수 2의 교류 네트워크(개인과 대상자가 2홉 떨어져 있는 교류의 네트워크)에 기초하여 전체의 52%의 개인을 식별할 수 있었다.또한 이 모델은 개인의 직접 접촉자(홉수 1)를 이용함으로써 사람들을 15%의 확률로 식별할 수 있었다.개인의 교류는 장기간에 걸쳐 안정적이기 때문에, 저서들은 홉 수 2의 교류 네트워크를 사용하여 20주 후에 24%의 사람들을 확인할 수 있었다.게다가 이 모델을 587명으로 구성된 Bluetooth 근접 데이터 세트에 적용하면 26% 이상의 확률로 개인 식별이 가능했다.다만, 저자들은 이 모델을 접촉자 추적 프로토콜(Google이나 Apple의 접촉 통지 등)에 적용할 수 있다고는 생각하지 않는다고 말하고 있다.

저서들은 이번 연구결과에 의해 교류에 관한 익명화되고 연관되지 않게 된 데이터로부터 특정 개인을 장기간에 걸쳐 식별할 수 있는 가능성이 있는 것으로 나타났으며, 프라이버시 법령의 준수에 중요한 의미를 가지고 있다고 생각된다고 주장하고, 보안 대책(액세스 제어 시스템, 프라이버시 강화 시스템 등)을 사용해, 재식별화를 방지할 수 있다고 하는 생각을 나타내고 있다.

doi:10.1038/s41467-021-27714-6
[영어 원문 »]
 
「Nature 관련지 주목의 하이라이트」는, 네이처 홍보 부문이 보도 관계자용으로 작성한 릴리스를 번역한 것입니다.보다 정확하고 상세한 정보가 필요한 경우에는 원저 논문을 참조하십시오.

 
※이 기사는 「Nature Japan 주목의 하이라이트」에서 전재하고 있습니다.
원본 텍스트: "기술 : 개인 간의 교류 데이터가 있으면 장기간에 걸쳐 익명화 데이터에서 특정 개인을 식별 할 수 있습니다."
 

네이처 재팬

네이처 재팬 주식회사는 연구, 교육, 전문 분야에서 세계를 선도하는 출판사인 슈프링거 네이처의 일부입니다. 1987년 5월 설립 이후 네이처 재팬 주식회사는 과학지자연 의 일본 인쇄나 과학에 관한 보도 자료의 전달, 학술 저널이나 서적의 판매 및 마케팅 등, 출판 활동에 관련된 업무 전반을 집행하고 있습니다.또한 대학, 연구기관, 정부기관 및 기업의 파트너로서 각 기관의 특징을 내세우기 위한 커스텀 출판과 미디어 제작, 브랜딩과 연구 활동을 세계를 향해 발신하기 위한 광고 및 스폰서십 서비스를 제공하고 있습니다.아시아 태평양 지역의 주요 기지 중 하나로서 국내는 물론 싱가포르, 한국, 동남아시아, 오세아니아, 인도를 향해 광범위한 사업 활동을 전개하고 있습니다.