이화학 연구소, 도쿄 대학을 포함한 대규모 국제 공동 연구 그룹 "The ICGC / TCGA Pan-Cancer Analysis of Whole Genomes Consortium"이 지금까지 가장 포괄적이고 상세한 암 게놈 정보를 분석하고, 결과를 보고했다. 38종류의 암에 대해 2800례 이상의 전체 게놈 시퀀스 해석이 이루어져 4600만개를 넘는 변이·이상과 그 특징이 밝혀졌다.
본 연구는, 2014년에 시동한 국제적 제휴에 의한 「전 게놈 암종 횡단적 해석 프로젝트(PCAWG)」의 일환으로서 행해졌다.프로젝트에는 37개국에서 1300명 이상의 과학자, IT 엔지니어, 임상가가 참가해, 지금까지 없는 암의 대규모 전체 게놈 시퀀스 해석에 임했다.
암 전체 게놈 시퀀스 해석에서는, 해석 알고리즘(파이프라인)에 의해 동일한 데이터로부터도 결과가 다른 것을 알고 있다.거기서 PCAWG에서는, 38개의 기본 파이프라인을 조합한, 고정밀도로 표준화된 변이 동정 알고리즘을 구축.이것을 이용하여, 지금까지 ICGC(국제암 게놈 컨소시엄)나 TCGA(암 게놈 아틀라스 계획)가 수집해 온 2834종류의 암의 XNUMX례의 전체 게놈 시퀀스 데이터를 해석했다.
시퀀스 데이터는 합계 약 1페타바이트(1000조바이트)에 이르기 때문에 도쿄대학의과연구소의 슈퍼컴퓨터 'SHIROKANE'을 포함한 세계 10곳의 슈퍼컴퓨터와 클라우드에서 데이터를 공유하고 거대한 가상 데이터 센터에서 작업이 이루어졌다.결과, 비코딩 영역의 변이, 게놈 구조 이상, 미토콘드리아 게놈 이상 등, 합계 4600만개를 넘는 변이·이상이 동정되었다.게다가, 동정된 돌연변이 정보를 16개의 워킹 그룹으로 해석하고, 이들의 다양한 특징이 밝혀진 것으로, 지금까지 가장 포괄적이고 상세한 암 게놈 맵을 작성할 수 있었다.
PCAWG에서의 전체 게놈 데이터나 개발한 해석 수법은, 전세계에서 공개되고 있다고 하고, 차세대의 암 게놈 의료 및 연구의 데이터 기반이 되는 것이 크게 기대된다.
참조 :【이화학 연구소】국제 연계에 의한 암 전 게놈의 대규모 해석-차세대의 암 게놈 의료의 해석 기반 구축에 공헌-