Press release

2016. 11. 24. (목)부터 보도해 주시기 바랍니다.

국민 표준 게놈지도, ‘코레프(KOREF)’ 공개

UNIST 박종화 교수팀, Nature Communications 24일 게재
한국인 41명 게놈 정보 통합… “정확한 질병 원인 예측 기대”

KOREF_포스터

한국인을 대표하는 표준 게놈지도가 나왔다. 전국 각지에 사는 한국인 41명의 게놈 정보가 통합된 ‘국민 대표 게놈지도’다. 한국인의 특이적 질병연구에 가속도가 붙을 전망이다.

UNIST(총장 정무영) 게놈연구소(소장 박종화)가 국민 표준 게놈지도 ‘코레프(KOREF: KORean REFerence)’를 네이처 커뮤니케이션(Nature Communications) 24일자에 공개했다. 코레프는 울산에서 추진 중인 ‘게놈 코리아 프로젝트’의 일부로, 정밀 의료 기술 개발에 활용될 빅데이터다. 이 자료는 한국인을 대표하는 유전적인 특징으로서 한국인 ‘참조표준’으로도 활용될 예정이다.

이번 논문의 제1저자인 조윤성 UNIST 생명과학부 박사과정 연구원은 “코레프는 한국인 41명의 게놈 정보를 통합해 공통 게놈 서열을 융합하는 새로운 기법으로 제작됐다”며 “세계 최초로 인구집단을 대표하는 표준 게놈지도를 만들었다는 점이 가장 큰 특징”이라고 강조했다.

인간 게놈지도는 2003년 인간 게놈 프로젝트(Human Genome Project)를 통해 완성됐다. 그러나 백인 중심의 자료라 인종별 특징을 제대로 담지 못했다. 2009년 중국에서 중국인 1명과 흑인 1명의 게놈지도 초안을 발표했지만, 완성도와 정확도가 낮아 활용도가 적었다.

이에 박종화 교수팀은 한국인 41명의 게놈을 이용해, 약 30억 개의 염기서열을 한국인의 고유한 특징이 드러나도록 정리했다. 기존 백인 중심의 인간 표준 게놈(GRCh38)을 기준으로 삼으면, 한국인 1명의 돌연변이 수치가 400만 개로 나타난다. 그런데 코레프를 활용하자 이 수치가 300만 개로 25% 감소했다. 이는 100만 개의 돌연변이가 단순히 인종 차이에서 발생한다는 걸 보여준다.

박종화 교수는 “인종 차이로 인한 돌연변이와 질병에 따른 돌연변이를 구분하는 일은 정확한 질병 원인 규명과 예측에 반드시 필요하다”며 “한국 국민의 대표성을 갖춘 최초의 표준 게놈지도, 코레프는 국민 건강에도 크게 기여할 것”이라고 밝혔다.

표준 게놈지도의 작성은 두 단계를 거친다. 먼저 첨단 DNA 해독기를 통해 다양한 종류의 게놈 정보를 생산한다. 이후 ‘생정보학(Bioinformatics)’ 기술을 적용해 컴퓨터로 게놈지도를 완성한다.

코레프는 이미 공개된 9개의 다른 인간 표준 게놈지도와 정밀하게 비교, 분석됐다. 표준게놈을 서로 비교하면 기존에 알 수 없던 민족 간 게놈 차이가 극명하게 드러난다. 예를 들어, 미국인은 가지고 있지만 한국인에겐 없는 염색체상의 큰 영역을 더 쉽게 찾을 수가 있는 것이다. 이런 결손 영역에 중요한 유전자가 있을 경우, 질병에 걸릴 확률이 올라갈 수 있다.

특히 이번 연구는 게놈지도 작성의 대중화도 이끌 것으로 보인다. 기존 인간 표준 게놈지도는 13년간 3조원을 들여서 완성됐지만, 코레프는 아주 적은 비용으로 게놈을 매우 정확히 조립하는 데 성공한 것이다.

박종화 교수는 “코레프는 지금까지 나온 표준 게놈지도 중에서 가격 대비 정확도가 가장 높다”며 “모든 인간이 각자의 게놈 정보를 갖고, 일반인도 정밀한 게놈지도를 가지게 되는 미래를 앞당기는 기술이 될 것”이라고 말했다.

채균식 한국표준과학연구원 국가참조표준센터장은 “코레프는 국가참조표준체계에 따른 엄격한 표준절차와 평가를 거쳐 제작했다”며 “신뢰도와 정확도가 확보된 데이터로 국가참조표준으로 등록될 예정”이라고 말했다. 국가 참조표준은 국가사회의 모든 분야에서 널리 지속적으로 사용되거나 반복사용이 가능한 국가 공인 자료다.

UNIST 게놈연구소가 공개한 코레프는 한국표준게놈지도 홈페이지(http://koreanreference.org)에서 내려받을 수 있다. 미국 국가생명정보센터(NCBI)에서도 KOREF(Korean Reference Genome)란 이름으로 확인 가능하다.

한편 코레프 프로젝트는 2006년부터 한국생명공학연구원과 한국표준과학연구원 국가참조표준센터 주도로 시작됐다. 2014년 한국표준과학연구원과 게놈연구재단이 한국코레프 초안을 전 세계에 공개한 이래 게놈연구재단과 하버드대, UNIST 등 많은 기관의 협력하며 연구하고 있다.

이번 성과는 10년간 과학기술부(현 미래창조과학부), 산업자원부 등의 다양한 부처의 국가적 지원으로 완성됐다. 한국표준연구원 국가참조표준센터가 공동 주관하고, 하버드대학교의 개인 게놈프로젝트(Personal Genome Project)와 국제협력을 통해 진행됐다.

2014년 7월 개소된 UNIST 게놈연구소는 표준 게놈지도의 정밀화와 활용을 통해 게놈 산업기술의 국산화를 위해 연구 중이다. 2015년 울산시와 공동으로 만 명 이상의 한국인 게놈을 해독, 분석하는 ‘게놈 코리아 프로젝트’를 추진하고 있다.  (끝)

  • 논문명: An ethnically relevant consensus Korean reference genome is a step towards personal reference genomes
자료문의

홍보팀: 장준용 팀장, 박태진 담당 (052)217-1232

유니스트 게놈연구소: 박종화 소장 (052)217-5329

  • 박종화 교수팀1
  • 박종화 교수팀2
  • 박종화 교수_KOREF
  • KREF_포스터
 

[붙임] 용어 설명 및 참고 내용

1. 게놈(유전체)

생명체의 몸은 수많은 세포로 이루어져 있고, 세포는 모두 핵을 가지고 있으며, 핵 안의 염색체(chromosome)라는 물질에 생명체의 유전정보를 저장하는 DNA가 있다. 이 DNA는 생명체가 다음 세대로 자신의 유전정보를 전달할 수 있는 유전전달 물질로서, 한 쌍의 염색체를 부모로부터 하나씩 받게 된다. 인간은 22쌍의 상염색체(autosomal chromosome)와 1쌍의 성염색체(sex chromosome)로 이루어진 총 23쌍을 가진다. 전체 염색체를 구성하는 DNA를 게놈(genome)이라고 한다.

2. 인간 게놈지도

생명체의 게놈(genome) 서열(sequence)은 생명 현상의 가장 기본이 되는 게놈 및 게놈의 조절에 관한 일차적인 기본 정보를 제공한다. 이 때문에 게놈 서열을 밝히는 일은 생명 현상을 이해하는 데 매우 중요하다.

1980년대 말 미국 주도 아래 미국 국립보건원(NIH)와 유럽, 일본 등 선진국은 ‘인간 게놈 프로젝트(Human Genome Project)’를 시작했다. 이 프로젝트의 목표는 백인 게놈에 있는 약 30억 개의 뉴클레오타이드 염기쌍의 서열을 밝히는 것이었다. 이 작업은 1988년 미국 의회의 연구비 승인으로 시작돼 미국, 영국, 일본, 독일, 프랑스 등이 공동 참여했다. 그 결과물인 백인의 게놈지도 초안은 2000년 6월 발표됐다.

인간 게놈 프로젝트는 약 13년간 진행됐으며 3조원의 비용이 소요됐다. 2013년 6월 네이처(Nature)지는 미국 배틀메모리얼 연구소의 자료를 인용해 ‘게놈 서열 분석에 투자된 공적자금 1달러로 141달러의 경제적 효과를 창출했다’고 보도했다. 여기에 사람들에게 돌아가는 보건 혜택처럼 가치 평가가 어려운 효과까지 더하면 그 성과 규모는 더욱 커질 수 있다고 평가된다.

3. 인종별 게놈지도

2009년 12월, 중국의 BGI-Shenzhen 연구소는 차세대 염기서열 해독방식(Next Generation Sequencing, 이하 NGS)을 이용해 얻은 아시아인(중국인) 1명과 흑인 1명의 표준 게놈지도 초안을 발표했다. 여기에는 백인과 중국인의 게놈에서 차이점도 제시됐다. 이 결과는 각 인종별 게놈지도의 필요성을 나타냈다. 그러나 중국인 표준 게놈지도 초안은 완성도와 정확도가 낮아서 아시아의 표준 게놈지도로서 활용도가 적었다. 한국인 표준 게놈지도는 한국인의 특이적인 유전체 영역을 복원하는 데 목적이 있다. 이에 따라 정확하고 효율적인 한국인 변이 데이터를 수집해 질병치료와 맞춤치료제 개발에 적용하려는 것이다.

4. 2008년 공개된 최초 한국인 게놈 데이터와의 차이

2008년 12월 한국인 최초의 게놈 데이터가 공개됐다. 이 데이터는 백인의 게놈지도를 중심으로 한국인의 유전적 변이와 위치를 상대적으로 측정한 자료다. 반면, 이번 연구로 발표한 한국인 표준 게놈지도는 백인의 표준 혹은 뼈대와는 완전히 독립적으로 서열의 순서를 규명한 자료다. 또 하나의 표준 게놈지도에 수십 명의 한국인 게놈 정보를 통합하는 새로운 기법을 적용해 활용성이 높아졌다.

5. 국가참조표준센터

국가참조표준센터는 한국표준과학연구원 산하 센터다. 과학, 기술, 산업 활동에서 생산되는 모든 측정데이터 및 정보를 과학적으로 분석・평가해 정확도와 신뢰도를 공인한다. 국가와 사회의 모든 분야에서 널리 지속적으로 사용할 수 있는 물리, 화학, 금속재료, 보건의료, 생명공학 등 다양한 분야의 국가참조표준데이터를 제정하고 있다.

 

[붙임] 그림 설명

1. 한국인 표준 게놈지도 포스터

이 프로젝트에 참여한 한국인들의 연고지를 녹색 점으로 표시한 대한민국 지도로 ‘한국인 표준 게놈지도’를 나타냈다.

2. 한국인 참조표준 게놈지도 작성의 기술적 단계 모식도

게놈해독기에서 나온 짧은 서열을 오버랩 정보를 활용해 컨티그로 조립한다. 조립된 컨티그는 긴 짝서열 데이터(점핑 라이브러리)를 활용해 스캐폴드 수준으로 확장되고, 옵티컬 맵핑 데이터를 활용해 슈퍼 스캐폴드 수준으로 확장된다. 이후 긴 서열을 활용한 갭 클로징 작업과 맵핑 데이터를 활용한 정확도 검증을 하고, 염색체 맵핑, 한국인 공통서열 치환 과정을 거쳐, 최종의 참조표준 게놈지도가 완성됐다.

3. 주로 사용된 DNA 해독기(NGS)

Next Generation Sequencing(NGS)이라고 하며 2005년부터 상용화됐다. DNA를 합성할 때 나타나는 화학 신호를 확인하는 방식이다. 1세대 DNA 해독기에 비해 대량의 DNA 서열을 동시에 병렬적으로 해독할 수 있어, 빠른 시간과 적은 비용으로 DNA 서열 해독이 가능하다.

4. 각 인종별 표준게놈 지도들간 비교의 예

인간 표준게놈에는 없는 DNA 영역이 한국인 표준게놈에는 있다는 차이를 보여주는 그림이다. 회색 지역이 추가된 DNA 삽입 부분을 뜻한다.