지난 4월 26일 UNIST에서는 ‘울산만명게놈프로젝트’ 사업 완수를 기념하는 행사가 있었다. 이 사업은 지난 5년간 한국인 1만 명의 게놈 데이터 해독과 임상 정보 수집을 바탕으로 한국인 게놈의 특성과 다양한 표현형, 질병과의 연관성을 분석하고 관련 기술을 산업화할 목적으로 추진됐다. 1만 명 이상의 게놈 프로젝트를 완수한 국가는 미국·영국·중국에 불과할 정도로 규모가 큰 사업이지만 고도의 전문성을 요구하는 탓에 일반인은 그 가치를 제대로 알기 어렵다. 본지는 프로젝트 추진 당사자인 UNIST 이세민·박종화 두 교수의 기고를 통해 게놈 산업의 의미와 비전을 세 차례에 걸쳐 소개한다. 글은 △(上) 게놈이란 무엇인가? △(中) 울산만명게놈사업과 게놈 2.0 시대의 도래 △(下) 게놈 산업 강국의 비전 순으로 싣는다. <편집자 주>
‘게놈’은 영어로 ‘genome’이라 쓰는데, 유전자를 의미하는 ‘gene’과 전체를 의미하는 접미어‘ome’이 붙어 만들어진 단어로 하나의 세포 또는 개체가 지닌 유전 정보의 총합을 의미한다. 이러한 게놈정보는 아데닌(adenine, A), 티민(thy mine, T), 구아닌(guanine, G), 사이토신(cytosine, C)이라는 네 종류의 염기로 이뤄진 DN A(deoxyribonucleic acid, 데옥시리보 핵산)라고 불리는 핵산으로 구성돼 있다.
총 30억 개의 염기쌍으로 구성된 인간 게놈은 염기 서열의 조합과 순서에 생명의 모든 정보가 담겨있다고 할 정도로 복잡한 생명 현상의 ‘틀’이 되고 있다. 자녀의 외모나 성격 등이 부모를 쏙 빼닮는 이유도 게놈정보가 아버지, 어머니로부터 자녀로 전달되기 때문이며, 일란성 쌍둥이의 성별이 같고 외모가 붕어빵처럼 서로를 닮은 이유 역시 쌍둥이의 게놈정보가 서로 같기 때문이다.
이러한 게놈정보는 1866년 오스트리아의 수사였던 멘델이 완두 교배 실험을 통해 형질 유전의 법칙을 발견하면서 본격적으로 정립되기 시작됐다. 이후 1903년 미국의 유전학자인 서턴에 의해 유전 물질은 세포핵에 있는 염색체(chro mosome)에 담겨 자손에게 전달된다는 가설이 제시되면서 더욱 탄력을 받게 됐다. 이어 1944년에는 캐나다의 유전학자인 에이버리에 의해 염색체를 구성하는 물질인 DNA가 유전 물질임이 마침내 증명됐다.
당시만 해도 DNA에 담겨있는 정보와 의미에 대한 이해는 매우 부족했다. 그러나 1953년 영국 케임브리지대학의 왓슨과 크릭이 DNA 이중 나선 구조를 밝혀내고, 1960년대 생어가 DNA 서열 분석 기술을 개발하면서 DNA 서열에 대한 이해와 연구가 본격적으로 시작됐다.
하지만 인간 게놈의 길이가 30억 염기쌍인 데 비해 생어의 DNA 서열 분석 기술은 하루에 고작 수천 염기쌍만 해독할 수 있어 여전히 어려움이 많았다. 그래도 생어의 DNA 서열 분석 기술을 기반으로 샷건 시퀀싱(shotgun sequencing) 등의 고효율 DNA 서열 분석 기술들이 1970년대 후반부터 본격 개발되면서 게놈의 크기가 상대적으로 작은 바이러스 등의 게놈분석이 가능해졌다. 이 같은 샷건 시퀀싱 기술이 보편화하면서 1990년 미국과 영국을 중심으로 하는 다국적 연구 컨소시엄 프로젝트 ‘인간 게놈 프로젝트(Human Genome Project)’가 시작됐고, 13년 동안 무려 30억 달러(3조 원)라는 막대한 예산을 들여 처음으로 인간 게놈 서열을 해독, 발표하기에 이르렀다.
이런 가운데 DNA 염기 서열 분석 기술은 계속 발전해 2000년에는 차세대 염기 서열 분석 기술(next-generation sequencing, NGS)이 개발됐고, 최신 NGS 기술을 이용하면 인간 게놈을 해독하는 데 1주일 정도의 시간과 1천 달러(1천200만 원)의 비용만 있으면 될 만큼 시간과 비용이 대폭 줄어들게 됐다. ‘울산만명게놈프로젝트’에도 바로 이러한 NGS 기술이 활용되고 있다.
NGS 기술을 이용해 해독된 인간 게놈은 그 크기가 대략 200Gb 정도로 1만 명의 게놈정보를 저장·분석하기 위해서는 슈퍼컴퓨팅 자원과 고난이도의 빅데이터 처리·분석 기술이 요구된다. UNIST 게놈산업기술센터는 국내 최대 규모의 ‘울산만명게놈프로젝트’를 수행하면서 슈퍼컴퓨팅 환경과 빅데이터 분석역량을 갖췄고, 이를 바탕으로 현재 정부가 추진 중인 ‘국가 통합 바이오 빅데이터 구축사업’에서도 주도적인 역할을 할 수 있을 것으로 기대된다.
이세민 울산과학기술원 바이오메디컬공학과 게놈산업기술센터 교수
<본 칼럼은 2021년 5월 12일 울산제일일보 13면 ‘‘울산만명게놈프로젝트’를 완수하면서 (上) 게놈이란 무엇인가?’ 라는 제목으로 실린 것입니다.>