생어 이전에도 염기서열을 해독한 사람들이 있다. 염기서열 해독은 RNA의 해독에서 먼저 시작됐다. 벨기에의 월터 피어스가 겐트대학에서 1972년 최초의 유전자 서열과 최초의 RNA 게놈 서열(1976)을 해독해 냈다. 그 뒤 미국 하버드대학의 막삼과 길버트가 1973년 24개의 염기를 해독해 냈으나, 제대로 된 DNA 해독 방법은 생어가 만든 안정적이고 빠른 사슬막기(Chain termination) 방법이었다. 이 방법이 케임브리지에서 미국으로 돌아가, 하버드대의 교수가 된 제임스 왓슨이 제안했던 미국국립보건연원(NIH)의 인간게놈프로젝트의 표준이 됐고, 수 십 년간 DNA 해독기의 표준이었다. 초기의 해독법은 방사성 동위원소를 이용했으나, 뒤에 염료를 이용하는 것으로 대치됐다. 생어해독법은 길이가 700 염기 정도까지 읽을 수 있고, 그보다 길면 정확도가 떨어진다. 그리고 시약값과 시간이 많이 든다. 최근에는 384개의 조그만 공간에 동시에 화학반응을 일으킬 수 있는 것이 가능해졌다. 그러나 근본적으로 60억 쌍의 인간 게놈을 다 읽기에는 비용이 너무 크다.
생어방법을 이용한 백인 게놈프로젝트는 15년에 걸쳐 3조원이 들었다. 1987년부터 공식적으로 2000년에 끝났다고 되어있다. 그러나 실제로는 2010년까지도 완벽히 완성되진 못했다. 2003년에 한번 완성됐다고 했다가 또 2004년에도 진짜로 완성됐다고 나오는 등 많은 이슈를 나았다. 또 누가 가장 먼저 했는가에 대한 시비로 많이 들어간 정치적인 프로젝트이기도 했다.
#구세대 생어해독법을 통한 게놈프로젝트 (Genomes by Sanger methods)
길이가 700염기보다 훨씬 긴 게놈 서열을 해독하기 위해서는 복잡한 절차가 필요하다. 염색체 한 개를 해독하기 위해서는 먼저 긴 DNA를 제한효소를 통해 작은 DNA로 수많은 조각을 만든다. 조각난 DNA를 DNA 벡터라고 불리는 아주 작은 게놈 같은 것에 넣고, 이것을 대장균 세포 속에서 번식을 시킨다. 마지막으로 대장균에서 이것을 빼내서 정제하고 생어방법으로 해독을 한다. 그 뒤 생정보학 알고리듬을 사용해 긴 서열로 붙여나간다. 완벽하게 되지 않기 때문에 틈이 많이 생기는데 이것을 프라이머 워킹이라는 방법으로 막아나간다.
#게놈프로젝트 경쟁에 셀레라사의 등장 (Celera in genome competition)
인간게놈프로젝트 사업에 맞서 셀레라라는 미국 기업에서 크레이그 벤터 박사가 이용한 방법은 이렇게 벡터를 만들지 않고, 긴 염색체를 무작위로 잘라서 엄청나게 많은 양으로 서열을 해독한 뒤, 수퍼컴퓨터와 생정보학을 이용해 붙여나가는 방법이다. 이것을 산탄총 해독법이라고 부른다. 이 방법은 뒤에 긴 서열을 해독하는 일종의 표준이 되고, 생어해독법의 다음세대인 병렬적 해독법에 적용된다. 이 방법은 필연적으로 많은 컴퓨터와 정보처리 작업을 요구한다.
대부분의 DNA 해독법은 2009년까지도 한 가닥의 DNA를 실처럼 뽑아서 해독을 하는 것이 불가능하다. 그래서 PCR(polymerase chain reaction)을 이용하여 엄청난 양의 DNA 증폭을 먼저 한다.
다양한 PCR 증폭을 이용해 수없이 조각난 수많은 DNA를 무작위로 수만 혹은 수십만 테스트 튜브에서 동시에 해독하는 방법이 개발됐는데, 이것의 대표적인 방법들이 로슈사의 454 방법, 하버드 대학의 폴로니방법, 솔리드방법, 그리고 일루미나 회사의 교량PCR 해독법이다. 이런 초대용량 산탄총 해독기를 바로 차세대 해독기(Next generation sequencer: NGS)라고 지칭한다.
<본 칼럼은 2023년 10월 17일 울산매일신문 “[박종화의 게놈이야기(29)] 초기 게놈해독역사”라는 제목으로 실린 것입니다.