# 선도게놈해독과 재해독 (Resequencing) 차이
한 생물의 전장(full length) 게놈을 해독(sequencing)하는 것은 대체로 두 가지로 나눈다.
하나는 선도 해독 혹은 신생 해독 (de novo sequencing)이다. 생어해독기를 사용하며, 게놈의 지도를 만들어 가면서 하는 매우 비싼 방법이다. 이것은 완전히 새로운 생물 종에 많이 쓰인다.
장점은 DNA 서열들이 어디에 있는지를 잘 알면서 DNA 조각들을 퍼즐 맞추듯이 맞추기 때문에 유전자의 위치 정보가 정확하다.
그래서 이것을 참조표준(reference standard)이라고 한다. 일단 하나의 참조표준 게놈서열이 나오면, 그다음부터는 또 다시 비싼 생어해독기를 쓸 이유가 없이, 빠르고 싼 차세대 해독기를 이용해 많은 DNA 조각들을 해독한다.
그다음, 그 조각들을 먼저 만들어진 참조표준 게놈서열에 정렬을 한다. 정렬은 수백 개의 컴퓨터 CPU를 쓰는 컴퓨터 클러스터를 이용한다.
김성진 박사의 게놈 (SJK)과 서정선 박사팀의 무명의 한국인 게놈(AK1)은 선도게놈 해독이 아니라, 재해독으로 진행된 것이다. 그렇기 때문에 총 해독과 분석 시간이 1년 미만이 가능해진다. 이에 반해 최초의 인간게놈은 3조원의 돈이 최소 15년간 투자된 결과물이다.
# 분자합성방식 해독 (Synthesis Based Sequencing)
30배 정도의 해독 깊이로 읽었으며, 논문의 요점은 자사의 Genome Analyzer가 값싸게 정확하게 게놈 해독을 해낸다는 내용이다.
GA는 원래 솔렉사(Solexa)라는 영국회사에서 만든 것인데 일루미나사가 합병했다. GA는 DNA 조각을 한쪽으로나 양쪽 방향(paired end)으로 읽을 수 있는데, 36개 염기를 양쪽으로 읽어서 서열을 생산한다.
이 방법을 합성(synthetic) 방법이라고 한다. 일루미나사는 그것을 SBS(synthesis based sequencing)라고 한다. 녹색 막대기가 양쪽으로 있고, 그 중간에 가는 선이 있다. 이 하나의 조각을 ‘read (해독편)’이라고 한다. 일루미나 해독기를 돌리면 수십억 개의 해독편이 생긴다. 이들을 컴퓨터로 참조표준 게놈에 정렬한다. 정렬을 하면 수십 개의 해독편들이 들쑥날쑥하게 붙게 된다. 그러면 평균을 내 게놈 전체 서열을 재구성해 준다.
#개인유전체 분석 과정 소개 (Analysis of Personal Genomes)
김성진 박사(2008년 당시 50세 중반)의 혈액 샘플로부터 DNA을 추출했다.
다음으로 일루미나사에서 제작된 서열 해독기 (대당 8억 정도)를 사용해, 2008년 4월부터 이길여 암당뇨 연구원에서 서열해독을 시작했다.
일루미나사의 해독기는 Single end 형을 과거에 시판하다가, 당시에 Paired end로 업그레이드를 했다.
한국인 게놈 프로젝트에서 사용한 방식은 DNA 조각의 양쪽을 읽어 들이는 Paired end 방식이라는 것이었다. 서열 해독 과정 이후 유의한 정보 추출 작업인 서열 해석 과정이 이어졌으며 한국생명공학연구원의 코빅이 분석 작업을 진행했다.
총 서열해독 시료 비용은 약 2억5,000만원이 투여되었고, 실험인 서열 해독에 투입된 인원은 2명이었다.
서열 해독과 서열 해석의 수행에 소요된 기간은 각각 56일과 5.42일 정도로, 한 명의 게놈 서열을 8X정도로 분석하기 위해서는 약 2달의 시간이 소요됐다.
<본 칼럼은 2024년 4월 2일 울산매일신문 “[박종화의 게놈이야기(47)] 게놈에 대한 몇 가지 개념 이야기”라는 제목으로 실린 것입니다. >