기초적인 게놈 지도화와 변이에 대한 분석이 끝나면, 그 이후 수없이 많은 다양한 생명정보 분석이 가능하다. 예를 들면 단백질에 변이가 있는지, 질병과의 연관도를 다각도로 계산해 내던가, 각종 약물에 이 유전체의 소유자가 어떤 체질적 특성을 가지는지, 면역학상 어떤 특이가 있을 수 있는지, Y 염색체상으로 볼 때 어떤 인종적 뿌리를 가지는지 등등이다.
그리고 이러한 수많은 생명정보분석은 앞으로 개인 게놈이 대중화될수록 새로운 요구에 맞춰 무궁무진하게 다양하게 발전할 것이다.
아래는 그러한 생정보학 분석의 하나인 계통도 분석을 보여준다.
3만1,460개의 단염기다형체(SNP)를 이용해 개인 간 유전적 거리인 ASD(Allele Sharing Distance)를 계산했으며 NJ(Neighbor Joining) 방법으로 계통도를 구성했다. (CEU:서양인(코카시안), CHB:중국인, JPT:일본인, YRI:아프리카인).
게놈을 가진 사람들을 제외한 다른 사람들은 게놈 해독을 통해 서열을 얻은 것이 아니라 DNA 칩을 통해 서열을 확인한 것이다. 이런 칩을 통한 개개인의 유전적 변이를 모아놓은 DB가 햅맵이다. 우리는 HapMap Phase 3의 160만개의 변이를 이용한 계통도를 그렸다. 여기서 사용된 사람의 수는 서양인(20명), 중국인(20명), 일본인(20명), 아프리카인(20명) 이다.
이중 김성진 박사 게놈 바로 옆에 있는 것은 김성진 박사의 어머니 게놈이다(KOR00009). 그리고 그 나머지는 익명의 코빅에서 실험을 한 한국인들이다.
Watson 과 HuRef Venter는 바로 옆에 같이 붙어서 나오는 것은 벤터와 왓슨이 많이 닮아서가 아니라, 자주색의 다른 백인들이 유타 지방에서 고립된 사람들이기 때문이다.
# 크레이그 벤터 박사의 HUREF 게놈
(Craig Venter’s HUREF genome)
두 번째 인간 게놈인 크레이그 벤터 박사 것도 선도게놈해독법으로 만들어졌는데, 그것도 1,000억원 이상이 들었다.
2001년에 발표한 것은 초안(draft)이었는데, 이것은 돈을 더 들여 완성한 것이다. 크레이그 벤터 박사는 자신의 게놈을 ‘HUREF’라고 부른다.
이것은 ‘Human Reference’라는 뜻이다. 다시 말하면 3조원짜리 최초의 인간 게놈(HGP)과 대등한 것이라고 말을 하는 것이다.
HUREF는 HGP와 가장 다른 점이 한 사람의 게놈이란 것이다. HGP는 한 사람 것이 아니라, 최소 5명의 것을 합친 것으로 알려졌다.
하지만 실제로는 거의 한 사람 것이 대부분으로 들어갔다. 그 사람(남성)의 이름을 알 만한 사람은 알지만, 공식적으로는 무명으로 돼 있다. HUREF는 http://huref.jcvi.org/에 공개돼 있다.
Huref에서 찾은 유전적 SNP 변이는 321만개이고, 약 28억개의 염기 쌍을 해독했다. SNP가 아닌 다른 변이도 약 100만개를 찾아냈다. 이런 변이가 바로 벤터박사와 다른 사람들 간의 차이를 결정짓는 유전변이인 것이다. 이런 변이가 나쁜 것이면, 질병을 더 잘 일으키는 역할을 하게 될 수도 있다.
<본 칼럼은 2024년 5월 7일 울산매일신문 “[박종화의 게놈이야기(51)] 개인 게놈 분석 이후의 생정보학 분석”라는 제목으로 실린 것입니다. >