히모필러스 인플루엔지는 이름에서도 알 수 있듯이, 감기를 일으키는 세균(박테리아)이다. 이것의 완전한 게놈서열이 1995년 ‘사이언스’ 학술지에 발표됐다. 크레이그 벤터가 마지막 저자로 돼있다. 생물학에선 일반적으로 마지막 저자가 그 프로젝트를 이끈 사람이나 그룹의 대표자이다.
이 게놈의 크기는 1,830,137개의 염기로 이뤄져 있다. 박테리아가 가지는 보통의 크기이다. 이 논문에서 말하는 의미는, 기존의 게놈지도 작성의 필요성 없이 앞으로는 수많은 박테리아의 게놈을 마구 해독할 수 있으며, 분석한 게놈은 독립적인 생명현상을 유지할 수 있는 세계 최초의 생명체의 게놈이라는 것이다.
히모필러스 인플루엔지 다음으로 나온 게놈이 마이코플라즈마 제니탈리움인데, 같은 크레이그 벤터 그룹에서 해독이 됐다. 이 게놈은 2002년 세계에서 가장 작은 나노아키움이라는 고세균이 해독되기 전까지 가장 작은 게놈으로 알려져 있었다.
효모게놈 논문의 제목과 초록이 공개됐다. 제목은 6,000개의 유전자를 가진 생명체라고 돼있는데, 그것이 뜻하는 것은 6,000개 밖에 안 되는 유전자를 가지는 완전한 생명체에 대한 보고서라는 뜻이다. 당시에는 6,000개인 줄 알았지만, 시간이 갈수록 발견되는 유전자 수가 늘어나서 6,400개가 넘는 것으로 보고되기도 했으나, 2003년 미국 MIT의 에릭 랜더 랩의 M. Kellis에 의해 5,538개라고 주장됐다. 그 근거는 진화적으로 압력을 받는 유전자만이 진짜이기 때문에, 그런 유전자를 카운트 하면 된다는 논리였다. 이것은 네이쳐 잡지에 실렸다. (M. Kellis et al., Nature 423, 241-254)
효모게놈의 가장 큰 특징은 고등 진핵생물과는 달리 인트론이 매우 적다는 것이다. 인트론은 단백질을 만드는 중요한 DNA사이사이에 들어가는 덜 중요할 것으로 생각되는 DNA 서열을 말한다. 효모는 일종의 곰팡이인데, 다른 곰팡이들은 보통 40 메가베이스(MB)의 크기를 가지고 있는데 비해 훨씬 적다 (12.5 MB). 인트론이 적어도 효모의 게놈이 작동하는 것은 효모의 게놈은 수학적으로 최적화 돼있어 적은 인트론으로도 게놈의 평형을 이룰 수 있기 때문이다. 인트론의 존재 이유에 대해 많은 이론이 있는데, 나의 이론은 게놈구조는 프랙탈이며, 그 대칭적 조화가 단백질에 의해 깨어질 때, 인트론이 일종의 카운터 밸런서 (파트너) 역할을 할 것이라는 것이다.
내가 1994년부터 1997년까지 MRC센터에서 단백질 서열과 3차원 구조에 대해 박사과정 연구를 할 때, 미국에서는 하바드의 조지 처치, 지금 워싱턴에 있는 리로이 후드 같은 사람들이 게놈을 대량으로 빨리 해독하는 방법들을 개발하여, 바이러스보다 수백 배가 큰 박테리아 게놈을 해독하는 작업들이 이미 진행되고 있었다. 조지 처치는 하바드에서 해독기로 노벨상을 받은 월터 길버트박사의 수제자이다. 길버트는 하바드에서 조지 처치가 가장 똑똑한 과학자라고 말을 했다고 한다. 길버트는 노벨상까지 받았지만, 그의 해독법은 무용지물이었다. 그런데, 그의 제자인 조지 처치는 서열해독법에 관한 박사학위 논문을 쓰고, 계속 해독법을 개발하여 현재, 가장 뛰어난 해독기 연구자로 알려져 있다. 또 조지 처치는 어렸을 때부터 컴퓨터 프로그래밍도하여, 생정보학자로도 알려져 있다. 내가 처치 랩에서 포닥연구를 할 때, 내 월급으로 비싼 컴퓨터를 사서 연구에도 사용한다고 했을 때, 조지가 자신도 자기 돈으로 산 큰 컴퓨터를 아파트에 두고 포닥때 연구를 했다고 말했다. 조지는 생정보학의 중요성을 누구보다도 잘 아는 사람이었다. 내가 조지 랩에 가게 된 가장 큰 이유는 게놈의 기능을 연구하기 위해서였다. 조지 처치와 길버트 생어 등 생정보학과 게놈은 처음부터 같이 가야 할 기술들이고, 내가 이런 사람들과 직간접으로 연결되는 것은 우연이 아니었다.
<본 칼럼은 2023년 10월 30일 울산매일신문“[박종화의 게놈이야기 (31)] 최초의 박테리아 게놈 – 히모필러스 인플루엔지”라는 제목으로 실린 것입니다.