팀은 내가 존경하는 훌륭한 과학자이고, 지도교수였다. 그러나 과학자체에 대한 철학은 깊진 않았다. 나의 공동지도 교수인 싸이러스는 팀보다 나이도 더 많고 좀 더 생각이 많은 편이었다. 나의 학위 말년에는 싸이러스와 일을 더 많이 했다.
나의 논문은 5월초에 끝이 났고, 케임브리지대학에는 5~6월에 제출을 했다. 그리고 7월 4일 심사를 받았다. 2명의 분야 전문가가 초대돼 나의 논문을 읽고, 그 뒤 일정을 잡아 직접 면접을 했다.
심사자인 히긴스 박사는 클러스터W(ClustalW)를 만든 유명한 생정보학자였고, 싸이러스는 나의 공식적 지도교수가 아니라서 구두 심사자(Viva)로 들어왔다. 데스 히긴스의 구두 심사 때, 싸이러스가 ABC가 무슨 단백질이냐고 물었는데, 답을 못했다. ‘ATP Binding Cassette’ 였는데 기억이 안났다.
데스 히긴스는 내 논문 내용을 보고 매우 놀라워하며, 얼마 동안에 이것을 다 했나고 물었다. 그리고는 3년 안에 한 일들이 놀랍도록 많다고 했다. 그 말에 나도 놀랐다. 왜냐하면, 내 졸업논문 대부분의 내용은 3년차 말기, 6개월에서 1년 사이에 했던 일들이었기 때문이다. 그 전의 것을 많이 생략 했었다. 짧은 기간에 많은 분석이 가능했던 이유는 체계적으로 축적된 ‘바이오펄’ 프로그램들 때문이었다.
나중에 팀 허버드는 자기와 주로 많이 했던 부분이 많이 빠지고 싸이러스와의 부분이 대부분 들어간 졸업논문을 보고, 옛날에 했던 것들도 중요한 것이니 더 넣었으면 좋았겠다고 코멘트를 했다. 그때는 나는 그것이 무엇을 뜻하는 것인지 몰랐는데, 나중에 보니 자기와의 연구가 경시됐다고 섭섭했던 것 같다.
박사학위 3년 차엔 많은 일을 했다. 거기엔 이유가 있었다. 바이오펄(Bioperl)등을 만들면서, 내가 하는 모든 분석을 자동화 해왔다.
그래서 일반적으로는 3개월간 해야 할 일을 3일만에 자동화된 프로그램으로 더 많이 분석해 냈기 때문이다. 박사 3년 차에는 효율이 매우 높아져서, 세상의 모든 생정보학 문제를 풀 수 있을 것 같은 자신이 있었다. 실제로도 싸이러스가 그 전의 학생에게 맡겨서 해결 못하던 것을 2주 만에 완전히 해결하는 등 프로그래밍의 숙련도와 자동화가 높았다.
특히 대량의 전산 자원을 한꺼번에 이용하는 방법을 많이 써서, 가장 많이 컴퓨터를 활용했다. 하지만 MRC센터 전체의 수퍼컴퓨터를 너무 많이 써서 종종 불평을 들어야 했다. 그래서 남들이 일을 안 하는 밤 7시부터 아침 7시 사이에 자동으로 많은 프로그램을 돌리곤 했다. 나는 1~2년차에는 많은 단백질 구조 관련, 서열 정열 관련 일을 했다. 그러나 졸업 논문엔 주로 게놈 분석에 대한 것을 실었다.
나의 졸업논문의 제목은 ‘게놈서열 분석과 그 방법들’이다. 이 제목을 정할 때, 내가 고등학교 때부터 하고 싶었던 게놈분야를 한다는 상징성을 주기 위해 일부러 게놈 쪽을 강조했다. 나는 게놈을 통한 정보학이 생명학의 핵심이라고 오랫동안 생각해왔다. 애버딘 대학에서 학부를 할 때도, 종종 그런 말을 했다. 미국에서 초빙교수로 왔던 유전학과 교수와 그 부인이 내 말을 듣고, 자기는 게놈을 잘 모르고 컴퓨터도 모르지만, 내가 한 말에 동의를 하며, 꼭 그쪽으로 연구를 잘 해보라고 했다.
<본 칼럼은 2023년 9월 5일 울산매일신문 “[박종화의 게놈이야기(24)] 게놈 박사 졸업논문”라는 제목으로 실린 것입니다.>