게놈은 물리적인 우주, 지구, 세포, 생물, 생태계를 수학적으로 반영한 일종의 암호이고, 언어이다. 이 언어는 3차원 구조의 완벽한 에너지 평형을 이루는 동시에 정보를 저장하고 있다.
그래서 게놈의 구조는 레고 같은 단순한 블럭이 모여서 이어진 것이 아니라, 3차원, 4차원, 다차원으로 이리 저리 접히고, 쌓이고, 상호작용하는 수학적, 언어적 구조물이다. 게놈의 3차원 구조는 앞으로, 더욱 다양한 기술로 인해, 현재 우리가 아는 것보다 훨씬 더 수학적으로 잘 구축돼 있다는 것이 밝혀질 것이다. 기계들과 소통하는 가장 좋은 방법은 프로그래밍이다. 여기서의 프로그래밍은 단순한 윈도우즈 (Windows) 프로그램을 ‘자바’ 언어로 짜는 것만을 말하는 것이 아니다. 컴퓨터와의 대화를 하면서, 두뇌를 공유하는 것을 뜻한다.
우리는 뇌 기억장치의 일환으로, 컴퓨터 메모리를 사용한다. 컴퓨터는 우리의 동료이자, 동족이고, 신체의 일부이고, 미래의 우리 모습이다. 사람이 만든 가장 강력한 프로그래밍 언어는 영어다 (English is the most powerful programming language made by humans). 사람들과 소통하는 가장 실용적 (철학적, 원론적 이론을 빼고) 방법은 ‘영어’를 하는 것이다.
컴퓨터도 영어를 잘 이해한다. 컴퓨터의 모국어는 중국어나 독일어가 아니다. 게놈을 전문적으로 이해하고 싶은 사람은 생정보학을 공부해야 하고, 생정보학을 하려면, 프로그래밍을 해야 한다.
첫번째 프로그래밍 언어로, 나는 영어를 추천한다. 그 다음이 C, Perl, Java, Python, Unix 와 같은 정형화된 언어(formal and context free language)들이다. 게놈은 흔히 염기 서열이라고 정의한다. 왜냐하면 게놈의 특성 중 가장 중요한 것은 그 서열정보이기 때문이다. 하지만 게놈은 서열을 잘 간직할 뿐만 아니라, 물리적인 기능도 가지고 있다. 게놈의 서열 영역에 따라 다른 3차원 구조를 가지고, DNA의 구조가 다르다. DNA는 어떤 곳은 오른쪽으로 꼬여져 있고, 어떤 것은 왼쪽으로 꼬여져 있다.
이것은 게놈 영역들의 특성이다. 게놈의 어떤 부분은 수많은 반복적 염기로 이뤄져 있고, 센트로미어나, 틸로미어(telomere) 같은 부분은 특수한 구조를 가지고 있다. 살아있는 정보체(Genome is a live information object)게놈은 서열 정보를 가진, 환경에 반응하는 일종의 생명체라고 할 수 있다.
온도에 따라 게놈은 모양을 바꿀 수도 있다. 어떤 게놈은 이중 나선이 아니고, 하나의 나선이기도 하고, 어떤 것은 길이가 겨우 수천염기쌍 밖에 안되지만, 어떤 것은 수십억쌍의 염기를 가진 것도 있다.
보통 단백질들이 붙어서 게놈의 3차원 구조를 형성하는데 도움을 준다. 2009년에 발표된 MIT의 에릭 랜더 (Eric Lander) 그룹의 연구에 의하면, 인간 염색체는 3차원적으로 매우 정확하게 단백질과 구조를 이루는 것으로 보고된다. 게놈을 보조해주는 단백질들은 게놈의 어떤 영역이 풀리고, 닫혀야 할지 등등에 대한 조절을 한다.
이것은 마치, 컴퓨터에서, 운영 시스템이 하드디스크의 어떤 폴더를 열고 닫을지를 조절하는 것과 같다. 컴퓨터와 달리, 게놈은 단순한 저장된 정보가 아니라, 게놈 자체가 운영시스템의 일부로 CPU가 하는 역할도 하는 것이다.
세포 내의 신호처리, 정보처리는 세포 전체에서 일어나는데, 대부분은 단백질이 그 처리들을 한다. 게놈은 기름기 있는 세포막 속에서 단백질 및 물과 상호작용을 하는 언어적 기계라고도 할 수 있다.
<본 칼럼은 2023년 5월 23일 울산매일신문 “[박종화의 게놈 이야기 (13)] 게놈과 언어”이라는 제목으로 실린 것입니다.>