Press release

2020. 8. 5 (수) 09:00시 부터 보도해 주시기 바랍니다.

가장 큰 ‘물고기’ 고래상어 게놈 해독: 장수 비밀 풀리나

UNIST·국내·외 공동연구진, 한국 근해서 잡힌 고래상어 표준 게놈 구축
생물 노화 및 진화 관련 실마리 제공…美 국립과학원회보[PNAS] 논문 게재

세상에서 가장 큰 어류인 고래상어의 게놈(유전체, GENOME) 연구 결과가 공개되었다. 이번에 공개된 고래상어 게놈분석 정보는 인간의 노화나 진화의 비밀을 푸는 실마리가 될 전망이다.

*게놈(유전체, Genome): 한 생물이 가지는 모든 유전 정보. 일부 바이러스의 RNA를 제외하고 모든 생물은 DNA로 유전 정보를 구성하고 있기 때문에 일반적으로 DNA로 구성된 유전 정보를 지칭한다. DNA는 4종류의 염기로 구성돼 있으며, DNA염기서열 정보(유전 정보)대로 단백질을 합성한다.

 

UNIST 게놈산업기술센터(KOGIC)는 하버드 대학교, 서울대학교, 제주대학교, ㈜ 클리노믹스 등과 공동 연구를 통해 멸종위기 종인 고래상어의 유전체 정보(게놈)를 해독, 조립, 분석한 결과를 세계적인 학술지인 미국국립과학원회보(PNAS)에 발표했다. 분석 결과 유전자의 길이와 수명간 상관관계가 있는 것으로 드러났다. 연구팀은 한국 아쿠아 플라넷 제주에서 제공한 고래상어 샘플로부터 완성한 고래상어 표준 게놈을 84개 생물의 전장 게놈(whole genome)정보과 대조해 고래상어의 ‘인트론’의 길이가 다른 생물체에 비해 긴 것을 확인했다. 인트론은 유전자 중 단백질 합성에 관여하지 않는 부분인데, 수명과 연관있는 기초대사량(Basal Metabolic Rate, BMR)과 관련이 있다.

*유전자(Gene): 유전자(Gene)는 유전정보(염기서열 등)가 담긴 DNA의 특정 부분을 말한다. 유전자는 다시 엑손(Exon)과 인트론(Intron) 부분으로 분리된다.

*표준게놈: 참조표준게놈(Reference genome). 생물종의 대표 게놈 지도

*인트론(Intron): 유전자에서 단백질 합성에 관여하지 않는 부분. 1978년 처음 등장한 인트론은 단백질 중심으로 해석되었던 생물학에 많은 논쟁거리를 제공하였고 지금까지도 새로운 인트론 기능들이 연구되고 있다. 유전자 내에서 엑손 대비 인트론의 비율(약 22배)이 압도적으로 높기 때문에 인트론의 길이는 유전자 길이와 직결된다.

고래상어는 평균 길이는 20m, 무게 42톤에 이른다. 또 수명도 길다. 가장 오래 산 고래상어의 경우 수명이 약 100년에 이른다. 일반적으로 몸집이 큰 생물체는 열 손실을 최소화 할 수 있어 수명이 길다고 알려져 있지만, 고래상어의 정확한 장수 원인은 밝혀지지 않았었다.

[연구그림] 고래상어를 포함한 85 생물 종 비교 연구를 통한 다양한 상호 연관관계 분석

UNIST 게놈산업기술센터 연구팀은 고래상어의 표준게놈을 구축하고 이를 84개 생물체의 게놈과 대조해 고래상어가 상대적으로 긴 인트론’(Intron)을 갖고 있는 것을 밝혀냈다. 고래상어는 다른 생물체보다 염기서열이 반복되는 형태가 많았다. 무작위한 서열이 아닌 규칙성이 있는 반복서열이 인트론 부위에서 많이 발견됐는데, 이는 인트론 부위가 또 다른 기능을 가질 수 있다는 걸 의미한다. 연구팀은 인트론의 새로운 기능 중 일부가 노화와 관련 있는 것으로 보고 있다.

[연구그림] 인트론내에 존재하는 반복서열 들에 대한 생물종 함량비

제1저자인 박승구 UNIST 박사는 “고래상어 유전자에는 그 기능이 명확하지 않은 ‘CR-1’, ‘Penelope’와 같은 반복서열이 다른 생물 종들과 비교했을 때 확연히 많았다”며 “아직 밝혀지지 않은 인트론의 기능 중 노화에 영향을 미치는 기능이 있을 것으로 예상한다”고 설명했다.

연구팀은 몸집(생물체 무게), 기초대사량, 게놈 크기 등 수명과 관련 있는 것으로 알려진 요인과 고래상어의 게놈 특성과 연관된 각종 요소를 84종의 생명체와 비교 분석해 이러한 결과를 얻었다. 그 과정에서 고래상어의 표준 게놈도 구축했다. 게놈 해독을 통해 얻은 수십억 개의 짧은 단위의 염기서열을 새롭게 조립(선도 조립, de novo assembly)해 32억개 염기쌍을 가지는 고래상어 표준 게놈 지도를 구축했다.

또한 연구진은 고래상어의 신경관련 유전자들이 긴 인트론을 갖는다는 사실을 최초로 밝혀냈다. 이번 연구를 통해 고래상어의 신경연결성(Neural connectivity) 기능을 갖는 유전자의 길이가 다른 유전자 길이보다 길다는 사실도 증명한 것이다. 신경 관련 유전자는 생물진화에서 매우 중요한 역할을 하며 보통 신경관련 유전자들은 길이가 길수록 유전자가 잘 발현되며, 발현 조절이 잘 된다.

박종화 교수는 “이번 고래상어 게놈 분석 결과는 고래상어 진화 연구를 넘어 인간을 포함하는 다양한 생물종 노화연구에 매우 중요한 연구가 될 수 있다”고 평가했다.

이번 연구는 美 하버드 대학교 조지 처지( George M. Church) 교수, 뉴멕시코 대학교 제레미 에드워드(Jeremy S. Edwards) 교수가 교신저자로 참여 했다.

논문명: The whale shark genome reveals how genomic and physiological properties scale with body size

자료문의

대외협력팀: 장준용 팀장, 양윤정 담당 (052) 217 1228

생명과학부: 박종화 교수 (052) 217 5329

  • [연구그림] 고래상어를 포함한 85 생물 종 비교 연구를 통한 다양한 상호 연관관계 분석
  • [연구그림] 인트론내에 존재하는 반복서열 들에 대한 생물종 함량비
 

[붙임] 연구결과 개요

1. 연구배경 

고래상어는 세상에서 가장 큰 어류로, 20미터의 길이와 42톤의 무게를 가지고 약 100살 정도의 수명을 가지고 있는 것으로 보고되어 있다. 일반적으로 몸집이 큰 생물체는 열 손실을 최소화할 수 있고 수명이 길다. 고래상어의 게놈(genome)1)을 비교 분석한 이번 연구는 긴 수명에 대한 이해의 단서를 제공을 한다.

 

2. 연구내용

연구팀은 몸집(생물체 무게), 기초대사량, 게놈 크기 등 수명에 관련 있는 것으로 보고된 요인들과 게놈 특성을 보여주는 다양한 요소들을 분석했다. 이를 위해 먼저 게놈 해독기를 통해 수십억 개의 DNA 염기서열2)을 생산했다. 이렇게 생산된 짧은 염기 서열을 선도 조립(de novo assembly)(짧은 염기서열을 다시 조립하는 과정)하여 32억개 염기쌍을 가지는 고래상어 표준 게놈 지도를 구축하였다. 이 표준게놈 지도로부터 28,483개 단백질들을 만드는 유전자(gene)3) 정보를 예측하여 분석에 사용하였다.

고래상어는 게놈 중에서 특히 반복서열이 많았다. 이런 반복서열의 기능이 무엇인지는 매우 중요한 연구이다. 특히, 길이가 긴 인트론(intron)4)이라는 부위로부터 단순 무작위 서열이 아닌 특별한 기능을 담고 있을 것으로 예상되는 반복서열들이 많이 발견 됐다. 특히 고래상어 게놈에서 반복서열 중 아직 그 기능이 명확하지 않은 CR-1, Penelope 유사 라인 반복서열이 다른 생물종들과 비교하였을 때 확연히 많이 존재하는 것을 밝혀냈다.

단순히 의미가 없는 서열이 아닌 특정 반복패턴을 보이는 서열이 인트론에 존재한다는 것은 아직 밝혀지지 않은 새로운 인트론 기능들이 있는 것으로 추정된다. 이러한 기능들 중 노화에 영향을 미치는 것이 있을 것으로도 기대 된다.

또한 이번 연구에서는 신경관련 유전자에 대한 심도 있는 분석을 진행했다. 신경관련 유전자는 생물진화에서 매우 중요하다. 연구팀은 신경관련 유전자들이 다른 유전자들보다 길이가 더 길다는 것도 증명하였다. 보통 신경관련 유전자들은 길이가 길수록 유전자의 발현이 잘 되고 전사5)외유전체적(epigenomic) 조절6)이 잘 이루어진다. 고래상어 게놈에서도 역시 신경연결성(Neural connectivity) 기능7)을 가지는 유전자들이 긴 인트론을 가진다는 것을 연구진이 최초로 밝혔다.

 

3. 기대효과  

고래상어 게놈에서 다른 종보다 더 긴 인트론을 가지는 것은 기초대사량과 관련이 있기 때문에 인트론 총길이가 긴 수명의 핵심 될 수 있을 것이다. 또한 진화연구에 초석이 되는 신경관련 유전자를 분석함으로써 이번 연구 결과는 고래상어 진화 연구와 인간을 포함한 다양한 생물종 노화연구에 매우 중요한 연구가 단서가 될 수 있을 것이다.

 

[붙임] 용어설명

1. 게놈(Genome)

유전자(Gene)과 염색체(Chromosome)의 합성어. 유전체라고도 한다. 게놈은 한 개체 유전자의 총 염기서열로, 한 생물종의 거의 완전한 유전 정보의 총합이다. 

2. DNA 염기서열 (DNA Sequence)

일부 바이러스의 RNA를 제외하고 모든 생물은 DNA로 유전 정보를 구성하고 있기 때문에 일반적으로 게놈은 DNA로 구성된 유전 정보를 지칭한다. DNA는 4종류의 염기로 구성돼 있으며, DNA 염기서열 정보대로 단백질을 합성한다.  

3. 유전자(Gene)

유전자(Gene)는 유전정보(염기서열 등)가 담긴 DNA의 특정 부분을 말한다. 유전자는 다시 엑손(Exon)과 인트론(Intron) 부분으로 분리된다.

4. 인트론 (Intron)

유전자에서 단백질 합성에서 관여하지 않는 부분. 전체 유전자 중에 엑손이 차지하는 비중 대신 인트론이 차지하는 비중이 월등히 높아(인간 기준 약 22) 유전자의 길이는 인트론에 의해 결정된다고 볼 수 있다. 1978년 처음 등장한 인트론은 단백질 중심으로 해석되었던 생물학에 많은 논쟁거리를 제공하였고 지금까지도 새로운 인트론 기능들이 연구되고 있다. 많은 사람들이 인정하고 가장 오랫동안 인정받고 있는 인트론 기능은 선택적으로 엑손을 선택하여 다양한 단백질을 생산 할 수 있게 하는 것이다. 즉, 엑손들이 다양하게 결합 되어 한정된 엑손정보를 가지고도 다양한 기능을 가지는 단백질을 생산 할 수 있는 것이다. 또한 인트론 내에는 다양한 기능을 가지는 DNA를 가지고 있어 유전자발현조절, 단백질 접힘 조절 등 단백질을 코딩하는 엑손이 가지지 못하는 생물학적 역할을 하고 있다.

5. 전사(Transcription)

단일 가닥 DNA를 주형(틀)으로 mRNA가 합성되는 과정을 전사라 한다. 쉽게 설명하면 DNA를 유전형질에 영향을 미치는 단백질을 만드는 설계도에 비유하면 이 설계도를 mRNA(messenger RNA)가 복사하는 과정을 전사라 한다. 복사를 마친 mRNA는 단백질을 만드는 공장인 리보솜 속으로 들어가 설계도대로 단백질을 만든다. 이 때 단백질을 구성성분인 아미노산은 tRNA(transfer RNA)가 가져다 준다.

6. 외유전체적 조절(후성유전체 조절, epigenetics)

DNA는 히스톤 단백질에 의해 감겨져 있다. 이 히스톤 단백질과 실처럼 감겨있는 DNA의 복합체인 크로마틴의 특정 부분에 메틸화라고 하는 화학적 변화가 발생하면, 히스톤 단백질에 감겨 있던 DNA가 물리적으로 풀리면서 DNA에 저장되어 있는 유전정보가 읽혀져 “발현”할 수 있게 된다. , 유전자의 발현조절과 관련있다.

7. 신경연결성 (Neural connectivity)

신경연결성이란 뉴런과 뉴런 사이에 연결을 의미한다. 신경세포인 뉴런 사이에는 시냅스(synaps)라는 틈이 있고, 시냅스에서 우리 몸에 화학 메신저와 같은 역할을 하는 신경전달물질(ex: 도파민, 아세틸콜린 등)이 전달돼, 신호 전달이 일어난다.

8. 엑손(Exon)-인트론(Intron)-스플라이싱(Splicing)

인간과 같은 진핵생물은 유전자에 단백질 합성 정보를 담는 부분과 그렇지 않는 부분을 함께 가지고 있다. 이때 단백질 합성 정보를 갖는 부분을 엑손 이라고 하며 단백질 합성 정보를 가지지 않는 부분을 인트론 이라고 한다. 따라서 진핵생물은 단백질 합성을 위해 인트론을 제거하고 엑손끼리 연결하는 과정을 거치는데 이를 스플라이싱이라고 한다. DNA 로부터 단백질을 합성하는데 뼈대로 작용하는 mRNA는 이 스플라이싱을 거쳐야만 미성숙 mRNA 에서 성숙 mRNA가 돼 단백질을 합성 할 수 있게 된다.

9. 스플라이스 부위

진핵생물은 유전자로부터 정확한 단백질을 만들어 내기 위해서는 올바른 성숙 mRNA를 만들어야 한다. 따라서 정확한 스플라이싱을 하기 위해서는 엑손부위와 인트론 부위를 구별 할 수 있어야 한다. 이때 엑손과 인트론이 연결되어 있는 부위를 스플라이스 부위라 한다.

 

[붙임] 그림설명

 

그림1. 고래상어를 포함한 85 생물 종 비교 연구를 통한 다양한 상호 연관관계 분석 고래상어(붉은 박스표시)를 포함하여 총 85 생물 종 비교 연구를 통해 게놈이 가지는 물리적인 특성들과 몸무게, 수명, 기초 대사량들과 상호 연관성을 분석 할 수 있다. 게놈의 크기는 단순히 크다 혹은 작다로 표현되는 단순 수치적인 것이 아니라 길이가 긴 게놈에 많은 정보를 담고 있고 그 정보들을 파악하여 인간의 수명과 같은 생물학적 의미를 파악 할 수 있음을 알려준다.

 

그림2. 인트론내에 존재하는 반복서열 들에 대한 생물종별 함량비 반복서열 종류에 따라 주로 존재하는 생물종이 다른 것을 확인 할 수 있다. 특히 LINE/CR1, LINE/CR1-Zenon, LINE/Penoelope 반복서열은 이번 연구를 통해 고래상어에서 가장 많이 발견됐다. 따라서 일반 다른 생물종에 비해 긴 인트론을 가지는 고래상어는 길이뿐만 아니라 그 성격도 다를 것임을 예측 할 수 있다.