게시판 뷰
게시판 뷰페이지
1-1. Internet에서의 유전자 검색 - GenBank
작성자 안홍선
날짜 2009.05.12
조회수 4,218

원하는 유전자가 정해졌으면 PCR을 하기 위하여 유전자의 정보를 얻어야 합니다. 그런데 먼저 유전자라는 것이 어떤 것인가 알고 넘어가야 할
것입니다. 세포의 핵 내에는 염색체(chromosome)라는 것이 있는데 핵분열 중에 특히 잘 보입니다. Chromosome은 chromatin
fiber의 뭉치로 구성되어 있으며 이는 DNA가 histone 단백질들을 칭칭 감고 있는 형태인 nucleosome으로 구성되어 있음을 알 수
있습니다.


width=450 border=0>


DNA라는 것은 deoxyribonucleic acid의 약자로, 말 그대로 화학물질의 명칭입니다. 세포의 핵 속에 다량 존재하기 때문에
"핵산(nucleic acid)"라는 말이 붙었지요. 이 물질이 유전에 관여한다는 것을 안 것은 지금으로부터 채 50년이 안됩니다. DNA가
유전물질이란 것이 알려진 이후 DNA를 유전자(gene)이라는 말과 혼용하고 있지만, 엄밀하게 따지면 유전자라는 것은 DNA 중에서도 유전에
관여하는 부분을 일컫는 말이라 할 수 있습니다. DNA의 부분 부분 중에는 아직도 기능이 밝혀지지 않은 부분이 많습니다.


지놈(genome)이란 것은 유전자(gene)들의 집합체를 의미합니다. 사회적으로는 게놈이라고 읽기로 약속이 되었다고 하지만, 이 일을
하는 사람은 누구나 지놈이라고 읽습니다. 만약 이 용어를 게놈이라 읽어야 한다면 gene(진)을 겐이라 읽어야 하며 genomics(지노믹스)도
게노믹스라고 읽어야 하는데 아무도 이렇게 읽지 않습니다. 신문에서 "이번 인간 게놈 프로젝트를 수행한 셀레라 지노믹스라는 회사는..."이란
기사를 읽고 쓴 웃음을 지은 기억이 납니다.


DNA 부분 중에서 어떤 단백질을 만드는 부분이 밝혀지면 유전자 은행(GenBank)에 등록을 하게 되어 있습니다. 따라서 우리가 어떤
단백질을 만드는 유전자 염기서열이 필요하면 GenBank를 뒤져보면 됩니다. Human genome project의 결과로 사람의 염기서열은
거의 모두 밝혀져 있어서 이제는 이렇게 인터넷을 통해 필요한 유전자의 염기서열을 검색하는 일이 대단히 중요해졌습니다.


염기서열을 검색하는 인터넷 싸이트를 비롯해서 분자생물학에 유용한 싸이트는 이 홈페이지의 href="http://biochemistry.yonsei.ac.kr/biochem_link/biochem_link.htm">[자주가는
싸이트]
에 수록해 놓았습니다.


GenBank에서 유전자 검색하기


GenBank의 주소는 target=_blank>http://www.ncbi.nlm.nih.gov/Genbank/index.html입니다. 이곳에 가면 다음과
같은 화면이 나타납니다.


border=0>


p53은 매우 연구가 많이 된 유명한 유전자입니다. 그래서 p53이라고만 입력하면 관련 유전자를 포함해서 대단히 많은 유전자가 검색됩니다.
한번 해 보시면 이렇게는 찾기 힘들다는 걸 아실 겁니다. 우리가 지금 원하는 것은 사람 p53 유전자의 mRNA 입니다. (왜 DNA 대신
RNA 를 찾는가는 다음에 설명합니다).

'p53 mRNA complete human'의 키워드로 찾아보면 다음과 같은 결과를 얻습니다. GenBank 검색엔진은 상당히 똑똑해서
AND나 OR를 넣지 않고 그냥 자연어 검색을 하듯이 입력해도 잘 찾아줍니다. 그래도 139개나 되는 유전자가 검색되었군요.


border=0>


p53이란 유전자가 처음 밝혀진 다음에 계속해서 관련 유전자가 밝혀졌을 것이므로 이런 경우는 마지막 페이지로 가서 보는 것이
좋습니다.


사실, 검색을 하다보면 제목만 보고서는 자기가 원하는 염기서열을 얻기가 쉽지 않다는 것을 아실 것입니다. 제목이 똑같은데도 들어가서 보면
염기서열이 조금 틀린 경우도 있고 무엇보다 제목에 적혀있는 정보가 정확한 이름이 아닌 경우가 많습니다. 이것은 사람들이 유전자를 밝혀서
GenBank에 등록할 시점에서 정확한 명명이 않된 경우가 많기 때문이며, 따라서 유전자은행의 이름들은 아직 정리가 안되어 중구난방입니다.
최근에 NCBI에서 정리를 시도하고 있지만 개인적인 의견으로는 아직까지는 더 복잡해지기만 한 결과를 초래하고 있는 것 같습니다. 어쨌든 열심히
살펴서 정확한 페이지를 검색해야 하겠습니다.


가장 정확한 검색 방법은 그 유전자가 처음 보고된 논문을 참조하는 방법입니다. 이 경우 논문에 GenBank의 등록번호(accession
number)가 있습니다. GenBank의 모든 정보들은 이런 고유 등록번호가 붙어 있습니다. 일단 찾은 정보는 이 등록번호를 다시 입력하면
일일이 처음부터 검색하지 않아도 단번에 찾을 수 있습니다. 아래 그림은 X02469 라는 등록번호로 찾는 과정입니다.


border=0>


클릭하면 다음과 같은 유전자에 관한 정보를 볼 수 있습니다.


border=0>


자, 이제 원하는 유전자 정보를 찾았습니다. 이제 이것을 읽는 방법을 알아봅시다.