Gene set analysis
인간을 오랜 시간 과학을 발전 시켜 생물의 gene sequence를 알아내는 단계까지 도달했다. 그러나 이 염기 서열의 나열만 가지고는 유의미한 정보를 얻어낼 수가 없었다. 그래서 각기 다른 발현을 하는 gene을 구분하고, 그 발현을 하는 염기 서열 묶어 gene set을 정리하였다. 이 정보를 바탕으로 임의의 gene이 가지는 gene set을 유추하여 그 기능을 알아보는 것을 Gene set analysis라 한다.
Gene Ontology
여러 종에 걸쳐서 유사한 기능을 하는 gene과 gene product를 분류한 것이다. 이것을 데이터베이스화 하는 것을 Gene Ontology project라 한다. 이 project는 gene과 gene product의 용어를 정리하고, 그 용어에 대한 개념을 정리하며, 그 용어와 개념에 대한 데이터베이스를 구축하는 것을 목적으로 한다. 이때 이 데이터베이스는 크게 세가지 항목으로 나뉘어진다. 첫 번째 항목은 cellular component이다. 이것은 cell의 구성성분을 말한다.
그러나 rough endoplasmic reticulum와 같이 해부학 적으로 관찰 가능한 구조 혹은 ribosome과 같은 gene product들을 말하는 것이지 세포가 가지고 있는 화학적 구조 같은 것을 말하는 것은 아니다. 두 번째는 biological process이다. Biological process는 하나 혹은 그 이상의 molecular function에 의해 이루어지는 일련의 사건들을 말한다. 예를 들어 pyrimidine metabolic process나 alpha-glucoside transport가 biological process에 속한다 할 수 있다.
마지막은 molecular function이다. Molecular function은 분자 단위에서 일어나는 반응을 말한다. 이것은 보통은 gene product 개개의 반응을 말한다. 그러나 몇몇의 반응에서는 gene product가 complex의 형태로 반응하기 때문에 아주 적은 경우에는 gene product 여러 개의 반응을 말하기도 한다. 이때 biological process와 molecular function은 의미가 서로 비슷해 보인다. 그러나 molecular function와는 달리 biological process는 2개 이상의 개의 구별된 단계가 있는 것임에 유의하여야 한다.
실험 방법
1. gsGator
Set creator를 통하여 주어진 gene의 gene set을 만들고 set analyzer를 통하여 orthology mapping등의 gene set analysis을 수행한다.
2. DAVID
DAVID를 통하여 ID type가 entrez로 주어진 gene을 gene set analysis를 수행하여 gene list로 만든다.
댓글