Sunday, February 6, 2011

생명정보학자들은 어떤 역할을 해야 하나?

네이쳐 바이오테크놀로지에 2010년 생명정보학 연구 하일라이트에 관한 글이 실렸다.
http://www.nature.com/nbt/journal/v29/n1/pdf/nbt.1747.pdf

이 글 중 Box2 에는 '분야를 뛰어넘는 연구자( Cross functional individual )' 들이 생명정보학 연구에 어떤 기여를 하고 있는지에 관한 내용이 담겨있다. 여기서 말하는 분야를 뛰어넘는 연구자들은 곧, 생명정보학자, 계산 생물학자로 지칭되는 생물학과 계산과학 두 분야 모두에 전문적인 지식을 가진 연구자들을 이야기 한다.

생명정보학 툴이 생물학계 전반에 퍼지는 양상은 3단계에 거쳐 진행이 된다고 하는데, 이 순서는 아래와 같다.

1. 생명정보학자들이 정보학적 분석을 통해 해결할 수 있는 생물학 문제들을 인식하고 간단한 방법론을 통해 이런 문제들을 해결할 수 있다는 사실을 증명한다.
2. 정통 계산과학자 ( 수학 및 컴퓨터과학자들 ) 들이 좀더 정교한 방법론들을 이용해 생명정보학자들이 만들어 놓은 간단한 방법론을 개선하여 생물학자들이 사용하기 쉬운 '툴'로 만든다.
3. 만들어진 '툴'을 필요로 하는 생물학자들이 사용하여 새로운 발견에 이용된다.

마이크로어레이 '분류( classification )' 연구에서 핵심이 되는 것은 특징 찾기(feature selection) 과정인데, 이 분야 연구를 예로 들어보면,  1999년 Todd golub 에 의해 출판된 네이쳐 논문이 선구적인 논문으로 이와 관련해 가장 인용이 많이 된 논문인 것으로 알고 있다.

그런데, 이 논문의 핵심이 되는 feature selection 알고리즘은 새롭게 개발된 것이 아니라, 흔하게 쓰이는 t-test 다. 즉, 위의 1번 과정 처럼 '기존에 존재하는 단순한 방법론' 을 '새로운 생물학 문제'에 적용을 하여 효과적으로 문제 해결을 할 수 있다는 사실을 증명한 것이다.

이후로 이 보다 훨씬 정교한 방법론들이 수학자, 통계학자, 컴퓨터 공학자들에 의해 엄청나게
만들어 지면서 2번 과정이 진행된다. 이 중에 가장 효과적이라고 검증된 SAM 과 같은 몇몇개의 방법론들은 마이크로어레이 분류 문제 해결을 위해 전세계의 생물학자및 생명정보학 연구자들에 의해 사용되는 3번 과정을 거치며 기술 정착 단계에 이른다.

1,2,3번 과정에서 가장 큰 업적으로 평가받는 것은 1번, 즉 가장 먼저 '문제를 인식' 하고 '간단한 방법으로 해결 가능성' 을 보인 사람이다.  노벨상도 이런 일을 한 사람에게 돌아간다. 즉, 노벨상이나 각광받는 연구 업적들은 대단한 '방법론' 에 의한 경우보다 새로운 '문제 인식(발견)' 인 경우가 많고, 이런 새로운 '문제 인식' 에는 복잡한 방법론이 필요하지 않은 경우가 많다는 얘기다.

똑같은 문제를 조금 더 효과적으로 해결하는 방법론 을 만들기 위해 노력하는 것 보다, '중요한 문제' 발굴에 좀 더 신경을 쓰는 것이 좋은 생명정보학 연구자로 거듭나는 길이 되지 않을까 생각해 본다.