Monday, April 8, 2013

생물정보학은 BT와 IT의 결합이 아니다.


Bioinformatics를 BT 전문가 분들도 단순히 BT와 IT의 결합이라고 생각하는 경우가 많음을 지난주 GMIG 미팅에서 느꼈다. 단순히 BT 하는 사람과 IT 하는 사람들이 같이 모여서 열심히 일하면 잘 되는 문제로 생각하는 경향이 있는데, 절대 그렇게 해서 bioinformatics가 제대로 안 된다.

달리기 잘하는 사람과 테니스 잘 치는 사람 둘을 모으면 좋은 야구팀이 될까? 야구는 야구를 전문적으로 연습한 사람이 테니스 세계 1위 보다, 100m 기록 보유자 우사인 볼트보다 훨씬 잘 한다.

바이오인포매틱스도 마찬가지. 세부적으로 도구를 나눠 보자면, BT도 알아야 하고 IT 도 알아야 하니, 이 둘을 잘 하는 사람을 모아 놓으면 잘 할 것 같지만, 실상은 전혀 아니다. BT하는 사람은 IT의 철학과 방법론을 모르고, IT는 다루는 데이터의 본질을 알지 못한다. 이렇게 교집합 부분이 텅 비어 있는 상태로 올바른 합집합이 만들어 지지 않는다.

바이오인포는 바이오인포를 전문적으로 학습하고 시간을 투자하여, 바이오 데이터를 IT 적 시각으로 보고, 통계적으로 바라볼 수 있는 안목이 있어야 비로소 제대로 된 일을 수행할 수 있다.

경험상 어느 한쪽에 전문성을 가진 사람이 바이오인포로 와서 반대쪽에 익숙해 지는데는 적어도 학위 과정 정도의 시간이 필요하다. 굳이 더 따지자면 BT-> IT가, IT->BT로 가는 경우 보다 더 짧은 시간 안에 좋은 성과를 낸다.

얼핏 생각하면 생물학이 공부하기 더 쉬우니 IT->BT 로 가는 것이 더 빠르지 않을까 생각할 수 있는데, 바이오인포 즉 생물정보학 = 생물학 이다. 바이오인포는 결국 생물학 문제를 풀어야 의미가 있는 일이다. 자연히 생물학적 지식에 기반한 문제 인식을 가진 생물학 기반의 생물정보학자가 반대쪽의 경우보다 '본질'을 더 잘 이해하고 접근하는 경우가 많다.

IT에서 온 사람들이 이런 노력을 등한시 하는 경우, 그저 algorithm 최적화 문제에 집착하고 시간을 낭비하는 경우가 많다. 하지만, 그건 생물정보학이 아니라, 그냥 알고리즘 문제 해결일 뿐이고, 의미 있는 일도 아니다.

반대로 생물학에서 넘어온 사람들은 기초적인 프로그래밍 능력만 갖추어도 의미 있는 생물학 문제에 의미 있는 수준의 결과를 내는 것이 가능하다. fancy한 알고리즘이나 알고리즘의 효율성은 전혀 문제가 되지 않기 때문이다. ( 하지만, 제대로 된 알고리즘 설계를 하지 못한다면, 풀지 못하는 생물정보학의 문제가 매우 많은 것이 현실 )

생물정보학은 아주 전도 유망한 학문이다. 왜? 생물정보학은 현대 사회가 요구하는 데이터 분석 능력(big data 의 통계적 분석 능력), IT 이해( 프로그래밍 능력, 웹, 클라우드를 컨트롤 하는 능력), 그리고 next paradigm 인 유전체/의학을 이해하는 사람을 길러내는 학문이기 때문이다.

현재 미국에서 생물정보학자가 평균적으로 생물학자보다 연봉이 50% 높다. ( 스탠포드의 생물정보학자들이 인터뷰에서 2-3배 라고 했는데, 평균적으로 따지면 그 보다는 낮다. 하지만, 실질 체감 연봉은 그 정도 차이라는 것 ) 앞으로 이런 갭은 더욱 커질 거라 보는데, 이는 생물정보학자가 선택할 수 있는 도메인이 늘어날 것이기 때문.