Wednesday, April 10, 2013

노령화, 의료시스템의 위기, 정부의 역할 :: 영국의 국가 유전체 연구 전략을 통해 본 의료시스템과 국가 정책

영국의 국가 주도 대규모 Genome 프로젝트

 영국은 프레데릭 생어에 의해 최초로 DNA sequencing이 탄생한 곳이고, 그 생어를 기려 웰컴트러스트의 기부로 설립한 Sanger institute 은 현재도 세계 최고의 유전체 연구소로 자리 메김하고 있다.   대규모 유전체 연구를 가능케 하는 Bioinformatics 도 EBI 와 Sanger 연구소를 통해 세계 최고 수준을 유지하며 유전체 연구를 위한 인프라도 부족함 없이 잘 구축되어 있다 할 수 있다.

하지만, 여느 field와 마찬가지로, 넓은 시장과 막강한 자금력을 바탕으로한 미국의 대학과 회사들이 유전체 학계와 시장을 주도하기 시작했고, 영국도 여느 나라와 마찬가지로 미국의 lead에 동참하는 top tier 중 한 곳으로 주저 앉은 느낌을 지울 수 없었던 것이 사실이다.

하지만 최근의 영국의 행보를 보면, 국가적으로 미래 유전체 market을 leading 하려는 강력한 의지가 보이는데, 그 근거는 최근 발표한  10만명 whole genome 프로젝트 그리고 50만명 genotyping 프로젝트.


노령화,  암울한 미래 의료 시스템

영국이 이런 엄청난 프로젝트를 진행하는 이유는 이 프로젝트의 주체 NHS 를 생각하면 쉽게 답이 나온다. NHS는 우리로 치면 의료보험건강공단 쯤 되는 곳인데, 이를 통한 영국의 의료시스템은 공짜다. 누구나 무상으로 병원을 이용할 수 있고, 약값은 어떤 약을 처방받든 일정 금액을 지불한다 . 이렇게 하면서도 사보험 중심 의료시스템의 미국이 2010년 기준 GDP 18%를 의료비로 소비하는데 반해, 영국은 그 절반 수준인 9% 정도만 의료비로 사용하는 효율적인 의료시스템을 운영하고 있다.

하지만,  고령화 추세에 발맞추어 의료비도 빠르게 상승하고 있다. 2000년대 초반 6%대에 머물던 것이, 2010년 기준 9%를 넘어섰고, 이런 추세가 이어지면 2020년 경에는 20%를 넘어서게 될 것으로 예상된다 ( 아래 그래프 참조, 고령화 추세는 developed country 들엔 공통적 고민거리고 한국도 마찬가지 추세가 확인된다. 남의 일이 아니다 ).

1995년 부터 2010년 까지 각 국가의 GDP 대비 의료비 지출을 표시한 그래프.
 X 축은 1인당 GDP, Y축이 GDP 대비 의료비 지출% 


GDP대비가 아닌, 정부 예산 대비 의료비 지출로 따지면, 영국은 이미 15% 이상을 의료비로 지출하고 있다( 아래 그래프 참조 , 미국은 20%를 이미 넘어섰고, 한국도 이미 12% 이상을 지출하고 있다 )

2010년의 각 정부 지출 대비 의료비 지출을 표시한 그래프. 

결국 모든 국가들이 장기적으로 급격히 늘어나는 의료비 문제에 봉착하게 되는 것이 현실이고,  현재의 의료 시스템은 어떻게든 혁신이 일어나야만 암울한 미래의 의료시스템의 붕괴를 피할 수 있는 상황이다.


유전체 의학 ( Genomic Medicine )과 의료 혁신 

의료시스템의 혁신은 가장 상황이 심각하고 시급한 미국을 중심으로, 활발하게 다양한
대안 모델들이 시도 되고 있다. 원격 의료, 원격 처방, 전문 간호사 진료 ( 의사를 거치지 않고, diagnosis - prescription 이 명확한 질환들을 전문간호사의 관리하에 진료-처방 ) , Mobile 기술을 활용한 다양한 healthcare 등.

이러한 줄기들 중, 의료 혁신에 강력한 drive를 걸어줄 것으로 대두되는 것이 바로 개인유전체 혁명에 기반한 유전체 의학 ( Genomic Medicine )이다.  개개인의 유전체( Personal Genome ) 정보를 기반으로 개인의 healthcare 관리를 일상의 영역으로 끌어내려, 질병에 걸리기 이전에 미리 질병을 예방하는 예방의학( Preventible Medicine ) 을 가능케 하고, 암과 같은 치명적 질병을 개개인의 질병 발현을 일으킨 변이 유전자를 찾아내 개인화된 치료를 가능케 하고, 개인의 유전적 특성에 기초해 부작용을 일으키는 약물을 속아내거나, 안전한 수준의 약물 투여량 등을 판별해 내는 등의 일들이 개인의 유전체 정보를 의학에 이용할 때 가능해지는 일들이 되고, 국가 전체의 의료 시스템의 측면에서 보자면, 유전체 정보를 활용하여 효율적인 치료와 처방 및 예방이 가능해지면, 엄청난 의료비 지출 감소 효과를 기대할 수 있을 것으로 예상된다.

인간게놈프로젝트( Human Genome Project)에서 한 사람의 유전체 분석( DNA sequencing)에 3조원이 소모되었던 것이, 지금은 수백만원 수준으로 떨어졌고, 전체 유전체 중 유전자 영역인 Exome 부위의 DNA 만 읽어내는 Exome sequencing의 경우 소비자 가격이 이미 백만원 아래로 떨어진 상태다.  MRI, CT 찍는 정도의 가격으로 전체 유전자 영역의 DNA sequencing이 가능하다는 말이고, 이는 곧, 지금 당장도 유전체 의학을 적용해 볼 수 있는 시대라는 것.

하지만, 아직 유전체 의학이 기대 만큼 제대로 환자의 치료에 적용되지는 못하는데, 이는 유전체와 질병 및 약물 등과의 연관성이 충분히 연구되지 않은 상태이기 때문이다.



10만명 Genome 프로젝트에 담긴 영국의 전략


앞서 언급한 영국 NHS 주도 10만명 Whole Genome 프로젝트는 유전체 의학의 실효성을 높일 유전체-질병,약물 연관성 정보의 부족을 타개하여, 유전체 의학의 실질적 이용을 가능케 하기 위해 디자인된 프로젝트다.

영국 국가 건강 서비스  NHS( National Health Service ) 주도로 암이나 희귀질병을 가진 영국인 10만명의 DNA sequence 30억개 전체 whole genome을 분석하는 인류 역사상 최대의 genome project 를 통해 질병과 유전체의 상관 관계에 대한 다양한 정보를 얻어내, 의료시스템에 활용하겠다는 전략.  영국 총리 데이빗 카메론은  "영국이 mainstream 의료 시스템에 유전체를 이용하는 최초의 국가가 될 것" 이라고 얘기하는데, 바로 이 프로젝트의 목적을 잘 보여주는 대목이다.

이 프로젝트는 구체적으로 2014년 4월까지 10만명의 whole genome sequencing을 수행할 기관을 선정하고,  프로젝트를 진행할 계획이라고 하는데,  프로젝트 에는  

-  유전체 의학, 약물유전체학을 연구할 전문 인력 교육
-  대규모 유전체 정보를 관리할 computer system 구축

에 대한 계획도 수립되어 있다고 한다. 

이 프로젝트가 성공적으로 완수가 되면 영국은
- 세계 최대의 유전체 의학 정보 knowledgebase 구축( 이 자체가 엄청난 자산)
- 유전체 의학의 NHS 이용으로 국가적 의료비 절감
- 프로젝트를 통해 대규모 유전체 정보 분석 전문 인력 대규모로 양성
- 대규모 유전체 정보 flow 컨트롤 가능한 computer system 구축 ( 현재 IT의 최대 화두 중 하나인 Cloud 컴퓨팅 환경 하에서의 Genome data 활용에 필요한 기반 기술의 개발이 기대됨 )

등의 효과를 기대할 수 있는데, next paradigm인 Genome 산업에 매우 유리한 위치를 선점하게 되는 것. 

이런 대단한 프로젝트에 드는 돈은 얼마나 될까? 겨우 $160 million 이다. 겨우 우리돈 2천억 정도.  4대강에 수십조 쏟은 우리의 경험을 생각해 보면, 겨우 2천억 정도 푼돈을 쏟아 Genome 대국이 되는 영국의 정책 입안자들이 그저 부러울 따름이다. 


50만명 Genotyping 프로젝트 :: 또다른 영국의 국가 주도 유전체 프로젝트

10만명 Genome 프로젝트 이외에 영국은 UK Biobank 주관의 50만명 Genotyping 프로젝트도 시작한다. 

이 프로젝트는 40세에서 69세 사이의 영국인인 50만명의 blood, urine, saliva 샘플을 Affymetrix Genotyping chip을 이용해 분석하여, 다양한 질병과 유전체의 상관관계를 밝혀내는 것이 목적이다.  10만명 프로젝트와 차이는 이것이 추적조사연구( longitudinal study) 라는 점.  

참여자의 medical history, lifestyle( diet, 다양한 설문, body scan, 그외 accelerometer를 이용한 activity tracking 등도 고려) 그리고 다양한 테스트 결과들( fMIR, CT scan, X-ray 등의 정보의 포함 까지 계획)이 유전체 정보와 함께 분석되어  구체적인 유전체와 질병 발병의 상관 관계를 밝혀낼 수 있게 된다. 

질병의 발현은 개인의 유전체 타입으로만 결정되는 것이 아니라, 다양한 생활 습관, 식습관, 운동, 환경적 요인등 다양한 생활-환경 요소가 함께 결합되어 결정이 된다. 이 프로젝트에서는 개인의 유전체 뿐만 아니라 다양한 개인의 생활-환경 요소 정보를 함께 축적하여 질병의 발현의 종합적 분석을 하려는 목적을 담고 있다.  

이런 시도는 인류 역사상 최초로 시도되는 가장 구체적인 질병 연구라 할 수 있고, 여기서 쏟아지는 질병 정보는 인류가 지금까지 축적한 질병의 발현 정보를 기하 급수적으로 확장시킬 것이라 예상한다. 

이 프로젝트 또한 $160million 정도, 우리돈 2천억 정도만 소모된다고 한다.  

현재 미국과 중국이 이와 유사한 프로젝트를 계획하고 있다고 하는데, 미국은 이 프로젝트에 $2 billion 우리돈 2조 이상을 투입할 것이라 한다. ( 얼마나 대규모로 진행할려고 2조 이상을 ... )

이 두 프로젝트 도합 우리돈 4천억 밖에 안 든다.  도로명 주소 까는데 4천억 이상의 예산이 소모되었다고 한다.  통크게 1조 정도 써서  50만명 whole genome 기반 10년 longitudinal 질병 프로젝트 하면, 한국은 유전체 연구, 산업 Top tier 국가로 올라선다.  


앞서나가는 국가들, 그리고 한국 

한국은 지금까지 whole genome sequencing 이 가장 많이 수행된 국가 중 한곳으로, 다양한 genome 관련 연구 프로젝트가 진행되고 있긴 하다. BT가 성장 동력이라는 것도 잘 인식하고 있고, 이를 위해 다양한 정책과 산업적 움직임이 감지되고 있다. 하지만, Genome 산업과 그 정책에 대해서만 따져보면,  의료시스템과 Genome 기술과 산업을 한데 묶어, 경쟁력 있는 미래를 위한 정책이나 투자는 전혀 진행되고 있지 못하다고 생각한다. 

유전체 산업에 대해서만 보자면, 다양한 idea들이 시장에 선보이고 자연스럽게 시장에 의해 성공과 실패가 반복되며 경쟁력 있는 유전체 산업과 제품군이 생겨나는 창의적인 순환이 일어나야 하지만, 생명의료윤리법에 의해 이러한 시도는 완전히 불가능하게 막혀 있다. 

미국이 모두 정답은 아니지만,  GINA법( 개인의 유전적 특질로 인해 차별받지 않을 권리)이나, 소비자유전학에 대한 관리규정 등 사회,윤리적 문제가 될 만한 부분들을 법적 장치나 관리 기관의 관리 하에 허용하면서, 유전체 산업의 다양한 창의적 시도들이 가능한 환경은 정말 부럽기 그지 없다.

유전체 산업에서는 앞으로 분명히 구글, 애플을 능가하는 회사가 출현할 것인데,  어떤 비즈니스 모델이 이런 회사로 이어질지는 아무도 모른다.  자연히 다양한 시도를 하는 중에 이런 회사가 툭 튀어 나오게 된다. 실리콘밸리의 성공을 굳이 언급할 필요는 없을터. 

IT에서 실리콘 밸리가 성공했는데, BT 유전체 산업에서도 지금 이런 일이 반복되고 있다.  인간 유전체 산업은 사회, 윤리적 문제가 여타 산업과 비교할 수 없을 만큼 파급력이 강할 수밖에 없다. 하지만, 무엇이 문제가 될 것인지, 이런 문제를 어떻게 보호할지는 적절한 법적인 울타리를 만들어 컨트롤 하는 것이 가능하다. 당장 문제가 되는 부분들을 법제화하고, 새로운 문제는 그 때 그때 만들어 나가면 된다. 

그런 울타리를 치고, 창의적 아이디어들이 시장에 살아 숨쉴 수 있도록 만들어야 한다.  선진국들이 모든 문제를 해결해 놓고 난 후에, 이를 그저 답습하는 식의 전략은 이제 그만 버려야 한다. 적극적으로, 주도적으로 목표를 세우고 문제를 해결해 나가는 자세를 국가가 견지 하지 않는 한,  next big thing BT 산업에서 한국이 선도국가로 발돋움하는 일은 없을거라 '확신'한다. 





Monday, April 8, 2013

생물정보학은 BT와 IT의 결합이 아니다.


Bioinformatics를 BT 전문가 분들도 단순히 BT와 IT의 결합이라고 생각하는 경우가 많음을 지난주 GMIG 미팅에서 느꼈다. 단순히 BT 하는 사람과 IT 하는 사람들이 같이 모여서 열심히 일하면 잘 되는 문제로 생각하는 경향이 있는데, 절대 그렇게 해서 bioinformatics가 제대로 안 된다.

달리기 잘하는 사람과 테니스 잘 치는 사람 둘을 모으면 좋은 야구팀이 될까? 야구는 야구를 전문적으로 연습한 사람이 테니스 세계 1위 보다, 100m 기록 보유자 우사인 볼트보다 훨씬 잘 한다.

바이오인포매틱스도 마찬가지. 세부적으로 도구를 나눠 보자면, BT도 알아야 하고 IT 도 알아야 하니, 이 둘을 잘 하는 사람을 모아 놓으면 잘 할 것 같지만, 실상은 전혀 아니다. BT하는 사람은 IT의 철학과 방법론을 모르고, IT는 다루는 데이터의 본질을 알지 못한다. 이렇게 교집합 부분이 텅 비어 있는 상태로 올바른 합집합이 만들어 지지 않는다.

바이오인포는 바이오인포를 전문적으로 학습하고 시간을 투자하여, 바이오 데이터를 IT 적 시각으로 보고, 통계적으로 바라볼 수 있는 안목이 있어야 비로소 제대로 된 일을 수행할 수 있다.

경험상 어느 한쪽에 전문성을 가진 사람이 바이오인포로 와서 반대쪽에 익숙해 지는데는 적어도 학위 과정 정도의 시간이 필요하다. 굳이 더 따지자면 BT-> IT가, IT->BT로 가는 경우 보다 더 짧은 시간 안에 좋은 성과를 낸다.

얼핏 생각하면 생물학이 공부하기 더 쉬우니 IT->BT 로 가는 것이 더 빠르지 않을까 생각할 수 있는데, 바이오인포 즉 생물정보학 = 생물학 이다. 바이오인포는 결국 생물학 문제를 풀어야 의미가 있는 일이다. 자연히 생물학적 지식에 기반한 문제 인식을 가진 생물학 기반의 생물정보학자가 반대쪽의 경우보다 '본질'을 더 잘 이해하고 접근하는 경우가 많다.

IT에서 온 사람들이 이런 노력을 등한시 하는 경우, 그저 algorithm 최적화 문제에 집착하고 시간을 낭비하는 경우가 많다. 하지만, 그건 생물정보학이 아니라, 그냥 알고리즘 문제 해결일 뿐이고, 의미 있는 일도 아니다.

반대로 생물학에서 넘어온 사람들은 기초적인 프로그래밍 능력만 갖추어도 의미 있는 생물학 문제에 의미 있는 수준의 결과를 내는 것이 가능하다. fancy한 알고리즘이나 알고리즘의 효율성은 전혀 문제가 되지 않기 때문이다. ( 하지만, 제대로 된 알고리즘 설계를 하지 못한다면, 풀지 못하는 생물정보학의 문제가 매우 많은 것이 현실 )

생물정보학은 아주 전도 유망한 학문이다. 왜? 생물정보학은 현대 사회가 요구하는 데이터 분석 능력(big data 의 통계적 분석 능력), IT 이해( 프로그래밍 능력, 웹, 클라우드를 컨트롤 하는 능력), 그리고 next paradigm 인 유전체/의학을 이해하는 사람을 길러내는 학문이기 때문이다.

현재 미국에서 생물정보학자가 평균적으로 생물학자보다 연봉이 50% 높다. ( 스탠포드의 생물정보학자들이 인터뷰에서 2-3배 라고 했는데, 평균적으로 따지면 그 보다는 낮다. 하지만, 실질 체감 연봉은 그 정도 차이라는 것 ) 앞으로 이런 갭은 더욱 커질 거라 보는데, 이는 생물정보학자가 선택할 수 있는 도메인이 늘어날 것이기 때문.

Sunday, April 7, 2013

지금 BT에 필요한 IT 기술이란?

아래 내용은 GMIG( Genomic Medicine Interest Group ) 2회 모임 후 관련 내용을 멤버들과 share한 내용으로, 내용의 변경 없이 그대로 여기에 남깁니다.
-------------------------------------------------------------------------------------

2회 모임의 내용 중에 제(금창원)가 지적하고 싶었던 내용이 하나더 있는데, 그것은 바로 IT에 대한 '환상'의 경계 입니다. 박재범 대표님의 발표를 보면서 그런 생각이 들었는데, 재범 대표님의 발표에서 중요하게 받아들여야 할 것은 IT의 영역 중 '소비자 중심의 UX / UI 와 관련한 부분'들로 BT에 적용되지 않았던 '일반 대중'을 대상으로 접근성이 높고, 지속가능한 유용성을 꾸준히 제공하는 IT application이 필요하다는 점 이라고 봅니다.

이런 부분은 인류 역사상 BT에 거의 접목이 된 적이 없는 부분에 가깝다 봅니다. 근접하는 성공으로 한국인 정세주 대표가 뉴욕에서 창업한 Noom의 다이어트앱 정도를 들 수 있을 것 같습니다. ( 최초엔 running trajectory tracing과 칼로리 소모량 기록용 개인 data log 앱이었으나, 발전하여 지금은 식습관 등이 포함되어 살빼는 목적을 실현시켜주는 앱이 되었고 전세계 user가 1500만명이 넘습니다. )

이런 식의 접근이 Genetics에도 시도가 되어 나가면 엄청난 혁신이 있을거라는 것을 GMIG 참여자 분들이라면 충분히 이해하시리라 생각 합니다.

하지만, Genomics의 연구 관점에서 보자면 이미 최첨단의 IT 기술들이 충분히 적용되고 있고, 경우에 따라서는 BT inspired IT 기술이 IT의 최첨단 기술이 되고 있습니다.

당장 현재 IT 최대 화도 cloud 컴퓨팅만 해도 유전체 데이터 분석이 major application domain으로 활발하게 연구 개발이 되고 있죠( KT에서 GenomeCloud를 베타 테스트 중입니다)

재범 대표님의 발표에서 구글의 Pagerank 알고리즘이 적용된 Gene priotization 연구를 언급하셨는데, 이런 연구는 gene expression 연구 초창기인 2000년대 초반 부터 minor 저널에 심심하면 한번씩 출판되던 내용입니다. 그냥 구글 서치해보면 2005년 논문이 상위에 뜨네요. 왜 이런 논문이 minor 저널에 출판되냐 하면, 당연히 value가 낮기 때문입니다.

즉, 이런 알고리즘을 적용하는 것은 fancy한 접근일 수는 있지만, '문제 해결'은 되지 않기 때문입니다. 기존의 방법론 보다 더 나은 해결책을 제시해 주지도 못하는데 그 이유는 간략하게 생물체의 variation은 엄청나기 때문이라는 것 정도만 여기에 언급해 둡니다. Gene expression과 관련해선 FDA의 MAQC( Microarray Quality Control ) 컨소시움의 연구를 통해 이런 점들이 이미 충분히 지적이 되었습니다.

(MAQC 내용을 정리한 제 블로그 글http://goldbio.blogspot.kr/2011/03/20.html )

MAQC는 당시 가능한 모든 통계적 분석법과 machine learning 알고리즘을 gene expression 분석에 적용해 보고, 가장 consistent하고 재현성 높은 분석 기준을 찾는 것을 목적으로 미국의 51개 major 유전체 연구기관이 참여한 대규모 study 였습니다.

기대는 뭔가 첨단의 hign-end 방법론이 best 일거라 기대했지만, 그 예상은 처참히 무너집니다. 최고는 초창기 부터 일반적으로 써왔던 fold change ( 그냥 단순히 case-control의 비율) 과 가장 간단한 t-test를 적절히 혼용하는 것이었죠.

재범 대표 님이 발표한 내용 중 network analysis 와 관련된 내용도 있었는데, network analysis 는 네트웍 분석이 바라바시에 의해 중요하게 부각된 초창기 부터 BT가 major application domain 으로 2000년대 초반부터 BT 특히나 bioinformatics에서는 일상적으로 다루어져 오고 있습니다. 바라바시가 쓴 그 유명한 저서 'Linked'에도 현재 테라젠의 박종화 연구소장님의 단백질 구조 도메인의 네트웍 연구가 소개되어 있을 정도 입니다.

심지어 network visualization 소프트웨어 중 최고로 인정되는 것이 바로 요즘 생물학 연구실에서 한명 쯤은 쓰고 있는 cytoscape라는 오픈 소스 소프트웨어 입니다. ( 이는 리로이 후드가 이끄는 ISB 에서 개발한 소프트웨어 )

사실 BT의 연구 측면에서만 보자면 IT 적 시각을 가진 사람들( bioinformatician )이 해야하는 역할은 새로운 시각으로 문제 해결의 새로운 가능성을 여는 일이라 봅니다. ( 이에 대해서도 일전에 정리해 둔 글을 참고로 링크 합니다http://goldbio.blogspot.kr/2011/02/blog-post.html )

Broad나 Sanger 연구소가 유전체 연구의 최고로 인정받는 이면에는 바로 이런 역할을 하는 사람들이 directing board로 참여하면서 연구의 혁신을 이끌기 때문입니다. ( sanger의 리차드 더빈, 팀 허바드 broad의 토드 골럽 등) 국외 뿐만 아니라, 국내에서도 유전체 연구를 선도하는 테라젠이나 서정선 교수님이 이끄는 서울대유전체연소(GMI) 등도 훌륭한 bioinformatician( 혹은 cross-functional researcher ) 들의 존재 때문에 선구적인 연구들을 진행할 수 있다고 봅니다.

글이 길어졌는데, 정리해 보면, IT의 UX/UI 기술들이 접목이 되어야 결국 진정한 personal genomics로 갈 수 있고, 대중화될 수 있다는 점. 하지만 연구자의 입장에서는 이미 충분히 첨단의 IT 기술이 적용되고 있고, 필요한 내용들은 대부분 쉽게 사용할 수 있는 application들이 존재하니, 활용을 하고, IT 기술에 대한 환상을 가질 필요는 없다는 점, 그리고 fancy한 기술 보다는 어떤 문제를 해결하는데 새로운, 참신한 idea를 간단한 IT 기법들로, crude한 상태라도 적용해보는 것이 중요할 수 있다는 아이디어들을 나누고 싶었습니다