Thursday, December 4, 2014

Bioinformatics Startup 분석

Genome 산업이 꿈틀꿈틀 대고 있는 이 시점, Genome 정보 산업의 핵심 역할을 하는 분야 'bioinformatics' tag 을 달고 창업하는 startup 들은 얼마나 많을까? 이들의 비즈니스 모델은  성공적으로 시장에 안착했을까? 대체 어떤 제품들을 가지고 창업한 곳들일까?





이런 질문에 답을 달아보고자, 투자자 - startup 매치 온라인 사이트 AngelList 에 등록된 Bioinformatics 회사들의 정보를 간략히 분석해 봤다.
( AngelList의 API 를 활용해 회사 정보를 수집 , code: https://github.com/Goldbio/AngelList_API)


Number of bioinformatics startups 
AngelList 를 통해 정보 검색이 가능한 Bioinformatics startup 수는 총 68개.
2011년 5개를 시작으로 매년 20여개 startup 이 AngelList  에 등록되어 있음을 확인할 수 있다. ( AngelList는 2010년 시작된 서비스 ) 적은 숫자 지만 2013년 까지는 꾸준히 증가하다가 2014년에는 증가세가 둔해진 듯한 양상이다. 

Location 
총 47개 지역에서 68개 Bioinformatics startup이 창업 되었고, 그 중 San francisco 소재 기업이 12개로 압도적 1위. palo alto, mountain view, sunnyvale, san jose 등 범 실리콘벨리 지역들에서도 도합 7곳 창업되어, San francisco-Silicon valley 지역에서 28%인 19곳이 창업되어, Bioinformatics startup도 실리콘벨리를 중심으로 가장 활발하게 창업되고 있음을 확인할 수 있다. 

그 이외에는 러시아 Moscow 가 3곳, 워싱턴 DC 가 2곳, 런던 2곳, 뉴욕 2곳, 그리고 최근 국가 정책으로 창업 기업들에 많은 혜택을 준다는 칠레의 Santiago 에서 2곳(Beagle Bioinformatics, Dodo Biotech Crowdfunding)이 창업 되었다. 아시아에서는 일본 도쿄의 Molcure 사가 유일하게 등록되어 있다. 



Target markets
68개 회사들의 Market tag 빈도를 계산해 보면, Bioinformatics, Biotechnology 외에 Health care, big data, healthcare information technology, synthetic biology , SaaS, genetic testing 등이 6개 이상의 회사에 매치 되며 상위에 랭크되어 있다. 

빈도에 따른 market tag 를 Word cloud 로 그려보면 아래와 같다. 

Health care, Big data, Synthetic biology, cloud computing, genetic testing, pharmaceuticals 등 이 분야 굵직한 Phrase 들이 눈에 띈다. Web development, 이전 posting에서도 언급했던 data visualization 등도 눈에 띈다.  이들을 한 문장으로 엮어 보면,
" Cloud backed, mobile & web based big genetic data analysis and visualization software for diagnostics, healthcare and pharmaceuticals " 정도로, AngelList에 등록된 Bioinformatics 회사로 창업한 곳들이 타겟팅 하는 방향이 바로 이 phrase 하나에 담겨 있다. 


Concepts 
각 회사의 'High-concept' 항목에는 회사가 추구하는 concept가 한 문장으로 짧게 요약되어 있다. NGS genome data cloud 분석 플랫폼을 제품으로 하는 DNAnexus 의 경우 'Genomics platform in the cloud ',  Genome 분석에 필요한 DB들을 API로 제공하는 SolveBio의 경우 'The Data Platform for Medicine ' 와 같은 식이다. 

이들 high-concept을 word cloud 로 그려보면 아래와 같다. 

Healthcare, data platform , genomics, sequencing 등 위의 Target market 과 크게 차이 나지 않는 단어들이 굵직하게 엮여 있는 모습이다. 하나 없었던 거라면 'Personalized' 정도인데, 위의 market tag 에서 중요한 단어 하나를 빠뜨렸다면 이 Personalized 라는 흐름이 되지 않았을까 싶다.  위에 요약된 Pharase에 이를 추가해 보면, 
" Cloud backed, mobile & web based big genetic data analysis and visualization software for personalized diagnostics, healthcare and pharmaceuticals  " 가 된다. 



Company ranking 
AngelList 가 48시간 마다 여러 지표를 집계해 회사들의 상대적 ranking을 매겨 0~10점 사이로  Quality 라는 지표를 부여한다. 이를 기준 삼은 Bioinformatics 회사들의 랭킹 top 20는 아래와 같다.  

name qual followers loc concept
DNAnexus  10 125 [mountain view]  Genomics platform in the cloud 
SolveBio  9 163 [new york, ny]  The Data Platform for Medicine 
Benchling  9 616 [san francisco]  App store for life science 
Genome Compiler  9 1205 [silicon valley]  Democratizing creation  
Maverix Biomics  8 71 [san mateo]  Next generation genomic data management, exploration, and visualization 
Synthace Limited  8 82 [london]  Applied Synthetic Biology 
One Codex  7 48 [san francisco]  Genomic search and discovery platform 
MedWhat  7 163 [palo alto]  Personal Medical Assistant providing answers to your health and medical questions. 
Syapse  7 92 [palo alto] 
3Scan  6 84 [san francisco]  Automated pathology 
Desktop Genetics  6 87 [london]  Genome editing software 
Spiral Genetics  6 294 [seattle]  The Most Accurate Bioinformatics Algorithms 
Divergent Rays Computing Inc.  5 16 [toronto]  SaaS for Technical Image Analysis Software 
Mondevices Inc.  5 21 [north bergen]  Baby Monitor in a smart button 
Indie Bio  5 46 [san francisco]  Accelerating Biology-based Startups 
Universe Ventures  5 66 [moscow] 
Prime Genomics  5 35 [san francisco]  Population screening for breast cancer through salivary samples.  
Health Heritage  4 6 [evanston]  Ancestry.com for personalized healthcare 
Simpathic  4 9 [san francisco]  Automated medical diagnosis 
T-Bio  4 14 [san francisco]  Healthcare, Heart, Authentication, Mobile, Bioinformatics 


전체 68개 회사들, 그 중 상위 20개 회사들 안에 60%인 12개가 San francisco-Silicon valley 지역 회사들이다.   회사들 concept 를 보면 다양한 product 를 만들어 내고 있는 회사들이 top 20위 안에 랭크되어 있다는 것을 확인할 수 있다.  

Cloud 기반 Genome 분석 플랫폼 회사로 Series C 까지  투자를 받고 이미 유명해진 DNAnexus 가 1위,  Genome 분석에 필요한 다양한 DB들을 API로 제공하는 SolveBio가 2위,  생명과학 연구자들이 필요로 하는 다양한 software들을 App store 개념으로 제공하는 플랫폼 Benchling 이 3위, Synthetic biology 소프트웨어를 기반으로  실험 서비스까지 제공하는 Genome compiler 가 4위, 웹기반 NGS 분석 software를 제공하는 Maverix Biomics  가 5위를 차지 하고 있다.  

이 외에도 Mammogram 보다 정교한 Saliva test로 유방암 검진 킷을 만들고 임상 연구를 진행 중인 Prime Genomics , Anchored assembly 라는 알고리즘으로 정교하게 SNP , indel, structural variation을 detection 하는 기술을 제공한다는 Spiral genetics 등 다양한 형태로 Bioinformatics 를 활용한 제품들을 만드는 Startup들이 눈에 띈다. 




Fund raising & Valuation 
기본적으로 fund raising 과 valuation 정보가 등록된 곳은 전체 68개 회사 중, 3곳 밖에 없어 전체적인 양상을 확인하거나, 회사 가치와 관련된 factor들을 분석해 내는 작업은 할 수 없었다. 구글벤처스 등을 통해 대규모 Series A,B,C 투자를 받은 DNAnexus 같은 곳도 AngelList API 정보의 fundraising, valuation 항목의 정보는 빠져 있었다.  정보가 확인되는 3곳은 fund raising, valuation 은 아래와 같다. 

회사이름, fund raising, valuation 순서 
The Hexagon Lavish , $40,500,000 , $1,954,573,892
Prime Genomics , $4,000,000 , 0 
Mondevices Inc. ,   $200,000 , $1,500,000

Hexagon Lavish 라는 곳은 4천만 달러, 우리돈 400억 이상을 투자 받고, 약 20억불 우리돈 2조원의 가치로 정보가 표기되어 있는데, Hexagon Lavish 의 홈페이지 를 확인해 보면 fund / valuation 정보는 멋대로 올려 놓은 정보라는 의심이 강하게 든다. ( 대체 뭐 하는 회사인지 모르겠다. )

400만 불 우리돈 40억을 투자 받았다는 Prime genomics 의 제품은 꾀나 흥미롭다. Breast cancer early detection 할 수 있는 saliva test kit 을 개발해 몇건의 case study를 진행하고 임상을 준비 중인 것으로 보인다. 이들 연구 결과로는 78-83% 정확도의 Mammogram 보다 이들이 제작한 saliva test 가 90% 정확도로 더 낫다는 주장. X-ray 에 노출되는 위험을 감수하는 Mammogram 보다 침 한번 뱉어서 이 보다 더 높은 정확도로 유방암 검사를 할 수 있다면 이는 분명 의미 있는 비즈니스 모델이 될 것이라 본다. FDA 심사를 통과하고 출시될 수 있을지 지켜봐야 할 일.

우리돈 2억 가량 투자 받고, 15억 가치의 Mondevices Inc.  의 제품도 재미는 있다.  이 회사의 주력 제품은 Monbaby 라는 제품으로 'Wireless sleep sensor for baby' 즉,  '무선 아기 수면 센서'다.  아기 옷에 붙여 놓으면 sensor의 position을 감지하여 아기의 수면 상태, 수면 중 자세 등을 smartphone 등으로 실시간 확인할 수 있다. ( 아래  소개 동영상  ) 



어쨌건 이 회사도 Bioinformatics 회사라기 보단 smart device, health care device 제작사로 분류되어야 할 것 같다. Mondevices의 경우  본인들의 회사 Market 을 bioinformatics, baby safety, elder care 로 써놓아 Bioinformatics 회사로 검색이 되었는데, AngelList의 Bioinformatics 회사 68 곳 중 상당수도 이렇듯 Bioinformatics 카테고리에 분류하기 어려운 회사들이 상당수 포함되어 있다는 것을 이글을 보는 독자들이 감안해야 할 것 같다. 


Take home messages 
투자 및 Valuation 정보가 거의 없어, 회사 가치에 영향을 주는 요인 분석을 못해 좀 맥이 빠진 분석으로 AngelList 등록된 Bioinformatics startup 분석을 마무리 한다. 

한가지 핵심적인 건, '다양성'. 기존의 비즈니스 모델을 답습하는 곳은 찾기 어렵고, Bioinformatics 기술을 바탕으로 다양한 domain의 다양한 문제를 푸는 application을 만들어 창업하는 곳이 대부분을 차지한다.  시장도 담보 되지 않고, 매출도 확보되지 못하는 상황에서도 끊임없이 이런 회사들이 실리콘벨리 지역을 중심으로 나올 수 있는 건, 이들의 가능성을 믿고 generous 하게 투자하는 투자 환경과 software 등 지식기반제품 들을 '제 값'을 주고 구매 하는 문화가 깔려 있기 때문이 아닐까?

벤처 환경이 열악하고, 더군다나 시장의 규제로 숨이 턱턱 막히는 한국에서 실리콘벨리 처럼 다양한 Bioinformatics startup이 나오고, 성공적으로 성장하길 기대하기는 무리고, 불가능에 가깝다. 그저 한국에선 Fast follower 가 답.