Showing posts with label Research of interest. Show all posts
Showing posts with label Research of interest. Show all posts

Monday, December 29, 2008

I'm not a scientist, I'm a number!

plos comput. perspective :http://www.ploscompbiol.org/article/info%3Adoi%2F10.1371%2Fjournal.pcbi.1000247

Ten simple rules series를 쓰던 Phillip bourne이
Perspective article을 하나 썼다. 이 글 제목이
바로 그 글의 제목인데,

이 글에선 일종의 과학자 '평가' 시스템을
openID 를 통해 기존의 논문에 국한하지
않고 전 'web' 활동 범위로 확대하자는
idea를 설명하고 있다.

과학자 impact factor =
H factor ( 기존의 paper based impact factor)
+ ( #{Grant/Review editor}/20 )
+ ( #{Annotation/software/Dataset}/5 )
+ ( # Web factor /50 )

과 같은 수식을 사용하여 블로그 글에 달린
답글이 50이 넘을 때 마다 1씩 researcher factor
를 주고, 논문 에디터도 20번 이상이면 1씩,
소프트웨어나 데이터셋 public 에 공개 등도
5회 이상이면 1씩 이 팩터를 증가시키는
방식으로 과학자의 전방위 활동에 대한
scoring을 할 수 있다는 것이다.

이런 식의 web-based author , paper,
software, dataset 등에 대한 파급효과
scoring은 필요에 따라 우리도 다양하게
시도해 볼 수 있는 것 같다.

최근에 나도 GEO에 있는 micorarray
dataset에 대한 impact size scoring
을 google scholar를 이용해 시도한
적이 있다. 데이터셋이 얼마나 커뮤니티에
파급효과가 있었는지를 그 데이터를
쓴 논문에 대한 citation, cite한 논문에
대한 citation, ... 로 citation의 propagation
을 쭉 따라가며 scoring을 할려고 했는데,

google scholar가 web scrapping robot
program에 대해 접근을 차단하는 정책을
써서 개발을 중단한 상태다.

이 문제를 해결할 수 있는 아이디어가 있는 분들의
답글 기대하면 좋겠는데,내 블로그를 구독하는

사람이 거의 없어서 ㅜㅜ

Tuesday, July 10, 2007

Top journal의 article은 뭐가 특별한가?

얼마 전 내 관심 분야인 protein evolution에 관해 발표된 논문을 읽었다. (Science,314,1938,2006) 논문의 핵심은 protein interaction network의 topology와 특성들은 protein structure와 밀접한 연관이 있다는, 어떻게 보면 당연한 내용을 재탕한 것에 지나지 않는다.

Protein interaction network의 hub protein들은 interaction type에 따라 party hub와 date hub로 나뉘는데, 이 때 party hub는 protein complex 처럼 함께 interaction하며 존재하고 기능하는 protein들이고, date hub는 cell signalling의 hub protein으로 기능하여 여러가지 protein들과 시간과 장소에 따라 interaction하는 protein이다.

여기에 더해 이전까지 리포팅 된 내용은 party hub와 date hub의 evolution rate의 차이, protein network과 관계된 내용은 아니지만, protein structure의 특성과 evolution rate의 관계 정도 였다.

내 석사 졸업 논문도 바로 이 protein structure 특성과 evolution rate의 관계에 관한 further study였고, 이 점이 또한 이 science 논문에 관심을 증폭시킨 원인이기도 하다.

논문을 읽으면서 난 당연하지... 당연하지... 를 연발했는데, 이 topic에 관심있는 연구자라면 누구나 그런 반응을 기대할 수 있을 만큼 당연한 연구에 당연한 결론이었기 때문이다. 그런데 어떻게 이 논문이 science에 게재될 수 있었을까?

나름대로 의견을 제시해 보자면,

첫째, Gerstein 이라는 protein network 연구의 대가 랩에서 행해진 연구라는 것
둘째, 누구나 알고 있는 and 이미 밝혀진 두 가지 topic을 통합하여 새로운 insight를 제공할 수 있는 연구라는 것 정도가 될 것 같다.

두번째 이유보다는 당연히 첫번째 이유가 Big journal publish에 중요함은 다시 말할 필요가 없을거다. 만약 내가 같은 논문을 써서 science에 submit 했다면 당연히 reject되었을 거고, 논문의 quality로 보자면 Bioinformatics, Plos computational biology, NAS 회원의 도움이 있다면 PNAS 정도가 maximum이지 않았을까...

개인적으로 top journal에의 출판을 별로 중요하게 생각하진 않지만, publication list가 나중의 사회적, 경제적 위치의 결정에 관여하는 한국 사회에 살고 있다보니 이런 문제에 관심이 가는건 어쩔 수 없다.

Wednesday, April 18, 2007

Role of CNEs

Conserved noncoding elements (CNEs) 는 지놈 서열 상에
보존된 서열들의 대부분을 차지하지만, 그 기능에 대해서는
거의 알려진 것이 없었다. 실험을 통해 알려진 바로는
gene regulation에 관여한다는 것이 알려져 있지만,
어떤 mechanism을 통해 어떻게 이런 기능을 하는지에
대해서는 역시 아직까지 밝혀진 바가 없었다.

MIT의 Broad Institute의 연구진들은 이들 CNE의
역할을 규명하려는 일련의 실험을 진행하였다.
( http://www.pnas.org/cgi/reprint/0701811104v1)

먼저 CNE 중 비교적 긴 motif (12-22nt)를 찾아내었는데,
이렇게 얻어진 CNE motif는 총 233개, 전체 CNE의 개수는
human genome에서 60,000개에 달했다고 한다.

이어 연구진은 이들 motif의 역할을 실험적으로 규명했는데,
RFX1 protein family가 가장 conservation이 강한 CNE motif와
결합한다는 사실, gene activation을 제한하는 insulator 기능을 가진
CTCF protein의 결합 부위를 결정한다는 사실을 밝혀내었다.
또한 CTCF protein 결합 부위에 의해 분리된 인접 유전자들은
gene expression이 감소되는 경향이 있음을 확인했다.

CTCF protein에 의해 분리된 유전자의 단위들이 gene expression의
발현 정도를 조절하는 잣대가 된다면, 이를 통한 상대적 발현 정도의
차이를 예측하는 시스템의 구축이 가능할 것이고, gene expression
도 protein domain 처럼 묶어 각각의 기능적 특성들을 이해하고 분류하는
일련의 과정들도 가능해 질 것이라 본다.

Microarray 를 통한 gene expression 연구 또한 새로운 insight를
가질 수 있을 것 같다. 무조건 DEG들이 중요한 것들이라기 보다는
어떤 gene context에 속해 어느 정도의 expression을 가질 것인가
라는 맥락 속에서 얼마나 다른 발현 정도를 가져왔느냐가 핵심이
되어야 할 것이다.