Tuesday, November 25, 2008

Gene expression related papers of interests

Gene expression 과 관련한 각 토픽들에 대한 reading list 를 정리하는 포스팅이다.
향후 논문 writing 때 필요한 reference paper로 이용할 목적도 있고, 전반적으로
gene expression과 관련한 연구에 대한 overview를 그려보기 위한 목적도 물론 포함된다.
List는 꾸준히 업데이트 될 예정이다.


Gene expression and protein expression


Gene expression and evolution



Co-expression and protein-protein interaction

Expression profile based classifier

Wednesday, November 19, 2008

Efficient calculation of Correlation coefficient

Pearson's correlation coefficient 를 구하는 공식은 아래와 같이 표현된다.





이 때, 아래와 같이 x, 와 y의 element 각각에 대한 Z-score로 변환하면,




Correlation coeffient 구하는 수식은 새로운 벡터 X와 Y의 곱으로 간단하게 아래와 같이 표현될 수 있다.






Reference : Genome Research, 12, 37

Monday, November 17, 2008

Axis lableling in R

R을 이용해 plotting 하다보면 x,y 축의 label을 default 조건이 아닌,
자신이 원하는 label로 바꾸어 plotting 해야할 때가 생긴다.



>a=1:5
>b=c(1,5,10,50,100)
>plot(a~b,type='l')



위의 plot은 x 축을 b로 하여 대응되는 a의 값을 y축에 나타낸 것이고,
하등의 문제가 없지만, 경우에 따라서는 x축의 단위를 b의 데이터 단위와
일치하게 출력해야할 때가 있다.

다시 말해 b의 데이터 포인트 1,5,10,50,100이 default 옵션에서는
0부터 100단위로 표시된 x 축 위에 5개의 포인트가 숫자 그대로의
스케일로 표현된다. 그러나 이 5개의 데이터 포인트 간의 거리가
표현되기 보다는 각각이 discret 하게 독립적으로 서로 비교가
될 수 있게 같은 거리 상에 표현할 필요가 있을 때가 있는 것.

이럴 때는 아래와 같이 plot의 axes 옵션 그리고 axis 함수를 사용하여
문제를 해결할 수 있다.


>plot(a,type='l',axes=F)
>axis(1,1:5,b)
>axis(2)
>box()