Tuesday, May 29, 2007

DEG finding in R

1. T-test

Gene A 100 120 300 500

와 같이 A에 대해 normal sample(검은색)과 control sample(붉은색)의 expression data가 있고, 이를 바탕으로 A gene이 control 환경에 specific 하게 up or down regulation되었는지를 t-test를 통해 알아보고자 한다면, Two sample t-test를 쓴다.

http://www.biomedcentral.com/content/inline/1471-2105-6-199-i8.gif'>

> a=c(100,120,300,500)
>t.test(a[1:2],a[3:4])

M x N의 microarray data matrix에서 column 1:4가 normal 5:8이 control이고 M개의 gene의 t-test를 계산한다면,

>for(i in 1:nrow(matrix))
>{
>value<-t.test(matrix[i,1:4],matrix[i,5:8])
>result[i]=value$p.value
>}

각 gene의 t-test 결과 p-value가 result에 저장된다.