Tuesday, April 3, 2007

Frequently used commands in R

Download package

>install.packages('package name')

For bioconductor package

>source('http://www.bioconductor.org/biocLite.R')
>biocLite('package name')

Reading data

read.table 옵션
row.names=1이면 첫번째 column의 row값이 row name이 된다.

Glimpse of data

>str(data)
>summary(data)
>print(data)

Divide plotting space

>par(mfrow=c(n,m))
nXm 행렬 형태로 plotting 공간을 나눈다.

Distribution model

[rpq][normpoisbinomunif]
각 distribution 에 따라 random generator, cumulative robability, deviate fo currespond cumulative probability.

Length of column and raw of matrix

>nrow(matrix) ; matrix의 row 개수 반환
>ncol(matrix) ; marix의 column 개수 반환

>dim(matrix) ; matrix의 row와 column 반환

>length(matrix) ; matrix의 전체 길이 반환 ( matrix 형 data 인 경우, is.matrix()로 판정 or class())

Boxplot

header가 없는 matrix의 boxplot은 모든 데이터를 하나의 column으로 간주하는데, 이 때 각 column에 대한 boxplot을 그리려면

>boxplot(matrix~col(matrix))