Wednesday, July 23, 2008

Silhouette Coefficient

Silhouette coefficient : Clustering evalution 에 널리 사용되는 방법으로 개개의 element에 대한 clustering quality를 측정하는 척도가 된다.

Clustering 결과 각 element의 distance 분포가 아래 그림과 같다고 한다면,


붉은색 element ( ith element )에 대한 silhouette coefficient는 아래와 같은 순서로 구한다.
1. 같은 cluster 안의 모든 element와의 거리의 평균 A(i) 를 구한다.
2. ith element 를 포함하지 않은 다른 모든 cluster 안의 element에 대해, ith element와 가장 가까운 element와의 거리 B(i) 를 구한다.
3. Silhouette coefficient S(i)= (B(i)-A(i)) / max(A(i),B(i))