목록GMM (1)
On the journey of
[자진프] 클러스터링
클러스터(cluster)라는 말은 일단 '부분집합'을 의미한다. 즉 원 데이터를 부분집합으로 쪼개는 것을 의미하는 것. 쪼개는 기준이 다양한 만큼 알고리즘 종류도 다양하다. K-MEANS Clustering K-Means는 제일 유명한 알고리즘이다. 제일 먼저 원 데이터 상에서 클래스(그룹)를 선택한 후, 각 데이터 분포(점으로 표시되는) 와 그룹 간의 거리를 계산하여 분류하게 된다. 복잡도는 O(n)이나, 무작위 선택으로 시작하기 때문에 결과 상 일관성이 부족할 수 있다(실행할 떄마다 클러스터링 결과가 다를 수 있다). K-Means와 유사한 알고리즘으로 K-Medians가 있는데 평균이 아닌 '그룹의 중앙벡터'를 사용한다는 점에서 차이가 있다. Median 벡터를 계산하게 되면 반복 시 이상치에는 덜..
학교 프로그램
2023. 9. 29. 08:12