반응형

머신러닝

unsupervised learning

 

K-means algorithm

군집화 문제를 풀기 위한 자율 학습 알고리즘의 일종입니다.

이 알고리즘은 간단한 방법으로 주어진 데이터를 지정된 군집(cluster) 개수 (K)로 그룹화합니다 

한 군집 내의 데이터들은 동일한 성질을 가지며 다른 그룹과는 구별됩니다.

즉 한 군집 내의 모든 원소들은 군집 밖의 데이터보다 서로 더 닮아 있습니다.

 

centroid  -> k개의 점

이들은 각기 다른 그룹의 중심점을 나타내며 데이터들은 K개의 군집 중 하나에만 속할 수 있다.

한 군집 내의 모든 데이터들은 다른 어떤 중심들보다 자기 군집 중심과의 거리가 더 가깝습니다. 

 

초기단계 (0단계): K 개 중심의 초기 집합을 결정

할당단계 (1단계): 각 데이터를 가장 가까운 군집에 할당

업데이트 단계 (2단계) : 각 그룹에 대해 새로운 중심을 계선

 

20211209

k-평균 알고리즘

k-means 알고리즘

1. 우선 전체를 k개의 그룹으로 나눕니다. 

2. 각 점에 무작위로 그룹을 할당한 다음 그룹 각각의 중심(보통은 무게 중심)과의 (유클리드 거리 등)를 계산합니다. 

3. 어떤 그룹에 속해 있는 점이 다른 그룹과 거리가 더 가깝다면 해당 점을 거리가 가까운 그룹으로 변경합니다. 

4. 이러한 작업을 반복해서 가까운 점 끼리 묶어 k개의 그룹으로 나눕니다. 

 

20211210

중심점만 기준으로 삼다가 잘못 된 그룹으로 할당할 수 있는 문제나 계산 시간이 길어지는 등의 문제가 있습니다 

최초에 정하는 K값은 감으로 결정할 때가 많지만 계산으로 구해서 결정할 수 도 있다 .

K를 결정할 때는 혼합 디리클레 모델을 사용합니다. 

베이즈 모델 기반의 접근 방식으로 디리클레 분포가 다항분포의 결합 사전분포라는 점을 이용합니다. 

 

출처 :

텐서플로 첫걸음

처음 배우는 인공지능

반응형

'개념 정리' 카테고리의 다른 글

활성화함수_20210916  (0) 2021.10.11
MNIST 데이터셋_20210915  (0) 2021.10.07
학습률_20210913  (0) 2021.10.07
경사하강법_20210912  (0) 2021.10.06
평균제곱오차_20210911  (0) 2021.10.06

+ Recent posts