머신러닝
unsupervised learning
K-means algorithm
군집화 문제를 풀기 위한 자율 학습 알고리즘의 일종입니다.
이 알고리즘은 간단한 방법으로 주어진 데이터를 지정된 군집(cluster) 개수 (K)로 그룹화합니다
한 군집 내의 데이터들은 동일한 성질을 가지며 다른 그룹과는 구별됩니다.
즉 한 군집 내의 모든 원소들은 군집 밖의 데이터보다 서로 더 닮아 있습니다.
centroid -> k개의 점
이들은 각기 다른 그룹의 중심점을 나타내며 데이터들은 K개의 군집 중 하나에만 속할 수 있다.
한 군집 내의 모든 데이터들은 다른 어떤 중심들보다 자기 군집 중심과의 거리가 더 가깝습니다.
초기단계 (0단계): K 개 중심의 초기 집합을 결정
할당단계 (1단계): 각 데이터를 가장 가까운 군집에 할당
업데이트 단계 (2단계) : 각 그룹에 대해 새로운 중심을 계선
20211209
k-평균 알고리즘
k-means 알고리즘
1. 우선 전체를 k개의 그룹으로 나눕니다.
2. 각 점에 무작위로 그룹을 할당한 다음 그룹 각각의 중심(보통은 무게 중심)과의 (유클리드 거리 등)를 계산합니다.
3. 어떤 그룹에 속해 있는 점이 다른 그룹과 거리가 더 가깝다면 해당 점을 거리가 가까운 그룹으로 변경합니다.
4. 이러한 작업을 반복해서 가까운 점 끼리 묶어 k개의 그룹으로 나눕니다.
20211210
중심점만 기준으로 삼다가 잘못 된 그룹으로 할당할 수 있는 문제나 계산 시간이 길어지는 등의 문제가 있습니다
최초에 정하는 K값은 감으로 결정할 때가 많지만 계산으로 구해서 결정할 수 도 있다 .
K를 결정할 때는 혼합 디리클레 모델을 사용합니다.
베이즈 모델 기반의 접근 방식으로 디리클레 분포가 다항분포의 결합 사전분포라는 점을 이용합니다.
출처 :
텐서플로 첫걸음
처음 배우는 인공지능
'개념 정리' 카테고리의 다른 글
활성화함수_20210916 (0) | 2021.10.11 |
---|---|
MNIST 데이터셋_20210915 (0) | 2021.10.07 |
학습률_20210913 (0) | 2021.10.07 |
경사하강법_20210912 (0) | 2021.10.06 |
평균제곱오차_20210911 (0) | 2021.10.06 |