반응형

교차 검증

홀드 아웃 검증

학습 결과로 식별이 얼마나 잘 되었는가는 데이터 세트를 나눠서 검증할 수 도 있다 .

훈련 데이터 

테스트 데이터  평가와 검증에 사용

 

20211219

홀드 아웃 검증(holdout method)

데이터를 훈련 데이터와 테스트 데이터로 나눈 후 테스트 데이터를 사용하지 않는 검증 방법입니다. 

테스트 데이터는 사용했을 때의 정밀도를 평가해 성능을 판단합니다 .보통 교차 검증에는 사용하지 않습니다 .

 

k-겹 교차 검증 k-fold cross-validation

데이터 K개의 그룹으로 나눈 후 그룹 하나를 제외한 나머지 데이터를 훈련 데이터로 설정합니다. 

사용하지 않은 하나의 그룹에서는 테스트를 실행합니다. 

테스트 데이터에서 얻은 정밀도에 평균과 표준 편차를 구하는 것으로 평가를 실행합니다. 

k는 5~ 10으로 설정할때가 많습니다. 

 

LOOCV leave-ont-out  cross-validation

K겹 교차 검증에서 K가 데이터 개수와 같을 때를 뜻합니다. 

데이터 수가 적을 때 사용합니다. 

 

 

 

 

출처 : 처음 배우는 인공지능

반응형

'개념 정리' 카테고리의 다른 글

전이 학습_20211224  (0) 2021.12.28
앙상블 학습_20211221  (0) 2021.12.20
ROC 곡선_20211218  (0) 2021.12.18
랜덤 포레스트_20211217  (0) 2021.12.18
ID3_20211216  (0) 2021.12.16
반응형

ROC 곡선 

Receiver Operating Characteristic curve

식별 모델의 성능을 평가하는 방법입니다. 

ROC 는 제 2차 세계 대전 때 수신된 레이더 신호에서 적 전투기를 찾으려는 미국의 레이더 연구에서 탄생한 개념입니다. 

데이터의 정답(양성 positive과 음성 negative) 결과 세트와 식별 결과 세트를 준비해 혼동행렬 confusion matrix를 만듭니다. 

혼동행렬 표는

TP True Positive   

FN False Negative 

FP False Positive  

TN True Negative 

 

정밀도 precision 

재현율 recall

f 값 f measure

 

 

출처 : 처음 배우는 인공지능

반응형

'개념 정리' 카테고리의 다른 글

앙상블 학습_20211221  (0) 2021.12.20
교차검증_20211220  (0) 2021.12.18
랜덤 포레스트_20211217  (0) 2021.12.18
ID3_20211216  (0) 2021.12.16
서포트 벡터 머신_20211214  (0) 2021.12.16
반응형

랜덤 포레스트

무작위로 뽑은 데이터를 이용해 학습하면서 많은 결정 트리를 구축하면 의사 결정 트리를 만들 때마다 결정 트리 구성을 약간씩 변화시킵니다. 

최종 단계에서 구축한 결정 트리 중 최적의 결정 트리를 선택합니다. 

 

출처 : 처음 배우는 인공지능

반응형

'개념 정리' 카테고리의 다른 글

교차검증_20211220  (0) 2021.12.18
ROC 곡선_20211218  (0) 2021.12.18
ID3_20211216  (0) 2021.12.16
서포트 벡터 머신_20211214  (0) 2021.12.16
자기조직화지도  (0) 2021.12.13
반응형

ID3:

정답 데이터를 이용해 결정 트리를 만드는 알고리즘의 하나로 ID3가 있습니다. 

ID3는 의사 결정 트리를 기반으로 모든 데이터를 제대로 분류할 때까지 노드를 추가합니다 .

이때 데이터를 제대로 분류하는 결정 트리는 여러 개가 나올 수 있지만 분류 효율성과 의사 결정 트리의 일반성을 고려해 최대한 단순한 형태가 되는 것을 목표로 합니다. 

 

만드는 방법:

1. 집합 A안의 데이터가 모두 같은 클래스에 속하면 해당 클래스의 노드를 만듭니다. 

2. 집합 A에서 속성을 하나 선택(특성 B)해 식별 노드를 만듭니다 .

3. 속성 B의 속성 값에 따라 집합 A를 부분 집합으로 나누고 각각의 자식 노드를 만듭니다. 

4. 지식 노드 각각에 1~ 3번을 재귀적으로 반복합니다. 

 

출처 :  처음 배우는 인공지능

 

반응형

'개념 정리' 카테고리의 다른 글

ROC 곡선_20211218  (0) 2021.12.18
랜덤 포레스트_20211217  (0) 2021.12.18
서포트 벡터 머신_20211214  (0) 2021.12.16
자기조직화지도  (0) 2021.12.13
독립 성분 분석  (0) 2021.12.13
반응형

서포트 벡터 머신

Support Vector machine, SVM

데이터 분포를 나누는 기준을 결정하는 지도학습 모델 중 하나입니다 .

어떤 패턴으로 데이터를 분류한 후 데이터 사이의 거리에 따라 어떤 카테고리에 속할것인지 판단하는데 중점을 둡니다. 

다층 퍼셉트론 같은 신경망을 이용한 데이터 분류와 비슷합니다. 

비선형 식별함수를 만드는데 

 

서포트 벡터: 마진 영역의 가장 자리에 해당하는 위치에 있는 데이터

마진 영역: 서포트 벡터와 식별 함수 사이의 공간을 마진 영역이라고 합니다. 

 

라그랑주 승수법: Lagrange multiplier method"

 

 

 

출처 : 처음 배우는 인공지능

반응형

'개념 정리' 카테고리의 다른 글

랜덤 포레스트_20211217  (0) 2021.12.18
ID3_20211216  (0) 2021.12.16
자기조직화지도  (0) 2021.12.13
독립 성분 분석  (0) 2021.12.13
특잇값 분해_20211213  (0) 2021.12.13
반응형

자기조직화지도

Self Organization MAP, SOM

신경망을 이용한 자율학습은 주어진 입력 데이터로 학습해 일관성 있게 변화한다는 자기조직화에 기반을 둡니다. 

그래서 자율 학습의 출력 결과를 이용해 클러스터 분석한 것은 자기 조직화와 연관이 커서 자기조직화지도 라고 합니다. 

입력 벡터를 이용해 데이터의 거리를 계산한 후 어떤 지도를 만드는 훈련과 훈련 결과에 따라 데이터의 연결 강도를 자동으로 재조정하는 매핑으로 나뉩니다. 

 

출처 : 처음 배우는 인공지능

반응형

'개념 정리' 카테고리의 다른 글

ID3_20211216  (0) 2021.12.16
서포트 벡터 머신_20211214  (0) 2021.12.16
독립 성분 분석  (0) 2021.12.13
특잇값 분해_20211213  (0) 2021.12.13
t-SNE_20211212  (0) 2021.12.13
반응형

독립 성분 분석

Independent Composition Analysis CIA

한 걸음 더 나아가 통계 독립성을 극대화하는 예측 성분을 찾는 것

제거할 수 없는 데이터를 다루는데 목적을 둡니다. 

비가우스성을 계산합니다. 

 

출처 : 처음 배우는 인공지능

반응형

'개념 정리' 카테고리의 다른 글

서포트 벡터 머신_20211214  (0) 2021.12.16
자기조직화지도  (0) 2021.12.13
특잇값 분해_20211213  (0) 2021.12.13
t-SNE_20211212  (0) 2021.12.13
주성분 분석_2021121  (0) 2021.12.13
반응형

특잇값 분해

Sigular Value Decomposition SVD

주성분을 분석할 때는 행렬로 데이터를 나타낸 후 공분산행렬을 계산해 고윳값과 고유 벡터를 구합니다. 

 

 

출처 : 처음 배우는 인공지능

반응형

'개념 정리' 카테고리의 다른 글

자기조직화지도  (0) 2021.12.13
독립 성분 분석  (0) 2021.12.13
t-SNE_20211212  (0) 2021.12.13
주성분 분석_2021121  (0) 2021.12.13
클러스터 분석_20211208  (0) 2021.12.09

+ Recent posts