728x90
반응형
선행 학습
pre-training:
다층 네트워크는 기울기 소실 문제가 발생해 학습이 제대로 되지 않을 때가 있습니다.
계층을 깊게 할 수록 그 경향이 더 두드러집니다.
가중치 매개변수의 초깃값을 무작위로 결정하는 것도 원인 중 하나입니다.
이를 해결하는 방법으로 선행학습이 있습니다.
선행 학습은 다층 네트워크를 입력 받은 순서대로 제한 볼츠만 머신 같은 두 계층의 네트워크로 분리(오토인코드로 설정)합니다.
출처 : 처음 배우는 인공지능
반응형
'개념 정리' 카테고리의 다른 글
오토인코더_20220103 (0) | 2022.01.03 |
---|---|
심층 신뢰 신경망_20220102 (0) | 2022.01.03 |
볼츠만 머신_20211231 (0) | 2021.12.31 |
데이터 정규화_20211230 (0) | 2021.12.30 |
확률적 경사 하강법_20211229 (0) | 2021.12.30 |