반응형

LSTM

Long Short-Term Memory

순환 신경망은 거슬러 올라가는 단계 수가 많아지면 기울기 소실 문제 때문에 제대로 학습할 수 없습니다. 

이 문제를 개선하는 것이 LSTM입니다. 

LSTM은 신경망의 중간 계층에서의 각 유닛을 LSTM 블록이라는 메모리 유닛으로 치환한 구조입니다. 

LSTM 블록에는 입력 게이트 , 망각 게이트 출력 게이트 라는 세가지 게이트가 있으며 메모리 셀에 저장된 1단계 이전의 상태를 망각 게이트에 참조(요소곱)합니다. 

그리고 입력 게이트와 망각 게이트를 잘 여닫으면서 출력을 조정합니다. 

 

출처 : 처음 배우는 인공지능

반응형

'개념 정리' 카테고리의 다른 글

컴퓨터 비전  (0) 2022.01.10
패턴 인식  (0) 2022.01.07
완전 연결 계층  (0) 2022.01.05
스파스 코딩_2021014  (0) 2022.01.05
오토인코더_20220103  (0) 2022.01.03

+ Recent posts