Attention

    [Deep Learning] Attention 메커니즘

    [Deep Learning] Attention 메커니즘 Attention Mechanism 이란? 기존의 RNN, 즉 recurrent model에서는 문장의 순차적 특성을 유지한다. 하지만, 두 정보 사이의 거리가 멀 때 해당 정보를 이용하지 못하는 문제가 발생한다. 이 문제는 Long-term dependency problem라고 한다. 다시말해 recurrent model은 학습 시 t번째 hidden state를 얻기 위해 t-1번째 hidden state가 필요하다(=과거 정보를 이용한다.) 즉, 순서대로 계산되어야 하기 때문에 병렬 처리가 불가능하고 속도라 느리다(Parallelization). 이를 해결하기 위한 방법인 Attention이란, 모델이 중요한 부분에 집중(attention)하게..