ANN의 가장 기본적인 형태로 노드 또는 레이어 간의 연결이 한 방향으로만 이어져있다. hidden layer와 model input의 차원이 다르기 때문에 두 개의 선형 변환 ), 로 표현되며 다음과 같이 쓸 수 있다.
Position-Wise FFN
개별적인 embedding vector 단위로 FFN의 연산을 수행한다.
Oct 25, 2024, 1 min read
ANN의 가장 기본적인 형태로 노드 또는 레이어 간의 연결이 한 방향으로만 이어져있다. hidden layer와 model input의 차원이 다르기 때문에 두 개의 선형 변환 W1=(dmodel,dffn), W2=(dffn,dmodel)로 표현되며 다음과 같이 쓸 수 있다.
σ:activation functionFFN(x)=σ(xW1+b1)W2+b2개별적인 embedding vector 단위로 FFN의 연산을 수행한다.