[Back propagation] 역전파

DS | Data Science/ML | Machine Learning

[Back propagation] 역전파

_껀이_ 2022. 9. 21. 19:36

728x90

신경망은 선형모델(linear model)과 활성함수(activation function)을 합성한 함수로 구성된다.

이렇게 구성된 신경망을 겹겹이 쌓으면 다층 퍼셉트론(Multi-Layer Perceptron:MLP)이 되며, 머신러닝 모델의 기본이 된다.

위의 MLP 예시 이미지에 나타난 것과 같이 화살표 방향으로 데이터가 흐르며 계산이 되고 이를 순전파(Forward Propagation)이라고 한다.

순전파는 input 데이터가 output 데이터로 변환되는 과정을 말하며, 이것만 가지고는 모델이 학습이 되지 않기 때문에 모델이 가진 선형방정식을 업데이트해야한다. 이때 업데이트가 되는 방향은 순전파 방향의 반대 방향이 되고 이를 역전파(Back propagation)이라고 한다.

1. 역전파 : Back Propagation

역전파는 레이어에 있는 선형방정식과 활섬함수의 gradient를 계산해서 업데이트하게 된다.

각각의 레이어에서 계산된 gradient를 계산하여 가장 상층 레이어부터 시작레이어까지 chain rule을 통해 그레디언트 벡터를 전달하게 된다.

이를 통해 매 학습 스텝마다 W, b의 값을 업데이트하면서 모델이 학습된다.

참고자료 : 네이버부스트캠프 AI Tech 강의자료

728x90

저작자표시 비영리 변경금지 (새창열림)

'DS | Data Science > ML | Machine Learning' 카테고리의 다른 글

[RNN] Recurrent Neural Network : 순환신경망 (2)	2022.09.23
[CNN] Convolutional Neural Network : 합성곱 신경망 (1)	2022.09.23
[Gradient Descent & Gradient ascent] 경사상승법 & 경사하강법 (1)	2022.09.21
지도학습 Supervised Learning / 비지도학습 Unsupervised Learning / 강화학습 Reinforcement Learning (0)	2022.07.15
Neural Network basic - NN, Gradient Descent, Error Back Propagation은 무엇일까? (0)	2022.07.15

현재글[Back propagation] 역전파

ML Engineer

250x250

코딩테스트, 네이버커넥트, 딥러닝, 추천시스템, 수학, 선대, 부스트캠프, recommender system, recsys, 4기, 프로그래머스, 앱만들기, 프로그래머스 고득점 kit, AI_Tech, linear algebra, 선형대수, Flutter, recommendation system, 선형대수학, ML,

Today :
Yesterday :

일	월	화	수	목	금	토
					1	2
3	4	5	6	7	8	9
10	11	12	13	14	15	16
17	18	19	20	21	22	23
24	25	26	27	28	29	30
31

내 블로그 - 관리자 홈 전환	`Q` `Q`
새 글 쓰기	`W` `W`

글 수정 (권한 있는 경우)	`E` `E`
댓글 영역으로 이동	`C` `C`

이 페이지의 URL 복사	`S` `S`
맨 위로 이동	`T` `T`
티스토리 홈 이동	`H` `H`
단축키 안내	`Shift` + `/` `⇧` + `/`

日日 Deep 每日 Learning