M.L (p.201)
MNIST 데이터셋으로 본 Adam, SGD, AdaGrad, Momentum 네가지 학습을 비교해본 것이다.
학습률과 신경망의 구조 등에 따라 결과가 달라진다는 점 주의.

SGD보다 다른 세 기법이 빠르게 학습하는 것을 볼 수 있다.
MNIST 데이터셋으로 본 Adam, SGD, AdaGrad, Momentum 네가지 학습을 비교해본 것이다.
학습률과 신경망의 구조 등에 따라 결과가 달라진다는 점 주의.

SGD보다 다른 세 기법이 빠르게 학습하는 것을 볼 수 있다.