저번 글에서는 경사하강법의 가장 원초적인 방법과 수식에 대해서 알아보았다.하지만원초적인 경사하강법에서는 local minima 문제가 있다는 것을 알게 되었고이 local minima 문제를 해결하기 위해 다양한 경사하강법 기법이 등장하게 되었다. 위 사진은 다양한 경사하강법 기법에 대해서 간단히 정리한 것이다.이 글에서는 우리가 많이 사용할 SGD와 Adam을 설명할 것이고Adam의 이해를 위한 Momentum, Adagrad, RMSProp 또한 설명할 것이다. SGD는 전체 데이터 셋을 보고 방향을 정하는 GD와 다르게 전체 데이터의 일부 mini-batch 데이터를 보고 방향을 정하는 기법이다.작은 데이터에 대해서 처리하기 때문에 처리 속도가 빠르며 부정확한 방향으로 갈 수 있지만 이러한 부정확한..