[DAY4] AI math 5. 딥러닝 학습방법 이해하기 신경망 neural network =perceptron 선형모델은 단순한 데이터에서는 가능하지만 복잡한 문제에서는 성능이 부족하다. 복잡한 문제에 대응하기 위해서 신경망을 사용한다. 신경망은 비선형모델이다. 선형모델이 숨겨져 있고 선형모델과 비선형함수의 결합으로 이루어져 있다. 비선형모델은 밑에 설명할 활성함수이다. $X$ 데이터들로 이루어진 행렬 (n*d) 한 점으로 표현됨 $W$ 가중치 행렬(d*p) 데이터를 다른 데이터 공간으로 보내는 역할을 한다 $b$ y절편에 해당하는 행벡터 1 (1*p) 개를 n개의 행렬만큼 늘려놓은 행렬(n*p) 각 행들이 전부 같은 값을 같게 된다. $O$ 출력 (n*p) 원래 데이터는 d차원이었는데, 출력을 하게 되면서 p차원으로 바뀌게 된다 $$\textbf{O = X.. 이전 1 다음