[Deep Neural Network] part 1 - 2
๐ง๐ป๐ป์ฉ์ด ์ ๋ฆฌ
Deep Neural Network
multi-layer perceptron
sigmoid
MNIST
MSE error
logistic regression
Forward Propagation
- multi-layer perceptron์์ ์ด ์์ฐจ์ ์ธ ๊ณ์ฐ๊ณผ์ ์ ๋ํ๋ด๋ forward propatation
๋ด๋ฐ์ ์ ๋ ฅ์ผ๋ก ์ฃผ์ด์ง๋ vector๋ฅผ column vector๋ก ๋ง๋ค๊ณ , ์ด ๋ด๋ฐ์ด ๊ฐ์ง๋ ๊ฐ์ค์น๋ฅผ row vector๋ก ๋ง๋ค๋ฉด ํ์ด์ ๋ด์ ํํ๋ก ๊ฐ์คํฉ์ ๋ํ๋ผ ์ ์์ต๋๋ค.
์์ ๊ฐ์ด ๊ณ์ฐ์์์ ํ์ต์ ์ฉ์ดํจ์ ํ์๋ก ํ๊ธฐ ๋๋ฌธ์, ์ด๋ฌํ ํ์ฑ ํจ์๋ฅผ ์ฌ์ฉํ๊ฒ ๋ฉ๋๋ค.
์ Activation function์ sigmoid or logistic function์ด๋ผ๊ณ ๋ถ๋ฆฌ๊ฒ ๋ฉ๋๋ค.
์์ ๊ฐ์ด ์ ํ ๊ฒฐํฉ๋ ๊ฐ์ด Activation function์ ํต๊ณผํ์ฌ ์ต์ข ์ ์ธ Output ๊ฐ์ ๋ง๋ค์ด๋ด๊ฒ ๋๊ณ ,
์์ ๊ฐ์ discreteํ ๊ฐ์ด ์ถ๋ ฅ์ธ Hard-Threshold function๊ณผ ๋ฌ๋ฆฌ ์ sigmoid function์ 0๊ณผ 1 ์ฌ์ด์ ์ค์๊ฐ์ ์ถ๋ ฅ์ผ๋ก ๋ด์ด์ค๋๋ค.
Output noded์ธ ์ถ๋ ฅ ๋ด๋ฐ์ ๊ฐ์์ ํด๋นํ๋ dimension์ ๊ฐ์ง๋ ์ด๋ฒกํฐ๊ฐ ๋์ค๊ฒ ๋ฉ๋๋ค.
์ด ์ด๋ฒกํฐ ๊ฐ๊ฐ์ ์์๊ฐ sigmoid function์ ํต๊ณผํ๊ฒ ๋๋ฉด ์ด๋ฐ Output ๊ฐ์ ์ป์ด๋ผ ์ ์์ต๋๋ค.
์๋์ ๊ฐ์ด Linear Layer๋ฅผ ํ์ฑํ ์ ์์ต๋๋ค.
- MNIST Dataset (Modified National Institute of Standards and Technology)
- MNIST Classification Model
- ์ด ์ถ๋ ฅ vector๋ฅผ ground truth ๊ฒฐ๊ณผ๋ฅผ ๋ฐํ์ผ๋ก loss function์ ๋ง๋ค์ด์ค ์๊ฐ ์๊ฒ ๋ฉ๋๋ค.
- ์ค์ Prediction๊ณผ Target ๊ฐ์ Squared Error ๋ฅผ ๋ด์ด loss๋ฅผ ์ ์ํ ์ ์์ต๋๋ค.
- ์ด๋ฌํ loss๋ฅผ Mean Squared Error Loss๋ผํฉ๋๋ค.
- class์์์ ์์ธก ๊ฐ๊ณผ ์ฐธ ๊ฐ์ ์ฐจ์ด๊ฐ ์์, ํ์ต์ ์ฌ์ฉ๋๋ Gradient ๊ฐ์ด ํฌ์ง ์๊ฒ ๋์ด ํ์ต์ด ์๋์ ์ผ๋ก ๋๋ ค์ง ์ ์์ต๋๋ค.
- class ๋ถ๋ฅ ์, ์์ธก ๊ฐ, ์ถ๋ ฅ ๊ฐ์ ํํ๋, ํ๋ฅ ์ ๊ฐ์ผ๋ก ์ด 1์ด ๋๋๋กํ๋ vector๋ฅผ ์ป์ด์ผ ํฉ๋๋ค.
- ์ด๋ฅผ softmax layer ํน์ softmax classifier๋ผ๊ณ ํฉ๋๋ค.
- ๋จผ์ ์ถ๋ ฅ ๋ด๋ฐ๋ค์ ๊ฐ์ ํฉ์ด 1์ด ๋๋๋ก ํ๊ธฐ ์ํ์ฌ ๋ค์๊ณผ ๊ฐ์ ๊ณผ์ ์ ๊ฑฐ์น๋ค.
- ์ถ๋ ฅ ๋ด๋ฐ๋ค์ ๊ฐ๊ฐ์ ๊ฐ์ ์ง์ํจ์๋ฅผ ๊ฑฐ์น๊ฒ ํ๋ค.
- ๋ชจ๋ ์์์ธ ํํ์ ์ถ๋ ฅ ๊ฐ์ ๊ฐ์ง๊ณ ์๋์ ์ธ ๋น์จ์ ๊ณ์ฐํ๊ฒ ๋๋ค.
- ๊ฐ๊ฐ์ ํ๋ฅ ๊ฐ์ ๊ตฌํ์ฌ ํฉ์ด 1์ด ๋๋๋ก ๊ตฌํ๋ค.
- ์ด๋ฌํ softmax layer์ Output vector๋ฅผ multi-class classification task๋ฅผ ์ํ ํํ๋ก ์ป์์ ๋, ์ฌ๊ธฐ์ Loss function์ ์ ์ฉํ ๋,
- MSE Loss๋ 0๊ณผ 1๋ก ๊ฐ์ ๋ฐ๊พธ๊ณ ๊ทธ ์ฐจ์ด์ ์ ๊ณฑ์ ํ์ฐํ๋ ๊ฒ์ผ๋ก ๊ณ์ฐํ๋ค๋ฉด,
- ๋์ ์, softmax layer์ ์ ์ฉํ๋ Loss๋ก์, softmax loss or cross-entropy loss๋ฅผ ์ฌ์ฉํฉ๋๋ค.
- ์๋์ ๊ฐ์ด ์ถ๋ ฅ vector์ ground truth vector์ธ one-hot vector ํํ๋ก ์ฃผ์ด์ง๋๋ค.
- ๋จผ์ ์ถ๋ ฅ ๋ด๋ฐ๋ค์ ๊ฐ์ ํฉ์ด 1์ด ๋๋๋ก ํ๊ธฐ ์ํ์ฌ ๋ค์๊ณผ ๊ฐ์ ๊ณผ์ ์ ๊ฑฐ์น๋ค.
- ์ด๋ฅผ softmax layer ํน์ softmax classifier๋ผ๊ณ ํฉ๋๋ค.
'Artificial Intelligence > Deep Learning' ์นดํ ๊ณ ๋ฆฌ์ ๋ค๋ฅธ ๊ธ
[Convolutional Neural Networks and Image Classification] Part 3 (0) | 2023.01.24 |
---|---|
[Training Neural Networks] part 2 (0) | 2023.01.24 |
[Deep Neural Network] part 1 - 1 (0) | 2023.01.22 |
[Machine Learning] ์ ๊ฒฝ๋ง ๊ธฐ์ด 1 (0) | 2023.01.17 |
more clever function (0) | 2021.12.19 |