[Deep Learning] - Neural Networks
๐ง๐ป๐ป์ฉ์ด ์ ๋ฆฌ
Neural Networks
Linear Separability
Optimization
Perceptron
Activation function
์ค๋์ NN์ด ๋ฌด์์ธ์ง์ ๋ํด ์์๋ณด๊ณ ์ ํ๋ค.
Neural Networks (NN)
๋ด๋ด ๋คํธ์ํฌ.
์ด๊ฒ์ ์ฌ๋์ ๋๋ฅผ ํ๋ด๋ด์ด ๋ง๋ mathematical model์ด๋ค.
์ํ์ ์ผ๋ก ํ๋ด๋ธ๋ค.
- ๋ฐ์ดํฐ๊ฐ ๋ค์ด์จ๋ค.
- ๋ฐ์ดํฐ๊ฐ weight์ ํจ๊ป ๋ค๋ฅธ networs๋ค๊ณผ ์ฐ๊ฒฐ๋๋ค.
- ๋ง๋ function์ ๊ฐ์ด ์ถฉ๋ถํ ๊ฐํ๋ค๋ฉด, node๊ฐ activation ๋๋ค.
์ด๋ฅผ ANN, Artificial Neural Networks๋ผ๊ณ ๋ ํ๋ค.
๋๋ถ๋ถ์ ์๊ณ ๋ฆฌ์ฆ๋ค์ด specialํ NN์ form์ผ๋ก ๋ฌ์ฌ๋ ์ ์๋ค.
์ด๊ฒ์๋ ๋ค์๊ณผ ๊ฐ์ ํญ๋ชฉ๋ค์ด ์กด์ฌํ๋ค.
- Bayesian classifier
- support vector machines
- decision tree
- etc..
Deep learning์ NN์ ํฌํจ๋์ด ์๋ค.
Linear Separability
์ฌ๊ธฐ์๋ Classification problem์ด ์กด์ฌํ๋ค.
์ฆ,
์ ๊ทธ๋ฆผ๊ณผ ๊ฐ์ด ๋ถ๋ฅํ๋ ๋ฌธ์ ์ด๋ค.
์ด๋ค ํจ์ g(x)์ ๋ํด์ฌ ๋ ๊ฐ์ง๋ก ๋ถ๋ฆฌํ๋ค.
์ฌ๊ธฐ์ g(x) = 0 ์ด ๋๋ ๊ฒ์ ๋ค์๊ณผ ๊ฐ์ด ์ด๋ฆ ๋ถ์ธ๋ค.
- Decision boundary
- Decision Surface
- Decision hyperplane
- Class boundary
- ...
์๋ original space๋ฅผ ๋ ๊ฐ์ง subspace๋ก ๋ถ๋ฆฌํ๋ linear function์ด๋ผ๊ณ ํ ์ ์๋ค.
Generalize to multivariate proble
์ด์ ๊ฐ์ด ์์์ ๋ดค๋ g(x) ํจ์๋ฅผ ์ผ๋ฐํ ํ ์ ์๋ค.
์ด์ ๋ํ ์ฉ์ด๋ ์์ ๊ฐ์ด ์ ๋ฆฌํ ์ ์๋ค.
ํ๋ ํ๋์ Neuron ๋ค์ unit or node๋ผ๊ณ ๋ ๋ถ๋ฅธ๋ค.
๊ทธ๋ฆฌ๊ณ ์ด๊ฒ๋ค์๋ input variables๊ฐ ๋ค์ด๊ฐ๋ค.
๊ทธ๋ฆฌ๊ณ ์ด๊ฒ๋ค์ Weight๊ฐ ๊ณฑํด์ง๋ค. ์ด๊ฒ๋ค์ ๋ชจ๋ ๋ํ ๋ค Bias ํญ๊น์ง ๋ํ๋ฉด Weighted Summation์ด ๋ง๋ค์ด์ง๋ค.
๊ทธ๋ฆฌ๊ณ !!!
์ด๊ฒ์ด ๋์ด ์๋๋ค !!!!
์ฌ๊ธฐ์ Activation function์ ํต๊ณผ์ํจ ํ ๋์ค๋ ๊ฒ์ด output์ด ๋๋ค.
์ฆ ์ฐ๋ฆฌ๊ฐ ์ํ๋ ๊ฐ์ Weighted Summation์ด ์๋๋ผ ๊ทธ ๊ฐ์ Activation function์ ํต๊ณผ์ํจ Output ๊ฐ์ด๋ค.
Optimization
์๊น Classification problem์์ ๋ณธ ๊ทธ๋ฆผ์ ์ ์์ ๋ํ์ฌ ์ ์ฉํ๋ค.
์ g(x) = 0 ์ผ ๋์ ๊ฐ์ด ์ฐ๋ฆฌ๊ฐ ์ํ๊ณ ์ํ๋, ์ฐ๋ฆฌ๊ฐ ํ์ต์ ํตํด ์ป๊ณ ์ํ๋ ํ์ต ๋ชฉํ๊ฐ ๋๋ค.
์ ๊ทธ๋ฆผ์์ ๋ณด๋ฉด, ์ฐ๋ฆฌ๋ g(x)์ ๊ฐ์ด ํ์ต ๋ชฉํ์ด๋ค. ๊ทธ๋ฆฌ๊ณ ์ด ๊ฐ๋ณด๋ค ํฐ ๊ฐ์ ๋๊ทธ๋ผ๋ฏธ, ์์ ๊ฐ์ ๋ค๋ชจ๋ก Classification ํ ๊ฒ์ด๋ค.
์ฌ๊ธฐ์ ๋ณผ ์ ์๋ ๊ฒ์ ์ฌ๋ฌ ๊ฐ์ง ๋๊ทธ๋ผ๋ฏธ์ ๋ค๋ชจ์ ๋ฐ์ดํฐ๋ฅผ ํตํด์ ์ฐ๋ฆฌ๋ hyperplane์ ํ์ต์์ผฐ๋ค๋ ๊ฒ์ด๋ค.
๊ทธ๋ฆฌ๊ณ g(x)์ ๊ฐ์ด 0๋ณด๋ค ํฐ ๊ฒฝ์ฐ์ ์์ ๊ฒฝ์ฐ๋ก ๋๋๋ฏ๋ก, 0๋ณด๋ค ์์ ๊ฒฝ์ฐ์ ๋ํด์๋ ๋ฐ์ดํฐ๋ค์ x -> -x๋ก ์นํํ๋ค.
๊ทธ๋ฆฌ๊ณ ๋์ 0๋ณด๋ค ํฐ ๊ฒฝ์ฐ์ ๋ํ ์์ผ๋ก ๋ฐ๊พธ์ด ๊ณ์ฐ์ ๋ ์ฝ๊ฒ ๋ง๋ ๋ค.
๊ทธ๋ฆฌ๊ณ ์ฌ๊ธฐ์ ๋ง์ผ,
์๋ก์ด ๋ฐ์ดํฐ๊ฐ ๋ค์ด์จ๋ค๋ฉด,
g(x) > 0 ๊ฐ์ธ๋ฐ, ํ์ฌ ํ์ต๋ ๋ฐ์ดํฐ๋ก ๊ณ์ฐํ์ ๋ 0๋ณด๋ค ์์ ์์ญ์ผ๋ก ๊ฐ๋ค๋ฉด ์ฐ๋ฆฌ๋ ๋ค์ hyperplane์ update ์์ผ์ค ํ์์ฑ์ด ์๋ค,
์ด๋ด ๋ ์ฐ๋ฆฌ๋
Gradient Descent
๋ฐฉ๋ฒ์ ์ด์ฉํ๋ค.
์ด ๋ฐฉ๋ฒ์ ํตํด์
์์ ๊ฐ์ ์์์ ํตํด ์๋ก์ด input์ธ ๋ฐ์ดํฐ๋ฅผ ํตํด์ weight๋ฅผ updateํ๋ค.
๊ทธ๋ฆฌ๊ณ ๋ค์ ํ์ต๋ ๋ฐ์ดํฐ๋ฅผ ์ฌ์ฉํ๋ค.
- ์ด๊ฒ์ Weight์ misclassified data๊ฐ ํ์ํ๋ค.
- ์ฌ๊ธฐ์ g(x)๋ misclassified data๋ก ๋ฎ์ธ๋ค.
- misclassified data๋ ์๋ฌด์ด๋ค.
- ๋ง์ฝ data๊ฐ ์์ฃผ ํฌ๊ฒ misclassified ๋์ด ์๋ค๋ฉด gradient ๋ ์ปค์ง๋ค.
์ฐ๋ฆฌ๋ ์์์ ๋ณธ ์ด๊ฒ์ ํ๋์ perceptron์ด๋ผ๊ณ ๋ถ๋ฅธ๋ค.
์ด perceptron์ ํตํด์ ์ฐ๋ฆฌ๋ linear problem์ ํด๊ฒฐํ ์ ์๊ฒ ๋์๋ค.
์์ ๊ฐ์ด ์ธ๊ฐ์ brain์ ๋ชจ๋ฐฉํ์ฌ ๊ณ ์ํด๋ธ ์์ด๋์ด์ด๋ค.
์ neuron output์ด ๋ค์ neuron input์ด ๋๋ค.
๊ทธ๋ฆฌ๊ณ ์ด๋ฌํ ์ ๊ธฐ ์ ํธ์ ๋ํ ํฌ๊ธฐ๋ก output์ ๋ณด๊ณ . activation function์ด ํ์ฑํ ์ฌ๋ถ๋ฅผ ๊ฒฐ์ ํ๋ค.
๊ทธ๋ ๋ค๋ฉด, Activation function ์ ๋ํด ์์๋ณด์.
Activation function
์ ๊ทธ๋ฆผ๊ณผ ๊ฐ์ด output์ผ๋ก ๋์จ Weighted Summation, ์ด๋ฌํ continuous output์ probability of decision์ ํํ๋ก ๋ฐฐ์ถํ๋ค.
์์ ๊ฐ์ ํํ๋ก ์กด์ฌํ๋ค.
๋ณธ๋ step function์ ํํ๋ก ์กด์ฌํ๋ค๊ณ ๋ณธ๋ค.
์๋ step function์ ํํ๋ผ๋ฉด 0๋ณด๋ค ํฌ๋ฉด activation,
0๋ณด๋ค ์๋ค๋ฉด deactivation์ด ๋ง๋ค.
๊ทธ๋ฐ๋ฐ, ์ฐ๋ฆฌ๋ ๋ฏธ๋ถ์ ๋๋ฌด๋๋ ์ข์ํ๋ ์ฌ๋๋ค์ด๊ธฐ ๋๋ฌธ์, ์์ ๊ฐ์ step function์์๋ ๋ฏธ๋ถํ์ฌ ๊ณ์ฐํ ์๊ฐ ์๋ค.
๊ทธ๋ฆฌํ์ฌ, ์ฐ๋ฆฌ๋ ์์ ๊ฐ์ sigmoid function์ ํํ๋ฅผ ๋์ ํ๊ฒ ๋์๋ค.
๊ทธ๋ฌ๋, ๋์ค์ ๋ค๋ฃจ๊ฒ ์ง๋ง ์์ ๊ฐ์ sigmoid function๋ ๋ฌธ์ ๋ ์กด์ฌํ๋ค.
Vanishing Gradient์ ๊ฐ์ ๋ฌธ์ ๋ค์ด ๋ฐ์ํ๋ฏ๋ก ์ฐ๋ฆฌ๋ ์์ ๊ฐ์ ํจ์๋ฅผ ํน์์ ์ธ ์ํฉ์ด ์๋๋ฉด ๋ฐ์ํ ์ ์๊ฒ ๋์๋ค.
๊ทธ๋ฆฌํ์ฌ ์ฐ๋ฆฌ๋ neuron ๋ชจ๋ฐฉ ๋ง๊ณ ํ์ต์ ๋์์ด ๋๋ ๋ฐฉํฅ์ผ๋ก ๋ค์ activation function์ ๋ง๋ค์๋ค.
๊ทธ๊ฒ์ ReLU function์ด๋ค.
์ฐ๋ฆฌ๋ ์ด ํจ์๋ก ๋ ๋์ ํ์ต์ ์ด๋ฃจ์ด๋๊ณ ,
๋ ๋ค๋ฅธ ๋ณํ ํํ๋ก๋ ๋ง์ด๋ค ์กด์ฌํ๋ค. ์ฐ๊ตฌ๋ ๊ณ์๋๊ณ ์๋ค.
'Artificial Intelligence > Deep Learning' ์นดํ ๊ณ ๋ฆฌ์ ๋ค๋ฅธ ๊ธ
[Deep Learning] Feedforward (0) | 2023.03.27 |
---|---|
[Deep Learning] - MLP(Multilayer Perceptron) (0) | 2023.03.26 |
[Supervised Learning] ์ง๋ ํ์ต (0) | 2023.02.08 |
[Machine Learning] ์ ๊ฒฝ๋ง ๊ธฐ์ด 3 (0) | 2023.02.08 |
[Machine Learning] ์ ๊ฒฝ๋ง ๊ธฐ์ด 2 (2) | 2023.02.06 |