[Advanced Classification] part 5 - 3
2023. 1. 19. 15:43
๐ง๐ป๐ป์ฉ์ด ์ ๋ฆฌ
ANN (Aritificial Neural Network)
DNN (Deep Neural Network)
Multilayer perceptron model
ANN (Aritificial Neural Network)
- nonlinear classification model์ ์ ๊ณต
- ์์ ์๋ ๊ฒ๊ณผ ๊ฒฐ์ด ๋ค๋ฅธ classifier
- ์ธ๊ฐ์ ๋ ์ ๊ฒฝ์ ๋ชจ์ฌํ ํํ๋ก ๋ง๋ค์ด์ง model
- ์ธ์ ํ๋ node์์ ์ ํธ๋ฅผ ์์งํ๊ฒ ๋๋ฉด, ๊ทธ ์ ํธ๋ค์ ์ ๊ธฐ์ ์ผ๋ก ํ๋์ node๋ค์ ํฉ์ฑ์ด ๋์ด์ ์ด๋ ์ ๊ธฐ ์์ค ์ด์์ผ๋ก ์ ํธ๊ฐ ์ฆ๊ฐ๋์ ๋, ํํ์ ์ธ ๊ณผ์ ์ ํตํด์ ๊ทธ ๋ค์ ๋ด๋ฐ์ผ๋ก ์ ํธ๋ฅผ ์ ํํด ๋๊ฐ๋ค.
- Linear combinations์ผ๋ก ๋ง๋ score ๊ฐ์ ์ด์ฉ
- nonlinearํ ์ฐ์ฐ์ด "Actiovation Function"์ ์ํด์ ์ด๋ฃจ์ด์ง๋๋ค.
- Activation function์ linear combination์ผ๋ก์์ score ๊ฐ์ ์ ๋ ฅ์ผ๋ก ์ผ์์ sigmoid ์ ๊ฐ์ ํจ์๋ฅผ ํตํด nonlinearํ ๊ด๊ณ๋ก mapping ํด์ฃผ๋ ์ญํ ์ ์ํํฉ๋๋ค.
ANN์์์ Activation functions
- Sigmoid neurons
- neural network๋ฅผ ๊น์ด์๊ฒ ์์๊ฐ ๋, ํจ๊ณผ์ ์ด์ง ์์์ด ๋ณด์ฌ์ง๋๋ค.
- ํ์ต์ด ์งํ๋จ์ ๋ฐ๋ผ gradient ๊ฐ์ด ์ ์ ์์์ง๋ ๊ฒฝํฅ์ด ์์ต๋๋ค.
- ReLU
- max (0, x)
- ์ด ํจ์๋ฅผ ๋ฏธ๋ถํ๋๋ผ๋ ์ฌ์ ํ gradient term์ด 1๋ก ๋ํ๋๋ ๊ฒ์ ์ ์ ์์ต๋๋ค.
- Leaky ReLU
- max (0.1x, x)
๐ก ์ด๋ฌํ ANN์ ๊ณ์ธต์ ์์์ ๊น๊ฒ ์๊ฒ ๋๋ฉด DNN์ด ๋ฉ๋๋ค.
DNN (Deep Neural Network)
- ๊ฐ๊ฐ์ ๊ณ์ธต์ ๋ฐ๋ผ์ ํ์ต์ ํ๊ฒ๋๋ feature์ ํํ๊ฐ ๋ฌ๋ผ์ง๋ค๊ณ ํ๋ ๊ฒ์ด ์ ์๋ ค์ ธ ์์ต๋๋ค.
- ์ด๋ฌํ nonlinear ํจ์๋ค์ด ๊ณ์ธต์ ์ผ๋ก ์์ฌ ๊ฐ์ ๋ฐ๋ผ์, signal spade์์์ ๋ณต์กํ ์ ํธ๋ค์ ํจํด๋ค์ ์กฐ๊ธ ๋ ์ ํํ๊ฒ ๋ถ๋ฅํ ์๊ฐ ์๋ค๊ณ ํ๋ ๊ฒ์
๋๋ค.
- ๋ณต์กํ ํํ์ input feature๋ค์, ๋ณต์กํ sample๋ค์ ํจ๊ณผ์ ์ผ๋ก ๋ถ๋ฅํ๊ธฐ ์ํ linear play๋ ๊ตฌ์ฑํ๊ธฐ ์ด๋ ต์ต๋๋ค.
- ํ๋์ ๊ณ์ธต์ ํตํ nonlinear activation function ์ญ์ ์ด๋ฌํ ๊ฒ๋ค์ ํจ๊ณผ์ ์ผ๋ก ๋ถ๋ฅํ๊ธฐ ์ด๋ ต๋ค๊ณ ๋ณผ ์ ์์ต๋๋ค.
- ์ด๋ฌํ neural network๋ฅผ ์ฌ๋ฌ ๊ฐ์ ๊ณ์ธต์ ํตํด์ ์์๊ฐ๋ฉฐ ์ฐ์ฐ์ ์ํํ๋ฉด ๋ณต์กํ model๋ค ์ญ์, ๋ ๋ณต์กํ ํํ์ hyper plane์ ํตํด์ ๋ชจ๋ธ๋ค์ ๋ ์ ๋ถ๋ฅํ ์ ์์ต๋๋ค.
์์ ๊ฐ์ด XOR Problem์ด ์์ต๋๋ค.
์๋ ํ๋ฅผ ๊ฐ์ด ๋ดค์ ๋ , ์๋ก ๋ค๋ฅผ ๋ output์ด 1์ด๊ณ , ๊ฐ์ ๋ 0์ ๋๋ค.
output | input1 | input2 |
0 | 0 | 0 |
1 | 0 | 1 |
1 | 1 | 0 |
0 | 1 | 1 |
Postive ๋ผ๋ฆฌ, negative ๋ผ๋ฆฌ, ๋ถ๋ฅํ ์ ์์๊น์?
์ด๋ฌํ ๋ฌธ์ ๋ฅผ ํ๋์ hyper plane์ ๊ทธ์ด ๋ถ๋ฅํ ์ ์์๊น์?
์ด๋ ๊ต์ฅํ ์ด๋ ค์ธ ๊ฒ์ ๋๋ค.
Neural Network๊ฐ ์ด๋ฌํ ๋ฌธ์ ๋ฅผ ํจ๊ณผ์ ์ผ๋ก ํ ์ ์์์ ์์๋์ต๋๋ค.
Neural Network๋ฅผ ์ฌ๋ฌ ๊ฐ์ ์ธต์ผ๋ก ์์ ๊ฒ์,
Multilayer perceptron model (MLP)
์ด๋ผ๊ณ ํ ์๊ฐ ์์ต๋๋ค.
MLP
- XOR problem์ ํ ์ ์์ต๋๋ค.
- multilayer์ ๊ณ์ธต์ด ์ฌ๋ผ๊ฐ์ ๋ฐ๋ผ ๋ ๋ณต์กํ ํํ์ hyper plane ์ ๋ง๋ญ๋๋ค.
- ์ด๋ฌํ neural network๋ linear classification ๋ฌธ์ ์์ ์ํํ ์๊ฐ ์๋, XOR problem๊ณผ ๊ฐ์ด nonlinearํ ๋ฌธ์ ๋ค์ ํ์ด๋ผ ์๊ฐ ์์ต๋๋ค.
- ๊ณ ์ฐจ์์ ์ ํธ, image ๊ฐ์ ํํ์ ๋ณด๋ค ๋ ์ ๋์ํจ์ ์ ์ ์์ต๋๋ค.
ANN
- Example : MNIST data recognition
- Computer Vision, Image Recognition์ ๋ง์ด ํ์ฉ๋ฉ๋๋ค.
- ํํธ, ์ด๋ฌํ ๋ชจ๋ธ์ accuacy๊ฐ ๊ณ์ธต์ ๊ณ์ ๋๋ ค๊ฐ๋ค๊ณ ํ ์ง๋ผ๋, ์ด๋ ์๊ฐ ๋ฎ์์ง๊ฒ ๋๋ ๋ฌธ์ ๊ฐ ๋ฐ์ํ๊ฒ ๋ฉ๋๋ค.
- ์ด๊ฒ์ Gradient Vanishing problem ๋๋ฌธ์ ๋ฐ์ํ๋ ๊ฒ์ ๋๋ค.
- ๋ชจ๋ธ ํ์ต ๊ณผ์ ์์ parameter๋ฅผ chain rule์ ํตํด ํ์ตํ๊ฒ ๋๋๋ฐ, ๊ณ์ธต์ด ๊น์ด์ง๋ฉด ๊น์ด์ง ์๋ก, Gradient ๊ฐ์ด ๊ณ์ํด์ ์ค์ด๋ค๊ฒ ๋์ด์, ๊น์ layer์ ๋ํด์ ํ์ต์ด ํจ๊ณผ์ ์ผ๋ก ์ด๋ฃจ์ด์ง์ง ์๊ฒ ๋๋ ๋ฌธ์ ๊ฐ ๋ฐ์ํ๊ฒ ๋ฉ๋๋ค.
- ์ด๋ฌํ ํ์ต ๊ณผ์ , ์ด๋ฌํ optimization ๋ฌธ์ ๋ฅผ BackPropagation ์ด๋ผ๊ณ ํฉ๋๋ค.
- ์ด๋ฌํ BackPropagation ๊ณผ์ ์์ ๋ฐ์๋๋ "vanishing gradient problem"์ ํ๊ธฐ ์ํ ๋ง์ ์ฐ๊ตฌ๊ฐ ์์์ต๋๋ค.
- ๊ฒฐ๊ตญ pre-training ๊ณผ fine tuning๊ณผ ๊ฐ์ ๊ณผ์ ์ ๊ฑฐ์ณ์ ANN๊ณผ CNN(Convolutional Neural Network)๊ณผ ๊ฐ์ Deep Learning model ๊ณผ ๊ฐ์ ๊ฒ์ผ๋ก ๋ฐ์ ๋์ด ์ฐ์ํ ์ฑ๋ฅ์ ๋ด๊ณ ์์ต๋๋ค.
Convolutional Neural Network (CNN)
- ANN์์ ๊ณ ๋ํ ๋์ด์, image๋ video์ ๊ฐ์ ๊ณ ์ฐจ์ ์ ํธ๋ฅผ ํจ๊ณผ์ ์ผ๋ก ๋ค๋ฃจ๋ ๋ฐ ๋ง์ด ํ์ฉ๋๊ณ ์์ต๋๋ค.
'Artificial Intelligence' ์นดํ ๊ณ ๋ฆฌ์ ๋ค๋ฅธ ๊ธ
[Ensemble Learning] part 6 - 2 (0) | 2023.01.20 |
---|---|
[Ensemble Learning] part 6 - 1 (0) | 2023.01.20 |
[Advanced Classification] part 5 - 2 (0) | 2023.01.19 |
[Advanced Classification] part 5 - 1 (0) | 2023.01.19 |
[Linear Classification] part 4 - 3 (0) | 2023.01.19 |