๐ง๐ป๐ป์ฉ์ด ์ ๋ฆฌ
CNN
CNN
- ์ด๋ฏธ์ง ๋ฟ ์๋๋ผ ์ด๋ฌํ ๊ตฌ์กฐ ์์ฒด๋ฅผ ์๊ณ์ด ๋ฐ์ดํฐ์ ์ ์ฉํ์ ๋๋ ๊ต์ฅํ ์ข์ ํจ๊ณผ๋ฅผ ๋ณผ ์ ์์ต๋๋ค.
- feature๋ฅผ ์ค์ค๋ก ํ์ตํ ์ ์๋ ๋ฅ๋ ฅ์ ๊ฐ์ถ ์ฌ์ธต ์ ๊ฒฝ๋ง ๊ตฌ์กฐ์
๋๋ค.
- Classification
- Classification + Localization
- Object Detection
- Instance Segmentation
- ์์ ๊ฐ์ ์ํ์ด ์ด๋ฃจ์ด์ง๋๋ค.
- ์ด๋ฏธ์ง๋ 3์ฐจ์์ tensor๋ก ํํ๋ฉ๋๋ค.
- ๋ชจ๋ pixel ํ๋์ ์ ๋ ฅ ๋ ธ๋๋ก ๊ฐ์ฃผํ๊ณ ์๋ก ๋ค๋ฅธ ๊ฐ์ค์น๋ก ์ฐ๊ฒฐํ๋ฉด input layer์ first hidden layer ์ฌ์ด ๋ง์ weights๊ฐ ๋ฐ์ํฉ๋๋ค. ํ์ต๋์ด ๊ธฐํ๊ธ์์ ์ผ๋ก ์ฆ๊ฐํ๊ฒ ๋ฉ๋๋ค.
- ๊ทธ๋์ ์๋ ํ๋ ๋๋ก vector data๋ฅผ ํํํ๋ ๋ฐฉ์๋๋ก ์ด๋ฏธ์ง data๋ฅผ neural network์๋ ์ง์ด ๋ฃ์ด์ ์ฐ์ฐ์ ํ ์๊ฐ ์๋ ์ํฉ์ ๋๋ค.
- ๊ทธ๋์ Convolution ์ฐ์ฐ์ ์ฌ์ฉํฉ๋๋ค.
- image convolution
- ํน์ ์์ฑ์ ํ์งํ๋๋ฐ ์ฌ์ฉํ๋ matrix
- edge detection
- ์ด๋ฏธ์ง์ ํน์ฑ์ ํ์ฉํ๋ filter
- ํน์ ์์ฑ์ ํ์งํ๋๋ฐ ์ฌ์ฉํ๋ matrix
- CNN์ filter๋ฅผ data๋ฅผ ํตํด ์ค์ค๋ก ํ์ต ์ํค๋ ๋ฅ๋ ฅ์ ๊ฐ์ง๊ณ ์์ต๋๋ค.
- end-to-end ํ์ต
- ์ธ์ pixel ๊ฐ์๋ ์๋นํ ๋์ ์๊ด์ฑ์ ๊ฐ์ง๋๋ค.
- ๊ทธ๋ฌ๋ ์ด๋ฏธ์ง๊ฐ ์ด๋์ ๋ํ๋ ์ง๋ ๋ชจ๋ฅด๋ ๊ฒ์ด feature invariance์ ๋๋ค. CNN์์ ์ด ํน์ฑ์ ๋ฐ์ํฉ๋๋ค.
- sparse connection์ ์ธ์ ํ ์์ญ๋ง์ ์ด์ฉํ์ฌ feature๋ฅผ ๊ณ ๋ คํฉ๋๋ค.
- localํ๊ฒ correlation์ด ๋์ ์์ญ๋ง ๋ณด์์ invariant feature๋ฅผ ์ถ์ถํ๋ค. ์ด๋ฅผ ์ํ ์ shared weight๋ฅผ ์ฌ์ฉํฉ๋๋ค.
- ์์น๊ฐ ๋ฌ๋ผ๋ ๋์ผํ ๊ฐ์ค์น๋ฅผ ๊ณ์ํด์ ์ ์ฉํฉ๋๋ค.
CNN ์ฐ์ฐ
Convolution ์ฐ์ฐ
- ํน์ ์์ญ์ ์ถ์ถํ๊ธฐ ์ํ filter๊ฐ ํ์ํฉ๋๋ค.
- input์ ๋ํด ์ด filter๋ฅผ ์,์ ์ํ์ข์ฐ ๋ค๋๋ฉด์ ์ฐ์ฐ์ ํตํด ์ด๋ค ๊ฒฐ๊ณผ ๊ฐ์ ๋์ถํ๋ ๊ฒ ๋ฐ๋ก Convolution ์ฐ์ฐ์ ๋๋ค.
- ์ด๋ฏธ์ง data๋ 3์ฐจ์์ tensor์ด๊ธฐ ๋๋ฌธ์ filter๋ ์ญ์ 3์ฐจ์์ ๋๋ค.
- 3 by 3์ filter๋ฅผ ๊ฑธ์๋ค๋ฉด, depth๊ฐ ๋์์ด ๋๋ ๊ฐ์ฒด์ ๋์ผํ depth๋ฅผ ๊ฐ์ง๊ณ ์๋ค๊ณ ์๊ฐํ๋ฉด ๋ฉ๋๋ค.
- filter๊ฐ ๋ช ๊ฐ๊ฐ ํ์ํ์ง ์ ์ ์์ต๋๋ค. detection ํด์ผํ๋ ๋์์ด ๋ง๊ธฐ ๋๋ฌธ์ ๋๋ค.
- ์ด filter์ ์๋ฅผ hyper parameter๋ก์ ์ ํด์ผํฉ๋๋ค.
- input์ ๊ฐ์์ D in์ ๋์ผํ๊ณ filter์ ๊ฐ์๋ D out๊ณผ ๋์ผํฉ๋๋ค.
- ๊ทธ๋์ filter์ ๊ฐ์์ ๋์ผํ๊ฒ D out๊ฐ์ ๊ฒฐ๊ณผ๋ฌผ์ด ๋์ต๋๋ค.
- pixel ํ๋์ฉ ํ๊ธฐ ๋๋ฌธ์ ์ฌ๋ฌ ์นธ์ ํ ๋ฒ์ ์ฎ๊ฒจ๊ฐ ์ ์์ต๋๋ค.
- ์ด๋ฅผ strideํ๋ค๊ณ ํฉ๋๋ค.
- ํ ์นธ์ฉ ์์ง์ด๋ฉด stride 1, ๋ ์นธ์ฉ ์์ง์ด๋ฉด stride 2์ ๋๋ค.
- ๊ฐ์ด๋ฐ ์๋ ๊ฒ๋ค์ filter์ ์ํฅ์ ๊ฐ์ฅ์๋ฆฌ ๋ณด๋ค ์๋์ ์ผ๋ก ๋ง์ด ๋ฐ์ต๋๋ค.
- ์ด๋ฅผ ํด๊ฒฐํ๊ธฐ ์ํด padding์ ํฉ๋๋ค.
- ์๋ณธ data์ ํ ๋๋ฆฌ์ pixel์ ํ ์นธ์ฉ ๋๋ฌ์ ์ ๋ถ 0์ ๊ฐ์ ์ค๋๋ค.
- ๊ทธ๋์ ๋๋ฆ filter๋ฅผ ๋ ์ฌ๋ฌ ๋ฒ ์ ์ฉ๋ฐ๊ฒ ๋ฉ๋๋ค.
- stride์ padding์ ์ผ๋ง๋ ์ฃผ๋์ ๋ฐ๋ผ Output size๊ฐ ๋ฌ๋ผ์ง๋๋ค.
- ์ด๋ฅผ strideํ๋ค๊ณ ํฉ๋๋ค.
- activation ์ฐ์ฐ
- ๋ณต์กํ ์ ํ์กฐํฉ์ ๋น์ ํ ๋ณํ์ ์ํํ๋ ๊ฒ์ ๋๋ค.
- ReLU
- 0๋ณด๋ค ํฐ ๊ฐ์ ์๊ธฐ์์ , 0๋ณด๋ค ์์ ๊ฐ์ 0์ผ๋ก returnํฉ๋๋ค.
- ์ฌ๋์ ๊ท๋ ๋ชจ๋ ์์๋ก ๋ค์ด์ค๋ ์ ๋ณด๋ฅผ ์ฑํํฉ๋๋ค. ์์๋ ์๊ธฐ ๋๋ฌธ์ 0์ผ๋ก ๋ณํํฉ๋๋ค.
- Pooling
- ํฐ data๊ฐ ์์ฑ ๋๊ธฐ ๋๋ฌธ์ ๊ณ ์ฐจ์์ tensor๋ฅผ ๋ณด๋ค compactํ๊ฒ ์ถ์ฝํ๋ ๊ฒ์ ๋๋ค.
- ์ผ์ ์์ญ์ ๋ํ ์ ๋ณด๋ฅผ ๋ํฏ๊ฐ์ ์ด์ฉํด์ ๊ฐ์ง๊ณ ์ต๋๋ค.
- max pooling
- ์ต๋๊ฐ์ ๊ฐ์ ธ์ต๋๋ค.
- ์ผ๋ฐ์ ์ผ๋ก ์ฌ์ฉํฉ๋๋ค.
- average pooling
- ์ ๋ถ ํ๊ท ๋ด์ด ๊ฐ์ ธ์ต๋๋ค.
- strided convolution์ ํน์ํ ๊ฒฝ์ฐ์ ๋๋ค.
- ์ผ์ ํ์ ์ด์ ์ง๋๋ฉด tensor ํํ๋ก ๊ตฌ์ฑ๋ data๋ฅผ ์ผ์ฐจ์์ผ๋ก ํผ์ณ flattenํ๋ ๊ณผ์ ์ ๊ฑฐ์นฉ๋๋ค.
- pooling์ ํด๋ ๊ตฌ์กฐ๋ 3์ฐจ์ tensor ํํ๊ฐ ๋๋๋ฐ, ์ด๋ฅผ 1์ฐจ์์ vector๋ก ๋ณํํ๋ ๊ณผ์ ์ ๋๋ค.
- ํ๋ณ์ ์ํด์๋ vector ํํ๋ก ์ด๋ฃจ์ด์ ธ ์์ด์ผ ํฉ๋๋ค.
- AlexNet
- ์ฐ์ฐ๋ ๋ถ์กฑ์ผ๋ก ์ธํ resize ํ์.
- 224 x 224 ํฌ๊ธฐ์ ์ด๋ฏธ์ง input์ผ๋ก ์ฌ์ฉ
- ์ด๊ธฐ ๋จ๊ณ์ ํฐ ํํฐ์ ์ฌ์ด์ฆ์ stride ์ฌ์ฉ
- ์์ Layer๋ก ๊ฐ์๋ก ์์ ํํฐ ์ฌ์ด์ฆ์ stride ์ฌ์ฉ
- 2๊ฐ์ fully connected layer ์กด์ฌ
- ํ๋ผ๋ฏธํฐ ์ด์ : 60 million
- VGGNet
- AlexNet์ ๋นํด ๋จ์ํ์ง๋ง ๊น์ ๊ตฌ์กฐ
- 3 by 3 convolution with stride๋ฅผ ๊ธฐ๋ณธ ์ฐ์ฐ์ผ๋ก ํ๋ฉฐ ์ค๊ฐ ์ค๊ฐ 2 by 2 max pooling ์ํ
- ํ๋ผ๋ฏธํฐ ์ด ์ 138 million
Time-Series Data ๊ณผ์ for CNN
- ๋ชจ๋ ๋ณ์๋ ๋์ผํ ์ฃผ๊ธฐ๋ก ์์ง๋๊ณ ์์ต๋๋ค.
- Classification
- ํน์ ๊ธฐ๊ฐ ๋ฐ์ดํฐ๋ฅผ ์ ๋ ฅ์ผ๋ก ํ๊ณ ํน์ ๋ฒ์ฃผ๋ฅผ ์ถ๋ ฅํ๋ ๋ถ๋ฅ ๋ชจ๋ธ (์ ํ ๊ฐ๊ณต)
- Regression
- ํน์ ๊ธฐ๊ฐ ๋ฐ์ดํฐ๋ฅผ ์ ๋ ฅ์ผ๋ก ํ๊ณ ํน์ ์์น๋ฅผ ์ถ๋ ฅ์ผ๋ก ํ๋ ํ๊ท ๋ชจ๋ธ (ํ์ง ์งํ)
- ์ผ๋ถ ๊ธฐ๊ฐ ๋ฐ์ดํฐ๋ฅผ ์ ๋ ฅ์ผ๋ก ํ์ฌ ์ดํ ๊ธฐ๊ฐ ๋ฐ์ดํฐ๋ฅผ ์์ธก
- Anomaly Detection
- ์ผ๋ถ ๊ธฐ๊ฐ ๋ฐ์ดํฐ๋ฅผ ์ ๋ ฅ์ผ๋ก ํ์ฌ ํด๋น ์ํฉ์ ์ ์/๋น์ ์ ์ฌ๋ถ๋ฅผ ํ์ง
- Classification
- ์๊ณ์ด ๋ฐ์ดํฐ๋ ์ด๋ฏธ์ง ํ ์ดํฐ์๋ ๋ฌ๋ฆฌ ๋ณ์๋ค ์ฌ์ด์ Spatial Correlation์ด ์กด์ฌํ์ง ์์ต๋๋ค.
- ์๊ฐ์ถ์ผ๋ก ์์ง์ด๋ Convolution์ ์๋ฏธ๊ฐ ์์ผ๋, ๋ณ์์ถ์ผ๋ก ์์ง์ด๋ Convolution์ ์๋ฏธ๊ฐ ์์ต๋๋ค.
- 2-D Convolution์ ์๊ฐ๊ณผ ๋ณ์ ๋ ์ถ์ ๋ชจ๋ Convolution ์ฐ์ฐ์ ํตํด ํ์ํ๋ ๋ฐฉ์์
๋๋ค.
- 1-D Convolution vs. 2-D Convolution
- Dilated Convolution
- ๋ณด๋ค ๊ธด ๊ธธ์ด์ ์๊ณ์ด ๋ฐ์ดํฐ๋ฅผ ํจ์จ์ ์ผ๋ก ์ฒ๋ฆฌํ๋ ๋ฐฉ๋ฒ์
๋๋ค.
- standard convolution์ ํญ์ ์ธ์ ํ ์ฐ์๋ ์์ ์ ๋ฐ์ดํฐ์ ๋ํ ํฉ์ฑ๊ณฑ ์ฐ์ฐ์ ์ํํฉ๋๋ค.
- ํฉ์ฑ๊ณฑ์ฐ์ฐ์ ๋์๋์ ์ํํฉ๋๋ค.
- ๋ณด๋ค ๊ธด ๊ธธ์ด์ ์๊ณ์ด ๋ฐ์ดํฐ๋ฅผ ํจ์จ์ ์ผ๋ก ์ฒ๋ฆฌํ๋ ๋ฐฉ๋ฒ์
๋๋ค.
- ํฉ์ฑ๊ณฑ ์ ๊ฒฝ๋ง์ ํ์ฉํ ์๊ณ์ด ํ๊ท
- ํฉ์ฑ๊ณฑ ์ฐ์ฐ์ Feature Invariance์ Spatial Correlation์ ๋ฐ์ํ๊ธฐ ์ํด ์ฌ์ฉ๋๋ ์ฐ์ฐ์ ๋๋ค.
- ์ด๋ฏธ์ง๋ฅผ ์ฒ๋ฆฌํ ๋๋ ์ ๋ฐฉํ์ ํํฐ๋ฅผ ์ฌ์ฉํ์ฌ ๊ฐ๋ก ~ ์ธ๋ก ๋ ๋ฐฉํฅ์ผ๋ก ์์ง์ด๋ 2d ํฉ์ฑ๊ณฑ ์ฐ์ฐ์ ์ฌ์ฉํฉ๋๋ค.
- ๋ฐ๋ฉด, ์๊ณ์ด ๋ฐ์ดํฐ๋ฅผ ์ฒ๋ฆฌํ๋ ๊ฒฝ์ฐ์๋ ๋ณ์์ถ์ผ๋ก ํํฐ๊ฐ ์ด๋ํ๋ ๊ฒ์ ์๋ฏธ๊ฐ ์์ผ๋ฏ๋ก ํํฐ์ ํ ์ชฝ ํฌ๊ธฐ๋ ๋ณ์์ ๊ฐ์์ ๊ฐ๊ฒ ์ ์ํ ๋ค ์๊ฐ ์ถ์ผ๋ก๋ง ์์ง์ด๋ 1d ํฉ์ฑ๊ณฑ ์ฐ์ฐ์ ์ฌ์ฉํฉ๋๋ค.
- ํฉ์ฑ๊ณฑ์ฐ์ฐ์ ํ ๋ ์ด์ด์์๋ง ์ ์ฉํ๋ ๊ฒ์ด ์๋๋ผ ๋ฐ๋ณต์ ์ผ๋ก ์์์ฌ๋ ค์ ์ฌ์ฉํ ์ ์์ต๋๋ค.
- ๋ณด๋ค ๊ธด ๊ธธ์ด์ ์๊ณ์ด ๋ฐ์ดํฐ๋ฅผ ํ๋ฒ์ ์ฒ๋ฆฌํ๊ธฐ ์ํด์๋ Standard Convolution ๋ณด๋ค๋ ์ค๊ฐ ์ง์ ์ ์๋ตํ๋ Dilated Convolution์ ์ฌ์ฉํ๋ฉด ๋ณด๋ค ํจ์จ์ ์ธ ์ ๋ณด์ ์ฒ๋ฆฌ๊ฐ ๊ฐ๋ฅํด์ง๋๋ค.
'Artificial Intelligence' ์นดํ ๊ณ ๋ฆฌ์ ๋ค๋ฅธ ๊ธ
[Thinking] 2023. 4. 27. (0) | 2023.04.28 |
---|---|
[Transformer] Time-Series Transformer (0) | 2023.01.27 |
[Time-Series data] RNN ๊ธฐ๋ฐ ๋ค๋ณ๋ ์๊ณ์ด ๋ฐ์ดํฐ ํ๊ท๋ชจํ (0) | 2023.01.27 |
[Causality] ์ธ๊ณผ์ถ๋ก (0) | 2023.01.26 |
[Self-Supervised Learning and Large-Scale Pre-Trained Models] Part 6 (0) | 2023.01.25 |