[Computer Vision] Quantization & Pruning
๐ง๐ป๐ป์ฉ์ด ์ ๋ฆฌ
Computer vision
Quantization
Pruning
Quantization & Pruning
์ด Quantization์ด ์ ํ์ํ ๊น์?
๊ฒฐ๊ตญ ๋์ค๊ฒ ๋ ์ด์ ๋,
computation๊ณผ memory๋ฅผ ์กฐ๊ธ๋ง ์ฌ์ฉํ๋ฉด์ ๋น์ทํ accuracy๋ฅผ ๋ด๊ณ ์ถ๋ค๋ ๊ฒ์ ๋๋ค.
์ด๊ฒ์ด ๊ฐ์ฅ ํฐ ์๋ง์ด์ฃ .
ํํธ,
CNN์ด MLP ๋ณด๋ค ์ฐ์ํ ์ด์ ๋,
MLP๋ edge ๊ฐ์๋งํผ์ parameter์ ๊ฐ์๊ฐ ์๊ตฌ๋์ง๋ง,
CNN์ ์ผ๋ถ์ parameter sharing ๋ฑ์ ์ฑ์ง๋ก ์ธํ์ฌ memory๋ฅผ ์กฐ๊ธ ์ฌ์ฉํฉ๋๋ค.
๊ทธ๋ฆฌ๊ณ spare connection์ ํตํด ์กฐ๊ธ์ weighted summation์ ํ๋ค๋ ๊ฒ์ ๋๋ค.
์์ต๋๋ค. ๋ฐ๋ผ์, ์ด๋ฌํ ๊ธฐ๋ฒ์ ์ฌ์ฉํ ๋๋ ํญ์ ์ธ์ฌํ ์ฃผ์๋ฅผ ๊ธฐ์ธ์ฌ์ผ ํฉ๋๋ค.
์ด๊ฒ์ด ํต์ฌ์ด์ฃ .
์ฌ๊ธฐ์ CNN๊ณผ MLP๋ฅผ ๋น๊ตํ ์ด์ ๊ฐ ๋ฌด์์ผ๊น์?
๊ฒฐ๊ตญ ์์์ ์ธ๊ธํ parameter sharing๊ณผ spare connection์ ์ฑ์ง์ ํตํด CNN์ MLP๋ณด๋ค computation๋ ๋ ์ ๊ฒํ๊ณ , memory๋ ์กฐ๊ธ ์๋ชจํ๋ค๋ ๊ฒ์ด์ฃ .
๊ทธ๋ฐ๋ฐ ์ฑ๋ฅ์ ๋ ์ข์ต๋๋ค.
๊ทธ ์ด์ ๋ Regularization ํจ๊ณผ๋ ์๊ณ , ์ด๋ฏธ์ง ์ฒ๋ฆฌ์ ์์ด ์ ์ฒด๋ฅผ ๋ณด๋ ๊ฒ์ด ์๋ local ๋ถ๋ถ์ ๊ฒ๋ค์ ์ดํผ๋ ๊ฒ์ด ๋ ์ข์ ์ ๊ทผ๋ฒ์ด๋ผ๋ ๊ฒ์ด ๋ฐํ์ง ๋ถ๋ถ์ ๋๋ค.
"Quantization(์์ํ)"๊ณผ "Pruning(๊ฐ์ง์น๊ธฐ)"๋ ๋ฅ ๋ฌ๋ ๋ชจ๋ธ์ ํจ์จ์ฑ๊ณผ ์ฌ์ฉ ๊ฐ๋ฅ์ฑ์ ํฅ์์ํค๋ ๋ ๊ฐ์ง ์ค์ํ ๊ธฐ๋ฒ์
๋๋ค. ์ด ๋ ๊ฐ์ง ๊ธฐ๋ฒ์ด ํ์ํ ์ฃผ์ํ ์ด์ ๋ ๋ค์๊ณผ ๊ฐ์ต๋๋ค.
๋ชจ๋ธ์ ํฌ๊ธฐ ๊ฐ์: ๋ฅ ๋ฌ๋ ๋ชจ๋ธ๋ค์ ์๋ฐฑ๋ง, ๋๋ก๋ ์์ญ์ต์ ๋งค๊ฐ๋ณ์๋ฅผ ๊ฐ์ง ์ ์์ต๋๋ค. ์ด๋ ๊ฒ ํฐ ๋ชจ๋ธ์ ๋ง์ ์ ์ฅ ๊ณต๊ฐ์ ํ์๋ก ํ๋ฉฐ, ๋ค์ด๋ก๋ ์๊ฐ์ด ๊ธธ๊ณ ๋ฐฐํฌ๊ฐ ์ด๋ ค์ธ ์ ์์ต๋๋ค. ์์ํ์ ๊ฐ์ง์น๊ธฐ๋ฅผ ์ฌ์ฉํ๋ฉด ๋ชจ๋ธ ํฌ๊ธฐ๋ฅผ ์ค์ผ ์ ์์ต๋๋ค. ํนํ, ์์ํ๋ ๊ฐ ๋งค๊ฐ๋ณ์๊ฐ ์ฐจ์งํ๋ ๋นํธ ์๋ฅผ ์ค์์ผ๋ก์จ ๋ชจ๋ธ ํฌ๊ธฐ๋ฅผ ์ค์ผ ์ ์์ต๋๋ค. ๋ฐ๋ฉด, ๊ฐ์ง์น๊ธฐ๋ ์ค์๋๊ฐ ๋ฎ์ ๋งค๊ฐ๋ณ์๋ฅผ ์ ๊ฑฐํจ์ผ๋ก์จ ๋ชจ๋ธ์ ํฌ๊ธฐ๋ฅผ ์ค์
๋๋ค.
๊ณ์ฐ ํจ์จ์ฑ ํฅ์: ๋ ์์ ๋ชจ๋ธ์ ๋ ๋น ๋ฅด๊ฒ ์คํ๋ ์ ์์ต๋๋ค. ์ด๋ ์ ์ ์์ ์ปดํจํ
๋ฆฌ์์ค์์ ๋ ํจ์จ์ ์ผ๋ก ๋์ํ ์ ์์์ ์๋ฏธํฉ๋๋ค. ์ด๋ฌํ ํน์ง์ ํนํ๋ ์์ง ์ปดํจํ
ํ๊ฒฝ(์: ์ค๋งํธํฐ, IoT ๋๋ฐ์ด์ค)์์ ์ค์ํฉ๋๋ค.
์๋์ง ํจ์จ์ฑ ํฅ์: ๋ชจ๋ธ ํฌ๊ธฐ ๊ฐ์์ ๊ณ์ฐ ํจ์จ์ฑ ํฅ์์ ์๋์ง ์๋ชจ๋ ์ค์ผ ์ ์์ต๋๋ค. ์ด๋ ๋ฐฐํฐ๋ฆฌ๋ก ์๋ํ๋ ๋๋ฐ์ด์ค์์ ๋งค์ฐ ์ค์ํ ์์์
๋๋ค.
๊ณผ์ ํฉ ๊ฐ์: ๊ฐ์ง์น๊ธฐ๋ ๋ชจ๋ธ์ด ํ์ต ๋ฐ์ดํฐ์ ๊ณผ์ ํฉ๋๋ ๊ฒ์ ๋ฐฉ์งํ๋ ๋ฐ ๋์์ด ๋ ์ ์์ต๋๋ค. ์ด๋ ๋ชจ๋ธ์ด ์ผ๋ฐํ ๋ฅ๋ ฅ์ ํฅ์์ํค๋ ๋ฐ ๋์์ด ๋ฉ๋๋ค.
๋ฅ ๋ฌ๋์ ๊ด์ ์์ ๋ณผ ๋, ์ด๋ฌํ ๊ธฐ๋ฒ๋ค์ ๋ชจ๋ธ์ ์ฑ๋ฅ์ ์ ์งํ๋ฉด์ ํจ์จ์ฑ์ ํฌ๊ฒ ํฅ์์ํฌ ์ ์๋ ํ๋ฅญํ ๋๊ตฌ์
๋๋ค. ํ์ง๋ง, ๋ชจ๋ ์ํฉ์์ ์์ํ์ ๊ฐ์ง์น๊ธฐ๊ฐ ์ด์์ ์ธ ํด๊ฒฐ์ฑ
์ ์๋๋๋ค. ์ด ๊ธฐ๋ฒ๋ค์ ํญ์ ํธ๋ ์ด๋์คํ๋ฅผ ํฌํจํ๋ฉฐ, ๋๋๋ก ๋ชจ๋ธ์ ์์ธก ์ฑ๋ฅ์ด ๋จ์ด์ง ์๋ ์์ต๋๋ค. ๋ฐ๋ผ์, ์ด๋ฌํ ๊ธฐ๋ฒ์ ์ฌ์ฉํ ๋๋ ํญ์ ์ธ์ฌํ ์ฃผ์๋ฅผ ๊ธฐ์ธ์ฌ์ผ ํฉ๋๋ค.
'Artificial Intelligence > Deep Learning' ์นดํ ๊ณ ๋ฆฌ์ ๋ค๋ฅธ ๊ธ
[Deep Learning] Deep Generative Models(2) - GAN (0) | 2023.06.01 |
---|---|
[Deep Learning] Deep Generative Models(1) - VAE (0) | 2023.05.29 |
[Deep Learning] Autoencoders (0) | 2023.05.23 |
[Deep Learning] Recurrent Neural Network (4) - Transformer (0) | 2023.05.20 |
[Deep Learning] Recurrent Neural Network (3) - Attention (0) | 2023.05.19 |