[Computer Vision] Quantization & Pruning

2023. 6. 15. 11:55
๐Ÿง‘๐Ÿป‍๐Ÿ’ป์šฉ์–ด ์ •๋ฆฌ

Computer vision
Quantization
Pruning

 

 

Quantization & Pruning

 

์ถœ์ฒ˜ : https://nni.readthedocs.io/en/stable/compression/overview.html

 

์ด Quantization์ด ์™œ ํ•„์š”ํ• ๊นŒ์š”?

 

๊ฒฐ๊ตญ ๋‚˜์˜ค๊ฒŒ ๋œ ์ด์œ ๋Š”,

 

computation๊ณผ memory๋ฅผ ์กฐ๊ธˆ๋งŒ ์‚ฌ์šฉํ•˜๋ฉด์„œ ๋น„์Šทํ•œ accuracy๋ฅผ ๋‚ด๊ณ ์‹ถ๋‹ค๋Š” ๊ฒƒ์ž…๋‹ˆ๋‹ค.

 

์ด๊ฒƒ์ด ๊ฐ€์žฅ ํฐ ์š•๋ง์ด์ฃ .

 

 

ํ•œํŽธ,

 

CNN์ด MLP ๋ณด๋‹ค ์šฐ์ˆ˜ํ•œ ์ด์œ ๋Š”,

 

MLP๋Š” edge ๊ฐœ์ˆ˜๋งŒํผ์˜ parameter์˜ ๊ฐœ์ˆ˜๊ฐ€ ์š”๊ตฌ๋˜์ง€๋งŒ,

 

CNN์€ ์ผ๋ถ€์˜ parameter sharing ๋“ฑ์˜ ์„ฑ์งˆ๋กœ ์ธํ•˜์—ฌ memory๋ฅผ ์กฐ๊ธˆ ์‚ฌ์šฉํ•ฉ๋‹ˆ๋‹ค.

 

๊ทธ๋ฆฌ๊ณ  spare connection์„ ํ†ตํ•ด ์กฐ๊ธˆ์˜ weighted summation์„ ํ•œ๋‹ค๋Š” ๊ฒƒ์ž…๋‹ˆ๋‹ค.

์žˆ์Šต๋‹ˆ๋‹ค. ๋”ฐ๋ผ์„œ, ์ด๋Ÿฌํ•œ ๊ธฐ๋ฒ•์„ ์‚ฌ์šฉํ•  ๋•Œ๋Š” ํ•ญ์ƒ ์„ธ์‹ฌํ•œ ์ฃผ์˜๋ฅผ ๊ธฐ์šธ์—ฌ์•ผ ํ•ฉ๋‹ˆ๋‹ค.

์ด๊ฒƒ์ด ํ•ต์‹ฌ์ด์ฃ .

 

์—ฌ๊ธฐ์„œ CNN๊ณผ MLP๋ฅผ ๋น„๊ตํ•œ ์ด์œ ๊ฐ€ ๋ฌด์—‡์ผ๊นŒ์š”?

 

 

๊ฒฐ๊ตญ ์œ„์—์„œ ์–ธ๊ธ‰ํ•œ parameter sharing๊ณผ spare connection์˜ ์„ฑ์งˆ์„ ํ†ตํ•ด CNN์€ MLP๋ณด๋‹ค computation๋„ ๋” ์ ๊ฒŒํ•˜๊ณ , memory๋„ ์กฐ๊ธˆ ์†Œ๋ชจํ•œ๋‹ค๋Š” ๊ฒƒ์ด์ฃ .

 

๊ทธ๋Ÿฐ๋ฐ ์„ฑ๋Šฅ์€ ๋” ์ข‹์Šต๋‹ˆ๋‹ค.

 

๊ทธ ์ด์œ ๋Š” Regularization ํšจ๊ณผ๋„ ์žˆ๊ณ , ์ด๋ฏธ์ง€ ์ฒ˜๋ฆฌ์— ์žˆ์–ด ์ „์ฒด๋ฅผ ๋ณด๋Š” ๊ฒƒ์ด ์•„๋‹Œ local ๋ถ€๋ถ„์˜ ๊ฒƒ๋“ค์„ ์‚ดํ”ผ๋Š” ๊ฒƒ์ด ๋” ์ข‹์€ ์ ‘๊ทผ๋ฒ•์ด๋ผ๋Š” ๊ฒƒ์ด ๋ฐํ˜€์ง„ ๋ถ€๋ถ„์ž…๋‹ˆ๋‹ค.

 

 

 

 

 

 

 

 

 

"Quantization(์–‘์žํ™”)"๊ณผ "Pruning(๊ฐ€์ง€์น˜๊ธฐ)"๋Š” ๋”ฅ ๋Ÿฌ๋‹ ๋ชจ๋ธ์˜ ํšจ์œจ์„ฑ๊ณผ ์‚ฌ์šฉ ๊ฐ€๋Šฅ์„ฑ์„ ํ–ฅ์ƒ์‹œํ‚ค๋Š” ๋‘ ๊ฐ€์ง€ ์ค‘์š”ํ•œ ๊ธฐ๋ฒ•์ž…๋‹ˆ๋‹ค. ์ด ๋‘ ๊ฐ€์ง€ ๊ธฐ๋ฒ•์ด ํ•„์š”ํ•œ ์ฃผ์š”ํ•œ ์ด์œ ๋Š” ๋‹ค์Œ๊ณผ ๊ฐ™์Šต๋‹ˆ๋‹ค.

๋ชจ๋ธ์˜ ํฌ๊ธฐ ๊ฐ์†Œ: ๋”ฅ ๋Ÿฌ๋‹ ๋ชจ๋ธ๋“ค์€ ์ˆ˜๋ฐฑ๋งŒ, ๋•Œ๋กœ๋Š” ์ˆ˜์‹ญ์–ต์˜ ๋งค๊ฐœ๋ณ€์ˆ˜๋ฅผ ๊ฐ€์งˆ ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค. ์ด๋ ‡๊ฒŒ ํฐ ๋ชจ๋ธ์€ ๋งŽ์€ ์ €์žฅ ๊ณต๊ฐ„์„ ํ•„์š”๋กœ ํ•˜๋ฉฐ, ๋‹ค์šด๋กœ๋“œ ์‹œ๊ฐ„์ด ๊ธธ๊ณ  ๋ฐฐํฌ๊ฐ€ ์–ด๋ ค์šธ ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค. ์–‘์žํ™”์™€ ๊ฐ€์ง€์น˜๊ธฐ๋ฅผ ์‚ฌ์šฉํ•˜๋ฉด ๋ชจ๋ธ ํฌ๊ธฐ๋ฅผ ์ค„์ผ ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค. ํŠนํžˆ, ์–‘์žํ™”๋Š” ๊ฐ ๋งค๊ฐœ๋ณ€์ˆ˜๊ฐ€ ์ฐจ์ง€ํ•˜๋Š” ๋น„ํŠธ ์ˆ˜๋ฅผ ์ค„์ž„์œผ๋กœ์จ ๋ชจ๋ธ ํฌ๊ธฐ๋ฅผ ์ค„์ผ ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค. ๋ฐ˜๋ฉด, ๊ฐ€์ง€์น˜๊ธฐ๋Š” ์ค‘์š”๋„๊ฐ€ ๋‚ฎ์€ ๋งค๊ฐœ๋ณ€์ˆ˜๋ฅผ ์ œ๊ฑฐํ•จ์œผ๋กœ์จ ๋ชจ๋ธ์˜ ํฌ๊ธฐ๋ฅผ ์ค„์ž…๋‹ˆ๋‹ค.

๊ณ„์‚ฐ ํšจ์œจ์„ฑ ํ–ฅ์ƒ: ๋” ์ž‘์€ ๋ชจ๋ธ์€ ๋” ๋น ๋ฅด๊ฒŒ ์‹คํ–‰๋  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค. ์ด๋Š” ์ ์€ ์–‘์˜ ์ปดํ“จํŒ… ๋ฆฌ์†Œ์Šค์—์„œ ๋” ํšจ์œจ์ ์œผ๋กœ ๋™์ž‘ํ•  ์ˆ˜ ์žˆ์Œ์„ ์˜๋ฏธํ•ฉ๋‹ˆ๋‹ค. ์ด๋Ÿฌํ•œ ํŠน์ง•์€ ํŠนํžˆ๋‚˜ ์—์ง€ ์ปดํ“จํŒ… ํ™˜๊ฒฝ(์˜ˆ: ์Šค๋งˆํŠธํฐ, IoT ๋””๋ฐ”์ด์Šค)์—์„œ ์ค‘์š”ํ•ฉ๋‹ˆ๋‹ค.

์—๋„ˆ์ง€ ํšจ์œจ์„ฑ ํ–ฅ์ƒ: ๋ชจ๋ธ ํฌ๊ธฐ ๊ฐ์†Œ์™€ ๊ณ„์‚ฐ ํšจ์œจ์„ฑ ํ–ฅ์ƒ์€ ์—๋„ˆ์ง€ ์†Œ๋ชจ๋„ ์ค„์ผ ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค. ์ด๋Š” ๋ฐฐํ„ฐ๋ฆฌ๋กœ ์ž‘๋™ํ•˜๋Š” ๋””๋ฐ”์ด์Šค์—์„œ ๋งค์šฐ ์ค‘์š”ํ•œ ์š”์†Œ์ž…๋‹ˆ๋‹ค.

๊ณผ์ ํ•ฉ ๊ฐ์†Œ: ๊ฐ€์ง€์น˜๊ธฐ๋Š” ๋ชจ๋ธ์ด ํ•™์Šต ๋ฐ์ดํ„ฐ์— ๊ณผ์ ํ•ฉ๋˜๋Š” ๊ฒƒ์„ ๋ฐฉ์ง€ํ•˜๋Š” ๋ฐ ๋„์›€์ด ๋  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค. ์ด๋Š” ๋ชจ๋ธ์ด ์ผ๋ฐ˜ํ™” ๋Šฅ๋ ฅ์„ ํ–ฅ์ƒ์‹œํ‚ค๋Š” ๋ฐ ๋„์›€์ด ๋ฉ๋‹ˆ๋‹ค.

๋”ฅ ๋Ÿฌ๋‹์˜ ๊ด€์ ์—์„œ ๋ณผ ๋•Œ, ์ด๋Ÿฌํ•œ ๊ธฐ๋ฒ•๋“ค์€ ๋ชจ๋ธ์˜ ์„ฑ๋Šฅ์„ ์œ ์ง€ํ•˜๋ฉด์„œ ํšจ์œจ์„ฑ์„ ํฌ๊ฒŒ ํ–ฅ์ƒ์‹œํ‚ฌ ์ˆ˜ ์žˆ๋Š” ํ›Œ๋ฅญํ•œ ๋„๊ตฌ์ž…๋‹ˆ๋‹ค. ํ•˜์ง€๋งŒ, ๋ชจ๋“  ์ƒํ™ฉ์—์„œ ์–‘์žํ™”์™€ ๊ฐ€์ง€์น˜๊ธฐ๊ฐ€ ์ด์ƒ์ ์ธ ํ•ด๊ฒฐ์ฑ…์€ ์•„๋‹™๋‹ˆ๋‹ค. ์ด ๊ธฐ๋ฒ•๋“ค์€ ํ•ญ์ƒ ํŠธ๋ ˆ์ด๋“œ์˜คํ”„๋ฅผ ํฌํ•จํ•˜๋ฉฐ, ๋•Œ๋•Œ๋กœ ๋ชจ๋ธ์˜ ์˜ˆ์ธก ์„ฑ๋Šฅ์ด ๋–จ์–ด์งˆ ์ˆ˜๋„ ์žˆ์Šต๋‹ˆ๋‹ค. ๋”ฐ๋ผ์„œ, ์ด๋Ÿฌํ•œ ๊ธฐ๋ฒ•์„ ์‚ฌ์šฉํ•  ๋•Œ๋Š” ํ•ญ์ƒ ์„ธ์‹ฌํ•œ ์ฃผ์˜๋ฅผ ๊ธฐ์šธ์—ฌ์•ผ ํ•ฉ๋‹ˆ๋‹ค.

 

 

 

 

 

 

BELATED ARTICLES

more