[Computer Vision] Segmentation

2023. 5. 7. 16:38
๐Ÿง‘๐Ÿป‍๐Ÿ’ป์šฉ์–ด ์ •๋ฆฌ

Computer vision
Edge
Segmentation
clustering
semantic segmentation
Otsu's Method
average
variance
moving average
threshold
within-class
between-class

 

 

์ด๋ฒˆ์—๋Š” Segmentation์œผ๋กœ ๋” grouping์„ ํ†ตํ•ด,

 

clustering์„ ํ†ตํ•ด์„œ ๋ฐ์ดํ„ฐ๋ฅผ ์–ด๋–ป๊ฒŒ ๋” ์˜๋ฏธ์žˆ๊ฒŒ ๋‚˜๋ˆŒ ์ˆ˜ ์žˆ์„๊นŒ๋ฅผ ์‚ดํŽด๋ณด๊ฒ ์Šต๋‹ˆ๋‹ค.

 

 

 

Segmentation

 

 

image์— ๋Œ€ํ•ด์„œ pixel ๋“ค์„ ๋ญ‰์น˜๋Š” ๊ฒƒ์— ๋Œ€ํ•ด์„œ clustering ๋ณด๋‹ค๋Š” Segmentation์ด๋ผ๋Š” ๋‹จ์–ด๋ฅผ ๋งŽ์ด ์”๋‹ˆ๋‹ค.

 

๋‘ ๋‹จ์–ด๊ฐ€ ๋น„์Šทํ•˜๋‹ค๊ณ  ๋ณด์…”๋„ ๋ฉ๋‹ˆ๋‹ค.

 

์˜๋ฏธ๊ฐ€ ๋งž๋Š” pixel ๋ผ๋ฆฌ ๊ฐ™์€ groupํ™” ํ•˜๋Š” ๊ฒƒ๋„ ๋ณด์ž…๋‹ˆ๋‹ค.

 

 

๊ทธ๋ž˜์„œ group์€ ๋น„์Šทํ•œ ๊ฒƒ์„ ํ•˜๋Š” ๊ฒƒ์ธ๋ฐ,

 

์ด ๋น„์Šทํ•˜๋‹ค๋Š” ๊ฒƒ์€ ๋ชจํ˜ธํ•จ์ด ์žˆ์Šต๋‹ˆ๋‹ค.

 

๊ทธ๋ž˜์„œ ์œ„ ์™ผ์ชฝ ์•„๋ž˜ ์‚ฌ์ง„์ฒ˜๋Ÿผ pixel ๋งˆ๋‹ค ์–ด๋–ค class์ธ๊ฐ€๋ฅผ ๋งž์ถ”๋Š” ๊ฒƒ์€ ๋” ๋ช…ํ™•ํ•œ segmentation์ด ๋˜๊ฒ ์Šต๋‹ˆ๋‹ค.

 

 

์ด์™ธ์—๋„ segmentation์—์„œ๋Š” ๋‹ค์Œ๊ณผ ๊ฐ™์€ ๊ฒƒ๋“ค์ด ์žˆ์Šต๋‹ˆ๋‹ค.

 

  • Segmentation method (before deep learning)
    • K-meas clustering
    • Mean shift
    • Normalized-cut
    • Graph cut
    • Random-walk
    • Markov ranodm field (MRF) optimization

๊ฒฐ๊ตญ Deep Learning์ด ๋„์ž…๋˜๊ธฐ ์ „์—๋„ ์ด๋Ÿฌํ•œ image segmentation์— ๋Œ€ํ•œ ์—ฐ๊ตฌ๊ฐ€ ์ง„ํ–‰์ด ๋˜์—ˆ์Šต๋‹ˆ๋‹ค.

 

๊ทธ๋ฆฌ๊ณ , ์–ด๋–ป๊ฒŒ ๋น„์Šทํ•œ pixel๋“ค๋ผ๋ฆฌ ๋ญ‰์น ๊นŒ, ๋น„์Šทํ•œ ์˜๋ฏธ์˜ pixel๋“ค์„ ์–ด๋–ป๊ฒŒ ๋ญ‰์น ๊นŒ์— ๋Œ€ํ•œ ๊ณ ๋ฏผ์ด ๊ณ„์† ๋˜์—ˆ์ฃ .

 

์—ฌ๋Ÿฌ ๊ฐ€์ง€ ๋ฐฉ๋ฒ•์ด ์žˆ์—ˆ์ง€๋งŒ,

 

pixel์„ ํ•˜๋‚˜์˜ node๋กœ ๋ณธ๋‹ค๋ฉด, 8-neighborhoods์™€ ๊ฐ™์€ ๊ฒƒ์˜ ๊ฐœ๋…์—์„œ๋„ edge๋กœ ์—ฐ๊ฒฐํ•˜๋Š” ๊ฒƒ์ด ์žˆ์ฃ .

 

edge์™€ node๋งŒ ์žˆ์œผ๋ฉด, graph๋ฅผ ๊ทธ๋ฆด ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค.

 

edge๋ฅผ ์—ฐ๊ฒฐํ•˜๊ณ  edge weight๋ฅผ ํ†ตํ•ด node๋ผ๋ฆฌ ๊ฐ€๊นŒ์šด์ง€๋ฅผ ์‚ดํ•„ ์ˆ˜๋„ ์žˆ์Šต๋‹ˆ๋‹ค.

 

 

์ด์™€ ๊ฐ™์ด ๋น„์Šทํ•œ ๊ฒƒ๋ผ๋ฆฌ ๋ญ‰์น˜๋Š” ๋ฐฉ๋ฒ•๋„ ์กด์žฌํ–ˆ์Šต๋‹ˆ๋‹ค.

 

๋ณด์ด์‹œ๋Š” ๊ฒƒ์ฒ˜๋Ÿผ ๊ฒฐ๊ณผ๊ฐ€ ๊ทธ๋ ‡๊ฒŒ ์ž˜ ๋‚˜์˜ค์ง„ ์•Š์Šต๋‹ˆ๋‹ค.

 

 

 

์š”์ฆ˜์€ ์ฒซ๋ฒˆ์งธ ์‚ฌ์ง„๊ณผ ๊ฐ™์ด semantic segmentation์„ ํ†ตํ•ด ํ•™์Šต ๊ธฐ๋ฐ˜์œผ๋กœ class๋ฅผ ๋ฏธ๋ฆฌ ์ •์˜ํ•ด๋†“๊ณ  class์— ํ•ด๋‹น๋˜๋Š” ๊ฒƒ์„ ๋งž์ถ”๊ฒŒ ํ•˜๋„๋ก ์ ‘๊ทผํ•ฉ๋‹ˆ๋‹ค.

 

์•„๋‹ˆ๋ฉด ์œ„์™€ ๊ฐ™์ด ์‚ฌ๋ฌผ ๊ฐ์ฒด ์ธ์‹, ์•„๋‹ˆ๋ฉด instance์— ๋Œ€ํ•ด์„œ๋งŒ ๋ถ„ํ•  ํ•  ์ˆ˜๋„ ์žˆ์Šต๋‹ˆ๋‹ค.

 

๊ทธ๋Ÿฐ๋ฐ ์šฐ๋ฆฌ๋Š” ๊ฐ€์žฅ classicํ•œ ๋ฐฉ๋ฒ•์€ image thresholding์— ๋Œ€ํ•ด ๋ฐฐ์›Œ๋ณผ ๊ฒƒ์ž…๋‹ˆ๋‹ค.

 

์ด์ œ ๋ณธ๋ก ์œผ๋กœ ๋“ค์–ด๊ฐ€ ๋ด…์‹œ๋‹ค.

 

 

Image thresholding

 

์ด์ „ ์‹œ๊ฐ„์— ์šฐ๋ฆฌ๋Š” threshold์„ ํ†ตํ•ด edge์ด๋‹ค ์•„๋‹ˆ๋‹ค๋ฅผ ๋‚˜๋ˆ„์—ˆ์Šต๋‹ˆ๋‹ค.

 

์ด๋ฒˆ์—๋Š” pixel ๊ฐ’์„ ๋ณด๊ณ  ํŒ๋‹จํ•˜๋Š” ๊ฒƒ์ž…๋‹ˆ๋‹ค.

 

 

๋ฐฐ๊ฒฝ์€ background, ์ „๊ฒฝ์€ foreground๋ผ๊ณ  ๋ณด๋ฉด ์ด ๋‘ ๊ฐ€์ง€๋ฅผ ๋ถ„๋ฅ˜ํ•˜๊ณ  ์‹ถ๋‹ค๊ณ  ํ•˜๋ฉด,

 

์œ„ ์‚ฌ์ง„๊ณผ ๊ฐ™์ด ์ด์ง„ ๋ถ„๋ฅ˜๋œ ๊ฒฐ๊ณผ, ์ฆ‰ binary segmentation์˜ ๊ฒฐ๊ณผ๋ฅผ ์–ป์„ ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค.

 

 

์˜ค๋Š˜์€ ๋‹ค์Œ๊ณผ ๊ฐ™์ด ์ด์ง„ํ™”ํ•˜๊ธฐ ์ข‹์€, ๋ฐฐ๊ฒฝ - ์ „๊ฒฝ์œผ๋กœ ๋ถ„๋ฅ˜ํ•˜๊ธฐ ํŽธํ•œ ์ด๋ฏธ์ง€๋ฅผ ๋‹ค๋ฃจ๊ฒ ์Šต๋‹ˆ๋‹ค.

 

์ด threshold๋ฅผ ํ†ตํ•ด, threshold ๋ณด๋‹ค ํฌ๋ฉด 1, threshold ๋ณด๋‹ค ์ž‘์œผ๋ฉด 0์œผ๋กœ ๋ด…๋‹ˆ๋‹ค.

 

์ด๋Ÿฌํ•œ single threshold์„ ํ†ตํ•ด ์•„๋ž˜์™€ ๊ฐ™์ด ๋ฐ•ํ…Œ๋ฆฌ์•„๋ฅผ ๋ถ„๋ฅ˜ํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค.

 

 

์œ„์™€ ๊ฐ™์ด threshold๋ฅผ ์ง์ ‘ ์ง€์ •ํ•ด์ฃผ๋ฉฐ ๊ฒฐ๊ณผ๊ฐ€ ์ž˜ ๋‚˜์˜ค๋Š”์ง€๋ฅผ ์‚ดํŽด๋ด์•ผํ•ฉ๋‹ˆ๋‹ค.

 

๊ทธ๋Ÿผ ์‚ฌ๋žŒ์ด ํ•˜๋‚˜ํ•˜๋‚˜ ๋„ฃ์–ด์ฃผ์–ด์•ผํ•˜๋Š” ๋ฒˆ๊ฑฐ๋กœ์›€์ด ์žˆ๊ฒ ์ฃ .

 

๊ทธ๋ž˜์„œ ์šฐ๋ฆฌ๋Š” ์ด threshold๋ฅผ ๊ฒฐ์ •ํ•˜๋Š” ๋ฐฉ๋ฒ•, ์˜ˆ์ธกํ•˜๋Š” ๋ฐฉ๋ฒ•์„ ๋ฐฐ์›Œ๋ณด๊ฒ ์Šต๋‹ˆ๋‹ค.

 

 

 

๊ทธ๋ฆฌ๊ณ  ์•„๋ž˜ ์˜ˆ์‹œ๋Š” threshold๋ฅผ ํ†ตํ•ด ์ด๋ฏธ์ง€ ์ƒ์—์„œ ๊ฐ€๋ ค์ ธ ์žˆ๋Š” ๊ฒƒ์„ ๋ณผ ์ˆ˜ ์žˆ๋‹ค๋Š” ๊ฒƒ์„ ๋ณด์—ฌ์ค๋‹ˆ๋‹ค.

 

 

 

๊ทธ๋ฆฌ๊ณ  ๋‹ค๋ฅธ threshold ์˜ˆ์‹œ๋กœ Double thresholding์„ ์‚ฌ์šฉํ•  ์ˆ˜๋„ ์žˆ์Šต๋‹ˆ๋‹ค.

 

Canny edge์— ํ–ˆ๋˜ ๋ฐฉ๋ฒ•์„ ์‚ฌ์šฉํ•˜์—ฌ class๋ฅผ 3๊ฐœ๋กœ ๋งŒ๋“ค์–ด, weak edge๋Š” ๋˜๋‹ค๋ฅธ ํ›„์ฒ˜๋ฆฌ๋ฅผ ํ†ตํ•ด ๊ฒฐ์ •ํ•˜๋Š” ๊ทธ๋Ÿฌํ•œ ๊ฒƒ๋„ ํ•ด๋ณผ ์ˆ˜๊ฐ€ ์žˆ์Šต๋‹ˆ๋‹ค.

 

๋˜๋Š” threshold๋ฅผ ๋‘ ๊ฐœ ์„ค์ •ํ•˜์—ฌ ๊ทธ ์‚ฌ์ด์— ์žˆ๋Š” ๊ฐ’๋งŒ ๋ฝ‘์•„์˜ฌ ์ˆ˜๋„ ์žˆ๊ฒ ์ฃ .

 

๊ทธ๋Ÿฌํ•œ ๋ฐฉ๋ฒ•์ด ์žˆ๋Š” ๊ฒƒ์„ ์•Œ์•„๋‘์‹œ๋ฉด ๋ฉ๋‹ˆ๋‹ค.

 

 

 

๊ทธ๋ฆฌ๊ณ , threshold๋ฅผ ํ†ตํ•ด์„œ noise๊ฐ€ ๋ฐฐ๊ฒฝ์— ๊ปด์žˆ๋Š” ๋‹ค์Œ๊ณผ ๊ฐ™์€ Image์— ๋Œ€ํ•ด์„œ ๋‚ ๋ ค๋ฒ„๋ฆฌ๋Š” ํšจ๊ณผ๋ฅผ ๊ฐ€์ ธ์˜ค๊ธฐ๋„ ํ•ฉ๋‹ˆ๋‹ค.

 



 

๊ฒฐ๊ตญ threshold๋Š” ์–ด๋–ค ๊ธฐ์ค€์„ ์„ธ์›Œ์„œ ํฌ๊ณ  ์ž‘์€ ๊ฒƒ๋“ค์„ ๋ถ„๋ฅ˜ํ•˜๋Š” ๊ทธ๋Ÿฐ ๊ฒƒ์ด๋‹ค ๋ณด๋‹ˆ, noise์— ๋Œ€ํ•ด์„œ threshold ์ด์ƒ์ด๋ฉด ์žก์Œ์œผ๋กœ ๊ฒฐ๊ณผ์— ๋‚˜ํƒ€๋‚˜๊ธฐ๋„ ํ•ฉ๋‹ˆ๋‹ค.

 

threshold๋ฅผ ์ด๋ฏธ์ง€์— ๋Œ€ํ•ด ๋ฐ”๋กœ ๊ฑฐ์น˜๋ฉด, ์ด๋Ÿฌํ•œ ์žก์Œ์ด ๊ทธ๋Œ€๋กœ ๋‚˜์˜ค๊ฒŒ ๋ฉ๋‹ˆ๋‹ค.

 

๊ทธ๋ž˜์„œ, ์ด๋Ÿฌํ•œ ์žก์Œ์„ ์—†์• ๊ธฐ ์œ„ํ•ด smoothing filter๋ฅผ ๊ฑฐ์นœ ํ›„ ๊ทธ๊ฒƒ์— threshold๋ฅผ ์ทจํ•˜๋Š” ๊ฒƒ์œผ๋กœ ์ง„ํ–‰ํ•˜๋Š” ๊ฒƒ์ž…๋‹ˆ๋‹ค.

 

์ด ๊ณผ์ •์—์„œ ์ „์ฒ˜๋ฆฌ๋กœ์„œ average filter๋‚˜ Gaussian filter๊ฐ€ ํ™œ์šฉ๋  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค.

 

 

๊ทธ๋ž˜์„œ ์–ด๋–ป๊ฒŒ threshold๋ฅผ ์˜ˆ์ธกํ•  ์ˆ˜ ์žˆ์„๊นŒ์š”?

 

 

๊ทธ๋ ‡๋‹ค๋ฉด, ์œ„์™€ ๊ฐ™์ด foreground, background๋ฅผ ๋‚˜๋ˆ„์–ด์„œ ๋ณผ ๋•Œ,

 

threshold๋ฅผ ๋‚ฎ๊ฒŒ ์žก์œผ๋ฉด ๋„ˆ๋ฌด ๋งŽ์ด ๋‚ ๋ผ๊ฐ€ ๋ฒ„๋ฆฌ๊ณ , ๋ฐ˜๋Œ€๋กœ threshold๋ฅผ ๋†’๊ฒŒ ์žก์œผ๋ฉด ๋„ˆ๋ฌด ๋งŽ์ด ๋‚จ์Šต๋‹ˆ๋‹ค.

 

์—ฌ๊ธฐ์„œ threshold๋ฅผ ๊ฒฐ์ •ํ•˜๋Š” ๊ฒƒ์„ ์—ฌ๋Ÿฌ ๋ฒˆ ๋” ํ•ด์•ผ ์ข€ ๋” ๊ดœ์ฐฎ์€ ์ •๋ณด๋ฅผ ์–ป์„ ์ˆ˜๊ฐ€ ์žˆ๋Š”๋ฐ, ์ด๊ฒƒ์„ ์ง์ ‘ํ•˜๋Š” ๊ฒƒ์€ ๋ฒˆ๊ฑฐ๋กญ์Šต๋‹ˆ๋‹ค.

 

๊ทธ๋ž˜์„œ ์ด threshold๋ฅผ ์–ด๋–ป๊ฒŒ ์ž๋™์œผ๋กœ ๊ฒฐ์ •ํ•  ์ˆ˜ ์žˆ์„๊นŒ์š”?

 

 

์•„๋ž˜์™€ ๊ฐ™์ด image์— ๋Œ€ํ•œ histogram์„ ๋ด…์‹œ๋‹ค.

 

0 ~ 255์˜ pixel ๊ฐ’์ด image ์ƒ์—์„œ ๋ช‡ ๋ฒˆ ๋ฐœ์ƒํ–ˆ๋Š”์ง€ ์นด์šดํŠธํ•ด์„œ ๋ณด์—ฌ์ค๋‹ˆ๋‹ค.

 

y์ถ•์ด pixel์˜ ๊ฐœ์ˆ˜๊ฐ€ ๋ฉ๋‹ˆ๋‹ค.

 

๊ทธ๊ฒƒ์„ ์‚ดํŽด๋ณด๋‹ˆ, 2๊ฐœ๋กœ ๋ถ„๋ฅ˜ํ•  ์ˆ˜ ์žˆ๋Š” image์— ๋Œ€ํ•ด์„œ๋Š” dominantํ•œ ๋‘ ๋ถ„ํฌ๊ฐ€ ๋ณด์ž…๋‹ˆ๋‹ค.

 

๊ทธ๋ ‡๋‹ค๋ฉด, ์ด ์‚ฌ์ด์˜ ๊ฐ’์„ ์ž˜ ๊ฒฐ์ •ํ•˜๋ฉด, ์ด ๋‘ ๊ฐ€์ง€๋ฅผ ์ž˜ ๊ฒฐ์ •ํ•  ์ˆ˜ ์žˆ์„ ๊ฒƒ ๊ฐ™์•„ ๋ณด์ž…๋‹ˆ๋‹ค.

 

 

 

๊ฒฐ๊ตญ, ์ด ๋‘ histogram์„ ์ž˜ ๋ถ„๋ฆฌํ•˜๋Š” threshold ๊ฐ’์„ ์ฐพ๋Š” ๊ฒƒ์ž…๋‹ˆ๋‹ค.

 

๋’ค ์ชฝ์— ์žˆ๋Š” ๊ฒƒ์ด ์–ด๋‘์šด ๊ฐ’์ด๋‹ˆ background์— ํ•ด๋‹นํ•˜๋Š” ๊ฐ’์ผ ํ…Œ๊ณ , ์•ž ์ชฝ์— ์žˆ๋Š” ๊ฐ’์ด foreground์— ํ•ด๋‹นํ•˜๋Š” ๊ฐ’์ด๊ฒ ์ฃ .

 

๊ทธ๋ž˜์„œ ํ•˜๋‚˜์˜ threshold๋ฅผ ์ž˜ ๊ณจ๋ผ์„œ ์ข‹์€ Segmentation ๊ฒฐ๊ณผ๋ฅผ ์–ป์„ ์ˆ˜ ์žˆ๊ฒ ๋‹ค๊ณ  ๊ธฐ๋Œ€ํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค.

 

 

์ด threshold๋„ ํ•˜๋‚˜์˜ pixel ๊ฐ’์ด๋‹ˆ, ์ด ๊ฐ’์„ ์ดํ•˜ k๋ผ๊ณ  ์นญํ•˜๊ฒ ์Šต๋‹ˆ๋‹ค.

 

์ด๊ฒƒ์€ k : 0 ~ 255์˜ ๊ฐ’์„ ๊ฐ€์ง€๊ฒ ์Šต๋‹ˆ๋‹ค.

 

์ด k๋ฅผ 0๋ถ€ํ„ฐ 256๊นŒ์ง€์˜ ๊ฐ’์ผ ๋•Œ์˜ ์—ฐ์‚ฐ์„ ํ†ตํ•ด ์ตœ์ ์˜ k์˜ ๊ฐ’์„ ์ฐพ์Šต๋‹ˆ๋‹ค.

 

๊ทธ๊ฒƒ์ด ์ž๋™์œผ๋กœ k๋ฅผ ๊ตฌํ•˜๋Š” ๋ฐฉ๋ฒ•์ž…๋‹ˆ๋‹ค.

 

 

 

๊ทธ๋ž˜์„œ, ์ด ๋‘ histogram์— ๋Œ€ํ•ด์„œ threshold๋ฅผ ๊ณ„์‚ฐํ•ด์ฃผ๋Š” algorithm์ด ํ•„์š”ํ•ฉ๋‹ˆ๋‹ค.

 

Otsu's Method

 

 

 

๋‘ histogrm ๋ถ„ํฌ์˜ threshold๋ฅผ ์ž๋™์œผ๋กœ ๊ฒฐ์ •ํ•ด์ฃผ๋Š” ๊ธฐ๋ฒ•์ž…๋‹ˆ๋‹ค.

 

์•„๋ž˜์™€ ๊ฐ™์ด group์„ 2๊ฐœ๋กœ ๋‚˜๋ˆ„๊ฒ ์Šต๋‹ˆ๋‹ค.

 

์ด๋Š” k ๊ฐ’์— ์˜ํ•ด ๋‚˜๋ˆ„์–ด์ง„ group ๋‘ ๊ฐœ์ž…๋‹ˆ๋‹ค.

 

 

 

์™ผ์ชฝ group1์€ k ๋ณด๋‹ค ๊ฐ™์ด ์ž‘์€ ๊ฐ’๋“ค์ด๊ณ  ์˜ค๋ฅธ์ชฝ group2๋Š” k ๋ณด๋‹ค ํฐ ๊ฐ’๋“ค์ž…๋‹ˆ๋‹ค.

 

๊ทธ๋ ‡๋‹ค๋ฉด ์ž˜ ๋ถ„๋ฅ˜ํ–ˆ๋‹ค๋Š” ๊ธฐ์ค€์€ ์–ด๋–ค ๊ฒŒ ์žˆ์„๊นŒ์š”?

 

๊ฐ™์€ group์ธ ๊ฐ’๋“ค๋ผ๋ฆฌ ๋น„์Šทํ•œ pixel ๊ฐ’๋“ค์„ ๊ฐ€์ ธ์•ผ ์šฐ๋ฆฌ๊ฐ€ ์ž˜ groupingํ–ˆ๋‹ค๊ณ  ๋ณผ ์ˆ˜ ์žˆ๊ฒŒ๋ฉ๋‹ˆ๋‹ค.

 

๊ทธ๊ฒƒ๋“ค์„ ์‚ดํŽด๋ณด๋Š” ์ง€ํ‘œ์—๋Š” ๋ถ„์‚ฐ์„ ๊ตฌํ•˜๋Š” ๋ฐฉ๋ฒ•์ด ์žˆ์Šต๋‹ˆ๋‹ค.

 

๋ถ„์‚ฐ ๊ณ„์‚ฐ ์‹œ ํ‰๊ท  ๊ตฌํ•˜๊ณ  ๊ฐ ๊ฐ’์— ํ‰๊ท ์„ ๋นผ์„œ ์ œ๊ณฑํ•˜์—ฌ ๊ตฌํ–ˆ์—ˆ์ฃ .

 

 

๊ทธ๋ ‡๋‹ค๋ฉด ๊ฐ ๊ฐ’๋“ค์ด ํ‰๊ท  ๊ธฐ์ค€์œผ๋กœ ๋ชฐ๋ ค ์žˆ์„ ์ˆ˜๋ก ๋ถ„์‚ฐ ๊ฐ’์ด ๋‚ฎ์„ ๊ฒƒ์ž…๋‹ˆ๋‹ค.

 

๊ทธ ๊ฐ’๋“ค ๋ผ๋ฆฌ ๋น„์Šทํ•ด์•ผํ•œ๋‹ค๋Š” ๊ฒƒ์„ ๋ณด๋ ค๋ฉด ๋ถ„์‚ฐ์ด ๋‚ฎ์•„์•ผํ•œ๋‹ค๋Š” ๋œป์ž…๋‹ˆ๋‹ค.

 

intra-class variance

 

์ด group, ์ฆ‰ class ์•ˆ์—์„œ ์ด๋ฃจ์–ด์ง€๋Š” ๋ถ„์‚ฐ์„ within-class ๋˜๋Š” intra-class variance๋ผ๊ณ  ๋ถ€๋ฆ…๋‹ˆ๋‹ค.

 

์ด๊ฒƒ์€ weighted sum of variances of the two classes์˜ ๋ฐฉ์‹์œผ๋กœ ๊ตฌํ•ฉ๋‹ˆ๋‹ค.

 

์œ„์—์„œ ๊ตฌํ•œ ๋‘ ๋ถ„์‚ฐ์˜ ํ•ฉ์ด ์ž‘์•„์•ผ ์šฐ๋ฆฌ๊ฐ€ ์ ์ ˆํ•œ k ๊ฐ’์„ ๊ตฌํ–ˆ๋‹ค๊ณ  ๋ณผ ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค.

 

0๋ถ€ํ„ฐ 255๊นŒ์ง€ k์˜ ๊ฐ’์„ ๊ณ„์† ๋ฐ”๊พธ๋ฉฐ group 1, 2๊ฐ€ ๊ณ„์† ๋ฐ”๋€Œ๊ณ  ๋ถ„์‚ฐ 1, 2๋„ ๊ณ„์† ๋ฐ”๋€Œ๋ฉฐ ์ด ๋ถ„์‚ฐ์˜ ํ•ฉ์ด ์ตœ์†Ÿ๊ฐ’์„ ๊ฐ–๋Š” k๋ฅผ ์„ ํƒํ•˜๊ฒ ๋‹ค๋Š” ๊ฒƒ์ž…๋‹ˆ๋‹ค.

 

 

์œ„๋Š” class ์•ˆ์—์„œ ๋ณธ ๊ฒƒ์ž…๋‹ˆ๋‹ค.

 

๊ทธ๋ฆฌ๊ณ , ์œ„ ๋‚˜๋ˆˆ group1๊ณผ group2๊ฐ€ ์–ผ๋งˆ๋‚˜ ๋‹ค๋ฅธ์ง€๋„ ๋ด์•ผํ•ฉ๋‹ˆ๋‹ค.

 

 

inter-class variance

 

์ด์ œ ๋‚ด๋ถ€์—์„œ ์‚ดํ”ผ๊ฒ ์Šต๋‹ˆ๋‹ค.

 

group1๊ณผ group2 pixel์˜ ๋ถ„ํฌ๊ฐ€ ์–ผ๋งˆ๋‚˜ ๋‹ค๋ฅธ๊ฐ€๋ฅผ ์‚ดํŽด๋ณด์•„์•ผํ•ฉ๋‹ˆ๋‹ค.

 

์ด ์„œ๋กœ ๋‹ค๋ฅธ class๊ฐ„ ๋น„๊ต๋ฅผ ํ•  ๋•Œ bwtween-class, ๋˜๋Š” inter-class variance๋ฅผ ๊ตฌํ•ฉ๋‹ˆ๋‹ค.

 

์ด ๋ถ„์‚ฐ์€ ์ปค์•ผํ•ฉ๋‹ˆ๋‹ค.

 

๋ถ„ํฌ๊ฐ€ ๋‹ค๋ฅธ์ง€๋ฅผ ๋ณด๋Š” ๊ฒƒ์ด๊ธฐ ๋•Œ๋ฌธ์ž…๋‹ˆ๋‹ค.

 

์ด๊ฒƒ์€ maximizeํ•ด์•ผํ•˜๋Š” ๊ฒƒ์ด์ฃ .

 

 

 

๋‘ ๊ฐœ๋ฅผ ๊ฐ™์ด ์กฐํ•ฉํ•˜์—ฌ ์‚ฌ์šฉํ•˜๊ธฐ๋„ ํ•˜๊ณ , ๋‘˜ ์ค‘ ํ•˜๋‚˜๋งŒ ์‚ฌ์šฉํ•˜๊ธฐ๋„ ํ•ฉ๋‹ˆ๋‹ค.

 

 

 

์ž, ๊ทธ๋ ‡๋‹ค๋ฉด ์šฐ๋ฆฌ์—๊ฒŒ image ํ•˜๋‚˜๊ฐ€ ์ฃผ์–ด์ง„๋‹ค๊ณ  ํ•˜๊ฒ ์Šต๋‹ˆ๋‹ค.

 

์ด image๋Š” ํฌ๊ธฐ๊ฐ€ M x N์ž…๋‹ˆ๋‹ค. pixel์˜ ๊ฐœ์ˆ˜๊ฐ€ M x N๊ฐœ ์žˆ๋Š” ๊ฒƒ์ด์ฃ 

 

๊ทธ๋ฆฌ๊ณ , pixel ๊ฐ’์ด L๊ฐœ์˜ intensity๊ฐ€ ์žˆ์Šต๋‹ˆ๋‹ค.

 

๊ทธ๋Ÿฐ๋ฐ ์šฐ๋ฆฌ๊ฐ€ ๋‹ค๋ฃจ๋Š” image๋Š” 0 ~ 255์˜ pixel ๊ฐ’์„ ๊ฐ€์ง€๋ฏ€๋กœ L์€ 256์ž…๋‹ˆ๋‹ค.

 

 

๊ทธ๋Ÿฌ๋‚˜ ์–ด๋””์—์„œ๋‚˜ image๊ฐ€ 8๋น„ํŠธ์ธ ๊ฒƒ์€ ์•„๋‹™๋‹ˆ๋‹ค. 10๋น„ํŠธ 12๋น„ํŠธ ์งœ๋ฆฌ๊ฐ€ ์žˆ๊ธฐ๋„ ํ•ฉ๋‹ˆ๋‹ค.

 

๋‹ค๋ฅธ ๋ฐ์„œ๋„ ์ด  Otsu's ๋ฐฉ๋ฒ•์ด ์‚ฌ์šฉ ๊ฐ€๋Šฅํ•ฉ๋‹ˆ๋‹ค.

 

๊ทธ๋ฆฌ๊ณ  n i๋Š” pixel ๊ฐ’ i์˜ histogram ๊ฐ’์ด ๋ฉ๋‹ˆ๋‹ค.

 



 

๊ทธ๋Ÿฐ๋ฐ, ์ด ๊ฐ’์„ ์ „์ฒด pixel ๊ฐœ์ˆ˜๋กœ ๋‚˜๋ˆ ์ฃผ์–ด ํ™•๋ฅ ๊ฐ’์ฒ˜๋Ÿผ ๋ณด์ด๊ฒŒ ํ•ฉ๋‹ˆ๋‹ค.

 

์ด p i๋Š” ๊ฐœ์ˆ˜ ์ž์ฒด์˜ ๊ฐ’์€ ์•„๋‹ˆ์ง€๋งŒ n i์— ๋น„๋ก€ํ•ฉ๋‹ˆ๋‹ค.

 

์ •ํ™•ํžˆ ๊ฐœ์ˆ˜๋Š” ์•„๋‹ˆ์ง€๋งŒ ๊ฐœ์ˆ˜๋กœ ๋ฐ›์•„๋“ค์ด๊ณ  ๋„˜์–ด๊ฐ‘์‹œ๋‹ค.

 

 

์ด ์‹์— ์˜ํ•ด ์œ„ ์ด ํ•ฉ์€ 1์ด ๋ฉ๋‹ˆ๋‹ค.

 

 

 

๋‹ค์‹œ ๋Œ์•„์˜ค๋ฉด,

 

์ด threshold k์— ์˜ํ•ด class๊ฐ€ ๋‘ ๊ฐœ๋กœ ๋‚˜๋‰ฉ๋‹ˆ๋‹ค.

 

์—ฌ๊ธฐ์„œ ํ•˜๋‚˜์˜ ์•ฝ์†์ด ํ•„์š”ํ•ฉ๋‹ˆ๋‹ค.

 

k๊ฐ€ class 1 or class 2์— ์†ํ• ์ง€์ž…๋‹ˆ๋‹ค.

 

์—ฌ๊ธฐ์„  class 1์— ๋„ฃ๊ฒ ์Šต๋‹ˆ๋‹ค.

 



์–ด๋””์— ๋„ฃ๋“  ์ƒ๊ด€์€ ์—†์Šต๋‹ˆ๋‹ค.

 

0 ~ k์˜ ๊ฐ’์€ class 1, k+1 ~ L-1 ์€ class 2๊ฐ€ ๋ฉ๋‹ˆ๋‹ค.

 

 

์šฐ์„ , class 1์—์„œ์˜ ํ‰๊ท ๊ณผ ๋ถ„์‚ฐ์„ ๊ตฌํ•˜๋Š” ๊ณผ์ •์„ ์‚ดํŽด๋ด…์‹œ๋‹ค.

 

 

class 1์— ์†ํ•˜๋Š” histogram ๊ฐ’๋“ค์˜ ํ•ฉ์— M x N์„ ๋‚˜๋ˆ ์ค€ ๊ฒƒ์ด q 1(k)์ž…๋‹ˆ๋‹ค.

 

 

์—ฌ๊ธฐ์„œ ํ‰๊ท ์„ ๊ณ„์‚ฐํ•ด์ค„ ๊ฒƒ์ž…๋‹ˆ๋‹ค.

 

i ์ž์ฒด๊ฐ€ pixel ๊ฐ’์ž…๋‹ˆ๋‹ค.

 

๊ทธ๋ฆฌ๊ณ  p(i)๋Š” i์— ๋Œ€ํ•œ pixel ์˜ ๊ฐœ์ˆ˜๋กœ ๋ณด๋ฉด ๋˜์ฃ .

 

๊ทธ๊ฒƒ์— ๋Œ€ํ•ด์„œ ๊ฐ ๊ฐœ์ˆ˜์— ๊ฐ ์›์†Œ์˜ ๊ณฑ์„ ํ•˜์—ฌ ๋‹ค ๋”ํ•ด์ค๋‹ˆ๋‹ค.

 

๊ทธ๋ฆฌ๊ณ , ์—ฌ๊ธฐ์„œ ๊ฐœ์ˆ˜๋กœ ๋‚˜๋ˆ ์ค๋‹ˆ๋‹ค.

 

 

 

์ด๋ ‡๊ฒŒ ํ‰๊ท ์„ ๊ตฌํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค.

 

๊ทธ๋ฆฌ๊ณ  ๋ถ„์‚ฐ๋„ ๊ตฌํ•˜๋ฉด ๋ฉ๋‹ˆ๋‹ค.

 

๊ฐ๊ฐ์„ ํ‰๊ท ์—์„œ ๋นผ์„œ ์ œ๊ณฑํ•œ ๊ฒƒ์— ๊ฐœ์ˆ˜๋ฅผ ๊ณฑํ•˜๋Š” ๊ฒƒ์ž…๋‹ˆ๋‹ค.

 

๋˜๋Š” ๊ฐ ์›์†Œ์˜ ์ œ๊ณฑ์— ๊ฐœ์ˆ˜๋ฅผ ๊ณฑํ•˜๊ณ  ํ‰๊ท ์˜ ์ œ๊ณฑ์„ ๋นผ์ฃผ๋Š” ์‹๋„ ์žˆ์Šต๋‹ˆ๋‹ค.

 

๊ทธ๋ฆฌ๊ณ  ์ „์ฒด ๊ฐœ์ˆ˜๋กœ ๋‚˜๋ˆ ์ค๋‹ˆ๋‹ค.



๊ทธ๋ž˜์„œ class 2์— ๋Œ€ํ•ด์„œ ๋‹ค์Œ๊ณผ ๊ฐ™์ด ๊ตฌํ•  ์ˆ˜ ์žˆ๊ฒ ์Šต๋‹ˆ๋‹ค.

 

๋‹จ์ง€ sigma์˜ ๋ฒ”์œ„๋งŒ ๋‹ฌ๋ผ์ง‘๋‹ˆ๋‹ค.

 



๊ทธ๋ฆฌ๊ณ  ์ „์ฒด class๋„ ๋ฐ”๋กœ ์—ฐ์‚ฐ ๊ฐ€๋Šฅํ•ฉ๋‹ˆ๋‹ค.

 

 

m G๋Š” ์ด๋ฏธ์ง€ ์ „์ฒด์˜ ํ‰๊ท ๊ฐ’์ž…๋‹ˆ๋‹ค.

 

sigma G๋„ ์ „์ฒด์— ๋Œ€ํ•œ ๋ถ„์‚ฐ๊ฐ’์ž…๋‹ˆ๋‹ค.

 

 

๊ทธ๋ฆฌ๊ณ  ์•„๋ž˜ ์‹์„ ๋ด…์‹œ๋‹ค.

์œ„ ์‹์€ p(i)๋ฅผ ๊ฒฐ๊ตญ ๋‹ค ๋”ํ•˜๋Š” ๊ฒƒ์ด๋‹ˆ 1์ด ๋˜๊ฒ ์ฃ .

 

๊ฐ๊ฐ class 1, 2์˜ ํ‰๊ท ์„ ๊ตฌํ–ˆ์„ ๋•Œ ์ „์ฒด ํ‰๊ท ์„ ๊ตฌํ•˜๊ณ  ์‹ถ์„ ๋•Œ ์‚ฌ์šฉํ•˜๋Š” ์‹์ž…๋‹ˆ๋‹ค.

 

์—ฌ๊ธฐ์„œ q1(x) + q2(x) = 1 ์ด๋ฏ€๋กœ ์ƒ๋žต ๋˜์—ˆ์Šต๋‹ˆ๋‹ค.

 

 

๊ทธ๋ž˜์„œ ์ด์ œ ์ด๊ฒƒ๋“ค์„ ๊ฐ€์ง€๊ณ  inter-class, intra-class๋ฅผ ๊ตฌํ•˜๋Š” ๋ฐฉ๋ฒ•์— ๋Œ€ํ•ด ๋‹ค๋ฃจ๊ฒ ์Šต๋‹ˆ๋‹ค.

 

Optimum Global Thresholding

 

 

 

intra-class๋ฅผ ๊ตฌํ•˜๋Š” ๋ฐฉ๋ฒ•์— ๋Œ€ํ•ด์„œ ์‚ดํŽด๋ณด๊ฒ ์Šต๋‹ˆ๋‹ค.

 

์œ„ ์ˆ˜์‹์€ within-class variance๋ฅผ ๊ตฌํ•˜๋Š” ์ˆ˜์‹์ž…๋‹ˆ๋‹ค.

 

k๋ผ๋Š” ์ƒํ™ฉ์—์„œ k๋ฅผ ๋ณ€์ˆ˜๋กœ์„œ ๊ณ„์† ์”๋‹ˆ๋‹ค.

 

์œ„ ์‹์—์„œ class 1๊ณผ class2์˜ ์ด ๊ฐœ์ˆ˜๋ฅผ q1(k), q2(k)๋กœ ๋ณด๋ฉด ๋ฉ๋‹ˆ๋‹ค.

 

pixel์˜ ๊ฐœ์ˆ˜๊ฐ€ ๋งŽ์•„์ง€๋ฉด ๊ฐ™์ด ๋น„๋ก€ํ•ด์„œ ์˜ฌ๋ผ๊ฐ€๋Š” ๊ฒƒ์ด์ฃ .

 

 

์ด๊ฒƒ์„ ์™œ ๊ณฑํ• ๊นŒ์š”?

 

 

์ด ๋‘๊ฐœ๋ฅผ ๋‹จ์ˆœํžˆ ๋”ํ•˜๊ธฐ์—๋Š” ๋‘ ๊ฐœ์˜ ์ค‘์š”๋„๊ฐ€ ๋‹ค๋ฅผ ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค.

 

์—ฌ๊ธฐ์„œ ๊ธฐ์ค€์„ 1๋กœ ๋†“๊ณ  ๋ณด๋ฉด, ์ ์€ ๊ฐœ์ˆ˜๋กœ ๊ณ„์‚ฐํ•œ ๋ถ„์‚ฐ์ด ๋งŽ์€ ๊ฒƒ์œผ๋กœ ๊ณ„์‚ฐํ•œ ๋ถ„์‚ฐ๋ณด๋‹ค ์‹ ๋ขฐ๋„๊ฐ€ ๋” ๋†’๋‹ค๊ณ  ๋ณด๊ธฐ ์–ด๋ ต์Šต๋‹ˆ๋‹ค.

 

๊ฐ’์ด ์ ๋‹ค๋ณด๋‹ˆ ๋งŒ์ผ 5๊ฐœ์˜ ๊ฐ’์ด ๋ชจ๋‘ ๊ฐ™๋‹ค๋ฉด ๋ถ„์‚ฐ์ด 0์ด ๋‚˜์˜ค๊ฒŒ ๋ฉ๋‹ˆ๋‹ค.

 

์ด ๊ฒฝ์šฐ ์ „์ฒด ํ•ฉ์ด ๋‚ฎ์•„์ ธ์„œ ์ด ๋•Œ k๊ฐ€ ์„ ํƒ๋  ์ˆ˜๋„ ์žˆ์Šต๋‹ˆ๋‹ค.

 

์ด ์ ์€ ๊ฐ’ ๊ฐ€์ง€๊ณ  ๊ตฌํ•œ ๋ถ„์‚ฐ์€ ์•ฝ๊ฐ„ noiseํ•œ ๋ฐ์ดํ„ฐ์ผ ์ˆ˜ ์žˆ๋Š” ๊ฒƒ์ž…๋‹ˆ๋‹ค.

 

๊ฐœ์ˆ˜๊ฐ€ ๋งŽ์€ ๋งŒํผ ๋” ์ค‘์š”๋„๋ฅผ ๋‘๊ฒ ๋‹ค๋Š” ๊ฒƒ์ž…๋‹ˆ๋‹ค.

 

์ด๊ฒƒ์ด weighted sum์ž…๋‹ˆ๋‹ค.

 

์ด weight๋Š” ๊ฐ class์— ์†ํ•˜๋Š” pixel๋“ค์˜ ๊ฐœ์ˆ˜๋ผ๊ณ  ๋ณด์‹œ๋ฉด ๋ฉ๋‹ˆ๋‹ค.

 

๊ทธ๋ฆฌ๊ณ  ๊ฐ€์ค‘์น˜์˜ ํ•ฉ์ด 1์ด ๋˜์–ด ๋” ์ด์ƒ์ ์ธ ๋ชจ์–‘์ƒˆ๋ฅผ ์ด๋ฃน๋‹ˆ๋‹ค.

 

 

 

๊ทธ๋ž˜์„œ ์ด within-class variance๊ฐ€ ์ตœ์†Œ๊ฐ€ ๋˜๋Š” k๋ฅผ ๊ณ ๋ฅด๋Š” ๊ฒƒ์ž…๋‹ˆ๋‹ค.

์ด optimal threshold k๋ฅผ ๊ตฌํ•˜๋Š” ๊ฒƒ์ž…๋‹ˆ๋‹ค.

 

์ด k๋ฅผ 0๋ถ€ํ„ฐ 255๊นŒ์ง€ ๋‹ค ๊ตฌํ•ด์„œ ์ตœ์†Œ๊ฐ€ ๋˜๋Š” k๋ฅผ ๊ตฌํ•˜๋Š” ๊ฒƒ์ž…๋‹ˆ๋‹ค.

 

์ด๊ฒƒ์ด within-class ๋ฐฉ์‹์„ ์ด์šฉํ•ด์„œ k๋ฅผ ๊ตฌํ•˜๋Š” ๋ฐฉ๋ฒ•์ž…๋‹ˆ๋‹ค.

 

 

 

๊ทธ๋ฆฌ๊ณ  ์„œ๋กœ ๋‹ค๋ฅธ class ๊ฐ„ ์–ผ๋งˆ๋‚˜ ๋‹ค๋ฅธ์ง€๋ฅผ ๋ถ„์„ํ•˜๋Š” ๊ฒƒ์ด between-class variance์ž…๋‹ˆ๋‹ค.

 

๋‹ค๋ฅผ ์ˆ˜๋ก variance๊ฐ€ ํฝ๋‹ˆ๋‹ค.

 

 

์ด๊ฒƒ์€ ์œ„์™€ ๋‹ค๋ฅด๊ฒŒ ์ตœ๋Œ€ํ™”๋ฅผ ์‹œ์ผœ์•ผํ•ฉ๋‹ˆ๋‹ค.

 



์ด ๋˜ํ•œ ๋งˆ์ฐฌ๊ฐ€์ง€๋กœ k๊ฐ€ 0์ผ ๋•Œ๋ถ€ํ„ฐ 255์ผ ๋•Œ๊นŒ์ง€ ์ฐจ๊ทผ์ฐจ๊ทผ ํ•˜๋‚˜์”ฉ ๋‹ค ๊ตฌํ•˜๋ฉด ๋ฉ๋‹ˆ๋‹ค.

 

 

์ด์ œ ๊ทธ ์ด์•ผ๊ธฐ๋ฅผ ํ•ด๋ด…์‹œ๋‹ค.

 

group 1๊ณผ group 2 ์‚ฌ์ด์˜ ์ฐจ์ด๋ฅผ ๋‹ค ๊ตฌํ•ด์„œ ํ‰๊ท ์„ ๊ตฌํ•  ์ˆ˜๋„ ์žˆ๊ฒ ์ฃ ?

 

๊ทธ๋Ÿฌ๋‚˜ ์ด๊ฒƒ์€ ๋งŽ์€ ์‹œ๊ฐ„๊ณผ ๋น„์šฉ์ด ๋“ญ๋‹ˆ๋‹ค.

 

๊ฐ€๋Šฅ์€ ํ•œ ๋ฐฉ๋ฒ•์ด๊ฒ ์ฃ .

 

 

์•„๋‹ˆ๋ฉด ํ‰๊ท  ํ•˜๋‚˜์™€ ๋‹ค๋ฅธ group๊ณผ์˜ ์›์†Œ ๊ฐ„์˜ ์ฐจ์ด๊ฐ€ ์ปค์•ผํ•œ๋‹ค๋กœ ๋ณผ ์ˆ˜๋„ ์žˆ์Šต๋‹ˆ๋‹ค.

 

๊ทธ๋ฆฌ๊ณ , ์ „์ฒด ํ‰๊ท ๊ณผ ์œ„ m1, m2 ์™€์˜ ์ฐจ์ด๊ฐ€ ์ปค๋„ ๋˜๊ฒ ์Šต๋‹ˆ๋‹ค.

 

์ด ๋งˆ์ง€๋ง‰ ๋ฐฉ๋ฒ•์ด ๊ณ„์‚ฐ์ด ๊ฐ€์žฅ ์ ๊ฒ ์ฃ ?

 

๊ทธ๋ž˜์„œ ์œ„์™€ ๊ฐ™์ด Between-class variance๋ฅผ ๊ตฌํ•˜๊ฒŒ ๋ฉ๋‹ˆ๋‹ค.

 

๊ทธ๋ž˜์„œ ์œ„์™€ ๊ฐ™์ด ์ฐจ์ด๋ฅผ ๊ตฌํ•˜๊ณ  ์ œ๊ณฑ์„ ํ†ตํ•ด ์–‘์ˆ˜๋กœ ๋ฐ”๊ฟ”์ค๋‹ˆ๋‹ค.

 

์—ฌ๊ธฐ๋„ ๋งˆ์ฐฌ๊ฐ€์ง€๋กœ ๊ฐœ์ˆ˜๋กœ weight๋ฅผ ์ฃผ๊ฒŒ ๋ฉ๋‹ˆ๋‹ค.

 

 

 

์œ„ ์‹์„ ์•„๋ž˜์™€ ๊ฐ™์ด ์ „๊ฐœํ•˜์—ฌ ์ •๋ฆฌํ•  ์ˆ˜๊ฐ€ ์žˆ์Šต๋‹ˆ๋‹ค.

๊ทธ๋ฆฌ๊ณ  ์ฆ๋ช… ์‹์€ ์œ„์™€ ๊ฐ™์ด ์‹์„ ์ „๊ฐœํ•ฉ๋‹ˆ๋‹ค. (k๋Š” ๊ณ„์‚ฐ์˜ ํŽธ์˜๋ฅผ ์œ„ํ•ด ์ƒ๋žตํ–ˆ์Šต๋‹ˆ๋‹ค.)

 

์ฃผ์˜ ๊นŠ๊ฒŒ ๋ณผ ๋ถ€๋ถ„์€ ์œ„์™€ ๊ฐ™์Šต๋‹ˆ๋‹ค.

 

m G ๋Œ€์‹ ์— q1m1 + q2m2๋ฅผ ๋Œ€์ž…ํ–ˆ์Šต๋‹ˆ๋‹ค.

 

๊ทธ๋ฆฌ๊ณ  ์•„๋ž˜์™€ ๊ฐ™์ด ์—ฐ์‚ฐ ๊ณผ์ •์„ ๊ฑฐ์นฉ๋‹ˆ๋‹ค.

 

๊ทธ๋ฆฌ๊ณ , q1 + q2๊ฐ€ 1์ธ ๊ฒƒ๋„ ์šฐ๋ฆฌ๊ฐ€ ์•Œ๊ณ  ์žˆ์Šต๋‹ˆ๋‹ค.

 

๊ทธ๋ž˜์„œ ๊ฒฐ๊ณผ์ ์œผ๋กœ ์œ„์™€ ๊ฐ™์€ ๊ฒฐ๊ณผ๊ฐ€ ๋‚˜์˜ต๋‹ˆ๋‹ค.

 

 

๊ฒฐ๊ตญ, group 1๊ณผ group 2์˜ ํ‰๊ท  ์‚ฌ์ด์˜ ์ฐจ์ด๋ฅผ ๊ณ„์‚ฐํ•˜๊ฒŒ ๋ฉ๋‹ˆ๋‹ค.

 

๋‘ ๊ฐœ๊ฐ€ ์–ผ๋งˆ๋‚˜ ๋‹ค๋ฅธ์ง€๋ฅผ ๊ณ„์‚ฐํ•˜๋Š” ํŽธํ•œ ๋ฐฉ๋ฒ•์ž…๋‹ˆ๋‹ค.

 

๊ฒŒ๋‹ค๊ฐ€ ์—ฐ์‚ฐ๋Ÿ‰๋„ ์ค„์–ด๋“ญ๋‹ˆ๋‹ค.

 

๊ทธ๋ฆฌ๊ณ  ํ‰๊ท ๋งŒ ๋ณด๋Š” ๊ฒƒ์ด ์•„๋‹Œ, q1 x q2๋„ ๊ฐ™์ด ๋ณด๋Š” ๊ฒƒ์ž…๋‹ˆ๋‹ค.

 

๋‘ q1 + q2 = 1์ธ ๊ฒƒ์„ ์•Œ๊ณ  ์žˆ์Šต๋‹ˆ๋‹ค.

 

๊ทธ๋ ‡๋‹ค๋ฉด ์ด max(q1 x q2)๊ฐ€ ๋˜๋ ค๋ฉด ์–ธ์ œ์ผ๊นŒ์š”?

 

when q1 = 0.5, q2 = 0.5์ž…๋‹ˆ๋‹ค.

 

๊ทธ๋ž˜์„œ, ๊ฒฐ๊ตญ m1๊ณผ m2์˜ ์ฐจ์ด๊ฐ€ ์ปค์ ธ์•ผ ํ•˜์ง€๋งŒ, q1๊ณผ q2๊ฐ€ ๋น„์Šทํ•ด์•ผํ•œ๋‹ค๋Š” ๊ฒƒ์ž…๋‹ˆ๋‹ค.

 

์ด ๋‘ ๊ฐ’์ด ๋น„์Šทํ•ด์•ผ ๋” ํฐ ๊ฐ’์„ ๊ฐ€์ง€๊ฒŒ ๋˜๋Š” ๊ฒƒ์ž…๋‹ˆ๋‹ค.

 

์ด๊ฒƒ๋„ ๊ฒฐ๊ตญ ์ฐจ์ด๊ฐ€ ์ค„์–ด๋“ค์–ด์•ผํ•ฉ๋‹ˆ๋‹ค.

 

์•„๊นŒ ๋ณธ ๊ฒƒ์ฒ˜๋Ÿผ ๊ฐœ์ˆ˜๊ฐ€ ์–ด๋Š์ •๋„ ๋น„์Šทํ•ด์•ผ ์‹ ๋ขฐ๋„๊ฐ€ ์˜ฌ๋ผ๊ฐ„๋‹ค๋Š” ๊ฒƒ์ด ์ด๋Ÿฌํ•œ ์˜๋ฏธ์ž…๋‹ˆ๋‹ค.

 

๊ทธ๋ž˜์„œ ๋‘ ๊ฐ€์ง€ ์˜๋ฏธ๊ฐ€ ์žˆ์Šต๋‹ˆ๋‹ค.

 

1. ๋‘ group ๊ฐ„ ํ‰๊ท ์˜ ์ฐจ์ด๊ฐ€ ๋‹ฌ๋ผ์•ผํ•ฉ๋‹ˆ๋‹ค.

 

2. ๋‘ group์˜ ๊ฐœ์ˆ˜๊ฐ€ ๋น„์Šทํ•ด์•ผํ•ฉ๋‹ˆ๋‹ค.

 

 

ํ‰๊ท  ์ฐจ์ด๊ฐ€ ํฌ์ง€ ์•Š์œผ๋ฉด, ๊ฐœ์ˆ˜๊ฐ€ ๋น„์Šทํ•œ ์ƒํ™ฉ์—์„œ ๋๋‚  ๊ฒƒ์ž…๋‹ˆ๋‹ค.

 

ํ˜น์€ ํ‰๊ท  ์ฐจ์ด๊ฐ€ ํฌ๋‹ค๊ณ  ํ•˜๋ฉด ๊ฐœ์ˆ˜๊ฐ€ ๋‹ฌ๋ผ๋„ ์„ ํƒ์ด ๋  ์ˆ˜๊ฐ€ ์žˆ์„ ๊ฒƒ์ž…๋‹ˆ๋‹ค.

 

๊ฐœ์ˆ˜๊ฐ€ ๋น„์Šทํ•˜๋ฉด์„œ ํ‰๊ท  ์ฐจ์ด๊ฐ€ ์ ์ ˆํžˆ ๋‚˜๋Š” ๊ตฌ๊ฐ„์ด ์„ ํƒ๋  ์ˆ˜๋„ ์žˆ์Šต๋‹ˆ๋‹ค.

 

within-class์™€ ๋น„๊ตํ–ˆ์„ ๋•Œ,

 

์ด between-class๋Š” ๋ถ„์‚ฐ์„ ๊ตฌํ•  ํ•„์š”๊ฐ€ ์—†์Šต๋‹ˆ๋‹ค.

 

๋ถ„์‚ฐ์€ ํ‰๊ท ์„ ๊ตฌํ•˜๊ณ  ๋ถ„์‚ฐ์„ ๊ตฌํ•ฉ๋‹ˆ๋‹ค.

 

๊ทธ๋ž˜์„œ ๋” ์—ฐ์‚ฐ๋Ÿ‰์—์„œ ์•ž์„œ๋Š” ๋ชจ์Šต์„ ๋ณด์ž…๋‹ˆ๋‹ค.

 

 

๊ทธ๋ฆฌ๊ณ  ์ด ํ‰๊ท ์€ ๋” ํšจ๊ณผ์ ์œผ๋กœ ๊ตฌํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค.



 

์šฐ์„  k ๊ฐ€ 0์ผ ๋•Œ initial ๊ฐ’์„ ๊ตฌํ•ฉ๋‹ˆ๋‹ค.

 

0์— ์–ด๋–ค ๊ฐœ์ˆ˜๋ฅผ ๊ณฑํ•ด๋„ 0์ด๋ฏ€๋กœ ํ‰๊ท ์€ 0์ž…๋‹ˆ๋‹ค.

 



์—ฌ๊ธฐ์„œ, ์šฐ๋ฆฌ๊ฐ€ k๊นŒ์ง€ ๊ตฌํ–ˆ๋‹ค๊ณ  ํ–ˆ์„ ๋•Œ, k+1์ธ ๊ฒฝ์šฐ๋ฅผ ์–ด๋–ป๊ฒŒ ๊ณ„์‚ฐํ• ์ง€ ๋ณด๊ฒ ์Šต๋‹ˆ๋‹ค.

 

์šฐ์„  q์˜ ๊ฐ’์€ ์œ„์™€ ๊ฐ™์ด ์‰ฝ๊ฒŒ ๊ตฌํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค.

 

 

์ด๋ฏธ ๊ตฌํ•ด๋†“์€ ๊ฒƒ์— ๋”ํ•ฉ๋‹ˆ๋‹ค.

 

๊ทธ๋ฆฌ๊ณ  m1(k)๋ฅผ ๊ตฌํ•ด๋†“์€ ๊ฒƒ์— ์ƒˆ๋กœ ์ถ”๊ฐ€๋˜๋Š” ๊ฒƒ๋งŒ ๋”ํ•ด์ฃผ๊ณ  ์ด ๊ฐœ์ˆ˜๋กœ ๋‚˜๋ˆ„์–ด์ค๋‹ˆ๋‹ค.

 

์ด ๊ฐœ์ˆ˜๋„ ๋‹ฌ๋ผ์ง€๋‹ˆ ๊ทธ q1(k+1)๋„ ๋ฏธ๋ฆฌ ๊ตฌํ•ด๋†“์€ ๊ฒƒ์ด์ฃ .

 

 

 

์ด๋™ํ•˜๋ฉด์„œ ํ‰๊ท ์„ ์ผ์ผ์ด ๋‹ค ๊ตฌํ•ด์ฃผ๋Š” ๊ฒƒ์ด ์•„๋‹ˆ๋ผ ์ด์ „ ๋‹จ๊ณ„์—์„œ ๊ตฌํ˜„ํ•ด๋†“์€ ๊ฒƒ์„ ๊ทธ๋Œ€๋กœ ์‚ฌ์šฉํ•˜๋ฉด์„œ ์ƒˆ๋กœ ์ถ”๊ฐ€๋˜๋Š” ๊ฒƒ๋งŒ ์“ฐ๊ฒ ๋‹ค๋Š” ๊ฑฐ์ฃ .

 

์ด๋Ÿฌํ•œ ๊ฒƒ์ด moving average์ž…๋‹ˆ๋‹ค.

 

 

์ง€๊ธˆ k๊นŒ์ง€๋Š” ๋‹ค ๊ตฌํ•ด์ ธ ์žˆ๋‹ค๋Š” ๊ฐ€์ •์ž…๋‹ˆ๋‹ค.

 

๊ทธ๋ ‡๊ฒŒ q1(k+1)์™€ m1(k+1)๋ฅผ ๊ตฌํ•ด์ค๋‹ˆ๋‹ค.

 

๊ทธ๋ฆฌ๊ณ , ์ด๊ฒƒ์€ ์›๋ž˜ ์ฒ˜์Œ๋ถ€ํ„ฐ ๋‹ค ๋”ํ•˜๋Š” ๊ฒƒ๋ณด๋‹ค ์›๋ž˜ ๊ตฌํ•ด๋†“์€ ๊ฒƒ์— ํ•˜๋‚˜๋งŒ ๋”ํ•˜๋Š” ๊ฒƒ์ด ํ›จ์”ฌ ๋น ๋ฅธ ๊ฒƒ์ด ๋ฉ๋‹ˆ๋‹ค.

 

 

๊ทธ๋ฆฌ๊ณ  m2(k+1)์€ class 2์— ํ•ด๋‹นํ•˜๋Š” ๊ฒƒ์ž…๋‹ˆ๋‹ค.

 

q2๋„ 1 - q1์œผ๋กœ ์น˜ํ™˜ํ•˜์—ฌ ๋ฐ”๋กœ ๊ตฌํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค.

 

k+1 ์—์„œ๋Š” ๋ฉ์–ด๋ฆฌ๋Š” ๊ทธ๋Œ€๋กœ ์œ ์ง€๋˜๋Š”๋ฐ, class 1์—์„œ๋Š” ํ•˜๋‚˜ ์ถ”๊ฐ€๋˜๋Š” ๊ฒƒ์ด๊ณ  class 2์—์„œ๋Š” ๋นผ์ค˜์•ผํ•ฉ๋‹ˆ๋‹ค.

 

์ด k+1๋ฒˆ์žฌ ์• ๋“ค์„ class 2์—์„œ๋Š” ๋นผ์ค˜์•ผํ•˜๋Š” ๊ฒƒ์ด์ฃ . ์ด ๊ฐœ์ˆ˜๋„ 1 - q1(k+1)์ด ๋ฉ๋‹ˆ๋‹ค.

 

์ด๋Ÿฐ์‹์œผ๋กœ moving average ๋ฐฉ์‹์œผ๋กœ ๊ตฌํ•  ์ˆ˜ ์žˆ๊ณ ,

 

์ด๊ฒƒ์€ ๋ถ„์‚ฐ์„ ๊ตฌํ•  ํ•„์š”๊ฐ€ ์—†๊ธฐ ๋•Œ๋ฌธ์— within-class ๋ฐฉ์‹๋ณด๋‹ค ์†๋„๊ฐ€ ๋” ๋น ๋ฆ…๋‹ˆ๋‹ค.

 

๊ทธ๋ฆฌ๊ณ  between-class ๋ฐฉ์‹์—์„œ๋„ ์ด๋ ‡๊ฒŒ ๋ฐ”๋€Œ๋Š” ์• ๋“ค๋งŒ ๋”ํ•ด์ฃผ๊ณ  ๋นผ์ฃผ๋Š” ๊ฒƒ์ด ๋” ๋น ๋ฅผ ๊ฒƒ์ž…๋‹ˆ๋‹ค.

 

 

 

 

์ด otsu ๋ฐฉ์‹์œผ๋กœ image๋งˆ๋‹ค ์„œ๋กœ ๋‹ค๋ฅธ threshold๋ฅผ ๋ฝ‘์•„์ค„ ์ˆ˜ ์žˆ๋‹ค๋Š” ๊ฒƒ์ž…๋‹ˆ๋‹ค.

 

๊ทธ๋Ÿฌ๋‚˜, ๋‘ ๊ฐœ๋กœ ๋‚˜๋ˆ„๊ธฐ ์‰ฌ์šด ๊ฒƒ,

 

๋‘ ๊ฐœ์˜ ํ™•์‹คํ•œ dominantํ•œ distribution์ด ์žˆ๋Š” ์ƒํ™ฉ์—์„œ๋Š” ์ž˜ ๋˜์ง€๋งŒ,

 

์ง€๊ธˆ ์˜ˆ์ œ์ฒ˜๋Ÿผ ๊ทธ๋ ‡์ง€ ์•Š์€ ๊ฒฝ์šฐ์—๋Š”,

 

pixel ๊ฐ’ ๊ธฐ์ค€์œผ๋กœ ํ™•์‹คํžˆ ๋‚˜๋ˆ ์ ธ ์žˆ์ง€ ์•Š์€ ๊ฒฝ์šฐ์—๋Š”,

 

Otsu ์จ๋„ ์˜ค๋ฅธ์ชฝ ์ด์ƒ์€ ๋‹ค ํ•˜์–€์ƒ‰์ด ๋‚˜์™€๋ฒ„๋ฆฝ๋‹ˆ๋‹ค.

 

๋ฐฐ๊ฒฝ ๋ถ€๋ถ„์ด ์ถฉ๋ถ„ํžˆ ๋ฐ๊ธฐ ๋•Œ๋ฌธ์ž…๋‹ˆ๋‹ค.

 

 

 

pixel ๊ฐ’์„ 3D๋กœ ๋ณด์—ฌ์ค€๋‹ค๋ฉด,

 

์˜ค๋ฅธ์ชฝ๊ณผ ๊ฐ™์ด ์œ„ ๋ฐฐ๊ฒฝ๋„ ๊ฐ™์ด ์˜ฌ๋ผ๊ฐ€๊ฒŒ ๋œ๋‹ค๋Š” ๊ฒƒ์ž…๋‹ˆ๋‹ค.

 

๊ทธ๋ž˜์„œ ์ด๋ ‡๊ฒŒ ๊ฒฝ์‚ฌ๋ฅผ ๊ฐ€์ง€๊ฒŒ ๋ณด์ด๊ฒŒ ๋ฉ๋‹ˆ๋‹ค.

 

์ด๋ ‡๊ฒŒ ํ•˜๋‚˜์˜ pixel ๊ฐ’๋งŒ ๊ฐ€์ง€๊ณ ๋Š”, ํ•˜๋‚˜์˜ threshold ๊ฐ’ ๊ฐ€์ง€๊ณ ๋Š” ๋ฐฐ๊ฒฝ์ด ํฌํ•จ๋  ์ˆ˜๋ฐ–์— ์—†์Šต๋‹ˆ๋‹ค.

 

์ฆ‰, ์ด๋Ÿฌํ•œ ๋ฐฐ๊ฒฝ์„ ๋ถ„๋ฆฌํ•ด๋‚ผ ์ˆ˜ ์—†์Šต๋‹ˆ๋‹ค.

 

 

๊ทธ๋ž˜์„œ ๊ฒฝ์šฐ์— ๋”ฐ๋ผ ์‚ฌ๋žŒ์ด ์ง์ ‘ ๊ด€์—ฌํ•˜์—ฌ image๋ฅผ 4๋“ฑ๋ถ„ํ•˜์—ฌ ๋“ฑ๋ถ„๋งˆ๋‹ค Otsu๋ฅผ ์‚ฌ์šฉํ•˜์—ฌ, ๊ฐ๊ฐ์˜ ๊ตฌ๊ฐ„์— ๋Œ€ํ•ด threshold๋ฅผ ๊ตฌํ•˜๋Š” ๊ฒƒ์ž…๋‹ˆ๋‹ค.

 

๊ทธ๋ž˜์„œ ์‚ฌ๋žŒ์ด ๊ด€์—ฌํ•˜์—ฌ ์กฐ๊ธˆ ๋” ์ข‹๊ฒŒ image๋ฅผ ๋ฝ‘์•„๋‚ผ ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค.

 



2๊ฐœ ๋ฐ–์— ๋‚˜๋ˆ„์ง€ ๋ชปํ•˜๋‹ˆ ํ™œ์šฉ๋„ ๋ฉด์—์„œ ์ข€ ๋–จ์–ด์ง‘๋‹ˆ๋‹ค.

 

์š”์ƒˆ color image์—์„œ ํŠนํžˆ ์‰ฝ์ง€ ์•Š์Šต๋‹ˆ๋‹ค.

 

ํ‘๋ฐฑ image์—์„œ๋„ ์ œํ•œ์ด ์žˆ์Šต๋‹ˆ๋‹ค.

 

 

'Artificial Intelligence > Computer Vision' ์นดํ…Œ๊ณ ๋ฆฌ์˜ ๋‹ค๋ฅธ ๊ธ€

[Computer Vision] Objectives - JPEG Algorithm  (0) 2023.05.10
[Computer Vision] Objectives - Huffman Coding, Run-length Encoding  (0) 2023.05.10
[Computer Vision] Binary Image  (2) 2023.04.27
[Computer Vision] Canny edge detector  (0) 2023.04.23
[Computer Vision] Image Gradient  (0) 2023.04.16

BELATED ARTICLES

more