[Linear Classification] part 4 - 2
๐ง๐ป๐ป์ฉ์ด ์ ๋ฆฌ
zero-one loss
hinge loss
cross-entropy loss
Linear Classification
hinge loss
๊ณ์ฐ ๊ฐ์ด + ๊ฐ์ด ๋๋ค๋ฉด, max ๊ฐ์ margin ๊ฐ์ ์ ํ์ ์ผ๋ก ๋น๋กํ์ฌ ์ฆ๊ฐํฉ๋๋ค.
์ด ๊ฒฝ์ฐ, loss ์ญ์ ์ฆ๊ฐํฉ๋๋ค.
Cross-entropy loss
p์ q๊ฐ ์ ์ฌํ๋ค๋ฉด loss๋ ์ค์ด๋ค๊ณ , ์๋ก ๋ค๋ฅด๋ค๋ฉด loss๋ ์ฌ๋ผ๊ฐ๋๋ค.
์ง๊ธ๊น์ง๋ ๊ณ์ฐํ ๋ชจ๋ธ์ score ๊ฐ์ ์ค์ ๊ฐ์ ๋๋ค.
๊ทธ๋ฌ๋ ๋ฐฉ๊ธ ๋ฐฐ์ด Cross-entropy loss ๊ฐ์ ํ๋ฅ ๊ฐ์ผ๋ก ์ด๋ฃจ์ด์ ธ ์์ต๋๋ค.
๊ทธ๋ ๋ค๋ฉด ๊ณ์ฐํ Score ๊ฐ์ ์ด๋ป๊ฒ ์ด๋ฌํ ํ๋ฅ ๊ฐ์ผ๋ก mapping ํ ์๊ฐ ์์๊น์?
์ฐ๋ฆฌ๊ฐ fittingํ๊ณ ์ ํ๋ Label์ 1 or 0 ์ธ ๊ฐ์ ๊ฐ๊ฒ ๋๋๋ฐ, ์ฐ๋ฆฌ์ score๋ ์ค์ ๊ฐ์ด๊ธฐ ๋๋ฌธ์,
๊ทธ ์ค์ ๊ฐ์ ํ๋ฅ ํจ์๋ฅผ ํตํด์ mappingํด์ผ ๋๋ค๊ณ ์๊ฐํ ์ ์์ต๋๋ค.
์ด mapping์ ์ฌ์ฉํ๋ ํจ์๊ฐ ๋ฐ๋ก,
Sigmoid
ํจ์ ์ ๋๋ค.
์ด ํจ์์ ๊ฐํ์ ์ดํผ์ด real ๊ฐ์ด +๋ก ๊ต์ฅํ ์ฆ๊ฐํ๊ฒ ๋๋ค๋ฉด ํ๋ฅ ๊ฐ 1์ ๊ทผ์ฌํ๊ฒ ๋ ๊ฒ์ด๋ฉฐ,
๋ฐ๋๋ก -๋ก ์ปค์ง๊ฒ ๋๋ค๋ฉด ํ๋ฅ ๊ฐ 0์ ๊ทผ์ฌํ๊ฒ ๋ ๊ฒ์ ๋๋ค.
real์ด 0์ ๊ฐ์ ๊ฐ์ง๊ฒ ๋๋ฉด ์ด ๊ฐ์ 1/2์ ํ๋ฅ ์ ๊ฐ๋ ํจ์๊ฐ ๋๊ฒ ์ต๋๋ค.
๊ทธ๋ฌ๋ฏ๋ก, ์ฐ๋ฆฌ์ Score ์ค์ ๊ฐ์ 0๋ถํฐ 1 ์ฌ์ด์ ๊ฐ์ผ๋ก mapping ํ ์๊ฐ ์๊ฒ ๋ฉ๋๋ค.
์ด๋ฌํ ํํ๋ฅผ ์ฐ๋ฆฌ๊ฐ logistic model์ด๋ผ๊ณ ์ด์ผ๊ธฐ ํฉ๋๋ค.
Linear classifier๋ฅผ ํ์ตํ๋ ๋ฐ ์์ด, ์ด๋ป๊ฒ Gradient Descent Algorithm์ด ์ฐ์ผ๊น?
1. weight ๊ฐ initialization
2. gradient ๊ฐ ๊ณ์ฐ
์ฆ, cross-entropy loss์, train loss์ ๋ฏธ๋ถ term์ด ๋ฉ๋๋ค.
3. weight update
4. ์๋ ดํ ๋๊น์ง ์งํ
'Artificial Intelligence' ์นดํ ๊ณ ๋ฆฌ์ ๋ค๋ฅธ ๊ธ
[Advanced Classification] part 5 - 1 (0) | 2023.01.19 |
---|---|
[Linear Classification] part 4 - 3 (0) | 2023.01.19 |
[Linear Classification] part 4 - 1 (2) | 2023.01.19 |
[Parameter] part 3 - 2 (0) | 2023.01.16 |
[Gradient Descent] part 3 - 1 (0) | 2023.01.16 |