[Linear Regression] part 2 - 2
๐ฏ Keyword ๐ฏ
- linear model
- MSE
- model parameter
- score
- parameter optimization
Parameter Optimization
- model parameter๊ฐ ๋ฌ๋ผ์ง์ ๋ฐ๋ผ ์ฃผ์ด์ง data์ fittingํ๋ ๊ณผ์ ์์ ์ค์ฐจ๊ฐ ๋ฐ์ํ๊ฒ ๋ฉ๋๋ค.
- ์ฃผ์ด์ง ์ธํ ๊ฐ์ด ๋ฌ๋ผ์ง์ ๋ฐ๋ผ ์ปค๋ธ๋ฅผ ๊ทธ๋ฆฌ๊ฒ ๋ฉ๋๋ค.
- loss function์ model parameter์ ์ํ ํจ์๊ฐ ๋๊ฒ ๋ฉ๋๋ค.
θ0, θ1์ด ๋ฐ๋๊ฒ ๋จ์ ๋ฐ๋ผ MSE๊ฐ ๋ฌ๋ผ์ง๋ฏ๋ก Error ๊ณก์ ์ด ๋ฐ๋๊ฒ ๋ฉ๋๋ค.
์ฐ๋ฆฌ์ ๋ชฉ์ ?
-> cost function์ ์ต์๋ก ๋ง๋๋ θ0, θ1์ ์ฐพ๋ ๊ฒ์ ๋๋ค.
=> ๊ทธ๋ก๋ถํฐ data์ fittingํ๋ ์ ํ ๋ชจ๋ธ์ ์ฐพ๊ฒ ๋๋ ๊ฒ์ ๋๋ค.
๋ฐ์ดํฐ ๊ฐ์ ์ํด ํ์ต์ด ์งํ ๋๋ฉด์ θ0, θ1์ด ์ฃผ์ด์ง ๋ฐ์ดํฐ์ fitting์ด ๋๋ฉด์ ์ฃผ์ด์ง ๋ฑ๊ณ ์ ์ ๋ฎ์ ๊ฐ์ผ๋ก fitting์ด ๋ฉ๋๋ค.
Loss function์ด ๊ฐ์ฅ ๋ฎ์ ๊ฐ์ ๊ฐ๊ฒ ๋ ๋, ํด๋น parameter θ0 θ1์ด ์ต์ ํ๋ ์ ํ ๋ชจ๋ธ์ ์ ๊ณตํ๋ ๊ฒ์ ์ ์ ์์ต๋๋ค.
์ด θ0, θ1์ ๊ตฌํ๋ ๊ณผ์ ์ parameter optimization์ด๋ผ๊ณ ํฉ๋๋ค.
์ ๋ ฅ ๋ฐ์ดํฐ๋ฅผ matrix ํํ๋ก ์ ๋ฆฌํ์ ๋, ์ ๋ ฅ vector x๋ d-dimensionํ๋ vector์ด๋ฏ๋ก x1 ~ xd๊น์ง๋ก ํํ ๋์ง๋ง offset์ธ θ0๋ฅผ ํํํ๊ธฐ ์ํด ๋ฒกํฐ์ ์์ 1๋ก ๊ตฌ์ฑ ๋์ด ์์ต๋๋ค.
linear regression์์ ์ฐ๋ฆฌ์ ์ ๋ต์ธ y ์ญ์ n-dimension ์ ์ด๋ฃจ๊ณ ์์ต๋๋ค.
๊ทธ ์ด์ ๋ n๊ฐ์ sample ๋ง๋ค ํ๋์ฉ์ ์ ๋ต์ด ์กด์ฌํ๊ธฐ ๋๋ฌธ์ธ ๊ฒ์ ๋๋ค.
parameter vector θ๋ θ0 ~ θd๊น์ง ์๊ธฐ ๋๋ฌธ์ d + 1์ dimensional vector์ ๋๋ค.
์ ๋ ฅ matrix X์ θ๋ฅผ ๊ณฑํ ๊ฒ์ด Score์ ๋๋ค.
Score๊ณผ Y์ ์ฐจ์ด Squared ๊ฐ์ ํตํด Loss๋ฅผ ํตํ matrix ํํ๋ฅผ ๊ณ์ฐํ ์ ์์ต๋๋ค.
๋ชจ๋ธ์ ์ถ๋ ฅ๊ณผ Y์ ์ฐจ์ด๋ฅผ ์ ๊ณฑํ๊ณ ํ๊ท ํ์ฌ ๊ณ์ฐํฉ๋๋ค.
์ต์ ํ๋ parameter θ๋ cost function์ ๊ฐ์ฅ ์ต์ํํ๋ ๊ฒ์ ๋๋ค.
์์์ ํ๊ธฐ ์ํด์ θ์ ๊ดํ derivative term์ ๊ตฌํ ๋ค, 0์ด ๋๋๋ก ํ๋ θ์ ๊ฐ์ ๊ตฌํ๋ฉด ์ต์ ํ๋ parameter ๊ฐ์ ๊ตฌํ ์ ์์ต๋๋ค.
-> ์ด ๊ณผ์ ์ Least Square Problem์ด๋ผ๊ณ ํ๋ฉฐ ๋ฐฉ์ ์์ Normal Equation์ด๋ผ๊ณ ํฉ๋๋ค.
์ด ๋, loss function์ differentiableํ๊ณ convexํด์ผํฉ๋๋ค.
์ด๋ฌํ ๋ฐฉ์์ผ๋ก θ๋ฅผ ๊ตฌํ๋ฉด one step์ผ๋ก ํด๋ฅผ ๊ตฌํ ์ ์์ต๋๋ค.
๊ทธ๋ฌ๋ ์ด๋ ๊ฒ Normal Equation์ ์ด์ฉํด์ ํด๋ฅผ ๊ตฌํ๋ ๊ฒฝ์ฐ, Data์ ์ํ ์ซ์๊ฐ ๋์ด๋๋ฉด ๋นํจ์จ ์ ์์ด ๋ฐํ์ก์ต๋๋ค.
N์ด ๋์ด๋๊ฒ ๋๋ฉด ์ด matrix์ dimension์ด ์ฆ๊ฐํ๊ฒ ๋๊ณ , matrix inverse ๋ฑ์ ์ฐ์ฐ์ ํจ์ ์์ด ๊ต์ฅํ ํฐ ๋ณต์ก๋๊ฐ ์์๋๊ฒ ๋ฉ๋๋ค.
๋๋, matrix์ inverse๊ฐ ์กด์ฌํ์ง ์๋ ๊ฒฝ์ฐ๋ ์์ด, ์ด๋ฐ ๊ฒฝ์ฐ ํด๋ฅผ ๊ตฌํ๊ธฐ๊ฐ ์ด๋ ต์ต๋๋ค.
์ด๋ฌํ ๋ฐฉ์์ ํด๊ฒฐํ๊ธฐ ์ํด์ ์ฐ๋ฆฌ๋ Gradient Descent ๋ฐฉ์์ ์ฌ์ฉํฉ๋๋ค.
'Artificial Intelligence' ์นดํ ๊ณ ๋ฆฌ์ ๋ค๋ฅธ ๊ธ
[Gradient Descent] part 3 - 1 (0) | 2023.01.16 |
---|---|
[Gradient Descent] part 2 - 3 (0) | 2023.01.14 |
[Linear Regression] part 2 - 1 (0) | 2023.01.14 |
[Foundation of Supervised Learning] part 1 - 2 (0) | 2023.01.12 |
[Foundation of Supervised Learning] part 1 - 1 (0) | 2023.01.12 |