Intra-class Variation VS. Inter-class Variation
Class Variation์ด๋ ๋ฐ์ดํฐ์ ํด๋์ค๊ฐ ์ผ๋ง๋ ๋จ์ด์ ธ ์๋์ง(๋ถ์ฐ)์ ๋ํ๋ด๋ ํํ์ด๋ค.
Class Variation์ ํํ์๋ ํฌ๊ฒ Inter-class Variation๊ณผ Intra-class Variation์ด ์๋ค.
๋ ๋จ์ด๋ค์ ๋ฐ์์ด ๋น์ทํด์ ๋ ํท๊ฐ๋ฆฌ๋ ๊ฒ ๊ฐ๋ค. ํ์ง๋ง ์ธํธ๋ผ๋ท์ด ์ด๋ค ์กฐ์ง์ ํ์์ ์ธ ๋ด๋ถ๋ง์ ์๋ฏธํ๋ค๋ ๊ฒ์ ๋ ์ฌ๋ฆฌ๋ฉด ์ด๋ ต์ง ์๋ค.
Example 1
Example 2
์ ๋ ์์๋ค์ ๋ฐ์ดํฐ๋ค์ ํด๋์ค ๋ถํฌ๋ฅผ ์๊น๋ก ๋ํ๋ธ ์ ์ด๋ค.
L1 Distance (Manhattan distance) VS. L2 Distance (Euclidean distance)
L1 Distance์ L2 Distance๋ ๋ ๋ฒกํฐ ๊ฐ์ ๊ฑฐ๋ฆฌ ๋๋ ์ ์ฌ์ฑ์ ์ธก์ ํ๋ ์ผ๋ฐ์ ์ธ ๋ฐฉ๋ฒ์ด๋ค.
Manhattan distance๋ผ๊ณ ๋ ํ๋ L1 Distance๋ ๋ ๋ฒกํฐ์ ํด๋น ์์ ๊ฐ ์ ๋ ์ฐจ์ด์ ํฉ์ด๋ค.
์ํ์ ์ผ๋ก ๋ ๋ฒกํฐ p์ q ์ฌ์ด์ L1 Distance๋ ์๋์ ๊ฐ์ด ์ ์๋๋ค.
L1 Distance (Manhattan distance):
ํ์๊ฐ ํ ์ง์ ์์ ๋ค๋ฅธ ์ง์ ์ผ๋ก ์ด๋ํ๊ธฐ ์ํด ๊ทธ๋ฆฌ๋์ ๊ฐ์ ๋๋ก ์์คํ ์ ๋ฐ๋ผ ์ด๋ํด์ผ ํ๋ ๊ฑฐ๋ฆฌ๋ฅผ ์ธก์ ํ๋ค๋ ์ฌ์ค์์ ์ด๋ฆ์ ์ป์๋ค๊ณ ํ๋ค. ์ฌ๊ธฐ์ ๊ทธ๋ฆฌ๋ ์ ์ ์ผ๋ จ์ ์ง๊ฐ์ ํ์ฑํ๋ค.
์ ํด๋ฆฌ๋ Distance๋ผ๊ณ ๋ ํ๋ L2 Distance๋ ๋ ๋ฒกํฐ์ ํด๋น ์์ ๊ฐ ์ฐจ์ด ์ ๊ณฑํฉ์ ์ ๊ณฑ๊ทผ์ด๋ค. ์ง์ ์ ๋ ์ ์ฌ์ด์ ์ต๋จ ๊ฑฐ๋ฆฌ๋ฅผ ์ธก์ ํ๋ค๋ ์ฌ์ค์์ ์ด๋ฆ์ด ๋ถ์ฌ์ก๋ค. ์ํ์ ์ผ๋ก ๋ ๋ฒกํฐ p์ q ์ฌ์ด์ L2 ๊ฑฐ๋ฆฌ๋ ๋ค์๊ณผ ๊ฐ์ด ์ ์๋๋ค.
L2 Distance (Euclidean distance):
์ผ๋ฐ์ ์ผ๋ก L2 Distance๋ ๋ฒกํฐ ์์ ๊ฐ์ ์ฐจ์ด ํฌ๊ธฐ๋ฅผ ๊ณ ๋ คํ๊ธฐ ๋๋ฌธ์ L1 Distance๋ณด๋ค ๋ ์ผ๋ฐ์ ์ผ๋ก ์ฌ์ฉ๋๋ ๋ฐ๋ฉด, L1 Distance๋ ์ ๋ ๊ฐ๋ง ๊ณ ๋ คํ๋ค.
๊ทธ๋ฌ๋ L1 Distance๋ ์์ ๊ฐ ์ฐจ์ด์ ํฌ๊ธฐ๊ฐ ๋ค๋ฅด๊ณ ๋ถํธ๊ฐ ์ค์ํ ์ํฉ์์ ์ ์ฉํ๊ฒ ์ฌ์ฉ๋๋ค.
์๋ ๊ทธ๋ฆผ๋ค์ L1 Distance์ L2 Distance๋ฅผ ์๊ฐํํ ๊ทธ๋ฆผ์ด๋ค.
Example 1
Example 2
Example 3
L1 Loss (Mean Absolute Error) VS. L2 Loss (Mean Squared Error)
ํ๊ท ์ ๋ ์ค์ฐจ(MAE)๋ผ๊ณ ๋ ํ๋ L1 Loss๊ณผ ํ๊ท ์ ๊ณฑ ์ค์ฐจ(MSE)๋ผ๊ณ ๋ ํ๋ L2 Loss์ ๋์ ๋ณ์์ ์์ธก ๊ฐ๊ณผ ์ค์ ๊ฐ ๊ฐ์ ์ฐจ์ด ๋๋ ์ค๋ฅ๋ฅผ ์ธก์ ํ๊ธฐ ์ํด ํ๊ท(Regression) ์์ ์ ์ฌ์ฉ๋๋ ์์ค ํจ์์ด๋ค.
L1 Loss (Mean Absolute Error):
\(\begin{equation}
L_{1}=\frac{1}{n}\sum_{i=1}^{n}|y_{i}-\hat{y}_{i}|
\end{equation}\)
L2 Loss (Mean Squared Error):
\[\begin{equation} L_{2}=\frac{1}{n}\sum_{i=1}^{n}(y_{i}-\hat{y}_{i})^2 \end{equation}\]L1 Loss์ ์์ธก ๊ฐ๊ณผ ์ค์ ๊ฐ ๊ฐ์ ์ ๋ ์ฐจ์ด๋ฅผ ๊ณ์ฐํ๋ ๋ฐ๋ฉด L2 Loss์ ์ฐจ์ด ์ ๊ณฑ์ ๊ณ์ฐํ๋ค.
์ด๋ฌํ ์์ค ํจ์๋ฅผ ์ฌ์ฉํ๋ ๋ชฉ์ ์ ํ์ต ์ค์ ์์ธก ๊ฐ๊ณผ ์ค์ ๊ฐ ๊ฐ์ ์ฐจ์ด ๋๋ ์ค๋ฅ๋ฅผ ์ต์ํํ๊ธฐ ์ํจ์ด๋ค.
L@ Loss VS. L@ Distance
L1 Loss, L2 Loss, L1 Distance, L2 Distance๋ ์ ์ฌํ ์ํ ๊ณต์์ ๊ณต์ ํ์ง๋ง, ์๋ก ๋ค๋ฅธ ์ฉ๋๋ก ์ฌ์ฉ๋๋ค.
L@ Loss๋ ํ๊ท ์์ ์์ ์์ธก ๊ฐ๊ณผ ์ค์ ๊ฐ์ ์ฐจ์ด ๋๋ ์ค๋ฅ๋ฅผ ์ธก์ ํ๋๋ฐ ์ฌ์ฉ๋๋ ๋ฐ๋ฉด, L@ Distance๋ ๊ฑฐ๋ฆฌ ๋๋ ๋ ๋ฒกํฐ ์ฌ์ด์ ์ ์ฌ์ฑ์ ์ธก์ ํ๋๋ฐ์ ์ฌ์ฉ๋๋ค.
๋ฐ์ดํฐ์ ์ ๋ถ๋ฆฌํ๋ ์ด์ ๋ ๋ฌด์์ธ๊ฐ?
๋ฐ์ดํฐ์ ์ train set, validation set, test set์ผ๋ก ๋๋๋ ์ด์ ๋ ์ด์ ์ ๋ณด์ง ๋ชปํ ๋ฐ์ดํฐ๋ก ๋ฅ๋ฌ๋ ๋ชจ๋ธ์ ์ฑ๋ฅ์ ํ๊ฐํ ์ ์๋ ๋ฐฉ๋ฒ์ ๊ฐ๊ธฐ ์ํจ์ด๋ค.
train set๋ ๋ชจ๋ธ์ ํ๋ จ์ํค๋ ๋ฐ ์ฌ์ฉ๋๋ฉฐ, validation set๋ ๋ชจ๋ธ ํ์ดํผํ๋ผ๋ฏธํฐ๋ฅผ ์กฐ์ ํ๋ ๋ฐ ์ฌ์ฉ๋๋ฉฐ, test set๋ ๋ณธ ์ ์ด ์๋ ๋ฐ์ดํฐ์ ๋ํ ๋ชจ๋ธ์ ์ต์ข ์ฑ๋ฅ์ ํ๊ฐํ๋ ๋ฐ ์ฌ์ฉ๋๋ค.