๐Ÿฆญ AI&Big Data/ML

ํšŒ๊ท€

๊ณ„๋ž€์†Œ๋…„ 2025. 2. 28. 09:05

ํšŒ๊ท€

KNN ํšŒ๊ท€๋Š” ๊ฐ€์žฅ ๊ฐ€๊นŒ์šด k๊ฐœ์˜ ์ด์›ƒ์„ ์ฐพ์•„ ์˜ˆ์ธก๊ฐ’์„ ๊ณ„์‚ฐํ•˜๋Š” ๋ฐฉ๋ฒ•์ด๋‹ค.

ํ•˜์ง€๋งŒ ๋ฉ€๋ฆฌ ์žˆ๋Š” ์ด์›ƒ๋“ค์ด ์˜ˆ์ธก์— ์˜ํ–ฅ์„ ๋ฏธ์น˜๋ฉด ์ •ํ™•๋„๊ฐ€ ๋–จ์–ด์งˆ ์ˆ˜ ์žˆ๋‹ค. ์ด๋Ÿฐ ๋ฌธ์ œ๋ฅผ ํ•ด๊ฒฐํ•˜๋ ค๋ฉด ํšŒ๊ท€ ๋ชจ๋ธ์„ ์‚ฌ์šฉํ•œ๋‹ค.

  • ๋ชจ๋ธ ํŒŒ๋ผ๋ฏธํ„ฐ๋Š” ๋ชจ๋ธ์ด ํ•™์Šต์„ ํ†ตํ•ด ์ž๋™์œผ๋กœ ์กฐ์ •๋˜๋Š” ๊ฐ’
  • ํ•˜์ดํผํŒŒ๋ผ๋ฏธํ„ฐ๋Š” ๋ชจ๋ธ ํ•™์Šต ์ „์— ์‚ฌ์šฉ์ž๊ฐ€ ์„ค์ •ํ•˜๋Š” ๊ฐ’

ํšŒ๊ท€

ํšŒ๊ท€๋Š” ์—ฐ์†์ ์ธ ํƒ€๊นƒ ๋ณ€์ˆ˜์™€ ์„ค๋ช… ๋ณ€์ˆ˜(ํŠน์„ฑ) ์‚ฌ์ด์˜ ๊ด€๊ณ„๋ฅผ ๋ชจ๋ธ๋งํ•˜๋Š” ๊ธฐ๋ฒ•. ์ฃผ๋กœ ์˜ˆ์ธก ๋ฌธ์ œ์—์„œ ์‚ฌ์šฉ๋˜๋ฉฐ, ์„ ํ˜• ํšŒ๊ท€๋Š” ๊ฐ€์žฅ ๊ธฐ๋ณธ์ ์ธ ํ˜•ํƒœ๋กœ, ๋‘ ๋ณ€์ˆ˜ ๊ฐ„์˜ ๊ด€๊ณ„๋ฅผ ์ง์„ (๋˜๋Š” ๊ณ ์ฐจ์›์—์„œ๋Š” ์ดˆํ‰๋ฉด)์œผ๋กœ ๋‚˜ํƒ€๋‚ธ๋‹ค.

 

K-์ตœ๊ทผ์ ‘ ์ด์›ƒ ํšŒ๊ท€ 

  • ํšŒ๊ท€ ๋ฌธ์ œ์— KNN ์•Œ๊ณ ๋ฆฌ์ฆ˜์„ ์ ์šฉํ•œ ๊ฒƒ
  • ํšŒ๊ท€๋Š” ์—ฐ์†์ ์ธ ๊ฐ’์„ ์˜ˆ์ธกํ•˜๋Š” ๋ฌธ์ œ๋กœ, ๋ถ„๋ฅ˜ ๋ฌธ์ œ์™€ ๋‹ฌ๋ฆฌ ์˜ˆ์ธกํ•˜๋ ค๋Š” ๊ฐ’์ด ์—ฌ๋Ÿฌ ํด๋ž˜์Šค ์ค‘ ํ•˜๋‚˜๊ฐ€ ์•„๋‹ˆ๋ผ ์‹ค์ˆ˜ ๊ฐ’
  • ex) ๊ฒฝ์ œ ์„ฑ์žฅ๋ฅ  ์˜ˆ์ธก
  • K-์ตœ๊ทผ์ ‘ ์ด์›ƒ ํšŒ๊ท€์—์„œ ์˜ˆ์ธกํ•˜๋ ค๋Š” ๊ฐ’์€ ์ฃผ๋ณ€ ๋ฐ์ดํ„ฐ์˜ ํ‰๊ท ์„ ์‚ฌ์šฉํ•œ๋‹ค.
  • ์ฆ‰, ์˜ˆ์ธกํ•˜๋ ค๋Š” ์ƒ˜ํ”Œ์— ๋Œ€ํ•ด ๊ฐ€์žฅ ๊ฐ€๊นŒ์šด k๊ฐœ์˜ ์ƒ˜ํ”Œ์„ ์ฐพ๊ณ , ๊ทธ๋“ค์˜ ํƒ€๊นƒ ๊ฐ’์˜ ํ‰๊ท ์„ ์˜ˆ์ธก ๊ฐ’์œผ๋กœ ์‚ฌ์šฉ
  • ์›๋ฆฌ
    1. ์˜ˆ์ธกํ•˜๋ ค๋Š” ์ƒ˜ํ”Œ๊ณผ ๊ฐ€์žฅ ๊ฐ€๊นŒ์šด k๊ฐœ์˜ ์ƒ˜ํ”Œ์„ ์ฐพ๋Š”๋‹ค.
    2. ์ด k๊ฐœ์˜ ์ƒ˜ํ”Œ์˜ ํƒ€๊นƒ ๊ฐ’(์ˆ˜์น˜)์˜ ํ‰๊ท ์„ ๊ณ„์‚ฐ
    3. ๊ณ„์‚ฐ๋œ ํ‰๊ท  ๊ฐ’์„ ์˜ˆ์ธก ๊ฐ’์œผ๋กœ ์‚ฌ์šฉ
  •  KNN ํšŒ๊ท€์™€ KNN ๋ถ„๋ฅ˜์˜ ์ฐจ์ด
    • ๋ถ„๋ฅ˜: ์˜ˆ์ธกํ•˜๋ ค๋Š” ๊ฐ’์ด ํŠน์ • ํด๋ž˜์Šค ์ค‘ ํ•˜๋‚˜์ผ ๋•Œ, ๊ฐ€์žฅ ๊ฐ€๊นŒ์šด k๊ฐœ์˜ ํด๋ž˜์Šค ์ค‘ ๊ฐ€์žฅ ๋งŽ์ด ๋‚˜์˜ค๋Š” ํด๋ž˜์Šค๋ฅผ ์„ ํƒ
    • ํšŒ๊ท€: ์˜ˆ์ธกํ•˜๋ ค๋Š” ๊ฐ’์ด ์—ฐ์†์ ์ธ ์ˆ˜์น˜์ผ ๋•Œ, ๊ฐ€์žฅ ๊ฐ€๊นŒ์šด k๊ฐœ์˜ ๊ฐ’์˜ ํ‰๊ท ์„ ๊ณ„์‚ฐํ•˜์—ฌ ์˜ˆ์ธก
  •  K-์ตœ๊ทผ์ ‘ ์ด์›ƒ ํšŒ๊ท€์˜ ํ‰๊ฐ€
    • ํšŒ๊ท€ ๋ฌธ์ œ์—์„œ๋Š” ์ •ํ™•๋„ ๋Œ€์‹  ๊ฒฐ์ •๊ณ„์ˆ˜(R² score)๋ฅผ ์‚ฌ์šฉํ•˜์—ฌ ๋ชจ๋ธ์˜ ์„ฑ๋Šฅ์„ ํ‰๊ฐ€
    • ๊ฒฐ์ •๊ณ„์ˆ˜๋Š” ๋ชจ๋ธ์ด ์˜ˆ์ธกํ•œ ๊ฐ’๊ณผ ์‹ค์ œ ๊ฐ’ ์‚ฌ์ด์˜ ์ฐจ์ด๋ฅผ ๊ธฐ๋ฐ˜์œผ๋กœ ๋ชจ๋ธ ์„ฑ๋Šฅ์„ ์ธก์ •ํ•˜๋Š” ์ง€ํ‘œ
    • R² score๊ฐ€ 1์— ๊ฐ€๊นŒ์šธ์ˆ˜๋ก ๋ชจ๋ธ์ด ์ž˜ ์˜ˆ์ธกํ•˜๊ณ  ์žˆ์Œ์„ ์˜๋ฏธ
  •  KNN ํšŒ๊ท€๋ฅผ ๊ตฌํ˜„ํ•˜๋Š” ๋ฐฉ๋ฒ• (์‚ฌ์ดํ‚ท๋Ÿฐ)
  • ์‚ฌ์ดํ‚ท๋Ÿฐ์—์„œ KNN ํšŒ๊ท€๋Š” KNeighborsRegressor ํด๋ž˜์Šค๋ฅผ ์‚ฌ์šฉํ•˜์—ฌ ๊ตฌํ˜„ํ•  ์ˆ˜ ์žˆ๋‹ค.

 

import numpy as np
from sklearn.model_selection import train_test_split
from sklearn.preprocessing import StandardScaler
from sklearn.neighbors import KNeighborsRegressor
from sklearn.metrics import mean_squared_error, r2_score

# ์˜ˆ์‹œ ๋ฐ์ดํ„ฐ (ํŠน์„ฑ X, ํƒ€๊นƒ y)
X = np.array([[1, 2], [3, 4], [5, 6], [7, 8], [9, 10], [11, 12]])
y = np.array([1, 3, 5, 7, 9, 11])  # ์˜ˆ์ธกํ•˜๋ ค๋Š” ํƒ€๊นƒ ๊ฐ’

# ํ›ˆ๋ จ์„ธํŠธ์™€ ํ…Œ์ŠคํŠธ์„ธํŠธ ๋‚˜๋ˆ„๊ธฐ
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)

# ๋ฐ์ดํ„ฐ ํ‘œ์ค€ํ™” (StandardScaler)
scaler = StandardScaler()
X_train_scaled = scaler.fit_transform(X_train)
X_test_scaled = scaler.transform(X_test)

# KNN ํšŒ๊ท€ ๋ชจ๋ธ ์ƒ์„ฑ (k=3)
knn = KNeighborsRegressor(n_neighbors=3)

# ๋ชจ๋ธ ํ›ˆ๋ จ
knn.fit(X_train_scaled, y_train)

# ์˜ˆ์ธก
y_pred = knn.predict(X_test_scaled)

# ์„ฑ๋Šฅ ํ‰๊ฐ€
mse = mean_squared_error(y_test, y_pred)  # ํ‰๊ท  ์ œ๊ณฑ ์˜ค์ฐจ
r2 = r2_score(y_test, y_pred)  # ๊ฒฐ์ •๊ณ„์ˆ˜

print(f"์˜ˆ์ธก๊ฐ’: {y_pred}")
print(f"ํ‰๊ท  ์ œ๊ณฑ ์˜ค์ฐจ(MSE): {mse}")
print(f"๊ฒฐ์ •๊ณ„์ˆ˜(R²): {r2}")

  1. ๋ฐ์ดํ„ฐ์…‹ ์ค€๋น„: ์˜ˆ์‹œ๋กœ ๊ฐ„๋‹จํ•œ 2์ฐจ์› ํŠน์„ฑ(X)๊ณผ ๊ทธ์— ๋Œ€์‘ํ•˜๋Š” ํƒ€๊นƒ ๊ฐ’(y)์„ ์ค€๋น„
  2. ํ›ˆ๋ จ์„ธํŠธ์™€ ํ…Œ์ŠคํŠธ์„ธํŠธ ๋‚˜๋ˆ„๊ธฐ: train_test_split()์„ ์‚ฌ์šฉํ•˜์—ฌ ๋ฐ์ดํ„ฐ๋ฅผ ํ›ˆ๋ จ์„ธํŠธ์™€ ํ…Œ์ŠคํŠธ์„ธํŠธ๋กœ ๋‚˜๋ˆˆ๋‹ค.
  3. ๋ฐ์ดํ„ฐ ํ‘œ์ค€ํ™”: StandardScaler๋ฅผ ์‚ฌ์šฉํ•˜์—ฌ ๋ฐ์ดํ„ฐ๋ฅผ ํ‘œ์ค€ํ™”(ํ‘œ์ค€ํŽธ์ฐจ)
  4. KNN ํšŒ๊ท€ ๋ชจ๋ธ ํ›ˆ๋ จ: KNeighborsRegressor๋ฅผ ์‚ฌ์šฉํ•˜์—ฌ ํšŒ๊ท€ ๋ชจ๋ธ์„ ํ•™์Šต์‹œํ‚ด
  5. ์„ฑ๋Šฅ ํ‰๊ฐ€: mean_squared_error()๋ฅผ ์‚ฌ์šฉํ•˜์—ฌ ํ‰๊ท  ์ œ๊ณฑ ์˜ค์ฐจ(MSE)๋ฅผ ๊ณ„์‚ฐํ•˜๊ณ , r2_score()๋ฅผ ์‚ฌ์šฉํ•˜์—ฌ ๊ฒฐ์ •๊ณ„์ˆ˜(R²)๋ฅผ ํ‰๊ฐ€

๊ณผ๋Œ€์ ํ•ฉ๊ณผ ๊ณผ์†Œ์ ํ•ฉ์„ ๊ณ ๋ ค -> ๋”ฐ๋ผ์„œ ์ด์›ƒ์˜ ์ˆ˜(k)๋ฅผ ์ ์ ˆํ•˜๊ฒŒ ์„ค์ •ํ•˜๋Š” ๊ฒƒ์ด ์ค‘์š”

  • K๊ฐ’ ์„ ํƒ
    • ์ž‘์€ k๊ฐ’: ๋ฐ์ดํ„ฐ์˜ ๊ตญ์ง€์ ์ธ ํŒจํ„ด์„ ๋ฐ˜์˜ํ•˜๋ฏ€๋กœ, ํ›ˆ๋ จ์„ธํŠธ์— ๊ณผ์ ํ•ฉ๋  ๊ฐ€๋Šฅ์„ฑ์ด ๋†’๋‹ค.
    • ํฐ k๊ฐ’: ์ „์ฒด ๋ฐ์ดํ„ฐ์˜ ์ผ๋ฐ˜์ ์ธ ํŒจํ„ด์„ ๋ฐ˜์˜ํ•˜๋ฏ€๋กœ, ๊ณผ์†Œ์ ํ•ฉ์˜ ์œ„ํ—˜์ด ์žˆ์„ ์ˆ˜ ์žˆ๋‹ค.
  • K-์ตœ๊ทผ์ ‘ ์ด์›ƒ ํšŒ๊ท€(KNN Regression)๋Š” ๊ฐ€์žฅ ๊ฐ€๊นŒ์šด k๊ฐœ์˜ ์ƒ˜ํ”Œ์˜ ํ‰๊ท ์„ ์‚ฌ์šฉํ•˜์—ฌ ์˜ˆ์ธกํ•˜๋Š” ๋ฐฉ๋ฒ•
  • ๊ณผ๋Œ€์ ํ•ฉ๊ณผ ๊ณผ์†Œ์ ํ•ฉ์„ ๋ฐฉ์ง€ํ•˜๊ธฐ ์œ„ํ•ด ์ ์ ˆํ•œ k๊ฐ’์„ ์„ ํƒํ•˜๋Š” ๊ฒƒ์ด ์ค‘์š”
  • KNeighborsRegressor๋ฅผ ์‚ฌ์šฉํ•˜์—ฌ ๊ฐ„๋‹จํ•˜๊ฒŒ KNN ํšŒ๊ท€๋ฅผ ๊ตฌํ˜„ํ•˜๊ณ , ๊ฒฐ์ •๊ณ„์ˆ˜(R² score)๋ฅผ ํ†ตํ•ด ๋ชจ๋ธ์˜ ์„ฑ๋Šฅ์„ ํ‰๊ฐ€ํ•  ์ˆ˜ ์žˆ๋‹ค.

 

๋‹จ์ˆœ ์„ ํ˜• ํšŒ๊ท€ (Simple Linear Regression)

  • ๋ชฉํ‘œ: ํ•˜๋‚˜์˜ ํŠน์„ฑ(์„ค๋ช… ๋ณ€์ˆ˜)๊ณผ ์—ฐ์†์ ์ธ ํƒ€๊นƒ(์‘๋‹ต ๋ณ€์ˆ˜) ๊ฐ„์˜ ๊ด€๊ณ„๋ฅผ ๋ชจ๋ธ๋ง
  • ๋ชจ๋ธ: ์„ ํ˜• ํšŒ๊ท€ ๋ชจ๋ธ์€ y = w1 * x + b์™€ ๊ฐ™์€ ์ง์„  ๋ฐฉ์ •์‹์œผ๋กœ ํ‘œํ˜„
    • b: y์ถ• ์ ˆํŽธ
    • w1: ํŠน์„ฑ์˜ ๊ฐ€์ค‘์น˜
  • ์˜ค์ฐจ(์ž”์ฐจ): ํ›ˆ๋ จ ์ƒ˜ํ”Œ๊ณผ ํšŒ๊ท€ ์ง์„  ์‚ฌ์ด์˜ ์ˆ˜์ง ๊ฑฐ๋ฆฌ. ์˜ค์ฐจ๋Š” ์ž”์ฐจ๋ผ๊ณ ๋„ ํ•˜๋ฉฐ, ์˜ค์ฐจ๊ฐ€ 0์— ๊ฐ€๊นŒ์šธ์ˆ˜๋ก ์ข‹์€ ๋ชจ๋ธ
  • ๋ฌธ์ œ: ๊ฐ’์ด ์Œ์ˆ˜๊ฐ€ ๋‚˜์˜ฌ ์ˆ˜๋„ ์žˆ๋‹ค. → ๋‹คํ•ญ ํšŒ๊ท€๋ฅผ ์‚ฌ์šฉ

 

๋‹ค์ค‘ ํšŒ๊ท€ (Multiple Regression)

  • ๋ชฉํ‘œ: ์—ฌ๋Ÿฌ ํŠน์„ฑ์ด ์žˆ๋Š” ๊ฒฝ์šฐ, ์ดˆํ‰๋ฉด์„ ์‚ฌ์šฉํ•˜์—ฌ ๋ชจ๋ธ๋ง.
    • y = w1 * x1 + w2 * x2 + ... + wn * xn + b
    • ์ดˆํ‰๋ฉด: ๊ณ ์ฐจ์›์—์„œ๋Š” ์ง์„ ์ด ์•„๋‹ˆ๋ผ ๋‹ค์ฐจ์› ๊ณต๊ฐ„์—์„œ ๋ฐ์ดํ„ฐ๋ฅผ ๋ถ„๋ฆฌํ•˜๋Š” ํ‰๋ฉด์„ ์˜๋ฏธ, n์ฐจ์›์—์„œ๋Š” n-1์ฐจ์›์˜ ๊ณต๊ฐ„์ด ์ดˆํ‰๋ฉด
  • ์ผ๋ฐ˜ํ™”: ํŠน์„ฑ์ด ํ•˜๋‚˜์ผ ๋•Œ๋Š” ์ง์„ , ์—ฌ๋Ÿฌ ๊ฐœ์ผ ๋•Œ๋Š” ์ดˆํ‰๋ฉด์œผ๋กœ ์ผ๋ฐ˜ํ™”

 

์ƒ๊ด€๊ด€๊ณ„ ํ–‰๋ ฌ (Correlation Matrix)

  • ์ƒ๊ด€๊ด€๊ณ„๋Š” ๋‘ ๋ณ€์ˆ˜ ๊ฐ„์˜ ๊ด€๊ณ„๋ฅผ ๋‚˜ํƒ€๋‚ด๋ฉฐ, ํ”ผ์–ด์Šจ ์ƒ๊ด€๊ณ„์ˆ˜๋ฅผ ์‚ฌ์šฉํ•˜์—ฌ ํ‘œํ˜„
    • ๊ฐ’์˜ ๋ฒ”์œ„๋Š” -1(์™„์ „ํ•œ ์Œ์˜ ์ƒ๊ด€๊ด€๊ณ„)์—์„œ 1(์™„์ „ํ•œ ์–‘์˜ ์ƒ๊ด€๊ด€๊ณ„) ์‚ฌ์ด
    • 0์€ ๋‘ ๋ณ€์ˆ˜ ๊ฐ„์— ์ƒ๊ด€๊ด€๊ณ„๊ฐ€ ์—†์Œ์„ ์˜๋ฏธ
  • ๊ณต๋ถ„์‚ฐ ํ–‰๋ ฌ๊ณผ ๊ด€๋ จ: ์ƒ๊ด€๊ด€๊ณ„ ํ–‰๋ ฌ์€ ๊ณต๋ถ„์‚ฐ ํ–‰๋ ฌ์„ ์Šค์ผ€์ผ ์กฐ์ •ํ•œ ๊ฒฐ๊ณผ๋กœ ๋ณผ ์ˆ˜ ์žˆ๋‹ค.

 

์ตœ์†Œ ์ œ๊ณฑ๋ฒ• (Ordinary Least Squares, OLS)

  • ์ตœ์†Œ ์ œ๊ณฑ๋ฒ•์€ ๊ฐ€์žฅ ์ž˜ ๋งž๋Š” ์ง์„ ์„ ์ฐพ๋Š” ๊ธฐ์ค€. ํ›ˆ๋ จ ์ƒ˜ํ”Œ์˜ ์ˆ˜์ง ๊ฑฐ๋ฆฌ(์ž”์ฐจ)์˜ ์ œ๊ณฑํ•ฉ์„ ์ตœ์†Œํ™”ํ•˜๋Š” ์„ ํ˜• ํšŒ๊ท€ ๋ชจ๋ธ ํŒŒ๋ผ๋ฏธํ„ฐ๋ฅผ ์ถ”์ •ํ•œ๋‹ค.
  • OLS์—์„œ ์‚ฌ์šฉํ•œ ์†์‹ค ํ•จ์ˆ˜์™€ ์•„๋‹ฌ๋ฆฐ์˜ ์†์‹ค ํ•จ์ˆ˜(ํ‰๊ท  ์ œ๊ณฑ ์˜ค์ฐจ)๊ฐ€ ๋™์ผํ•˜๋‹ค๋Š” ์ ์—์„œ ์•„๋‹ฌ๋ฆฐ์€ OLS ํšŒ๊ท€๋กœ ํ•ด์„๋  ์ˆ˜ ์žˆ๋‹ค.

 

ํšŒ๊ท€ ๋ชจ๋ธ์—์„œ์˜ ์ด์ƒ์น˜ ์ฒ˜๋ฆฌ - RANSAC

  • RANSAC (RANdom SAmple Consensus) ์•Œ๊ณ ๋ฆฌ์ฆ˜์€ ์ด์ƒ์น˜์— ๋ฏผ๊ฐํ•œ ์„ ํ˜• ํšŒ๊ท€ ๋ชจ๋ธ์—์„œ ์•ˆ์ •์ ์ธ ๋ชจ๋ธ์„ ์ฐพ๊ธฐ ์œ„ํ•œ ์•Œ๊ณ ๋ฆฌ์ฆ˜

RANSAC ์•Œ๊ณ ๋ฆฌ์ฆ˜ ๋‹จ๊ณ„

  1. ๋žœ๋คํ•˜๊ฒŒ ์ƒ˜ํ”Œ์„ ์„ ํƒํ•˜์—ฌ ๋ชจ๋ธ ํ•™์Šต
  2. ํ›ˆ๋ จ๋œ ๋ชจ๋ธ์—์„œ ๋‹ค๋ฅธ ํฌ์ธํŠธ๋ฅผ ํ…Œ์ŠคํŠธํ•˜๊ณ , ์‚ฌ์šฉ์ž๊ฐ€ ์ง€์ •ํ•œ ํ—ˆ์šฉ ์˜ค์ฐจ ๋‚ด์— ์žˆ๋Š” ํฌ์ธํŠธ๋ฅผ ์ •์ƒ์น˜๋กœ ์ถ”๊ฐ€
  3. ์ •์ƒ์น˜๋“ค๋งŒ์„ ์‚ฌ์šฉํ•˜์—ฌ ๋ชจ๋ธ์„ ๋‹ค์‹œ ํ•™์Šต
  4. ๋ชจ๋ธ์„ ํ›ˆ๋ จ์‹œํ‚ค๊ณ  ์ •์ƒ์น˜ ๊ฐ„์˜ ์˜ค์ฐจ๋ฅผ ์ถ”์ •
  5. ์„ฑ๋Šฅ์ด ์ง€์ •๋œ ์ž„๊ณ„๊ฐ’์— ๋„๋‹ฌํ•˜๊ฑฐ๋‚˜ ๋ฐ˜๋ณต ํšŸ์ˆ˜๊ฐ€ ๋๋‚  ๋•Œ๊นŒ์ง€ ๋ฐ˜๋ณต

 

์„ ํ˜• ํšŒ๊ท€ ๋ชจ๋ธ ์„ฑ๋Šฅ ํ‰๊ฐ€

  1. ์ž”์ฐจ ๊ทธ๋ž˜ํ”„
    • ์ž”์ฐจ(์˜ค์ฐจ)๊ฐ€ ์˜ˆ์ธก๊ฐ’์— ๋Œ€ํ•ด ๋žœ๋คํ•˜๊ฒŒ ๋ถ„ํฌํ•˜๋Š”์ง€ ํ™•์ธํ•˜๋Š” ๋ฐฉ๋ฒ•
    • ๋น„์„ ํ˜•์„ฑ์ด๋‚˜ ์ด์ƒ์น˜๋ฅผ ๊ฐ์ง€ํ•˜๋Š” ๋ฐ ๋„์›€์ด ๋œ๋‹ค.
    • ์˜ˆ์ธก์ด ์™„๋ฒฝํ•˜๋ฉด ์ž”์ฐจ๋Š” 0์ด ๋œ๋‹ค.
    • ์ด์ƒ์น˜๋Š” ๋‹ค๋ฅธ ๊ฐ’๋“ค๊ณผ ํฌ๊ฒŒ ์ฐจ์ด ๋‚˜๋Š” ๊ฐ’์ด๋ฏ€๋กœ, ์ž”์ฐจ ๊ทธ๋ž˜ํ”„์—์„œ ์ด๋ฅผ ๋ˆˆ์œผ๋กœ ์‹๋ณ„ํ•  ์ˆ˜ ์žˆ๋‹ค.
    • ํŒจํ„ด์ด๋ž€, ์ž”์ฐจ๋“ค์ด ๊ทœ์น™์ ์ด์ง€ ์•Š๊ฒŒ ํฉ์–ด์ ธ ์žˆ์ง€ ์•Š๊ณ  ์–ด๋–ค ํ˜•ํƒœ๋‚˜ ๊ฒฝํ–ฅ์„ฑ์„ ๋ณด์ด๋Š” ๊ฒฝ์šฐ๋ฅผ ์˜๋ฏธ
    • ์ด์ƒ์น˜๊ฐ€ ์žˆ์œผ๋ฉด ์ž”์ฐจ์˜ ๋ถ„ํฌ๊ฐ€ ์™œ๊ณก๋˜๊ฑฐ๋‚˜, ๋‹ค๋ฅธ ๊ฐ’๋“ค๊ณผ ํฐ ์ฐจ์ด๋ฅผ ๋ณด์ด๋ฏ€๋กœ ์ž”์ฐจ ๊ทธ๋ž˜ํ”„์— ํŒจํ„ด์ด ๋‚˜ํƒ€๋‚  ์ˆ˜ ์žˆ๋‹ค.
  2. ํ‰๊ท  ์ œ๊ณฑ ์˜ค์ฐจ (MSE, Mean Squared Error)
    • ํ›ˆ๋ จ ๋ฐ์ดํ„ฐ์™€ ํ…Œ์ŠคํŠธ ๋ฐ์ดํ„ฐ์—์„œ์˜ ์˜ค์ฐจ๋ฅผ ๋น„๊ตํ•˜๋Š” ์ •๋Ÿ‰์ ์ธ ์ง€ํ‘œ
    • MSE๊ฐ€ ๋‚ฎ์„์ˆ˜๋ก ๋ชจ๋ธ์˜ ์˜ˆ์ธก์ด ์ •ํ™•ํ•˜๋‹ค๋Š” ์˜๋ฏธ
    • MSE๋Š” ์ƒ˜ํ”Œ ํฌ๊ธฐ n์— ๋Œ€ํ•ด ์ •๊ทœํ™”๋˜์–ด ๋น„๊ต๊ฐ€๋Šฅ
    • MSE๋Š” ์˜ค์ฐจ๋ฅผ ์ œ๊ณฑํ•˜์—ฌ ๊ณ„์‚ฐํ•˜๊ธฐ ๋•Œ๋ฌธ์— ํฐ ์˜ค์ฐจ์— ๋” ๋ฏผ๊ฐํ•˜๋‹ค. ์ฆ‰, ํฐ ์˜ค์ฐจ๋ฅผ ๋” ๊ฐ•์กฐํ•˜๋Š” ํŠน์„ฑ์ด ์žˆ๊ณ , ์ด๋กœ ์ธํ•ด ๊ณผ๋Œ€์ ํ•ฉ์„ ๋” ์‰ฝ๊ฒŒ ๊ฐ์ง€ํ•  ์ˆ˜ ์žˆ๋‹ค. ์˜ˆ๋ฅผ ๋“ค์–ด, ๋ชจ๋ธ์ด ํ›ˆ๋ จ ๋ฐ์ดํ„ฐ์—์„œ ๋„ˆ๋ฌด ์„ธ๋ฐ€ํ•œ ํŒจํ„ด๊นŒ์ง€ ํ•™์Šตํ•ด๋ฒ„๋ฆฐ ๊ฒฝ์šฐ, ํ›ˆ๋ จ ๋ฐ์ดํ„ฐ์—์„œ MSE๊ฐ€ ๋งค์šฐ ์ž‘์ง€๋งŒ ํ…Œ์ŠคํŠธ ๋ฐ์ดํ„ฐ์—์„œ MSE๊ฐ€ ๊ธ‰๊ฒฉํžˆ ์ปค์ง€๋Š” ํ˜„์ƒ์„ ์‰ฝ๊ฒŒ ํŒŒ์•…ํ•  ์ˆ˜ ์žˆ๋‹ค.
    • RMSE: MSE์˜ ์ œ๊ณฑ๊ทผ์„ ์ทจํ•œ ๊ฐ’์œผ๋กœ, ์˜ค์ฐจ์˜ ๋‹จ์œ„๊ฐ€ ์›๋ž˜ ๋ฐ์ดํ„ฐ์˜ ๋‹จ์œ„์™€ ์ผ์น˜ํ•˜๊ฒŒ ๋งŒ๋“ค์–ด์ค€๋‹ค. ์˜ค์ฐจ์˜ ํฌ๊ธฐ๋ฅผ ๋” ์ง๊ด€์ ์œผ๋กœ ์ดํ•ดํ•  ์ˆ˜ ์žˆ๊ฒŒ ํ•ด์ค€๋‹ค.
  3. ํ‰๊ท  ์ ˆ๋Œ€ ์˜ค์ฐจ (MAE, Mean Absolute Error)
    • MSE์™€ ๋‹ฌ๋ฆฌ ์˜ˆ์ธก ์˜ค์ฐจ์˜ ์ ˆ๋Œ“๊ฐ’์„ ์‚ฌ์šฉํ•˜์—ฌ ํ‰๊ท ์„ ๊ตฌํ•จ
    • MAE๋Š” ์˜ค์ฐจ๊ฐ€ ์ผ์ •ํ•˜๊ฒŒ ๋ถ„ํฌ๋œ ๊ฒฝ์šฐ ์œ ์šฉํ•˜๋ฉฐ, MSE๋ณด๋‹ค ์ด์ƒ์น˜์— ๋œ ๋ฏผ๊ฐํ•˜๋‹ค.
    • ๋ฐ˜๋ฉด MAE๋Š” ์˜ค์ฐจ์˜ ์ ˆ๋Œ“๊ฐ’์„ ๋‹จ์ˆœํžˆ ํ‰๊ท ๋‚ด๋Š” ๋ฐฉ์‹์ด๋ผ ํฐ ์˜ค์ฐจ์— ๋Œ€ํ•œ ๋ฏผ๊ฐ๋„๊ฐ€ ๋‚ฎ๋‹ค. ๋”ฐ๋ผ์„œ ํฐ ์˜ค์ฐจ๊ฐ€ ์žˆ์„ ๋•Œ MAE๊ฐ€ MSE๋ณด๋‹ค ๋œ ๋ฏผ๊ฐํ•˜๊ฒŒ ๋ฐ˜์‘ํ•  ์ˆ˜ ์žˆ๋‹ค.
  4. ๊ฒฐ์ • ๊ณ„์ˆ˜ (R², R-squared)
    • ๋ชจ๋ธ์ด ํƒ€๊นƒ ๋ณ€์ˆ˜์˜ ๋ถ„์‚ฐ์—์„œ ์–ผ๋งˆ๋‚˜ ๋งŽ์€ ๋ถ€๋ถ„์„ ์„ค๋ช…ํ•˜๋Š”์ง€(์ฆ‰, ๋ฐ์ดํ„ฐ์—์„œ ์–ผ๋งˆ๋‚˜ ๋งŽ์€ ๋ณ€๋™์„ฑ์„ ์„ค๋ช…ํ•˜๋Š”์ง€)๋ฅผ ์„ค๋ช…
    • SSE (Sum of Squared Errors): ์ œ๊ณฑ ์˜ค์ฐจํ•ญ์˜ ํ•ฉ
    • SST (Total Sum of Squares): ์ „์ฒด ์ œ๊ณฑํ•ฉ
    • ๊ฒฐ์ • ๊ณ„์ˆ˜ ํ•ด์„
      • R² = 1: ๋ชจ๋ธ์ด ๋ฐ์ดํ„ฐ๋ฅผ ์™„๋ฒฝํžˆ ์„ค๋ช…
      • R² = 0: ๋ชจ๋ธ์ด ๋ฐ์ดํ„ฐ๋ฅผ ์ „ํ˜€ ์„ค๋ช…ํ•˜์ง€ ๋ชปํ•จ
      • R² < 0: ๋ชจ๋ธ์ด ์ƒ˜ํ”Œ ํ‰๊ท ์„ ๊ทธ๋Œ€๋กœ ์˜ˆ์ธกํ•˜๋ฉฐ, ๊ณผ์†Œ์ ํ•ฉ๋œ ๊ฒฝ์šฐ
    • ๊ทธ๋ ‡๋‹ค๋ฉด ๊ฒฐ์ •๊ณ„์ˆ˜๋งŒ ์‚ฌ์šฉํ•˜๋Š”๊ฒƒ์ด ์œ ๋ฆฌํ• ๊นŒ? ์•„๋‹ˆ๋‹ค. ๋‹ค์Œ๊ณผ ๊ฐ™์€ ๊ฒฝ์šฐ๋ฅผ ๊ณ ๋ คํ•ด์•ผ ํ•œ๋‹ค.
      • ๊ณผ๋Œ€์ ํ•ฉ์„ ํ™•์ธํ•˜๋ ค๋ฉด: ํ›ˆ๋ จ ๋ฐ์ดํ„ฐ์…‹๊ณผ ํ…Œ์ŠคํŠธ ๋ฐ์ดํ„ฐ์…‹์—์„œ MSE๋‚˜ MAE๋ฅผ ๋น„๊ตํ•˜๋Š” ๊ฒƒ์ด ์œ ์šฉํ•˜๋‹ค. MSE๋ฅผ ํ†ตํ•ด ํ›ˆ๋ จ ๋ฐ์ดํ„ฐ์—์„œ MSE๊ฐ€ ๋‚ฎ๊ณ  ํ…Œ์ŠคํŠธ ๋ฐ์ดํ„ฐ์—์„œ MSE๊ฐ€ ํฌ๊ฒŒ ์ฆ๊ฐ€ํ•˜๋Š” ๊ฒฝ์šฐ ๊ณผ๋Œ€์ ํ•ฉ์„ ์˜์‹ฌํ•  ์ˆ˜ ์žˆ๋‹ค.
      • ๋น„์„ ํ˜• ๋ชจ๋ธ์—์„œ๋Š”: R²๋Š” ์„ ํ˜• ํšŒ๊ท€ ๋ชจ๋ธ์—์„œ ์œ ์šฉํ•˜๋‹ค. ์ด ๊ฒฝ์šฐ์—๋Š” MSE๋‚˜ MAE์™€ ๊ฐ™์€ ์ง€ํ‘œ๊ฐ€ ๋” ์ ํ•ฉํ•  ์ˆ˜ ์žˆ๋‹ค.

 

๋‹คํ•ญ ํšŒ๊ท€ (Polynomial Regression)

  • ๋ชฉํ‘œ: ๋น„์„ ํ˜• ๊ด€๊ณ„๋ฅผ ๋ชจ๋ธ๋งํ•˜๊ธฐ ์œ„ํ•ด ์ง์„ ์ด ์•„๋‹Œ ์ตœ์ ์˜ ๊ณก์„ ์„ ์ฐพ๋Š” ๋ฐฉ๋ฒ•
  • ์„ ํ˜• ํšŒ๊ท€์™€์˜ ๊ด€๊ณ„: ๋น„์„ ํ˜• ๋ชจ๋ธ์ด์ง€๋งŒ, ์‹ค์ œ๋กœ๋Š” ๋ณ€์ˆ˜์˜ ์ œ๊ณฑ ํ•ญ ๋˜๋Š” ๊ณ ์ฐจ ํ•ญ์„ ์ถ”๊ฐ€ํ•˜์—ฌ ์„ ํ˜• ํšŒ๊ท€ ๋ชจ๋ธ์˜ ํ™•์žฅ์œผ๋กœ ๋ณผ ์ˆ˜ ์žˆ๋‹ค. ์ด๋•Œ, ๋ณ€์ˆ˜์˜ ์ œ๊ณฑ ๋ณ€ํ™˜์„ ํฌํ•จํ•œ ๋ชจ๋ธ๋„ ์„ ํ˜• ํšŒ๊ท€ ๋ชจ๋ธ์˜ ํ˜•ํƒœ๋กœ ๋ณผ ์ˆ˜ ์žˆ๋Š”๋ฐ, ์™œ๋ƒํ•˜๋ฉด ํšŒ๊ท€์˜ ๊ฐ€์ค‘์น˜(w)๊ฐ€ ์—ฌ์ „ํžˆ ์„ ํ˜•์ด๊ธฐ ๋•Œ๋ฌธ

์—ฌ๊ธฐ์„œ "์„ ํ˜•"์ด๋ž€, ๋ชจ๋ธ์ด ๊ฐ€์ค‘์น˜(w)์— ๋Œ€ํ•ด ์„ ํ˜•์ ์ด๋ผ๋Š” ๋œป.

๋ชจ๋ธ์—์„œ ์˜ˆ์ธก๊ฐ’์€ ๊ฐ ๋ณ€์ˆ˜์— ๋Œ€ํ•ด ๊ฐ€์ค‘์น˜๋ฅผ ๊ณฑํ•œ ํ›„ ๋”ํ•œ ํ˜•ํƒœ๋กœ ๋‚˜์˜ค๊ฒŒ ๋œ๋‹ค.

์—ฌ๊ธฐ์„œ x^2์€ ๋น„์„ ํ˜•์ฒ˜๋Ÿผ ๋ณด์ผ ์ˆ˜ ์žˆ์ง€๋งŒ, ์‚ฌ์‹ค w_1๊ณผ w_2๋Š” ๊ฐ๊ฐ x์™€ x^2์— ๋Œ€ํ•ด ์„ ํ˜•์ ์ด๋‹ค.

๋”ฐ๋ผ์„œ ๊ฐ€์ค‘์น˜๊ฐ€ ๊ฐ ํ•ญ์— ๋Œ€ํ•ด ์„ ํ˜•์ ์ด๋ฏ€๋กœ ๋‹คํ•ญ ํšŒ๊ท€๋„ ์„ ํ˜• ํšŒ๊ท€ ๋ชจ๋ธ๋กœ ๋ณผ ์ˆ˜ ์žˆ๋‹ค.

  • ์žฅ์ : ์ง์„ ์ด ์•„๋‹Œ ๊ณก์„  ํ˜•ํƒœ๋กœ ๋ฐ์ดํ„ฐ๋ฅผ ์ž˜ ๋ชจ๋ธ๋งํ•  ์ˆ˜ ์žˆ์–ด, ๋น„์„ ํ˜• ๊ด€๊ณ„๋ฅผ ํšจ๊ณผ์ ์œผ๋กœ ์ฒ˜๋ฆฌํ•  ์ˆ˜ ์žˆ๋‹ค.
  • ๋‹จ์ : ํŠน์„ฑ์„ ๋งŽ์ด ์ถ”๊ฐ€ํ• ์ˆ˜๋ก ๋ชจ๋ธ์˜ ๋ณต์žก๋„๊ฐ€ ๋†’์•„์ง€๊ณ  ๊ณผ๋Œ€์ ํ•ฉ์ด ๋ฐœ์ƒํ•  ์ˆ˜ ์žˆ๋‹ค๋Š” ์ 

 

๊ฒฐ์ • ํŠธ๋ฆฌ ํšŒ๊ท€ (Decision Tree Regression)

  • ๋ชฉํ‘œ: ๋ฐ์ดํ„ฐ๋ฅผ ์ž‘์€ ์˜์—ญ์œผ๋กœ ๋ถ„ํ• ํ•˜๊ณ  ๊ฐ ์˜์—ญ ๋‚ด์—์„œ ์˜ˆ์ธก์„ ํ•˜๋Š” ๋ฐฉ๋ฒ•
  • ์žฅ์ : ๋น„์„ ํ˜• ๋ฐ์ดํ„ฐ์—์„œ๋„ ์ข‹์€ ์„ฑ๋Šฅ์„ ๋ณด์ด๋ฉฐ, ํŠน์„ฑ ๋ณ€ํ™˜ ์—†์ด๋„ ์ž˜ ๋™์ž‘ํ•˜๊ณ , ์ž„์˜์˜ ํŠน์„ฑ์—์„œ๋„ ์ž˜ ์ž‘๋™ํ•˜๊ณ  ํ•ด์„์ด ์ง๊ด€์ 
  • ๋‹จ์ : ํŠธ๋ฆฌ๊ฐ€ ๋„ˆ๋ฌด ์–•์œผ๋ฉด ๊ณผ์†Œ์ ํ•ฉ์ด ๋ฐœ์ƒํ•˜๊ณ , ๋„ˆ๋ฌด ๊นŠ์œผ๋ฉด ๊ณผ๋Œ€์ ํ•ฉ์ด ๋ฐœ์ƒํ•  ์ˆ˜ ์žˆ๋‹ค. ์ ์ ˆํ•œ ํŠธ๋ฆฌ ๊นŠ์ด๋ฅผ ์„ค์ •ํ•˜๋Š” ๊ฒƒ์ด ์ค‘์š”
  • ํšŒ๊ท€์—์„œ MSE ๊ธฐ์ค€: ๊ฒฐ์ • ํŠธ๋ฆฌ ํšŒ๊ท€๋Š” MSE๋ฅผ ๊ธฐ์ค€์œผ๋กœ ๋ถ„ํ• ์„ ์ง„ํ–‰ํ•˜๋ฉฐ, ์ด๋ฅผ ๋ถ„์‚ฐ ๊ฐ์†Œ๋ผ๊ณ  ํ•œ๋‹ค.

 

๋žœ๋ค ํฌ๋ ˆ์ŠคํŠธ ํšŒ๊ท€ (Random Forest Regression)

  • ๋ชฉํ‘œ: ์—ฌ๋Ÿฌ ๊ฐœ์˜ ๊ฒฐ์ • ํŠธ๋ฆฌ๋ฅผ ์•™์ƒ๋ธ”ํ•˜์—ฌ ๋” ๊ฐ•๋ ฅํ•œ ์˜ˆ์ธก ๋ชจ๋ธ์„ ๋งŒ๋“œ๋Š” ๋ฐฉ๋ฒ•
  • ์žฅ์ 
    • ๋ชจ๋ธ์˜ ๋ถ„์‚ฐ์„ ๋‚ฎ์ถ”์–ด ๊ณผ๋Œ€์ ํ•ฉ์„ ๋ฐฉ์ง€
    • ์ด์ƒ์น˜์— ๋œ ๋ฏผ๊ฐํ•˜๊ณ , ํ•˜์ดํผํŒŒ๋ผ๋ฏธํ„ฐ ํŠœ๋‹์— ๋Œ€ํ•œ ๋ฏผ๊ฐ๋„๊ฐ€ ๋‚ฎ๋‹ค.
    • ํŠธ๋ฆฌ ๊ฐœ์ˆ˜๋ฅผ ์„ค์ •ํ•˜๋Š” ๊ฒƒ ์™ธ์—๋Š” ํŠœ๋‹์ด ์ ๊ณ , ์„ฑ๋Šฅ์ด ๋งค์šฐ ์•ˆ์ •์ 
  • ๋‹จ์ผ ๊ฒฐ์ • ํŠธ๋ฆฌ์™€์˜ ์ฐจ์ด์ : ๋žœ๋ค ํฌ๋ ˆ์ŠคํŠธ์—์„œ๋Š” ๊ฐ ํŠธ๋ฆฌ๊ฐ€ ๋ฌด์ž‘์œ„๋กœ ๋…๋ฆฝ์ ์œผ๋กœ ํ›ˆ๋ จ๋˜๋ฉฐ, ๊ฐœ๋ณ„ ํŠธ๋ฆฌ๋“ค์ด MSE ๊ธฐ์ค€์œผ๋กœ ์„ฑ์žฅ. ๋” ์ข‹์€ ์˜ˆ์ธก ์„ฑ๋Šฅ
  • ๋‹จ์ : ๋ชจ๋ธ ํ•ด์„์ด ์–ด๋ ต๊ณ , ๋ฉ”๋ชจ๋ฆฌ ์‚ฌ์šฉ๋Ÿ‰ ์ฆ๊ฐ€์™€ ํ›ˆ๋ จ ๋ฐ ์˜ˆ์ธก ์†๋„ ๊ฐ์†Œ๋ผ๋Š” ๋‹จ์  ์กด์žฌ

์ •๋ฆฌํ•˜๋ฉด

  • ์„ ํ˜• ํšŒ๊ท€๋Š” ๋ฐ์ดํ„ฐ์˜ ๊ด€๊ณ„๋ฅผ ์ง์„ ์ด๋‚˜ ์ดˆํ‰๋ฉด์œผ๋กœ ๋ชจ๋ธ๋งํ•˜๋Š” ๊ธฐ๋ฒ•์ด๋ฉฐ, ์ด๋ฅผ ํ†ตํ•ด ์—ฐ์†์ ์ธ ํƒ€๊นƒ ๋ณ€์ˆ˜๋ฅผ ์˜ˆ์ธกํ•  ์ˆ˜ ์žˆ๋‹ค.
  • ๋‹ค์ค‘ ์„ ํ˜• ํšŒ๊ท€๋Š” ์—ฌ๋Ÿฌ ํŠน์„ฑ(์„ค๋ช… ๋ณ€์ˆ˜)์„ ํ™œ์šฉํ•˜์—ฌ ๊ณ ์ฐจ์›์—์„œ ๋ฐ์ดํ„ฐ๋ฅผ ๋ชจ๋ธ๋งํ•œ๋‹ค.
  • ์ตœ์†Œ ์ œ๊ณฑ๋ฒ•์€ ๊ฐ€์žฅ ์ ํ•ฉํ•œ ์ง์„ ์„ ์ฐพ๊ธฐ ์œ„ํ•œ ๋ฐฉ๋ฒ•์œผ๋กœ, ์ž”์ฐจ๋ฅผ ์ตœ์†Œํ™”
  • ์ด์ƒ์น˜์— ๋ฏผ๊ฐํ•œ ์„ ํ˜• ํšŒ๊ท€์—์„œ๋Š” RANSAC ์•Œ๊ณ ๋ฆฌ์ฆ˜์„ ์‚ฌ์šฉํ•˜์—ฌ ๋ชจ๋ธ์„ ์•ˆ์ •ํ™”ํ•  ์ˆ˜ ์žˆ๋‹ค.
  • MSE, MAE, ๊ฒฐ์ • ๊ณ„์ˆ˜๋Š” ํšŒ๊ท€ ๋ชจ๋ธ์˜ ์„ฑ๋Šฅ์„ ํ‰๊ฐ€ํ•˜๋Š” ์ค‘์š”ํ•œ ์ง€ํ‘œ
  • ๋‹คํ•ญ ํšŒ๊ท€๋Š” ๋น„์„ ํ˜• ๊ด€๊ณ„๋ฅผ ๋ชจ๋ธ๋งํ•˜์ง€๋งŒ, ์—ฌ์ „ํžˆ ์„ ํ˜• ํšŒ๊ท€์˜ ํ™•์žฅ์œผ๋กœ ์ดํ•ดํ•  ์ˆ˜ ์žˆ๋‹ค.
  • ๊ฒฐ์ • ํŠธ๋ฆฌ ํšŒ๊ท€๋Š” ๋ฐ์ดํ„ฐ๋ฅผ ๋น„์„ ํ˜•์ ์œผ๋กœ ์ž˜ ๋ชจ๋ธ๋งํ•  ์ˆ˜ ์žˆ์ง€๋งŒ, ๊ณผ์ ํ•ฉ์— ์ฃผ์˜ํ•ด์•ผ ํ•œ๋‹ค.
  • ๋žœ๋ค ํฌ๋ ˆ์ŠคํŠธ ํšŒ๊ท€๋Š” ์—ฌ๋Ÿฌ ๊ฐœ์˜ ๊ฒฐ์ • ํŠธ๋ฆฌ๋ฅผ ๊ฒฐํ•ฉํ•˜์—ฌ ์„ฑ๋Šฅ์„ ๋†’์ด๊ณ , ๊ณผ์ ํ•ฉ์„ ์ค„์—ฌ์ฃผ๋ฉฐ ์ด์ƒ์น˜์— ๋ฏผ๊ฐํ•˜์ง€ ์•Š๋‹ค๋Š” ์žฅ์ 

 

ํšŒ๊ท€ ๊ทœ์ œ

๋ชจ๋ธ์˜ ๊ณผ๋Œ€์ ํ•ฉ์„ ๋ฐฉ์ง€ํ•˜๊ณ  ์ผ๋ฐ˜ํ™” ์„ฑ๋Šฅ์„ ๋†’์ด๊ธฐ ์œ„ํ•ด ๋ชจ๋ธ ํŒŒ๋ผ๋ฏธํ„ฐ์— ํŒจ๋„ํ‹ฐ๋ฅผ ๋ถ€์—ฌํ•˜๋Š” ๊ธฐ๋ฒ•

์ด๋ฅผ ํ†ตํ•ด ๋ชจ๋ธ์˜ ๋ณต์žก๋„๋ฅผ ์ œ์–ดํ•˜๊ณ , ๊ณผ์ ํ•ฉ์„ ๋ฐฉ์ง€ํ•  ์ˆ˜ ์žˆ๋‹ค.

  • ๋ฆฟ์ง€ ํšŒ๊ท€, ๋ผ์˜ ํšŒ๊ท€, ์—˜๋ผ์Šคํ‹ฑ ๋„ท

 

1. ๋ฆฟ์ง€ ํšŒ๊ท€  - L2 ๊ทœ์ œ

  • ๊ฐœ์š”: ๋ชจ๋“  ๋ชจ๋ธ ํŒŒ๋ผ๋ฏธํ„ฐ์˜ ์ œ๊ณฑํ•ฉ์— ํŒจ๋„ํ‹ฐ๋ฅผ ์ถ”๊ฐ€
  • ๋ชฉ์ : ๋ชจ๋ธ ํŒŒ๋ผ๋ฏธํ„ฐ ๊ฐ’์ด ๋„ˆ๋ฌด ์ปค์ง€์ง€ ์•Š๋„๋ก ์ œํ•œํ•˜์—ฌ ๊ณผ๋Œ€์ ํ•ฉ์„ ๋ฐฉ์ง€
  • ์ˆ˜์‹: ์†์‹ค ํ•จ์ˆ˜์— λ * (Σw^2) ํ˜•ํƒœ์˜ ํŒจ๋„ํ‹ฐ๊ฐ€ ์ถ”๊ฐ€๋œ๋‹ค.
  • ํ•œ๊ณ„(๊ณผ๋Œ€์ ํ•ฉ)
    • ํŠน์„ฑ ์„ ํƒ์ด ์–ด๋ ค์›€: ๋ฆฟ์ง€ ํšŒ๊ท€๋Š” ๋ชจ๋“  ํŠน์„ฑ์˜ ๊ฐ€์ค‘์น˜๋ฅผ ์ž‘๊ฒŒ ๋งŒ๋“ค์ง€๋งŒ 0์œผ๋กœ ๋งŒ๋“ค์ง€๋Š” ์•Š๋Š”๋‹ค. ์ฆ‰, ๋ชจ๋“  ํŠน์„ฑ์ด ๋ชจ๋ธ์— ํฌํ•จ๋˜๋ฏ€๋กœ ์ค‘์š”ํ•˜์ง€ ์•Š์€ ํŠน์„ฑ๊นŒ์ง€ ํฌํ•จ๋  ์ˆ˜ ์žˆ๋‹ค.
    • ๊ณผ์ ํ•ฉ ๋ฐฉ์ง€์— ์œ ํšจํ•˜์ง€๋งŒ, ๋ถˆํ•„์š”ํ•œ ํŠน์„ฑ์„ ์ œ๊ฑฐํ•˜์ง€ ๋ชปํ•จ: ์ค‘์š”ํ•œ ํŠน์„ฑ๋งŒ์„ ๋‚จ๊ธฐ๊ณ  ๋‚˜๋จธ์ง€๋ฅผ ์ œ์™ธํ•˜๋Š” ๋ผ์˜์˜ ํŠน์„ฑ๊ณผ ๋‹ค๋ฅด๊ฒŒ, ๋ฆฟ์ง€๋Š” ๋ชจ๋“  ํŠน์„ฑ์— ํŒจ๋„ํ‹ฐ๋ฅผ ๋ถ€์—ฌํ•˜๊ณ , ํŠน์„ฑ์„ ์ œ๊ฑฐํ•˜์ง€ ์•Š๊ธฐ ๋•Œ๋ฌธ์— ๋ชจ๋ธ์˜ ๋ณต์žก๋„๋ฅผ ์ค„์ด๊ธฐ ์–ด๋ ต๋‹ค.

 

2. ๋ผ์˜ ํšŒ๊ท€ - L1 ๊ทœ์ œ

  • ๊ฐœ์š”: ๋ชจ๋ธ ํŒŒ๋ผ๋ฏธํ„ฐ์˜ ์ ˆ๋Œ“๊ฐ’ ํ•ฉ์— ํŒจ๋„ํ‹ฐ๋ฅผ ์ถ”๊ฐ€
  • ๋ชฉ์ : ๋ถˆํ•„์š”ํ•œ ํŠน์„ฑ์„์˜ ๋ณ€์ˆ˜ ๊ฐ€์ค‘์น˜๋ฅผ 0์œผ๋กœ ๋งŒ๋“ค ์ˆ˜ ์žˆ์–ด, ํฌ์†Œํ•œ ๋ชจ๋ธ์„ ์ƒ์„ฑ
  • ์ˆ˜์‹: ์†์‹ค ํ•จ์ˆ˜์— λ * Σ|w| ํ˜•ํƒœ์˜ ํŒจ๋„ํ‹ฐ๊ฐ€ ์ถ”๊ฐ€๋œ๋‹ค.
  • ํŠน์ง•: ๋ผ์˜๋Š” ๋ชจ๋ธ์„ ๊ฐ„์†Œํ™”ํ•˜๊ณ  ํŠน์„ฑ ์„ ํƒ์„ ๊ฐ€๋Šฅํ•˜๊ฒŒ ํ•œ๋‹ค. ๊ทธ๋Ÿฌ๋‚˜, ์ƒ๊ด€ ๊ด€๊ณ„๊ฐ€ ํฐ ๋ณ€์ˆ˜๋“ค์ด ์žˆ์„ ๊ฒฝ์šฐ ํ•˜๋‚˜๋งŒ ์„ ํƒ๋  ์ˆ˜ ์žˆ๋‹ค.
  • ํ•œ๊ณ„(๊ณผ์†Œ์ ํ•ฉ)
    • ์ƒ๊ด€๊ด€๊ณ„๊ฐ€ ํฐ ๋ณ€์ˆ˜๋“ค ์ค‘์—์„œ ํ•˜๋‚˜๋งŒ ์„ ํƒ: ๋ผ์˜ ํšŒ๊ท€๋Š” L1 ๊ทœ์ œ๋ฅผ ์‚ฌ์šฉํ•˜์—ฌ ์ผ๋ถ€ ํŠน์„ฑ์˜ ๊ฐ€์ค‘์น˜๋ฅผ 0์œผ๋กœ ๋งŒ๋“ค ์ˆ˜ ์žˆ๋‹ค. ํ•˜์ง€๋งŒ ํŠน์„ฑ๋“ค ๊ฐ„์— ๊ฐ•ํ•œ ์ƒ๊ด€๊ด€๊ณ„๊ฐ€ ์žˆ์„ ๋•Œ, ๋ผ์˜๋Š” ๊ทธ ์ค‘์—์„œ ํ•˜๋‚˜๋งŒ ์„ ํƒํ•˜๋Š” ๊ฒฝํ–ฅ์ด ์žˆ๋‹ค. ์ด๋กœ ์ธํ•ด ๋ชจ๋ธ์ด ๊ณผ์†Œ์ ํ•ฉ๋  ์ˆ˜ ์žˆ๋‹ค.
    • ๋ชจ๋“  ํŠน์„ฑ์„ ์ œ๊ฑฐํ•˜๋ ค๊ณ  ํ•  ์ˆ˜ ์žˆ์Œ: ๋„ˆ๋ฌด ๊ฐ•ํ•œ ๊ทœ์ œ๋ฅผ ์‚ฌ์šฉํ•˜๋ฉด, ๊ณผ๋„ํ•œ ํŠน์„ฑ ์ œ๊ฑฐ๋กœ ์ธํ•ด ์ค‘์š”ํ•œ ์ •๋ณด๋„ ์†์‹ค๋  ์ˆ˜ ์žˆ๋‹ค. ํŠนํžˆ, ์ค‘์š”ํ•œ ๋ณ€์ˆ˜๋“ค์ด 0์ด ๋˜์–ด ๋ชจ๋ธ์˜ ์„ฑ๋Šฅ์ด ๋–จ์–ด์งˆ ์ˆ˜ ์žˆ๋‹ค.

 

3. ์—˜๋ผ์Šคํ‹ฑ ๋„ท 

  • ๊ฐœ์š”: ์—˜๋ผ์Šคํ‹ฑ ๋„ท์€ L1๊ณผ L2 ๊ทœ์ œ๋ฅผ ๊ฒฐํ•ฉํ•œ ๋ชจ๋ธ
  • ๋ชฉ์ : ๋ผ์˜์™€ ๋ฆฟ์ง€์˜ ์žฅ์ ์„ ๊ฒฐํ•ฉํ•˜์—ฌ, ๋ผ์˜์˜ ํฌ์†Œ์„ฑ๊ณผ ๋ฆฟ์ง€์˜ ๋ชจ๋ธ ๋ณต์žก๋„ ๊ฐ์†Œํ†ตํ•œ ์ผ๋ฐ˜ํ™” ์„ฑ๋Šฅ์„ ๋™์‹œ์— ์ฒ˜๋ฆฌ
  • ์ˆ˜์‹: ์†์‹ค ํ•จ์ˆ˜์— λ1 * Σ|w| + λ2 * Σw^2 ํ˜•ํƒœ์˜ ํŒจ๋„ํ‹ฐ๊ฐ€ ์ถ”๊ฐ€๋œ๋‹ค.
  • ํŠน์„ฑ ์„ ํƒ: L1 ๊ทœ์ œ(๋ผ์˜) ๋•๋ถ„์— ๋ถˆํ•„์š”ํ•œ ํŠน์„ฑ์„ 0์œผ๋กœ ๋งŒ๋“ค ์ˆ˜ ์žˆ๊ณ , L2 ๊ทœ์ œ(๋ฆฟ์ง€) ๋•๋ถ„์— ๋ชจ๋“  ํŠน์„ฑ์— ์ผ์ •ํ•œ ์˜ํ–ฅ์„ ์ฃผ์–ด ๊ณผ์ ํ•ฉ์„ ๋ฐฉ์ง€ํ•œ๋‹ค.