๊ฐ๋
MinIO๋? MinIO๋ AWS S3์ ํธํ๋๋ ์ค๋ธ์ ํธ ์คํ ๋ฆฌ์ง ์์คํ
์ผ๋ก, ๋ฐ์ดํฐ๋ฅผ ์ ์ฅํ๊ณ ๊ด๋ฆฌํ๋ ์ญํ ์ค์ต ์์ฒญ์ฌํญ data๋ minio์ raw-data ๋ฒํท์์ ๊ฐ์ ธ์์ airflow๋ก ๋งค ์๊ฐ ์ ๊ฐ์ ์คํ๋๋, ๋ก๊ทธ๋ mlflow์ ๋จ๋ pipeline dag๋ฅผ ์์ฑdag์ด๋ฆ์ 00_airflow_mlops.py๋ก ํฉ๋๋ค.experiment ์ด๋ฆ์ fisa-ml ์ฌ๊ณ ๊ณผ์ MinIO์์ ๋ฐ์ดํฐ๋ฅผ ๊ฐ์ ธ์์, ๋ฐ์ดํฐ๋ฅผ ์ฒ๋ฆฌํ ํ, MLflow์ ๋ก๊น
ํ๋ ๋ฐ์ดํฐ ํ์ดํ๋ผ์ธ์ ๊ตฌ์ถํ๋ DAG๋ฅผ ๋ง๋ค๋ฉด ๋๋ค. MinIO์์ raw-data ๋ฒํท์ ์๋ data.csv ํ์ผ์ ๊ฐ์ ธ์ด๊ฐ์ ธ์จ ๋ฐ์ดํฐ๋ฅผ ์ฒ๋ฆฌํ์ฌ ํต๊ณ๊ฐ(ํ๊ท )์ ๊ณ์ฐMLflow์ ๋ก๊ทธ๋ฅผ ๊ธฐ๋กํ์ฌ ์คํ ๊ด๋ฆฌ๋งค ์๊ฐ ์ ๊ฐ(0๋ถ)๋ง๋ค ์คํ..
๋น์ง๋ ํ์ต์ด๋? ํ๊น ๊ฐ์ ์ ์ ์๊ฑฐ๋ ์์ธกํ ์ ์๋ ๋ฐ์ดํฐ๋ฅผ ํ์ตํ๋ ๋ฐฉ๋ฒ์ง๋ ํ์ต๊ณผ ๋ฌ๋ฆฌ ์ ๋ต(๋ผ๋ฒจ)์ด ์์ผ๋ฉฐ, ๋ฐ์ดํฐ์ ํจํด์ ๋ฐ๊ฒฌํ๊ณ ๊ทธ๋ฃนํํ๋ ๋ฐ ์ด์ ์ ๋ง์ถคex) ๊ตฐ์ง, ์ฐจ์์ถ์ 1. ๊ตฐ์ง ์๊ณ ๋ฆฌ์ฆ (Clustering) ๋น์ทํ ์ํ๋ผ๋ฆฌ ๊ทธ๋ฃน์ผ๋ก ๋ฌถ๋ ๊ณผ์ , ์ด๋ฅผ ์ํํ๋ ์๊ณ ๋ฆฌ์ฆํด๋ฌ์คํฐ: ๊ตฐ์ง์์ ๋ง๋ค์ด์ง ๊ฐ ๊ทธ๋ฃน K-Means ๊ตฐ์ง ์๊ณ ๋ฆฌ์ฆ K-Means๋ ๊ฐ์ฅ ๋๋ฆฌ ์ฌ์ฉ๋๋ ๊ตฐ์ง ์๊ณ ๋ฆฌ์ฆ์ผ๋ก, K๊ฐ์ ํด๋ฌ์คํฐ ์ค์ฌ(์ผํธ๋ก์ด๋, Centroid)์ ์๋์ผ๋ก ์ฐพ๋ ๋ฐฉ์K-Means ์๊ณ ๋ฆฌ์ฆ ์๋ ๋ฐฉ์์์๋ก K๊ฐ์ ํด๋ฌ์คํฐ ์ค์ฌ์ ์ง์ ๊ฐ ์ํ์ ๊ฐ์ฅ ๊ฐ๊น์ด ํด๋ฌ์คํฐ ์ค์ฌ์ ํ ๋นํด๋ฌ์คํฐ์ ์ํ ์ํ๋ค์ ํ๊ท ๊ฐ์ ๊ณ์ฐํ์ฌ ์๋ก์ด ํด๋ฌ์คํฐ ์ค์ฌ์ ๊ฐฑ์ ํด๋ฌ์คํฐ ์ค์ฌ์ด ๋ ์ด์ ๋ณํํ์ง ์์ ๋๊น..
1. ๊ฒฐ์ ํธ๋ฆฌ ๋ฐ์ดํฐ๋ฅผ ํธ๋ฆฌ ๊ตฌ์กฐ๋ก ๋ถ๋ฅํ๋ ์ง๋ ํ์ต ์๊ณ ๋ฆฌ์ฆ๊ฐ ๋
ธ๋์์ ํน์ ๊ธฐ์ค์ ๋ฐํ์ผ๋ก ๋ฐ์ดํฐ๋ฅผ ๋ถํ ํ๊ณ , ์ต์ข
์ ์ผ๋ก ๊ฐ ๋ฆฌํ ๋
ธ๋์์ ์์ธก ๊ฐ์ ๊ฒฐ์ ํน์งํด์์ด ์ฌ์ฐ๋ฉฐ ์๊ฐ์ ์ผ๋ก ํํ ๊ฐ๋ฅ๊ณผ๋์ ํฉ(overfitting)๋ ๊ฐ๋ฅ์ฑ์ด ์์๋ถํ ๊ธฐ์ค์ ๋ฐ๋ผ ์ฑ๋ฅ์ด ๋ฌ๋ผ์ง ์ ์์ ์ฌ์ดํท๋ฐ์ ํ์ฉํ ๊ฒฐ์ ํธ๋ฆฌ ๊ตฌํfrom sklearn.tree import DecisionTreeClassifier# ๋ชจ๋ธ ์์ฑ ๋ฐ ํ์ตdt = DecisionTreeClassifier(max_depth=3, random_state=42)dt.fit(X_train, y_train)# ์์ธกy_pred = dt.predict(X_test) ๊ต์ฐจ ๊ฒ์ฆ๊ณผ ๊ฒ์ฆ ์ธํธ ๊ต์ฐจ ๊ฒ์ฆ ๋ชจ๋ธ์ ํ๊ฐํ ๋ ๋ฐ์ดํฐ๋ฅผ ์ฌ๋ฌ ๋ฒ ํ์ต ๋ฐ ๊ฒ์ฆํ..
1. ๋ก์ง์คํฑ ํ๊ท ๋ก์ง์คํฑ ํ๊ท๋ ์ด๋ฆ์์ "ํ๊ท"๋ผ๋ ๋จ์ด๊ฐ ํฌํจ๋์ด ์์ง๋ง, ์ค์ ๋ก๋ ๋ถ๋ฅ ๋ฌธ์ ๋ฅผ ํด๊ฒฐํ๋ ์๊ณ ๋ฆฌ์ฆ์ด๋ค.์ฃผ๋ก ์ด์ง ๋ถ๋ฅ์์ ์ฌ์ฉ๋๋ฉฐ, ์์ธก ๊ฐ์ 0๊ณผ 1 ์ฌ์ด์ ํ๋ฅ ๋ก ๋ณํํ์ฌ ๊ฒฐ๊ณผ๋ฅผ ์ ๊ณต์ ํ ๋ฐฉ์ ์์ ๊ธฐ๋ฐ์ผ๋ก ํ๋ฉฐ, ์ด ๊ฐ์ ์๊ทธ๋ชจ์ด๋ ํจ์๋ฅผ ํตํด 0๊ณผ 1 ์ฌ์ด์ ํ๋ฅ ๊ฐ์ผ๋ก ๋ณํ-> ๋ถ๋ฅ ๋ฌธ์ ์์ ๊ฐ ํด๋์ค์ ์ํ ํ๋ฅ ์ ๊ณ์ฐ ์๋ ์๋ฆฌ ์
๋ ฅ ๋ฐ์ดํฐ๋ฅผ ๋ฐํ์ผ๋ก ์ ํ ๋ฐฉ์ ์์ ํตํด ์์ธก๊ฐ์ ๊ณ์ฐ๊ทธ๋ฌ๋ ์ด ์์ธก๊ฐ์ ํ๋ฅ ์ด ์๋๋ฏ๋ก, ์ด๋ฅผ ์๊ทธ๋ชจ์ด๋ ํจ์์ ํต๊ณผ์์ผ 0๊ณผ 1 ์ฌ์ด์ ํ๋ฅ ๋ก ๋ณํํ๋ค.์ด์ง ๋ถ๋ฅ์์ ํ๋ฅ ๊ฐ์ด 0.5๋ณด๋ค ํฌ๋ฉด ์์ฑ ํด๋์ค, ์์ผ๋ฉด ์์ฑ ํด๋์ค๋ก ์์ธกfrom sklearn.linear_model import LogisticRegression# ๋ชจ๋ธ ์์ฑlr ..
ํ๊ทKNN ํ๊ท๋ ๊ฐ์ฅ ๊ฐ๊น์ด k๊ฐ์ ์ด์์ ์ฐพ์ ์์ธก๊ฐ์ ๊ณ์ฐํ๋ ๋ฐฉ๋ฒ์ด๋ค.ํ์ง๋ง ๋ฉ๋ฆฌ ์๋ ์ด์๋ค์ด ์์ธก์ ์ํฅ์ ๋ฏธ์น๋ฉด ์ ํ๋๊ฐ ๋จ์ด์ง ์ ์๋ค. ์ด๋ฐ ๋ฌธ์ ๋ฅผ ํด๊ฒฐํ๋ ค๋ฉด ํ๊ท ๋ชจ๋ธ์ ์ฌ์ฉํ๋ค.๋ชจ๋ธ ํ๋ผ๋ฏธํฐ๋ ๋ชจ๋ธ์ด ํ์ต์ ํตํด ์๋์ผ๋ก ์กฐ์ ๋๋ ๊ฐํ์ดํผํ๋ผ๋ฏธํฐ๋ ๋ชจ๋ธ ํ์ต ์ ์ ์ฌ์ฉ์๊ฐ ์ค์ ํ๋ ๊ฐํ๊ทํ๊ท๋ ์ฐ์์ ์ธ ํ๊น ๋ณ์์ ์ค๋ช
๋ณ์(ํน์ฑ) ์ฌ์ด์ ๊ด๊ณ๋ฅผ ๋ชจ๋ธ๋งํ๋ ๊ธฐ๋ฒ. ์ฃผ๋ก ์์ธก ๋ฌธ์ ์์ ์ฌ์ฉ๋๋ฉฐ, ์ ํ ํ๊ท๋ ๊ฐ์ฅ ๊ธฐ๋ณธ์ ์ธ ํํ๋ก, ๋ ๋ณ์ ๊ฐ์ ๊ด๊ณ๋ฅผ ์ง์ (๋๋ ๊ณ ์ฐจ์์์๋ ์ดํ๋ฉด)์ผ๋ก ๋ํ๋ธ๋ค. K-์ต๊ทผ์ ์ด์ ํ๊ท ํ๊ท ๋ฌธ์ ์ KNN ์๊ณ ๋ฆฌ์ฆ์ ์ ์ฉํ ๊ฒํ๊ท๋ ์ฐ์์ ์ธ ๊ฐ์ ์์ธกํ๋ ๋ฌธ์ ๋ก, ๋ถ๋ฅ ๋ฌธ์ ์ ๋ฌ๋ฆฌ ์์ธกํ๋ ค๋ ๊ฐ์ด ์ฌ๋ฌ ํด๋์ค ์ค ํ๋๊ฐ ์๋๋ผ ์ค์ ๊ฐex) ๊ฒฝ์ ์ฑ์ฅ๋ฅ ..
๋จธ์ ๋ฌ๋ํน์ฑ(Feature): ๋ฐ์ดํฐ๋ฅผ ์ค๋ช
ํ๋ ๋ค์ํ ์์๋ค์ ํน์ฑ์ด๋ผ๊ณ ํ๋ค.์๋ฅผ ๋ค์ด, ์ง ๊ฐ๊ฒฉ ์์ธก์์๋ ๋ฉด์ , ๋ฐฉ ๊ฐ์, ์์น ๋ฑ์ด ํน์ฑ์ด ๋ ์ ์๋ค. ๋ถ๋ฅ ๋ฌธ์ ์ ์ด์ง ๋ถ๋ฅ๋จธ์ ๋ฌ๋ ๋ฌธ์ ์ค ํ๋๋ ๋ถ๋ฅ(Classification) ๋ฌธ์ ์ฌ๋ฌ ๊ฐ์ ํด๋์ค ์ค์์ ํ๋๋ฅผ ์ ํํ๋ ๋ฌธ์ ์๋ฅผ ๋ค์ด, ์ด๋ฉ์ผ์ด ์คํธ์ธ์ง ์คํธ ์๋์ธ์ง ๊ตฌ๋ถํ๋ ๋ฌธ์ ๋ ์ด์ง ๋ถ๋ฅ(Binary Classification)์ ํด๋น์ด์ง ๋ถ๋ฅ: ๋ ๊ฐ์ ํด๋์ค ์ค ํ๋๋ฅผ ๊ณ ๋ฅด๋ ๋ฌธ์ (์: ์ด๋ฉ์ผ์ด ์คํธ์ธ์ง ์๋์ง)๋ค์ค ํด๋์ค ๋ถ๋ฅ: ์ฌ๋ฌ ๊ฐ์ ํด๋์ค ์ค ํ๋๋ฅผ ๊ณ ๋ฅด๋ ๋ฌธ์ (์: ๋๋ฌผ ์ข
๋ฅ๋ฅผ ๊ณ ๋ฅด๋ ๋ฌธ์ ) ํ๋ จ(Training)๊ณผ ์์ธก(Prediction)ํ๋ จ(Training): ๋จธ์ ๋ฌ๋ ๋ชจ๋ธ์ ๋ฐ์ดํฐ๋ฅผ ์ ๊ณตํ์ฌ ๋ชจ๋ธ์ด ๋ฐ์ดํฐ๋ฅผ..
์ธ๊ณต์ง๋ฅ์ด๋?์ฌ๋์ฒ๋ผ ํ์ตํ๊ณ ์ถ๋ก ํ ์ ์๋ ์ง๋ฅ์ ๊ฐ์ง ์ปดํจํฐ ์์คํ
์ ๋ง๋๋ ๊ธฐ์ ๊ธฐ๋ณธ์ ์ผ๋ก ์ธ๊ฐ์ ์ง๋ฅ์ ๋ชจ๋ฐฉํ๋ ค๋ ์๋์์ ์์๋จ์ฐ๋ฆฌ๊ฐ ํ๋ ๋ค์ํ ์์
๋ค์ ์ปดํจํฐ๊ฐ ํ ์ ์๋๋ก ํ์ฌ, ์ผ์ ์ํ์ ํจ์จ์ฑ์ ๋์ด๊ณ ์๋ค. ๊ฐ์ธ๊ณต์ง๋ฅ vs ์ฝ์ธ๊ณต์ง๋ฅ๊ฐ์ธ๊ณต์ง๋ฅ(AGI, Artificial General Intelligence)์ธ๊ฐ๊ณผ ์ ์ฌํ ์์ค์ ์ง๋ฅ์ ๊ฐ์ง ์ปดํจํฐ ์์คํ
๋ค์ํ ๋ฌธ์ ๋ฅผ ์ค์ค๋ก ํด๊ฒฐํ ์ ์์ผ๋ฉฐ, ์ค์ค๋ก ํ์ตํ๊ณ ์ถ๋ก ํ ์ ์๋ ๋ฅ๋ ฅ์ ๊ฐ์ง๋ค.ํ์ฌ๋ ์ฐ๊ตฌ ๋จ๊ณ์ ์์ผ๋ฉฐ, ์คํ๋์ง๋ ์์๋ค.์ฝ์ธ๊ณต์ง๋ฅ(ANI, Artificial Narrow Intelligence)ํน์ ๋ฌธ์ ๋ฅผ ํด๊ฒฐํ๋ ๋ฐ ํนํ๋ AI. ํ์ฌ ์ฐ๋ฆฌ๊ฐ ์ฌ์ฉํ๋ ๋๋ถ๋ถ์ AI ์์คํ
์ ์ด ๋ฒ์ฃผ์ ์ํ๋ค.์๋ฅผ ๋ค์ด, ์์ฑ ์ธ์..
'๐ฆญ AI&Big Data/ML' ์นดํ
๊ณ ๋ฆฌ์ ๊ธ ๋ชฉ๋ก
๋จ์ถํค
๋ด ๋ธ๋ก๊ทธ
๋ด ๋ธ๋ก๊ทธ - ๊ด๋ฆฌ์ ํ ์ ํ |
Q
Q
|
์ ๊ธ ์ฐ๊ธฐ |
W
W
|
๋ธ๋ก๊ทธ ๊ฒ์๊ธ
๊ธ ์์ (๊ถํ ์๋ ๊ฒฝ์ฐ) |
E
E
|
๋๊ธ ์์ญ์ผ๋ก ์ด๋ |
C
C
|
๋ชจ๋ ์์ญ
์ด ํ์ด์ง์ URL ๋ณต์ฌ |
S
S
|
๋งจ ์๋ก ์ด๋ |
T
T
|
ํฐ์คํ ๋ฆฌ ํ ์ด๋ |
H
H
|
๋จ์ถํค ์๋ด |
Shift + /
โง + /
|
* ๋จ์ถํค๋ ํ๊ธ/์๋ฌธ ๋์๋ฌธ์๋ก ์ด์ฉ ๊ฐ๋ฅํ๋ฉฐ, ํฐ์คํ ๋ฆฌ ๊ธฐ๋ณธ ๋๋ฉ์ธ์์๋ง ๋์ํฉ๋๋ค.