๐Ÿฆญ AI&Big Data

๋”ฅ๋Ÿฌ๋‹๊ณผ ์‹ ๊ฒฝ๋ง ๋จธ์‹ ๋Ÿฌ๋‹์˜ ํ•œ ๋ถ„์•ผ๋กœ, ์ธ๊ณต ์‹ ๊ฒฝ๋ง(ANN)์„ ๊ธฐ๋ฐ˜์œผ๋กœ ๋Œ€๋Ÿ‰์˜ ๋ฐ์ดํ„ฐ๋ฅผ ํ•™์Šตํ•˜์—ฌ ๋›ฐ์–ด๋‚œ ์„ฑ๋Šฅ์„ ๋ฐœํœ˜ํ•˜๋Š” ์•Œ๊ณ ๋ฆฌ์ฆ˜๋”ฅ๋Ÿฌ๋‹์€ ์—ฌ๋Ÿฌ ์ธต์„ ํ†ตํ•ด ์ ์  ๋” ์ถ”์ƒํ™”๋œ ํŠน์ง•์„ ํ•™์Šตํ•˜๋ฉฐ, ๋ณต์žกํ•œ ํŒจํ„ด์„ ์ธ์‹ํ•˜๊ณ  ๋ฌธ์ œ๋ฅผ ํ•ด๊ฒฐํ•˜๋Š” ๋ฐ ๋›ฐ์–ด๋‚œ ์„ฑ๋Šฅ์„ ๋ณด์ธ๋‹ค.ํŠนํžˆ ๋”ฅ๋Ÿฌ๋‹์€ ๋Œ€๊ทœ๋ชจ ๋ฐ์ดํ„ฐ์™€ ๊ฐ•๋ ฅํ•œ ๊ณ„์‚ฐ ๋Šฅ๋ ฅ์„ ํ™œ์šฉํ•˜์—ฌ ๋ชจ๋ธ์ด ์ ์  ๋” ๊ฐ•๋ ฅํ•œ ์˜ˆ์ธก ๋Šฅ๋ ฅ์„ ๋ฐœํœ˜ํ•˜๋„๋ก ํ•œ๋‹ค. ๋”ฅ๋Ÿฌ๋‹ vs ์ „ํ†ต์ ์ธ ๋จธ์‹ ๋Ÿฌ๋‹ ์ „ํ†ต์ ์ธ ๋จธ์‹ ๋Ÿฌ๋‹์—์„œ๋Š” ํŠน์ง• ์ถ”์ถœ(Feature Engineering)์„ ์‚ฌ๋žŒ์ด ์ง์ ‘ ํ•ด์•ผ ํ•œ๋‹ค.๋”ฅ๋Ÿฌ๋‹์€ ์ž๋™ ํŠน์ง• ํ•™์Šต(Representation Learning)์„ ํ†ตํ•ด ๋ฐ์ดํ„ฐ๋ฅผ ์ž๋™์œผ๋กœ ๋ถ„์„ํ•˜๊ณ  ์ค‘์š”ํ•œ ํŠน์ง•์„ ํ•™์Šตํ•œ๋‹ค. ์ „ํ†ต์ ์ธ ๋จธ์‹ ๋Ÿฌ๋‹ ๋ชจ๋ธ์€ ์ฃผ๋กœ ๋‹จ์ผ ์ธต์—์„œ ์ฃผ์–ด์ง„ ํŠน์ง•์„ ๋ฐ”ํƒ•์œผ๋กœ ์˜ˆ์ธก์„ ์ˆ˜ํ–‰๋”ฅ๋Ÿฌ๋‹ ๋ชจ๋ธ์€ ..
1.  ๋กœ์ง€์Šคํ‹ฑ ํšŒ๊ท€ ๋กœ์ง€์Šคํ‹ฑ ํšŒ๊ท€๋Š” ์ด๋ฆ„์—์„œ "ํšŒ๊ท€"๋ผ๋Š” ๋‹จ์–ด๊ฐ€ ํฌํ•จ๋˜์–ด ์žˆ์ง€๋งŒ, ์‹ค์ œ๋กœ๋Š” ๋ถ„๋ฅ˜ ๋ฌธ์ œ๋ฅผ ํ•ด๊ฒฐํ•˜๋Š” ์•Œ๊ณ ๋ฆฌ์ฆ˜์ด๋‹ค.์ฃผ๋กœ ์ด์ง„ ๋ถ„๋ฅ˜์—์„œ ์‚ฌ์šฉ๋˜๋ฉฐ, ์˜ˆ์ธก ๊ฐ’์„ 0๊ณผ 1 ์‚ฌ์ด์˜ ํ™•๋ฅ ๋กœ ๋ณ€ํ™˜ํ•˜์—ฌ ๊ฒฐ๊ณผ๋ฅผ ์ œ๊ณต์„ ํ˜• ๋ฐฉ์ •์‹์„ ๊ธฐ๋ฐ˜์œผ๋กœ ํ•˜๋ฉฐ, ์ด ๊ฐ’์„ ์‹œ๊ทธ๋ชจ์ด๋“œ ํ•จ์ˆ˜๋ฅผ ํ†ตํ•ด 0๊ณผ 1 ์‚ฌ์ด์˜ ํ™•๋ฅ  ๊ฐ’์œผ๋กœ ๋ณ€ํ™˜-> ๋ถ„๋ฅ˜ ๋ฌธ์ œ์—์„œ ๊ฐ ํด๋ž˜์Šค์— ์†ํ•  ํ™•๋ฅ ์„ ๊ณ„์‚ฐ ์ž‘๋™ ์›๋ฆฌ ์ž…๋ ฅ ๋ฐ์ดํ„ฐ๋ฅผ ๋ฐ”ํƒ•์œผ๋กœ ์„ ํ˜• ๋ฐฉ์ •์‹์„ ํ†ตํ•ด ์˜ˆ์ธก๊ฐ’์„ ๊ณ„์‚ฐ๊ทธ๋Ÿฌ๋‚˜ ์ด ์˜ˆ์ธก๊ฐ’์€ ํ™•๋ฅ ์ด ์•„๋‹ˆ๋ฏ€๋กœ, ์ด๋ฅผ ์‹œ๊ทธ๋ชจ์ด๋“œ ํ•จ์ˆ˜์— ํ†ต๊ณผ์‹œ์ผœ 0๊ณผ 1 ์‚ฌ์ด์˜ ํ™•๋ฅ ๋กœ ๋ณ€ํ™˜ํ•œ๋‹ค.์ด์ง„ ๋ถ„๋ฅ˜์—์„œ ํ™•๋ฅ ๊ฐ’์ด 0.5๋ณด๋‹ค ํฌ๋ฉด ์–‘์„ฑ ํด๋ž˜์Šค, ์ž‘์œผ๋ฉด ์Œ์„ฑ ํด๋ž˜์Šค๋กœ ์˜ˆ์ธกfrom sklearn.linear_model import LogisticRegression# ๋ชจ๋ธ ์ƒ์„ฑlr ..
ํšŒ๊ท€KNN ํšŒ๊ท€๋Š” ๊ฐ€์žฅ ๊ฐ€๊นŒ์šด k๊ฐœ์˜ ์ด์›ƒ์„ ์ฐพ์•„ ์˜ˆ์ธก๊ฐ’์„ ๊ณ„์‚ฐํ•˜๋Š” ๋ฐฉ๋ฒ•์ด๋‹ค.ํ•˜์ง€๋งŒ ๋ฉ€๋ฆฌ ์žˆ๋Š” ์ด์›ƒ๋“ค์ด ์˜ˆ์ธก์— ์˜ํ–ฅ์„ ๋ฏธ์น˜๋ฉด ์ •ํ™•๋„๊ฐ€ ๋–จ์–ด์งˆ ์ˆ˜ ์žˆ๋‹ค. ์ด๋Ÿฐ ๋ฌธ์ œ๋ฅผ ํ•ด๊ฒฐํ•˜๋ ค๋ฉด ํšŒ๊ท€ ๋ชจ๋ธ์„ ์‚ฌ์šฉํ•œ๋‹ค.๋ชจ๋ธ ํŒŒ๋ผ๋ฏธํ„ฐ๋Š” ๋ชจ๋ธ์ด ํ•™์Šต์„ ํ†ตํ•ด ์ž๋™์œผ๋กœ ์กฐ์ •๋˜๋Š” ๊ฐ’ํ•˜์ดํผํŒŒ๋ผ๋ฏธํ„ฐ๋Š” ๋ชจ๋ธ ํ•™์Šต ์ „์— ์‚ฌ์šฉ์ž๊ฐ€ ์„ค์ •ํ•˜๋Š” ๊ฐ’ํšŒ๊ท€ํšŒ๊ท€๋Š” ์—ฐ์†์ ์ธ ํƒ€๊นƒ ๋ณ€์ˆ˜์™€ ์„ค๋ช… ๋ณ€์ˆ˜(ํŠน์„ฑ) ์‚ฌ์ด์˜ ๊ด€๊ณ„๋ฅผ ๋ชจ๋ธ๋งํ•˜๋Š” ๊ธฐ๋ฒ•. ์ฃผ๋กœ ์˜ˆ์ธก ๋ฌธ์ œ์—์„œ ์‚ฌ์šฉ๋˜๋ฉฐ, ์„ ํ˜• ํšŒ๊ท€๋Š” ๊ฐ€์žฅ ๊ธฐ๋ณธ์ ์ธ ํ˜•ํƒœ๋กœ, ๋‘ ๋ณ€์ˆ˜ ๊ฐ„์˜ ๊ด€๊ณ„๋ฅผ ์ง์„ (๋˜๋Š” ๊ณ ์ฐจ์›์—์„œ๋Š” ์ดˆํ‰๋ฉด)์œผ๋กœ ๋‚˜ํƒ€๋‚ธ๋‹ค. K-์ตœ๊ทผ์ ‘ ์ด์›ƒ ํšŒ๊ท€ ํšŒ๊ท€ ๋ฌธ์ œ์— KNN ์•Œ๊ณ ๋ฆฌ์ฆ˜์„ ์ ์šฉํ•œ ๊ฒƒํšŒ๊ท€๋Š” ์—ฐ์†์ ์ธ ๊ฐ’์„ ์˜ˆ์ธกํ•˜๋Š” ๋ฌธ์ œ๋กœ, ๋ถ„๋ฅ˜ ๋ฌธ์ œ์™€ ๋‹ฌ๋ฆฌ ์˜ˆ์ธกํ•˜๋ ค๋Š” ๊ฐ’์ด ์—ฌ๋Ÿฌ ํด๋ž˜์Šค ์ค‘ ํ•˜๋‚˜๊ฐ€ ์•„๋‹ˆ๋ผ ์‹ค์ˆ˜ ๊ฐ’ex) ๊ฒฝ์ œ ์„ฑ์žฅ๋ฅ  ..
๋จธ์‹ ๋Ÿฌ๋‹ํŠน์„ฑ(Feature): ๋ฐ์ดํ„ฐ๋ฅผ ์„ค๋ช…ํ•˜๋Š” ๋‹ค์–‘ํ•œ ์š”์†Œ๋“ค์„ ํŠน์„ฑ์ด๋ผ๊ณ  ํ•œ๋‹ค.์˜ˆ๋ฅผ ๋“ค์–ด, ์ง‘ ๊ฐ€๊ฒฉ ์˜ˆ์ธก์—์„œ๋Š” ๋ฉด์ , ๋ฐฉ ๊ฐœ์ˆ˜, ์œ„์น˜ ๋“ฑ์ด ํŠน์„ฑ์ด ๋  ์ˆ˜ ์žˆ๋‹ค. ๋ถ„๋ฅ˜ ๋ฌธ์ œ์™€ ์ด์ง„ ๋ถ„๋ฅ˜๋จธ์‹ ๋Ÿฌ๋‹ ๋ฌธ์ œ ์ค‘ ํ•˜๋‚˜๋Š” ๋ถ„๋ฅ˜(Classification) ๋ฌธ์ œ์—ฌ๋Ÿฌ ๊ฐœ์˜ ํด๋ž˜์Šค ์ค‘์—์„œ ํ•˜๋‚˜๋ฅผ ์„ ํƒํ•˜๋Š” ๋ฌธ์ œ์˜ˆ๋ฅผ ๋“ค์–ด, ์ด๋ฉ”์ผ์ด ์ŠคํŒธ์ธ์ง€ ์ŠคํŒธ ์•„๋‹˜์ธ์ง€ ๊ตฌ๋ถ„ํ•˜๋Š” ๋ฌธ์ œ๋Š” ์ด์ง„ ๋ถ„๋ฅ˜(Binary Classification)์— ํ•ด๋‹น์ด์ง„ ๋ถ„๋ฅ˜: ๋‘ ๊ฐœ์˜ ํด๋ž˜์Šค ์ค‘ ํ•˜๋‚˜๋ฅผ ๊ณ ๋ฅด๋Š” ๋ฌธ์ œ (์˜ˆ: ์ด๋ฉ”์ผ์ด ์ŠคํŒธ์ธ์ง€ ์•„๋‹Œ์ง€)๋‹ค์ค‘ ํด๋ž˜์Šค ๋ถ„๋ฅ˜: ์—ฌ๋Ÿฌ ๊ฐœ์˜ ํด๋ž˜์Šค ์ค‘ ํ•˜๋‚˜๋ฅผ ๊ณ ๋ฅด๋Š” ๋ฌธ์ œ (์˜ˆ: ๋™๋ฌผ ์ข…๋ฅ˜๋ฅผ ๊ณ ๋ฅด๋Š” ๋ฌธ์ œ) ํ›ˆ๋ จ(Training)๊ณผ ์˜ˆ์ธก(Prediction)ํ›ˆ๋ จ(Training): ๋จธ์‹ ๋Ÿฌ๋‹ ๋ชจ๋ธ์— ๋ฐ์ดํ„ฐ๋ฅผ ์ œ๊ณตํ•˜์—ฌ ๋ชจ๋ธ์ด ๋ฐ์ดํ„ฐ๋ฅผ..
์ธ๊ณต์ง€๋Šฅ์ด๋ž€?์‚ฌ๋žŒ์ฒ˜๋Ÿผ ํ•™์Šตํ•˜๊ณ  ์ถ”๋ก ํ•  ์ˆ˜ ์žˆ๋Š” ์ง€๋Šฅ์„ ๊ฐ€์ง„ ์ปดํ“จํ„ฐ ์‹œ์Šคํ…œ์„ ๋งŒ๋“œ๋Š” ๊ธฐ์ˆ ๊ธฐ๋ณธ์ ์œผ๋กœ ์ธ๊ฐ„์˜ ์ง€๋Šฅ์„ ๋ชจ๋ฐฉํ•˜๋ ค๋Š” ์‹œ๋„์—์„œ ์‹œ์ž‘๋จ์šฐ๋ฆฌ๊ฐ€ ํ•˜๋Š” ๋‹ค์–‘ํ•œ ์ž‘์—…๋“ค์„ ์ปดํ“จํ„ฐ๊ฐ€ ํ•  ์ˆ˜ ์žˆ๋„๋ก ํ•˜์—ฌ, ์ผ์ƒ ์ƒํ™œ์˜ ํšจ์œจ์„ฑ์„ ๋†’์ด๊ณ  ์žˆ๋‹ค. ๊ฐ•์ธ๊ณต์ง€๋Šฅ vs ์•ฝ์ธ๊ณต์ง€๋Šฅ๊ฐ•์ธ๊ณต์ง€๋Šฅ(AGI, Artificial General Intelligence)์ธ๊ฐ„๊ณผ ์œ ์‚ฌํ•œ ์ˆ˜์ค€์˜ ์ง€๋Šฅ์„ ๊ฐ€์ง„ ์ปดํ“จํ„ฐ ์‹œ์Šคํ…œ๋‹ค์–‘ํ•œ ๋ฌธ์ œ๋ฅผ ์Šค์Šค๋กœ ํ•ด๊ฒฐํ•  ์ˆ˜ ์žˆ์œผ๋ฉฐ, ์Šค์Šค๋กœ ํ•™์Šตํ•˜๊ณ  ์ถ”๋ก ํ•  ์ˆ˜ ์žˆ๋Š” ๋Šฅ๋ ฅ์„ ๊ฐ€์ง„๋‹ค.ํ˜„์žฌ๋Š” ์—ฐ๊ตฌ ๋‹จ๊ณ„์— ์žˆ์œผ๋ฉฐ, ์‹คํ˜„๋˜์ง€๋Š” ์•Š์•˜๋‹ค.์•ฝ์ธ๊ณต์ง€๋Šฅ(ANI, Artificial Narrow Intelligence)ํŠน์ • ๋ฌธ์ œ๋ฅผ ํ•ด๊ฒฐํ•˜๋Š” ๋ฐ ํŠนํ™”๋œ AI. ํ˜„์žฌ ์šฐ๋ฆฌ๊ฐ€ ์‚ฌ์šฉํ•˜๋Š” ๋Œ€๋ถ€๋ถ„์˜ AI ์‹œ์Šคํ…œ์€ ์ด ๋ฒ”์ฃผ์— ์†ํ•œ๋‹ค.์˜ˆ๋ฅผ ๋“ค์–ด, ์Œ์„ฑ ์ธ์‹..
ํŠน์ง•๊ฒ€์ƒ‰ ์—”์ง„: ์ „๋ฌธ ๊ฒ€์ƒ‰ ์ง€์›, ์—ญ์ƒ‰์ธ ํ†ตํ•œ ๋น ๋ฅธ ์†๋„, ์• ๋„๋ผ์ด์ € ํ†ตํ•œ ํ˜•ํƒœ์†Œ ๋ถ„์„๋ถ„์‚ฐ ์ฒ˜๋ฆฌ๊ณ ๊ฐ€์šฉ์„ฑ์ˆ˜ํ‰์  ํ™•์žฅ์„ฑJSON๊ธฐ๋ฐ˜ REST API ์ค€์‹ค์‹œ๊ฐ„ ๊ฒ€์ƒ‰: ์—ญ์ƒ‰์ธ์œผ๋กœ๋ถ€ํ„ฐ ๊ฒ€์ƒ‰์ด ๊ฐ€๋Šฅํ•ด์ง€๊ธฐ๊นŒ์ง€ 1์ดˆ์˜ ์‹œ๊ฐ„์ด ๊ฑธ๋ฆฌ๊ธฐ์—, ์ค€์‹ค์‹œ๊ฐ„ ๊ฒ€์ƒ‰์ด๋ผ ํ•  ์ˆ˜์žˆ๋‹ค.์กฐ์ธ๊ณผ ํŠธ๋žœ์žญ์…˜ ๋ฏธ์ง€์› Elasticsearch์—์„œ ํ•˜๋‚˜์˜ ์ธ๋ฑ์Šค์— ํ•˜๋‚˜์˜ ํƒ€์ž…๋งŒ ๊ตฌ์„ฑํ•  ์ˆ˜ ์žˆ๋‹ค๋Š” ์ œ์•ฝ์ด ์žˆ์ง€๋งŒ, ๋‹ค๋ฅธ ํƒ€์ž…์„ ์‚ฌ์šฉํ•ด์•ผ ํ•˜๋Š” ๊ฒฝ์šฐ์—๋Š” ๋ฐฐ์—ด์ด๋‚˜ ๋‹ค์–‘ํ•œ ํ•„๋“œ๋กœ ์—ฌ๋Ÿฌ ๋ฐ์ดํ„ฐ๋ฅผ ์ €์žฅํ•˜๋Š” ๋ฐฉ๋ฒ•์„ ์‚ฌ์šฉํ•  ์ˆ˜ ์žˆ๋‹ค. ๋ฌธ์„œ ์ƒ‰์ธ 1. ์ƒ‰์ธ(Indexing)PUT [์ธ๋ฑ์Šค ์ด๋ฆ„] /_doc/[_id๊ฐ’]{ [๋ฌธ์„œ ๋‚ด์šฉ]} ๋ฐ์ดํ„ฐ๋ฅผ Elasticsearch์— ์ €์žฅํ•˜๋Š” ๊ณผ์ •. ์ด ์ž‘์—…์€ ์ฃผ๋กœ ๋ฌธ์„œ(document)๋ฅผ ํŠน์ • ํ˜•์‹์œผ๋กœ Elasticsearch์˜..
์ž์„ธํ•œ ์ •๋ณด๋Š” ์•„๋ž˜ ์ฐธ๊ณ https://pandas.pydata.org/docs/ pandas documentation — pandas 2.2.3 documentationAPI reference The reference guide contains a detailed description of the pandas API. The reference describes how the methods work and which parameters can be used. It assumes that you have an understanding of the key concepts.pandas.pydata.org ํŒ๋‹ค์Šค๋ž€? ํŒ๋‹ค์Šค๋Š” ๋ฐ์ดํ„ฐ ๋ถ„์„ ๋ผ์ด๋ธŒ๋Ÿฌ๋ฆฌ๋กœ, ์‹œ๋ฆฌ์ฆˆ์™€ ๋ฐ์ดํ„ฐํ”„๋ ˆ์ž„ ์ž๋ฃŒํ˜•์œผ๋กœ ๋ฐ์ดํ„ฐ๋ฅผ ๋‹ค๋ฃฌ๋‹ค.๋‚ด๋ถ€์ ์œผ๋กœ ๋„˜..
์ž์„ธํ•œ ์ •๋ณด๋Š” ์•„๋ž˜ ์ฐธ๊ณ https://numpy.org/doc/ NumPy Documentation numpy.org NumPy๋ž€? ์•„๋ž˜๋Š” NumPy๋ฅผ์—ฐ์Šตํ•ด ๋ณผ ์ˆ˜ ์žˆ๋Š” ์‚ฌ์ดํŠธ์ด๋‹ค.https://www.w3schools.com/python/numpy/default.asp  NumPy ์ด๋ชจ์ €๋ชจ ์šฐ๋ฆฌ ์ฃผ๋ณ€์— ๋งŽ์€๊ฒƒ๋“ค์ด ํ–‰๋ ฌ๋กœ ํ‘œํ˜„๋œ๋‹ค. ์‚ฌ์ง„, ์‹œ๊ณ„์—ด ๋ฐ์ดํ„ฐ ๋ชจ๋‘ ํ–‰๋ ฌ๋กœ ํ‘œํ˜„๋˜๋ฉฐ, ์ด๋•Œ NumPy๊ฐ€ ์ ํ•ฉํ•˜๋‹ค.NumPy์˜ ๋ฐฐ์—ด์ธ ndarray๋ฅผ ์ด์šฉํ•˜์—ฌ ํ–‰๋ ฌ ์—ฐ์‚ฐ์„ ํšจ์œจ์ ์œผ๋กœ ํ•  ์ˆ˜ ์žˆ๋‹ค.NumPy๋Š” C ์–ธ์–ด๋กœ ๊ตฌํ˜„๋˜์–ด ์žˆ์–ด, Python๋ณด๋‹ค ํ›จ์”ฌ ๋น ๋ฅด๊ฒŒ ๋ฐฐ์—ด ์—ฐ์‚ฐ์„ ์ˆ˜ํ–‰ํ•  ์ˆ˜ ์žˆ๋‹ค.ndarray๋Š” ๊ฐ™์€ ์ž๋ฃŒํ˜•์„ ๊ฐ€์ง€๋Š” ์š”์†Œ๋งŒ ์ฒ˜๋ฆฌํ•˜์ง€๋งŒ, ํ˜•๋ณ€ํ™˜์„ ํ†ตํ•ด ์—ฐ์‚ฐ์ด ๊ฐ€๋Šฅํ•˜๋‹ค.ํ˜•๋ณ€ํ™˜ ๊ฐ€๋Šฅ  ex) float ๋ฐฐ์—ด์— i..
๊ณ„๋ž€์†Œ๋…„
'๐Ÿฆญ AI&Big Data' ์นดํ…Œ๊ณ ๋ฆฌ์˜ ๊ธ€ ๋ชฉ๋ก
์ƒ๋‹จ์œผ๋กœ