데이터 엔지니어링

MLOps Machine Learning Operations머신러닝(ML) 모델을 배포, 모니터링, 유지 관리하는 일련의 과정을 의미목표: ML 모델의 개발 생명 주기를 자동화하고 최적화하는 것이 목표필요성워크플로우 자동화: 모델 개발, 학습, 배포, 모니터링 등 전체 파이프라인 자동화안정성: 모델을 프로덕션 환경에 안정적으로 배포하고, 지속적인 모니터링을 통해 이상 상황 감지 및 대응확장성: 데이터와 트래픽에 맞게 인프라 확장모니터링: 실시간 성능 지표, 로그, 알림 통해 성능 저하, 오류 모니터링장점빠른 배포: 머신러닝 모델의 배포 과정을 자동화협업 효율성 향상: 데이터 과학자, 개발자, 운영팀의 협업모델 성능 향상: 모니터링&필요 시 업데이트vs DevOps공통점: 둘 다 소프트웨어 개발과 운영을 ..
빅데이터 프로젝트 시작, 문제 정의, 데이터 수집 및 이해, 분석 및 모델링, 배포 및 적용, 종료의 단계를 거친다.시작 →문제정의 ↔ 데이터 수집 및 이해 ↔ 배포 및 적용 →종료시작 →문제정의 ↔ 분석 및 모델링 ↔ 배포 및 적용 →종료데이터 수집 및 이해 ↔ 분석 및 모델링 1. 문제 정의문제를 명확하게 표현했는지 확인하며, 이를 위해 문제 제시자와 소통문제를 얼마나 잘 해결해야 하는지에 대한 목표를 설정최종 결과를 전달받는 대상자를 명확히 설정문제 해결을 위한 데이터, IT 환경, 빅데이터 전문가 등의 자원을 점검 2. 데이터 수집 및 이해IT 환경을 조성하고 데이터를 수집하며, 데이터를 이해하는 데 많은 시간을 투자한다.양질의 데이터를 적시에 제공해야 하며, 정해진 기한을 준수해야 한다.데이터 ..
이번에 프로그래머스 “[3기] K-Digital Training: 데이터엔지니어링 데브코스”를 준비했다.https://school.programmers.co.kr/learn/courses/22002/22002-3%EA%B8%B0-k-digital-training-%EB%8D%B0%EC%9D%B4%ED%84%B0-%EC%97%94%EC%A7%80%EB%8B%88%EC%96%B4%EB%A7%81-%EB%8D%B0%EB%B8%8C%EC%BD%94%EC%8A%A4 [3기] K-Digital Training: 데이터 엔지니어링 데브코스주니어 데이터 엔지니어의 길잡이가 되어줄 데이터 엔지니어링 데브코스school.programmers.co.kr 3주전에 개발 프로젝트 데모데이가 끝나서, 무엇을 더 배우고 준비해야할..
상단으로