머신 러닝 Machine Learning
인공지능 > 머신러닝 > 딥러닝
위의 크기대로 상위 개념이라고 볼 수 있음
Tom Mitchell의 머신러닝 정의
머신러닝이란 다음과 같은 알고리즘을 연구하는 학문
- 어떠한 작업 T에 대하여
- 경험 E와 함께
- 성능 P를 향상시킨다
제대로 정의된 학습 과제는 <P, T, E>에 의해 주어진다
전통적 프로그래밍
데이터, 프로그램 입력 → 출력값 출력
머신 러닝
데이터, 출력값 입력 → 프로그램 출력
머신 러닝 : 학습의 종류
지도 학습 (귀납적 학습) Supervised Learning
Classification Algorithm
학습 데이터 x + 원하는 출력(레이블) y를 페어로 제공 받아 학습을 진행
→ 주어진 x에 대해 y를 예측하는 함수 f(x)를 학습
y가 실수값 → 회귀(Regression)
y가 범주형 → 분류(Classification)
→ 주로 회귀 문제에 사용
준지도 학습 Semi-supervised Learning
- 가장 현실적
비지도 학습 Unsupervised Learning
Clustering Algorithm
레이블(라벨) 없이 학습 데이터 x만 이용하여 학습 진행
→ 주어진 x 뒤에 숨겨진 구조를 출력
주로 클러스터링 같은 군집화 문제에 사용
딥러닝에서는 AutoEncoder
자기 지도 학습 Self-supervised Learning
강화 학습 Reinforcement Learning
- 일련의 행동에 따른 보상
- 어떤 환경에서 정의된 에이전트(시스템)가 현재의 상태를 인식하여 선택 가능한 행동들 중 보상을 최대화하는 행동 혹은 행동 순서를 선택하는 방법
- 보상이 있는 상태와 액션의 시퀀스가 주어졌을 때, (지연)보상이 있는 일련의 상태와 작업이 주어지면 policy를 출력 → Policy란 주어진 상태에서 수행해야 할 작업을 알려주는 ‘상태→작업’ 형식의 매핑
머신 러닝 라이프 사이클 Machine Learning Life Cycle
머신 러닝 모델을 개발, 배포, 유지 및 보수하는 일련의 단계들을 정의하는 프로세스
1. 계획하기 (Planning)
- ML 애플리케이션의 범위, 성공 지표 및 실현 가능성을 평가하는 작업 포함
- 비즈니스와 머신러닝을 사용하여 현재 프로세스를 개선하는 방법의 이해
- 비용-편익 분석과 여러 단계로 솔루션을 출시할 방법의 이해
- 비즈니스,머신 러닝 모델(정확도, F1점수, AUC), 경제성(핵심성과 지표)에 대한 명확하고 측정
가능한 성공 지표 정의 - 타당성 보고서 작성
2. 데이터 준비 (Data Preparation)
- 데이터 수집 및 라벨링
- 데이터 정리 (Cleaning)
- 데이터 처리
- 데이터 관리
3. 모델 엔지니어링 (Model Engineering)
계획 단계의 모든 정보를 사용하여 머신러닝 모델을 구축하고 훈련
(e.g. 모델 메트릭 추적, 확장성 및 견고성 보장, 스토리지 및 컴퓨팅 리소스 최적화 등)
- 광범위한 조사를 통해 효과적인 모델 아키텍처 구축
- 모델 메트릭 정의
- 학습 및 검증 데이터 셋으로 모델 학습, 검증
- 실험, 메타데이터,기능,코드 변경 및 머신 러닝 파이프라인을 추적 (1~4번 → 기타 코드 정리)
- 모델 압축 및 앙상블 수행
- 도메인 지식 전문가를 통하여 결과 해석
4. 모델 평가 (Model Evaluation)
- 테스트 데이터 셋으로 모델 테스트, 전문가를 참여시켜 예측 오류 파악
- AI 솔루션 구축을 위한 산업적, 윤리적, 법적 프레임워크를 준수하는지 확인
- 무작위 및 실제 데이터에 대한 견고성(robustness) 테스트
- 결과를 계획된 성공 지표와 비교하여 모델 배포 여부 결정
5. 모델 배포 (Model Deployment)
- 현재 시스템에 머신러닝 모델을 배포
- 일반적으로 클라우드 및 로컬 서버, 웹 브라우저, 소프트웨어 패키지 등에 배포할 수 있으며, API, 웹, 앱, 플러그인 또는 대시보드를 사용하여 접근
6. 모니터링 및 유지, 관리 (Monitoring and Maintenance)
- 배포한 후에는 지속적으로 시스템을 모니터링하고 개선
- 모델 지표, 하드웨어 및 소프트웨어 성능, 고객 만족도를 모니터링
- 데이터 처리 및 모델 학습 기술을 개선하고, 새로운 소프트웨어와 하드웨어를 업데이트하기 위해 전체 머신 러닝 수명 주기를 개선해야 하는 경우도 있음
'Study - AI > Machine Learning' 카테고리의 다른 글
Transformer (0) | 2025.01.10 |
---|---|
선형 대수 (0) | 2025.01.06 |