머신 러닝 Machine Learning

인공지능 > 머신러닝 > 딥러닝

위의 크기대로 상위 개념이라고 볼 수 있음




Tom Mitchell의 머신러닝 정의

머신러닝이란 다음과 같은 알고리즘을 연구하는 학문

  • 어떠한 작업 T에 대하여
  • 경험 E와 함께
  • 성능 P를 향상시킨다

제대로 정의된 학습 과제는 <P, T, E>에 의해 주어진다


전통적 프로그래밍

데이터, 프로그램 입력 → 출력값 출력

머신 러닝

데이터, 출력값 입력 → 프로그램 출력




머신 러닝 : 학습의 종류

지도 학습 (귀납적 학습) Supervised Learning

Classification Algorithm

  • 학습 데이터 x + 원하는 출력(레이블) y를 페어로 제공 받아 학습을 진행

    주어진 x에 대해 y를 예측하는 함수 f(x)를 학습

  • y가 실수값 → 회귀(Regression)

  • y가 범주형 → 분류(Classification)

    → 주로 회귀 문제에 사용


준지도 학습 Semi-supervised Learning

  • 가장 현실적

비지도 학습 Unsupervised Learning

Clustering Algorithm

  • 레이블(라벨) 없이 학습 데이터 x만 이용하여 학습 진행

    → 주어진 x 뒤에 숨겨진 구조를 출력

  • 주로 클러스터링 같은 군집화 문제에 사용

  • 딥러닝에서는 AutoEncoder


자기 지도 학습 Self-supervised Learning


강화 학습 Reinforcement Learning

  • 일련의 행동에 따른 보상
  • 어떤 환경에서 정의된 에이전트(시스템)가 현재의 상태를 인식하여 선택 가능한 행동들 중 보상을 최대화하는 행동 혹은 행동 순서를 선택하는 방법
  • 보상이 있는 상태와 액션의 시퀀스가 주어졌을 때, (지연)보상이 있는 일련의 상태와 작업이 주어지면 policy를 출력 → Policy란 주어진 상태에서 수행해야 할 작업을 알려주는 ‘상태→작업’ 형식의 매핑




머신 러닝 라이프 사이클 Machine Learning Life Cycle

머신 러닝 모델을 개발, 배포, 유지 및 보수하는 일련의 단계들을 정의하는 프로세스


1. 계획하기 (Planning)

  • ML 애플리케이션의 범위, 성공 지표 및 실현 가능성을 평가하는 작업 포함
  • 비즈니스와 머신러닝을 사용하여 현재 프로세스를 개선하는 방법의 이해
  • 비용-편익 분석과 여러 단계로 솔루션을 출시할 방법의 이해
  • 비즈니스,머신 러닝 모델(정확도, F1점수, AUC), 경제성(핵심성과 지표)에 대한 명확하고 측정
    가능한 성공 지표 정의
  • 타당성 보고서 작성

2. 데이터 준비 (Data Preparation)

  1. 데이터 수집라벨링
  2. 데이터 정리 (Cleaning)
  3. 데이터 처리
  4. 데이터 관리

3. 모델 엔지니어링 (Model Engineering)

계획 단계의 모든 정보를 사용하여 머신러닝 모델을 구축하고 훈련
(e.g. 모델 메트릭 추적, 확장성 및 견고성 보장, 스토리지 및 컴퓨팅 리소스 최적화 등)

  1. 광범위한 조사를 통해 효과적인 모델 아키텍처 구축
  2. 모델 메트릭 정의
  3. 학습 및 검증 데이터 셋으로 모델 학습, 검증
  4. 실험, 메타데이터,기능,코드 변경 및 머신 러닝 파이프라인을 추적 (1~4번 → 기타 코드 정리)
  5. 모델 압축 및 앙상블 수행
  6. 도메인 지식 전문가를 통하여 결과 해석

4. 모델 평가 (Model Evaluation)

  • 테스트 데이터 셋으로 모델 테스트, 전문가를 참여시켜 예측 오류 파악
  • AI 솔루션 구축을 위한 산업적, 윤리적, 법적 프레임워크를 준수하는지 확인
  • 무작위 및 실제 데이터에 대한 견고성(robustness) 테스트
  • 결과를 계획된 성공 지표와 비교하여 모델 배포 여부 결정

5. 모델 배포 (Model Deployment)

  • 현재 시스템에 머신러닝 모델을 배포
  • 일반적으로 클라우드 및 로컬 서버, 웹 브라우저, 소프트웨어 패키지 등에 배포할 수 있으며, API, 웹, 앱, 플러그인 또는 대시보드를 사용하여 접근

6. 모니터링 및 유지, 관리 (Monitoring and Maintenance)

  • 배포한 후에는 지속적으로 시스템을 모니터링하고 개선
  • 모델 지표, 하드웨어 및 소프트웨어 성능, 고객 만족도를 모니터링
  • 데이터 처리 및 모델 학습 기술을 개선하고, 새로운 소프트웨어와 하드웨어를 업데이트하기 위해 전체 머신 러닝 수명 주기를 개선해야 하는 경우도 있음



'Study - AI > Machine Learning' 카테고리의 다른 글

Transformer  (0) 2025.01.10
선형 대수  (0) 2025.01.06