DA

[TIL] 머신러닝이란?|MLOps|머신러닝 모델 만들어보기

ha_data 2023. 11. 22. 21:58

머신러닝이란?

Machine Learning은 컴퓨터가 학습할 수 있도록 하는 알고리즘과 기술을 개발하는 분야.

딥러닝은 이 중의 일부 (비전, 자연어 처리 등)

머신 러닝을 통해 최종적으로 만드는 것이 머신 러닝 모델

 

머신러닝 종류

  • 지도 기계 학습 (Supervised Machine Learning) : 명시적 예제 (트레이닝 셋)을 통해 학습 -> 정답이 존재
    • 분류 지도 학습 (Classification) : 이진 분류(Binary)와 다중 분류 (Multi-class) ex. 개 or 고양이, 어떤 동물인가?
    • 회귀 지도 학습 (Regression) ex. 주택 가격 예측, 주식 가격 예측
  * 이진 분류 문제 ex. 타이타닉 승객 생존 여부 예측
탑승 승객별로 승객 정보와 최종 생존 여부가 트레이닝셋으로 제공 
탑승객의 훈련 데이터를 사용하기 쉬운 형태로 컨버젼 해주기 -> Feature Engineering

 

 

  • 비지도 기계 학습 (Unsupervised Machine Learning)
    • 클러스터링 혹은 뉴스 그룹핑 처럼 데이터를 몇 개의 그룹으로 분리
    • GPT 같은 언어 모델의 훈련 
  • 강화 학습 (Reinforcement Learning)
    • 알파고 혹은 자율주행

MLOps란?

머신러닝 모델 빌딩, 매포, 모니터링 전체 프로세스를 자동화 하는 직군

Data Drift로 인한 모델 성능 저하 -> MLOps의 필요성

ML 모델에서 가장 중요한 것은 훈련 데이터

시간이 지나면서 훈련에 사용한 데이터와 실제 환경의 데이터가 다르게 변화함. 이를 Data Drift 라고 부르며 이를 모니터링 하는 것이 중요. 주기적으로 ML 모델을 다시 빌딩해주는 일이 필요함

 

머신 러닝 모델 만들어보기 

1) Simple ML for Sheets 확장프로그램 다운

Simple ML for Sheets - Google Workspace Marketplace

 

Simple ML for Sheets - Google Workspace Marketplace

리뷰, 프로필 이름, 사진이 Google 서비스에 공개적으로 표시됩니다. 리뷰는 Google Workspace Marketplace 댓글 가이드라인 및 리뷰 정책을 준수해야 합니다. 자세히 알아보기

workspace.google.com

 

2) 구글 시트에서 예제파일 열기 - 확장프로그램 시작

비어진 셀을 채우기 위해 Predict missing values 를 클릭하고 Predict을 누르면 셀이 채워진다!

3) 결과

예측된 값과 예측 값의 Confidence 값을 출력해준다.