머신러닝이란?
Machine Learning은 컴퓨터가 학습할 수 있도록 하는 알고리즘과 기술을 개발하는 분야.
딥러닝은 이 중의 일부 (비전, 자연어 처리 등)
머신 러닝을 통해 최종적으로 만드는 것이 머신 러닝 모델
머신러닝 종류
- 지도 기계 학습 (Supervised Machine Learning) : 명시적 예제 (트레이닝 셋)을 통해 학습 -> 정답이 존재
- 분류 지도 학습 (Classification) : 이진 분류(Binary)와 다중 분류 (Multi-class) ex. 개 or 고양이, 어떤 동물인가?
- 회귀 지도 학습 (Regression) ex. 주택 가격 예측, 주식 가격 예측
* 이진 분류 문제 ex. 타이타닉 승객 생존 여부 예측
탑승 승객별로 승객 정보와 최종 생존 여부가 트레이닝셋으로 제공
탑승객의 훈련 데이터를 사용하기 쉬운 형태로 컨버젼 해주기 -> Feature Engineering
- 비지도 기계 학습 (Unsupervised Machine Learning)
- 클러스터링 혹은 뉴스 그룹핑 처럼 데이터를 몇 개의 그룹으로 분리
- GPT 같은 언어 모델의 훈련
- 강화 학습 (Reinforcement Learning)
- 알파고 혹은 자율주행
MLOps란?
머신러닝 모델 빌딩, 매포, 모니터링 전체 프로세스를 자동화 하는 직군
Data Drift로 인한 모델 성능 저하 -> MLOps의 필요성
ML 모델에서 가장 중요한 것은 훈련 데이터
시간이 지나면서 훈련에 사용한 데이터와 실제 환경의 데이터가 다르게 변화함. 이를 Data Drift 라고 부르며 이를 모니터링 하는 것이 중요. 주기적으로 ML 모델을 다시 빌딩해주는 일이 필요함
머신 러닝 모델 만들어보기
1) Simple ML for Sheets 확장프로그램 다운
Simple ML for Sheets - Google Workspace Marketplace
Simple ML for Sheets - Google Workspace Marketplace
리뷰, 프로필 이름, 사진이 Google 서비스에 공개적으로 표시됩니다. 리뷰는 Google Workspace Marketplace 댓글 가이드라인 및 리뷰 정책을 준수해야 합니다. 자세히 알아보기
workspace.google.com
2) 구글 시트에서 예제파일 열기 - 확장프로그램 시작
비어진 셀을 채우기 위해 Predict missing values 를 클릭하고 Predict을 누르면 셀이 채워진다!
3) 결과
예측된 값과 예측 값의 Confidence 값을 출력해준다.
'DA' 카테고리의 다른 글
| [TIL]캐글실습하기|타이타닉생존율예측하기|정확도0.6xx... (0) | 2023.11.30 |
|---|---|
| [TIL]공공데이터|Tableau|데이터분석 실습 (3) | 2023.11.28 |
| [TIL]Gen AI란?|Gen AI를 활용한 데이터분석 실습 (0) | 2023.11.23 |
| [데이터분석] 시각화 대시보드 툴|지표 정의하고 차트 만들어보기 실습 (0) | 2023.11.21 |
| [데이터분석] KPI|선행지표 후행지표란? | 두 가지 중요한 KPI (1) | 2023.11.21 |