Gen AI
뉴스, 위키피디 등 자연스러운 언어 문장을 학습하여서 새로운 문장을 출력
이미지, 오디오, 텍스트 등을 학습해 새로운 컨텐츠를 출력하는 딥러닝 기술
프롬프트를 바탕으로 대답을 예측하는 등 새로운 컨텐츠 생성
딥러닝, Gen AI, LLM의 관계
딥러닝의 안에 LLM(Large Language Model), Gen AI가 속해 있음
LLM은 Gen AI의 일부
딥러닝의 모델 타입
Discriminative
분류/예측을 하는 것으로 레이블이 존재하는 데이터에 적용
피처들과 레이블들간의 관계를 학습
*피처-학습데이터 레이블-테스트데이터
ex. 개 혹은 고양이 분류
Generative
훈련된 데이터와 비슷하지만 새로운 데이터생성, 훈련된 데이터의 통계적 특성을 이해
비지도 학습에 해당 -> 정답이 없기 때문
ex. 개 이미지 생성
Gen AI 모델과 일반 ML 모델의 동작방식
y= f(x)
y-출력, f-모델, (x) - 입력
일반 ML 모델에서 y는 숫자, 카테고리, 확률
Gen AI 모델에서 y는 자연어 문장, 이미지, 오디오
Gen AI 파운데이션 모델
광범위한 데이터셋을 바탕으로 학습시킨 모델로 이미 일반적인 지식이 학습되어 있음 (Pre-trained)
Unsupervised Learning (혹은 Self Supervised Learning)
대용량 데이터로 학습하기에 엄청난 시간과 돈과 인력 필요
트랜스포머 모델 아키텍처를 사용함 (Attention is All You Need)
하나의 트랜스 포머에는 Encoder -> Decorder 로 구성, 트랜스 포머를 많이 사용할 수록 학습하는데 시간과 비용 증가
파운데이션 모델을 파인튜닝을 통해 내가 원하는 쪽으로 동작할 수 있도록 특정 지식 학습 시킴
Gen AI 실습: Chat GPT로 데이터 분석하기
1) csv 파일 입력하고 어떤 데이터 분석이 가능한지 질문하기
2) 국가별 삶의 기대 수명과 GDP 증가율 간의 상관관계 알아보기
3) 결과값 출력
'DA' 카테고리의 다른 글
[TIL]캐글실습하기|타이타닉생존율예측하기|정확도0.6xx... (0) | 2023.11.30 |
---|---|
[TIL]공공데이터|Tableau|데이터분석 실습 (3) | 2023.11.28 |
[TIL] 머신러닝이란?|MLOps|머신러닝 모델 만들어보기 (1) | 2023.11.22 |
[데이터분석] 시각화 대시보드 툴|지표 정의하고 차트 만들어보기 실습 (0) | 2023.11.21 |
[데이터분석] KPI|선행지표 후행지표란? | 두 가지 중요한 KPI (1) | 2023.11.21 |