선형 변환 ( Linear Transformation)
벡터 v에 특정 행렬 A를 곱하면? 새로운 벡터v2 생성
특정 벡터에 어떠한 행렬을 곱하면 벡터의 방향 또는 크기가 변경됨.
벡터의 방향과 크기 변경을 선형 변환이라고 함
고유벡터(Eigenvector)와 고유값 (Eigenvalue)
행렬 A에는 다양한 벡터를 곱할 수 있음
Av = av (a: 상수)
방향은 그대로고 크기만 바뀐것
그런 벡터 v를 고유벡터, 상수 a를 고유값이라고 함
행렬 A의 고유벡터는 행렬 A의 값이 가장 많이 분산되는 방향을 나타냄
분산이 많이 된다는 것은 많은 정보력을 갖고 있다고 볼 수 있음
일반적으로 데이터를 불러오면 행렬의 형태를 갖게 됨
이 데이터를 담아온 행렬을 A라고 하면, 데이터가 담고 있는 여러 정보 중 가장 의미가 큰 방향이 고유 벡터가 됨
해당 방향으로 얼만큼 분산이 이루어졌는지 분산의 크기를 나타내는 정도가 고유값
고유벡터와 고유값은 복수, 고유값을 기준으로 나열된 고유벡터는 해석력이 큰 방향의 순서를 의미함
이 둘은 데이터를 이해하고 계산하는 과정에서 사용됨
- 의미를 유지한 상태로 데이터를 전처리 하거나
- 행렬 계산을 간소화 하는 과정에서 사용됨
특이값 분해 (Singular Value Decomposition, SVD)
복잡한 행렬 A(m*n)을 더 간단한 세 가지행렬로 분해
고유벡터와 고유값 그리고 SVD의 관계
둘 다 특정 행렬A에서 정보를 뽑아내는 과정
고유벡터와 고유값 분석은 행렬A가 정사각 행렬일 경우에 사용가능
SVD는 직사각형 행렬A에 대해 사용 가능
SVD가 좀 더 일반적인 경우를 나타내며 고유벡터와 고유값은 SVD의 스페셜 케이스로 보면 됨
'ML' 카테고리의 다른 글
[ML] 다중공선성 | SVD-OLS | Over fitting | 랏쏘회귀, 릿지회귀 (1) | 2024.02.01 |
---|---|
[ML]선형의 의미 | 다중공선성 | 선형 회귀 | 비용 함수 - 정규방정식, 경사 하강법 (0) | 2024.02.01 |
[ML] 학습,검증,평가 데이터 분할 | overfitting 과적합 | 손실함수 | 파라미터와 최적화 | 분류와 회귀 대표알고리즘 (2) | 2024.01.30 |
[ML]scikit-learn | Pipeline | 지도학습이란?| 분류와 회귀문제 | 이진분류, 다중클래스 (0) | 2024.01.30 |
[ML]머신러닝 종류 | 메타 데이터와 레이블| 지도학습, 비지도학습, 준지도, 자기지도 학습, 강화학습 (1) | 2024.01.29 |