ML

[ML]머신러닝에 필요한 선형대수 | 선형 변환 | 고유벡터, 고유값, 분산 |

ha_data 2024. 1. 29. 21:24

선형 변환 ( Linear Transformation)

벡터 v에 특정 행렬 A를 곱하면? 새로운 벡터v2 생성

특정 벡터에 어떠한 행렬을 곱하면 벡터의 방향 또는 크기가 변경됨.

벡터의 방향과 크기 변경을 선형 변환이라고 함

 

고유벡터(Eigenvector)와 고유값 (Eigenvalue)

행렬 A에는 다양한 벡터를 곱할 수 있음

Av = av  (a: 상수)

방향은 그대로고 크기만 바뀐것

그런 벡터 v를 고유벡터, 상수 a를 고유값이라고 함

행렬 A의 고유벡터는 행렬 A의 값이 가장 많이 분산되는 방향을 나타냄

분산이 많이 된다는 것은 많은 정보력을 갖고 있다고 볼 수 있음

일반적으로 데이터를 불러오면 행렬의 형태를 갖게 됨

이 데이터를 담아온 행렬을 A라고 하면, 데이터가 담고 있는 여러 정보 중 가장 의미가 큰 방향이 고유 벡터가 됨

해당 방향으로 얼만큼 분산이 이루어졌는지 분산의 크기를 나타내는 정도가 고유값

고유벡터와 고유값은 복수, 고유값을 기준으로 나열된 고유벡터는 해석력이 큰 방향의 순서를 의미함

이 둘은 데이터를 이해하고 계산하는 과정에서 사용됨

 - 의미를 유지한 상태로 데이터를 전처리 하거나

 - 행렬 계산을 간소화 하는 과정에서 사용됨

 

특이값 분해 (Singular Value Decomposition, SVD)

복잡한 행렬 A(m*n)을 더 간단한 세 가지행렬로 분해

 

고유벡터와 고유값 그리고 SVD의 관계

둘 다 특정 행렬A에서 정보를 뽑아내는 과정

고유벡터와 고유값 분석은 행렬A가 정사각 행렬일 경우에 사용가능

SVD는 직사각형 행렬A에 대해 사용 가능

SVD가 좀 더 일반적인 경우를 나타내며 고유벡터와 고유값은 SVD의 스페셜 케이스로 보면 됨