일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | ||||
4 | 5 | 6 | 7 | 8 | 9 | 10 |
11 | 12 | 13 | 14 | 15 | 16 | 17 |
18 | 19 | 20 | 21 | 22 | 23 | 24 |
25 | 26 | 27 | 28 | 29 | 30 | 31 |
- Self-attention
- 확률밀도함수
- 모평균
- 베타분포
- 통계
- 상관계수
- ViT
- 공분산
- 평균
- 조건부확률
- 확률모형
- 검정
- 모집단
- 표본
- 검정력
- 리샘플링
- 확률변수
- p-value
- 데이터분석
- Transformer
- 확률분포
- 샘플링
- 선형대수
- 신뢰구간
- 데이터분석면접
- 통계면접
- 누적분포함수
- 고유값
- 확률
- 고유벡터
- Today
- Total
AIMS Study Blog
고유값과 고유벡터의 개념과 중요성 본문
Question. 고유값과 고유벡터에 대해 설명해주세요. 그리고 왜 중요할까요?
고유값과 고유벡터
정방 행렬 A에 의한 선형 변환 결과가 자기 자신의 상수배가 되는 0이 아닌 벡터를 고유 벡터(Eigen Vector)라고 부르며, 이 상수배 값을 고유 값(Eigen Value)라고 한다.
고유 값과 고유 벡터는 행과 열의 크기가 동일한 정방행렬에서만 구할 수 있으며, 정방 행렬이라도 행렬에 따라서 고유값과 고유 벡터의 개수는 서로 다르다. 행과 열의 크기를 n이라고 가정할 때 0 ~ n개의 고유 벡터를 가질 수 있다.
고유값, 고유벡터, 그리고 대각화
고유값과 고유벡터에 대한 개념은 정방행렬의 대각화를 하는 과정에서 직접적으로 사용이 된다.
대각화라는 것은 특정 정방행렬 A를 대각원소 이외에는 모든 원소가 0의 값을 가지고 있는 대각행렬(Lambda)과 고유벡터를 열벡터로 하는 행렬의 곱으로 분해를 하는 것을 의미한다.
행렬 A의 고유 벡터들을 열벡터로 가지고 있는 행렬을 P라고 하고, 고유 값들을 대각 원소로 하는 대각 행렬을 Lambda라고 한다면,
위의 두 식에서 볼 수 있듯이 행렬 A를 A의 고유 벡터들로 이루어진 P와 고유값을 대각 원소로 하는 대각행렬 Lambda의 곱을 통해서 표현할 수 있다. 이러한 대각화 분해를 Eigen Deomposition이라고 한다.
행렬이 일차 독립인 경우에는 대각화가 가능하며, 행렬의 거듭제곱, 역행렬, 대각합, 행렬의 다항식 등 다양한 연산을 손쉽게 계산할 수 있다.
고유값과 고유벡터 계산
고유값과 고유벡터의 정의식은 다음과 같다.
고유값과 고유벡터는 위의 식을 계산하여 나오는 lambda와 v이다. 하지만, 고유벡터의 정의상 v는 영벡터가 될 수 없으므로, (A - lambda E)의 역행렬이 존재하지 않아야 v가 영벡터가 아닌 다른 해를 가질 수 있다. 따라서 det(A - lambda E) = 0 의 식을 계산하면 행렬 A의 고유값과 고유벡터를 계산할 수 있다.
대칭행렬과 고유값 분해
정방행렬 중, 대각 원소를 기준으로 원소값들이 대칭이 되는 행렬을 대칭행렬(Symmetric Matrix)라고 부른다. 이 대칭 행렬은 고유값과 고유벡터와 관련하여 두가지 특징점을 가지고 있다.
1. 대칭 행렬은 항상 고유값 대각화가 가능하다.
2. 대칭행렬은 직교 행렬(Orthogonal Matrix)로 대각화가 가능하다.
이러한 성질들은 Singular Value Decomposition(특이값 분해), Principal Component Analysis(주성분 분석)에서 주요한 특성으로 활용이 된다.
Answer
고유값과 고유벡터은 정방행렬 A를 선형변환의 관점에서 보았을 때, 특정 벡터들은 행렬 A를 통해서 선형 변환을 거치더라도 방향이 변하지 않는데, 이것을 고유벡터라고 하고, 그 때 변화하는 벡터들의 크기의 비율을 고유 값이라고 합니다.
위의 개념들이 중요한 이유는, 특이값 분해, 주성분 분석 등 데이터를 분석할 때 자주 사용되는 개념들이 고유 값과 고유 벡터를 활용한 개념들이고, 특히, 대각 행렬에서 고유값과 고유 벡터를 통해서 eigen decomposition을 진행하면 다른 행렬과의 연산이 매우 간단하게 해결이 되기 때문에, 고유값과 고유 벡터의 개념이 중요한 것 같습니다.
ref :
'통계' 카테고리의 다른 글
고유값과 고유 벡터에 대한 설명과 중요성 (0) | 2023.01.14 |
---|---|
고유값, 고유 벡터의 개념과 중요성 (1) | 2023.01.14 |
Sampling & Resampling (0) | 2023.01.14 |
샘플링과 리샘플링에 대해 (0) | 2023.01.13 |
고유값과 고유벡터는 무엇이고 왜 중요할까? (0) | 2023.01.09 |