반응형
Basis(기저)
- 벡터 공간 𝑽의 기저는 𝑽를 채울 수 있는 선형독립인 벡터들(Span의 역개념)
- 좌표평면(2차원)을 구성하는 기저벡터는 2개(차원 = 기저 벡터의 개수)
Rank
- 행렬의 열을 이루는 벡터로 만들 수 있는 공간(span)의 차원
- 선형 독립인 행 또는 열의 최대 개수
- 행 또는 열을 이루는 벡터들이 선형관계
Vector Transformation
- 데이터를 변환하기 위한 단계
- 벡터의 변환은 벡터의 행렬 𝑻의 곱으로 이루어짐
- 임의의 벡터 [𝒙₁, 𝒙₂]는 함수(행렬) 𝑓에 의해 [𝒙₁', 𝒙₂']로 변환
Eigenstuff
- Eigenvector(고유벡터)
- 주어진 transformation에 의해 크기만 변하고 방향은 변하지 않는 벡터
- Eigenvalue와 한 쌍
- 행렬이 벡터의 변화에 작용하는 축의 방향을 나타냄
- 공분산 행렬의 고유벡터는 데이터가 어떤 방향으로 분산되어 있는지 알려줌
- Eigenvalue(고유값)
- Eigenvector의 변화한 크기(얼마나 벡터 공간이 늘려지는가를 의미)
- Eigenvalue가 큰 순서대로 Eigenvector 정렬 -> 중요한 순서대로 주성분을 구성
- 행렬의 column 수만큼 존재
- 𝑻(𝑣) = 𝜆𝑣 (𝜆 : eigenvalue, 𝑣 : eigenvector)
분산(Variance)
- 데이터가 흩어진 정도를 하나의 값으로 나타낸 것(편차 제곱의 평균)
- 데이터가 서로 멀리 떨어져 있을수록 분산의 값이 커짐
표준편차(Standard Deviation)
- 분산의 스케일을 조정하는 효과(분산의 제곱근)
공분산(Covariance)
- 두 변수에 대해 한 변수가 변화할 때, 다른 변수가 어떤 연관성을 갖고 변하는지를 나타내는 값
- 두 변수의 연관성이 클수록 공분산 값도 커짐
- 양수, 음수 모두 가질 수 있으며, 데이터의 스케일에 큰 영향을 받음
- 분산-공분산 행렬(variance-covariance matrix)
- 모든 변수에 대해 분산과 공분산 값을 나타내는 정사각행렬
- 주 대각선 성분은 자기 자신의 분산값을나타냄
- 주 대각선 이외의 성분은 가능한 두 변수의 공분산 값을 나타냄
상관계수(Correlation Coefficient)
- 공분산을 두 변수의 표준편차로 나눠준 값 -> 공분산의 스케일을 조정하는 효과
- 공분산과 상관계수의 차이 : scaling
- 연관성이 유사해도 변수들의 스케일이 크면 공분산 값이 큼
- 변수의 스케일에 영향을 받지 않음
- -1 ~ 1 사이의 값
- 상관계수 1 = 양의 선형관계
- 상관계수 -1 = 음의 선형관계
** 수정이 필요하다면 댓글을 부탁드립니다.
반응형
'공부 노트' 카테고리의 다른 글
[선형대수] 선형대수(1) (0) | 2023.02.15 |
---|---|
[확률과 통계] 가설 검정(2) (0) | 2023.02.14 |
[확률과 통계] 가설 검정(1) (0) | 2023.02.13 |
[확률과 통계] 확률에 대하여(2) (0) | 2023.02.13 |
[확률과 통계] 확률에 대하여(1) (0) | 2023.02.13 |