반응형

Basis(기저)

  • 벡터 공간 𝑽의 기저는 𝑽를 채울 수 있는 선형독립인 벡터들(Span의 역개념)
  • 좌표평면(2차원)을 구성하는 기저벡터는 2개(차원 = 기저 벡터의 개수)

 

Rank

  • 행렬의 열을 이루는 벡터로 만들 수 있는 공간(span)의 차원
  • 선형 독립인 행 또는 열의 최대 개수
  • 행 또는 열을 이루는 벡터들이 선형관계

 

Vector Transformation

  • 데이터를 변환하기 위한 단계
  • 벡터의 변환은 벡터의 행렬 𝑻의 곱으로 이루어짐
  • 임의의 벡터 [𝒙₁, 𝒙₂]는 함수(행렬) 𝑓에 의해 [𝒙₁', 𝒙₂']로 변환

 

Eigenstuff

  • Eigenvector(고유벡터)
    • 주어진 transformation에 의해 크기만 변하고 방향은 변하지 않는 벡터
    • Eigenvalue와 한 쌍
    • 행렬이 벡터의 변화에 작용하는 축의 방향을 나타냄
    • 공분산 행렬의 고유벡터는 데이터가 어떤 방향으로 분산되어 있는지 알려줌
  • Eigenvalue(고유값)
    • Eigenvector의 변화한 크기(얼마나 벡터 공간이 늘려지는가를 의미)
    • Eigenvalue가 큰 순서대로 Eigenvector 정렬 -> 중요한 순서대로 주성분을 구성
    • 행렬의 column 수만큼 존재
    • 𝑻(𝑣) = 𝜆𝑣 (𝜆 : eigenvalue, 𝑣 : eigenvector)

 

분산(Variance)

  • 데이터가 흩어진 정도를 하나의 값으로 나타낸 것(편차 제곱의 평균)
  • 데이터가 서로 멀리 떨어져 있을수록 분산의 값이 커짐

 

표준편차(Standard Deviation)

  • 분산의 스케일을 조정하는 효과(분산의 제곱근)

 

공분산(Covariance)

  • 두 변수에 대해 한 변수가 변화할 때, 다른 변수가 어떤 연관성을 갖고 변하는지를 나타내는 값
  • 두 변수의 연관성이 클수록 공분산 값도 커짐
  • 양수, 음수 모두 가질 수 있으며, 데이터의 스케일에 큰 영향을 받음
  • 분산-공분산 행렬(variance-covariance matrix)
    • 모든 변수에 대해 분산과 공분산 값을 나타내는 정사각행렬
    • 주 대각선 성분은 자기 자신의 분산값을나타냄
    • 주 대각선 이외의 성분은 가능한 두 변수의 공분산 값을 나타냄

 

상관계수(Correlation Coefficient)

  • 공분산을 두 변수의 표준편차로 나눠준 값 -> 공분산의 스케일을 조정하는 효과
  • 공분산과 상관계수의 차이 : scaling
    • 연관성이 유사해도 변수들의 스케일이 크면 공분산 값이 큼
    • 변수의 스케일에 영향을 받지 않음
  • -1 ~ 1 사이의 값
    • 상관계수 1 = 양의 선형관계
    • 상관계수 -1 = 음의 선형관계

 

 

** 수정이 필요하다면 댓글을 부탁드립니다. 

반응형

+ Recent posts