수정된 RV계수를 이용한 주성분 개수 결정에 관한 연구
- Abstract
- 다변량분석(Multivariate analysis)은 다변량 데이터의 변수들 간 상관관계를 이용하여 차원의 수를 축약하는 통계적 분석방법이다. 그중에서도 주성분분석(Principal Component Analysis: PCA)은 연속형 독립변수들의 선형결합을 통해 원데이터가 내포한 정보의 대부분을 설명하고 의미 있는 주성분이란 새로운 결합변수를 탐색하는 분석방법이다.
주성분분석의 목적은 다차원데이터에 대한 정보의 손실을 최소화하는 소수의 주성분을 선택하여 차원을 축소하는 것으로서 적절한 주성분의 개수를 추정하는데 있어서 여러 가지 방법들이 연구되어왔다. 방법들은 크게 두 분류로 나눠질 수 있는데 분포의 가정이 필요한 병렬분석, 바틀렛의 구형성검정이나 분포의 가정이 필요하지 않은 탐색적 방법으로 카이저규칙과 산비탈그림과 같은 방법 등이 널리 쓰이고 있다.
본 논문에서는 고차원 행렬간의 상관성 척도인 수정된 RV계수를 기반으로 적절한 주성분의 개수를 추정하고 그 개수가 적절한지에 대해 모의실험과 실제자료에 적용시켜봄으로서 효율성을 평가하였다. 그 결과 관측치의 수보다 변수의 수가 더 큰 경우에 수정된 RV계수를 이용한 주성분개수 결정방법이 기존의 방법보다 우수함을 확인하였다.
|Principal Component Analysis(PCA) is one of the multivariate techniques that analyze a data in which observations are described by several inter-correlated quantitative variables. As the purpose of PCA is determining the number of non-trivial principal components, many methods to estimate the number of non-trivial axes has been proposed.
In this study, we suggested a new technique to evaluate the dimensionality in PCA. It is based on a similarity measurement, singular value decomposition(SVD), and permutation procedures. The RV-coefficient was introduced as a measure of similarity between matrices and as a theoretical tool to analyze multivariate techniques. Modified RV-coefficient can be used in high-dimensional data analysis studies as a measurements of common information of two datasets. The technique proposed used the RV-coefficient as the similarity measure between data matrix and residual matrix of original data.
The simulation study and real application showed that the suggested method based on modified RV-coefficient is more accurate than based on th RV-coefficient when the number of variables is lager than observations.
- Author(s)
- 김소영
- Issued Date
- 2012
- Awarded Date
- 2012-02
- Type
- Dissertation
- URI
- https://repository.sungshin.ac.kr/handle/2025.oak/4388
http://dcollection.sungshin.ac.kr/jsp/common/DcLoOrgPer.jsp?sItemId=000000007014
- Department
- 일반대학원 통계학과
- Advisor
- 이성건
- Degree
- Master
- Publisher
- 성신여자대학교 대학원
-
Appears in Collections:
- 통계학과 > 학위논문
- 공개 및 라이선스
-
- 파일 목록
-
Items in Repository are protected by copyright, with all rights reserved, unless otherwise indicated.