OAK

보조변수를 활용한 결측치 처리 과정에서 주성분 분석의 적용에 대한 연구

Metadata Downloads
Alternative Title
Application of Principal Components as Auxiliary Variable in Missing data Handling
Abstract
본 논문은 완전정보최대가능성법을 활용한 결측치 추정에서 보조변수 간 상관에 따른 주성분 분석의 수행을 비교하는 시뮬레이션 연구다. 이를 위해 측정변수와 보조변수 간 상관의 크기, 보조변수 간 상관의 형태, 결측치의 비율, 표본의 크기, 모형의 분석 방법에 따라 조건을 설정했다. 이에 따라 통계프로그램 Mplus를 활용해 576(4×3×4×4×3)개의 조건을 만족하는 자료를 생성했으며, 통계프로그램 R을 통해 500회씩 반복 시행 및 분석했다.
분석 결과, 주성분 분석은 연구에서 설정한 모든 조건에서 보조변수로 지정한 9개의 변수를 2개의 주성분으로 축소했다. 주성분 분석을 통해 구한 주성분을 보조변수로 활용해 결측치를 추정할 경우, 보조변수를 사용하지 않고 결측치를 추정할 때보다 추정이 더 정확했으며 오차와 편향이 작았다. 주성분을 보조변수로 활용한 결측치 추정은 보조변수를 그대로 투입한 추정과 유사한 수행 능력을 보였다. 또한 표본의 크기가 작고 결측치의 비율이 높은 극단적인 조건에서 보조변수를 그대로 투입할 경우 모형이 수렴하지 않는 문제가 발생하나, 주성분 분석을 활용할 경우 이를 해결할 수 있었다.
다만 보조변수 간 상관이 이질적인 조건에서 주성분 분석을 활용한 결측치 추정은 보조변수를 그대로 사용한 추정 방법에 비해 수행이 다소 떨어지는 것을 확인했다. 따라서 본 논문은 결측치 추정 과정에서 주성분 분석의 수행 능력을 확인하고, 어떤 상황에서 유용하게 활용될 수 있는지 지표를 제시했다. 마지막으로 본 연구의 한계와 후속 연구에 대한 제언을 논의했다.
Author(s)
유주연
Issued Date
2020
Awarded Date
2020-08
Type
Dissertation
URI
https://repository.sungshin.ac.kr/handle/2025.oak/3673
http://dcollection.sungshin.ac.kr/common/orgView/000000013895
Department
일반대학원 심리학과
Advisor
조영일
Table Of Contents
Ⅰ. 서론 1
1. 연구의 필요성 및 목적 1

Ⅱ. 이론적 배경 10
1. 결측치 메커니즘 10
1) Missing completely at random (MCAR) 11
2) Missing at random (MAR) 13
3) Missing not at random (MNAR) 14
2. 결측치 처리 방법 16
1) 다중대체법(Multiple Imputation: MI) 16
2) 완전정보최대가능성법(Full Information Maximum
Likelihood: FIML 19
3. 보조변수(Auxiliary Variable) 21
1) Inclusive Strategy 25
2) Restrictive Strategy 25
4. 주성분분석(Principal Component Analysis: PCA) 26
1) 주성분분석 26
2) 주성분의 수 결정 28
3) 보조변수 투입에서의 주성분분석 활용 29

Ⅲ. 연구문제 및 가설 32
1. 연구문제 1 32
2. 연구문제 2 32

Ⅳ. 연구방법 33
1. 자료 생성 33
1) 몬테카를로 시뮬레이션 33
2) 시뮬레이션 조건 34
2. 자료 분석 39
1) 모수 편향(Parameter bias) 39
2) RMSE(Root-mean square error) 39
3) 신뢰구간(Confidence Interval: CI) 범위 40
4) 수렴(Convergence) 여부 40

Ⅴ. 연구결과 41
1. 주성분의 수 41
2. 수렴(Convergence) 여부 41
3. 모수 편향(Parameter bias) 42
1)X와 Y의 상관 42
2)Y의 평균 46
3)Y의 분산 48
4. RMSE 51
1)X와 Y의 상관 51
2)Y의 평균 53
3)Y의 분산 56
5. 신뢰구간(Confidence Interval) 58
1)신뢰구간의 범위 58
2)신뢰구간의 너비 61

Ⅵ. 논의 64
Degree
Master
Publisher
성신여자대학교 일반대학원
Appears in Collections:
심리학과 > 학위논문
공개 및 라이선스
  • 공개 구분공개
  • 엠바고2020-08-31
파일 목록

Items in Repository are protected by copyright, with all rights reserved, unless otherwise indicated.