OAK

표준화 잔차(Standardized Residuals)를 이용한 확인적 요인분석에서의 극단치 식별

Metadata Downloads
Abstract
본 연구에서는 구조방정식 모형에서 측정모형에 해당하는 확인적 요인모형에서의 극단치 식별에 관한 경험적 증거를 찾고자 했다. 먼저 요인모형에서 표준화 잔차의 이론적 분포가 분포와 다른지 검증하였고, 표준화 잔차의 경험적 분포의 평균 및 표준편차와 이론적 분포의 평균 및 표준편차의 비교를 통해서 표준화 잔차가 분포를 가정하는지 살펴보았다. 연구 결과, 생성된 자료로부터 산출된 값은 분포를 따르지 않았다. 따라서 극단치 식별을 위해 분포가 아닌 생성된 자료의 경험적 분포를 활용하여 백분위수(percentile) 99%, 95%, 90%에 따른 임계값(critical value)를 구하였다. 이 임계값을 이용하여 극단치를 포함한 표본에서 분석모형, 표본크기, 극단치 비율의 다양한 조건 하에서 표준화 잔차의 극단치 탐지율을 비교함으로써 표준화 잔차의 유용성을 검증하였다. 주요 연구결과를 요약하면 다음과 같다.
첫째, 분석모형이 단순하고 표본크기가 크며 극단치 비율이 높은 조건에서 극단치 탐지율이 높게 나타났다. 둘째, 모형과 표본크기의 상호작용효과를 분석한 결과 통계적으로 유의한 것으로 나타났다. 따라서 단순모형과 복잡모형으로 나누어 단순주효과 분석을 실시한 결과 표본크기가 300일 때 극단치 탐지율이 가장 높게 나타났으며, 다음으로 표본크기 50, 100 순으로 극단치 탐지율이 높게 나타났다. 셋째, 표본크기와 극단치 비율의 상호작용효과 역시 통계적으로 유의하게 나타났다. 보다 구체적으로 표본크기가 50과 100인 조건에서는 극단치 비율이 높을수록 극단치 탐지율이 높은 것으로 나타났으며 표본크기가 300인 조건에서는 5%일 때 극단치 탐지율이 가장 높았으며, 다음으로 20%, 15%, 10%순으로 극단치 탐지율이 높은 것으로 나타났다.
끝으로, 본 연구에 대해 논의하고 제한점 및 추후 연구방향을 제시하였다.

주요어: 극단치, 이상치, 시뮬레이션, 표준화 잔차, outlier
Author(s)
신진이
Issued Date
2015
Awarded Date
2015-02
Type
Dissertation
URI
https://repository.sungshin.ac.kr/handle/2025.oak/6853
http://dcollection.sungshin.ac.kr/jsp/common/DcLoOrgPer.jsp?sItemId=000000009976
Affiliation
성신여자대학교 대학원
Department
일반대학원 심리학과
Advisor
조영일
Table Of Contents
논문개요

Ⅰ. 서 론
1. 연구의 필요성 및 목적 1

Ⅱ. 이론적 배경
1. 극단치의 식별에 대한 전통적인 접근방식 8
1) 모형에 기반을 두지 않는 방법
(1) 히스토그램(histogram) 8
(2) 상자도표(box plot) 12
(3) 산포도(scatter plot) 15
2) 모형기반방법 17
(1) Cook’s distance 17
(2) 마할라노비스 거리(Mahalanobis distance) 18
(3) 표준화 잔차(Standardized Residuals) 19
2. 극단치의 식별에 대한 새로운 접근방식
1) 요인모형(Factor Model) 21
2) 잔차(Residuals)의 산출 21
(1) 비표준화 잔차(Unstandardized Residuals) 24
(2) 표준화 잔차(Standardized Residuals) 29
3) 통계적 유의성 검증 30

Ⅲ. 연구문제 및 가설 32

Ⅳ. 연구 방법
1. 시뮬레이션 연구 설계 34
1) 독립변수
(1) 분석모형 34
(2) 표본크기(Sample Size) 35
(3) 극단치의 비율 35
2) 종속변수
(1) 1종 오류(Type-I error) 35
(2) 극단치 탐지율(Detection rates) 35
2. 자료생성 및 분석방법
1) 자료생성 37
(1) 첫 번째 모형의 모수치 37
(2) 두 번째 모형의 모수치 39
2) 분석방법 40

Ⅴ. 연구 결과
1. 극단치를 포함하지 않은 조건의 특성 41
2. 모형, 표본크기, 극단치의 비율, 유의수준에 따른 극단치 탐지율 43
1) 경험적 분포에 의한 임계값 43
2) 극단치 사례를 포함한 조건의 특성 44
3) 단순모형에서 극단치 탐지율 48
4) 복잡모형에서 극단치 탐지율 50
5) 모형에 따른 표본크기에서 극단치 탐지율의 평균차이 52
6) 표본크기에 따른 극단치 비율에서 극단치 탐지율의 평균차이 54

Ⅵ. 논의 및 제언
1. 연구 결과에 대한 논의 58
2. 연구의 제한점 및 후속 연구를 위한 제언 60

참 고 문 헌
ABSTRACT(영문초록)
부 록
Degree
Master
Publisher
성신여자대학교 대학원
Appears in Collections:
심리학과 > 학위논문
공개 및 라이선스
  • 공개 구분공개
  • 엠바고2015-02-25
파일 목록

Items in Repository are protected by copyright, with all rights reserved, unless otherwise indicated.