몬테카를로 시뮬레이션을 이용한 K-평균 군집분석과 잠재계층분석의 비교-군집회복(cluster recovery)을 중심으로
- Abstract
- 본 논문은 K-평균 군집분석과 잠재계층분석의 군집회복 정도를 비교해보는 시뮬레이션 연구이다. 이를 위하여 총 4개의 시뮬레이션 연구가 사용되었다. 4개의 연구에서는 다섯 개의 조작변수(즉, 사례수, 문항수, 군집수, 효과크기, & 잠재집단확률)가 사용되었다. 조작변수의 수준에 따라 3(N)×3(V)×3(K)×3(F)×3()의 요인설계(factorial design)를 바탕으로 243개의 실험 조건을 설정하고 각 조건을 500번씩 반복하였다. 자료의 생성과 분석에는 통계프로그램 R이 사용되었다.
잠재계층분석의 분석 결과, 문항수 수준, 효과크기 수준, 잠재집단확률 수준에 따른 군집회복 정도에는 유의한 차이가 있었다. K-평균 군집분석의 결과, 군집수 수준, 효과크기 수준, 잠재집단확률 수준에 따른 군집회복 정도에는 유의한 차이가 있었다. 분석방법과 군집수 수준, 분석방법과 효과크기 수준, 그리고 분석방법과 잠재집단확률 수준이 군집회복에 미치는 상호작용효과는 통계적으로 유의하였다. 전반적으로 잠재계층분석이 K-평균 군집분석보다 높은 군집회복 지수를 보였다.
또한 추정의 효율성을 검증하기 위하여 잠재계층분석과 K-평균 군집분석을 실시하는 과정에서 지정한 반복(iteration) 횟수 이후에도 수렴하지 못하는 경우에 대해 살펴보았다. K-평균 군집분석에서는 NC(Not Converged)가 한 건도 발생하지 않은 반면에 잠재계층분석에서는 총 121,500의 자료 중에 약 0.1%인 141건의 NA가 발생하였다. 따라서 연구자에게 주어진 데이터의 형태와 조건에 따라 잠재계층분석과 K-평균 군집분석이 각각 가질 수 있는 장점과 단점이 있으므로, 상이한 연구문제에 따라 적합한 분석방법을 사용할 것에 대해 논의하였다. 마지막으로 후속연구를 위한 제언을 논의하였다.
주요어: 군집회복, ARI, 잠재계층분석, K-평균 군집분석, 시뮬레이션, 통계 프로그램 R
- Author(s)
- 구소희
- Issued Date
- 2017
- Awarded Date
- 2017-08
- Type
- Dissertation
- URI
- https://repository.sungshin.ac.kr/handle/2025.oak/3335
http://dcollection.sungshin.ac.kr/jsp/common/DcLoOrgPer.jsp?sItemId=000000012014
- 공개 및 라이선스
-
- 파일 목록
-
Items in Repository are protected by copyright, with all rights reserved, unless otherwise indicated.