OAK

상사성의 측도를 이용한 다변량 의사결정나무에 관한 연구

Metadata Downloads
Alternative Title
A Study on Multivariate Decision Tree using Similarity Measures
Abstract
연구대상이 되는 개체들을 어떤 관점에서 분류하거나 예측하는 것은 통계적 연구에서 가장 본원적인 목표들 중의 하나이다. 방대한 양의 자료들이 쏟아지는 요즘, 대용량의 자료들을 관심이 되는 집단으로 분류하거나 예측하고자 하는 방법론들이 제안되고 있다. 그 중 의사결정나무분석(decision tree analysis)은 연구자가 분석과정을 쉽게 이해할 수 있고, 그 해석이 용이하여 흔히 이용되고 있다.
적절한 의사결정나무를 구축하기 위해서는 주어진 자료에 적합한 의사결정나무 알고리즘을 적용하여야 한다. 그러나 대표적인 의사결정나무 알고리즘들은 반응변수가 일변량인 경우에 주로 사용되어, 다변량 반응변수의 다양한 형태에 대한 의사결정나무분석을 수행하는데 한계가 있다.
본 논문은 범주형과 연속형 변수가 혼합된 다변량 반응변수인 경우에 대한 새로운 알고리즘을 제안한다. 제안된 알고리즘을 R 소프트웨어를 이용하여 모의실험한 후, 이 결과를 바탕으로 다변량 의사결정나무가 보다 개선되었는지 비교 연구한다. 또한 새로운 알고리즘이 실제자료에도 잘 적용되고 있음을 보여준다.|In many fields, decision trees can be used to classify and predict the responses of data. There are many tree methods for univariate responses, such as CHAID, CART and QUSET. Recently, researches based on these methods like Mahalanobis distance and Generalized Entropy Index for multivariate responses have also been studied. But these algorithms are limited to be applied to mixed multivariate responses.
In this thesis, we modify previous multivariate decision trees and suggest new splitting criterions using Mahalanobis distance and Gower's Similarity coefficient for any type of mixed responses. To compare the performance of proposed trees, simulation studies on two new splitting criterions using Mahalanobis distance and Gower's Similarity coefficient are performed. Finally, an application using the data of Korean credit card company is illustrated.
Author(s)
이주현
Issued Date
2008
Awarded Date
2008-08
Type
Dissertation
URI
https://repository.sungshin.ac.kr/handle/2025.oak/3998
http://210.125.93.15/jsp/common/DcLoOrgPer.jsp?sItemId=000000005435
Alternative Author(s)
Lee, Ju-hyun
Affiliation
성신여자대학교 대학원
Department
일반대학원 통계학과
Advisor
이성건
Table Of Contents
제1장 서론 = 1
제2장 의사결정나무 = 3
2.1 일변량의사결정나무 = 3
2.1.1 CHAID알고리즘 = 3
2.1.2 CART알고리즘 = 6
2.2 다변량의사결정나무 = 8
2.2.1 마할라노비스거리(Mahalanobis distance) = 8
2.2.2 엔트로피지수(Generalized Entropy Index) = 9
제3장 혼합반응에대한다변량의사결정나무 = 11
3.1 마할라노비스 거리를 이용한 의사결정나무 = 11
3.2 Gower의 상사성 계수를 이용한 의사결정나무 = 13
제4장 모의실험및적용 = 16
4.1 분리기준에대한모의실험 = 16
4.2 실제자료의적용 = 25
4.2.1 자료소개 = 25
4.2.2 일변량의사결정나무분석결과 = 26
4.2.3 다변량의사결정나무분석결과 = 31
제5장 결론및향후연구과제 = 36
참고문헌 = 37
ABSTRACT = 38
부록 = 39
Degree
Master
Publisher
성신여자대학교 대학원
Appears in Collections:
통계학과 > 학위논문
공개 및 라이선스
  • 공개 구분공개
  • 엠바고2008-09-19
파일 목록

Items in Repository are protected by copyright, with all rights reserved, unless otherwise indicated.