비모수 검정통계량을 이용한 회귀나무 분리기준 모의실험연구
- Abstract
- 최근 대규모의 빅데이터를 이용한 알고리즘(algorithm) 기반의 기계학습(machine learning) 방법론이 각광받고 있으며 의사결정나무는 그 대표적인 방법론 중 하나이다. 특히 Random Forest, XGBoost 등 의사결정나무 기반의 Ensemble 방법론에 대한 많은 연구들이 제시되고 있으며, 이러한 방법론은 대용량의 데이터에서 우수한 성능을 보이지만, 작은 소표본의 데이터에서는 적합하지 않다. 소규모 데이터에 대해서 재표본(re-sampling) 방법론은 기저 분포에 대한 정보를 효과적으로 주지는 못하는 것이다. 다양한 현실의 문제에서는 많은 소표본의 상황이 존재하지만 이에 대한 효율적 의사결정나무 방법론은 많지 않다. 본 연구에서는 소규모 데이터에 대한 회귀나무(regression tree)의 구축에 대해서 검토하였다. 특히, 회귀나무의 구성에서 가장 중요한 분리변수(split variable) 탐색에 통계적 비모수 검정법(non-parametric test)을 적용하였으며, Lepage 검정통계량, Cucconi 검정통계량, PG 검정통계량 등을 고려하였다. 모의실험을 통한 비교 결과, 소규모 데이터일 경우, 비모수적 위치-척도 검정법을 이용한 의사결정나무가 우수한 성능을 보이고 있음을 확인할 수 있었다.
- Author(s)
- 이성건
- Issued Date
- 2025-02-28
- Type
- Article
- Keyword
- 통계계산/그래픽스
- DOI
- 10.37727/jkdas.2025.27.1.117
- URI
- http://repository.sungshin.ac.kr/handle/2025.oak/8669
- 공개 및 라이선스
-
- 파일 목록
-
Items in Repository are protected by copyright, with all rights reserved, unless otherwise indicated.