앙상블(ensemble) 기법을 이용한 일반화가법모형(GAM) 연구
- Alternative Title
- A Study on the Generalized Additive Models Using Ensemble Methods
- Abstract
- 통계학에서 주로 사용되는 일반화선형모형(Generalized Linear Model; GLM)은 변수 간 인과관계를 설명하는데 좋은 도구로서 많이 이용된다. 그러나 많은 현실 문제에서는 선형가정으로 설명될 수 없는 비선형 효과들이 존재한다. 이러한 비선형 효과를 효율적으로 설명할 수 있는 방법론으로 일반화가법모형이 이용된다. 일반화가법모형(Generalized Additive Models; GAM)에서 평활함수를 사용하여 비선형 효과를 확인할 수 있으며, 이 평활함수(smoothing function)의 추정은 로컬스코어링 알고리즘(local scoring algorithm)을 통해서 이루어진다.
한편, 자료에 대한 예측에서 배깅(bagging), 랜덤포레스트(random forest) 등의 앙상블 예측 기법이 단일 예측보다 더 좋은 성능을 가질 수 있음이 많은 연구를 통해 증명되었다. 앙상블 기법은 붓스트랩 표본에서 단일 예측자를 결합하여 변동이 작고 예측력이 좋은 결합 예측자를 구하는 것이다.
이항 반응변수에서 일반화가법모형을 단일 분류자로 하는 앙상블 분류자는 De Bock(2010)에 의해 제안되었으며, 또한 이 앙상블 분류자가 단일 분류자나 다른 앙상블 분류자보다 더 좋은 수행능력을 보이는 것을 추후 연구를 통해 증명하였다(De Bock & Van den Poel, 2012).
본 논문에서는 연속형 반응변수에서의 일반화가법모형을 단일 예측자로 하는 앙상블 기법을 제안하고자 한다. 또한 모의실험과 국내 요양보험자료를 통해 제안한 앙상블 기법의 우수성을 확인하고자 하였다.
- Author(s)
- 김하나
- Issued Date
- 2013
- Awarded Date
- 2013-02
- Type
- Dissertation
- URI
- https://repository.sungshin.ac.kr/handle/2025.oak/4743
http://dcollection.sungshin.ac.kr/jsp/common/DcLoOrgPer.jsp?sItemId=000000007499
- Alternative Author(s)
- KIM, HANA
- Affiliation
- 성신여자대학교 일반대학원
- Department
- 일반대학원 통계학과
- Advisor
- 이성건
- Table Of Contents
- 논문개요
제 1 장 서 론 1
제 2 장 일반화가법모형 3
2.1. 소개 3
2.1.1. 가법모형의 적합 5
(1) 평활스플라인(smoothing spline) 5
(2) 백피팅 알고리즘(backfitting algorithm) 7
(3) 로컬 스코어링 알고리즘(local scoring algorithm) 10
2.1.2. 평활함수(smoothing function) 12
2.2. 결합 예측 방법론 17
2.2.1. 소개 17
2.2.2. 배깅, 랜덤포레스트 17
2.2.3. 앙상블 기법을 이용한 일반화가법모형 21
(1) 이항 반응변수 22
(2) 연속형 반응변수 23
제 3 장 모의실험 및 실제자료의 적용 26
3.1. 모의실험설계 26
3.2. 적용결과 및 해석 39
3.3. 실제자료의 적용 53
제 4 장 결론 57
참고문헌
ABSTRACT
- Degree
- Master
- Publisher
- 성신여자대학교 대학원
-
Appears in Collections:
- 통계학과 > 학위논문
- 공개 및 라이선스
-
- 파일 목록
-
Items in Repository are protected by copyright, with all rights reserved, unless otherwise indicated.