Nonparametric logistic regression based on sparse triangulation over a compact domain
- Alternative Title
- 컴팩트 도메인의 희소 삼각분할 기반 비모수 로지스틱 회귀 모형
- Abstract
- 본 연구는 R2의 컴팩트 도메인의 희소 삼각분할을 기반으로 한 로지스틱 회귀 모형을 연구하여 삼각화 모델을 로지스틱 회귀 모형으로 확장하고 있습니다. 다수의 꼭짓점으로 인해 유발되는 잠재적 불안정성으로 설명변수와 반응변수 간의 복잡한 관계를 효과적으로 모델링하는 데 어려움이 있습니다. 이 문제를 해결하기 위해, RDP(Ramer-Douglas-Peucker) 알고리즘을 기반으로 삼각분할의 바깥쪽 경계 꼭짓점에 희소성을 도입하고, K-means알고리즘을이용하여데이터에맞게적응적으로삼각분할의내부꼭짓점을선택하는초기삼각화전략을제안합니다.제안된방법을구현하기위해2차좌표별 하강알고리즘을채택하였습니다.합성데이터와손글씨숫자데이터LeCun et al. (1989)를 사용하여 제안된 알고리즘의 안정성 검증 및 성능을 평가하였습니다. 결과는 직사각형 형태가 아닌 데이터 도메인 또는 복잡한 데이터 도메인을 다룰 때 기존 방법들에 비해 제안한 방법론의 장점을 입증하였습니다.|Based on the investigation of logistic regression models utilizing sparse triangulation within a compact domain in R2, this study addresses the limited research extending the triogram model to logistic regression. A primary challenge arises from the potential instability induced by a large number of vertices, hindering the effective modeling of complex relationships. To mitigate this challenge, we propose introducing sparsity to boundary vertices of the triangulation based on the Ramer-Douglas-Peucker algorithm and employing the K-means algorithm for adaptive vertex initialization. A second order coordinate-wise descent algorithm is adopted to implement the proposed method. Validation of the proposed algorithm’s stability and performance assessment are conducted using synthetic and handwritten digit data (LeCun et al., 1989). Results demonstrate the advantages of our method over existing methodologies, particularly when dealing with non-rectangular data domains.
- Author(s)
- 김서연
- Issued Date
- 2025
- Awarded Date
- 2025-02
- Type
- Dissertation
- URI
- https://repository.sungshin.ac.kr/handle/2025.oak/1744
http://dcollection.sungshin.ac.kr/common/orgView/000000015220
- Affiliation
- 성신여자대학교 일반대학원
- Department
- 일반대학원 통계학과
- Advisor
- 박관영
- Table Of Contents
- I. Introduction 1
II. Background and problem set-up 5
2.1. Preliminaries 5
2.2. Model and estimator 8
III. Implementation scheme 11
3.1. Coordinate descent algorithm 11
3.2. Initial triangulation with Ramer-Douglas-Peucker and K-means algorithm 13
3.3. Selection of interior centrioids with K-means algorithm 14
IV. Numerical studies 17
4.1. Simulation study 17
4.2. Digit data analysis 19
V. Conclusion 23
- Degree
- Master
- Publisher
- 성신여자대학교 일반대학원
-
Appears in Collections:
- 통계학과 > 학위논문
- 공개 및 라이선스
-
- 파일 목록
-
Items in Repository are protected by copyright, with all rights reserved, unless otherwise indicated.