SAS/AF를 이용한 통계적 데이터 결합 시스템에 관한 연구
- Alternative Title
- A Study on Statistical Matching System using SAS/AF
- Abstract
- In data analyzing, the availability of data is a very important factor. Generally, analysis data could come from single or various sources, which would be similar or not. In fact, it is rare that a single data set will hold all that we need to answer the question facing. Therefore a key issue is an ability to deal with conflicting data. It is necessary to match the data from various sources for assembling the meaningful information.
As a method of the matching, statistical matching is used for the production of a comprehensive data files from data in various sources. However, it is difficult for non-experts to use statistical data matching techniques because the techniques need statistical knowledge and programing abilities.
This thesis has introduced an overview of statistical matching and developed a statistical data matching system by using SAS/AF and SCL. Finally we have applied the system to the "2006 city family survey of Korea".|최근 정보화 사회의 발전과 더불어 서로 다른 원천과 경로로부터 얻어지 는 많은 양의 자료들 속에서 의미 있는 정보를 찾고자하는 방법들이 연구되 어 왔다. 그 하나의 방법으로 원천이 서로 다른 데이터들을 통계적으로 결 합하여 의미 있는 정보를 얻을 수 있는“통계적 자료 결합 방법(statistical data matching)”이 제안되고 있다. 통계적 자료결합의 방법으로는 유클리 드 거리 혹은 마할라노비스 거리를 이용하는 ‘최근접이웃(nearest neighbor)’방법과, 회귀분석을 이용하는 방법, 성향점수(propensity score)를 이용하는 방법 등이 있다. 이러한 통계적 자료 결합 방법은 결합 하고자 하는 자료의 특성과 상황에 따라 적절히 사용되어야 한다.
본 연구에서는 기존에 제안되어 있는 통계적 결합 방법론들을 전문지식이 없는 연구자들도 쉽게 사용할 수 있도록 통계적 결합 시스템을 구축하였다. 구축 방법은 SAS 소프트웨어에서 제공되는 기능을 이용하였다. SAS 제품 중 응용프로그램을 개발할 수 있도록 지원하는 SAS/AF (Application Frame) 와 SCL(Screen Control Language)를 이용하여 두 개의 파일을 통계적 방법으로 의미 있게 결합하는 통계적 결합 시스템 “SDMS (Statistical Data Matching System)”를 구축한다. 개발된 시스템으로 통 계청의 2007년 서울 도시가계조사 자료에 적용하여 결합을 수행해 보고 그 결과를 비교한다.
- Author(s)
- 김희라
- Issued Date
- 2008
- Awarded Date
- 2008-02
- Type
- Dissertation
- URI
- https://repository.sungshin.ac.kr/handle/2025.oak/1843
http://210.125.93.15/jsp/common/DcLoOrgPer.jsp?sItemId=000000005224
- Alternative Author(s)
- Kim, Hee-ra
- Affiliation
- 성신여자대학교 대학원
- Department
- 일반대학원 통계학과
- Advisor
- 이성건
- Table Of Contents
- 제1장 서론 = 1
제2장 통계적 결합 = 3
2.1 통계적 결합의 의미 = 3
2.2 결측치 대입과 통계적 결합의 비교 = 4
2.3 제약이 있는 결합과 제약이 없는 결합 = 6
2.4 통계적 결합의 타당성 = 6
제3장 통계적 결합의 방법 = 8
3.1 최근접이웃(nearest neighbor) 방법 = 8
3.2 성향점수(propensity score)를 이용한 방법 = 9
3.3 회귀분석(regression)을 이용한 방법 = 12
제4장 SAS/AF 와 SCL을 통한 시스템 개발 = 13
4.1 SAS/AF 및 SCL 소개 = 13
4.2 시스템 소개 = 14
4.3 시스템을 이용한 사례분석 = 18
4.3.1 자료소개 및 결합절차 = 18
4.3.2 시스템을 이용한 결합절차 = 19
4.4 결합 결과 비교 = 26
제5장 결론 및 향후 연구과제 = 30
참고문헌 = 37
ABSTRACT = 38
부록 = 39
- Degree
- Master
- Publisher
- 성신여자대학교 대학원
-
Appears in Collections:
- 통계학과 > 학위논문
- 공개 및 라이선스
-
- 파일 목록
-
Items in Repository are protected by copyright, with all rights reserved, unless otherwise indicated.