OAK

이수된 교양과목 데이터에서 연관성 및 순서 발견

Metadata Downloads
Alternative Title
Mining association rules and sequences from a database of liberal arts
Abstract
데이터 마이닝은 "데이터로부터 평범하지 않은 무엇을 발췌하는 것으로 이는 함축적이며 이전에 알려지지 않고 잠정적으로 유용한 정보이다. "라고 정의되고 있다. 업무의 상당부분을 일상적으로 데이터 마이닝에 의존하고 있는 회사들은 마켓팅, 은행 및 금융, 원격통신, 공학 등 여러 분야이다. 본 논문에서는 대학에서 학생들이 이수한 과목에 관한 데이터베이스 시스템 분야를 데이터 마이닝에 적용하였다. 한 학생이 대학졸업을 위해 학점을 이수하고자 하면, 교양과목부분에서 필수 학점 이상을 이수해야 한다. 이런 점을 착안하여 데이터데이스의 트랜잭션으로 한 학생이 졸업 때까지 이수한 교양과목을 한 트랜잭션으로 간주하였다. 각 교양과목은 연관 규칙 탐사를 위한 트랜잭션의 항목으로 대응되며, 학생들이 이수해야하는 교육과정이 소개된 대학 안내 책자에 따른 교양과목에 관한 taxonomy(is-α hierarchy 구조를 갖음)가 주어진다.
성신여자대학교에서 1995년부터 2001년까지 학생들이 이수한 교양과목에 관한 데이터베이스로부터 연관 규칙 탐사와 순차패턴에 대하여 연구하였다. 데이터베이스와 taxonomy로부터 "몇몇 학생들은 교양과목에서 A 과정을 수강하면 B 과정을 수강하는 경향이 있다" 라는 규칙을 발견할 수 있었다. 그리고 졸업까지 8학기동안 이수하는 과목들을 순차적으로 추정할 수 있었다. 또한 대학에서 학생들의 이수과목들에 관한 데이터베이스로부터 taxonomy 를 포함하는 연관 규칙 탐사와 순차 패턴들을 발견하는 마이닝 시스템으로 발전시켰다.|Data mining has been defined as "the nontrivial extraction of implicit, previously unknown, and potentially useful information from data". The industries that rely daily on data mining for a number of their functions include marketing, banking and financial industry, telecommunications, and engineering, among others. In this thesis, we applied the data mining to the field of database systems for students' credits at a university. When a student takes credits to graduate from a university, the student should earn the required credits in liberal arts. In this situation, we can consider a series of liberal arts for graduation of one student as a transaction of a database. Each liberal arts corresponds to an item of a transaction for mining association rules, and a taxonomy (is-α hierarchy) on the liberal arts is given according to the course registration book of the university for students to take courses for their credits.
We have studied about mining association rules and sequential patterns from a such database of liberal arts in which students earned at the Sungshin Women's University between 1995 and 2001. From the database and taxonomy, we can find a rule that "some students who take course A tend to take course B in liberal arts". And we can infer which subjects are sequentially registered during 8 semesters to graduate. We have developed a mining system that finds generalized association rules with a taxonomy and sequential patterns from a database of students' credits at the university.
Author(s)
김경희.
Issued Date
2002
Type
Dissertation
URI
https://repository.sungshin.ac.kr/handle/2025.oak/5490
http://210.125.93.15/jsp/common/DcLoOrgPer.jsp?sItemId=000000001358
Affiliation
성신여자대학교 교육대학원
Department
교육학과 전자계산교육
Table Of Contents
논문개요 = Ⅰ
목차 = ⅰ
Ⅰ. 서론 = 1
Ⅱ. 관련 연구 = 3
1. 연관 규칙 탐사(Association Rule Mining) = 3
1) 연관 규칙의 정의 = 3
2) Apriori 알고리즘 = 4
2. 일반화된 연관 규칙 탐사 ( Mining Generalized Association Rules) = 6
1) 일반화된 연관 규칙의 정의 = 6
2) Cumulate 알고리즘 = 8
3. 순차 패턴 탐사 (Sequntial Patterns Mining) = 9
1) 순차 패턴의 정의 = 9
2) SPADE 알고리즘 = 9
Ⅲ. 실제 데이터를 이용한 연관성과 순서 발견 과정 = 11
1. 이수 교양과목 데이터 분석 = 11
1) 교양과목 데이터 분석 = 11
3) 교양과목에 관한 Taxonomy 구성 = 14
2. Taxonomy를 포함하는 전처리 과정 = 16
1) 데이터 정제 = 17
2) 정렬 및 학생 트랜잭션 식별자 부여 = 19
3) 정렬 및 과목코드 항목 식별자 부여 = 20
4) 입력 트랜잭션 파일로 데이터 정렬 = 20
3. 이수 교양과목에 대한 연?? 규칙 탐사 실험 = 21
1) 연관 규칙 탐사 실험 = 22
2) 일반화된 연관 규칙 탐사 실험 = 23
4. 이수 교양과목에 대한 순차 패턴 탐사 실험 = 26
Ⅳ. 결과 분석 = 27
1. 이수 교양과목에 관한 일반화된 연관 규칙 탐사 = 27
1) Taxonomy를 적용하지 않은 경우 = 27
2) 학계 Taxonomy를 적용하였을 경우 = 30
3) 개설과 Taxonomy를 적용하였을 경우 = 32
3) 단과대 Taxonomy를 적용하였을 경우 = 34
2. 이수 교양과목에 관한 순차 패턴 탐사 = 35
Ⅴ. 결론 및 향후 과제 = 37
참고문헌 = 39
ABSTRACT = 43
Degree
Master
Publisher
성신여자대학교 교육대학원
Appears in Collections:
교육대학원 > 학위논문
공개 및 라이선스
  • 공개 구분공개
  • 엠바고2005-11-01
파일 목록
  • 관련 파일이 존재하지 않습니다.

Items in Repository are protected by copyright, with all rights reserved, unless otherwise indicated.