OAK

연관규칙에서의 Interesting rules 탐사를 위한 측정방법 연구

Metadata Downloads
Alternative Title
Interestingness measures for mining association rules
Abstract
데이터 마이닝이란 대용량의 데이터베이스로부터 숨겨져 있는 규칙적인 패턴이나 유용한 정보를 추출하는 방법론을 의미한다. 데이터 마이닝의 중요한 분야 중 하나인 연관 규칙 탐사는 그 동안 많은 연구가 이루어져왔다. 연관 규칙 탐사란 데이터베이스에서 항목들 간의 상관성을 찾아내는 것을 말한다. 항목들간의 상관성을 찾아내기 위해 일반적으로 지지도와 신뢰도를 사용한다. 사용자가 정한 최소 지지도와 최소 신뢰도 이상의 값을 가지는 연관규칙을 탐사하는 것이다. 하지만 이 지지도와 신뢰도만으로 연관규칙을 탐사하게 되면 매우 많은 규칙들이 생성될 뿐만 아니라 발견된 규칙?湧? 모두 유용한 정보를 지닌 규칙들은 아니다. 따라서 보다 연관성있고 유용한 정보를 지닌 규칙을 탐사하기 위해 여러 측정방법들이 연구발표 되었다.
본 논문에서는 기존에 발표된 여러 측정방법들을 연구하고 그들을 활용하여 연관규칙내에서 보다 흥미로운 규칙을 찾는 방법을 제시하였다.|Data mining is to extract frequent patterns or useful information from large databases. There are many works on mining association rules, where mining association rules is one of important techniques in data mining. An association rule represents correlation between the one itemset and another itemset in a database. The usual measures to assess association rules are support and confidence.
However, several authors have pointed out some drawbacks of the support and confidence framework. And, as a result of mining association rules, a user can get so many rules, which makes the user difficult to decide whether which rule is interesting or not.
Several authors have proposed alternatives to confidence. We briefly describe some of them.
In this paper, we present a method to assess association rules in order to avoid to obtain misleading rules with collective strength, certainty factor, piatetsky-shapiro, interest, add value, .
Author(s)
양민정.
Issued Date
2002
Type
Dissertation
URI
https://repository.sungshin.ac.kr/handle/2025.oak/4915
http://210.125.93.15/jsp/common/DcLoOrgPer.jsp?sItemId=000000001978
Affiliation
성신여자대학교 대학원
Department
전산학과
Table Of Contents
논문개요 = ⅰ
목차 = ⅴ
Ⅰ. 서론 = 1
Ⅱ. 관련 연구 = 3
1. 연관 규칙 탐사 = 3
1) 연관 규칙의 정의 = 3
2. Interestingness measures = 5
1) collective strength = 5
2) Interest = 7
3) Piatetsky-Shapiro = 9
4) Certainty Factor = 10
5) Added value = 12
Ⅲ. 흥미로운 규칙 탐색을 위한 측정 방법 연구 = 14
1. 지지도와 신뢰도를 이용한 연관규칙 탐색 = 14
1) 지지도와 신뢰도의 문제점 = 14
2. 5가지의 측정방법을 이용한 연관규칙 탐색 = 18
1) X와 Y의 지지도 차이가 30% 이하인 규칙 = 18
2) 여러 측정방법을 이용한 전략 = 24
Ⅳ. 실험 결과 = 29
1. 실험 데이터 = 29
2. 실험 결과 = 29
1) 교양과목 데이터에 적용한 측정결과 = 29
2) 웹 로그 데이터에 적용한 측정결과 = 33
Ⅴ. 결론 및 향후 과제 = 36
참고문헌 = 37
ABSTRACT = 42
Degree
Master
Publisher
성신여자대학교 대학원
Appears in Collections:
전산학과 > 학위논문
공개 및 라이선스
  • 공개 구분공개
  • 엠바고2005-11-01
파일 목록
  • 관련 파일이 존재하지 않습니다.

Items in Repository are protected by copyright, with all rights reserved, unless otherwise indicated.