作者投稿和查稿 主编审稿 专家审稿 编委审稿 远程编辑

计算机工程 ›› 2010, Vol. 36 ›› Issue (23): 28-30. doi: 10.3969/j.issn.1000-3428.2010.23.010

• 软件技术与数据库 • 上一篇    下一篇

Eclat算法的分析及改进

张玉芳,熊忠阳,耿晓斐,陈剑敏   

  1. (重庆大学计算机学院, 重庆 400030)
  • 出版日期:2010-12-05 发布日期:2010-12-14
  • 作者简介:张玉芳(1965-),女, 副教授、博士,主研方向:数据挖掘,远程教育;熊忠阳,教授;耿晓斐,硕士;陈剑敏,博士研究生
  • 基金资助:
    教育部留学回国人员基金资助项目(教外司留[2007]110810);中国博士后科学基金资助项目(20070420711)

Analysis and Improvement of Eclat Algorithm

ZHANG Yufang,XIONG Zhongyang,GENG Xiaofei,CHEN Jianmin   

  1. (College of Computer Science, Chongqing University, Chongqing 400030, China)
  • Online:2010-12-05 Published:2010-12-14

摘要: 关联规则算法中的数据通常采用水平数据形式,而采用垂直数据表示的挖掘性能优于水平表示。Eclat算法在项集规模庞大时,交集操作消耗大量时间和系统内存。为此,结合划分思想和突出基于概率的先验约束方法,把数据库中的事务划分成多个非重叠部分,对每一部分采用Eclat算法,减少每次“交”操作时项集的规模,从而减少比较次数。通过基于概率的先验约束,减少产生的局部频繁项集数。实验结果表明,改进算法比原算法具有更高的效率。

关键词: 关联规则, Eclat算法, 划分, 概率先验

Abstract: Although level transaction database is adopted in present association rules mining algorithms, plump transaction database has advantage over level transaction database. While Eclat algorithm shows when the Tidsets are very large, this step consumes a lot of time and memories. Contra posed this fault, a new improvement algorithm——Declat is presented. The algorithm applies the method of division to Eclat, reduces the Tidset’s quantity when operate intersects; proposes a priority constraint, reduces the local frequent itemsets’ quantity. Experimental result shows that the improved algorithm has ligher efficiency than the Eclat algorithm.

Key words: association rules, Eclat algorithm, division, probability priority

中图分类号: