作者投稿和查稿 主编审稿 专家审稿 编委审稿 远程编辑

计算机工程 ›› 2012, Vol. 38 ›› Issue (04): 73-75. doi: 10.3969/j.issn.1000-3428.2012.04.024

• 软件技术与数据库 • 上一篇    下一篇

项约束先过滤的最大频繁项集挖掘算法

姚全珠,李如琼,王美君   

  1. (西安理工大学计算机科学与工程学院,西安 710048)
  • 收稿日期:2011-08-01 出版日期:2012-02-20 发布日期:2012-02-20
  • 作者简介:姚全珠(1960-),男,教授、博士,主研方向:数据库技术,自然语言处理,数据挖掘;李如琼、王美君,硕士研究生

Mining Algorithm of Maximal Frequent Itemset with Item Constraint Filtering First

YAO Quan-zhu, LI Ru-qiong, WANG Mei-jun   

  1. (School of Computer Science & Engineering, Xi’an University of Technology, Xi’an 710048, China)
  • Received:2011-08-01 Online:2012-02-20 Published:2012-02-20

摘要: 在稠密型数据库中,现有最大频繁项集挖掘算法效率低、耗时长,挖掘结果模糊,不利于用户使用。为此,提出一种项约束先过滤的最大频繁项集挖掘算法——VCM。利用项包含约束过滤数据库,使用垂直数据表示数据集,采用深度优先的挖掘策略对数据库进行最大频繁相集的挖掘。实验结果表明,该算法快速有效,尤其在挖掘具有长模式的稠密数据库时优势明显。

关键词: 关联规则, 最大频繁项集, 项约束, 垂直数据格式, 深度优先, 稠密数据库

Abstract: In the dense database, mining maximal frequent itemsets takes too much time, and the results are too large to satisfy the users. This paper proposes a maximal frequent itemsets mining algorithm, called VCM. It filters the database with the constraints, uses the vertical data representation of data sets and adopts depth-first strategy for mining maximum frequent itemsets. Compared with other algorithms, experimental results show that the VCM algorithm is faster and more effective, and the advantage is remarkable when the databases are dense and with long patterns.

Key words: association rule, maximal frequent itemset, item constraint, vertical data format, depth-first, dense database

中图分类号: