作者投稿和查稿 主编审稿 专家审稿 编委审稿 远程编辑

计算机工程 ›› 2012, Vol. 38 ›› Issue (21): 45-48. doi: 10.3969/j.issn.1000-3428.2012.21.012

• 软件技术与数据库 • 上一篇    下一篇

数据流上的最大频繁项集挖掘方法

李海峰,章 宁   

  1. (中央财经大学信息学院,北京 100081)
  • 收稿日期:2011-11-23 出版日期:2012-11-05 发布日期:2012-11-02
  • 作者简介:李海峰(1979-),男,讲师、CCF会员,主研方向:数据挖掘,商务智能;章 宁,教授
  • 基金资助:
    国家自然科学基金资助项目(61100112);中央财经大学科研创新团队支持计划基金资助项目

Maximal Frequent Itemsets Mining Method over Data Stream

LI Hai-feng, ZHANG Ning   

  1. (School of Information, Central University of Finance and Economics, Beijing 100081, China)
  • Received:2011-11-23 Online:2012-11-05 Published:2012-11-02

摘要: 最大频繁项集适用于内存空间有限的数据流挖掘。为此,提出一种基于界碑模型的最大频繁项集挖掘方法,采用最大频繁项集树的数据结构,增量式地维护最大频繁项集与部分附属信息,实现项集的快速搜索和裁剪。在MUSHROOM和BMS-POS数据集上的实验结果表明,该方法具有较高的挖掘效率。

关键词: 界碑模型, 最大频繁项集, 数据挖掘, 数据流, 滑动窗口

Abstract: Maximal frequent itemsets is suitable for stream mining, which store most of the information contained in frequent itemsets using less space. This paper focuses on mining maximal frequent itemsets incrementally over streams under landmark model. It designs a simple and compacted data structure to effectively maintain a dynamically selected set of itemsets for quickly node search and pruning. Experimental results on the MUSHROOM and BMS-POS datasets show that this method has higher mining efficiency.

Key words: landmark model, maximal frequent itemsets, data mining, data stream, sliding window

中图分类号: