作者投稿和查稿 主编审稿 专家审稿 编委审稿 远程编辑

计算机工程 ›› 2010, Vol. 36 ›› Issue (18): 49-51. doi: 10.3969/j.issn.1000-3428.2010.18.018

• 软件技术与数据库 • 上一篇    下一篇

数据流上的频繁闭项集挖掘算法

陶 克,王意洁   

  1. (国防科技大学计算机学院并行与分布处理国家重点实验室,长沙 410073)
  • 出版日期:2010-09-20 发布日期:2010-09-30
  • 作者简介:陶 克(1988-),男,硕士研究生,主研方向:数据流处理;王意洁,教授、博士生导师
  • 基金资助:
    国家自然科学基金资助项目(60873215, 60621003);国家“973”计划基金资助项目(2005CB321801);高等学校博士学科点专项科研基金资助项目(200899980003);高等学校全国优秀博士学位论文作者专项基金资助项目(200141)

Algorithm of Mining Frequent Closed Itemsets on Data Streams

TAO Ke, WANG Yi-jie   

  1. (National Key Laboratory for Parallel and Distributed Processing, School of Computer, National University of Defense Technology, Changsha 410073, China)
  • Online:2010-09-20 Published:2010-09-30

摘要: 针对频繁闭项集挖掘算法中数据结构与处理机制复杂的问题,提出窗口快速滑动的数据流频繁闭项集挖掘算法——MFWSR。算法通过采用紧致的数据结构和简化的判断过程提高时空效率,支持响应不同用户支持度阈值的查询。实验结果表明,在保持已有算法精度的情况下,MFWSR具有更高的时空效率。

关键词: 数据流, 数据挖掘, 频繁闭项集

Abstract: This paper proposes an algorithm of Mining Frequent closed itemsets with Window Sliding Rapidly(MFWSR) against the complexity of data structure and process for determination. With the data stream represented by compact data structure, process for determination simplified, MFWSR improves the temporal and spatial efficiency while it can response to the requests of user-specified support threshold. Experimental results show that compared with existing algorithms, MFWSR achieves higher temporary and spatial efficiency while the accuracy remains.

Key words: data stream, data mining, frequent closed itemsets

中图分类号: