界标窗口中数据流频繁模式挖掘算法研究

doi:10.3969/j.issn.1000-3428.2012.01.014

计算机工程 ›› 2012, Vol. 38 ›› Issue (01): 55-58,61. doi: 10.3969/j.issn.1000-3428.2012.01.014

界标窗口中数据流频繁模式挖掘算法研究

张广路¹，雷景生²，吴兴惠¹

(1. 海南师范大学数学与统计学院，海口 571158；2. 南京邮电大学计算机学院，南京 210046)

收稿日期:2011-06-28 出版日期:2012-01-05 发布日期:2012-01-05
作者简介:张广路(1978－)，女，讲师，主研方向：数据库技术，数据挖掘，模糊信息系统；雷景生，教授、博士；吴兴惠，讲师、硕士
基金资助:
海南省自然科学基金资助项目(610221, 109002, 808155)；海南师范大学青年科研基金资助项目(QN0923)

Research on Data Stream Frequent Pattern Mining Algorithm in Landmark Window

ZHANG Guang-lu ¹, LEI Jing-sheng ², WU Xing-hui ¹

(1. School of Mathematics and Statistics, Hainan Normal University, Haikou 571158, China; 2. School of Computer Science & Technology, Nanjing University of Posts and Telecommunications, Nanjing 210046, China)

Received:2011-06-28 Online:2012-01-05 Published:2012-01-05

摘要/Abstract

摘要： 数据流的流量太大会无法被整个存储，或被多次扫描。为此，在研究已有挖掘算法的基础上，提出一种界标窗口中数据流频繁模式挖掘算法DSMFP_LW。利用扩展前缀模式树存储全局临界频繁模式，实现单遍扫描数据流和数据增量更新。实验结果表明，与Lossy Counting算法相比，DSMFP_LW算法具有更好的时空效率。

关键词: 界标窗口, 频繁模式, 数据流, DSMFP_LW算法, 滑动窗口

Abstract: For data traffic flow is too large to store the entire data stream or on its scan times and other issues, through the research of algorithms on mining frequent patterns that are proposed, this paper proposes an algorithm on mining frequent patterns over data stream based on Landmark window, named DSMFP_LW. DSMFP_LW has major features as follows: namely single streaming data scan for counting pattern’s information, extended prefix-tree-based compact pattern representation, and incremental update of data. Experimental results show that DSMFP_LW algorithm has better utilization of time and space efficiency. In addition, it outperforms the well-known algorithm Lossy Counting in the same streaming environment.

Key words: landmark window, frequent pattern, data stream, DSMFP_LW algorithm, sliding window

中图分类号:

TP311.13

张广路, 雷景生, 吴兴惠. 界标窗口中数据流频繁模式挖掘算法研究[J]. 计算机工程, 2012, 38(01): 55-58,61.

ZHANG An-Lu, LEI Jing-Sheng, TUN Xin-Hui. Research on Data Stream Frequent Pattern Mining Algorithm in Landmark Window[J]. Computer Engineering, 2012, 38(01): 55-58,61.

http://www.ecice06.com/CN/Y2012/V38/I01/55

[1]	高峰, 姚光涛, 顾进广. 基于改进多嵌入空间的实时语义数据流推理[J]. 计算机工程, 2022, 48(2): 55-64.
[2]	尤文珠, 葛海波. 利用多基数系统的高效椭圆曲线多标量乘算法[J]. 计算机工程, 2021, 47(2): 182-187.
[3]	郭渝洛, 边浩东, 董润婷, 唐嘉豪, 王晓英, 黄建强. 基于SIMD的并行傅里叶空间图像相似度计算[J]. 计算机工程, 2021, 47(11): 247-253.
[4]	殷佳豪, 刘世杰, 鲍宇, 杨轩, 朱紫维. 基于一维卷积神经网络的实时心脏按压评估[J]. 计算机工程, 2020, 46(5): 298-304,311.
[5]	周胜, 刘三民. 基于动态策略的多源迁移学习数据流分类研究[J]. 计算机工程, 2020, 46(5): 139-143,149.
[6]	王齐童, 王鹏, 赵郁亮, 汪卫. 一种高效的移动对象伴随模式挖掘算法[J]. 计算机工程, 2020, 46(4): 97-106,122.
[7]	徐玲, 乔建忠, 林树宽, 祁瑞华. 志愿计算中基于贝叶斯定理的信任模型[J]. 计算机工程, 2020, 46(4): 129-134.
[8]	张传伟, 曾虹钧, 杨萌月, 李波, 陈尚瑞. 基于多分辨率滤波通道的多尺度行人检测[J]. 计算机工程, 2020, 46(2): 235-241.
[9]	毛亚琼, 田立勤, 王艳, 毛亚萍, 王志刚. 引入局部向量点积密度的数据流离群点快速检测算法[J]. 计算机工程, 2020, 46(11): 132-138,147.
[10]	杜诗语, 韩萌, 申明尧, 张春砚, 孙蕊. 概念漂移数据流集成分类算法综述[J]. 计算机工程, 2020, 46(1): 15-24,30.
[11]	蒋华,张红福,罗一迪,王鑫. 基于KL距离的自适应阈值网络流量异常检测[J]. 计算机工程, 2019, 45(4): 108-113,118.
[12]	高权,万晓冬. 基于负载均衡的并行FP-Growth算法[J]. 计算机工程, 2019, 45(3): 32-35,40.
[13]	曹浩哲,张鹏,卢暾,顾寒苏,顾宁. 基于传感器距离的实时用户活动识别建模方法[J]. 计算机工程, 2019, 45(2): 1-6.
[14]	高嘉伟,刘建敏. 一种面向轨迹信息的时序数据流异常检测算法[J]. 计算机工程, 2018, 44(5): 25-32,46.
[15]	储光,胡学钢,张玉红. 基于语义的文本数据流概念漂移检测算法[J]. 计算机工程, 2018, 44(2): 24-30.

选择文件类型/文献管理软件名称

选择包含的内容

界标窗口中数据流频繁模式挖掘算法研究

Research on Data Stream Frequent Pattern Mining Algorithm in Landmark Window

PDF

可视化

被引次数

摘要/Abstract

引用本文

使用本文

参考文献

相关文章 15

编辑推荐

Metrics

本文评价

模态框（Modal）标题

选择文件类型/文献管理软件名称

选择包含的内容

界标窗口中数据流频繁模式挖掘算法研究

Research on Data Stream Frequent Pattern Mining Algorithm in Landmark Window

PDF

可视化

被引次数

摘要/Abstract

引用本文

使用本文

参考文献

相关文章 15

编辑推荐

Metrics

本文评价