两类频繁项算法在网络流上的适用性评估

doi:10.3969/j.issn.1000-3428.2011.16.008

计算机工程 ›› 2011, Vol. 37 ›› Issue (16): 24-26.

两类频繁项算法在网络流上的适用性评估

周骏 ^1,2，陈鸣 ¹，张佳明³

(1. 解放军理工大学指挥自动化学院，南京 210007；2. 第二炮兵后勤部自动化工作站，北京 100085； 3. 中国人民解放军96627部队，北京 100085)

收稿日期:2010-12-07 出版日期:2011-08-20 发布日期:2011-08-20
作者简介:周骏(1975－)，男，工程师、博士研究生，主研方向：网络异常流量检测；陈鸣，教授、博士；张佳明，工程师
基金资助:
国家“863”计划基金资助项目(2007AA01Z418)

Applicability Evaluation on Two Classes of Frequent Items Algorithms in NetFlow

ZHOU Jun ^1,2, CHEN Ming ¹, ZHANG Jia-ming ³

(1. Institute of Command Automation, PLA University of Science and Technology, Nanjing 210007, China; 2. Institution of Command Automation for Logistics Department, Second Artillery Corps, Beijing 100085, China; 3. Unit 96627, PLA, Beijing 100085, China)

Received:2010-12-07 Online:2011-08-20 Published:2011-08-20

摘要/Abstract

摘要： 通过建立基于分组俘获文件产生网络流的模拟环境，对计数型算法和略图算法两类经典的频繁项挖掘算法的适用性进行验证，检验采用界标窗口查询模式的效果。实验结果表明，算法查全率不低于98%，与查准率和查询精度的相关性弱，与数据项的规模及数据流中频繁项分布的相关性强。略图类算法对频率的估算误差比较稳定，计数型算法则偏大。计数型算法的执行效率明显优于略图类算法。

关键词: 数据流, 频繁项, 基于计数的算法, 基于略图的算法, 网络流, 适用性

Abstract: Established a trace-file based NetFlow simulation environment to evaluating the applicability of two classes of classic algorithms for finding frequent items in NetFlow. The queries are based on landmark window in experiment. Experimental results indicate that the recall of all algorithms no less than ninety-eight percent, and the correlation between precision and query granularity is weak, but the correlation between precision and amount of items is strong, the correlation between precision and distribution of frequent items is strong. The error of sketch-based algorithm is stable for frequency estimation, and it is better than count-based algorithms. Meanwhile, the performance of count-based algorithms is better than that of sketch-based algorithms.

Key words: data stream, frequent items, count-based algorithm, sketch-based algorithm, NetFlow, applicability

中图分类号:

TP312

周骏, 陈鸣, 张佳明. 两类频繁项算法在网络流上的适用性评估[J]. 计算机工程, 2011, 37(16): 24-26.

ZHOU Jun, CHEN Ming, ZHANG Jia-Meng. Applicability Evaluation on Two Classes of Frequent Items Algorithms in NetFlow[J]. Computer Engineering, 2011, 37(16): 24-26.

https://www.ecice06.com/CN/Y2011/V37/I16/24

[1]	陈燕菲, 刘三民. 类不平衡的特征演化流在线学习方法[J]. 计算机工程, 2024, 50(9): 92-103.
[2]	魏德宾, 杨力, 潘成胜, 沈婷. 基于流量自相似性的网络队列管理算法[J]. 计算机工程, 2024, 50(5): 306-312.
[3]	张鹏飞, 陈俊仕, 郑重, 沈沛祺, 安虹, 许乐. 申威处理器上数据流运行时系统的设计与实现[J]. 计算机工程, 2023, 49(12): 46-54.
[4]	董卫宇, 李海涛, 王瑞敏, 任化娟, 孙雪凯. 基于堆叠卷积注意力的网络流量异常检测模型[J]. 计算机工程, 2022, 48(9): 12-19.
[5]	钱龙, 赵静, 韩京宇, 毛毅. 基于标签相关性的K近邻多标签学习[J]. 计算机工程, 2022, 48(6): 73-78,88.
[6]	李贝贝, 彭力, 戴菲菲. 结合马氏距离与自编码器的网络流量异常检测方法[J]. 计算机工程, 2022, 48(4): 133-142.
[7]	赵欣灿, 朱云, 毛伊敏. 基于MapReduce的高维数据频繁项集挖掘[J]. 计算机工程, 2022, 48(3): 81-89.
[8]	高峰, 姚光涛, 顾进广. 基于改进多嵌入空间的实时语义数据流推理[J]. 计算机工程, 2022, 48(2): 55-64.
[9]	王璐, 刘晓清, 何震瀛. 连续时间区间内的频繁词序列挖掘算法[J]. 计算机工程, 2022, 48(2): 79-85,91.
[10]	梁晓萌, 严明, 吴杰. 基于人工蜂群算法的Tor流量在线识别方法[J]. 计算机工程, 2021, 47(11): 129-135,143.
[11]	郭渝洛, 边浩东, 董润婷, 唐嘉豪, 王晓英, 黄建强. 基于SIMD的并行傅里叶空间图像相似度计算[J]. 计算机工程, 2021, 47(11): 247-253.
[12]	周胜, 刘三民. 基于动态策略的多源迁移学习数据流分类研究[J]. 计算机工程, 2020, 46(5): 139-143,149.
[13]	王斌, 房新秀, 魏天佑. 基于差异节点集的加权频繁项集挖掘算法[J]. 计算机工程, 2020, 46(5): 150-156.
[14]	孙中军, 翟江涛. 一种面向加密流量的网络应用识别方法[J]. 计算机工程, 2020, 46(4): 151-156.
[15]	李洁, 朱洪亮, 陈玉玲, 辛阳. 基于哈希存储与事务加权的并行Apriori改进算法[J]. 计算机工程, 2020, 46(11): 109-116.

选择文件类型/文献管理软件名称

选择包含的内容

两类频繁项算法在网络流上的适用性评估

Applicability Evaluation on Two Classes of Frequent Items Algorithms in NetFlow

PDF

可视化

被引次数

摘要/Abstract

引用本文

使用本文

参考文献

相关文章 15

编辑推荐

Metrics

本文评价

模态框（Modal）标题

选择文件类型/文献管理软件名称

选择包含的内容

两类频繁项算法在网络流上的适用性评估

Applicability Evaluation on Two Classes of Frequent Items Algorithms in NetFlow

PDF

可视化

被引次数

摘要/Abstract

引用本文

使用本文

参考文献

相关文章 15

编辑推荐

Metrics

本文评价