基于加权信息增益的恶意代码检测方法

doi:10.3969/j.issn.1000-3428.2010.06.050

计算机工程 ›› 2010, Vol. 36 ›› Issue (06): 149-151.

基于加权信息增益的恶意代码检测方法

张小康，帅建梅，史林

(中国科学技术大学自动化系，合肥 230027)

收稿日期:1900-01-01 修回日期:1900-01-01 出版日期:2010-03-20 发布日期:2010-03-20

Malicious Code Detection Method Based on Weighted Information Gain

ZHANG Xiao-kang, SHUAI Jian-mei, SHI Lin

(Department of Automation, University of Science & Technology of China, Hefei 230027)

Received:1900-01-01 Revised:1900-01-01 Online:2010-03-20 Published:2010-03-20

摘要/Abstract

摘要： 采用数据挖掘技术检测恶意代码，提出一种基于加权信息增益的特征选择方法。该方法综合考虑特征频率和信息增益的作用，能够更加准确地选取有效特征，从而提高检测性能。实现一个恶意代码检测系统，采用二进制代码的N-gram和变长N-gram作为特征提取方法，加权信息增益作为特征选择方法，使用多种分类器进行恶意代码检测。实验结果证明，该方法能有效提高恶意代码的检测率和准确率。

关键词: 数据挖掘, 变长N-gram, 特征选择, 信息增益

Abstract: Using data mining technology to detect malicious code, this paper proposes a feature selection method based on weighted information gain. This method can select effective features more correctly by combining the advantage of information gain with classwise frequency. A malicious code detection system is implemented which adopts binary N-gram and variable-length N-gram as the feature extraction method, weighted information gain as the feature selection method. Several classifiers are used to detect malicious code in the system. Experimental results prove that this method can effectively improve the detection and accuracy rate.

Key words: data mining, variable-length N-gram, feature selection, information gain

中图分类号:

TP391

张小康;帅建梅;史林. 基于加权信息增益的恶意代码检测方法[J]. 计算机工程, 2010, 36(06): 149-151.

ZHANG Xiao-kang; SHUAI Jian-mei; SHI Lin. Malicious Code Detection Method Based on Weighted Information Gain[J]. Computer Engineering, 2010, 36(06): 149-151.

https://www.ecice06.com/CN/Y2010/V36/I06/149

[1]	李俊仪, 李向阳, 龙朝勋, 李海燕, 李红松, 余鹏飞. 基于多级区域选择与跨层特征融合的野生菌分类[J]. 计算机工程, 2024, 50(9): 179-188.
[2]	张健, 张博. 基于生物入侵的特征选择算法[J]. 计算机工程, 2024, 50(9): 46-53.
[3]	刘仲民, 严梁. 融合动态特征与注意力的敦煌壁画修复模型[J]. 计算机工程, 2024, 50(5): 342-353.
[4]	赵洁, 叶文浩, 梁周扬, 陈建新, 董振宁. 基于不一致近邻的模糊粗糙集特征选择[J]. 计算机工程, 2024, 50(1): 110-119.
[5]	邵良杉, 赵松泽. 基于多模型融合的不完整数据分数插补算法[J]. 计算机工程, 2023, 49(9): 79-88, 98.
[6]	杨璇, 马建敏, 赵曼君. 基于邻域互信息的高维时序数据特征选择[J]. 计算机工程, 2023, 49(7): 135-142.
[7]	席荣康, 蔡满春, 芦天亮. 基于数据增强与流数据处理的Tor流量分析模型[J]. 计算机工程, 2023, 49(3): 177-184.
[8]	刘利, 张德生, 肖燕婷. 基于隶属度的模糊加权k近质心近邻算法[J]. 计算机工程, 2022, 48(7): 122-129.
[9]	艾成豪, 高建华, 黄子杰. 混合特征选择和集成学习驱动的代码异味检测[J]. 计算机工程, 2022, 48(7): 168-176,198.
[10]	范林歌, 武欣嵘, 童玮, 曾维军. 基于概率矩阵分解的不完整数据集特征选择方法[J]. 计算机工程, 2022, 48(6): 57-64.
[11]	谷青竹, 董红斌. PPDM中面向k-匿名的MI Loss评估模型[J]. 计算机工程, 2022, 48(4): 143-147.
[12]	张要, 马盈仓, 朱恒东, 李恒, 陈程. 结合流形学习与逻辑回归的多标签特征选择[J]. 计算机工程, 2022, 48(3): 90-99,106.
[13]	汪正凯, 沈东升, 王晨曦. 基于文本分类的Fisher Score快速多标记特征选择算法[J]. 计算机工程, 2022, 48(2): 113-124.
[14]	王璐, 刘晓清, 何震瀛. 连续时间区间内的频繁词序列挖掘算法[J]. 计算机工程, 2022, 48(2): 79-85,91.
[15]	黄奕轩, 杜世强, 余瑶, 肖庆江, 宋金梅. 基于特征选择与鲁棒图学习的多视图聚类[J]. 计算机工程, 2022, 48(12): 95-103.

选择文件类型/文献管理软件名称

选择包含的内容

基于加权信息增益的恶意代码检测方法

Malicious Code Detection Method Based on Weighted Information Gain

PDF

可视化

被引次数

摘要/Abstract

引用本文

使用本文

参考文献

相关文章 15

编辑推荐

Metrics

本文评价

模态框（Modal）标题

选择文件类型/文献管理软件名称

选择包含的内容

基于加权信息增益的恶意代码检测方法

Malicious Code Detection Method Based on Weighted Information Gain

PDF

可视化

被引次数

摘要/Abstract

引用本文

使用本文

参考文献

相关文章 15

编辑推荐

Metrics

本文评价