计算机工程 ›› 2020, Vol. 46 ›› Issue (4): 162-168.doi: 10.19678/j.issn.1000-3428.0054313

• 网络空间安全 • 上一篇    下一篇

基于MobileNet的恶意软件家族分类模型

曾娅琴a, 张琳琳b,c, 张若楠a, 杨波a   

  1. 新疆大学 a. 软件学院;b. 网络空间安全学院;c. 信息科学与工程学院, 乌鲁木齐 830046
  • 收稿日期:2019-03-20 修回日期:2019-05-17 出版日期:2020-04-15 发布日期:2019-05-24
  • 作者简介:曾娅琴(1991-),女,硕士研究生,主研方向为恶意代码检测及分类、深度学习;张琳琳(通信作者),副教授、博士;张若楠、杨波,硕士研究生。
  • 基金项目:
    国家自然科学基金"移动学习情境感知模型研究"(61867006);新疆维吾尔自治区科技厅创新环境建设专项"校园网安全审计数据共享和威胁情报分析平台"(PT1811);新疆维吾尔自治区创新环境建设专项(自然科学基金)联合基金"多种技术融合的Android恶意软件检测方法研究"(2019D01C062);新疆维吾尔自治区高校科研计划项目—自然科学基金面上项目"基于异常模型的移动应用软件运行时行为检测方法研究"(XJEDU2017M005)。

Malware Family Classification Model Based on MobileNet

ZENG Yaqina, ZHANG Linlinb,c, ZHANG Ruonana, YANG Boa   

  1. a. School of Software;b. College of Cyberspace Security;c. College of Information Science and Engineering, Xinjiang University, Urumqi 830046, China
  • Received:2019-03-20 Revised:2019-05-17 Online:2020-04-15 Published:2019-05-24

摘要: 现有基于卷积神经网络(CNN)的恶意代码分类方法存在计算资源消耗较大的问题。为降低分类过程中的计算量和参数量,构建基于恶意代码可视化和轻量级CNN模型的恶意软件家族分类模型。将恶意软件可视化为灰度图,以灰度图的相似度表示同一家族的恶意软件在代码结构上的相似性,利用灰度图训练带有深度可分离卷积的神经网络模型MobileNet v2,自动提取纹理特征,并采用Softmax分类器对恶意代码进行家族分类。实验结果表明,该模型对恶意代码分类的平均准确率为99.32%,较经典的恶意代码可视化模型高出2.14个百分点。

关键词: 卷积神经网络, 恶意软件分类, 纹理特征, MobileNet v2模型, Softmax模型

Abstract: The existing malicious code classification method based on Convolutional Neural Network(CNN) has the problem of large computational resource consumption.In order to reduce the computational quantity and parameter quantity in the classification process,this paper constructs a malware family classification model based on malicious code visualization and lightweight CNN.The malware is visualized as grayscale to represent the similarity on code structure of the same malware family.Then the gray map is used to train the neural network model MobileNet v2 with deep separable convolution,so as to automatically extract the texture features.The Softmax classifier is used to classify the malicious code.Experimental results show that the average classificationaccuracy ofthe proposed model is 99.32%,which is 2.4 percentage points higher than the classic malicious code visualization model.

Key words: Convolutional Neural Network(CNN), malware classification, texture feature, MobileNet v2 model, Softmax model

中图分类号: