计算机工程 ›› 2019, Vol. 45 ›› Issue (9): 161-168.doi: 10.19678/j.issn.1000-3428.0051486

• 安全技术 • 上一篇    下一篇

隐马尔可夫模型在恶意域名检测中的应用

白玲玲1, 宁振虎1, 薛菲2, 杨永丽1   

  1. 1. 北京工业大学 信息学部, 北京 100124;
    2. 北京物资学院 信息学院, 北京 101149
  • 收稿日期:2018-05-08 修回日期:2018-07-28 出版日期:2019-09-15 发布日期:2019-09-03
  • 作者简介:白玲玲(1991-),女,硕士研究生,主研方向为信息安全;杨永丽,硕士研究生;宁振虎(通信作者)、薛菲,讲师、博士
  • 基金项目:
    北京市博士后工作经费项目(2017-22-030);CCF-启明星辰"鸿雁"科研计划(CCF-VenustechRP2017008)。

Application of Hidden Markov Model in Malicious Domain Name Detection

BAI Lingling1, NING Zhenhu1, XUE Fei2, YANG Yongli1   

  1. 1. Faculty of Information Technology, Beijing University of Technology, Beijing 100124, China;
    2. School of Information, Beijing Wuzi University, Beijing 101149, China
  • Received:2018-05-08 Revised:2018-07-28 Online:2019-09-15 Published:2019-09-03

摘要: 提出一种基于隐马尔可夫模型(HMM)的恶意域名检测方法。分析善恶域名在DNS通信中的各类特征,利用Spark大数据处理平台的高效计算能力对属性特征进行统计,在此基础上,通过HMM中的Baum-Welch算法和Viterbi算法对恶意域名进行准确分类。实验结果表明,与随机森林模型相比,HMM对恶意域名分类的准确率与召回率均较高。

关键词: 恶意域名, 隐马尔可夫模型, Baum-Welch算法, Viterbi算法, Spark大数据处理平台

Abstract: A malicious domain name detection method based on Hidden Markov Model(HMM) is proposed.The characteristics of good and evil domain name in DNS communication are analyzed,and the attribute characteristics are counted by using the efficient computing power of Spark big data processing platform.On this basis,malicious domain name are accurately classified by Baum-Welch algorithm and Viterbi algorithm in HMM.Experimental results show that compared with the Random Forest(RF) model,the accuracy and recall rate of HMM for malicious domain name classification are both higher.

Key words: malicious domain name, Hidden Markov Model(HMM), Baum-Welch algorithm, Viterbi algorithm, Spark big data processing platform

中图分类号: