基于PANAG模型的攻击路径预测研究

引用本文

王辉, 赵雅, 张娟, 等. 基于PANAG模型的攻击路径预测研究[J]. 计算机工程, 2020, 46(9), 154-162. DOI: 10.19678/j.issn.1000-3428.0055651.

WANG Hui, ZHAO Ya, ZHANG Juan, et al. Research on Attack Path Prediction Based on PANAG Model[J]. Computer Engineering, 2020, 46(9), 154-162. DOI: 10.19678/j.issn.1000-3428.0055651.

基金项目

国家自然科学基金（61300216）

通信作者

刘琨(通信作者), 副教授

作者简介

王辉(1975-), 男, 教授、博士, 主研方向为网络安全;
赵雅, 硕士研究生;
张娟, 硕士研究生

文章历史

收稿日期：2019-08-05
修回日期：2019-10-04

Contents Abstract Full text Figures/Tables PDF

基于PANAG模型的攻击路径预测研究

王辉 , 赵雅 , 张娟 , 刘琨

河南理工大学计算机科学与技术学院, 河南焦作 454000

收稿日期：2019-08-05；修回日期：2019-10-04

基金项目：国家自然科学基金（61300216）

作者简介：王辉(1975-), 男, 教授、博士, 主研方向为网络安全; 赵雅, 硕士研究生; 张娟, 硕士研究生.

通信作者：刘琨(通信作者), 副教授.

E-mail:763471003@qq.com

摘要：为准确预测网络攻击路径信息，提出一种基于概率属性网络攻击图（PANAG）的攻击路径预测方法。利用通用漏洞评分系统对弱点属性进行分析，设计节点弱点聚类算法以减少弱点数目，同时提出概率属性网络攻击图生成算法GeneratNAG，从而避免攻击图生成后可能存在的状态爆炸问题。综合分析影响网络攻击可行性的多方面因素，引入攻击价值的概念，提出一种基于攻击价值的路径生成算法BuildNAP，以消除冗余路径。在此基础上，通过PANAG模型定量分析基于入侵意图的不同入侵路径的可能性，预测攻击者最可能采取的攻击路径。实验结果表明，该方法的准确率与执行效率均较高。

Research on Attack Path Prediction Based on PANAG Model

WANG Hui , ZHAO Ya , ZHANG Juan , LIU Kun

College of Computer Science and Technology, Henan Polytechnic University, Jiaozuo, Henan 454000, China

Abstract: In order to accurately predict network attack paths, this paper proposes an attack path prediction method based on Probabilistic Attribute Network Attack Graph(PANAG).The method uses the common vulnerability scoring system to analyze the vulnerability attributes, and designs a Node Vulnerability Clustering(NVC) algorithm to reduce the number of vulnerabilities.Also, the probability attribute network attack graph generation algorithm, GeneratNAG, is given to avoid the possible state explosion of generated attack graphs.Then a comprehensive analysis of factors that influence the feasibility of cyberattacks is made, and on this basis the concept of attack value is introduced.A path generation algorithm based on attack value, BuildNAP, is proposed to eliminate redundant paths.Finally, the PANAG model is used to quantitatively analyze the possibility of different intrusion paths based on intrusion intent, and predict the attack path that the attacker is most likely to take.Experimental results demonstrate the accuracy and execution efficiency of the proposed method.

0 概述

随着互联网的快速发展, 网络空间安全问题日益突出。2018年, CNCERT全年截获计算机恶意程序超过1亿个, 其中包含计算机恶意程序家族超过51万个, 比2017年增加8 132个, 全年计算机恶意程序传播次数日均达500万余次^[1]。上述数据表明, 网络攻击造成的安全问题已不容忽视, 制定有效的安全防护措施尤为重要。攻击路径预测是当前主要的主动防御技术之一, 其通过分析网络中弱点关联关系来发现攻击者可能采取的攻击路径, 从而为网络防御提供理论依据^[2-3]。目前, 多数学者描述攻击路径时常使用的模型为攻击树和攻击图。攻击树具有直观、可视化的层次结构, 对攻击行为具有较好的图形化描述效果, 但其存在扩展性较弱的问题, 不适用于大规模复杂网络^[4]。攻击图具有良好的扩展性, 能够清晰地表达节点之间的依赖关系, 为描绘攻击路径提供了一种可视化方法^[5]。此外, 网络攻击通常带有主观因素, 具有不确定性, 攻击图能够描述攻击者可能采取的所有攻击行为, 其具有处理不确定性关系的能力^[6-7]。因此, 利用攻击图预测攻击者可能采取的攻击路径成为近年来学者们广泛关注的一个研究热点。

文献[8]提出基于D-S证据理论的攻击路径预测方法, 其应用概率推理计算攻击路径发生的可能性。文献[9]通过分析攻击行为发生的不确定性, 提出一种综合预测算法。文献[10]通过概率攻击图推理攻击节点的可达性, 根据节点状态及节点间的关联关系预测可能发生的攻击行为。文献[11]分析网络安全态势要素, 构建威胁状态转移图用于实时预测网络安全态势, 从而提高攻击路径预测的效果。上述方法主要依据当前网络状态对未来可能的攻击行为进行预测, 具有一定的可行性, 然而却忽略了攻击者将目标节点的成本和收益作为攻击依据的现象, 从而导致路径冗余问题, 影响了攻击路径概率的准确计算。

文献[12]针对攻击发生的不确定性问题, 将概率属性添加到攻击图模型中, 利用攻击图来推测关键攻击路径, 但随着网络规模的不断扩大, 其生成的攻击图可能存在状态爆炸问题。文献[13]利用贝叶斯网络将节点置信度转化为对攻击节点成本和收益的计算, 对比不同节点的成本-收益来找出最可能的攻击路径, 但其未对节点中的弱点进行属性分析, 导致预测准确度较低。文献[14]构建模糊马尔科夫链模型对网络攻击路径进行预测, 该模型的关键是确定适合的隶属函数, 当前常用的隶属函数选取方法有模糊统计法、判别矩阵法以及例证法等, 但上述方法都带有主观性, 理论基础较弱, 存在预测通用性较低的问题。文献[15]设计因果知识网络描述网络入侵过程, 并给出改进的Dijkstra算法来识别入侵意图和预测不同水平的攻击者在攻击路径选择上的差异性。该方法预测准确率较高但计算较为复杂, 存在预测成本较高的问题。文献[16]通过综合分析攻击者、防御者以及网络环境三方面要素的相互关系, 设计基于动态贝叶斯攻击图的攻击路径预测算法, 但其网络攻防具有动态性的特点, 文中节点概率计算方式并不能实时描绘攻防双方的对抗特征, 导致预测效果不佳。

为避免攻击图生成的状态爆炸问题, 本文提出节点弱点聚类算法NVC和概率属性网络攻击图生成算法GeneratNAG。通过分析影响网络攻击行为的多方面因素, 设计基于攻击价值的攻击路径生成算法BuildNAP。利用优化后的攻击路径, 应用概率推理思想计算基于入侵意图的不同攻击路径的发生概率, 以预测攻击者最可能采取的攻击路径。

1 PANAG定义及NAP描述

攻击路径预测是以图的形式寻找攻击者为实现入侵意图而可能采取的所有攻击路径。本文通过对网络中的弱点属性进行分析, 构建概率属性网络攻击图模型, 管理员能够依据此模型分析出最大概率攻击路径, 从而进行防御决策。给出概率属性网络攻击图、攻击路径定义如下:

定义1(概率属性网络攻击图) 设PANAG=(V, H, E, P, P′, T, W)为有向无环图, 其中:

1) V={∀v_i∈V, v_i为一个弱点}为网络中的弱点集合。若攻击者能够成功利用主机中的弱点, 则会给网络带来安全隐患。

2) H={H_i|i=1, 2, …, N}为攻击图中包含弱点的主机节点集合。其中, H_i={v_j, v_j+1, …, v_m}(0 < j < m)为攻击图中的某一个节点, 共含有m－j+1个弱点, N为节点的个数。

3) E={e_k→r|k=1, 2, …, N, r=1, 2, …, N}为攻击图中节点之间存在关联关系的有向边集合, 也即攻击行为集合。有向边〈H_k, H_r〉的攻击行为可表示为e_k→r。

4) P代表弱点被成功利用的概率, 即节点可达概率, 其由弱点的属性决定, 具体计算详见2.1节。

5) P′代表攻击者采取一系列相关攻击行为后, 实现入侵意图的攻击路径相对概率。假设攻击图中包含L条实现入侵意图的攻击路径, 用Θ表示攻击者的入侵意图, 则每条攻击路径的相对概率则表示为P′(NAP_l|Θ), 其中, NAP_l为攻击路径, l=1, 2, …, L。

6) T={t_n→p|n=1, 2, …, N, p=1, 2, …, N}代表攻击图包含的节点状态变迁集合, t_n→p表示攻击者在占有当前节点H_n的情况下成功占有下一个目标节点H_p并完成攻击行为e_n→p的节点变迁。

7) W代表攻击价值集合, ∀w∈W依附于攻击图的有向边, 其由攻击成本与攻击收益共同决定, 计算公式详见3.3节。

定义1主要综合上述7种因素及相互关系给出概率属性网络攻击图模型。依照定义1, 借助弱点扫描工具对目标网络中的设备进行扫描, 将具有弱点的主机作为攻击图节点, 有向边代表节点之间的关联关系, 生成如图 1所示的简单攻击图。

	Download: JPG larger image
图 1 简单攻击图 Fig. 1 Simple attack graph

在图 1中, 攻击者从初始节点H₀出发到成功占有H₅最终实现入侵意图, 共包含8次不同的攻击行为, 分别为e_0→1, e_0→2, e_1→3, e_1→4, e_2→3, e_2→4, e_3→5, e_4→5, 相应完成了8次状态变迁, 分别为t_0→1, t_0→2, t_1→3, t_1→4, t_2→3, t_2→4, t_3→5, t_4→5。攻击者从当前所在节点到成功占据下一个关联节点, 必定利用了其含有的某一弱点, 因此, 依据弱点的属性能够衡量节点的可达性, 便于预测攻击者的可能攻击路径。

定义2(网络攻击路径(Network Attack Path, NAP)) 对于入侵目标节点∀H_N∈H, 攻击者首先选择初始节点∀H_i∈H发起攻击, 其安全状态发生改变后, 对其他具有依赖关系的节点∀H_m∈H进行攻击。以此类推, 直至最终占有H_N, 所经过的攻击节点为H_i, H_m, …, H_N, 其中, 任意2个相邻的节点〈H_i, H_m〉满足t_i→m∈T, 0 < i < m≤N, 且所经过的变迁序列有限, 则〈H_i, H_m, …, H_N〉称为一条攻击路径, 记为NAP。

从定义2可以看出, 网络攻击路径描述了攻击者实现入侵意图而采取的一系列攻击行为, 体现了攻击者对网络中节点作不同选择的可能性。以图 1为例, 共包含如下4条攻击路径:

NAP₁=〈H₀, H₁, H₃, H₅〉

NAP₂=〈H₀, H₁, H₄, H₅〉

NAP₃=〈H₀, H₂, H₃, H₅〉

NAP₄=〈H₀, H₂, H₄, H₅〉

图 1中的攻击者依次占有所有节点后到达H₅, 为准确直观地描述概率属性网络攻击图与攻击路径的关联性, 对该攻击过程进行如下分析:

1) 在通常情况下, 目标节点若含多个攻击效果相同的弱点, 则攻击者会选择容易利用的弱点, 因此, 弱点属性影响节点的可达概率P。

2) 在理论上, 只需考虑节点的可达概率P, 由于P>0, 因此攻击者可以从上述4条路径中随意挑选路径发起攻击, 直至占有H₅实现入侵意图。但在实际中, 若目标节点的攻击成本高于收益, 则攻击者会放弃该节点, 即攻击价值在一定程度上决定了攻击行为是否发生。假定w(e_1→4) < 0, 攻击者会放弃节点H₄的攻击, 因此, NAP₂为无效攻击路径。

3) 若未有效分析攻击图中包含的弱点及攻击路径信息, 会导致实现入侵意图的有效攻击路径相对概率P′计算有偏差, 即存在预测结果不准确的现象。

2 弱点概率属性分析及PANAG生成算法

攻击图能够方便管理员对网络整体安全状况进行分析决策, 若攻击图过于复杂, 则不利于管理员制定合理的防御策略。鉴于此, 本文通过对弱点概率属性进行分析, 提出节点弱点聚类算法NVC和概率属性网络攻击图生成算法GeneratNAG, 从而优化攻击图生成效果, 增强其可读性。

2.1 弱点概率属性分析

在实际攻击场景中, 能够被攻击者利用的弱点通常含有某种漏洞。攻击者能否实现节点状态变迁与节点是否含有漏洞以及该节点的属性有关。目前, 被公认的能够量化漏洞属性的评分工具为通用漏洞评估系统(Common Vulerability Scoring System, CVSS)^[17], 漏洞属性在攻击路径(Access Vector, AV)、攻击复杂度(Access Complexity, AC)以及身份认证(Authentication, AU)三方面对应等级的具体取值如表 1所示。

下载CSV 表 1 漏洞属性度量表 Table 1 Vulnerability attribute measurement table

因为攻击成功概率与所利用的漏洞属性密切相关, 所以本文使用CVSS对不同漏洞的属性进行度量, 判断漏洞利用的难易程度, 并以此为依据计算攻击者的攻击成功概率, 即节点可达概率P, 其计算公式如下:

$ P = {\rm{AC \times AV \times AU}} $

(1)

2.2 PANAG生成算法

在对网络攻击进行建模时, 需要综合分析网络中的拓扑关系和弱点信息。当节点具有很多可以选择利用的弱点时, 就会存在多条攻击路径, 因此, 生成的攻击图会过于复杂。针对该现象, 本文提出节点弱点聚类算法NVC来简化节点中含有的弱点, 然后利用概率属性网络攻击图生成算法GeneratNAG生成攻击图。

2.2.1 节点弱点聚类算法NVC

当攻击者面临目标节点内存在多个弱点可供选择且攻击效果相同时, 往往会选择最容易成功利用的弱点。为此, 本文先综合分析多种弱点被利用后产生的后果, 将攻击分为获取信息(GI)、权限升级(PU)以及拒绝服务(DoS)3种类型, 再采用节点弱点聚类算法NVC对节点弱点进行预处理。节点弱点聚类算法流程如图 2所示。

	Download: JPG larger image
图 2 节点弱点聚类算法流程 Fig. 2 Procedure of node vulnerability clustering algorithm

在节点弱点聚类算法NVC中, 首先利用扫描工具扫描网络中节点含有的弱点信息并进行属性分析; 其次利用CVSS中对弱点的度量策略来计算攻击图中节点内每个弱点被攻击成功的概率, 对属性相同的弱点进行聚类; 最后对同种属性的弱点, 利用CVSS对弱点的度量策略选择攻击成功概率最高的弱点并作为聚类弱点的代表。NVC算法能够起到减少弱点数目的作用。

2.2.2 概率属性网络攻击图生成算法GeneratNAG

随着网络规模的扩大, 已有的攻击图生成方法已不能准确描述网络安全状况, 为此, 本文提出一种新的攻击图生成算法。根据单调性假设, 攻击者不会重复和放弃已攻击占有的节点, 因此, 攻击者必先成功占有前置状态节点, 后置状态节点才可能出现, 即前置状态节点和后置状态节点互为因果关系。因此, 本文采用正向搜索的思想, 首先搜索可能存在的攻击实例, 接着分析攻击实例内节点间的相互关系, 寻找并不断创建网络中新的攻击节点, 循环上述操作, 直至无新的攻击实例出现, 最终生成概率属性网络攻击图。概率属性网络攻击图生成算法GeneratNAG具体描述如下:

算法1 GeneratNAG算法

输入初始化攻击节点s₀, 攻击实例集合S

输出 PANAG

1.while S≠Ø

2.S_Node←S_Node∪{s₀}

3.for each s∈S

4.if H_j∈pre(s)⊂S_Node then

5.createNode(H_j)//创建攻击节点H_j

6.A←A∪{H_j}//A为攻击图的节点集合

7.for each H_i∈pre(s)

8.E←E∪{〈H_i, H_j〉}//E为攻击图中的边集合

9.for each H_m∈post(s)

10.if H_m∉S_Node then

11.createNode(H_m)

12.A←A∪{H_m}

13.E←E∪{〈H_j, H_m〉}

14.S_Node← S_Node∪{H_m}//更新当前攻击节点

15.S←S-{s}//将攻击实例s从集合S中移除

16.GeneratNAG(PANAG, S)

在算法1中, 首先收集归纳网络攻击状态前置节点pre(s)和网络攻击状态后置节点post(s), 即模式化所有可能攻击实例并存储在集合S中, 作为GeneratNAG的输入。算法第1行~第4行将初始攻击节点s₀存储在当前攻击节点集合S_Node中, 并搜索S中的节点, 判断是否有以当前攻击节点为pre(s)的攻击实例; 第5行~第15行进行判断, 若有攻击实例满足上述条件, 则创建攻击节点H_j, 并建立该节点与其前置网络状态节点H_i的一条边〈H_i, H_j〉, 若该节点的网络状态后置节点H_m不属于S_Node, 则建立H_m与其post(s)的一条边〈H_j, H_m〉, 并将H_m加入S_Node中, 同时将该攻击实例从S中移除; 第16行对于集合S_Node中新的当前攻击节点, 循环执行第4行~第15行操作, 直到S为空集。算法第10行加入对网络状态后置节点H_m与S_Node的判断, 以避免攻击图生成环路。

3 攻击可行性及NAP算法分析

随着网络规模的不断上升, 相应的主机节点数也会增多, 攻击图会包含过多的攻击路径, 影响攻击路径的有效预测。针对该问题, 本文通过对攻击图中节点的单元攻击成本(Unit Attack Cost, UAC)和单元攻击收益(Unit Attack Revenue, UAR)进行分析, 引入攻击价值的概念, 提出一种基于攻击价值的攻击路径生成算法。

3.1 单元攻击成本分析

UAC指攻击者发动一次攻击所消耗的成本, 其由操作成本和风险成本组成。本文借鉴文献[18]的思想, 定义单元攻击e_i→j的操作成本由元操作成本cost(meta-operations)和操作序列成本cost(sequence)构成, 计算公式如下:

$ \begin{array}{l} {\rm{cost}}{\left( {{e_{i - j}}} \right)_{{\rm{operation}}}} = \alpha \times {\rm{cost}}\left( {{\rm{metao - perations}}} \right) + \\ \begin{array}{*{20}{c}} {}&{}&{}&{}&{}&{\beta \times } \end{array}{\rm{cost}}\left( {{\rm{sequence}}} \right) \end{array} $

(2)

其中, α、β为元操作成本和操作序列成本所对应的权重。

关于单元攻击操作成本的详细描述可参见文献[18]。攻击行为的风险成本应根据具体的攻击场景进行量化, 通常由风险系数和攻击者累积的攻击经验决定。攻击者每发动一次攻击都会存在被发现的可能, 为此定义风险系数(δ)描述单元攻击被发现的可能性大小。若攻击者认为目标节点对于实现入侵意图具有重要性, 则该节点就很容易被攻击, 也很容易检测到该攻击行为。因此, 定义节点重要度(M)作为风险成本评估因素。此外, 风险成本与攻击者的攻击行为复杂度(φ)也具有相关性, 攻击行为复杂度越高, 越容易利用节点中的弱点, 但面临的风险也越大。因此, 风险系数δ的数学模型如下:

$ \delta \left( {{e_{i - j}}} \right) = M\left( {{e_{i - j}}} \right) \times \varphi \left( {{e_{i - j}}} \right) $

(3)

由于攻击者是理智的, 当攻击者采取的攻击次数越多时, 经验就越丰富, 其被发现的风险成本就越小。因此, 定义风险成本的数学模型如下:

$ {\rm{cost}}{\left( {{e_{i - j}}} \right)_{{\rm{risk}}}} = \eta {\left( {{e_{i - j}}} \right)^{n - 1}} \times \delta \left( {{e_{i - j}}} \right) $

(4)

其中, η(e_i→j)为攻击者经验依赖系数, n为成功攻击的次数。式(3)、式(4)中的相关变量具体取值均结合实际网络攻击场景并由专家经验给出。经过分析, 本文建立单元攻击成本的计算模型如下:

$ \begin{array}{l} {\rm{UAC}}\left( {{e_{i - j}}} \right) = \rho \times {\rm{cost}}{\left( {{e_{i - j}}} \right)_{{\rm{operation}}}} + \\ \begin{array}{*{20}{c}} {}&{\begin{array}{*{20}{c}} {}&{}&{}&{\nu \times } \end{array}} \end{array}{\rm{cost}}{\left( {{e_{i - j}}} \right)_{{\rm{risk}}}} \end{array} $

(5)

其中, ρ、ν分别代表操作成本和风险成本的权重, 且满足ρ+ν=1。

3.2 单元攻击收益分析

UAR是指攻击者采取单元攻击后获得的收益。通常很难具体量化收益, 本文用节点的资源损失(Resource Loss, RL)来表示UAR。

定义3 (资源损失) 资源损失代表节点受到某类攻击行为所遭受的损失大小。本文参考文献[19], 用攻击致命度(Attack Fatality, AF)、危险度(Risk)以及安全属性3个因素描述攻击的节点资源损失。

定义4 (攻击致命度) 攻击致命度代表节点受到某类攻击行为所产生的危害水平, 可以用0~N之间的数值来表示各类攻击的相对危害大小。依据2.2.1节对攻击的分类, 相同类型的攻击行为赋予相同的致命度等级, 具体取值如表 2所示。

下载CSV 表 2 攻击致命度等级表 Table 2 Attack fatality rating table

目前被广大研究人员认可的能反映节点资源的安全特性为完整性、保密性和可用性, 因此, 本文采用三元组(L_i, L_c, L_a)分别表示单元攻击行为对节点资源三方面安全特性的不同致命度偏重, 取值范围均为[0, 1]。

定义5 (危险度) 危险度表示攻击者的目标攻击节点所面临的危险程度。节点的危险度可采用high、middle和low 3个等级来描述。攻击者成功利用危险度越高的节点, 相应的资源损失就越大, 危险度等级具体取值由实际攻击场景确定。

本文结合网络具体环境, 定义Base_v为节点资源价值基数, 用Risk和Base_v表示网络中各个节点的相对价值Value, 即Value=Risk×Base_v。此外, 节点的资源价值相对于安全属性往往具有一定偏重, 用(P_i, P_c, P_a)描述对属性的完整性、机密性和可用性的不同偏重, 且满足P_i+P_c+P_a=1。经上述分析, 给出单元攻击e_i→j攻击成功后对网络中节点造成的资源损失计算模型如下:

$ {\rm{RL}}\left( {{e_{i - j}}} \right) = {\rm{AF \times Value}} \times \left( {{L_i} \times {P_i} + {L_c} \times {P_c} + {L_a} \times {P_a}} \right) $

(6)

可以认为单元攻击e_i→j对节点造成的资源损失就是本次攻击的收益, 即:

$ {\rm{UAR}}\left( {{e_{i - j}}} \right) = {\rm{RL}}\left( {{e_{i - j}}} \right) $

(7)

3.3 攻击可行性分析

在通常情况下, 攻击者对网络中的目标节点实施攻击时, 会对该节点的攻击价值w进行综合考量, 当攻击者认为本次攻击的攻击价值在目标范围内时才会采取攻击行为。因此, 本文给出式(8)计算攻击价值w, 从而判断攻击行为的可行性:

$ w = {\rm{UAR}}\left( {{e_{i - j}}} \right) - {\rm{UAC}}\left( {{e_{i - j}}} \right) $

(8)

从式(8)可以看出, 攻击可行性由节点的单元攻击成本和单元攻击收益共同决定。从攻击者的角度考虑, 若攻击者认为节点的单元攻击成本高于收益(此时w < 0), 就会放弃对该节点的攻击而寻找其他可行目标节点。对攻击价值的分析在一定程度上能够消除攻击路径冗余, 提高攻击预测的准确度。

3.4 攻击路径生成算法描述

定义6(偏序关系集(Partially Ordered Set, POS)) PANAG中的2个任意相邻节点H_i和H_m, 如果H_i, H_m之间存在一条〈H_i, H_m〉有向边, 则称〈H_i, H_m〉具有偏序关系。所有偏序关系构成的集合称为偏序关系集, 记作POS。

为详细展示NAP的形成过程, 用true代表状态变迁和攻击行为发生, false代表不可能发生。通过对某目标网络中的节点进行弱点分析, 得到其含有的攻击图, 依据上文的攻击可行性分析并结合专家经验为攻击图赋予攻击价值w, 然后以H₀为起始点, 断开以其为节点的一条边, 存放入POS_i中, 之后依照某一拓扑顺序e_i→j逐渐得到POS。赋予w后的攻击图如图 3所示。

	Download: JPG larger image
图 3 赋予攻击价值的攻击图 Fig. 3 Attack graph with attack value

在图 3中, 拓扑序φ={e_0→1, e_0→2, e_1→3, e_1→4, e_2→4, e_2→5, e_2→4, e_2→3, e_3→6, e_4→6, e_5→6}, 具体流程如下:

1) 断开e_0→1, w=1.5>0, e_0→1←true, t_0→1←true, POS₀={〈H₀, H₁〉}。

2) 断开e_0→2, w=1.9>0, e_0→2←true, t_0→2←true, POS₁=POS₀∪{〈H₀, H₂〉}。

3) 断开e_1→3, w=－0.7 < 0, e_1→3←false, t_1→3←false。

4) 断开e_1→4, w=2.3>0, e_1→4←true, t_1→4←true, POS₂=POS₁∪{〈H₁, H₄〉}。

5) 断开e_1→5, w=－3.6 < 0, e_1→5←false, t_1→5←false。

6) 断开e_2→3, w=－1.2 < 0, e_2→3←false, t_2→3←false。

7) 断开e_2→4, w=1.2>0, e_2→4←true, t_2→4←true, POS₃=POS₂∪{〈H₂, H₄〉}。

8) 断开e_2→5, w=2.5>0, e_2→5←true, t_2→5←true, POS₄=POS₃∪{〈H₂, H₅〉}。

9) 断开e_3→6, w=0.5>0, e_3→6←true, t_3→6←true, POS₅=POS₄∪{〈H₃, H₆〉}。

10) 断开e_4→6, w=3.1>0, e_4→6←true, t_4→6←true, POS₆=POS₅∪{〈H₄, H₆〉}。

11) 断开e_5→6, w=1.7>0, e_5→6←true, t_5→6←true, POS₇=POS₆∪{〈H₅, H₆〉}。

12) 遍历变迁关系集合T, 查找标识为false的t_i→j并将其从T中移除。

13) 若T≠Ø, 依据POS得到攻击路径NAP_i:

NAP₁=〈H₀, H₁, H₄, H₆〉

NAP₂=〈H₀, H₂, H₄, H₆〉

NAP₃=〈H₀, H₂, H₅, H₆〉

由上述结果可以看出, 该方法通过对攻击价值w的判断, 对攻击行为和状态变迁进行标识, 舍弃标识为false的状态变迁, 有效减少了冗余路径。基于攻击价值的攻击路径生成算法BuildNAP具体描述如下:

算法2 BuildNAP算法

输入 PANAG, 偏序关系集POS, 攻击价值w, 变迁关系集T, 有向边集合E, 拓扑序φ, 任意节点H_i、H_j

输出攻击路径集合NAP

1.φ←PANAG, POS_i←Ø, T_i←Ø

2.FOR(根据φ查找每一个节点变量H_i)

3.在PANAG中找出与H_i存在变迁关系的节点H_j

4.IF(e_i→j∈E)

5.IF(w>0)

6.e_i→j←true, t_i→j←true

7.ELSE

8.e_i→j←false, t_i→j←false

9.END IF

10.POS_i∪{ < H_i, H_j>}

11.END IF

12.END FOR

13.遍历集合T, 移除所有标志为false的t_i→j

14.IF(T≠Ø)

15.NAP_i←POS

16.RETURN NAP_i

4 基于PANAG模型的入侵预测

攻击者能否实现入侵意图通常与网络中节点之间的依赖关系以及节点包含的弱点属性有关。然而, 由于网络规模的不断扩大, 攻击者可以通过多条路径实现其入侵意图。因此, 预先发现攻击者的入侵意图并及时掌握其可能实施的攻击路径, 有助于防御网络入侵。

4.1 入侵意图的可达性分析

给定PANAG模型, 如果存在任意节点H_i, H_j∈PANAG, H_i为攻击者初始所在节点, H_j为攻击者完成入侵意图Θ的前置条件节点, 若模型中含有以H_i为起始节点、H_j为最终节点的攻击路径〈H_i, H_i+1, …, H_j〉, 则称入侵意图Θ可达。

4.2 入侵意图的实现概率分析

在概率属性网络攻击图中, 若攻击者想要占有的目标节点h含有多个弱点, 利用节点弱点聚类算法NVC能够找出攻击者最可能占有的弱点, 根据该弱点属性计算节点h的可达概率为P(h)。假设有L条NAP能够实现入侵意图, 每条NAP的对应节点数为ϕ(不同的NAP其ϕ取值可能不同), 则入侵意图Θ的实现概率计算公式为:

$ P\left( \Theta \right) - \prod\limits_L {\left[ {1 - \prod\limits_\phi {P\left( {{h_\phi }} \right)} } \right]} $

(9)

根据贝叶斯公式可计算出每条NAP的入侵意图Θ的相对实现概率, 如下:

$ P'\left( {{\rm{NA}}{{\rm{P}}_l}\left| \mathit{\Theta} \right.} \right) = P\left( {{\rm{NA}}{{\rm{P}}_l}} \right)P\left( {\left. \mathit{\Theta} \right|{\rm{NA}}{{\rm{P}}_l}} \right) $

(10)

其中, l=1, 2, …, L。依据式(10)可找出实现入侵意图概率最大的攻击路径, 即攻击者最可能采取的攻击路径。

5 仿真验证 5.1 仿真网络环境

为验证本文提出的模型和算法的有效性与适用性, 搭建一个仿真网络环境进行测试分析, 其拓扑结构如图 4所示。

	Download: JPG larger image
图 4 仿真网络拓扑 Fig. 4 Simulation network topology

仿真网络包括M₁、M₂、M₃以及DMZ 4个安全区域, 每个安全区域内节点之间可任意访问。DMZ中包含Mail服务器、SMTP服务器以及DNS服务器, 防火墙3保护DMZ区连接Internet。区域M₂和M₃内的主机均可与DMZ中的3台服务器互相访问, 区域M₁与DMZ不能互相访问。区域M₃中的主机H₄能够访问区域M₂中的服务器H₁₂, 同时H₄和M₂中的主机H₉与区域M₁中的DB服务器能够互相访问。攻击者通过Internet访问该网络。

在网络节点上配置的相关弱点信息如表 3所示。假定攻击者的入侵意图是窃取区域M₁中DB服务器H₁₂的隐秘数据和敏感信息, 为简化攻击行为的可行性分析, 本文首先依据文中的单元攻击成本、单元攻击收益的数学模型并结合专家经验, 将节点H₂的攻击价值w赋值为-1.2, 图 4中其他节点的攻击价值w均大于0。

下载CSV 表 3 节点弱点信息 Table 3 Node vulnerability information

5.2 仿真结果及分析

首先利用节点弱点聚类算法NVC对该网络中的弱点进行预处理, 输出每个节点聚类后的弱点, 并依据式(1)计算出所有包含弱点的节点可达概率P, 如表 4所示。

下载CSV 表 4 节点弱点聚类信息 Table 4 Node vulnerability clustering information

根据网络的节点弱点和拓扑结构信息, 利用本文给出的概率属性网络攻击图生成算法GenerateNAG生成该网络的攻击图, 如图 5所示。

	Download: JPG larger image
图 5 概率属性网络攻击图 Fig. 5 Probability attribute network attack graph

针对得出的PANAG模型, 根据本文提出的攻击可行性分析方法, 利用攻击路径生成算法BuildNAP生成8条可行的攻击路径, 如表 5所示。在表 5中, CP代表攻击路径的可达概率, 其为每条攻击路径所经过的各节点可达概率之积。

下载CSV 表 5 实现入侵意图的路径信息 Table 5 Path information to achieve intrusion intent

利用式(9)计算攻击者的入侵意图Θ的实现概率为P(Θ)=0.423, 通过式(10)计算得出攻击者实现入侵意图的每条攻击路径的相对概率P′, 具体结果为表 5中第4列所示。由此可以看出, P′(NAP₁|Θ)的取值最大, 因此, NAP₁为最可能采取的攻击路径, 管理员应对此进行重点防御。

5.3 仿真结果比较

本文利用节点弱点聚类算法以有效简化网络中的弱点, 并给出攻击可行性的判断依据, 消除了冗余攻击路径。经过对已有研究的对比分析得出, 文献[9, 20]与本文研究方法有一定的相似性。为此, 本文进行3组仿真实验, 在攻击图生成效果、执行时间以及预测有效性3个方面进行综合对比, 结果如下:

1) 攻击图生成效果对比。为保证仿真结果的可比性, 进行与本文算法相同的仿真环境配置, 使用文献[20]攻击图生成算法生成攻击图, 结果如图 6所示。

	Download: JPG larger image
图 6 文献[20]算法攻击图生成效果 Fig. 6 Attack graph generation effect of the algorithm in reference[20]

从图 6可以看出, 文献[20]算法生成的攻击图中攻击者利用节点的不同弱点实现入侵意图, 但存在过多的冗余路径, 可读性差。本文算法从攻击者角度考虑, 对生成的概率属性网络攻击图和攻击路径进行有效简化, 能够更加清楚地描述节点关系, 有助于攻击路径预测。

2) 执行时间对比。将本文算法与文献[20]算法的攻击图生成时间进行对比, 首先在网络中随机増加主机节点数、拓扑关系及弱点数, 然后分别计算2种算法的执行时间, 结果如图 7所示。

	Download: JPG larger image
图 7 2种算法的攻击图生成时间对比 Fig. 7 Comparison of attack graph generation time of two algorithms

从图 7可以看出, 当主机节点数小于4 000时, 2种算法的执行时间均低于10 s, 随着节点数的增多, 2种算法的执行时间都明显上升; 当节点数不超过5 000时, 2种算法所需执行时间基本上保持相同; 当节点数大于5 000时, 本文算法的时间消耗明显少于文献[20]算法, 说明本文算法更适用于大规模复杂网络。

3) 预测性能对比。为验证本文算法的有效性, 将其与文献[9, 20]算法进行对比, 预测准确率结果如表 6所示。

下载CSV 表 6 预测准确率对比 Table 6 Comparison of prediction accuracy

从表 6可以看出, 相比于文献[9, 20]算法, 本文算法的准确率更高, 主要是因为本文利用节点弱点聚类算法选出了攻击者最可能利用的弱点, 并以此为依据计算攻击者的最大概率攻击路径。

6 结束语

面对复杂的网络环境, 进行攻击路径预测有助于管理员分析网络安全状况。针对现有攻击图生成方法复杂度高、可读性差的问题, 本文提出节点弱点聚类算法NVC和概率属性网络攻击图生成算法GeneratNAG。通过分析影响攻击可行性的因素, 设计基于攻击价值的攻击路径生成算法BuildNAP。在此基础上, 应用概率推理预测攻击者最可能采取的攻击路径。实验结果验证了本文算法较高的准确性。本文综合分析影响网络攻击行为的多方面因素, 给出了节点的攻击价值计算方式, 但其中涉及较多参数, 且只能依据专家经验给出取值。为提高算法执行效率, 下一步将利用数学模型来计算具体的参数数值。

参考文献

[1]	National Internet Emergency Center.Overview of China's Internet security situation in 2018[EB/OL].[2019-07-20]. https://www.cert.org.cn/publish/main/46/index.html.(in Chinese) 国家互联网应急中心.2018年我国互联网安全态势综述[EB/OL].[2019-07-20]. https://www.cert.org.cn/publish/main/46/index.html.
[2]	ABRAHAM S, NAIR S. A predictive framework for cyber security analytics using attack graphs[J]. International Journal of Computer Networks and Communications, 2015, 7(1): 1-17. DOI:10.5121/ijcnc.2015.7101
[3]	BAO Xuhua, DAI Yingxia, FENG Pinghui, et al. Detection and prediction algorithm of compound attack based on intrusion intention[J]. Journal of Software, 2005, 16(12): 2132-2138. (in Chinese) 鲍旭华, 戴英侠, 冯萍慧, 等. 基于入侵意图的复合攻击检测和预测算法[J]. 软件学报, 2005, 16(12): 2132-2138.
[4]	WHITLEY J N, PHAN RAPHAELC W, WANG J, et al. Attribution of attack trees[J]. Computers and Electrical Engineering, 2011, 37(4): 624-628. DOI:10.1016/j.compeleceng.2011.04.010
[5]	WANG Hui, WANG Tengfei, LIU Shufen. A network attack path prediction method based on ATI[J]. Computer Engineering, 2016, 42(9): 132-137. (in Chinese) 王辉, 王腾飞, 刘淑芬. 一种基于ATI的网络攻击路径预测方法[J]. 计算机工程, 2016, 42(9): 132-137.
[6]	YE Ziwei, GUO Yuanbo, WANG Chendong, et al. Survey on application of attack graph technology[J]. Journal on Communications, 2017, 38(11): 121-132. (in Chinese) 叶子维, 郭渊博, 王宸东, 等. 攻击图技术应用研究综述[J]. 通信学报, 2017, 38(11): 121-132.
[7]	LIU Zhenyu, CHEN Yuzhong, GUO Kun, et al. Distributed process mining and graph segmentation for network attack modeling[J]. Journal of Chinese Computer Systems, 2020, 41(8): 1732-1740. (in Chinese) 刘贞宇, 陈羽中, 郭昆, 等. 面向网络攻击建模的分布式过程挖掘与图分割方法[J]. 小型微型计算机系统, 2020, 41(8): 1732-1740.
[8]	QU Zhaoyang, LI Yaying.A network security situation evaluation method based on DS evidence theory[C]//Proceedings of the 2nd Conference on Environmental Science and Information Application Technology.Washington D.C., USA: IEEE Press, 2010: 496-499.
[9]	GHASEMIGOL M, GHAEMI-BAFGHI A, TAKABI H. A comprehensive approach for network attack forecasting[J]. Computers and Security, 2016, 58: 83-105. DOI:10.1016/j.cose.2015.11.005
[10]	CHEN Xiaojun, SHI Jinqiao, XU Fei, et al. Algorithm of optimal security hardening measures against insider threat[J]. Journal of Computer Research and Development, 2014, 51(7): 1565-1577. (in Chinese) 陈小军, 时金桥, 徐菲, 等. 面向内部威胁的最优安全策略算法研究[J]. 计算机研究与发展, 2014, 51(7): 1565-1577.
[11]	LÜ Huiying, PENG Wu, WANG Ruimei, et al. A real-time network threat recognition and assessment method based on association analysis of time and space[J]. Journal of Computer Research and Development, 2014, 51(5): 1039-1049. (in Chinese) 吕慧颖, 彭武, 王瑞梅, 等. 基于时空关联分析的网络实时威胁识别与评估[J]. 计算机研究与发展, 2014, 51(5): 1039-1049.
[12]	WANG L Y, ISLAM T, LONG T, et al.An attack graph-based probabilistic security metric[M]//NIKLAS E, NIKLAS S.Lecture notes in computer science.Berlin, Germany: Springer, 2008: 283-296.
[13]	DEWRI R, RAY I, POOLSAPPASIT N, et al. Optimal security hardening on attack tree models of networks:a cost-benefit analysis[J]. International Journal of Information Security, 2012, 11(3): 167-188. DOI:10.1007/s10207-012-0160-y
[14]	KUANG G C, WANG X F, YIN L R.A fuzzy forecast method for network security situation based on Markov[C]//Proceedings of 2012 International Conference on Computer Science and Information Processing.Washington D.C., USA: IEEE Press, 2012: 785-789.
[15]	WANG Shuo, TANG Guangming, KOU Guang, et al. Attack path prediction method based on causal knowledgenet[J]. Journal on Communications, 2016, 37(10): 188-198. (in Chinese) 王硕, 汤光明, 寇广, 等. 基于因果知识网络的攻击路径预测方法[J]. 通信学报, 2016, 37(10): 188-198. DOI:10.11959/j.issn.1000-436x.2016210
[16]	HU Hao, YE Runguo, ZHANG Hongqi, et al. Quantitative method for network security situation based on attack prediction[J]. Journal on Communications, 2017, 38(10): 122-134. (in Chinese) 胡浩, 叶润国, 张红旗, 等. 基于攻击预测的网络安全态势量化方法[J]. 通信学报, 2017, 38(10): 122-134.
[17]	HOLM H, AFRIDI K K. An expert-based investigation of the common vulnerability scoring system[J]. Computers and Security, 2015, 53: 18-30. DOI:10.1016/j.cose.2015.04.012
[18]	WANG Hui, LIU Shufen. A scalable predicting model for insider threat[J]. Chinese Journal of Computers, 2006, 29(8): 1346-1355. (in Chinese) 王辉, 刘淑芬. 一种可扩展的内部威胁预测模型[J]. 计算机学报, 2006, 29(8): 1346-1355.
[19]	JIANG Wei.Research on key technologies of active defense based on attack defense game model[D].Harbin: Harbin Institute of Technology, 2010.(in Chinese) 姜伟.基于攻防博弈模型的主动防御关键技术研究[D].哈尔滨: 哈尔滨工业大学, 2010. http://cdmd.cnki.com.cn/Article/CDMD-10213-1011278865.htm
[20]	ZHONG Shangqin, XU Guosheng, YAO Wenbin, et al. Network security analysis based on host-security-group[J]. Journal of Beijing University of Posts and Telecommunica-tions, 2012, 35(1): 19-23. (in Chinese) 钟尚勤, 徐国胜, 姚文斌, 等. 基于主机安全组划分的网络安全性分析[J]. 北京邮电大学学报, 2012, 35(1): 19-23.