2. 中国人民解放军61660部队, 北京 100080
2. Unit 61660 of PLA, Beijing 100080, China
开放科学(资源服务)标志码(OSID):
复杂网络链路预测是指运用网络结构信息对节点对之间存在连接的可能性进行预测[1-2]。链路预测具有很强的理论和实际应用价值,可以帮助人们认识复杂网络演化机制与结构信息[3],还可以为生物蛋白质结构网络构建、电子商务商品推荐、资源贸易协调、电信用户通联关系挖掘等任务提供技术支持[4-5]。
链路预测方法主要分为基于网络结构信息相似性、融合网络多维度信息、基于网络结构模型等方法。基于网络结构信息进行链路预测的主要难点是找到网络生成演化机理及生成链路的诱导因素。例如,无标度网络仅由2条基本假设(网络是不断增长的、增长过程中节点倾向于与度大的节点相连),即可推导出网络中节点的度呈长尾分布这一共性规律[6]。这2条基本假设通过网络生成机理,解释了度分布不呈正态分布的原因。同样地,如何解释网络中链路的成因来预测未知链路也是链路预测的难点。
基于网络结构信息定义节点对之间相似性的链路预测方法使用单一维度的网络信息或直接明确定义多维度信息的关系,具有理论简洁、效率较高的特点。吕琳媛等[7-8]将节点对的共同邻居数赋予权重,提出共同邻居加权的资源分配指标。YAO等[9-11]提出基于局部拓扑信息加权的相似性指标。刘树新等[12]提出网络中节点间资源传输机理的资源传输匹配度指标。BISWAS等[13-15]考虑网络的社区信息,利用社区信息对经典相似性指标加权,或仅在节点所属社区内计算经典相似性指标,提升链路预测准确度。基于相似性度量的链路预测方法通常是对微观网络结构进行建模,从节点对及其周围的微观结构出发,解析链路形成机理预测链路。
随着网络结构信息研究的深入,网络多维度信息被充分挖掘。为进一步提高相似性指标的准确性和鲁棒性,学者们提出融合网络多维度信息的链路预测方法,例如,组合规则法、OWA算子融合法[16]、AdaBoost融合法[17]等基于相似性指标的后端融合方法[18]。基于机器学习或深度学习的链路预测方法将链路预测问题转化为有无连边的二分类问题,本质上也可将其看作多指标经分类器输出的后端融合方法。吴翼腾等[19]详细研究了后端融合方法的理论极限问题,提出并证明了采用组合方法进行链路预测的理论极限定理。后端融合方法主要针对数据建模,侧重于预测的准确性,但却牺牲了算法的可解释性,难以解析网络中链路形成的诱导因素[20]。
基于网络结构模型的链路预测方法从宏观上对网络结构进行建模,首先给出网络生成假设,然后根据网络生成假设求出节点对产生链路的概率,最后利用全概率思想计算某条连边的生成概率,主要包括随机分块模型[21-22]和层次结构模型[23]。随机分块模型假设节点间的连接概率取决于节点所在社区:同一社区内部节点连接概率相同,不同社区间连接概率仅与所在社区有关,通过随机划分节点所在社区,基于某种划分计算社区内和社区间形成连边的概率,并计算社区划分的先验概率,但无法处理重叠社区结构以及节点间的分级与层次结构。层次结构模型对节点间的层次结构进行建模,建立节点连接关系的谱系图,与随机分块模型计算连接概率的核心思想相似,首先计算基于某种谱系图和节点间生成连边概率,然后计算谱系图的先验概率,最后采用全概率思想计算最终的链路形成概率。在基于网络结构模型的链路预测方法中,连边的综合概率加权融合了多种子模型的连边概率,但该融合方法不同于后端融合方法,需对网络结构建模,因此将其概括为综合网络结构信息的前端融合方法。
随机分块模型和层次结构模型从不同角度给出了网络结构描述方式[24],但无法有效处理从宏观、中观网络社区结构到微观低阶环或模体[25]结构中的重叠结构信息,而实际网络中重叠结构无处不在。本文构建一种统一描述网络结构模型,简称USI(Uniform-Structure-Information)模型,既包含节点的层次结构信息,又可使节点从属于不同集合,并基于USI模型提出一种链路预测方法,通过实验以验证该方法的有效性。
1 问题描述和评价指标给定t时刻的网络
为了评估链路预测方法的准确性,需对网络进行训练集和测试集的划分,链路预测方法仅允许运用训练集进行预测。一般使用AUC(Area Under the Receiver Operation Characteristic Curve)衡量预测准确性。AUC不受有无连边两类样本非平衡性的影响(无连边的节点对远大于有连边的节点对数量),可以理解为在测试集中随机选择一条边的分数值比随机选择一条不存在的边的分数值高的概率[7],即每次从测试集中随机选择一条边,再从不存在的边中随机选择一条边,若前者高则加1分,若相等则加0.5分,这样独立比较n次。若有n′次测试集得分高,有n″次两者相等,则AUC定义如下:
$ {A}_{\mathrm{A}\mathrm{U}\mathrm{C}}=\frac{n{'}+0.5n{'}{'}}{n} $ | (1) |
定义1 在统一描述网络结构模型中,A0为网络中所有节点组成的集合,集合族
1)定义幂集:
$ {A}_{1}={2}^{{A}_{0}}, {A}_{2}={2}^{{A}_{1}}, \cdots , {A}_{i}={2}^{{A}_{i-1}}, i=\mathrm{1, 2}, \cdots $ | (2) |
对任意i,
$ f:\mathrm{ }({A}_{i}{)}^{k}\to {\mathfrak{D}}_{k}, {\mathfrak{D}}_{k}\subset ({A}_{i}{)}^{k}, k=\mathrm{1, 2}, \cdots , \left|{A}_{i}\right| $ | (3) |
$ ({A}_{i}{)}^{k}=\left\{\left\{{A}_{i1}, {A}_{i2}, \cdots , {A}_{ik}\right\}:{A}_{ij}\in {A}_{i}, 1\le j\le k\right\} $ | (4) |
其中:
特别地,当i=0时:
$ f:\mathrm{ }({A}_{0}{)}^{k}\to {\mathfrak{D}}_{k}, {\mathfrak{D}}_{k}\subset ({A}_{0}{)}^{k} $ | (5) |
2)假设集合
$ \left\{\begin{array}{l}0\le {p}_{i} < 1, x\ne y且x, y\in {D}_{i}\\ {p}_{i}=1, x=y且x, y\in {D}_{i}\end{array}\right. $ | (6) |
USI模型可以解释无向网络中各种节点的连接和组织关系,为网络中各类节点的层次关系、重叠关系等建立简明清晰的表示方法。定义1中的第1个部分可以理解为有共同特性的元素可以组成集合,第2个部分可以理解为集合内部元素间发生联系的概率相同。
根据模型定义,组成集合的元素可以是集合或非集合。当集合中元素为非集合时,表示节点对之间存在链路的概率;当集合中的元素为集合时,表示集合与集合建立联系的概率。例如:一个班级中的所有同学组成一个集合,集合中元素为非集合,p表示该班级任意两个同学存在联系的概率;一个学校所有班级组成一个集合,集合中元素班级仍为集合,p表示班级之间建立联系的概率,间接表示班级之间同学建立联系的概率。
定义2 在USI模型中,Ai及其非空子集的元素为i阶元素,
定义3 在USI模型中,集合所含元素的阶数称为集合的阶。i阶集合记为
例如一个由3个节点组成的网络,
USI模型是对随机分块模型和层次结构模型的一般化推广。随机分块模型假设网络被分成若干个群,两个节点产生链路的概率只取决于节点所在的群,无法体现网络的层次结构和重叠结构信息。层次结构模型将网络用族谱树的形式表示,网络中
USI模型本身可以看作加权网络模型。只要当i=0、k=2时,即两元素构成0阶集合的指定关系f为任意两节点对组成集合,p根据连边权重设定后,USI模型就可转化为加权网络模型。
2.2 统一描述网络结构模型性质命题1
$ g:{\mathfrak{X}}^{\left(i\right)}\to \underset{j=1}{\overset{n}{\cup }}{X}_{j}^{\left(i\right)} $ | (7) |
显然,
推论1
证明 根据命题1,i阶集合经1次元素的并集运算g可降为
推论2
证明 将i阶集合的每个元素看作
设3阶集合
$ \begin{array}{l}{\mathfrak{X}}^{\left(2\right)}=\underset{j=1}{\overset{3}{\cup }}{X}_{j}^{\left(3\right)}=\left\{\left\{\left\{\mathrm{1, 2}, 3\right\}, \left\{6\right\}\right\}, \left\{\left\{\mathrm{4, 5}\right\}\right\}\right\}\bigcup \left\{\left\{\left\{6\right\}, \left\{\mathrm{7, 8}, 9\right\}\right\}\right\}\bigcup \left\{\left\{\left\{6.9\right\}, \left\{9\right\}\right\}\right\}=\\ \left\{\left\{\left\{\mathrm{1, 2}, 3\right\}, \left\{6\right\}\right\}, \left\{\left\{\mathrm{4, 5}\right\}\right\}, \left\{\left\{6\right\}, \left\{\mathrm{7, 8}, 9\right\}\right\}, \left\{\left\{\mathrm{6, 9}\right\}, \left\{9\right\}\right\}\right\}\end{array} $ | (8) |
$ \begin{array}{l}{\mathfrak{X}}^{\left(1\right)}=\underset{i=1}{\overset{4}{\cup }}{X}_{j}^{\left(2\right)}=\left\{\left\{\mathrm{1, 2}, 3\right\}, \left\{6\right\}\right\}\bigcup \left\{\left\{\mathrm{4, 5}\right\}\right\}\bigcup \left\{\left\{6\right\}, \left\{\mathrm{7, 8}, 9\right\}\right\}\bigcup \left\{\left\{\mathrm{6, 9}\right\}, \left\{9\right\}\right\}=\\ \left\{\left\{\mathrm{1, 2}, 3\right\}, \left\{6\right\}, \left\{\mathrm{4, 5}\right\}, \left\{\mathrm{7, 8}, 9\right\}, \left\{\mathrm{6, 9}\right\}, \left\{9\right\}\right\}\end{array} $ | (9) |
$ {\mathfrak{X}}^{\left(0\right)}=\underset{j=1}{\overset{3}{\cup }}{X}_{j}^{\left(1\right)}=\left\{\mathrm{1, 2}, 3\right\}\bigcup \left\{6\right\}\bigcup \left\{\mathrm{4, 5}\right\}\bigcup \left\{\mathrm{7, 8}, 9\right\}\bigcup \left\{\mathrm{6, 9}\right\}\bigcup \left\{9\right\}=\left\{\mathrm{1, 2}, \mathrm{3, 4}, \mathrm{5, 6}, \mathrm{7, 8}, 9\right\} $ | (10) |
根据推论2,
$ \begin{array}{l}{X}_{1}^{\left(2\right)}=\left\{\left\{\mathrm{1, 2}, 3\right\}, \left\{6\right\}\right\}\bigcup \left\{\left\{\mathrm{4, 5}\right\}\right\}=\\ \left\{\left\{\mathrm{1, 2}, 3\right\}, \left\{6\right\}, \left\{\mathrm{4, 5}\right\}\right\}\end{array} $ |
$ {X}_{2}^{\left(2\right)}=\left\{\left\{6\right\}, \left\{\mathrm{7, 8}, 9\right\}\right\} $ |
$ {X}_{3}^{\left(2\right)}=\left\{\left\{\mathrm{6, 9}\right\}, \left\{9\right\}\right\} $ |
进一步地,2阶元素
$ {X}_{1}^{\left(1\right)}=\left\{\mathrm{1, 2}, 3\right\}\bigcup \left\{6\right\}\bigcup \left\{\mathrm{4, 5}\right\}=\left\{\mathrm{1, 2}, \mathrm{3, 4}, \mathrm{5, 6}\right\} $ |
$ {X}_{2}^{\left(1\right)}=\left\{6\right\}\bigcup \left\{\mathrm{7, 8}, 9\right\}=\left\{\mathrm{6, 7}, \mathrm{8, 9}\right\} $ |
$ {X}_{3}^{\left(1\right)}=\left\{\mathrm{6, 9}\right\}\bigcup \left\{9\right\}=\left\{\mathrm{6, 9}\right\} $ |
最终得到由这3个1阶元素组成的1阶集合:
$ \begin{array}{l}{\mathfrak{X}}^{\left(1\right)}=\left\{{X}_{1}^{\left(1\right)}, {X}_{2}^{\left(1\right)}, {X}_{3}^{\left(1\right)}\right\}=\\ \left\{\left\{\mathrm{1, 2}, \mathrm{3, 4}, \mathrm{5, 6}\right\}, \left\{\mathrm{6, 7}, \mathrm{8, 9}\right\}, \left\{\mathrm{6, 9}\right\}\right\}\end{array} $ | (11) |
基于USI模型的链路预测方法的基本假设是两个节点发生联系的概率主要依赖于其所在的群体(集合)。因此,基于USI模型的链路预测方法首先根据可利用的信息给出模型中的集合划分,其次利用最大似然估计法估计概率p,最后假设各条路径产生的联系是相互独立的,根据并联概率给出链路预测得分。
3.1 集合划分对于含有属性信息和真实群组结构的网络数据,可以根据该信息给出指定关系f确定各阶集合的划分组成。对于只含有节点和连边拓扑信息的数据,只能通过算法识别和合理策略给出指定关系f。现对只含有拓扑信息数据的集合进行分析。
根据USI模型可知,节点对之间链路的成因取决于节点对所属的集合及其概率。理论上,无论何种规模的网络结构均可被USI模型表示:只需将该种网络结构视作集合,并建立集合元素间的概率。根据实际应用场景,本文主要给出0阶和1阶集合的划分方式。
对于0阶集合,复杂网络的社区发现算法给出了针对仅含拓扑信息数据的0阶集合划分方式。USI模型的链路预测方法中引入社区发现算法,按特定社区发现算法划分的结果,规定指定关系f划分0阶集合。网络中的环也是十分重要的网络结构,1个长度为h的环,是由h个节点
对于1阶集合,考虑社区发现算法划分0阶集合两两交互作用的情况,将任意两个0阶集合组成1阶集合。为减少计算量,估计p时可设置阈值限定1阶集合概率p的建立范围,且低阶环不划分1阶集合。由于仅含拓扑信息,信息量有限,因此暂不考虑2阶以上集合的划分。
按照上述分析,给出指定关系f的如下3种策略:
1)当i=0、k=1,2,…,|A0|时,按社区发现算法的划分结果作为指定关系f1划分0阶集合。假设社区发现算法划分的全体社区结构为集合P,
$ \begin{array}{l}{f}_{1}:\mathrm{ }({A}_{0}{)}^{k}\to {\mathfrak{D}}_{{f}_{1}k}, {\mathfrak{D}}_{{f}_{1}k}\subset ({A}_{0}{)}^{k}, \\ k=\mathrm{1, 2}, \cdots , \left|{A}_{0}\right|\end{array} $ | (12) |
$ {\mathfrak{D}}_{{f}_{1}k}={f}_{1}\left[({A}_{0}{)}^{k}\right]=\left\{{V}_{i}:\left|{V}_{i}\right|=k, {V}_{i}\in P\right\} $ | (13) |
2)当i = 0、k = 1,2,…,|A0|时,按指定关系
$ \begin{array}{l}{f}_{2}:\mathrm{ }({A}_{0}{)}^{k}\to {\mathfrak{D}}_{{f}_{2}k}, {\mathfrak{D}}_{{f}_{2}k}\subset ({A}_{0}{)}^{k}, \\ k=\mathrm{1, 2}, \cdots , \left|{A}_{0}\right|\end{array} $ | (14) |
$ {\mathfrak{D}}_{{f}_{2}k}={f}_{2}\left[({A}_{0}{)}^{k}\right]=\left\{\begin{array}{l}\left\{{i}_{1}, {i}_{2}, \cdots , {i}_{k}\right\}:\mathrm{任}\mathrm{意}{i}_{1}, {i}_{2}, \cdots , {i}_{k}\in V\mathrm{且}{i}_{1}\ne {i}_{2}\ne \cdots \ne {i}_{k}, \\ \mathrm{存}\mathrm{在}\mathrm{唯}\mathrm{一} < i, j > , i={i}_{1}, {i}_{2}, \cdots , {i}_{k}, j={i}_{1}, {i}_{2}, \cdots , {i}_{k}, i\ne j\mathrm{使}\mathrm{得} < i, j > \notin E\end{array}\right\} $ | (15) |
3)当i=1、k=2时,按指定关系f3将f1划分的0阶集合两两组成1阶集合:
$ {D}_{i}\in \underset{k=1}{\overset{\left|{A}_{0}\right|}{\cup }}{\mathfrak{D}}_{{f}_{1}k}={\mathfrak{D}}_{{f}_{1}} $ | (16) |
$ {f}_{3}:\mathrm{ }({A}_{1}{)}^{2}\to \mathfrak{D}, \mathfrak{D}\subset ({A}_{1}{)}^{2} $ | (17) |
$ \mathfrak{D}={f}_{3}\left[({A}_{1}{)}^{2}\right]=\left\{\left\{{D}_{i}, {D}_{j}\right\}:\mathrm{任}\mathrm{意}{D}_{i}, {D}_{j}\in {\mathfrak{D}}_{{f}_{1}}, {D}_{i}\ne {D}_{j}\right\} $ | (18) |
根据集合阶数的不同,概率p的估计可以分为3种情况,分别为0阶集合上概率p的估计、1阶集合上概率p的估计以及高阶集合上概率p的估计。
3.2.1 0阶集合对于0阶集合
$ \left|{\mathfrak{X}}^{\left(0\right)}\right|={N}_{1} $ | (19) |
在仅含0阶元素组成的集合中,元素与元素间只有连边与非连边,概率p即定义为元素连边的概率。集合中元素连边数为随机变量X,X服从
$ L(p, x)={p}^{x}{(1-p)}^{N-x}, x=\mathrm{0, 1}, \cdots , N $ | (20) |
其中:x是0阶集合观测到的实际连边数。
令:
$ \frac{\mathrm{d}L(p, x)}{\mathrm{d}p}=0 $ | (21) |
解得:
$ \widehat{p}=\frac{x}{N} $ | (22) |
如图 1所示,在0阶集合中共有10个节点、12条连边,则概率p的估计值为
![]() |
Download:
|
图 1 0阶集合上概率p的估计示例 Fig. 1 Example of estimating probability p on 0-order set |
对于1阶集合
$ {\mathfrak{X}}^{\left(1\right)}=\left\{{X}_{j}^{\left(1\right)}:{X}_{j}^{\left(1\right)}\mathrm{是}1\mathrm{阶}\mathrm{元}\mathrm{素}\text{,}j=\mathrm{1, 2}, \cdots \right\} $ | (23) |
$ \left|{\mathfrak{X}}^{\left(1\right)}\right|=K $ | (24) |
考虑到1阶元素可能存在交集,假设:
$ \left|{X}_{j}^{\left(1\right)}\backslash \underset{j=1}{\overset{K}{\cup }}{X}_{j}^{\left(1\right)}\right|={k}_{j} $ | (25) |
集合中1阶元素的最大可能连边数定义如下:
$ N=\sum\limits_{i\ne j}{k}_{i}{k}_{j} $ | (26) |
因此对于1阶集合
如图 2(a)所示的1阶集合不存在交集,只需考虑集合之间的实际连边数(为6)和可能最大的连边数(为
![]() |
Download:
|
图 2 1阶集合上概率p的估计示例 Fig. 2 Examples of estimating probability p on 1-order set |
根据推论2,将高阶集合通过元素的并集运算迭代降为1阶集合后,按照1阶集合上概率p的估计方法进行求解。
3.3 基于并联概率的链路预测得分确定由于USI模型中同一节点可以从属于不同阶的不同集合,存在两节点对产生联系的多条路径,与生活中人际交往十分类似,每增加一条两节点产生联系的路径,则两节点产生联系的概率随之增大,因此采用节点对之间各条路径产生联系的概率值的并联概率作为最终链路预测得分。假设产生联系的各条路径在相互独立的条件下,最终链路预测得分可以表示如下:
$ {s}_{xy}=1-\prod\limits_{i=1}^{{N}_{xy}}\left(1-{p}_{xy}^{i}\right) $ | (27) |
其中:sxy为节点对xy的最终链路预测得分,即连边概率;
按照USI模型设计,各种规模的网络结构对链路形成的影响,主要体现在链路处于何种网络结构之中。无论何种网络结构,USI模型都将其视为集合以及集合中元素的连接概率。因此,链路的形成主要由节点对所属集合及其概率决定,节点对从属不同集合,则链路的形成由这些集合的共同作用效果决定。本文方法采用简单的概率并联策略,综合衡量不同集合的共同作用效果。
3.4 与其他链路预测方法的对比分析基于USI模型的链路预测方法属于链路预测的前端融合方法。前端融合方法主要包括基于拓扑信息[10-11]、基于社区信息[13-15]加权的相似性、基于网络结构模型等[21-23]方法,一般具有很好的解释性,物理意义明确,侧重于直接从网络的生成演化规律出发进行预测,弱化从数据中学习模式。后端融合方法包括基于相似性的指标融合方法[16-18]、基于机器学习的分类方法[20]等,提高预测准确率的机理是将多维度网络信息拟合成准确率的多元函数,并对目标函数进行优化,使准确率达到最大,侧重于从数据中提取特征,以准确率为最终优化目标。因此,前端融合方法的准确率整体低于后端融合方法,尤其是深度学习方法。
USI模型的链路预测方法基于基本假设:两节点发生联系的概率主要依赖于其所在群体。使用USI模型的定义来表述:若节点对从属于哪个集合,则使用哪个集合的概率p来衡量节点对的关系;若节点对从属于多个集合,则使用这些集合共同作用的效果(即概率的并联)衡量节点对之间的关系。由于USI模型可以将多维度网络结构信息(包括已知的真实网络结构信息)输入进来,因此基于USI模型的链路预测可以综合利用网络的层次结构、重叠结构、微观结构等网络结构信息。基于以上信息,使用节点对从属集合的连接概率解释链路的生成方式进行链路预测。
4 实验与结果分析基于USI模型的链路预测方法在实验过程中选取2种社区发现算法:1)Reichardt[26],该算法将社区结构理解为自旋组态,使其最小化自旋玻璃态的能量而得到一种社区划分结果;2)SpectralClust[27],对于图
基于USI模型的链路预测方法在FB(Football)[28]、NS(Netscience)[29]、LT(London transport1)[30]、CKM-3[31]、A01[32]、ER(Euroroad)[33]、OP(Opsahl_powergrid)[34]、FWFB[35]8个网络数据集上进行实验。8个网络数据集的统计信息如表 1所示,其中,|V|表示网络中的节点数,|E|表示网络中的边数,< k > 表示网络中节点的平均度,< d > 表示网络中节点对的平均距离,C表示网络的平均集聚系数,r表示网络的关联系数,H表示度的分布熵。
![]() |
下载CSV 表 1 网络数据集统计信息 Table 1 Network dataset statistics |
在每个数据集上计算节点对的链路预测得分,每个数据集单独计算10次,每次独立划分训练集和测试集,训练集和测试集的占比分别为90%和10%,最终取10次计算的平均值作为最终链路预测结果。
选取若干具有代表性的基于节点相似性的链路预测方法进行性能对比,包括基于共同邻居的CN[36]方法、基于共同邻居和节点度加权的AA[37]和RA[8]方法、偏好连接相似性的PA[38]方法、基于局部路径的LP[8]方法、基于随机游走的LRW[39]和SRW[39]方法(后面的数字表示步数,例如LRW4表示随机游走的步数为4)、全局相似性方法ACT[39]等10种方法。将AUC指标作为评价指标,得到如表 2所示的实验结果,其中排名前2的指标值用加粗字体标示。由表 2中实验数据可得知,仅使用网络社区结构和3阶环信息的USI模型的链路预测方法可显著提升局部结构相似性和全局相似性方法的AUC指标。尤其在LT、ER、OP数据集上,USI模型的AUC达到0.9左右,相比其他基于节点相似性的链路预测方法的最优值提升了0.075~0.143,预测准确性显著提升,从而验证了不同规模的网络结构信息对链路形成的影响。
![]() |
下载CSV 表 2 链路预测方法的AUC结果比较 Table 2 Comparison of AUC results of link prediction methods |
从方法效率上看,设网络节点数为N1,随机游走的步数为n1,网络中节点平均度为k1,则CN、AA、RA、PA的时间复杂度为
本文采用笛卡儿积、幂集等概念对多维度网络特征进行统一描述,建立统一描述网络结构模型(USI),并提出一种基于USI模型的链路预测方法。该方法利用USI模型对输入信息进行前端融合,描述实际网络的演化机理,并且明确了网络规模对链路形成的影响。实验结果验证了基于USI模型的链路预测方法的有效性。后续将融合其他的网络结构信息以及连边概率的组合方式,进一步提高链路预测准确率。此外,当USI模型输入仅为社区发现算法划分的社区结构信息时,即可利用USI模型的AUC值对重叠与非重叠社区结构的划分质量进行评价,下一步也将对此进行深入研究。
[1] |
GARCÍA-PÉREZ G, ALIAKBARISANI R, GHASEMI A, et al. Precision as a measure of predictability of missing links in real networks[J]. Physical Review E, 2020, 101(5): 052318. DOI:10.1103/PhysRevE.101.052318 |
[2] |
ZHANG J, YU P S. Link prediction[EB/OL]. [2021-03-17]. https://doi.org/10.1007/978-3-030-12528-8_7.
|
[3] |
谭索怡, 祁明泽, 吴俊, 等. 复杂网络链路可预测性: 基于特征谱视角[J]. 物理学报, 2020, 69(8): 182-191. TAN S Y, QI M Z, WU J, et al. Link predictability of complex network from spectrum perspective[J]. Acta Physica Sinica, 2020, 69(8): 182-191. (in Chinese) |
[4] |
CANNISTRACI C V, ALANIS-LOBATO G, RAVASI T. From link-prediction in brain connectomes and protein interactomes to the local-community-paradigm in complex networks[J]. Scientific Reports, 2013, 3: 1613. DOI:10.1038/srep01613 |
[5] |
李冬, 申德荣, 寇月, 等. 基于层次化混合特征图的链路预测方法[J]. 中国科学: 信息科学, 2020, 50(2): 221-238. LI D, SHEN D R, KOU Y, et al. Research on a link-prediction method based on a hierarchical hybrid-feature graph[J]. Scientia Sinica Informationis, 2020, 50(2): 221-238. (in Chinese) |
[6] |
汪小帆. 无标度网络研究纷争: 回顾与评述[J]. 电子科技大学学报, 2020, 49(4): 499-510. WANG X F. Controversial issues in researches on scale-free networks: an overview with a network perspective[J]. Journal of University of Electronic Science and Technology of China, 2020, 49(4): 499-510. (in Chinese) |
[7] |
吕琳媛, 周涛. 链路预测[M]. 北京: 高等教育出版社, 2013. LÜ L Y, ZHOU T. Link prediction[M]. Beijing: Higher Education Press, 2013. (in Chinese) |
[8] |
ZHOU T, LÜ L, ZHANG Y C. Predicting missing links via local information[J]. The European Physical Journal B, 2009, 71(4): 623-630. DOI:10.1140/epjb/e2009-00335-8 |
[9] |
YAO Y B, ZHANG R S, YANG F, et al. Link prediction based on local weighted paths for complex networks[J]. International Journal of Modern Physics C, 2017, 28(4): 1750053. DOI:10.1142/S012918311750053X |
[10] |
LIU S X, JI X S, LIU C X, et al. Similarity indices based on link weight assignment for link prediction of unweighted complex networks[J]. International Journal of Modern Physics B, 2017, 31(2): 1650254. DOI:10.1142/S0217979216502544 |
[11] |
王凯, 李星, 兰巨龙, 等. 一种基于资源传输路径拓扑有效性的链路预测方法[J]. 电子与信息学报, 2020, 42(3): 653-660. WANG K, LI X, LAN J L, et al. A new link prediction method for complex networks based on topological effectiveness of resource transmission paths[J]. Journal of Electronics & Information Technology, 2020, 42(3): 653-660. (in Chinese) |
[12] |
刘树新, 李星, 陈鸿昶, 等. 基于资源传输匹配度的复杂网络链路预测方法[J]. 通信学报, 2020, 41(6): 70-79. LIU S X, LI X, CHEN H C, et al. Link prediction method based on matching degree of resource transmission for complex network[J]. Journal on Communications, 2020, 41(6): 70-79. (in Chinese) |
[13] |
BISWAS A, BISWAS B. Community-based link prediction[J]. Multimedia Tools and Applications, 2017, 76(18): 18619-18639. DOI:10.1007/s11042-016-4270-9 |
[14] |
DE BACCO C, POWER E A, LARREMORE D B, et al. Community detection, link prediction, and layer interdependence in multilayer networks[J]. Physical Review E, 2017, 95: 042317. |
[15] |
MALLEK S, BOUKHRIS I, ELOUEDI Z, et al. Evidential Link Prediction Based on Group Information[M]. Berlin, Germany: Springer, 2015.
|
[16] |
HE Y L, LIU J N K, HU Y X, et al. OWA operator based link prediction ensemble for social network[J]. Expert Systems with Applications, 2015, 42(1): 21-50. DOI:10.1016/j.eswa.2014.07.018 |
[17] |
吴祖峰, 梁棋, 刘峤, 等. 基于AdaBoost的链路预测优化算法[J]. 通信学报, 2014, 35(3): 116-123. WU Z F, LIANG Q, LIU Q, et al. Modified link prediction algorithm based on AdaBoost[J]. Journal on Communications, 2014, 35(3): 116-123. (in Chinese) |
[18] |
YU H T, WANG S H, MA Q Q. Link prediction algorithm based on the Choquet fuzzy integral[J]. Intelligent Data Analysis, 2016, 20(4): 809-824. DOI:10.3233/IDA-160833 |
[19] |
吴翼腾, 于洪涛, 黄瑞阳, 等. 采用组合方法进行链路预测的理论极限研究[J]. 通信学报, 2020, 41(6): 34-50. WU Y T, YU H T, HUANG R Y, et al. Theoretical limit of link prediction using a combination method[J]. Journal on Communications, 2020, 41(6): 34-50. (in Chinese) |
[20] |
MARTÍNEZ V, BERZAL F, CUBERO J C. A survey of link prediction in complex networks[J]. ACM Computing Surveys, 2017, 49(4): 69. |
[21] |
HOLLAND P W, LASKEY K B, LEINHARDT S. Stochastic block models: first steps[J]. Social Networks, 1983, 5(2): 109-137. DOI:10.1016/0378-8733(83)90021-7 |
[22] |
GUIMERÀ R, SALES-PARDO M. Missing and spurious interactions and the reconstruction of complex networks[J]. Proceedings of the National Academy of Sciences of the United States of America, 2009, 106(52): 22073-22078. DOI:10.1073/pnas.0908366106 |
[23] |
CLAUSET A, MOORE C, NEWMAN M E J. Hierarchical structure and the prediction of missing links in networks[J]. Nature, 2008, 453(7191): 98-101. DOI:10.1038/nature06830 |
[24] |
WU Y T, YU H T, ZHANG J P, et al. USI-AUC: an evaluation criterion of community detection based on a novel link-prediction method[J]. Intelligent Data Analysis, 2018, 22(2): 439-462. DOI:10.3233/IDA-173400 |
[25] |
王守辉, 于洪涛, 黄瑞阳, 等. 基于模体演化的时序链路预测方法[J]. 自动化学报, 2016, 42(5): 735-745. WANG S H, YU H T, HUANG R Y, et al. A temporal link prediction method based on motif evolution[J]. Acta Automatica Sinica, 2016, 42(5): 735-745. (in Chinese) |
[26] |
HESPANHA P. An efficient MATLAB algorithm for graph partitioning[EB/OL]. [2021-03-17]. https://www.researchgate.net/profile/Joao-Hespanha/publication/239563498_An_Efficient_MATLAB_Algorithm_for_Graph_Partitioning/links/545ab7050cf2c46f66438782/An-Efficient-MATLAB-Algorithm-for-Graph-Partitioning.pdf.
|
[27] |
GIRVAN M, NEWMAN M E J. Community structure in social and biological networks[J]. Proceedings of the National Academy of Sciences of the United States of America, 2002, 99(12): 7821-7826. DOI:10.1073/pnas.122653799 |
[28] |
NEWMAN M E J. Finding community structure in networks using the eigenvectors of matrices[J]. Physical Review E, 2006, 74(3): 036104. DOI:10.1103/PhysRevE.74.036104 |
[29] |
DE DOMENICO M, SOLÉ-RIBALTA A, GÓMEZ S, et al. Navigability of interconnected networks under random failures[J]. Proceedings of the National Academy of Sciences of the United States of America, 2014, 111(23): 8351-8356. DOI:10.1073/pnas.1318469111 |
[30] |
COLEMAN J, KATZ E, MENZEL H. The diffusion of an innovation among physicians[J]. Sociometry, 1957, 20(4): 253-270. DOI:10.2307/2785979 |
[31] |
PAJEK datasets[EB/OL]. [2021-03-17]. http://vlado.fmf.unilj.si/pub/networks/data/mix/mixed.htm.
|
[32] |
ŠUBELJ L, BAJEC M. Robust network community detection using balanced propagation[J]. The European Physical Journal B, 2011, 81(3): 353-362. DOI:10.1140/epjb/e2011-10979-2 |
[33] |
WATTS D J, STROGATZ S H. Collective dynamics of 'small-world' networks[J]. Nature, 1998, 393(6684): 440-442. DOI:10.1038/30918 |
[34] |
ULANOWICZ R E, BONDAVALLI C, EGNOTOVICH M S. Network analysis of trophic dynamics in south Florida ecosystem, FY 97: the Florida Bay ecosystem[EB/OL]. [2021-03-17]. https://www.researchgate.net/publication/237005294_Network_Analysis_of_Trophic_Dynamics_in_South_Florida_Ecosystem_FY_97_The_Florida_Bay_Ecosystem.
|
[35] |
LORRAIN F, WHITE H C. Structural equivalence of individuals in social networks[M]. Amsterdam, Holland: Elsevier, 1977.
|
[36] |
ADAMIC L A, ADAR E. Friends and neighbors on the Web[J]. Social Networks, 2003, 25(3): 211-230. DOI:10.1016/S0378-8733(03)00009-1 |
[37] |
BARABASI A L, ALBERT R. Emergence of scaling in random networks[J]. Science, 1999, 286(5439): 509-512. DOI:10.1126/science.286.5439.509 |
[38] |
LIU W P, LÜ L. Link prediction based on local random walk[J]. Europhysics Letters, 2010, 89(5): 58007-58012. DOI:10.1209/0295-5075/89/58007 |
[39] |
KLEIN D J, RANDIĆ M. Resistance distance[J]. Journal of Mathematical Chemistry, 1993, 12(1): 81-95. DOI:10.1007/BF01164627 |