«上一篇 下一篇»
  计算机工程  2022, Vol. 48 Issue (7): 51-58  DOI: 10.19678/j.issn.1000-3428.0061523
0

引用本文  

吴翼腾, 于洪涛, 顾泽宇. 基于统一描述网络结构模型的链路预测方法[J]. 计算机工程, 2022, 48(7), 51-58. DOI: 10.19678/j.issn.1000-3428.0061523.
WU Yiteng, YU Hongtao, GU Zeyu. Link Prediction Method Based on Network Structure Model for Unified Description[J]. Computer Engineering, 2022, 48(7), 51-58. DOI: 10.19678/j.issn.1000-3428.0061523.

基金项目

国家自然科学基金创新研究群体项目(61521003);郑州市协同创新重大专项(162/32410218)

作者简介

吴翼腾(1992—),男,工程师、博士,主研方向为复杂网络、人工智能安全;
于洪涛,研究员、博士、博士生导师;
顾泽宇,硕士

文章历史

收稿日期:2021-04-30
修回日期:2021-09-07
基于统一描述网络结构模型的链路预测方法
吴翼腾1 , 于洪涛1 , 顾泽宇2     
1. 信息工程大学 信息技术研究所, 郑州 450002;
2. 中国人民解放军61660部队, 北京 100080
摘要:面向网络链路预测的随机分块模型和层次结构模型利用全概率思想计算节点对之间的链路形成概率,但无法有效利用从宏观、中观网络结构到微观低阶环或模体结构中的重叠结构信息,导致链路预测结果的准确率较低。根据笛卡尔积和幂集等概念,借鉴随机分块模型和层次结构模型思想,构建一种对层次结构信息、重叠结构信息和微观结构信息进行统一描述的网络结构模型(USI)。基于USI模型提出一种链路预测方法,依据网络结构信息给出USI模型中的集合划分,利用最大似然估计法计算节点对之间的链路形成概率,最终根据概率并联策略得到链路预测结果。实验结果表明,与基于节点相似性的经典链路预测方法相比,该方法在LT、ER、OP网络数据集上的AUC值提升了0.075~0.143,具有更高的链路预测准确性,并且验证了网络规模对链路形成具有一定的影响。
关键词复杂网络    链路预测    统一描述    网络结构模型    前端融合    
Link Prediction Method Based on Network Structure Model for Unified Description
WU Yiteng1 , YU Hongtao1 , GU Zeyu2     
1. Institute of Information Technology, Information Engineering University, Zhengzhou 450002, China;
2. Unit 61660 of PLA, Beijing 100080, China
Abstract: The random block model and hierarchical structure model for network link prediction use the idea of total probability to calculate the link formation probability between node pairs.They, however, cannot effectively use overlapping structural information from macroscopic and mesoscopic network structures in this endeavor.Neither can they effectively use microscopic low-order rings or motif structures, resulting in low accuracy of link prediction results.In this study, according to the concepts of Cartesian product and power set, and drawing on ideas from the random block model and the hierarchical structure model, a network structure model called the USI(Uniform-Structure-Information) model is constructed.The USI model uniformly describes hierarchical, overlapping, and microstructure information.Based on the USI model, a link prediction method is proposed.According to the network structure information, the set division in the USI model is given.The maximum likelihood estimation method is used to calculate the link formation probability between node pairs, and finally, the link prediction result is obtained according to probabilistic parallel strategies.The experimental results show that compared with the classic link prediction method based on node similarity, the AUC(Area Under the Receiver Operation Characteristic Curve) value of this method on the LT(London Transport1), ER(Euroroad), and OP(Opsahl_ powergrid) network datasets is improved by 0.075~0.143, and it has higher link prediction accuracy.It is verified that this network scale has a certain influence on the link formation.
Key words: complex network    link prediction    unified description    network structure model    front-end fusion    

开放科学(资源服务)标志码(OSID):

0 概述

复杂网络链路预测是指运用网络结构信息对节点对之间存在连接的可能性进行预测[1-2]。链路预测具有很强的理论和实际应用价值,可以帮助人们认识复杂网络演化机制与结构信息[3],还可以为生物蛋白质结构网络构建、电子商务商品推荐、资源贸易协调、电信用户通联关系挖掘等任务提供技术支持[4-5]

链路预测方法主要分为基于网络结构信息相似性、融合网络多维度信息、基于网络结构模型等方法。基于网络结构信息进行链路预测的主要难点是找到网络生成演化机理及生成链路的诱导因素。例如,无标度网络仅由2条基本假设(网络是不断增长的、增长过程中节点倾向于与度大的节点相连),即可推导出网络中节点的度呈长尾分布这一共性规律[6]。这2条基本假设通过网络生成机理,解释了度分布不呈正态分布的原因。同样地,如何解释网络中链路的成因来预测未知链路也是链路预测的难点。

基于网络结构信息定义节点对之间相似性的链路预测方法使用单一维度的网络信息或直接明确定义多维度信息的关系,具有理论简洁、效率较高的特点。吕琳媛等[7-8]将节点对的共同邻居数赋予权重,提出共同邻居加权的资源分配指标。YAO等[9-11]提出基于局部拓扑信息加权的相似性指标。刘树新等[12]提出网络中节点间资源传输机理的资源传输匹配度指标。BISWAS等[13-15]考虑网络的社区信息,利用社区信息对经典相似性指标加权,或仅在节点所属社区内计算经典相似性指标,提升链路预测准确度。基于相似性度量的链路预测方法通常是对微观网络结构进行建模,从节点对及其周围的微观结构出发,解析链路形成机理预测链路。

随着网络结构信息研究的深入,网络多维度信息被充分挖掘。为进一步提高相似性指标的准确性和鲁棒性,学者们提出融合网络多维度信息的链路预测方法,例如,组合规则法、OWA算子融合法[16]、AdaBoost融合法[17]等基于相似性指标的后端融合方法[18]。基于机器学习或深度学习的链路预测方法将链路预测问题转化为有无连边的二分类问题,本质上也可将其看作多指标经分类器输出的后端融合方法。吴翼腾等[19]详细研究了后端融合方法的理论极限问题,提出并证明了采用组合方法进行链路预测的理论极限定理。后端融合方法主要针对数据建模,侧重于预测的准确性,但却牺牲了算法的可解释性,难以解析网络中链路形成的诱导因素[20]

基于网络结构模型的链路预测方法从宏观上对网络结构进行建模,首先给出网络生成假设,然后根据网络生成假设求出节点对产生链路的概率,最后利用全概率思想计算某条连边的生成概率,主要包括随机分块模型[21-22]和层次结构模型[23]。随机分块模型假设节点间的连接概率取决于节点所在社区:同一社区内部节点连接概率相同,不同社区间连接概率仅与所在社区有关,通过随机划分节点所在社区,基于某种划分计算社区内和社区间形成连边的概率,并计算社区划分的先验概率,但无法处理重叠社区结构以及节点间的分级与层次结构。层次结构模型对节点间的层次结构进行建模,建立节点连接关系的谱系图,与随机分块模型计算连接概率的核心思想相似,首先计算基于某种谱系图和节点间生成连边概率,然后计算谱系图的先验概率,最后采用全概率思想计算最终的链路形成概率。在基于网络结构模型的链路预测方法中,连边的综合概率加权融合了多种子模型的连边概率,但该融合方法不同于后端融合方法,需对网络结构建模,因此将其概括为综合网络结构信息的前端融合方法。

随机分块模型和层次结构模型从不同角度给出了网络结构描述方式[24],但无法有效处理从宏观、中观网络社区结构到微观低阶环或模体[25]结构中的重叠结构信息,而实际网络中重叠结构无处不在。本文构建一种统一描述网络结构模型,简称USI(Uniform-Structure-Information)模型,既包含节点的层次结构信息,又可使节点从属于不同集合,并基于USI模型提出一种链路预测方法,通过实验以验证该方法的有效性。

1 问题描述和评价指标

给定t时刻的网络$ G(V, E) $,其中,VE分别表示节点集合和边集合。链路预测的目的是预测未来的t′时刻将要出现的链路或消失的链路,或是预测当前t时刻网络未观测到的链路或错误链路[20],即链路预测方法赋予节点对间链路预测的评分值,按照评分值的大小判定是否存在链路。

为了评估链路预测方法的准确性,需对网络进行训练集和测试集的划分,链路预测方法仅允许运用训练集进行预测。一般使用AUC(Area Under the Receiver Operation Characteristic Curve)衡量预测准确性。AUC不受有无连边两类样本非平衡性的影响(无连边的节点对远大于有连边的节点对数量),可以理解为在测试集中随机选择一条边的分数值比随机选择一条不存在的边的分数值高的概率[7],即每次从测试集中随机选择一条边,再从不存在的边中随机选择一条边,若前者高则加1分,若相等则加0.5分,这样独立比较n次。若有n′次测试集得分高,有n″次两者相等,则AUC定义如下:

$ {A}_{\mathrm{A}\mathrm{U}\mathrm{C}}=\frac{n{'}+0.5n{'}{'}}{n} $ (1)
2 统一描述网络结构模型 2.1 统一描述网络结构模型定义

定义1   在统一描述网络结构模型中,A0为网络中所有节点组成的集合,集合族$ {\mathfrak{D}}_{k} $中的元素$ {D}_{i} $也为集合。

1)定义幂集:

$ {A}_{1}={2}^{{A}_{0}}, {A}_{2}={2}^{{A}_{1}}, \cdots , {A}_{i}={2}^{{A}_{i-1}}, i=\mathrm{1, 2}, \cdots $ (2)

对任意i$ {A}_{i} $中具有指定关系f的元素可以组成集合族$ {\mathfrak{D}}_{k}, {\mathfrak{D}}_{k}=\{{D}_{1}, {D}_{2}, \cdots ,{D}_{n}\} $

$ f:\mathrm{ }({A}_{i}{)}^{k}\to {\mathfrak{D}}_{k}, {\mathfrak{D}}_{k}\subset ({A}_{i}{)}^{k}, k=\mathrm{1, 2}, \cdots , \left|{A}_{i}\right| $ (3)
$ ({A}_{i}{)}^{k}=\left\{\left\{{A}_{i1}, {A}_{i2}, \cdots , {A}_{ik}\right\}:{A}_{ij}\in {A}_{i}, 1\le j\le k\right\} $ (4)

其中:$ \left|{A}_{i}\right| $表示集合$ {A}_{i} $的势,即集合$ {A}_{i} $中元素的个数。

特别地,当i=0时:

$ f:\mathrm{ }({A}_{0}{)}^{k}\to {\mathfrak{D}}_{k}, {\mathfrak{D}}_{k}\subset ({A}_{0}{)}^{k} $ (5)

2)假设集合$ {D}_{i} $内元素建立联系的概率$ {p}_{i} $相同:

$ \left\{\begin{array}{l}0\le {p}_{i} < 1, x\ne y且x, y\in {D}_{i}\\ {p}_{i}=1, x=y且x, y\in {D}_{i}\end{array}\right. $ (6)

USI模型可以解释无向网络中各种节点的连接和组织关系,为网络中各类节点的层次关系、重叠关系等建立简明清晰的表示方法。定义1中的第1个部分可以理解为有共同特性的元素可以组成集合,第2个部分可以理解为集合内部元素间发生联系的概率相同。

根据模型定义,组成集合的元素可以是集合或非集合。当集合中元素为非集合时,表示节点对之间存在链路的概率;当集合中的元素为集合时,表示集合与集合建立联系的概率。例如:一个班级中的所有同学组成一个集合,集合中元素为非集合,p表示该班级任意两个同学存在联系的概率;一个学校所有班级组成一个集合,集合中元素班级仍为集合,p表示班级之间建立联系的概率,间接表示班级之间同学建立联系的概率。

定义2   在USI模型中,Ai及其非空子集的元素为i阶元素,$ i=\mathrm{1, 2}, \cdots $i阶元素记为$ {\mathfrak{X}}^{\left(i\right)} $,2阶以上元素称为高阶元素。

定义3   在USI模型中,集合所含元素的阶数称为集合的阶。i阶集合记为$ {\mathfrak{X}}^{\left(i\right)} $,2阶以上集合称为高阶集合。

例如一个由3个节点组成的网络,$ {A}_{0}=\{\mathrm{1, 2}, 3\} $,根据定义2,元素1、2、3都是0阶元素,根据定义3,$ {A}_{0} $是0阶集合。由于元素$ \left\{\mathrm{\varnothing }, \left\{1\right\}, \left\{2\right\}, \left\{3\right\}, \left\{\mathrm{1, 2}\right\}, \right.\left\{\mathrm{1, 3}\right\}, $ $ \left\{\mathrm{2, 3}\right\}, \left.\{\mathrm{1, 2}, 3\}\right\}={A}_{1} $,因此元素$ \left\{\mathrm{1, 2}\right\} $为1阶元素。设指定关系f为选取$ {A}_{1} $中包含节点对$ \left\{\mathrm{1, 2}\right\} $的元素,则$ f\left[\right({A}_{1}{)}^{1}]={\mathfrak{D}}_{1}=\left\{\left\{\left\{\mathrm{1, 2}\right\}\right\}, \left\{\{\mathrm{1, 2}, 3\}\right\}\right\} $$ f\left[\right({A}_{1}{)}^{2}]={\mathfrak{D}}_{2}=\left\{\left\{\left\{\mathrm{1, 2}\right\}, \{\mathrm{1, 2}, 3\}\right\}\right\} $,当$ k\ge 3 $时,$ f\left[\right({A}_{1}{)}^{k}]=\mathrm{\varnothing } $。显然,$ ({A}_{i}{)}^{k}\subseteq {2}^{{A}_{i}}={A}_{i+1} $$ i+1 $阶集合。由于$ \left\{\mathrm{1, 2}\right\} $为1阶元素,因此集合$ \left\{\left\{\mathrm{1, 2}\right\}\right\} $为1阶集合。又如,$ {\Lambda }_{1}=\left\{\left\{\mathrm{1, 2}\right\}\mathrm{ }, \left\{\mathrm{1, 3}\right\}\mathrm{ }, \{\mathrm{1, 2}, 3\}\right\} $$ {A}_{1} $的一个非空子集,即$ {\Lambda }_{1}\subseteq {A}_{1} $,因此$ {\Lambda }_{1} $中的元素为1阶元素,$ {\Lambda }_{1} $为1阶集合。同理,$ \left\{\left\{\mathrm{1, 3}\right\}, \{\mathrm{1, 2}, 3\}\right\}\in {2}^{{\Lambda }_{1}}\subseteq {2}^{{A}_{1}}={A}_{2} $,因此元素$ \left\{\left\{\mathrm{1, 3}\right\}, \{\mathrm{1, 2}, 3\}\right\} $为2阶元素。

USI模型是对随机分块模型和层次结构模型的一般化推广。随机分块模型假设网络被分成若干个群,两个节点产生链路的概率只取决于节点所在的群,无法体现网络的层次结构和重叠结构信息。层次结构模型将网络用族谱树的形式表示,网络中$ \left|{A}_{0}\right| $个节点作为叶子节点,族谱树通过$ \left|{A}_{0}\right|-1 $个非叶子节点将它们联系起来。将每个非叶子节点赋予一个概率值,每两个叶子节点连边的概率用它们最近共同非叶子节点处的概率表示。层次结构模型中若一个节点从属于某一叶子分支,其本身也属于上一级非叶子节点所属的叶子分支,即可以表示网络的层次结构特性。但是,节点不可从属于同级非叶子节点所属的其他叶子分支,即无法体现网络的重叠性。本质上,层次结构模型可以包含随机分块模型。USI模型假设有某种共同特性的元素可以组成集合,集合中元素建立联系的概率相同。若USI模型的最高阶集合为1阶集合,且所有1阶元素的交集为空集时,USI模型退化为随机分块模型。若每个集合有且仅有2个元素,且所有元素从属于唯一的对应阶集合时,USI模型退化为层次结构模型,层次结构模型可以包含高阶元素。基于该分析,层次结构模型是随机分块模型的推广,USI模型又是层次结构模型的推广。由此可以进一步得出,随机分块模型和层次结构模型实际上是USI模型从不同角度退化后的加权组合,加权系数由该模型的合理程度决定,属于链路预测的前端融合方法。当给定指定关系f后,USI模型可以用于链路预测,具体方法将在后文给出。

USI模型本身可以看作加权网络模型。只要当i=0、k=2时,即两元素构成0阶集合的指定关系f为任意两节点对组成集合,p根据连边权重设定后,USI模型就可转化为加权网络模型。

2.2 统一描述网络结构模型性质

命题1   $ i(i\ge 1) $阶集合$ {\mathfrak{X}}^{\left(i\right)}=\{{X}_{1}^{\left(i\right)}, {X}_{2}^{\left(i\right)}, \cdots , {X}_{n}^{\left(i\right)}\} $可以通过集合中元素的并集运算g降阶为$ i-1 $阶集合。

$ g:{\mathfrak{X}}^{\left(i\right)}\to \underset{j=1}{\overset{n}{\cup }}{X}_{j}^{\left(i\right)} $ (7)

显然,$ \underset{j=1}{\overset{n}{\cup }}{X}_{j}^{\left(i\right)} $$ i-1 $阶集合,记为$ {\mathfrak{X}}^{(i-1)} $

推论1   $ i(i\ge 2) $阶集合$ {\mathfrak{X}}^{\left(i\right)}=\{{X}_{1}^{\left(i\right)}, {X}_{2}^{\left(i\right)}, \cdots , {X}_{n}^{\left(i\right)}\} $可以通过集合中元素的并集运算gi次迭代降阶为0阶集合。

证明  根据命题1,i阶集合经1次元素的并集运算g可降为$ i-1 $阶集合;该$ i-1 $阶集合经第2次元素的并集运算g可降为$ i-2 $阶集合;以此类推,经过i次元素的并集运算g可降为0阶集合。证毕。

推论2   $ i(i\ge 2) $阶集合$ {\mathfrak{X}}^{\left(i\right)}=\{{X}_{1}^{\left(i\right)}, {X}_{2}^{\left(i\right)}, \cdots , {X}_{n}^{\left(i\right)}\} $可以将其元素看作$ i-1 $阶集合,对每个$ i-1 $阶集合通过集合中元素的并集运算g$ i-1 $次迭代,使原i阶集合降阶为1阶集合。

证明  将i阶集合的每个元素看作$ i-1 $阶集合,根据推论1,每个$ i-1 $阶集合经过$ i-1 $次元素的并集运算g的迭代,可降为0阶集合,则原i阶集合降为以0阶集合为元素构成的1阶集合。证毕。

设3阶集合$ {\mathfrak{X}}^{\left(3\right)}=\left\{{X}_{1}^{\left(3\right)}, {X}_{2}^{\left(3\right)}, {X}_{3}^{\left(3\right)}\right\}= $$ \left\{\left\{\left\{\left\{\mathrm{1, 2}, 3\right\},\left\{6\right\}\right\},\right.\right. $$ \left.\left\{\left\{\mathrm{4, 5}\right\}\right\}\right\} $$ \left\{\left\{\left\{6\right\}, \left\{\mathrm{7, 8}, 9\right\}\right\}\right\}, \left\{\left\{\left\{\mathrm{6, 9}\right\}, \left\{9\right\}\right\}\right\} $,显然,$ {X}_{1}^{\left(3\right)}=\left\{\left\{\left\{\mathrm{1, 2}, 3\right\}, \left\{6\right\}\right\}, \left\{\left\{\mathrm{4, 5}\right\}\right\}\right\} $$ {X}_{2}^{\left(3\right)}=\left\{\left\{\left\{6\right\}, \left\{\mathrm{7, 8}, 9\right\}\right\}\right\} $$ {X}_{3}^{\left(3\right)}=\left\{\left\{\left\{\mathrm{6, 9}\right\}, \left\{9\right\}\right\}\right\} $是3阶元素。根据推论1,该3阶集合可降阶为2阶集合,如式(8)所示。该2阶集合可以降阶为1阶集合,如式(9)所示。该1阶集合可以降阶为0阶集合,如式(10)所示。

$ \begin{array}{l}{\mathfrak{X}}^{\left(2\right)}=\underset{j=1}{\overset{3}{\cup }}{X}_{j}^{\left(3\right)}=\left\{\left\{\left\{\mathrm{1, 2}, 3\right\}, \left\{6\right\}\right\}, \left\{\left\{\mathrm{4, 5}\right\}\right\}\right\}\bigcup \left\{\left\{\left\{6\right\}, \left\{\mathrm{7, 8}, 9\right\}\right\}\right\}\bigcup \left\{\left\{\left\{6.9\right\}, \left\{9\right\}\right\}\right\}=\\ \left\{\left\{\left\{\mathrm{1, 2}, 3\right\}, \left\{6\right\}\right\}, \left\{\left\{\mathrm{4, 5}\right\}\right\}, \left\{\left\{6\right\}, \left\{\mathrm{7, 8}, 9\right\}\right\}, \left\{\left\{\mathrm{6, 9}\right\}, \left\{9\right\}\right\}\right\}\end{array} $ (8)
$ \begin{array}{l}{\mathfrak{X}}^{\left(1\right)}=\underset{i=1}{\overset{4}{\cup }}{X}_{j}^{\left(2\right)}=\left\{\left\{\mathrm{1, 2}, 3\right\}, \left\{6\right\}\right\}\bigcup \left\{\left\{\mathrm{4, 5}\right\}\right\}\bigcup \left\{\left\{6\right\}, \left\{\mathrm{7, 8}, 9\right\}\right\}\bigcup \left\{\left\{\mathrm{6, 9}\right\}, \left\{9\right\}\right\}=\\ \left\{\left\{\mathrm{1, 2}, 3\right\}, \left\{6\right\}, \left\{\mathrm{4, 5}\right\}, \left\{\mathrm{7, 8}, 9\right\}, \left\{\mathrm{6, 9}\right\}, \left\{9\right\}\right\}\end{array} $ (9)
$ {\mathfrak{X}}^{\left(0\right)}=\underset{j=1}{\overset{3}{\cup }}{X}_{j}^{\left(1\right)}=\left\{\mathrm{1, 2}, 3\right\}\bigcup \left\{6\right\}\bigcup \left\{\mathrm{4, 5}\right\}\bigcup \left\{\mathrm{7, 8}, 9\right\}\bigcup \left\{\mathrm{6, 9}\right\}\bigcup \left\{9\right\}=\left\{\mathrm{1, 2}, \mathrm{3, 4}, \mathrm{5, 6}, \mathrm{7, 8}, 9\right\} $ (10)

根据推论2,$ {\mathfrak{X}}^{\left(3\right)}=\left\{{X}_{1}^{\left(3\right)}, {X}_{2}^{\left(3\right)}, {X}_{3}^{\left(3\right)}\right\} $中的3阶元素$ {X}_{1}^{\left(3\right)}, {X}_{2}^{\left(3\right)}, {X}_{3}^{\left(3\right)} $可降为2阶元素:

$ \begin{array}{l}{X}_{1}^{\left(2\right)}=\left\{\left\{\mathrm{1, 2}, 3\right\}, \left\{6\right\}\right\}\bigcup \left\{\left\{\mathrm{4, 5}\right\}\right\}=\\ \left\{\left\{\mathrm{1, 2}, 3\right\}, \left\{6\right\}, \left\{\mathrm{4, 5}\right\}\right\}\end{array} $
$ {X}_{2}^{\left(2\right)}=\left\{\left\{6\right\}, \left\{\mathrm{7, 8}, 9\right\}\right\} $
$ {X}_{3}^{\left(2\right)}=\left\{\left\{\mathrm{6, 9}\right\}, \left\{9\right\}\right\} $

进一步地,2阶元素$ {X}_{1}^{\left(2\right)}, {X}_{2}^{\left(2\right)}, {X}_{3}^{\left(2\right)} $可降为1阶元素:

$ {X}_{1}^{\left(1\right)}=\left\{\mathrm{1, 2}, 3\right\}\bigcup \left\{6\right\}\bigcup \left\{\mathrm{4, 5}\right\}=\left\{\mathrm{1, 2}, \mathrm{3, 4}, \mathrm{5, 6}\right\} $
$ {X}_{2}^{\left(1\right)}=\left\{6\right\}\bigcup \left\{\mathrm{7, 8}, 9\right\}=\left\{\mathrm{6, 7}, \mathrm{8, 9}\right\} $
$ {X}_{3}^{\left(1\right)}=\left\{\mathrm{6, 9}\right\}\bigcup \left\{9\right\}=\left\{\mathrm{6, 9}\right\} $

最终得到由这3个1阶元素组成的1阶集合:

$ \begin{array}{l}{\mathfrak{X}}^{\left(1\right)}=\left\{{X}_{1}^{\left(1\right)}, {X}_{2}^{\left(1\right)}, {X}_{3}^{\left(1\right)}\right\}=\\ \left\{\left\{\mathrm{1, 2}, \mathrm{3, 4}, \mathrm{5, 6}\right\}, \left\{\mathrm{6, 7}, \mathrm{8, 9}\right\}, \left\{\mathrm{6, 9}\right\}\right\}\end{array} $ (11)
3 基于统一描述网络结构模型的链路预测

基于USI模型的链路预测方法的基本假设是两个节点发生联系的概率主要依赖于其所在的群体(集合)。因此,基于USI模型的链路预测方法首先根据可利用的信息给出模型中的集合划分,其次利用最大似然估计法估计概率p,最后假设各条路径产生的联系是相互独立的,根据并联概率给出链路预测得分。

3.1 集合划分

对于含有属性信息和真实群组结构的网络数据,可以根据该信息给出指定关系f确定各阶集合的划分组成。对于只含有节点和连边拓扑信息的数据,只能通过算法识别和合理策略给出指定关系f。现对只含有拓扑信息数据的集合进行分析。

根据USI模型可知,节点对之间链路的成因取决于节点对所属的集合及其概率。理论上,无论何种规模的网络结构均可被USI模型表示:只需将该种网络结构视作集合,并建立集合元素间的概率。根据实际应用场景,本文主要给出0阶和1阶集合的划分方式。

对于0阶集合,复杂网络的社区发现算法给出了针对仅含拓扑信息数据的0阶集合划分方式。USI模型的链路预测方法中引入社区发现算法,按特定社区发现算法划分的结果,规定指定关系f划分0阶集合。网络中的环也是十分重要的网络结构,1个长度为h的环,是由h个节点$ \{{v}_{1}, {v}_{2}, \cdots , {v}_{h}\} $h条边$ \{ < {v}_{1}, {v}_{2} > , < {v}_{2}, {v}_{3} > , \cdots , < {v}_{h-1}, {v}_{h} > , < {v}_{h}, {v}_{1} > \} $组成的封闭回路,其中,< ij > 表示边,且 < ij > = < ji > 。环的存在尤其是低阶环的数量对网络功能有重要影响。USI模型的链路预测方法也考虑网络中的低阶环作为0阶集合的划分方式。

对于1阶集合,考虑社区发现算法划分0阶集合两两交互作用的情况,将任意两个0阶集合组成1阶集合。为减少计算量,估计p时可设置阈值限定1阶集合概率p的建立范围,且低阶环不划分1阶集合。由于仅含拓扑信息,信息量有限,因此暂不考虑2阶以上集合的划分。

按照上述分析,给出指定关系f的如下3种策略:

1)当i=0、k=1,2,…,|A0|时,按社区发现算法的划分结果作为指定关系f1划分0阶集合。假设社区发现算法划分的全体社区结构为集合P$ P=\left\{{V}_{1}, {V}_{2}, \cdots , {V}_{n}\right\} $,则指定关系$ {f}_{1} $表示如下:

$ \begin{array}{l}{f}_{1}:\mathrm{ }({A}_{0}{)}^{k}\to {\mathfrak{D}}_{{f}_{1}k}, {\mathfrak{D}}_{{f}_{1}k}\subset ({A}_{0}{)}^{k}, \\ k=\mathrm{1, 2}, \cdots , \left|{A}_{0}\right|\end{array} $ (12)
$ {\mathfrak{D}}_{{f}_{1}k}={f}_{1}\left[({A}_{0}{)}^{k}\right]=\left\{{V}_{i}:\left|{V}_{i}\right|=k, {V}_{i}\in P\right\} $ (13)

2)当i = 0、k = 1,2,…,|A0|时,按指定关系$ {f}_{2} $将只差1条边构成k阶环的元素组成0阶集合:

$ \begin{array}{l}{f}_{2}:\mathrm{ }({A}_{0}{)}^{k}\to {\mathfrak{D}}_{{f}_{2}k}, {\mathfrak{D}}_{{f}_{2}k}\subset ({A}_{0}{)}^{k}, \\ k=\mathrm{1, 2}, \cdots , \left|{A}_{0}\right|\end{array} $ (14)
$ {\mathfrak{D}}_{{f}_{2}k}={f}_{2}\left[({A}_{0}{)}^{k}\right]=\left\{\begin{array}{l}\left\{{i}_{1}, {i}_{2}, \cdots , {i}_{k}\right\}:\mathrm{任}\mathrm{意}{i}_{1}, {i}_{2}, \cdots , {i}_{k}\in V\mathrm{且}{i}_{1}\ne {i}_{2}\ne \cdots \ne {i}_{k}, \\ \mathrm{存}\mathrm{在}\mathrm{唯}\mathrm{一} < i, j > , i={i}_{1}, {i}_{2}, \cdots , {i}_{k}, j={i}_{1}, {i}_{2}, \cdots , {i}_{k}, i\ne j\mathrm{使}\mathrm{得} < i, j > \notin E\end{array}\right\} $ (15)

3)当i=1、k=2时,按指定关系f3f1划分的0阶集合两两组成1阶集合:

$ {D}_{i}\in \underset{k=1}{\overset{\left|{A}_{0}\right|}{\cup }}{\mathfrak{D}}_{{f}_{1}k}={\mathfrak{D}}_{{f}_{1}} $ (16)
$ {f}_{3}:\mathrm{ }({A}_{1}{)}^{2}\to \mathfrak{D}, \mathfrak{D}\subset ({A}_{1}{)}^{2} $ (17)
$ \mathfrak{D}={f}_{3}\left[({A}_{1}{)}^{2}\right]=\left\{\left\{{D}_{i}, {D}_{j}\right\}:\mathrm{任}\mathrm{意}{D}_{i}, {D}_{j}\in {\mathfrak{D}}_{{f}_{1}}, {D}_{i}\ne {D}_{j}\right\} $ (18)
3.2 概率估计

根据集合阶数的不同,概率p的估计可以分为3种情况,分别为0阶集合上概率p的估计、1阶集合上概率p的估计以及高阶集合上概率p的估计。

3.2.1 0阶集合$ {\mathfrak{X}}^{\left(0\right)} $上概率p的估计

对于0阶集合$ {\mathfrak{X}}^{\left(0\right)} $上概率p的估计,假设:

$ \left|{\mathfrak{X}}^{\left(0\right)}\right|={N}_{1} $ (19)

在仅含0阶元素组成的集合中,元素与元素间只有连边与非连边,概率p即定义为元素连边的概率。集合中元素连边数为随机变量XX服从$ B(N, p) $的二项分布,其中,N为集合中元素的最大可能连边数,$ N={C}_{{N}_{2}}^{2} $,对0阶集合上概率p的估计采用极大似然估计法,似然函数表示如下:

$ L(p, x)={p}^{x}{(1-p)}^{N-x}, x=\mathrm{0, 1}, \cdots , N $ (20)

其中:x是0阶集合观测到的实际连边数。

令:

$ \frac{\mathrm{d}L(p, x)}{\mathrm{d}p}=0 $ (21)

解得:

$ \widehat{p}=\frac{x}{N} $ (22)

图 1所示,在0阶集合中共有10个节点、12条连边,则概率p的估计值为$ \widehat{p}=12/{C}_{10}^{2}=4/15 $

Download:
图 1 0阶集合上概率p的估计示例 Fig. 1 Example of estimating probability p on 0-order set
3.2.2 1阶集合$ {\mathfrak{X}}^{\left(1\right)} $上概率p的估计

对于1阶集合$ {\mathfrak{X}}^{\left(1\right)} $上概率p的估计,假设:

$ {\mathfrak{X}}^{\left(1\right)}=\left\{{X}_{j}^{\left(1\right)}:{X}_{j}^{\left(1\right)}\mathrm{是}1\mathrm{阶}\mathrm{元}\mathrm{素}\text{,}j=\mathrm{1, 2}, \cdots \right\} $ (23)
$ \left|{\mathfrak{X}}^{\left(1\right)}\right|=K $ (24)

考虑到1阶元素可能存在交集,假设:

$ \left|{X}_{j}^{\left(1\right)}\backslash \underset{j=1}{\overset{K}{\cup }}{X}_{j}^{\left(1\right)}\right|={k}_{j} $ (25)

集合中1阶元素的最大可能连边数定义如下:

$ N=\sum\limits_{i\ne j}{k}_{i}{k}_{j} $ (26)

因此对于1阶集合$ {\mathfrak{X}}^{\left(1\right)} $,集合中1阶元素间仅存在0阶元素的连边与非连边,问题同样转化为二项分布$ B(N, p) $p值估计问题,估计方法与3.2.1节相同。

图 2(a)所示的1阶集合不存在交集,只需考虑集合之间的实际连边数(为6)和可能最大的连边数(为$ 6\times 7 $=42),则概率p的估计值为$ \widehat{p} $=$ 6/(6\times 7)=1/7 $。如图 2(b)所示的集合存在交集,因此实际连边数仅考虑交集之外的实际连边(为7)和可能的最大连边(为$ 9\times 5=45 $),则概率p的估计值为$ \widehat{p} $=$ 7/(9\times 5)=7/45 $

Download:
图 2 1阶集合上概率p的估计示例 Fig. 2 Examples of estimating probability p on 1-order set
3.2.3 高阶集合$ {\mathfrak{X}}^{\left(i\right)}(i\ge 2) $上概率p的估计

根据推论2,将高阶集合通过元素的并集运算迭代降为1阶集合后,按照1阶集合上概率p的估计方法进行求解。

3.3 基于并联概率的链路预测得分确定

由于USI模型中同一节点可以从属于不同阶的不同集合,存在两节点对产生联系的多条路径,与生活中人际交往十分类似,每增加一条两节点产生联系的路径,则两节点产生联系的概率随之增大,因此采用节点对之间各条路径产生联系的概率值的并联概率作为最终链路预测得分。假设产生联系的各条路径在相互独立的条件下,最终链路预测得分可以表示如下:

$ {s}_{xy}=1-\prod\limits_{i=1}^{{N}_{xy}}\left(1-{p}_{xy}^{i}\right) $ (27)

其中:sxy为节点对xy的最终链路预测得分,即连边概率;$ {p}_{xy}^{i} $为节点对在第i个共同集合内连边的概率;Nxy为节点对xy所处的共同集合个数。

按照USI模型设计,各种规模的网络结构对链路形成的影响,主要体现在链路处于何种网络结构之中。无论何种网络结构,USI模型都将其视为集合以及集合中元素的连接概率。因此,链路的形成主要由节点对所属集合及其概率决定,节点对从属不同集合,则链路的形成由这些集合的共同作用效果决定。本文方法采用简单的概率并联策略,综合衡量不同集合的共同作用效果。

3.4 与其他链路预测方法的对比分析

基于USI模型的链路预测方法属于链路预测的前端融合方法。前端融合方法主要包括基于拓扑信息[10-11]、基于社区信息[13-15]加权的相似性、基于网络结构模型等[21-23]方法,一般具有很好的解释性,物理意义明确,侧重于直接从网络的生成演化规律出发进行预测,弱化从数据中学习模式。后端融合方法包括基于相似性的指标融合方法[16-18]、基于机器学习的分类方法[20]等,提高预测准确率的机理是将多维度网络信息拟合成准确率的多元函数,并对目标函数进行优化,使准确率达到最大,侧重于从数据中提取特征,以准确率为最终优化目标。因此,前端融合方法的准确率整体低于后端融合方法,尤其是深度学习方法。

USI模型的链路预测方法基于基本假设:两节点发生联系的概率主要依赖于其所在群体。使用USI模型的定义来表述:若节点对从属于哪个集合,则使用哪个集合的概率p来衡量节点对的关系;若节点对从属于多个集合,则使用这些集合共同作用的效果(即概率的并联)衡量节点对之间的关系。由于USI模型可以将多维度网络结构信息(包括已知的真实网络结构信息)输入进来,因此基于USI模型的链路预测可以综合利用网络的层次结构、重叠结构、微观结构等网络结构信息。基于以上信息,使用节点对从属集合的连接概率解释链路的生成方式进行链路预测。

4 实验与结果分析

基于USI模型的链路预测方法在实验过程中选取2种社区发现算法:1)Reichardt[26],该算法将社区结构理解为自旋组态,使其最小化自旋玻璃态的能量而得到一种社区划分结果;2)SpectralClust[27],对于图$ G(V, E) $,利用基于谱分解的图划分算法定义代价函数,求解优化问题得到一种社区划分结果。选取Reichardt算法的尺度参数为[3.0,2.5,2.0,1.5,1.0,0.5],SpectralClust算法的尺度参数为6,不同尺度参数的社区结构同时作为输入,因此具有层次信息和重叠信息。选取网络中的3阶环,即k=3。由Reichardt算法、3阶环作为输入的方法记为USI-1,由SpectralClust算法、3阶环作为输入的方法记为USI-2。

基于USI模型的链路预测方法在FB(Football)[28]、NS(Netscience)[29]、LT(London transport1)[30]、CKM-3[31]、A01[32]、ER(Euroroad)[33]、OP(Opsahl_powergrid)[34]、FWFB[35]8个网络数据集上进行实验。8个网络数据集的统计信息如表 1所示,其中,|V|表示网络中的节点数,|E|表示网络中的边数,< k > 表示网络中节点的平均度,< d > 表示网络中节点对的平均距离,C表示网络的平均集聚系数,r表示网络的关联系数,H表示度的分布熵。

下载CSV 表 1 网络数据集统计信息 Table 1 Network dataset statistics

在每个数据集上计算节点对的链路预测得分,每个数据集单独计算10次,每次独立划分训练集和测试集,训练集和测试集的占比分别为90%和10%,最终取10次计算的平均值作为最终链路预测结果。

选取若干具有代表性的基于节点相似性的链路预测方法进行性能对比,包括基于共同邻居的CN[36]方法、基于共同邻居和节点度加权的AA[37]和RA[8]方法、偏好连接相似性的PA[38]方法、基于局部路径的LP[8]方法、基于随机游走的LRW[39]和SRW[39]方法(后面的数字表示步数,例如LRW4表示随机游走的步数为4)、全局相似性方法ACT[39]等10种方法。将AUC指标作为评价指标,得到如表 2所示的实验结果,其中排名前2的指标值用加粗字体标示。由表 2中实验数据可得知,仅使用网络社区结构和3阶环信息的USI模型的链路预测方法可显著提升局部结构相似性和全局相似性方法的AUC指标。尤其在LT、ER、OP数据集上,USI模型的AUC达到0.9左右,相比其他基于节点相似性的链路预测方法的最优值提升了0.075~0.143,预测准确性显著提升,从而验证了不同规模的网络结构信息对链路形成的影响。

下载CSV 表 2 链路预测方法的AUC结果比较 Table 2 Comparison of AUC results of link prediction methods

从方法效率上看,设网络节点数为N1,随机游走的步数为n1,网络中节点平均度为k1,则CN、AA、RA、PA的时间复杂度为$ O({N}_{1}\cdot {k}_{1}^{2}) $,LP的时间复杂度为$ O({N}_{1}\cdot {k}_{1}^{3}) $,LRW、SRW的时间复杂度为$ O({N}_{1}\cdot {k}_{1}^{n}) $,ACT的时间复杂度为$ O\left({N}_{1}^{3}\right) $。基于USI模型的链路预测方法的时间复杂度主要分为划分社区结构、集合上度量p的估计、计算并联概率3个部分。Reichardt算法的时间复杂度为$ O\left({N}_{1}^{3}\right) $,SpectralClust算法的时间复杂度为$ O\left({N}_{1}\right) $。设Reichardt、SpectralClust两种社区发现算法划分了$ M(M\ll {N}_{1}) $个社区结构,组成$ M $个0阶集合和$ {C}_{M}^{2} $个1阶集合,则根据式(22),0阶集合和1阶集合上概率p的估计时间复杂度分别为$ O\left(M\right) $$ O\left({C}_{M}^{2}\right)\approx \frac{1}{2}O\left({M}^{2}\right) $。3阶环组成的0阶集合上概率p的估计可以等价转换为1次稀疏矩阵的乘法和归一化操作,时间复杂度为$ O({N}_{1}\cdot {k}_{1}^{2}) $。设共有$ {N}_{2}({N}_{2} < {C}_{N}^{2}) $个节点对同时从属于2个以上集合,设$ {N}_{3} $表示节点对所属共同集合个数的平均值,则根据式(27)并联概率的时间复杂度为$ O\left({N}_{3}\cdot {N}_{2}\right)\approx {N}_{3}O\left({N}_{2}\right) $。因此,USI-1的时间复杂度约为$ O\left({N}_{1}^{3}+{M}^{2}+{N}_{2}\right) $,USI-2的时间复杂度约为$ O\left({N}_{1}+{M}^{2}+{N}_{2}\right) $。由实验结果可知,USI-1方法的链路预测准确性普遍高于USI-2方法,预测准确性的提升是以方法的时间复杂度换取的,也间接说明网络中观社区结构质量对链路预测具有重要影响,进而验证了基于USI模型的链路预测方法假设的合理性。对于大规模网络,可选用USI-2方法,或在集合的划分中选用其他时间复杂度较低的社区发现算法。另外,1阶集合的划分具有灵活性,在大规模网络中可灵活调整1阶集合的划分数量,降低时间复杂度。

5 结束语

本文采用笛卡儿积、幂集等概念对多维度网络特征进行统一描述,建立统一描述网络结构模型(USI),并提出一种基于USI模型的链路预测方法。该方法利用USI模型对输入信息进行前端融合,描述实际网络的演化机理,并且明确了网络规模对链路形成的影响。实验结果验证了基于USI模型的链路预测方法的有效性。后续将融合其他的网络结构信息以及连边概率的组合方式,进一步提高链路预测准确率。此外,当USI模型输入仅为社区发现算法划分的社区结构信息时,即可利用USI模型的AUC值对重叠与非重叠社区结构的划分质量进行评价,下一步也将对此进行深入研究。

参考文献
[1]
GARCÍA-PÉREZ G, ALIAKBARISANI R, GHASEMI A, et al. Precision as a measure of predictability of missing links in real networks[J]. Physical Review E, 2020, 101(5): 052318. DOI:10.1103/PhysRevE.101.052318
[2]
ZHANG J, YU P S. Link prediction[EB/OL]. [2021-03-17]. https://doi.org/10.1007/978-3-030-12528-8_7.
[3]
谭索怡, 祁明泽, 吴俊, 等. 复杂网络链路可预测性: 基于特征谱视角[J]. 物理学报, 2020, 69(8): 182-191.
TAN S Y, QI M Z, WU J, et al. Link predictability of complex network from spectrum perspective[J]. Acta Physica Sinica, 2020, 69(8): 182-191. (in Chinese)
[4]
CANNISTRACI C V, ALANIS-LOBATO G, RAVASI T. From link-prediction in brain connectomes and protein interactomes to the local-community-paradigm in complex networks[J]. Scientific Reports, 2013, 3: 1613. DOI:10.1038/srep01613
[5]
李冬, 申德荣, 寇月, 等. 基于层次化混合特征图的链路预测方法[J]. 中国科学: 信息科学, 2020, 50(2): 221-238.
LI D, SHEN D R, KOU Y, et al. Research on a link-prediction method based on a hierarchical hybrid-feature graph[J]. Scientia Sinica Informationis, 2020, 50(2): 221-238. (in Chinese)
[6]
汪小帆. 无标度网络研究纷争: 回顾与评述[J]. 电子科技大学学报, 2020, 49(4): 499-510.
WANG X F. Controversial issues in researches on scale-free networks: an overview with a network perspective[J]. Journal of University of Electronic Science and Technology of China, 2020, 49(4): 499-510. (in Chinese)
[7]
吕琳媛, 周涛. 链路预测[M]. 北京: 高等教育出版社, 2013.
LÜ L Y, ZHOU T. Link prediction[M]. Beijing: Higher Education Press, 2013. (in Chinese)
[8]
ZHOU T, LÜ L, ZHANG Y C. Predicting missing links via local information[J]. The European Physical Journal B, 2009, 71(4): 623-630. DOI:10.1140/epjb/e2009-00335-8
[9]
YAO Y B, ZHANG R S, YANG F, et al. Link prediction based on local weighted paths for complex networks[J]. International Journal of Modern Physics C, 2017, 28(4): 1750053. DOI:10.1142/S012918311750053X
[10]
LIU S X, JI X S, LIU C X, et al. Similarity indices based on link weight assignment for link prediction of unweighted complex networks[J]. International Journal of Modern Physics B, 2017, 31(2): 1650254. DOI:10.1142/S0217979216502544
[11]
王凯, 李星, 兰巨龙, 等. 一种基于资源传输路径拓扑有效性的链路预测方法[J]. 电子与信息学报, 2020, 42(3): 653-660.
WANG K, LI X, LAN J L, et al. A new link prediction method for complex networks based on topological effectiveness of resource transmission paths[J]. Journal of Electronics & Information Technology, 2020, 42(3): 653-660. (in Chinese)
[12]
刘树新, 李星, 陈鸿昶, 等. 基于资源传输匹配度的复杂网络链路预测方法[J]. 通信学报, 2020, 41(6): 70-79.
LIU S X, LI X, CHEN H C, et al. Link prediction method based on matching degree of resource transmission for complex network[J]. Journal on Communications, 2020, 41(6): 70-79. (in Chinese)
[13]
BISWAS A, BISWAS B. Community-based link prediction[J]. Multimedia Tools and Applications, 2017, 76(18): 18619-18639. DOI:10.1007/s11042-016-4270-9
[14]
DE BACCO C, POWER E A, LARREMORE D B, et al. Community detection, link prediction, and layer interdependence in multilayer networks[J]. Physical Review E, 2017, 95: 042317.
[15]
MALLEK S, BOUKHRIS I, ELOUEDI Z, et al. Evidential Link Prediction Based on Group Information[M]. Berlin, Germany: Springer, 2015.
[16]
HE Y L, LIU J N K, HU Y X, et al. OWA operator based link prediction ensemble for social network[J]. Expert Systems with Applications, 2015, 42(1): 21-50. DOI:10.1016/j.eswa.2014.07.018
[17]
吴祖峰, 梁棋, 刘峤, 等. 基于AdaBoost的链路预测优化算法[J]. 通信学报, 2014, 35(3): 116-123.
WU Z F, LIANG Q, LIU Q, et al. Modified link prediction algorithm based on AdaBoost[J]. Journal on Communications, 2014, 35(3): 116-123. (in Chinese)
[18]
YU H T, WANG S H, MA Q Q. Link prediction algorithm based on the Choquet fuzzy integral[J]. Intelligent Data Analysis, 2016, 20(4): 809-824. DOI:10.3233/IDA-160833
[19]
吴翼腾, 于洪涛, 黄瑞阳, 等. 采用组合方法进行链路预测的理论极限研究[J]. 通信学报, 2020, 41(6): 34-50.
WU Y T, YU H T, HUANG R Y, et al. Theoretical limit of link prediction using a combination method[J]. Journal on Communications, 2020, 41(6): 34-50. (in Chinese)
[20]
MARTÍNEZ V, BERZAL F, CUBERO J C. A survey of link prediction in complex networks[J]. ACM Computing Surveys, 2017, 49(4): 69.
[21]
HOLLAND P W, LASKEY K B, LEINHARDT S. Stochastic block models: first steps[J]. Social Networks, 1983, 5(2): 109-137. DOI:10.1016/0378-8733(83)90021-7
[22]
GUIMERÀ R, SALES-PARDO M. Missing and spurious interactions and the reconstruction of complex networks[J]. Proceedings of the National Academy of Sciences of the United States of America, 2009, 106(52): 22073-22078. DOI:10.1073/pnas.0908366106
[23]
CLAUSET A, MOORE C, NEWMAN M E J. Hierarchical structure and the prediction of missing links in networks[J]. Nature, 2008, 453(7191): 98-101. DOI:10.1038/nature06830
[24]
WU Y T, YU H T, ZHANG J P, et al. USI-AUC: an evaluation criterion of community detection based on a novel link-prediction method[J]. Intelligent Data Analysis, 2018, 22(2): 439-462. DOI:10.3233/IDA-173400
[25]
王守辉, 于洪涛, 黄瑞阳, 等. 基于模体演化的时序链路预测方法[J]. 自动化学报, 2016, 42(5): 735-745.
WANG S H, YU H T, HUANG R Y, et al. A temporal link prediction method based on motif evolution[J]. Acta Automatica Sinica, 2016, 42(5): 735-745. (in Chinese)
[26]
[27]
GIRVAN M, NEWMAN M E J. Community structure in social and biological networks[J]. Proceedings of the National Academy of Sciences of the United States of America, 2002, 99(12): 7821-7826. DOI:10.1073/pnas.122653799
[28]
NEWMAN M E J. Finding community structure in networks using the eigenvectors of matrices[J]. Physical Review E, 2006, 74(3): 036104. DOI:10.1103/PhysRevE.74.036104
[29]
DE DOMENICO M, SOLÉ-RIBALTA A, GÓMEZ S, et al. Navigability of interconnected networks under random failures[J]. Proceedings of the National Academy of Sciences of the United States of America, 2014, 111(23): 8351-8356. DOI:10.1073/pnas.1318469111
[30]
COLEMAN J, KATZ E, MENZEL H. The diffusion of an innovation among physicians[J]. Sociometry, 1957, 20(4): 253-270. DOI:10.2307/2785979
[31]
PAJEK datasets[EB/OL]. [2021-03-17]. http://vlado.fmf.unilj.si/pub/networks/data/mix/mixed.htm.
[32]
ŠUBELJ L, BAJEC M. Robust network community detection using balanced propagation[J]. The European Physical Journal B, 2011, 81(3): 353-362. DOI:10.1140/epjb/e2011-10979-2
[33]
WATTS D J, STROGATZ S H. Collective dynamics of 'small-world' networks[J]. Nature, 1998, 393(6684): 440-442. DOI:10.1038/30918
[34]
ULANOWICZ R E, BONDAVALLI C, EGNOTOVICH M S. Network analysis of trophic dynamics in south Florida ecosystem, FY 97: the Florida Bay ecosystem[EB/OL]. [2021-03-17]. https://www.researchgate.net/publication/237005294_Network_Analysis_of_Trophic_Dynamics_in_South_Florida_Ecosystem_FY_97_The_Florida_Bay_Ecosystem.
[35]
LORRAIN F, WHITE H C. Structural equivalence of individuals in social networks[M]. Amsterdam, Holland: Elsevier, 1977.
[36]
ADAMIC L A, ADAR E. Friends and neighbors on the Web[J]. Social Networks, 2003, 25(3): 211-230. DOI:10.1016/S0378-8733(03)00009-1
[37]
BARABASI A L, ALBERT R. Emergence of scaling in random networks[J]. Science, 1999, 286(5439): 509-512. DOI:10.1126/science.286.5439.509
[38]
LIU W P, LÜ L. Link prediction based on local random walk[J]. Europhysics Letters, 2010, 89(5): 58007-58012. DOI:10.1209/0295-5075/89/58007
[39]
KLEIN D J, RANDIĆ M. Resistance distance[J]. Journal of Mathematical Chemistry, 1993, 12(1): 81-95. DOI:10.1007/BF01164627