开放科学(资源服务)标志码(OSID):
随着网络科学的不断发展,在社会科学、自然科学、信息科学等领域中的复杂关系问题都可以通过复杂网络来描述[1]。在复杂网络中通常出现网络未知或部分未知的情况,因此,对缺失信息的还原和预测是网络研究过程的关键。链路预测是根据已知的网络信息,预测尚未形成连边的两个节点之间产生链接的可能性,以预测未知链接[2]和未来链接[3]。链路预测被广泛应用在不同领域中,例如,在蛋白质网络中探究蛋白质之间的相互作用[4-5],在电商网络中推送客户感兴趣的产品[6],在社交网络中推荐可能认识的人[7],在航空网络中推测影响网络演化的重要因素[8]等。
现有链路预测方法从结构相似性[9]角度可以分为基于局部结构的方法(如共邻节点指标(CN)[10]、Adamic-Adar(AA)[11]、资源分配指标(RA)[12]等)、基于半局部结构的方法(如局部路径指标(LP)[13])和基于全部结构的方法(如考虑全局路径的Katz指标[14]、节点偏好性随机游走指标(DRW)[15])。基于局部结构的方法因计算复杂度低、适用性广等优点备受研究人员的关注[16],但这类方法大多简单地假设每个共邻节点对链路形成的贡献一致。为此,文献[17]提出局部朴素贝叶斯(LNB)模型,引入朴素贝叶斯理论来区分不同共邻节点的贡献,取得了较优的预测效果。文献[18]提出树增广朴素贝叶斯预测(TAN)方法,引入树增强朴素贝叶斯概率模型,缓解在共邻节点之间强独立性假设的问题。文献[19]提出扩展局部朴素贝叶斯(ELNB)方法,通过对共邻节点的角色贡献函数进行扩展,揭示了微观尺度下节点聚类系数对链路形成的作用。但这些方法都是基于共邻节点的角色贡献展开研究,忽略了路径结构特征的贡献。近年来,已有研究表明,考虑路径结构周围的拓扑信息能有效提升预测性能[20-21]。
此外,LNB模型及其相关改进方法并未考虑网络中的模体结构特征,而真实网络(如食物链网络、社交网络)存在大量模体结构。针对含有模体特征的网络,LNB模型仍存在局限性问题。网络模体的概念最早由文献[22]提出,即在真实网络中富集出现的由少量节点形成的小规模同构子图。文献[23]提出模体顶点度和边度来衡量网络中点和边的重要性。文献[24]提出三角模体度和四边模体度的代数算法,设计基于模体特征的攻击策略。文献[25]依据朴素贝叶斯理论解释了使用模体边度进行链路预测的可行性,提出基于单模体边度和双模体边度的链路预测方法,揭示了模体对链路形成的重要作用。随着模体在复杂网络中深入研究,模体顶点度和边度已经不足以描述更复杂的拓扑特征,基于路径结构的模体测度量有待提出。
本文结合路径模体特征与朴素贝叶斯理论,提出一种基于模体的局部朴素贝叶斯链路预测方法MLNB,以分析路径结构的模体特征对节点相似性的影响。定义路径结构上三角模体的聚集程度——模体密度,考虑模体密度对待测连边的影响,通过构建路径的角色贡献函数分析路径的相似性贡献,同时推导出基于共邻节点的扩展指标。
1 基本概念 1.1 问题描述本文给定一个无权无向网络
在现有链路预测方法中常用的相似性指标主要有8个:
1)共邻节点指标。对于待预测节点
$ {S}_{xy}^{\mathrm{C}\mathrm{N}}=\left|\mathit{\Gamma } \right(x, y\left)\right| $ | (1) |
2)Adamic-Adar指标。AA指标考虑共邻节点的度越小对链路形成的贡献越大,在CN指标的基础上为每个共邻节点分配一个权重,权值定义为该共邻节点度的对数的倒数。AA指标定义如式(2)所示:
$ {S}_{xy}^{\mathrm{A}\mathrm{A}}=\sum\limits_{\omega \in \mathit{\Gamma } (x, y)}\frac{1}{\mathrm{l}\mathrm{o}{\mathrm{g}}_{\mathrm{a}}{k}_{\omega }} $ | (2) |
其中:
3)资源分配指标。对于未连接的节点
$ {S}_{xy}^{\mathrm{R}\mathrm{A}}=\sum\limits_{\omega \in \mathit{\Gamma } (x, y)}\frac{1}{{k}_{\omega }} $ | (3) |
4)基于CN指标的局部朴素贝叶斯相似性指标(LNBCN)。在CN指标的基础上,LNBCN[17]考虑不同共邻节点对链路形成的贡献不同,定义了角色函数
$ {S}_{xy}^{\mathrm{L}\mathrm{N}\mathrm{B}\mathrm{C}\mathrm{N}}=\sum\limits_{\omega \in \mathit{\Gamma } (x, y)}({{\rm{log}}}_{a}s+{{\rm{log}}}_{a}{R}_{\omega }) $ | (4) |
其中:
5)基于AA指标的局部朴素贝叶斯相似性指标(LNBAA)。将局部朴素贝叶斯原理与AA指标相结合,LNBAA定义如式(5)所示:
$ {S}_{xy}^{\mathrm{L}\mathrm{N}\mathrm{B}\mathrm{A}\mathrm{A}}=\sum\limits_{\omega \in \mathit{\Gamma } (x, y)}\frac{1}{\mathrm{l}\mathrm{o}{\mathrm{g}}_{a}{k}_{\omega }}(\mathrm{l}\mathrm{o}{\mathrm{g}}_{a}s+\mathrm{l}\mathrm{o}{\mathrm{g}}_{a}{R}_{\omega }) $ | (5) |
6)基于RA指标的局部朴素贝叶斯相似性指标(LNBRA)。将局部朴素贝叶斯原理与RA指标相结合,LNBRA定义如式(6)所示:
$ {S}_{xy}^{\mathrm{L}\mathrm{N}\mathrm{B}\mathrm{R}\mathrm{A}}=\sum\limits_{\omega \in \mathit{\Gamma } (x, y)}\frac{1}{{k}_{\omega }}(\mathrm{l}\mathrm{o}{\mathrm{g}}_{a}s+\mathrm{l}\mathrm{o}{\mathrm{g}}_{a}{R}_{\omega }) $ | (6) |
7)局部路径指标。不同于上述6种局部指标,LP指标是一种半局部指标,不仅考虑了二阶路径(即共邻节点)的贡献,也考虑了三阶路径对节点相似性的贡献。LP指标计算如式(7)所示:
$ {\mathit{\boldsymbol{S}}}_{}^{\mathrm{L}\mathrm{P}}={\mathit{\boldsymbol{A}}}^{2}+\alpha {\mathit{\boldsymbol{A}}}^{3} $ | (7) |
其中:
8)Katz指标。全局相似性指标Katz计算节点
$ {S}_{xy}^{\mathrm{K}\mathrm{a}\mathrm{t}\mathrm{z}}=\sum\limits_{l=1}^{\infty }{\alpha }^{l}\cdot \left|{{\rm{path}}}_{x, y}^{l}\right|=\\ \;\;\;\;\;\;\;\;{\alpha }^{1}{A}_{xy}^{1}+{\alpha }^{2}{A}_{xy}^{2}+\cdots +{\alpha }^{n}{A}_{{x}{y}}^{{n}} $ | (8) |
其中:
模体是一种介于节点和社团之间的网络子图,是在真实网络中频繁出现的结构单元,可以很好地反映网络的结构和功能。模体的基本特性是在真实网络中出现的频率远高于其在规模相同的随机网络中出现的频率。模体的基本统计特征如下:
1)模体的频率。对于给定的含有
$ f\left(M\right)=\frac{n\left(M\right)}{N} $ | (9) |
其中:
2)模体的
3)模体的
$ {Z}_{i}=\frac{{{N}_{\mathrm{r}\mathrm{e}\mathrm{a}\mathrm{l}}}_{i}- < {{N}_{\mathrm{r}\mathrm{a}\mathrm{n}\mathrm{d}}}_{i} > }{{{\sigma }_{\mathrm{r}\mathrm{a}\mathrm{n}\mathrm{d}}}_{i}} $ | (10) |
网络中模体的存在性可以根据上述模体概念和基本统计特征来检验。在大多数无向网络中,三节点模体是最常见的模体结构。三节点构成的两种模体结构如图 1所示。
![]() |
Download:
|
图 1 在无向网络中三节点模体结构示例 Fig. 1 Examples of three-nodes motif structure in undirected network |
LNBCN指标在CN指标的基础上,区分每个共邻节点对待测连边的不同贡献,进一步提高预测精度,但忽略了经过不同共邻节点的路径对待测连边贡献的差异性。在路径上三角模体的聚集程度即模体密度,对待测节点间连边的产生具有重要影响。本文引入不同的局部结构图进行对比分析,3种不同的节点连接方式如图 2所示。
![]() |
Download:
|
图 2 3种不同的节点连接方式 Fig. 2 Three different node connection methods |
从图 2可以看出,在3种结构中均有一对待测节点
上述分析表明,节点
在复杂网络中边聚类系数是刻画局部三角环聚集程度的重要参数。根据边聚类系数的定义,即一条边的两个端点与其共邻节点之间所构成的三角形数与所有可能包含该边的三角形数的比值[26],图 2(b)中节点
$ {C}_{x\omega }=\frac{\left|\mathit{\boldsymbol{ \boldsymbol{\varGamma} }} \right(x, \omega \left)\right|+1}{\mathrm{m}\mathrm{i}\mathrm{n}\{{k}_{x}-1, {k}_{\omega }-1\}} $ | (11) |
边聚类系数准确地描述了一条边上三角模体的聚集程度。
定义1(模体密度(Motif Density,MD)) 对于网络中任意的待测节点
$ {M}_{\mathrm{M}\mathrm{D}}\left({w}_{x\omega y}\right)=\frac{\left|\mathit{\boldsymbol{ \boldsymbol{\varGamma} }} \right(x, \omega \left)\right|+\left|\mathit{\boldsymbol{ \boldsymbol{\varGamma} }} \right(\omega , y\left)\right|+1}{\mathrm{m}\mathrm{i}\mathrm{n}\{{k}_{x}-1, {k}_{\omega }-1\}+\mathrm{m}\mathrm{i}\mathrm{n}\{{k}_{\omega }-1, {k}_{y}-1\}+2} $ | (12) |
以图 2(b)为例,路径
$ {M}_{\mathrm{M}\mathrm{D}}\left({w}_{x\omega y}\right)=\frac{2+1+1}{\mathrm{m}\mathrm{i}\mathrm{n}\left\{\mathrm{5, 6}\right\}+\mathrm{m}\mathrm{i}\mathrm{n}\left\{\mathrm{6, 4}\right\}+2}=\frac{4}{11} $ |
本文在对路径结构上模体密度进行分析和量化后,基于模体密度来分析路径的相似性贡献,进而在朴素贝叶斯指标的基础上提出改进的链路预测方法。
根据文献[17],LNB方法将共邻节点
$ {R}_{\omega }=\frac{P\left({e}_{xy}\right|\omega )}{P\left({\stackrel{-}{e}}_{xy}\right|\omega )} $ | (13) |
其中:
定义2(基于路径模体密度的角色贡献函数) 将路径
$ R\left({w}_{x\omega y}\right)=\frac{P\left({e}_{xy}\right|{w}_{x\omega y})}{P\left({\stackrel{-}{e}}_{xy}\right|{w}_{x\omega y})}=\frac{{M}_{\mathrm{M}\mathrm{D}}\left({w}_{x\omega y}\right)}{1-{M}_{\mathrm{M}\mathrm{D}}\left({w}_{x\omega y}\right)} $ | (14) |
其中:
定义3(基于模体的朴素贝叶斯链路预测指标) 根据贝叶斯理论[17-19],在所有经过共邻节点路径的条件下,节点
$ P\left({e}_{xy}\right|W(x, y))=\frac{P\left({e}_{xy}\right)\cdot P\left(W\right(x, y\left)\right|{e}_{xy})}{P\left(W\right(x, y\left)\right)} $ | (15) |
$ P\left({\stackrel{-}{e}}_{xy}\right|W(x, y))=\frac{P\left({\stackrel{-}{e}}_{xy}\right)\cdot P\left(W\right(x, y\left)\right|{\stackrel{-}{e}}_{xy})}{P\left(W\right(x, y\left)\right)} $ | (16) |
其中:
假设每条路径对待测连边的贡献是相互独立的,则:
$ P\left(W\right(x, y\left)\right|{e}_{xy})=\prod\limits_{\omega \in \mathit{\boldsymbol{ \boldsymbol{\varGamma} }} (x, y)}P\left({w}_{x\omega y}\right|{e}_{xy}) $ | (17) |
$ P\left(W\right(x, y\left)\right|{\stackrel{-}{e}}_{xy})=\prod\limits_{\omega \in \mathit{\boldsymbol{ \boldsymbol{\varGamma} }} (x, y)}P\left({w}_{x\omega y}\right|{\stackrel{-}{e}}_{xy}) $ | (18) |
通过式(15)和式(16)相除的方式构建相似性指标,如式(19)所示:
$ \begin{array}{l}{r}_{xy}^{\mathrm{M}\mathrm{L}\mathrm{N}\mathrm{B}\mathrm{C}\mathrm{N}}=\frac{P\left({e}_{xy}\right|W(x, y))}{P\left({\stackrel{-}{e}}_{xy}\right|W(x, y))}=\frac{P\left({e}_{xy}\right)\prod\limits_{\omega \in \mathit{\boldsymbol{ \boldsymbol{\varGamma} }} (x, y)}P\left({w}_{x\omega y}\right|{e}_{xy})}{P\left({\stackrel{-}{e}}_{xy}\right)\prod\limits_{\omega \in \mathit{\boldsymbol{ \boldsymbol{\varGamma} }} (x, y)}P\left({w}_{x\omega y}\right|{\stackrel{-}{e}}_{xy})}=\\ \;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\underbrace{\frac{P\left(e_{x y}\right)}{P\left(\bar{e}_{x y}\right)} \prod\limits_{\omega \in \mathit{\boldsymbol{ \boldsymbol{\varGamma} }}(x, y)} \frac{P\left(\bar{e}_{x y}\right)}{P\left(e_{x y}\right)}}_{\text {constant value }}\underbrace{\prod\limits_{\omega \in \mathit{\boldsymbol{ \boldsymbol{\varGamma} }}(x, y)} \frac{P\left(e_{x y} \mid w_{x \omega y}\right)}{P\left(\bar{e}_{x y} \mid w_{x \omega y}\right)}}_{\text {role of } w_{x \omega y}}\end{array} $ | (19) |
其中:
$ P\left({e}_{xy}\right)=\frac{2\left|E\right|}{\left|V\right|\cdot \left(\right|V|-1)} $ | (20) |
$ P\left({\stackrel{-}{e}}_{xy}\right)=1-P\left({e}_{xy}\right) $ | (21) |
显然,
将式(14)、式(20)和式(21)代入式(19)中,等式两边取对数,得到其简化形式,如式(22)所示:
$ {s}_{xy}^{\mathrm{M}\mathrm{L}\mathrm{N}\mathrm{B}\mathrm{C}\mathrm{N}}=\sum\limits_{\omega \in \mathit{\boldsymbol{ \boldsymbol{\varGamma} }} (x, y)}(lo{g}_{a}s+lo{g}_{a}R({w}_{x\omega y}\left)\right) $ | (22) |
定义4(扩展指标) 基于共邻节点的相似性预测模型有很多经典的预测指标。受LNB模型启发,为进一步验证MLNB方法的有效性,本文把MLNB思想应用到AA指标和RA指标上,得到MLNB扩展指标,如式(23)和式(24)所示:
$ {s}_{xy}^{\mathrm{M}\mathrm{L}\mathrm{N}\mathrm{B}\mathrm{A}\mathrm{A}}=\sum\limits_{\omega \in \mathit{\boldsymbol{ \boldsymbol{\varGamma} }} (x, y)}\frac{1}{\mathrm{l}\mathrm{o}{\mathrm{g}}_{a}{k}_{\omega }}(lo{g}_{a}s+lo{g}_{a}R({w}_{x\omega y}\left)\right) $ | (23) |
$ {s}_{xy}^{\mathrm{M}\mathrm{L}\mathrm{N}\mathrm{B}\mathrm{R}\mathrm{A}}=\sum\limits_{\omega \in \mathit{\boldsymbol{ \boldsymbol{\varGamma} }} (x, y)}\frac{1}{{k}_{\omega }}(lo{g}_{a}s+lo{g}_{a}R({w}_{x\omega y}\left)\right) $ | (24) |
为了评价MLNB指标的预测准确性,本文在Football网络[27]、USAir网络[28]、C.elegans网络[29]、FWMW网络[30]、FWEW网络[31]和FWFW网络[32]这6个真实网络上进行实验。不同的网络具有不同的模体特征。当网络具有显著的模体特征时,挖掘模体特征的链路预测方法在性能上显著区别于传统的链路预测方法。因此,本文在进行仿真实验之前,首先要检验网络模体的存在性。本文基于2.1节的模体基本理论以及Rand-ESU[33]算法,通过模体发现软件FANMOD对6个网络进行模体存在性检验。6个网络的特征参数及模体存在性检验如表 1所示。从表 1可以看出,
![]() |
下载CSV 表 1 6个网络的特征参数与模体存在性检验 Table 1 Feature parameters and motif existence test of six networks |
为了量化链路预测方法的准确性,一般将边集
AUC值可解释为随机选择一条缺失边(即
$ {A}_{\mathrm{A}\mathrm{U}\mathrm{C}}=\frac{{n}^{\text{'}}+0.5{n}^{″}}{n} $ | (25) |
精确度(P)计算前
$ P=\frac{m}{L} $ | (26) |
由于本文选取6个真实网络的规模不同,因此统一将各数据集边数的10%作为
本文实验针对6个具有模体特征的网络进行仿真实验,采用随机抽样方法按9∶1划分训练集和测试集。为了消除随机误差的影响,对每个网络进行100次独立实验并取平均值。本文将提出的MLNBs指标与局部属性的CN指标、AA指标、RA指标、LNBs指标,半局部属性的LP指标和全局属性的Katz指标进行对比。在多个不同类型网络中MLNBs指标与现有指标的AUC值对比如表 2所示。
![]() |
下载CSV 表 2 不同指标的AUC值对比 Table 2 AUC values comparison among different indexs |
从表 2可以看出,在每个网络上MLNBs系列指标(MLNBCN、MLNBAA、MLNBRA)的AUC值均优于对应的原始指标(CN、AA、RA)和LNBs指标(LNBCN、LNBAA、LNBRA),表明路径模体密度对链路形成的可能性是有一定的影响。在MLNBs系列指标中,MLNBRA指标的AUC值最高,MLNBAA指标次之,MLNBCN指标最低,这说明惩罚度大的共邻节点能够有效提高预测精度。MLNBRA指标的AUC值在Football网络中仅次于LP和Katz指标,相差不超过1%,在剩余的网络中MLNBRA指标均具有较优的AUC值。LP指标在共同邻居的基础上考虑了三阶路径信息。Katz指标考虑全局信息,时间复杂度相对较高。因此,LP指标和Katz指标的预测精度有一定优势。而MLNBs系列指标计算二阶路径的局部信息,时间复杂度低于LP和Katz指标。本文提出的MLNB方法能解释路径模体聚集程度与节点对链接的关系,且复杂度低于半局部和全局方法,在含有模体的网络上具有较优的适用性。
在FWMW、FWEW、FWFW这3个食物链网络中,MLNBs系列指标的AUC值均优于所有的基准指标。若以次优的全局Katz指标为基准,MLNBs系列指标的AUC值在FWMW网络中至少提升了5%,在FWEW网络中至少提升了2%,在FWFW网络中至少提升了7%。从表 1可以看出,FWMW、FWEW、FWFW网络的三角模体平均频率较大,说明食物链网络中存在大量的三角模体,对于这类模体特征较为明显的网络,基于模体特征的MLNB方法预测的效果更好,进一步验证了MLNB指标针对此类网络具有一定的的有效性和可行性。
在不同类型网络中MLNBs系列指标与现有指标的精确度对比如表 3所示,所有指标的预测结果在0~0.28,大多数指标的精确度小于0.2。
![]() |
下载CSV 表 3 不同指标的精确度对比 Table 3 Precision comparison among different indexs |
在USAir网络中,MLNBs系列指标(MLNBCN、MLNBAA、MLNBRA)的精确度不仅优于对应的原始指标(CN、AA、RA)和LNBs系列指标(LNBCN、LNBAA、LNBRA),而且相对半局部LP指标和全局Katz指标也有明显提升。其中MLNBRA指标的精确度最优,RA和LNBRA指标的精确度次优。精确度分析结果说明在USAir网络中,共邻节点的度对链路的形成具有较大作用。在剩余的网络中,MLNBs系列指标的精确度均优于所有的基准指标。在所有网络中,MLNBs系列指标的精确度由大到小排序:MLNBRA > MLNBAA > MLNBCN。从表 3可以看出,基于模体特征的MLNB指标的精确度相比局部和全局指标有较大幅度提升,证明了计算模体结构信息有助于提升预测性能。
3.4 鲁棒性分析为了进一步分析MLNBs指标的鲁棒性,本节在不同的训练集比例下研究MLNBs指标与基准指标预测结果的变化情况。在不同网络中各指标的预测值仍然是取100次独立实验的平均值。当训练集比例从0.6开始每次增加0.1直到0.9时,各指标的AUC值对比如图 3所示。
![]() |
Download:
|
图 3 在不同的训练集比例下各指标的AUC值对比 Fig. 3 AUC values comparison among various indexs under different training set proportions |
从图 3可以看出,当训练集比例增加时,多数指标的AUC值随之增大,这是由于训练集比例增加使网络中共邻节点数目和已知拓扑信息增加,预测性能也随之提升。MLNBs指标的AUC值随训练集比例增大而增大。当可观测数据仅有60%时,除了USAir和C.elegans网络中MLNBs指标相对局部相似性指标变化范围不大,在其余网络中仍取得相对较优的预测结果,表明MLNBs指标在不同网络中具有较优的鲁棒性。LNBs指标在FWMW、FWEW、FWFW网络中并不遵从预测值随训练集比例增大而增大的规律,说明这3个网络中LNBs指标对训练集比例变化的敏感程度不同。
当训练集比例从0.6开始每次增加0.1直到0.9时,各指标的精确度对比如图 4所示。
![]() |
Download:
|
图 4 在不同的训练集比例下各指标的精确度对比 Fig. 4 Precision comparison among various indexs under different training set proportions |
与AUC值的变化规律相反,图 4中各指标的精确度随训练集比例的增加而下降,这是由于精确度计算前
无论训练集如何划分,在图 3中Football和C.elegans网络上的LP、Katz指标相较于MLNBs指标的AUC值有一定的优势,而图 4中LP、Katz指标的精确度都低于MLNBs指标,说明LP和Katz指标并不是在所有评价指标下都表现良好。因此,MLNBs指标在AUC值和精确度两种评价指标测试下具有较优的性能,与不同基准指标相比,在各网络中具有较优的鲁棒性。
4 结束语本文针对具有模体特征的网络提出一种基于模体的朴素贝叶斯链路预测方法。从模体角度定义模体密度来描述路径结构上模体的聚集程度。考虑到路径结构上模体密度对链接形成的作用,构建基于路径的角色贡献函数,以量化路径的相似性贡献。在此基础上,结合朴素贝叶斯理论,推导MLNBCN及其扩展指标。实验结果表明,本文方法具有较优的鲁棒性,所提相似性指标的AUC值和精确度均优于LNBs指标和CN、AA、RA等基准指标。本文所提的链路预测方法仅针对无权无向、含有模体结构的网络,后续将本文方法MLNB应用到加权有向网络中,研究加权有向网络的模体特征对链路预测准确度的影响。此外,设计适用于更多不同领域网络的链路预测方法也是下一步的重点研究方向。
[1] |
BATOOL K, NIAZI M A. Modeling the Internet of Things: a hybrid modeling approach using complex networks and agent-based models[EB/OL]. [2021-07-25]. http://link.springer.com/content/pdf/10.1186%2Fs40294-017-0043-1.pdf.
|
[2] |
YANG Y, LICHTENWALTER R N, CHAWLA N V. Evaluating link prediction methods[J]. Knowledge and Information Systems, 2015, 45(3): 751-782. DOI:10.1007/s10115-014-0789-0 |
[3] |
LI S B, HUANG J W, ZHANG Z G, et al. Similarity-based future common neighbors model for link prediction in complex networks[J]. Scientific Reports, 2018, 8(1): 1-14. |
[4] |
JEONG H, MASON S P, BARABÁSI A L, et al. Lethality and centrality in protein networks[J]. Nature, 2001, 411(6833): 41-42. DOI:10.1038/35075138 |
[5] |
HUANG Z A, HUANG Y, YOU Z H, et al. Novel link prediction for large-scale miRNA-lncRNA interaction network in a bipartite graph[J]. BMC Medical Genomics, 2018, 11(6): 113. |
[6] |
ZHANG L L, LI J, ZHANG Q L, et al. Domain knowledge-based link prediction in customer-product bipartite graph for product recommendation[J]. International Journal of Information Technology & Decision Making, 2019, 18(1): 311-338. |
[7] |
MA C, ZHOU T, ZHANG H F. Playing the role of weak clique property in link prediction: a friend recommendation model[J]. Scientific Reports, 2016, 6: 30098. DOI:10.1038/srep30098 |
[8] |
刘宏鲲, 吕琳媛, 周涛. 利用链路预测推断网络演化机制[J]. 中国科学: 物理学力学天文学, 2011, 41(7): 816-823. LIU H K, LÜ L Y, ZHOU T. Uncovering the network evolution mechanism by link prediction[J]. Scientia Sinica (Physica, Mechanica & Astronomica), 2011, 41(7): 816-823. (in Chinese) |
[9] |
YU C M, ZHAO X L, AN L, et al. Similarity-based link prediction in social networks: a path and node combined approach[J]. Journal of Information Science, 2017, 43(5): 683-695. DOI:10.1177/0165551516664039 |
[10] |
LIBEN-NOWELL D, KLEINBERG J. The link-prediction problem for social networks[J]. Journal of the American Society for Information Science and Technology, 2007, 58(7): 1019-1031. DOI:10.1002/asi.20591 |
[11] |
ADAMIC L A, ADAR E. Friends and neighbors on the Web[J]. Social Networks, 2003, 25(3): 211-230. DOI:10.1016/S0378-8733(03)00009-1 |
[12] |
ZHOU T, LÜ L, ZHANG Y C. Predicting missing links via local information[J]. The European Physical Journal B, 2009, 71(4): 623-630. DOI:10.1140/epjb/e2009-00335-8 |
[13] |
LYV L, JIN C H, ZHOU T. Similarity index based on local paths for link prediction of complex networks[J]. Physical Review E, Statistical, Nonlinear, and Soft Matter Physics, 2009, 80(4): 1-22. |
[14] |
KATZ L. A new status index derived from sociometric analysis[J]. Psychometrika, 1953, 18(1): 39-43. DOI:10.1007/BF02289026 |
[15] |
ZHANG Y Y, SHI Z, FENG D, et al. Degree-biased random walk for large-scale network embedding[J]. Future Generation Computer Systems, 2019, 100: 198-209. DOI:10.1016/j.future.2019.05.033 |
[16] |
LU Y D, GUO Y F, KORHONEN A. Link prediction in drug-target interactions network using similarity indices[J]. BMC Bioinformatics, 2017, 18(1): 39. DOI:10.1186/s12859-017-1460-z |
[17] |
LIU Z, ZHANG Q M, LÜ L, et al. Link prediction in complex networks: a local naive Bayes model[J]. Europhysics Letters, 2011, 96(4): 48007. DOI:10.1209/0295-5075/96/48007 |
[18] |
WU J H. A generalized tree augmented naive Bayes link prediction model[J]. Journal of Computational Science, 2018, 27: 206-217. DOI:10.1016/j.jocs.2018.04.006 |
[19] |
ZHANG H F, JIA M M, XIANG B B, et al. Predicting missing links in complex networks via an extended local naive Bayes model[J]. Europhysics Letters, 2020, 130(3): 38002. DOI:10.1209/0295-5075/130/38002 |
[20] |
刘英杰, 刘士虎, 徐伟华. 基于有效路径拓扑稳定性的链路预测方法[J]. 计算机应用研究, 2022, 39(1): 90-95. LIU Y J, LIU S H, XU W H. Link prediction method based on topology stability of effective path[J]. Application Research of Computers, 2022, 39(1): 90-95. (in Chinese) |
[21] |
李英乐, 何赞园, 王凯, 等. 基于资源传输节点拓扑紧密性的链路预测方法[J]. 计算机工程, 2021, 47(1): 50-57. LI Y L, HE Z Y, WANG K, et al. Link prediction method based on topological tightness of resource transmission nodes[J]. Computer Engineering, 2021, 47(1): 50-57. (in Chinese) |
[22] |
MILO R, SHEN-ORR S, ITZKOVITZ S, et al. Network motifs: simple building blocks of complex networks[J]. Science, 2002, 298(5594): 824-827. |
[23] |
韩华, 刘婉璐, 吴翎燕. 基于模体的复杂网络测度量研究[J]. 物理学报, 2013, 62(16): 1-8. HAN H, LIU W L, WU L Y. The measurement of complex network based on motif[J]. Acta Physica Sinica, 2013, 62(16): 1-8. (in Chinese) |
[24] |
贾承丰, 韩华, 完颜娟, 等. 基于网络模体特征攻击的网络抗毁性研究[J]. 复杂系统与复杂性科学, 2017, 14(4): 43-50. JIA C F, HAN H, WAN Y J, et al. Network destruction resistance based on network motif feature[J]. Complex Systems and Complexity Science, 2017, 14(4): 43-50. (in Chinese) |
[25] |
柳娟, 刘亚芳, 许爽, 等. 基于多模体边度的科学家合作关系预测[J]. 计算机学报, 2020, 43(12): 2372-2384. LIU J, LIU Y F, XU S, et al. Predicting scientific collaboration by edge degree of multiple motifs[J]. Chinese Journal of Computers, 2020, 43(12): 2372-2384. (in Chinese) |
[26] |
胡健, 杨炳儒. 基于边聚集系数的社区结构发现算法[J]. 计算机应用研究, 2009, 26(3): 858-859. HU J, YANG B R. Community structure discovery algorithm based on edge clustering coefficient[J]. Application Research of Computers, 2009, 26(3): 858-859. (in Chinese) |
[27] |
GIRVAN M, NEWMAN M E J. Community structure in social and biological networks[J]. PNAS, 2001, 99(12): 7821-7826. |
[28] |
BATAGELJ V, MRVAR A. Pajek-program for large network analysis[J]. Connections, 1998, 21(2): 47-57. |
[29] |
WATTS D J, STROGATZ S H. Collective dynamics of 'small-world' networks[J]. Nature, 1998, 393(6684): 440-442. |
[30] |
BAIRD D, LUCZKOVICH J, CHRISTIAN R R. Assessment of spatial and temporal variability in ecosystem attributes of the St. Marks national wildlife refuge, apalachee bay, Florida[J]. Estuarine, Coastal and Shelf Science, 1998, 47(3): 329-349. |
[31] |
ULANOWIC R E, DEANGELIS D L. Network analysis of trophic dynamics in south Florida ecosystems[M]//GEROULD S, HIGER A L U S. Geological survey program on the south Florida ecosystem. Washington D. C., USA: Government Printing Office, 1999: 114-115.
|
[32] |
MICHALSKI R, PALUS S, KAZIENKO P. Matching organizational structure and social network extracted from email communication[M]//ABRAMOWICZ W. Business information systems. Berlin, Germany: Springer, 2011: 197-206.
|
[33] |
WERNICKE S, RASCHE F. FANMOD: a tool for fast network motif detection[J]. Bioinformatics, 2006, 22(9): 1152-1153. |
[34] |
ZENG G P, ZENG E. On the three-way equivalence of AUC in credit scoring with tied scores[J]. Communications in Statistics-Theory and Methods, 2019, 48(7): 1635-1650. |
[35] |
WU Z H, LIN Y F, ZHAO Y J, et al. Improving local clustering based top-L link prediction methods via asymmetric link clustering information[J]. Physica A: Statistical Mechanics and Its Applications, 2018, 492: 1859-1874. |