2. 江南大学 江苏省模式识别与计算智能工程实验室, 江苏 无锡 214122
2. Jiangsu Provincial Engineering Laboratory of Pattern Recognition and Computing Intelligence, Jiangnan University, Wuxi, Jiangsu 214122, China
开放科学(资源服务)标志码(OSID):
近年来,随着高通量技术的发展,通过实验方法检测到蛋白质相互作用(Protein-Protein Interaction,PPI)的数量大幅增加,形成了越来越多的PPI网络。发现并理解蛋白质之间的相互作用,是生物学领域内的重要课题之一[1]。对PPI网络的分析能够增进对生物学过程的理解,不同物种间相互作用组的比对在蛋白质功能预测、保守功能成分检测、物种间知识转移等方面具有重要意义[2]。
网络比对按映射关系可分成局部比对和全局比对。局部比对旨在找到高度保守的小型网络区域,并生成多对多节点映射,例如LePrimAlign[3]、LocalAli[4]、Pin-Align[5]。全局比对旨在找到较大的保守区域并生成一对一的节点映射,例如Isorank[6]、GRAAL[7]、H-GRAAL[8]、MI-GRAAL[9]、C-GRAAL[10]、L-GRAAL[11]、NETAL[12]、SPINAL[13]、PINALOG[14]、ModuleAlign[15]、PROPER[16]、AligNet[17]、IsoRankN[18]、BEAMS[19]、SMETANA[20]等,其中后3种算法属于多网络比对,其余为2个网络的比对。本文着重研究2个网络的全局比对。
在现有2个网络的全局比对算法中,IsoRank算法是先进的全局比对算法,其主要利用类似谷歌页面排序算法(PageRank)的方法计算节点相似性,并采用贪心算法进行比对。GRAAL系列算法利用图形度标签相似性作为节点的拓扑相似度,结合其他搜索算法比对PPI网络。NETAL算法基于拓扑和生物相似性构建相似性矩阵,利用贪心搜索方法比对网络。SPINAL算法首先基于二分图构建初始相似性矩阵,利用种子-扩展算法并基于迭代交换局部改进比对节点。PINALOG算法首先利用聚类算法提取密集模块,计算模块间的相似度并通过模块匹配提取比对的种子集合,并将比对扩展至种子节点的邻域。ModuleAlign算法基于输入网络的层次聚类计算蛋白质间的同源性得分,整合了序列信息以及局部和全局网络拓扑作为评分方案,通过迭代算法寻找一种在实现较好整体得分的同时最大化保守相互作用数量的比对方法。PROPER算法首先根据序列信息设置阈值筛选种子集合,然后利用渗透图匹配(Percolation Graph Matching,PGM)算法[21]扩展种子。AligNet算法是成对网络比对算法,其先将网络划分成多个重叠簇,再进行簇间的局部比对,最后将其组合扩展为全局比对。
上述算法大多从拓扑和生物2个角度考虑蛋白质的相似性,由于PPI网络存在噪声,仅考虑拓扑特征可能对比对产生误导,而序列信息的不完全性使得仅考虑生物信息会影响比对的准确性,序列上相似不一定代表功能相似。此外,生物网络被观察到是高度模块化的[22],同一个功能模块中蛋白质相互连接密集,不同模块间蛋白质相互连接稀疏[23],部分算法利用层次聚类[24]、密度聚类[25]等模块检测技术从PPI网络中提取出具有相似功能的蛋白质,将功能模块检测融入网络比对中,更准确地预测蛋白质功能,但通常需要借助同源信息。因此,利用较少的额外信息实现良好的拓扑与生物一致性的平衡,是需要进一步研究的问题。
本文基于种子-扩展算法和功能模块检测,提出一种生物网络全局比对算法JAlign。结合节点及其邻居节点的拓扑特征和序列信息构建目标函数,利用Jerarca层次聚类算法[26]划分功能模块,并通过匈牙利算法从中提取种子,综合种子与邻居节点的连接关系、节点相似性和度,将比对从种子节点扩展至其邻居节点,同时对剩余节点再次进行加权二分图匹配,找到更多匹配节点,从而实现拓扑和生物一致性的平衡。
1 基于层次聚类的生物网络全局比对 1.1 问题描述2个PPI网络分别用无向图G1 =(V1,E1)和G2 =(V2,E2)表示,其中:V1、V2表示网络中的节点集合;E1、E2表示网络中的边集合;节点表示蛋白质;边表示2个蛋白质间的相互作用;N(i)表示节点i的邻居节点集合;N(j)表示节点j的邻居节点集合。全局比对f:V1→V2,是将G1中的V1节点映射到G2的V2节点上,形成一对一的映射关系,令
本文提出JAlign算法,利用功能模块检测和种子-扩展算法实现全局比对。该算法主要分为3个阶段,分别是种子筛选阶段、扩展阶段和局部优化阶段。在种子筛选阶段,先基于拓扑和序列信息构建目标函数,再利用层次聚类算法划分功能模块并进行模块间的比对,从模块对中提取高相似度节点对作为种子节点。在扩展阶段,先根据种子节点计算其邻居节点的相似性,再迭代比对高得分的节点对,逐步将比对扩展至所有可比对的节点。在局部优化阶段,先对剩余节点构建二分图,再利用最大加权匹配比对剩余节点,将比对节点对合并到比对集合。
1.2.1 种子筛选阶段种子筛选阶段包括目标函数构建、功能模块检测及种子筛选2个部分。
1)目标函数构建
目标函数用于衡量节点间的相似性,是后续比对的重要依据,结合序列信息与拓扑特征可避免仅考虑生物信息或拓扑信息对比对结果产生的误导。节点i和节点j的序列相似性根据BLAST bit-score值[27]计算,如式(1)所示:
$ B(i, j)=\frac{{b}_{\mathrm{b}\mathrm{l}\mathrm{a}\mathrm{s}\mathrm{t}}(i, j)-\underset{u\in {V}_{1}, v\in {V}_{2}}{\min}{b}_{\mathrm{b}\mathrm{l}\mathrm{a}\mathrm{s}\mathrm{t}}(u, v)}{\underset{u\in {V}_{1}, v\in {V}_{2}}{\min}{b}_{\mathrm{b}\mathrm{l}\mathrm{a}\mathrm{s}\mathrm{t}}(u, v)-\underset{u\in {V}_{1}, v\in {V}_{2}}{\min}{b}_{\mathrm{b}\mathrm{l}\mathrm{a}\mathrm{s}\mathrm{t}}(u, v)} $ | (1) |
其中:bblast(i,j)表示节点i、j之间的BLAST bit-score值。
若2个节点的邻居节点拓扑相似,则这2个节点拓扑相似的可能性更高,通过同时考虑邻居节点的拓扑相似性和节点本身的相似度计算节点对的拓扑相似性,能够更全面地衡量节点间的拓扑特征。计算节点i、j拓扑相似性得分T(i,j)的过程如下:首先初始化
$ \begin{array}{l}{T}^{{i}_{\mathrm{t}}+1}(i, j)=\theta \times \frac{\sum\limits_{(u, v)\in M}{T}^{{i}_{\mathrm{t}}}(u, v)}{\max\left\{\right|N\left(i\right)|, |N\left(j\right)\left|\right\}}+\\ \qquad\qquad\qquad(1-\theta )\times \frac{\min\left\{d\right(i), d(j\left)\right\}}{\underset{u\in {V}_{1}\bigcup {V}_{2}}{\max}\left\{d\right(u\left)\right\}}\end{array} $ | (2) |
其中:
在计算序列和拓扑相似性之后,可得到节点的相似性得分,如式(3)所示:
$ S(i, j)=\alpha \times B(i, j)+(1-\alpha )\times T(i, j) $ | (3) |
其中:α是平衡拓扑和序列权重的参数,0≤α≤1;
2)功能模块检测及种子筛选
生物网络的模块化特征使得具有相似生物功能的蛋白质连通密集,功能模块检测将功能相似的节点划分为同一模块。从功能模块中筛选种子,将功能信息融入到比对中,相较于在整个网络内筛选种子节点,缩小了种子节点的选择范围,通过对高质量的种子进行扩展,提高了比对结果质量。种子筛选阶段的算法流程如图 1所示。首先利用Jerarca聚类算法划分输入网络中的功能模块,构成模块集合,结合匈牙利算法先进行模块内比对,计算模块间相似性;然后模块间比对,得到模块间的最佳匹配结果;最后从中筛选出高相似性的节点对作为种子节点,其中Jerarca聚类算法通过节点间距离划分模块,使得在聚类时不会遗漏一些常规的不完全连通的功能模块,也不需要GO文件辅助划分模块,从而减少了输入信息。
![]() |
Download:
|
图 1 种子筛选流程 Fig. 1 Procedure of seed selection |
种子筛选阶段伪代码算法1所示。
算法1 SeedSelect算法
输入 2个PPI网络G1、G2,参数θ、α
输出 种子筛选结果seed
1.for all u∈V1 and v∈V2 do
2.按式(3)计算节点相似性S(u,v)
3.C1,C2←Jerarca算法划分G1、G2的功能模块
4.for all ci∈C1 and cj∈C2 do
5.按式(4)结合匈牙利算法计算模块相似性sc(ci,cj)
6.MC←匈牙利算法进行C1,C2内匹配
7.seed←筛选前25%节点对
8.return seed
种子筛选阶段的具体过程如下:
1)根据式(3)计算节点间的相似性得分S(u,v)。
2)利用Jerarca聚类算法检测G1、G2中的功能模块,并将模块信息分别存入集合C1、C2中。
3)计算模块间的相似性得分(算法1第4行和第5行)。利用匈牙利算法进行模块内比对,得到模块内节点间的最佳映射关系MH,计算比对模块的相似性得分sc,如式(4)所示:
$ {s}_{\mathrm{c}}({c}_{i}, {c}_{j})=\sum\limits_{(u, v)\in {M}_{H}}S(u, v) $ | (4) |
其中:ci、cj分别表示C1、C2中第i、j个模块;MH是通过匈牙利算法得到的ci、cj内节点的比对集合。
4)根据模块间的相似性得分sc,采用匈牙利算法得到模块间的匹配结果MC,依据相似性得分值分布的第3、4分位数,筛选出前25%的节点对作为种子继续扩展(算法1第6行和第7行)。
1.2.2 扩展阶段种子筛选阶段能够将部分重要节点比对上,但仍存在多数节点未涉及。为了将比对从种子节点扩展至整个网络,本文提出一种新的扩展方法,基本思路是某一对节点的邻居节点相似性越高,则这对节点比对上的概率越高,即比对上的邻居节点数越多,该节点对越可能被比对上。以种子节点为中心,遍历其邻居节点,将比对逐步从种子节点扩展至周围节点,但仅依靠节点间的连接关系确定比对节点也不全面,会存在多对节点满足扩展条件,而每步节点对的选择都会对后续节点的比对产生影响,从多角度考虑可以得出较为全面的结果。本阶段通过综合考虑节点间的连接关系、度特征、节点相似性,更全面、谨慎地确定扩展节点,产生更优的比对结果。
扩展阶段伪代码如算法2所示。
算法2 Extension算法
输入 G1、G2,种子集合seed,节点相似性S
输出 扩展比对结果M
1.M←seed
2.for all(u,v)∈seed do
3.按式(5)计算邻居节点scorestru(u',v')
4.seed=
5.while存在simstru(u',v') > 0 do
6.N←simstru得分最高的节点对
7.if |N| > 1 then
8.N←{(i,j)|(i,j)∈N and |di-dj| = min{|di-dj|}}
9.if | N| > 1 then
10.seed=seed
11.else
12.seed = seed
13.else
14.seed = seed
15.M=M
16.return M
扩展阶段的具体过程如下:
1)将种子节点对添加到比对集合M(算法2第1行)。
2)计算种子的邻居节点间的结构相似性(算法2第2行和第3行)。遍历种子节点的所有邻居节点,计算每一对邻居节点在已比对节点集合中的公共邻居节点数作为邻居节点的结构相似性得分sstru,如式(5)所示:
$ {s}_{\mathrm{s}\mathrm{t}\mathrm{r}\mathrm{u}}(u, v)=\left|\right\{(u\text{'}, v\text{'})\left|\right(u\text{'}, v\text{'})\in M, (u, u\text{'})\in {E}_{1}, (v, v\text{'})\in {E}_{2}\}| $ | (5) |
3)综合邻居节点结构相似性sstru、度、节点相似性S选择扩展节点对(算法2第5~15行)。首先对所有结构相似性从高到低排序,将得分最高的节点对添加到集合N,若N中存在多个得分最高的节点对,计算节点间的度差值,保留集合N中度差值最小的节点对,若N中存在多个最小度差值节点对,则根据式(3)中相似性得分S选择节点对,将相似性得分最高的节点对添加到比对集合中。
4)每有一对新的节点比对成功,更新其邻居节点的相似性得分(算法2第2行),重复上述过程,直至没有可选择的节点对。
1.2.3 局部优化阶段扩展阶段只是将比对从种子节点扩展到节点的邻域,这对于种子节点的选择非常重要,而模块检测是从网络中提取出连通密集模块并从中筛选出种子,因此,选择的种子节点多数是在连通密集的子图中的,对于较为离散或连通度不高的子图,比对上的概率很低,而这一部分子图中可能有部分节点是重要节点。为了解决这一问题,局部优化阶段对剩余节点进行局部优化比对,通过二分图的加权匹配比对剩余节点,使得孤立节点也能参与比对,将比对覆盖至整个网络。具体过程如下:
1)查找出G1、G2网络中未比对上的节点,构建二分图Gb,所有边的权重为该节点对的相似性得分S。
2)选择权重最大的边合并到比对集合M中。
3)删除步骤2中选中的节点对及其相关的边。
4)重复步骤2、3,直至图中没有边存在。
如图 2所示,先选中权重最大的边(a,d),若a、d节点均未在比对集中出现过,则将节点对(a,d)添加到比对集合中,删除a、d节点及其相关的边,再从剩余边中选择权重最大的边,选择的边是(b,e),确定b、e节点未出现在现有比对集合中,将(b,e)添加到比对集合,删除b、e节点及其相关的边,此时,Gb中无可匹配节点对存在,比对结束,将节点对(a,d)、(b,e)合并至比对集合,得到最终比对结果。
![]() |
Download:
|
图 2 剩余节点匹配示例 Fig. 2 Example of the matching for remaining nodes |
令
实验所用数据来自Isobase[28]数据库的真实网络数据和NAPAbench[29]合成网络数据,真实网络数据包括Caenorhabditis Elegans(CE)、Saccharomyces Cerevisiae(SC)、Drosophila Melanogaster(DM)、Homo Sapiens(HS)等4个物种,合成网络包括Crystal Growth(CG)、Duplication Mutation Completion(DMC)、Duplication with Random Mutation(DMR)。生物网络的节点和边信息见表 1,其中真实网络的数据均经过预处理,排除了自循环、重复的边和节点。
![]() |
下载CSV 表 1 网络数据信息 Table 1 Network data information |
对于网络比对算法的性能,从拓扑质量和生物质量2个方面进行评估。
1)拓扑质量度量
边正确性(Edge Correctness,EC)[7]是衡量网络比对拓扑质量最常用的指标,通过计算f映射下保守边在源网络中的比例来评估比对的质量,不能惩罚将稀疏网络映射到密集网络的比对。EC计算公式如式(6)所示:
$ {E}_{\mathrm{C}}\left(f\right)=\frac{\left|f\right({E}_{1}\left) \right|}{\left|{E}_{1}\right|} $ | (6) |
其中:|E1|表示G1网络的边数;|f(E1)|表示以f映射方式覆盖到G2中的边的边数。
诱导保守子结构得分(Induced Con-served-structure Score,ICS)[30]计算保守边与诱导边的比例,克服了EC的问题,但不能惩罚将密集网络映射到稀疏网络的比对。ICS计算公式如式(7)所示:
$ {I}_{\mathrm{C}\mathrm{S}}\left(f\right)=\frac{\left|f\right({E}_{1}\left) \right|}{\left|{E}_{{G}_{2}\left[f\right({V}_{1}\left)\right]}\right|} $ | (7) |
其中:
对称子结构得分(Symmetric Sub-structure Score,S3)[31]针对源网络和目标网络,既能惩罚稀疏到密集的比对又能惩罚密集到稀疏的比对。
$ {S}^{3}\left(f\right)=\frac{\left|f\right({E}_{1}\left) \right|}{\left|{E}_{1}\right|+\left|{E}_{{G}_{2}\left[f\right({V}_{1}\left)\right]}\right|-\left|f\right({E}_{1}\left) \right|} $ | (8) |
其中:分母表示根据比对f将G1和G2诱导子图重叠得到复合图计算图中唯一边的数目;|E1|表示G1网络中的边数。
2)生物质量度量
生物质量使用功能一致性(Functional Coherence,FC)[32]来衡量,FC利用GO术语测量比对蛋白质的功能一致性。GO术语描述蛋白质的生物特性,包括分子功能(Molecular Function,MF)、细胞成分(Cellular Component,CC)、生物过程(Biological Process,BP)[33]。通常认为具有相似GO术语的蛋白质其生物功能相似。FC计算公式如式(9)和式(10)所示:
$ {F}_{\mathrm{S}}(u, f(u\left)\right)=\frac{\left|{G}_{\mathrm{O}}\right(u)\bigcap {G}_{\mathrm{O}}(f\left(u\right)\left) \right|}{\left|{G}_{\mathrm{O}}\right(u)\bigcup {G}_{\mathrm{O}}(f\left(u\right)\left) \right|} $ | (9) |
$ {F}_{\mathrm{C}}\left(f\right)=\frac{\sum\limits_{u\in {V}_{1}}{F}_{\mathrm{S}}(u, f(u\left)\right)}{\left|{V}_{1}\right|} $ | (10) |
其中:GO(u)和GO(f(u))表示节点u和f(u)被注释的GO集合。
2.3 结果分析本文将JAlign算法与L-GRAAL、SPINAL、ModuleAlign算法进行比较,在参数设置上,拓扑相似性计算中θ设置为0.5,迭代2次,总相似性中α设置为0.4。Jerarca聚类中选择RCluster[26]迭代算法,迭代3次,层次树构建使用UPGMA[26]算法。其他算法的参数设置参照原文设置,具体参数设置如表 2所示。
![]() |
下载CSV 表 2 3种对比算法的参数设置 Table 2 Parameters setting of three alignment algorithms |
4种算法在合成网络上的比对结果如表 3所示,其中,加粗的数据为最佳结果,加下划线的数据为次优结果,下同。在拓扑指标上,JAlign算法的结果明显优于其他3种算法;在生物指标FC上,JAlign算法仅次于SPINAL算法,L-GRAAL算法表现最差。总体而言,JAlign算法在合成网络上表现最好,在保证了较好的生物特性的基础上实现了最好的拓扑质量。
![]() |
下载CSV 表 3 合成网络比对结果 Table 3 Alignment result for synthesis networks |
在真实网络上,分别从EC、ICS、S3、FC这4个方面对比4种算法,4种算法在EC指标上的结果如表 4所示。实验结果表明:在CE-SC、CE-HS、DM-HS中,ModuleAlign算法表现最好;在SC-HS、SC-DM中,JAlign算法表现最好。
![]() |
下载CSV 表 4 不同算法在不同物种上的EC指标 Table 4 EC index of different algorithms for different species |
表 5是不同算法在ICS指标上的对比结果。实验结果表明:L-GRAAL算法在CE-SC、CE-DM、CE-HS、DM-HS实验中结果最好;JAlign算法在这4组实验中表现仅次于L-GRAAL算法,在SC-HS、SC-DM实验中结果最好;SPINAL在各组实验中结果最差。
![]() |
下载CSV 表 5 不同算法在不同物种上的ICS指标 Table 5 ICS index of different algorithms for different species |
表 6是不同算法在S3指标上的对比结果,S3是从源网络和目标网络2个方面度量拓扑特征,能够更全面地分析算法的拓扑质量。实验结果表明:JAlign算法在网络规模较大的物种上,相较于其他算法表现最好,也较为稳定;L-GRAAL算法仅次于JAlign,且在小网络上结果较好。总结上述结果,JAlign算法在拓扑质量上可以得到稳定、最好的实验结果,L-GRAAL算法整体表现仅次于JAlign算法。
![]() |
下载CSV 表 6 不同算法在不同物种上的S3指标 Table 6 S3 index of different algorithms for different species |
表 7是不同算法在FC指标上的对比结果。从生物指标角度来看,SPINAL算法和JAlign算法结果相近,L-GRAAL算法表现最差。
![]() |
下载CSV 表 7 不同算法在不同物种上的FC指标 Table 7 FC index of different algorithms for different species |
表 8给出了不同算法运行时间的比较,实验计算机使用Inter Core i7-10510U 2.30 GHz处理器,内存16 GB,算法在Linux Ubuntu环境下运行。实验结果表明,在时间效率上JAlign算法也具有一定优势,SPINAL、ModuleAlign算法运行时间较长。
![]() |
下载CSV 表 8 不同算法的运行时间 Table 8 Running time of different algorithms |
结合拓扑质量度量结果分析,虽然SPINAL算法在生物指标上表现很好,但在拓扑指标上表现较差,而L-GRAAL算法则与之相反,其在牺牲一定生物质量的基础上实现了较好的拓扑质量,4种算法中只有JAlign算法同时实现了最佳的拓扑度量和生物度量。进一步分析实验过程可知,JAlign算法在目标函数中添加了拓扑特征并降低了序列特征的比重,在聚类算法中也仅依靠节点的结构信息来划分模块,但随着序列信息所占比例的降低,其在生物指标上表现仍优于大部分算法,这说明JAlign算法可以实现生物一致性和拓扑特性的良好平衡。
3 结束语本文提出的生物网络全局比对算法JAlign。基于种子-扩展算法,利用层次聚类算法检测功能模块并进行模块匹配,根据目标函数从模块中筛选种子节点。在此基础上,结合邻居节点与种子节点间的连接关系将比对扩展至种子节点的邻居节点,并对剩余节点构建二分图进行最大加权匹配,使得孤立节点也有机会被比对上。实验结果表明,该算法能够全面地考虑比对过程,实现拓扑质量与生物质量的良好平衡,相较于其他3种对比算法,其在拓扑和生物角度同时达到了最优的比对结果。为优化JAlign算法的效率,进一步提高算法在生物功能方面的性能,下一步将对功能模块检测部分做并行化处理,并将模块检测应用到目标函数计算和种子的扩展阶段。
[1] |
祝家烨. 基于局部优化与二分图匹配的PPI网络比对算法[J]. 计算机应用与软件, 2018, 35(1): 281-287. ZHU J Y. PPI network comparison algorithm based on local optimization and bipartite graph matching[J]. Computer Applications and Software, 2018, 35(1): 281-287. (in Chinese) |
[2] |
MENG L, STRIEGEL A, MILENKOVIĆ T. Local versus global biological network alignment[J]. Bioinformatics, 2016, 32(20): 3155-3164. DOI:10.1093/bioinformatics/btw348 |
[3] |
MASKEY S, CHO Y R. LePrimAlign: local entropy-based alignment of PPI networks to predict conserved modules[J]. BMC Genomics, 2019, 20(9): 964-976. |
[4] |
HU J, REINERT K. LocalAli: an evolutionary-based local alignment approach to identify functionally conserved modules in multiple networks[J]. Bioinformatics, 2015, 31(3): 363-372. DOI:10.1093/bioinformatics/btu652 |
[5] |
AMIR-GHIASVAND F, NOWZARI-DALINI A, MOMENZADEH V. Pin-Align: a new dynamic programming approach to align protein-protein interaction networks[J]. Computational and Mathematical Methods in Medicine, 2014, 2014: 1-5. |
[6] |
SINGH R, XU J, BERGER B. Global alignment of multiple protein interaction networks with application to functional orthology detection[J]. Proceedings of the National Academy of Sciences, 2008, 105(35): 12763-12768. DOI:10.1073/pnas.0806627105 |
[7] |
KUCHAIEV O, MILENKOVIĆ T, MEMIŠEVIĆ V, et al. Topological network alignment uncovers biological function and phylogeny[J]. Journal of the Royal Society Interface, 2010, 7: 1341-1354. DOI:10.1098/rsif.2010.0063 |
[8] |
MILENKOVIĆ T, NG W L, HAYES W, et al. Optimal network alignment with graphlet degree vectors[J]. Cancer Informatics, 2010, 9(8): 121-137. |
[9] |
KUCHAIEV O, PRŽULJ N. Integrative network alignment reveals large regions of global network similarity in yeast and human[J]. Bioinformatics, 2011, 27(10): 1390-1396. DOI:10.1093/bioinformatics/btr127 |
[10] |
MEMIŠEVIĆ V, PRŽULJ N. C-GRAAL: comon-neighbors-based global graph alignment of biological networks[J]. Integrative Biology, 2012, 4(7): 734-743. DOI:10.1039/c2ib00140c |
[11] |
MALOD-DOGNIN N, PRŽULJ N. L-GRAAL: lagrangian graphlet-based network aligner[J]. Bioinformatics, 2015, 31(13): 2182-2189. DOI:10.1093/bioinformatics/btv130 |
[12] |
NEYSHABUR B, KHADEM A, HASHEMIFAR S, et al. NETAL: a new graph-based method for global alignment of protein-protein interaction networks[J]. Bioinformatics, 2013, 29(13): 1654-1662. DOI:10.1093/bioinformatics/btt202 |
[13] |
ALADAĞ A E, ERTEN C. SPINAL: scalable protein interaction network alignment[J]. Bioinformatics, 2013, 29(7): 917-924. DOI:10.1093/bioinformatics/btt071 |
[14] |
PHAN H T T, STERNBERG M J E. PINALOG: a novel approach to align protein interaction networks-implications for complex detection and function prediction[J]. Bioinformatics, 2012, 28(9): 1239-1245. DOI:10.1093/bioinformatics/bts119 |
[15] |
HASHEMIFAR S, MA J, NAVEED H, et al. ModuleAlign: module-based global alignment of protein-protein interaction networks[J]. Bioinformatics, 2016, 32(17): 658-664. DOI:10.1093/bioinformatics/btw447 |
[16] |
KAZEMI E, HASSANI H, GROSSGLAUSER M, et al. PROPER: global protein interaction network alignment through percolation matching[J]. BMC Bioinformatics, 2016, 17(1): 527-543. DOI:10.1186/s12859-016-1395-9 |
[17] |
ALCALÁ A, ALBERICH R, LLABRÉS M, et al. AligNet: alignment of protein-protein interaction networks[J]. BMC Bioinformatics, 2020, 21(6): 1-22. |
[18] |
LIAO C S, LU K, BAYM M, et al. IsoRankN: spectral methods for global alignment of multiple protein networks[J]. Bioinformatics, 2009, 25(12): 253-258. DOI:10.1093/bioinformatics/btp203 |
[19] |
ALKAN F, ERTEN C. BEAMS: backbone extraction and merge strategy for the global many-to-many alignment of multiple PPI networks[J]. Bioinformatics, 2014, 30(4): 531-539. DOI:10.1093/bioinformatics/btt713 |
[20] |
SAHRAEIAN S M E, YOON B J. SMETANA: accurate and scalable algorithm for probabilistic alignment of large-scale biological networks[J]. PloS One, 2013, 8(7): 1-5. |
[21] |
KAZEMI E, HASSANI S H, GROSSGLAUSER M. Growing a graph matching from a handful of seeds[J]. Proceedings of the VLDB Endowment, 2015, 8(10): 1010-1021. DOI:10.14778/2794367.2794371 |
[22] |
TRIPATHI B, PARTHASARATHY S, SINHA H, et al. Adapting community detection algorithms for disease module identification in heterogeneous biological networks[J]. Frontiers in Genetics, 2019, 10: 164-181. DOI:10.3389/fgene.2019.00164 |
[23] |
冀俊忠, 刘志军, 刘红欣, 等. 蛋白质相互作用网络功能模块检测的研究综述[J]. 自动化学报, 2014, 40(4): 577-593. JI J Z, LIU Z J, LIU H X, et al. Research review on functional module detection of protein interaction network[J]. Acta Automata Sinica, 2014, 40(4): 577-593. (in Chinese) |
[24] |
LI C, BAI J, ZHAO W, et al. Community detection using hierarchical clustering based on edge-weighted similarity in cloud environment[J]. Information Processing & Management, 2019, 56(1): 91-109. |
[25] |
BRYANT A, CIOS K. RNN-DBSCAN: A density-based clustering algorithm using reverse nearest neighbor density estimates[J]. IEEE Transactions on Knowledge and Data Engineering, 2018, 30(6): 1109-1121. DOI:10.1109/TKDE.2017.2787640 |
[26] |
ALDECOA R, MARÍN I. Jerarca: efficient analysis of complex networks using hierarchical clustering[J]. PloS One, 2010, 5(7): 11585-11592. DOI:10.1371/journal.pone.0011585 |
[27] |
ALTSCHUL S F, GISH W, MILLER W, et al. Basic local alignment search tool[J]. Journal of Molecular Biology, 1990, 215(3): 403-410. DOI:10.1016/S0022-2836(05)80360-2 |
[28] |
PARK D, SINGH R, BAYM M, et al. IsoBase: a database of functionally related proteins across PPI networks[J]. Nucleic Acids Research, 2010, 39(s1): 295-300. |
[29] |
SAHRAEIAN S M E, YOON B J. A network synthesis model for generating protein interaction network families[J]. PloS One, 2012, 7(8): 1-5. |
[30] |
PATRO R, KINGSFORD C. Global network alignment using multiscale spectral signatures[J]. Bioinformatics, 2012, 28(23): 3105-3114. DOI:10.1093/bioinformatics/bts592 |
[31] |
SARAPH V, MILENKOVIĆ T. MAGNA: maximizing accuracy in global network alignment[J]. Bioinformatics, 2014, 30(20): 2931-2940. DOI:10.1093/bioinformatics/btu409 |
[32] |
HUANG J, GONG M, MA L. A global network alignment method using discrete particle swarm optimization[J]. IEEE/ACM Transactions on Computational Biology and Bioinformatics, 2016, 15(3): 705-718. |
[33] |
ZHU Y, LI Y, LIU J, et al. Discovering large conserved functional components in global network alignment by graph matching[J]. BMC Genomics, 2018, 19(7): 41-58. |