2. 广西嵌入式技术与智能系统重点实验室, 广西 桂林 541004
2. Guangxi Key Laboratory of Embedded Technology and Intelligent System, Guilin, Guangxi 541004, China
开放科学(资源服务)标志码(OSID):
长链非编码RNA(long non-coding RNA,lncRNA)是非编码RNA家族中的一个组成部分,它拥有长度超过200个核苷酸的转录产物[1]。研究表明lncRNA异常表达会导致多种复杂疾病。探寻导致疾病的lncRNA,有助于理解疾病产生的机理,为疾病治疗及预后提供参考[2]。
由于生物实验费时费力,在现实生活中大多采用可计算模型代替生物实验来实现lncRNA-疾病的关联预测,为生物实验提供高效的更准确的候选项。目前,常用基于生物网络和基于机器学习这两类计算方法预测lncRNA-疾病关联。
基于生物网络的方法通常需要构建基因相似性网络,构建完成后,根据lncRNA-疾病的关联得分大小对候选的lncRNA进行排序来预测致病基因。最常用的是标签传播算法,如重启随机游走和KATZ算法,它们的主要区别在于不同的传播算法应用的底层网络不同。文献[3]根据lncRNA功能相似性网络建立了全局的重启随机游走算法RWRlncD,从而对潜在的关联信息进行预测。但是该模型不能预测没有任何已知相关lncRNA的新疾病或没有任何已知相关疾病的孤立lncRNA。文献[4]基于“与多种相同miRNA有关的lncRNA会导致相似疾病”这一生物假设建立了RWRHLD模型,从而预测lncRNA-疾病的关联信息。该模型将miRNA信息加入到lncRNA-lncRNA网络中,与疾病相似性网络和已知的lncRNA-疾病关联网络整合成新网络,在这个新网络中实施重启随机游走。但是该模型不适用于预测没有已知lncRNA-miRNA相互作用的lncRNA,模型实用性较差。文献[5]结合已知的lncRNA-疾病关联、lncRNA表达谱、lncRNA功能相似性、疾病语义相似性和高斯相互作用谱核相似性建立基于KATZ的lncRNA-疾病关联预测模型KATZLDA。虽然该模型可以发现新疾病或孤立lncRNA,但是模型预测精度不高。
基于机器学习的方法是根据与疾病相关的已知lncRNA和没有任何已知关联的lncRNA-疾病对来训练分类器和建立模型的。文献[6]将已知的疾病-lncRNA关联和lncRNA表达谱信息进行整合,构建了LRLSLDA计算模型来预测潜在的lncRNA-疾病关联。该模型不需要负样本且适用于预测孤立lncRNA,但是模型最优参数的选取复杂,且模型分别将疾病空间和lncRNA空间作为两个分类器,对于同一个lncRNA-疾病对会产生两个不同的得分,不同分数的选取会得出不同的预测结果。文献[7]基于贝叶斯算法整合已知的与疾病相关的lncRNA和多种生物学数据(基因组数据、调控和转录生物数据),预测潜在的lncRNA-疾病关联。该模型虽然预测性能良好,但是贝叶斯分类器想要提高预测性能必须使用足够多的负样本,而此类研究缺少负样本,随机选择负样本不利于优化贝叶斯分类器的性能。文献[8]提出基于矩阵分解的lncRNA-疾病关联预测模型MFLDA。该模型通过矩阵分解将数据转换为低秩矩阵,不同的数据拥有各自的权重,并进一步引入迭代解,同时对权重矩阵和低秩矩阵进行优化。优化后得到的矩阵用来重建lncRNA-疾病关联,从而预测出潜在的lncRNA-疾病关联。MFLDA具有较好的适用性,很容易集成各种异构数据源来预测不同类型实体之间的关联,但是该模型寻找低秩矩阵最优秩过程复杂,且模型更偏向于选择稀疏的数据矩阵,导致模型预测精度不高。
为弥补上述不足,深度学习技术逐渐成为研究的热点。图作为一种能够抽象出实体与实体之间关系的数据结构得到广泛应用[9],图结构可以将节点与节点间的关系通过边的权重表现出来。目前,图神经网络主要应用于相邻节点间的信息传递和汇聚。文献[10]将图神经网络中的双向门控循环网络和标签注意力机制结合,提出基于图深度学习的金融文本多标签分类算法,提升了文本分类性能。文献[11]在动态网络异常检测中引入图神经网络,使得结构和属性上的异常可以同时被获知,提升了异常检测的准确度。文献[12]将图神经网络应用到会话序列推荐算法中,引入注意力机制,提出基于复杂结构信息的图神经网络序列推荐算法,提升了会话向量在推荐过程中的准确性。文献[13]将图神经网络用于网络中物理链路与路由方案路径建模,实现了对延迟抖动等端到端性能指标的有效预估。
近年来,图注意力网络(Graph Attention Network,GAT)[14-15]也被应用于一些生物信息学任务中,如文献[16]提出一种新的基于图注意力网络的方法GATMDA识别微生物-疾病关联,文献[17]基于图注意力网络提出预测circRNA-疾病关联的方法GATCDA,文献[18]基于图注意力网络预测药物ADMET分类。但截止到目前,较少有使用图注意力网络进行lncRNA-疾病关联预测的工作。另一方面,归纳矩阵补全(Inductive Martix Completion,IMC)技术广泛应用于生物信息领域[19-21],但也普遍存在预测精度不高的问题。如何更好地将生物信息相似性网络与归纳矩阵补全技术相结合,进一步提升预测性能,是有待研究的一个问题。
本文提出一种基于图注意力网络和归纳矩阵补全技术的双融合机制lncRNA-疾病关联预测模型(Dual Fusion Mechanism Prediction model for lncRNA-Disease Association,DFMP-LDA)。引入n头注意力机制,设计带有双重聚合器的图注意力网络。传统的图注意力网络虽然可以稳定自我注意的过程,但由于节点的独立性,训练后的节点特征不明显,本文通过设计双重聚合器增强lncRNA节点与疾病节点特征,避免传统可计算模型中因已知数据稀疏性导致预测精度不高的问题。在此基础上,利用归纳矩阵补全技术恢复lncRNA-疾病关联矩阵中缺失的元素,应用增强后的节点特征重建lncRNA-疾病关联,并使用Adam优化器[22]进一步提高预测精度。
1 DFMP-LDA模型 1.1 模型框架如图 1所示,DFMP-LDA模型框架主要包括3个步骤,具体如下:
![]() |
Download:
|
图 1 DFMP-LDA模型框架 Fig. 1 Framework of DFMP-LDA model |
1) 相似性网络建立。整合疾病集成相似性网络
2) lncRNA特征、疾病特征增强。使用带有双重聚合器的n头图注意力网络训练特征矩阵
3) lncRNA-疾病关联重建。将第2)步得到的特征矩阵
利用文献[23]提出的有向无环图(Directed Acyclic Graph,DAG)计算疾病之间的语义相似性。任意疾病
$ {D}_{{d}_{i}}\left({d}_{t}\right)=\left\{\begin{array}{l}1, {d}_{t}={d}_{i}\\ \mathrm{m}\mathrm{a}\mathrm{x}\left\{\gamma {D}_{{d}_{i}}\right({d}_{{t}^{\text{'}}}\left)\right|{d}_{{t}^{\mathrm{\text{'}}}}\in {d}_{t}\mathrm{的}\mathrm{孩}\mathrm{子}\mathrm{节}\mathrm{点}\}, {d}_{t}\ne {d}_{i}\end{array}\right. $ | (1) |
其中:参数
由文献[23]可知,两种疾病的DAG图的重叠部分越多,两者相似程度越高。矩阵
$ {D}_{\mathrm{S}}({d}_{i}, {d}_{j})=\frac{\sum\limits_{{d}_{m}\in ({T}_{{d}_{i}}\bigcap {T}_{{d}_{j}})}\left({D}_{{d}_{i}}\right({d}_{m})+{D}_{{d}_{j}}({d}_{m}\left)\right)}{S\left({d}_{i}\right)+S\left({d}_{j}\right)} $ | (2) |
其中:
$ S\left({d}_{i}\right)=\sum\limits_{{d}_{t}\in {T}_{{d}_{i}}}{D}_{{d}_{i}}\left({d}_{t}\right) $ | (3) |
由文献[23]可知,功能相似的lncRNA往往与表型相似的疾病有关,计算两个lncRNA的功能相似性首先要理解疾病的语义相似性及其与lncRNA之间的关系。用集合
$ \mathrm{m}\mathrm{a}\mathrm{x}({d}_{t}, D)=\underset{1\le i\le nd}{\mathrm{m}\mathrm{a}\mathrm{x}} \left({D}_{\mathrm{S}}\right({d}_{t}, {d}_{i}\left)\right) $ | (4) |
矩阵
$ {F}_{\mathrm{S}}({l}_{i}, {l}_{j})=\frac{\sum\limits_{1\le i\le m}\mathrm{m}\mathrm{a}\mathrm{x}({d}_{i}, {D}_{1})+\sum\limits_{1\le j\le n}\mathrm{m}\mathrm{a}\mathrm{x}({d}_{j}, {D}_{2})}{m+n} $ | (5) |
其中:集合
如果疾病
$ {G}_{\mathrm{D}}({d}_{i}, {d}_{j})=\mathrm{e}\mathrm{x}\mathrm{p}(-{\lambda }_{\mathrm{d}}|\left|{I}_{\mathrm{P}}\right({d}_{i})-{I}_{\mathrm{P}}({d}_{j}\left)\right|{|}^{2}) $ | (6) |
在式(6)中,
$ {\lambda }_{\mathrm{D}}=\frac{1}{\frac{1}{nd}\sum\limits_{i=1}^{nd}\left|\right|{I}_{\mathrm{P}}\left({d}_{i}\right)|{|}^{2}} $ | (7) |
同理,用矩阵
$ {G}_{\mathrm{L}}({l}_{i}, {l}_{j})=\mathrm{e}\mathrm{x}\mathrm{p}(-{\lambda }_{\mathrm{l}}|\left|{I}_{\mathrm{P}}\right({l}_{i})-{I}_{\mathrm{P}}({l}_{j}\left)\right|{|}^{2}) $ | (8) |
在式(8)中,
$ {\lambda }_{\mathrm{l}}=\frac{1}{\frac{1}{nl}\sum\limits_{i=1}^{nl}\left|\right|{I}_{\mathrm{P}}\left({l}_{i}\right)|{|}^{2}} $ | (9) |
由于并非所有疾病都可以找到相关的lncRNA,如果给定疾病缺乏相关基因,将无法得到该疾病与其他疾病的语义相似性。为了提高疾病语义相似性的准确性,将疾病的高斯相似性和疾病语义相似性进行集成。如果疾病
$ {D}_{\mathrm{S}}^{\mathrm{I}}({d}_{i}, {d}_{j})=\left\{\begin{array}{l}{D}_{\mathrm{S}}({d}_{i}, {d}_{j})+{G}_{\mathrm{D}}({d}_{i}, {d}_{j}), {D}_{\mathrm{S}}({d}_{i}, {d}_{j})\ne 0\\ {G}_{\mathrm{D}}({d}_{i}, {d}_{j}), {D}_{\mathrm{S}}({d}_{i}, {d}_{j})=0\end{array}\right. $ | (10) |
同理,用矩阵
$ {F}_{\mathrm{S}}^{\mathrm{I}}({l}_{i}, {l}_{j})=\left\{\begin{array}{l}{F}_{\mathrm{S}}({l}_{i}, {l}_{j}), {F}_{\mathrm{S}}({l}_{i}, {l}_{j})\ne 0\\ {G}_{\mathrm{L}}({l}_{i}, {l}_{j}), {F}_{\mathrm{S}}({l}_{i}, {l}_{j})=0\end{array}\right. $ | (11) |
将疾病集成相似性网络
$ \boldsymbol{X}=\left[\begin{array}{cc}\mathbf{0}& {\boldsymbol{D}}_{\mathrm{S}}^{\mathrm{I}}\\ {\boldsymbol{F}}_{\mathrm{S}}^{\mathrm{I}}& \mathbf{0}\end{array}\right] $ | (12) |
原始图注意力网络通过注意力分数在节点更新时自适应聚合邻居节点信息,通过为不同的邻居节点分配不同的权重来学习图上节点的表示。GAT利用多头注意力机制稳定自我注意的过程,每个注意头采用“连接”的方式聚合特征,对于特征向量的提取效果还有待改进。为更好地提取lncRNA特征向量和疾病特征向量,根据文献[16]设计带有双重聚合器的n头图注意力网络,在每个注意头设计中加入双重聚合器,对节点特征进行“加”和“连接”双重操作,并将前一个注意头的输出特征作为下一个注意头的输入特征,经过n次迭代,构造出带有双重聚合器的n头图注意力网络,达到强化节点间特征的目的。
1.3.2 注意头中的特征增强过程在注意头中,特征增强过程具体如下:
1) 注意特征训练层
在特征矩阵
$ {e}_{ij}^{k}=f({\boldsymbol{h}}_{i}^{k}\boldsymbol{W}, {\boldsymbol{h}}_{j}^{k}\boldsymbol{W}) $ | (13) |
其中:
为了使特征矩阵
$ {\alpha }_{ij}^{k}=\frac{\mathrm{e}\mathrm{x}\mathrm{p}\left({e}_{ij}^{k}\right)}{\sum\limits_{t\in {N}_{i}}\mathrm{e}\mathrm{x}\mathrm{p}\left({e}_{it}^{k}\right)} $ | (14) |
其中:
$ {\boldsymbol{h}}_{{N}_{i}}^{k}=\sum\limits_{t\in {N}_{i}}{\alpha }_{it}^{k}{\boldsymbol{h}}_{t}^{k} $ | (15) |
2) 神经特征聚合层
在原始图注意力网络中,神经特征聚合层仅仅是将注意特征训练层的特征进行“连接”操作,为增强节点特征,本文在注意特征训练层得到节点
$ {\boldsymbol{Z}}^{k}=\mathrm{L}\mathrm{e}\mathrm{a}\mathrm{k}\mathrm{y}\mathrm{R}\mathrm{e}\mathrm{L}\mathrm{U}\left(\right({\boldsymbol{h}}_{i}^{k}+{\boldsymbol{h}}_{{N}_{i}}^{k}\left){\boldsymbol{W}}_{1}\right)+\\ \mathrm{L}\mathrm{e}\mathrm{a}\mathrm{k}\mathrm{y}\mathrm{R}\mathrm{e}\mathrm{L}\mathrm{U}\left(\right({\boldsymbol{h}}_{i}^{k}\left|\right|{\boldsymbol{h}}_{{N}_{i}}^{k}\left){\boldsymbol{W}}_{1}\right) $ | (16) |
其中:
最后,每次聚合后的特征
$ \boldsymbol{Z}=|{|}_{k=1}^{n}{\boldsymbol{Z}}^{k}=\left[\begin{array}{c}{\boldsymbol{Z}}^{\mathrm{D}}\\ {\boldsymbol{Z}}^{\mathrm{L}}\end{array}\right] $ | (17) |
其中:
注:特征矩阵
在lncRNA-疾病关联预测方面,研究者常采用矩阵补全的方式,用低秩的关联矩阵表示lncRNA-疾病的关联关系,通过较少的已知关联恢复原始矩阵[25]。但传统的矩阵补全技术依赖于现存的lncRNA-疾病关联进行预测,由于关联矩阵中存在整行、整列数据缺失的情况,会导致冷启动发生,因此不能达到理想的预测效果。DFMP-LDA采用归纳式矩阵补全技术,打破传统矩阵补全的局限,使矩阵补全不只是单纯依赖关联矩阵,而是还加入了样本和未标记信息,实现预测未知样本的功能。
DFMP-LDA模型使用上一步推导得到的疾病特征向量
$ \boldsymbol{Q}={\boldsymbol{Z}}^{\mathrm{D}}\eta ({\boldsymbol{Z}}^{\mathrm{L}}{\eta )}^{\mathrm{T}} $ | (18) |
在此基础上,通过最小化损失函数实现参数训练,根据文献[22],选择Adam优化器对矩阵
$ \mathrm{m}\mathrm{i}\mathrm{n}L=\left|\right|{\boldsymbol{A}}_{\mathrm{l}\mathrm{d}}-{\boldsymbol{Z}}^{\mathrm{d}}\eta \left({\boldsymbol{Z}}^{\mathrm{l}}{\eta )}^{\mathrm{T}}\right|{|}_{\mathrm{F}}^{2}+\lambda \left|\right|{\boldsymbol{W}}_{2}|{|}_{\mathrm{F}}^{2} $ | (19) |
其中:
对原始数据库LncRNA Disease v2.0[26]进行预处理,收集与人类疾病关系密切的lncRNA及其关联,去除重复疾病和lncRNA,最终得到本文使用的数据集Dataset1。Dataset1中含有352个经实验验证的lncRNA-疾病已知关联对,涉及156种lncRNA和190种疾病。为了建立模型,用矩阵
本文采用五折交叉验证法,将已知的lncRNA-疾病关联随机分成5组,实验过程中依次选择1组lncRNA-疾病关联(即正样本)和1组相同大小的未知关联lncRNA-疾病对(即负样本)作为测试样本,剩下的4组lncRNA-疾病关联以及其余未知lncRNA-疾病对用来训练模型。通过设置不同的阈值,获得真阳率(True Positive Rate,TPR)、假阳率(False Positive Rate,FPR)、召回率、精度4个模型评价指标,根据这4个评价指标绘制ROC曲线和PR曲线,模型性能通过ROC曲线下面积(AUC)和PR曲线下面积(AUPR)衡量。为了避免随机分组的影响,每组实验重复进行10次,最后根据10次重复实验的平均值计算AUC值和AUPR值。
2.3 参数选择本节分析注意头数目
![]() |
Download:
|
图 2 不同衰减系数下的AUC值 Fig. 2 AUC values under different delay factors |
![]() |
Download:
|
图 3 不同数目注意头下的AUC值 Fig. 3 AUC values under different number of attention heads |
将DFMP-LDA与现有的3种基于机器学习和基于矩阵分解的计算方法SDLDA[27]、DMF-LDA[28]、TPGLDA[29]在相同的数据集Dataset1上进行比较。SDLDA使用奇异值分解提取lncRNA和疾病的线性特征,使用具有2个完全连接层的神经网络学习lncRNA和疾病的非线性特征,将线性特征和非线性特征结合成一个向量用于最终预测。DMF-LDA使用带有一系列非线性隐藏层的神经网络,从lncRNA-疾病关联矩阵中提取lncRNA和疾病的潜在特征,然后将这2个特征融合成一个新的向量,用其执行预测任务。TPGLDA将基因疾病关联与lncRNA疾病关联相结合,基于分配算法预测潜在的lncRNA疾病关联。五折交叉验证后,得到DFMP-LDA与其他3种模型的ROC曲线、PR曲线、AUC值、AUPR值和预测时间,分别如图 4、图 5和表 1所示。
![]() |
Download:
|
图 4 DFMP-LDA与其他模型的ROC曲线 Fig. 4 ROC curves of DFMP-LDA and other models |
![]() |
Download:
|
图 5 DFMP-LDA与其他模型的PR曲线 Fig. 5 PR curves of DFMP-LDA and other models |
![]() |
下载CSV 表 1 DFMP-LDA与其他模型的预测性能对比 Table 1 Prediction performance comparison of DFMP-LDA and other models |
由表 1可知,从AUC值和AUPR值来看,DFMP-LDA的预测性能优于SDLDA和DMFLDA,虽然DFMP-LDA的AUC值比TPGLDA低了0.76%,但是AUPR值比TPGLDA高1.75%,而且在预测时间上DFMP-LDA较TPGLDA节省了16.12%。从AUC值、AUPR值和预测时间3个方面得出,DFMP-LDA的综合性能最优。
3 结束语本文建立一种融合图注意力网络和归纳矩阵补全技术的lncRNA-疾病关联预测模型,该模型利用图注意力网络的n头注意力机制对节点及其邻居节点集特征进行加权,并通过注意头中的双重聚合操作进一步增强节点特征。在此基础上,增强后的特征矩阵输入到归纳矩阵补全过程中,补全原始关联矩阵中缺失元素,重建lncRNA-疾病关联网络。五折交叉验证结果显示,DFMP-LDA与对比的3种计算模型相比AUPR值最优,AUC值分别比SDLDA模型和DMFLDA模型高7.64%、10.18%,虽然AUC略低于TPGLDA模型,但是预测时间节省了16.12%。以上结果显示,DFMP-LDA模型是一个可靠的lncRNA-疾病关联预测模型。
如何整合多种lncRNA和疾病的生物信息是未来主要的研究方向。此外,因为无法获得新lncRNA和孤立疾病的特征,所以DFMP-LDA不能对这些基因和疾病进行预测。后续将考虑结合基因测序等手段收集更多的生物信息,同时对聚合器进行优化,进一步提高预测准确性。
[1] |
夏天, 肖丙秀, 郭俊明. 长链非编码RNA的作用机制及其研究方法[J]. 遗传, 2013, 35(3): 269-280. XIA T, XIAO B X, GUO J M. Acting mechanisms and research methods of long noncoding RNAs[J]. Hereditas, 2013, 35(3): 269-280. (in Chinese) |
[2] |
王利然, 杨丽红, 宁文华, 等. 长链非编码RNA调控血管新生的研究进展[J]. 中国比较医学杂志, 2021, 31(4): 143-149. WANG L R, YANG L H, NING W H, et al. Research progress of long non-coding RNA involvement in angiogenesis[J]. Chinese Journal of Comparative Medicine, 2021, 31(4): 143-149. (in Chinese) DOI:10.3969/j.issn.1671-7856.2021.04.021 |
[3] |
SUN J, SHI H B, WANG Z Z, et al. Inferring novel lncRNA-disease associations based on a random walk model of a lncRNA functional similarity network[J]. Molecular BioSystems, 2014, 10(8): 2074-2081. DOI:10.1039/C3MB70608G |
[4] |
ZHOU M, WANG X J, LI J W, et al. Prioritizing candidate disease-related long non-coding RNAs by walking on the heterogeneous lncRNA and disease network[J]. Molecular BioSystems, 2015, 11(3): 760-769. DOI:10.1039/C4MB00511B |
[5] |
CHEN X. KATZLDA: KATZ measure for the lncRNA-disease association prediction[J]. Scientific Reports, 2015, 5(1): 16840. DOI:10.1038/srep16840 |
[6] |
CHEN X, YAN G Y. Novel human lncRNA-disease association inference based on lncRNA expression profiles[J]. Bioinformatics, 2013, 29(20): 2617-2624. DOI:10.1093/bioinformatics/btt426 |
[7] |
ZHAO T, XU J, LIU L, et al. Identification of cancer-related lncRNAs through integrating genome, regulome and transcriptome features[J]. Molecular BioSystems, 2015, 11(1): 126-136. DOI:10.1039/C4MB00478G |
[8] |
FU G Y, WANG J, DOMENICONI C, et al. Matrix factorization-based data fusion for the prediction of lncRNA-disease associations[J]. Bioinformatics, 2017, 34(9): 1529-1537. |
[9] |
王健宗, 孔令炜, 黄章成, 等. 图神经网络综述[J]. 计算机工程, 2021, 47(4): 1-12. WANG J Z, KONG L W, HUANG Z C, et al. Survey of graph neural network[J]. Computer Engineering, 2021, 47(4): 1-12. (in Chinese) DOI:10.19678/j.issn.1000-3428.0058382 |
[10] |
金雨澄, 王清钦, 高剑, 等. 基于图深度学习的金融文本多标签分类算法[J]. 计算机工程, 2022, 48(4): 16-21. JIN Y C, WANG Q Q, GAO J, et al. Multi-label financial text classification algorithm based on graph deep learning[J]. Computer Engineering, 2022, 48(4): 16-21. (in Chinese) |
[11] |
郭嘉琰, 李荣华, 张岩, 等. 基于图神经网络的动态网络异常检测算法[J]. 软件学报, 2020, 31(3): 748-762. GUO J Y, LI R H, ZHANG Y, et al. Graph neural network based anomaly detection in dynamic networks[J]. Journal of Software, 2020, 31(3): 748-762. (in Chinese) DOI:10.13328/j.cnki.jos.005903 |
[12] |
胡承佐, 王庆梅, 李迪超, 等. 基于复杂结构信息的图神经网络序列推荐算法[J]. 计算机工程, 2022, 48(5): 82-90, 97. HU C Z, WANG Q M, LI D C, et al. Sequence recommendation algorithm of graph neural networks based on complex structure information[J]. Computer Engineering, 2022, 48(5): 82-90, 97. (in Chinese) |
[13] |
车向北, 康文倩, 邓彬, 等. 一种基于图神经网络的SDN路由性能预测模型[J]. 电子学报, 2021, 49(3): 484-491. CHE X B, KANG W Q, DENG B, et al. A prediction model of SDN routing performance based on graph neural network[J]. Acta Electronica Sinica, 2021, 49(3): 484-491. (in Chinese) |
[14] |
VELICKOVIC P, CUCURULL G, CASANOVA A, et al. Graph attention networks[C]//Proceedings of the 6th International Conference on Learning Representations. Vancouver, Canada: Vancouver Convention Center, 2018: 1-12.
|
[15] |
VASWANI A, SHAZEER N, PARMAR N, et al. Attention is all you need[EB/OL]. [2021-10-21]. https://arxiv.org/abs/1706.03762.
|
[16] |
LONG Y H, LUO J W, ZHANG Y, et al. Predicting human microbe-disease associations via graph attention networks with inductive matrix completion[J]. Briefings in Bioinformatics, 2020, 22(3): 1-13. |
[17] |
BIAN C, LEI X J, WU F X. GATCDA: predicting circRNA-disease associations based on graph attention network[J]. Cancers, 2021, 13(11): 2595. |
[18] |
顾耀文, 张博文, 郑思, 等. 基于图注意力网络的药物ADMET分类预测模型构建方法[J]. 数据分析与知识发现, 2021, 5(8): 76-85. GU Y W, ZHANG B W, ZHENG S, et al. Predicting drug ADMET properties based on graph attention network[J]. Data Analysis and Knowledge Discovery, 2021, 5(8): 76-85. (in Chinese) |
[19] |
LU C Q, YANG M Y, LUO F, et al. Prediction of lncRNA-disease associations based on inductive matrix completion[J]. Bioinformatics, 2018, 34(19): 3357-3364. |
[20] |
HUANG L, LI X H, GUO P F, et al. Matrix completion with side information and its applications in predicting the antigenicity of influenza viruses[J]. Bioinformatics, 2017, 33(20): 3195-3201. |
[21] |
CHEN X, SUN L G, ZHAO Y. NCMCMDA: miRNA-disease association prediction through neighborhood constraint matrix completion[J]. Briefings in Bioinformatics, 2020, 22(1): 485-496. |
[22] |
KINGMA D P, BA J L. Adam: a method for stochastic optimization[C]//Proceedings of International Conference on Learning Representations. New York, USA: ACM Press, 2015: 1-15.
|
[23] |
WANG D, WANG J, LU M, et al. Inferring the human microRNA functional similarity and functional network based on microRNA-associated diseases[J]. Bioinformatics, 2010, 26(13): 1644-1650. |
[24] |
VAN LAARHOVEN T, NABUURS S B, MARCHIORI E. Gaussian interaction profile kernels for predicting drug-target interaction[J]. Bioinformatics, 2011, 27(21): 3036-3043. |
[25] |
陈蕾, 陈松灿. 矩阵补全模型及其算法研究综述[J]. 软件学报, 2017, 28(6): 1547-1564. CHEN L, CHEN S C. Survey on matrix completion models and algorithms[J]. Journal of Software, 2017, 28(6): 1547-1564. (in Chinese) |
[26] |
CHEN G, WANG Z Y, WANG D Q, et al. LncRNADisease: a database for long-non-coding RNA-associated diseases[J]. Nucleic Acids Research, 2012, 41(D1): D983-D986. |
[27] |
ZENG M, LU C Q, ZHANG F H, et al. SDLDA: lncRNA-disease association prediction based on singular value decomposition and deep learning[J]. Methods, 2020, 179: 73-80. |
[28] |
ZENG M, LU C, FEI Z, et al. DMFLDA: a deep learning framework for predicting lncRNA-disease associations[J]. IEEE/ACM Transactions on Computational Biology and Bioinformatics, 2021, 18(6): 2353-2363. |
[29] |
DING L, WANG M H, SUN D D, et al. TPGLDA: novel prediction of associations between lncRNAs and diseases via lncRNA-disease-gene tripartite graph[J]. Scientific Reports, 2018, 8(1): 1065. |