开放科学(资源服务)标志码(OSID):
自闭症谱系障碍(Autistic Spectrum Disorder,ASD)是一种会导致言语困难、社会互动和沟通障碍、重复行为和运动能力延迟的神经系统发展障碍疾病。目前,临床主要根据医师主观经验判断以及相关量表测量进行自闭症诊断,不可避免地存在漏诊或者误诊的情况。截至目前还有很多包括自闭症在内的脑部疾病发病缘由尚不清楚,这也促使了科研人员对于探索生物神经系统的基础连接展开研究,从而合理解释人类大脑结构和功能的变化与脑部疾病的关系。
为了实现这一目标,脑神经科学专家利用神经成像技术加强人们对神经机制的理解,更好地描述神经元之间产生的内源性活动。在现有的医学模式中,基于功能性磁共振成像(functional Magnetic Resonance Imaging,fMRI)的使用较为广泛,从神经科学和神经成像的角度来看,功能性磁共振成像能够以非侵入性的方式解码人类大脑皮层的感知和语义信息,功能性脑成像通过测量血液流动和新陈代谢,以可视化方式激活特定大脑区域。现代脑科学研究表明,许多大脑高级认知功能的实现依赖的是不同脑区之间的协同合作,不仅仅依靠于某个具体的脑区。若把不同的脑区连接起来,则能构成一个非常复杂庞大的大脑连接网络。通过这种方式,fMRI可以揭示大脑网络中可导致神经功能障碍的新模式,因此被广泛用于脑组织和精神障碍研究。
随着人工智能和深度学习(Deep Learning,DL)技术应用于医学领域,极大弥补了临床医师主观判断的不足,在成像识别、智能诊断等任务中取得了重要进展。深度学习相比于传统机器学习效果有所提升,但不能较好地推广至非欧氏数据类型。由于图数据的结构与脑网络的拓扑结构非常相似,因此图神经网络(Graph Neural Network,GNN)被提出用于解决该问题。得益于图的强大表达能力,图卷积网络将欧氏数据的卷积运算推广到非欧氏图数据,基于图(graph)的辅助诊断方法在生物医学领域得到了广泛应用。
本文对图神经网络在自闭症神经成像诊断中的应用进行分析,将图神经网络在自闭症辅助诊断中的建模方法归纳为基于人群图和基于个体图两类,对两类框架处理流程进行概括,并在两类框架下对具体诊断方法做进一步分析和总结,最后对脑神经科学领域的辅助诊断面临的挑战和未来的研究方向进行展望。
1 图神经网络图是一种数据结构,常见的图结构由节点和边构成,节点包含了实体信息,边包含实体间的关系信息。图神经网络扩展了卷积神经网络的数据表示和分类能力,将规则欧氏域上的信号(如图像和音频信号)扩展为非欧氏域上的不规则图结构数据,是深度学习在图结构数据上的具体应用。近年来,随着GNN能处理结构更加复杂的图结构数据,逐渐成为研究热点。
在一个图结构中,每一个节点由它自身的特征及其相连的节点特征来定义该节点。GNN的目标是学习每个节点v的表示
$ {h}_{v}=f\left({x}_{v}, {x}_{\mathrm{c}\mathrm{o}\left[v\right]}, {h}_{\mathrm{n}\mathrm{e}\left[v\right]}, {x}_{\mathrm{n}\mathrm{e}\left[v\right]}\right) $ | (1) |
对于关注节点的任务,可直接利用
1)图卷积网络(Graph Convolutional Network,GCN)[1]。GCN是目前最重要的图神经网络,图卷积网络中使用可学习滤波器聚合邻域节点的特征。GCN按更新方式可分为基于谱域和基于空间域,其中基于谱域的GCN在图信号处理中应用广泛,而基于空间域的GCN通过模拟传统卷积神经网络在图像上的卷积操作,根据节点的空间关系定义图卷积。
2)图注意力网络(Graph Attention Network,GAT)。GAT将注意力机制引入基于空间域的图神经网络,解决了图卷积神经网络存在的问题。文献[2]采用Attention机制,可为不同节点分配不同权重,在训练时依赖成对的相邻节点,而不依赖具体的网络结构,适用于inductive任务。
3)深度图神经网络。随着GNN感受野随着网络深度的增加呈指数级增大,深度图神经网络在信息传递过程中会引入大量噪声,节点在聚合操作后容易出现过平滑问题。因此,文献[3]通过跳跃连接,使得每个节点可以灵活地利用不同的邻域范围,自适应选择聚合邻域信息的范围来得到节点的表示。
4)门控图神经网络。图神经网络还可以通过更复杂的方法来控制信息传播,如利用门控循环单元(Gated Recurrent Unit,GRU)[4]、长短期记忆(Long Short-Term Memory,LSTM)网络[5]的门控方式来传递图信息,以减少GNN中的计算限制,改善信息在图结构中的长时传播,但此类CNN运行固定数量的训练步骤,无法保证收敛。文献[6]将函数f变换为压缩映射,并在传播步骤中使用GRU,缓解了GNN的局限性。
2 脑网络建模随着神经成像技术的发展,fMRI、结构性磁共振成像(structural Magnetic Resonance Imaging,sMRI)、正电子发射型计算机断层显像(Positron Emission Computed Tomography,PET)等复杂脑成像数据为运用图神经网络进行脑疾病诊断提供了可能,人脑的活动模式可以用脑网络的功能/结构连接来描述,因此,首要的任务是进行脑成像的脑网络模型构建。如图 1所示,脑网络的建模有基于人群图和基于个体图 2种方式:
![]() |
Download:
|
图 1 基于GNN模型的脑网络主要建模方式 Fig. 1 Main modeling approaches for brain networks based on GNN models |
![]() |
Download:
|
图 2 个体图在GNN上的应用框架 Fig. 2 Application framework of individual graph on GNN |
1)基于个体图的建模方式。在该方式中,节点代表大脑解剖区域,边表示形态、功能或结构连接,定义为这些区域的时间序列之间的相关性。每个图仅代表一个被试脑区,每个被试脑区之间的联系以静止状态功能连接(Resting State Functional Connectivity,RSFC)图的形式出现,需要通过图比较、测量和学习来进一步分析。
2)基于人群图的建模方式。在该方式中,每个节点代表一个特定受试者的脑图,边被确定为受试者成像学特征或者表型特征(年龄、性别、惯用手等)之间的相似性。
文献[7-8]基于个体图的建模方式通过将每一个患者的脑成像视为一个脑图进行模型学习,然后通过图比较度量做进一步分析。首先,将预处理后的fMRI数据通过脑图谱模板(如Harvard Oxford)划分为模板相应数目脑区,其中每一个感兴趣区域(Region of Interest,ROI)表示为一个节点。其次,计算脑区平均时间序列,使用z-score进行标准化。然后,计算两个脑区之间的皮尔逊相关系数。最后,利用Fisher z变换提高方差的一致性,最终表示为静息状态功能连接图。个体图在GNN上的应用框架如图 2所示。个体图中每一个节点代表一个相应的感兴趣区域,RSFC图表示为脑区之间的潜在相关性,根据选取的GNN模型进行一系列卷积、池化操作后可以得到最终的一个低维向量。该向量可以用于疾病预测以及解释一些与疾病相关的生物标志物和脑区关联的问题。
个体图侧重于考虑ROI之间的成对关系,而忽略了被试之间的关联,基于人群图的建模方式通过构建人群图建立图模型,是由整个被试构成的结构,图中每一个节点代表一个被试,从成像数据中提取的特征向量作为每个节点的特征,边代表了被试之间的关系。有些学者除了应用脑成像数据外,还利用受试的性别、年龄、受教育程度等表型信息进行辅助疾病预测,人群图在GNN上的应用框架如图 3所示。首先根据数据预处理后得到的成像数据和表型数据构建人群图,其中每一个被试表示为一个节点,成像信息作为节点的特征,边的构造依据不同被试的表型信息以及成像数据特征的相似度,代表节点之间的关系,然后选取相应的图神经网络来处理构造的人群图,最后通过卷积方式聚合邻居信息进行半监督的节点分类任务,最终得到未知节点的预测值。
![]() |
Download:
|
图 3 人群图在GNN上的应用框架 Fig. 3 Application framework of population graphs on GNN |
随着图神经网络在疾病分类任务中的广泛应用,为进一步提高分类准确率,需要充分利用复杂的多模态数据,提取其中隐藏的特有的有效信息,这些数据通常是非欧几里得数据,难以通过传统深度学习方法进行处理,因此可以通过图神经网络利用成像学和非成像学信息进行神经疾病预测。
3 传统自闭症辅助诊断随着脑成像技术的快速发展,静息态功能性磁共振成像(resting-state functional Magnetic Resonance Imaging,rs-fMRI)下的脑网络分析方法受到广泛关注。目前,大量研究分析了自闭症患者与正常人静息状态下的脑网络差异,表明利用神经成像学异常作为ASD诊断的生物标志物是可行的。文献[9]使用人工智能算法来分析fMRI数据,是将神经成像异常作为ASD诊断的生物标志物工作的关键。文献[10]利用种子点法和模板法分别获得了14名自闭症患者和14名正常人的默认模式网络,使用logistic回归分类器进行分类,准确率为96.3%。这些研究虽然有很好的分类结果,但都是基于小样本数据,应用前景有限。文献[11]以多种方式构建了面向被试的连接器,并比较了不同预处理步骤对分类结果的影响,最后利用SVM分类算法实现了67%的分类精度。
深度学习分类方法可以利用不同层次的非线性层从输入数据中自动发现鉴别力强的表征,在近几年得到广泛应用。用于ASD诊断的深度学习方法可以分为基于自动编码器(Auto Encoder,AE)、基于卷积和基于循环神经网络(Recurrent Neural Network,RNN)3类。基于AE的深度学习分类方法能够学习高分辨和低维特征表示,但经常丢弃数据空间结构。
文献[12]提出一种新的volumetric卷积神经网络(Convolutional Neural Network,CNN)框架,该框架利用全分辨率的rs-fMRI数据的三维空间结构,适用于非线性预测模型。与基于卷积及专注于嵌入MRI的空间信息的模型不同,文献[13]基于RNN并利用来自fMRI时间序列数据的特征时间模式,能得到更加多元精细的特征。
4 基于GNN的自闭症辅助诊断尽管传统自闭症辅助诊断取得了不错的效果,但现有的深度学习方法在脑连接体分析方面遇到了挑战。例如,CNN在图像特征学习中应用较普遍,但因为典型图像的局部邻域结构被用于欧氏空间的卷积和池化操作,然而由于脑网络图的欧氏结构不规则,因此很难从脑网络图中有效提取代表性特征。由于图数据的结构与脑网络的拓扑结构非常相似,因此将图神经网络很自然地应用于脑疾病领域,由于与传统CNN处理方法相比大幅降低了计算复杂度,基于GNN的方法逐渐成为主流。本节首先介绍了开源自闭症谱系障碍数据集(ABIDE),接着分别从两种不同的脑网络建模方法入手对GNN在自闭症辅助诊断上的应用进行整理归纳,最后对所有方法进行概括。
4.1 ABIDE数据集开源自闭症谱系障碍数据集[14]共享计划涉及20个扫描站点。ABIDE收录了2 000多个自闭症儿童和正常发育儿童的结构和fMRI扫描,并分为ABIDE-I和ABIDE-II两个版本。由于不同站点使用的数据采集设备、参数、诊断协议或评估协议不同,因此ABIDE是一个高度异构的数据集。为了保证方法的可比性,据统计目前在ASD疾病的研究中,多数使用包含17个站点871名受试者的ABIDE-I数据集,这些数据是根据3位专家的视觉检查结果进行筛选的,重点考虑了数据不完全的大脑覆盖、严重的头部运动、伪影和其他扫描伪影。ABIDE-I预处理后的fMRI图像数据可以从PCP(Preprocessed Connectomes Project)下载[15],采用的预处理方法遵从CPAC[16]。在过去,对于这些疾病的预测多数依赖于特定的成像特征,rs-fMRI和任务功能性MRI是将人群划分为ASD或健康控制(Health Control,HC)组的主要方式。随着图卷积神经网络的发展,研究人员开始将注意力转向使用图卷积神经网络对其进行预测。根据构图方法的不同,ASD预测主要分为基于人群图和基于个体图。
4.2 基于人群图的GNN建模人群图已被证明是有效的脑疾病分类图,文献[17]提出将GCN应用于基于人群图的脑疾病诊断任务,提取被试的MRI成像数据特征作为节点特征,被试之间的潜在联系用辅助的表型数据中的性别和获取站点来定义,表示为边的权重,在ABIDE数据集得到69.5%的平均准确率。文献[18]在文献[17]的基础上进行拓展,将谱图卷积的概念应用于基于人群图的诊断,结果表明GCN使用更加精确的图结构可以提高分类精度,最后得到的准确率达到70.4%。但是实验未考虑将其推广到新的站点会导致性能下降的问题,而且被试之间类别数量不平衡问题也需要做进一步研究。文献[19]在文献[17]的基础上改进了GCN,通过设计具有不同内核大小的过滤器来构建模型架构,能够在卷积过程中捕获图内和图间的结构异质性,但是存在数据方差增大时模型对于感受野的大小变得敏感的缺陷。
由于图数据中的噪声会影响GNN模型的训练和预测效果,因此文献[20]将置信学习方法引入图卷积网络模型,以对带有标签噪声的图数据中的节点进行分类。实验结果表明,在人工注入标签噪声情况下该方法依旧取得了67.63%的准确率,但在真实世界噪声下的效果还有待验证。
一些具有优异效果的自闭症分类模型训练时往往需要训练大量样本以获得相应参数,该过程通常耗费大量时间。文献[21]研究了一种更简单的线性模型进行基于人群图的疾病预测,利用简化图卷积的概念,极大地提高了训练速度。
尽管图神经网络在基于人群图建模的疾病诊断领域得到应用,但是没有系统的方法来定义构建的人群图,导致预测模型不具备鲁棒性。为了解决该问题,文献[22]通过从初始总体图生成多个随机图来降低初始图构造步骤的敏感性,为每个随机图训练一个G-CNN并融合预测结果。由于单独的预测模型表现为弱学习者,因此可以通过聚合以产生优异的分类性能。虽然这种方法降低了模型对图构造选择的敏感性,但并没有选出最优的输入图。
为了探索人群图对于模型分类精度的影响,文献[23]提出一种基于人群图的多模型集成方法,使用图像和表型特征的不同组合构建人群图,利用神经网络架构来组合多个基于图的模型进行预测。这项工作的一个潜在延伸是使模型根据表型数据特征,自动选择关联信息进行边的构造。
文献[24]利用自编码器构建具有部分标记节点和变分边的自适应人群图,然后提出具有边dropout的图卷积网络进行学习,最后得到每个被试的预测值,但这种编码器不能自动选择最有利于分类的表型数据。
文献[25]认为之前的工作忽略了非成像数据中很多的有用信息,并且表型数据的合理选取有助于构建人群图进行预测任务,因此提出一种编码器,其能自动选择对最终结果有积极影响的表型测度构建人群图。文献[26]提出一种模态-注意多模态融合方法,通过利用各模态之间的相关性和互补性来整合各模态的特征,并且利用一种新的自适应图学习方法来捕获潜在的图结构。该方法可以与预测模型进行共同优化,从而揭示样本之间的内在联系。
近几年,多数方法在关注被试之间的关联关系的同时,忽略了个体级别脑网络拓扑结构的信息。文献[27]提出一种层次GCN框架,在考虑网络拓扑信息和被试之间关联的同时学习图特征嵌入,从层次的角度进行图嵌入学习,同时考虑个体大脑网络的结构和在人群图中的相关性,可以捕捉到最基本的嵌入特征,提高疾病诊断的分类性能。
文献[28]认为已有的诊断模型受位点间测量异质性和个体间表型差异的影响,研究方法也仅关注于异常的脑功能连接,忽略了区域活动的影响,因此提出一种新的成像特征提取方法,该方法可以学习整个大脑网络关于功能连接和区域活动的个性化低维度表示,随后将稀疏特征向量嵌入人群图进一步重新校准表型信息下提取特征的分布。
由于GCN中的过平滑问题,因此目前的研究成果均基于浅层GCN。文献[29]通过使用DeepGCN改进分类结果。在DeepGCN模型中引入ResNet单元和DropEdge策略,避免了梯度消失、过度拟合和过度平滑问题,达到73.7%的分类精度。
在建立临床诊断的预测模型时,泛化和可解释性是很重要的。为了解释大脑区域的相关性和被试之间的相关性,以及找到相应的Biomarkers,文献[30]提出一种图中图数据结构,它由两类图组成,即内部大脑连接图和外部人群图来探索一些更深层的关系,但是实验结果表明内部大脑连接图起到的特征提取作用并不明显,以致于分类精度不高。
文献[31]提出一种包含层次GCN和迁移学习的稀疏大脑网络集成框架,该框架允许GCN捕获被试和脑网络之间的内在相关性,在考虑网络拓扑信息和被试关联的情况下学习网络特征嵌入以改进模型的疾病诊断能力。这项工作是首次尝试在两个相关的疾病领域进行迁移学习,以揭示两种疾病之间的相关性。
文献[32]通过减少非成像元数据的使用,提出一种完全基于成像数据的疾病诊断方法,其中来自结构和功能性磁共振成像数据的信息被融合以构造图的边和节点,利用神经科学信息的时间度量(如振幅低频波动和熵)结合3D图像中每个体素的时间活动来表示每一个被试。
4.3 基于个体图的GNN建模利用rs-fMRI进行动态网络分析可以深入了解人类大脑的基本动态特征,从而为脑疾病的自动识别提供有效的解决方案。不同于人群图依靠被试之间的相似性构造邻接图,学习相似被试的邻接信息从而更新自身信息实现节点分类,基于个体图的方法在个体级别上对被试进行研究,利用整个脑图进行目标疾病预测,其中脑图中的节点表示为基于脑图谱分割后的感兴趣区域(ROI),节点之间的边表示为ROI之间相同时间序列下的血氧水平依赖(Blood Oxygenation Level Dependent,BOLD)或者体素的相似性,表示为一个特定的功能连接矩阵,最后构建一个带标签的脑图。
一些基于个体图的GNN模型通过学习脑图来预测脑部疾病。文献[33]使用基于图论的复杂网络分析来表征大脑连接网络的全局和区域拓扑结构,使用拓扑度量和GCN来创建有助于分类任务的新的图相关特征。由于目前尚不清楚不同非欧氏结构的脑功能网络(Functional Brain Network,FBN)在多大程度上影响基于GNN的疾病分类表现,并且是较为早期的工作,因此模型缺少可解释性,不能通过模型发现引起病因的生物标志物。文献[34]提出一种GNN方法来学习不同被试和功能连接图之间的相似性(距离)度量。文献[35]基于文献[34]的研究工作,在有监督的环境下使用孪生图卷积神经网络(siamese GCN,s-GCN)学习图的相似性度量用于分类和流形学习,并对之前用于异构数据的全局损失函数进行修改。
已有研究通常较少关注每个大脑的rs-fMRI时间序列中全局网络结构随时间的演化,并将基于网络的特征提取和分类器训练视为两个独立的任务。针对这些问题,文献[8]提出一种基于rs-fMRI时间序列数据的时间动态学习(Time-Dynamic Learning,TDL)方法,通过该方法将网络特征提取和分类器训练整合到统一的框架中,与已有研究相比,TDL模型不仅可以明确地模拟全局脑网络随时间变化的连接模式,而且还可以捕获每个ROI上的独特特征,但是实验脑区ROI划分策略单一,局限于AAL(Anatomical Automatic Labeling)脑图谱模板。
由于现有基于图的嵌入方法不能很好地建模节点子集之间的高阶交互,文献[36]将U-Net体系结构推广到超图,利用超图的结构学习多对多节点嵌入高阶特征聚合规则,通过改进局部特征聚合和保留数据中的高阶关系,学习数据样本的低维嵌入,同时捕捉它们的高阶关系。
在利用全连接层进行空间特征提取时往往会忽略了大脑的功能组织,由于过度拟合,因此很难训练出具有良好泛化能力的全连通模型。文献[37]提出一种用于功能磁共振成像分析的基于连通性的图卷积网络(cGCN)结构。该方法并不是从传统的欧几里得的邻域中提取空间特征,而是允许模型从大脑连接组的邻域中提取有效特征,这与大脑的功能组织是一致的。实验结果表明,cGCN可以有效地捕捉功能性连接特征,但存在的局限性是未考虑脑功能连接的显著可变性,只是静态更新,未来可以利用多模态成像学数据提高分类效果。
传统研究通常利用一个特定的模板将大脑划分为多个感兴趣区域来构建功能连接,这可能会将分析限制在由模板确定的单一空间尺度(即固定图)中。文献[38]提出一种多尺度三重图卷积网络用于rs-fMRI数据的脑功能连接分析,不仅考虑受试之间潜在的高阶(三联)关联,而且考虑数据的空间尺度。
基于个体图级别的图神经网络模型不仅可以用来预测疾病,还可以用来解释大脑某些区域与特定神经系统疾病的关系,这一直是神经成像学研究的重点,即识别出与发病相关的显著区域。文献[7]提出一个可解释的GNN框架和一个新的正则化池化层来突出ROI,以便根据池化层计算的节点分数推断哪些ROI对识别特定疾病很重要,以此确定与疾病相关的神经脑生物标记物,但是实验所使用的数据量较少,不能达到更具普遍性的预测效果。
文献[39]提出一种基于皮尔逊相关的空间约束表示(PSCR)方法,用于估计FBN结构,并将其转化为脑图,然后送入图注意力网络(GAT)进行ASD诊断,结果也证明了PSCR方法的优越性,但实验未考虑消除异构站点数据间的可变性,皮尔逊相关和空间约束逐个估计每个被试,忽略了组信息。
为更加深入理解某些大脑区域与特定神经障碍或认知刺激的关系,文献[40]基于功能性磁共振成像构建加权图,设计一种新的脑ROI感知图卷积层,其中ROI选择池化层结合多个正则化项来进行合理的ROI选择,不仅具有灵活性,可以保留个体或群体级别模式,而且突出了显著的ROI(图中的节点),以便推断哪些ROI对预测更重要。
4.4 ASD诊断根据上文总结的26项关于ASD分类的研究,按照构图方法的不同,ASD疾病诊断主要可以分为基于人群图和基于个体图,两种方法的总结与归纳如表 1和表 2所示。两种方法各有优劣势,其中基于个体图的方法在评价指标的数值上普遍低于基于群体图的方法,但基于个体图的方法可以更有利于解释以及寻找神经系统疾病引起的大脑紊乱改变的生物标志物。尽管这些研究使用了相同的数据集,但所使用的子集数量差异很大,样本数量从115到2 100不等。其中基于人群图的方法准确率最低为67.63%,最高为98.4%,基于个体图的方法准确率最低为62.9%,最高为80%。可以看出,目前在ABIDE上的实验绝大部分局限于单一的fMRI成像数据,临床研究表明,使用多模态技术可以有效提高ASD诊断的准确性,由于在ABIDE数据集中,并没有给出大量被试的扩散张量成像(Diffusion Tensor Imaging,DTI)模态,因此通过DTI数据结合GNN模型诊断ASD的研究效果是有限的。多模态数据集的使用可以促进GNN模型更好地进行ASD诊断的研究。
![]() |
下载CSV 表 1 GNN基于人群图实现的ASD诊断方法总结 Table 1 Summary of GNN's population graph-based approaches to ASD diagnosis |
![]() |
下载CSV 表 2 GNN基于个体图实现的ASD诊断方法总结 Table 2 Summary of GNN's individual graph-based approaches to ASD diagnosis |
由于图神经网络在自闭症脑部疾病诊断上的优异表现,近几年引起了广泛关注,脑神经科学专家开展了大量研究工作。虽然这些工作在自闭症分类任务中取得了一定的成果,但仍存在着一些限制和挑战,未来仍有很多问题需做进一步探究。
5.1 小样本数据增强与深度学习在疾病研究中,由于患者的隐私以及设备、检测成本的高昂,限制了可供研究的疾病的数据量。传统GNN模型需要大量的数据学习,模型性能往往取决于数据的数量和质量。高噪声的小样本可能会导致过拟合和特征学习效果差,使模型在小数据集上准确率降低。因此,如何通过少量带标签的数据训练获得性能较好的GNN模型,从而实现分类预测任务是亟需解决的问题。为此,合理使用数据增强技术及小样本学习(Few-Shot Learning,FSL)、迁移学习等深度学习方法能在一定程度上缓解数据样本量不足的问题,使模型在非常有限的数据中寻求更好的泛化性能。
数据增强技术已被用于推广机器学习模型,传统方法普遍使用生成对抗网络(Generative Adversarial Network,GAN)。但基于GAN的方法存在许多问题:1)GAN生成数据是从数据分布的角度进行,生成的是一个和真实数据分布相似的数据分布,当真实数据较少时,该分布情况大概率也是不理想的;2)GAN网络需要足够的数据来支持网络训练收敛,在数据量较少的情况下,难以达到较好的平衡。近年来,基于度量的方法在图数据增强中得到了较好的应用,这类工作可以很好地解决传统数据增强方法的不足。例如:GAUG[41]基于给定的图拓扑结构训练边缘预测器,在给定的图结构中促进类内边和减少类间边,度量函数可以通过下游任务的训练进行迭代更新;AdaEdge[42]根据GNN的分类结果迭代地向图形拓扑添加或删除边,并在更新的图上训练GNN分类器,以克服过度平滑问题;IDGL[43]基于学习到的节点嵌入更新图形拓扑,以增强下游模型的鲁棒性。在未来可以通过创建新的邻接矩阵和属性矩阵对,并自适应地选择一些有效的邻接矩阵和属性矩阵作为GNN模型的新特征输入。
小样本学习可以使模型拥有从少量样本中学习的能力,小样本学习模型大致可以分为:基于模型、基于度量和基于优化3类。基于模型的方法旨在通过模型结构的设计快速在少量样本上更新参数,直接建立输入值和预测值的映射函数。基于度量的方法通过度量查询集中的样本和支持集中样本的距离,借助最近邻的思想完成分类,这种非参数化的方法可以克服小样本学习中分类器参数训练不够从而导致的过拟合问题。基于优化的方法认为普通的梯度下降方法难以在小样本场景下拟合,多种超参数的选取无法保证收敛的速度,而基于优化方法不局限于参数的规模和模型架构,可使模型的初始化参数在一步或几步迭代后最大化在新任务上的精度来实现小样本分类。受到计算机视觉领域的启发,文献[44]提出小样本学习来解码大脑活动,处理神经成像数据的问题,结果表明基于小样本学习的方法在解决神经成像的数据问题上是有前景的。值得一提的是,小样本学习在目前基于脑图的工作中仍然是被忽视的,因此,未来可考虑FSL在脑神经科学研究中的应用。
当数据量有限且先验知识充足时,迁移学习可以利用特定数据预训练一个模型用于一个完全不同的新数据。在迁移学习中,尽可能多的知识从旧模型转移到新模型。知识的类型取决于数据的类型和问题。使用迁移学习的主要优点是可以减少训练时间和所需的数据量,从而提高性能。虽然迁移学习可以有效弥补训练数据不足的缺点,但自然图像和医学图像在性质上仍然存在差异,如果假设源模型直接建立在相关疾病的大脑网络上(如阿尔兹海默症与ASD之间的迁移[31]),则考虑样本相关性的网络嵌入学习可以推广到不同任务之间,从而使迁移学习可以实现更强大的目标模型。文献[31, 45]实验结果表明大脑的动态功能特征在不同的大脑区域和认知区域之间是可以转移的,甚至在不同的扫描序列之间也是可以转移的,从而证明了迁移学习在神经成像中具有潜在的作用。
5.2 多模态数据集构建目前,无法获得MRI和其他模态大量的神经成像数据集是脑疾病预测任务面临的严峻挑战。临床研究表明,使用多模态技术可以有效提高脑疾病诊断的准确性[46]。在ABIDE数据集中,大量被试的扩散张量成像(DTI)并没有给出。因此,通过DTI数据结合GNN模型诊断ASD的研究是有限的。另一个挑战是,像弥散加权成像(Diffusion Weighted Image,DWI)和灌注加权成像(Perfusion Weighted Imaging,PWI)这样的神经成像方式尚未被提出。在基于群体级别脑疾病分类的研究中,基因信息可以用于人群图的构建,表示为被试之间的关系,邻接矩阵的准确性侧面反映了多模态信息结合的完整性,对于图神经网络模型的性能至关重要。未来多模态数据集构建以及合理融合可以促进GNN模型更好地进行ASD诊断研究。
5.3 异构网络建模目前,在基于图神经网络的疾病预测研究中,多数采用基于同构图的方法,当图中包含不同类型节点和连接时,需要整合由异构结构组成的多类型节点和边的信息,异构性和丰富的语义信息给图神经网络设计带来了巨大的挑战。传统基于GNN的脑网络模型通常假设脑网络是一个节点和边类型单一的同构图。然而,大量研究表明人类大脑的异质性,特别是存在于两个半球之间。同质脑网络不足以模拟复杂的脑状态,然而目前很少有研究尝试将异构GNN应用到脑网络分类任务上。异构图的构建通过不同类型的元路径将被试或者特征整合到一个异构的大脑网络中,每种元路径对应于感兴趣区域或者被试之间的特定关系,从而构造出一个包含多种不同类型边的异构图,最终利用GNN模型得到最后的嵌入来预测被试的类别标签,未来将对异构图神经网络在疾病预测上的应用做进一步研究。
5.4 图Transformer网络架构应用Transformer技术是近几年应用于计算机视觉中较为热门的技术,使用全Attention的结构代替了LSTM,抛弃了之前传统的encoder-decoder模型必须结合CNN或者RNN的固有模式。在减少计算量和提高并行效率的同时还取得了更好的结果。自Transformer模型提出以来,众多衍生模型也相继在各领域占据一定的位置,文献[47]将graph与Transformer相结合,不仅可以产生新的网络结构(新的元路径),学习得到的元路径(meta-path)也具有一定的可解释性,并且可以端到端自动学习网络的表示。文献[48]提到,GTN层从候选邻接矩阵A中通过卷积得到邻接矩阵A1和A2,该过程可以看作是将注意力机制应用到原始邻接矩阵上,分配不同的注意力系数,最终通过加权求和得到一个新的邻接矩阵。在未来的研究中可将该类模型用于脑疾病的诊断。
5.5 模型可解释性加强对比人群图与个体图的研究结果可以看出,尽管基于群体图的模型取得了不错的效果,但它们存在一个共同的局限性是难以用神经科学的方式解释分类结果,这将限制其在实际临床中的使用,尽管有一些方法可以将GNN模型可视化,但仍需进一步深入研究。现有主流模型对于可解释性的研究通常采用文献[49]中提出的由特定脑功能单元定义的网络和ROIs关联可以通过专门设计的生物标志物检测池化和相应的正则化参数来指导模型的节点聚集过程,以提高模型学习性能和驱动更多可解释的生物标志物。文献[7]提出一个基于GAT的架构来预测识别疾病的最具鉴别力的ROI、池化层和正则化损失项,以缓和由网络生成的节点池化分布。在文献[40]中,一些先验的神经科学知识被整合到图模型训练中,以改进图分类以及模型的可解释性。此外,在目前研究中未充分探讨已确认的部分脑功能障碍(例如ADHD)对于致病病因学的贡献,无法发掘疾病与脑区之间的潜在联系。为了解这种联系,需要启动一个更大的与任务相关的神经成像分析[50]。未来将对在脑图分类任务中基于GNN模型的可解释学习进行更深入的研究。
6 结束语由于脑部疾病的复杂性,临床依靠神经成像数据结合深度学习方法来辅助脑部疾病诊断存在很多不足,而近年来图神经网络在脑部疾病诊断上的应用正逐渐克服这些问题。本文介绍了图神经网络的定义,系统回顾了图神经网络在自闭症脑部疾病神经成像诊断中的应用,并对最新研究进行全面分析总结,按照脑网络建模方法归纳为基于人群图和基于个体图两种,得出图神经网络为脑部疾病的诊断和预测提供了新的手段并大幅提高了诊断精度的结论,最后提出目前基于图神经网络进行自闭症疾病预测仍存在小样本数据增强、多模态数据集构建、异构网络建模、模型可解释性加强等挑战。图神经网络在基于神经成像的自闭症诊断中的应用仍需研究人员进行更加系统深入的探索,以推动图神经网络模型从基础研究到实际应用的转化。
[1] |
KIPF T N, WELLING M. Semi-supervised classification with graph convolutional networks[EB/OL]. [2022-02-08]. https://arxiv.org/abs/1609.02907.
|
[2] |
VELIČKOVIĆ P, CUCURULL G, CASANOVA A, et al. Graph attention networks[EB/OL]. [2022-02-08]. https://zhuanlan.zhihu.com/p/345328639.
|
[3] |
XU K, LI C T, TIAN Y L, et al. Representation learning on graphs with jumping knowledge networks[EB/OL]. [2022-02-08]. https://arxiv.org/abs/1806.03536v2.
|
[4] |
CHO K, VAN MERRIENBOER B, GULCEHRE C, et al. Learning phrase representations using RNN encoder-decoder for statistical machine translation[C]//Proceedings of 2014 Conference on Empirical Methods in Natural Language Processing(EMNLP). Stroudsburg, USA: Association for Computational Linguistics, 2014: 1-10.
|
[5] |
SHI X J, CHEN Z R, WANG H, et al. Convolutional LSTM network: a machine learning approach for precipitation nowcasting[EB/OL]. [2022-02-08]. https://arxiv.org/abs/1506.04214.
|
[6] |
LI Y J, TARLOW D, BROCKSCHMIDT M, et al. Gated graph sequence neural networks[EB/OL]. [2022-02-08]. https://arxiv.org/abs/1511.05493.
|
[7] |
LI X X, ZHOU Y, DVORNEK N C, et al. Pooling regularized graph neural network for fMRI biomarker analysis[M]. Berlin, Germany: Springer, 2020.
|
[8] |
WANG M L, HUANG J S, LIU M X, et al. Modeling dynamic characteristics of brain functional connectivity networks using resting-state functional MRI[J]. Medical Image Analysis, 2021, 71: 102063. DOI:10.1016/j.media.2021.102063 |
[9] |
ORRÙ G, PETTERSSON-YEO W, MARQUAND A F, et al. Using support vector machine to identify imaging biomarkers of neurological and psychiatric disease: a critical review[J]. Neuroscience & Biobehavioral Reviews, 2012, 36(4): 1140-1152. |
[10] |
MURDAUGH D L, SHINKAREVA S V, DESHPANDE H R, et al. Differential deactivation during mentalizing and classification of autism based on default mode network connectivity[J]. PLoS One, 2012, 7(11): 1-11. |
[11] |
ABRAHAM A, MILHAM M P, DI MARTINO A, et al. Deriving reproducible biomarkers from multi-site resting-state data: an autism-based example[J]. NeuroImage, 2017, 147: 736-745. DOI:10.1016/j.neuroimage.2016.10.045 |
[12] |
KHOSLA M, JAMISON K, KUCEYESKI A, et al. 3D convolutional neural networks for classification of functional connectomes[M]. Berlin, Germany: Springer, 2018.
|
[13] |
DVORNEK N C, VENTOLA P, PELPHREY K A, et al. Identifying autism from resting-state fMRI using long short-term memory networks[M]. Berlin, Germany: Springer, 2017.
|
[14] |
DI MARTINO A, YAN C G, LI Q, et al. The autism brain imaging data exchange: towards a large-scale evaluation of the intrinsic brain architecture in autism[J]. Molecular Psychiatry, 2014, 19(6): 659-667. DOI:10.1038/mp.2013.78 |
[15] |
CAMERON C, YASSINE B, CARLTON C, et al. The neuro bureau preprocessing initiative: open sharing of preprocessed neuroimaging data and derivatives[J]. Frontiers in Neuroinformatics, 2013, 7: 41. |
[16] |
CAMERON C, SHARAD S, BRIAN C, et al. Towards automated analysis of connectomes: the Configurable Pipeline for the Analysis of Connectomes(C-PAC)[J]. Frontiers in Neuroinformatics, 2013, 7: 42. |
[17] |
PARISOT S, KTENA S I, FERRANTE E, et al. Spectral graph convolutions for population-based disease prediction[C]//Proceedings of International Conference on Medical Image Computing and Computer-Assisted Intervention. Berlin, Germany: Springer, 2017: 177-185.
|
[18] |
PARISOT S, KTENA S I, FERRANTE E, et al. Disease prediction using graph convolutional networks: application to autism spectrum disorder and Alzheimer's disease[J]. Medical Image Analysis, 2018, 48: 117-130. DOI:10.1016/j.media.2018.06.001 |
[19] |
KAZI A, SHEKARFOROUSH S, ARVIND KRISHNA S, et al. InceptionGCN: receptive field aware graph convolutional network for disease prediction[M]. Berlin, Germany: Springer, 2019.
|
[20] |
CHEN L, HUANG Y M, LIAO B, et al. Graph learning approaches for graph with noise: application to disease prediction in population graph[C]//Proceedings of IEEE International Conference on Bioinformatics and Biomedicine. Washington D. C., USA: IEEE Press, 2020: 2724-2729.
|
[21] |
RAKHIMBERDINA Z, MURATA T. Linear graph convolutional model for diagnosing brain disorders[C]//Proceedings of International Conference on Complex Networks and Their Applications. Berlin, Germany: Springer, 2019: 815-826.
|
[22] |
ANIRUDH R, THIAGARAJAN J J. Bootstrapping graph convolutional neural networks for autism spectrum disorder classification[C]//Proceedings of 2019 IEEE International Conference on Acoustics, Speech and Signal Processing. Washington D. C., USA: IEEE Press, 2019: 3197-3201.
|
[23] |
RAKHIMBERDINA Z, LIU X, MURATA T. Population graph-based multi-model ensemble method for diagnosing autism spectrum disorder[J]. Sensors, 2020, 20(21): 6001. DOI:10.3390/s20216001 |
[24] |
HUANG Y X, CHUNG A C S. Edge-variational graph convolutional networks for uncertainty-aware disease prediction[C]//Proceedings of International Conference on Medical Image Computing and Computer-Assisted Intervention. Berlin, Germany: Springer, 2020: 562-572.
|
[25] |
CHEN H, ZHUANG F Z, XIAO L, et al. AMA-GCN: adaptive multi-layer aggregation graph convolutional network for disease prediction[C]//Proceedings of the 30th International Joint Conference on Artificial Intelligence. Montreal, Canada: International Joint Conferences on Artificial Intelligence Organization, 2021: 1-20.
|
[26] |
ZHENG S, ZHU Z, LIU Z, et al. Multi-modal graph learning for disease prediction[EB/OL]. [2022-02-08]. https://arxiv.org/abs/2203.05880.
|
[27] |
JIANG H, CAO P, XU M Y, et al. Hi-GCN: a hierarchical graph convolution network for graph embedding learning of brain network and brain disorders prediction[J]. Computers in Biology and Medicine, 2020, 127: 104096. DOI:10.1016/j.compbiomed.2020.104096 |
[28] |
PAN L, LIU J, SHI M, et al. Identifying autism spectrum disorder based on individual-aware down-sampling and multi-modal learning[EB/OL]. [2022-02-08]. https://arxiv.org/abs/2109.09129v3.
|
[29] |
CAO M L, YANG M, QIN C, et al. Using DeepGCN to identify the autism spectrum disorder from multi-site resting-state data[J]. Biomedical Signal Processing and Control, 2021, 70: 103015. DOI:10.1016/j.bspc.2021.103015 |
[30] |
ZHOU H Y, ZHANG D Q. Graph-in-graph convolutional networks for brain disease diagnosis[C]//Proceedings of IEEE International Conference on Image Processing. Washington D. C., USA: IEEE Press, 2021: 111-115.
|
[31] |
LI L, JIANG H, WEN G, et al. TE-HI-GCN: an ensemble of transfer hierarchical graph convolutional networks for disorder diagnosis[J]. Neuroinformatics, 2021, 7: 1-23. |
[32] |
ARYA D, OLIJ R, GUPTA D K, et al. Fusing structural and functional MRIs using graph convolutional networks for autism classification[C]//Proceedings of the 2nd International Conference on Embedded & Distributed Systems. Washington D. C., USA: IEEE Press, 2020: 44-61.
|
[33] |
FELOUAT H, OUKID-KHOUAS S. Graph convolutional networks and functional connectivity for identification of autism spectrum disorder[C]//Proceedings of the 2nd International Conference on Embedded & Distributed Systems(EDiS). Washington D. C., USA: IEEE Press, 2020: 27-32.
|
[34] |
KTENA S I, PARISOT S, FERRANTE E, et al. Distance metric learning using graph convolutional networks: application to functional brain networks[C]//Proceedings of International Conference on Medical Image Computing and Computer-Assisted Intervention. Berlin, Germany: Springer, 2017: 469-477.
|
[35] |
KTENA S I, PARISOT S, FERRANTE E, et al. Metric learning with spectral graph convolutions on brain connectivity networks[J]. NeuroImage, 2018, 169: 431-442. DOI:10.1016/j.neuroimage.2017.12.052 |
[36] |
LOSTAR M, REKIK I. Deep hypergraph U-Net for brain graph embedding and classification[EB/OL]. [2022-02-08]. https://arxiv.org/abs/2008.13118.
|
[37] |
WANG L B, LI K M, HU X P. Graph convolutional network for fMRI analysis based on connectivity neighborhood[J]. Network Neuroscience, 2021, 5(1): 83-95. DOI:10.1162/netn_a_00171 |
[38] |
YAO D R, LIU M X, WANG M L, et al. Triplet graph convolutional network for multi-scale analysis of functional connectivity using functional MRI[C]//Proceedings of International Workshop on Graph Learning in Medical Imaging. Berlin, Germany: Springer, 2019: 70-78.
|
[39] |
YANG C D, WANG P Y, TAN J, et al. autism spectrum disorder diagnosis using graph attention network based on spatial-constrained sparse functional brain networks[J]. Computers in Biology and Medicine, 2021, 139: 104963. DOI:10.1016/j.compbiomed.2021.104963 |
[40] |
LI X X, ZHOU Y, DVORNEK N, et al. BrainGNN: interpretable brain graph neural network for fMRI analysis[J]. Medical Image Analysis, 2021, 74: 102233. DOI:10.1016/j.media.2021.102233 |
[41] |
ZHAO T, LIU Y, NEVES L, et al. Data augmentation for graph neural networks[EB/OL]. [2022-02-08]. https://arxiv.org/abs/2006.06830v1.
|
[42] |
CHEN D L, LIN Y K, LI W, et al. Measuring and relieving the over-smoothing problem for graph neural networks from the topological view[C]//Proceedings of AAAI Conference on Artificial Intelligence. Palo Alto, USA: AAAI Press, 2020: 3438-3445.
|
[43] |
CHEN Y, WU L F, ZAKI M J. Iterative deep graph learning for graph neural networks: better and robust node embeddings[C]//Proceedings of the 34th Conference on Neural Information Processing Systems. Washington D. C., USA: IEEE Press, 2020: 19314-19326.
|
[44] |
BONTONOU M, FARRUGIA N, GRIPON V. Few-shot learning for decoding brain signals[EB/OL]. [2022-02-08]. https://arxiv.org/abs/2010.12500.
|
[45] |
ZHANG Y, BELLEC P. Transferability of brain decoding using graph convolutional networks[EB/OL]. [2022-02-08]. https://www.researchgate.net/publication/342368022_Transferability_of_Brain_decoding_using_Graph_Convolutional_Networks.
|
[46] |
LIBERO L E, DERAMUS T P, LAHTI A C, et al. Multimodal neuroimaging based classification of autism spectrum disorder using anatomical, neurochemical, and white matter correlates[J]. Cortex, 2015, 66: 46-59. DOI:10.1016/j.cortex.2015.02.008 |
[47] |
YUN S, JEONG M, KIM R, et al. Graph transformer networks[EB/OL]. [2022-02-08]. https://arxiv.org/abs/1911.06455.
|
[48] |
QIU Y L, YU S Z, ZHOU Y H, et al. Multi-channel sparse graph transformer network for early Alzheimer's disease identification[C]//Proceedings of the 18th International Symposium on Biomedical Imaging. Washington D. C., USA: IEEE Press, 2021: 1794-1797.
|
[49] |
SCHAEFER A, KONG R, GORDON E M, et al. Local-global parcellation of the human cerebral cortex from intrinsic functional connectivity MRI[J]. Cerebral Cortex, 2017, 28(9): 3095-3114. |
[50] |
ZHAO K, DUKA B, XIE H, et al. A dynamic graph convolutional neural network framework reveals new insights into connectome dysfunctions in ADHD[J]. NeuroImage, 2021, 246: 118774. |