空间方向关系作为空间关系不可缺少的组成部分,广泛应用于城市智能交通管控、环境资源检测、防灾减灾等诸多任务,日益成为地理信息系统、空间数据库、人工智能、模式识别等领域研究的热点。综合分析和梳理现有空间方向关系表达与推理模型,针对二维空间对象,从单目标对象、群组目标对象等方面详细介绍目前二维空间方向关系表达与推理模型的研究进展,依据描述对象的不同进行分类,对每类模型的特性及适用范围进行定性分析比较。针对三维空间对象,从点到区域依次分析当前三维空间方向关系表达与推理模型的特点、优势和不足。针对不确定性对象,从确定性空间方向关系模型的扩展模型、基于不确定性集合理论模型2个方面阐述不确定性方向关系模型的研究现状,并对每类模型的优缺点、适用范围等进行分析总结。最后阐明当前工作存在的不足,并从自动推理技术、空间关系的联合表达以及群组目标对象等方面对空间方向关系的未来研究方向进行展望。
文本对抗防御旨在增强神经网络模型对不同对抗攻击的抵御能力, 目前的文本对抗防御方法通常只能对某种特定对抗攻击有效,对于原理不同的对抗攻击效果甚微。为解决文本对抗防御方法的不足,提出一种文本对抗分布训练(TADT)方法,将TADT形式化为一个极小极大优化问题,其中内部最大化的目标是了解每个输入示例的对抗分布,外部最小化的目标是通过最小化预期损失来减小对抗示例的数量,并对基于梯度下降和同义词替换的攻击方法进行研究。在2个文本分类数据集上的实验结果表明,相比于DNE方法,在PWWS、GA、UAT等3种不同的对抗攻击下,TADT方法的准确率平均提升2%,相比于其他方法提升了10%以上,且在不影响干净样本准确率的前提下显著提升了模型的鲁棒性,并在各种对抗攻击下具有较高的准确率,展示了良好的泛化性能。
事件抽取旨在将非结构化自然语言文本中的事件信息以结构化形式进行识别提取。传统事件抽取方法抽取范围局限于单个句子,且依赖较大规模的标注数据,在篇章级抽取任务与低资源目标领域中表现不佳。现有研究利用提示学习方法,以模板槽位填空方式实现篇章级事件抽取,其缺点在于传统提示模板槽位对论元角色分类准确度不高,容易造成论元角色抽取错误。针对上述问题,提出一种基于槽位语义增强提示学习的篇章级事件抽取方法,在提示学习方法的基础上,将传统事件抽取范式中的论元角色语义信息融入提示模板槽位中,为模型的槽位预测生成环节提供论元类型约束,提高篇章级事件抽取的准确率。通过使预训练语言模型上下游任务保持一致,提高模型的泛化能力,同时以较低成本实现知识迁移,在低资源事件抽取场景下提升模型性能。实验结果表明,相较于表现次优的传统基线方法,在包含59种论元类型的英文事件抽取数据集、包含92种论元类型的中文数据集以及低资源数据规模下,该方法的F1值分别取得了2.6、2.9和4.0个百分点的提升。
向量化查询等技术的成熟为基于数据仓库(数仓)实现图查询提供了契机,但现有系统没有考虑列式存储特点和图查询语句的特点,无法高效存储图数据及支持图查询优化。同时,由于需要保持原有图查询应用的兼容性,图查询Gremlin语言翻译生成的数仓SQL语言书写复杂且性能较差。针对上述问题,提出基于数仓的图数据库系统PandaGraph。在存储方面,PandaGraph基于关系模型高效存储图数据,结合数仓列式存储的特性进行主键和属性键设计,同时考虑到图查询和数仓查询执行特点,构建出入两张边表供图查询进行选择。在查询方面,PandaGraph结合不同Gremlin步骤的特点,构建关于遍历和存储表的查询结构,实现从Gremlin语言到SQL语言的翻译转化,使用多种优化规则对生成SQL语句进行改写,提高图查询性能。实验结果表明,PandaGraph在多场景下可正确进行翻译查询工作,并且在经典的低k跳查询场景下较现有专有图数据库系统获得5.8倍性能提升,在高k跳场景下可获得18.5倍性能提升,在基于规则的优化、基于表选择的优化和基于表结构的优化下PandaGraph可获得最少1.3、1.1和1.3倍的性能提升。
在地面公交运输中,站点客流量数据是公交线网规划最重要的基础数据之一。站点周边兴趣点(POI)的类型、数量以及距离会导致站点客流量出现不同的趋势。神经网络是研究客流预测的常用方案,然而由于POI对客流的影响存在相互独立性,这一重要特征并未在传统全连接神经网络的结构中得以体现,易使预测效果不尽人意。基于POI与客流量关系的特殊性,改进全连接神经网络的基本结构,构建一种特定的非全连接神经网络,利用所有公交站点客流量的历史数据及各类POI分布,实现对站点各时间段的客流量的模拟及预测。模型设定一种连接矩阵实现特定的连接方式,并根据客流量的性质额外赋予部分隐藏层实际意义,构造组合误差传递函数,增强神经网络的可解释性。该模型可以快速收敛至全局最优解,改进传统全连接神经网络的收敛速度慢、拟合效果差、易陷入局部最优解等问题。实验结果表明,该模型单位时间内的客流量预测偏差在50人以内的概率达到88%以上,对比其他常见预测模型均有优质表现,并且能准确模拟每日客流的变化趋势。
现实世界中的知识图谱由大量事实三元组构成,其中通常包含许多出现次数很少的小样本关系,面向这些小样本关系补全知识图谱中缺失的三元组是一项具有挑战性的工作。针对现有小样本知识图谱补全模型中普遍存在的小样本关系表示无法有效提取问题,提出一种基于关系学习网络的小样本知识图谱补全模型。考虑关系的相关性,对参考和查询三元组进行邻域聚合编码,获得增强的实体嵌入表示。基于融合Transformer编码器与长短期记忆神经网络的结构,将三元组的关系表示进行编码输出。利用注意力机制得出查询关系与动态参考关系的语义相似性,并结合平移模型的假设对查询三元组成立的可能性进行综合打分。实验结果表明,该模型通过融合路径发现与上下文语义有效提取了小样本关系的细粒度语义,在小样本链接预测任务中,相较于基线模型中评价指标的最优值平均提升了9.5个百分点。
基于会话的推荐系统旨在根据匿名用户短时间内的历史行为序列预测下一个可能的项目,会话中的项目来自用户的反馈数据。然而,在海量的候选项目集中,用户倾向于反馈其中的小部分项目,除了少部分热门项目外,大量长尾项目的反馈数据非常稀疏。现有的会话推荐方法大多集中在对会话的序列模式以及项目之间的复杂关联关系进行建模,忽略了会话推荐中的长尾分布现象。针对这一问题,提出一种基于多任务自监督学习的会话推荐模型。在原始推荐任务基础上,使用基于项目频率的逆采样器建立自监督学习任务,以增强对长尾项目嵌入的学习,同时缓解数据稀疏性。此外,构建一个多密度会话图,并通过统一的图神经网络以可解释的方式学习会话的嵌入,以更准确地捕捉用户意图。为了避免过拟合,采用带有标签平滑正则化的交叉熵作为目标函数。实验结果表明,与GCE-GNN、COTREC、MSGIFSR等先进的基线方法相比,该方法在Diginetica、Tmall、Gowalla和Last.FM这4个真实数据集上的命中率与宏命中率显著提升,其中,在top-20推荐结果上,命中率分别提升了1.37%、5.88%、0.30%和2.16%,宏命中率分别提升了2.49%、12.86%、1.97%和10.19%。
时间序列在军事战术对抗等领域应用广泛,通过战场观测到的时间序列态势信息预测对抗目标的趋势是制定决策方案的重要前提。以潜艇防御声自导鱼雷攻击为背景,针对环境不明、目标不明、解算要素不明等导致水下态势获取困难的问题,提出一种基于循环神经网络的交替不完全时间序列预测方法。融合单变量自回归横向趋势与外部趋势,对观测变量进行趋势预测。针对多变量间存在非线性复杂关系的特点,将纵向多变量间关系特征提取与横向趋势预测相结合,采用插补数据集训练与趋势输出预测的方式实现纵向预测。最后,使用加权分配器对横向趋势预测和纵向预测结果进行融合,提高模型对不完全时序态势的学习能力,实现对未来态势的预测。实验结果表明,在不完全信息条件下,所提方法在缺失30%和60%数据、3种不同预测时间窗口长度条件下,在仿真数据集和电力公测数据集上的平均均方误差、平均绝对误差均达到了最优或次优结果,能够实现态势评估,为充分利用并融合多特征态势数据进行决策提供科学有效的参考。
缺失数据插补是从不完整数据集中进行数据挖掘的重要步骤,现有插补算法无法有效利用高缺失率的样本,存在等效处理缺失率不同的样本、假设缺失数据与完整数据同分布问题。构建基于多模型融合的不完整数据分数插补算法FIB。根据噪声标签学习,提出新的样本评分方式,以输出样本分数,通过建立机器学习模型将该分数作为分数样本权重,减小不可靠样本对模型性能的影响,并借鉴伪标签技术,使用高缺失率样本生成伪标签数据。将伪标签数据扩充至插补结果,形成待合并的单元插补结果,利用多个插补算法将单元插补结果融合生成最终插补结果。在12个公开UCI数据集上的实验结果表明,相比传统插补算法,使用样本评分、生成伪标签数据及多模型融合这3种新技术使插补效果分别平均相对提升2.35%、5.89%及7.78%,相比DIM,FIB的平均准确率相对提升8.39%。此外,随着模型个数的增加, 插补效果也会相应增加,对于分类任务,5个模型融合的插补效果比2个模型的准确率平均相对提升11%,对于回归任务,R2得分平均相对提升15%。
现有领域知识图谱推理模型多数是由基于百科类通用知识图谱的推理模型迁移而来,但是领域知识图谱的异构性并未得到妥善处理。同时,现有研究将关系预测与三元组分类视作2个独立的任务而忽视了两者之间的关联,且领域知识在领域模型的建立过程中也未得到充分的利用。针对上述问题,建立基于翻译距离的改进推理模型TransSep,为异构的实体类型分配不同的特征空间。提出一种联合训练的策略,使得关系预测与三元组分类2个任务互相指导对方的负采样过程,并交替地学习实体的嵌入特征,从而提升2个任务的训练效果。以医疗领域知识图谱为例,将领域知识通过元路径的思想引入TransSep模型中,增强模型的表达能力。在由复旦大学构建的精准医学知识图谱上进行实验,结果表明,相比TransE、DistMult、TriModel等模型,TransSep模型在关系预测任务中MR分数至少提高17.4%,三元组分类任务中的F1值提高至0.928 6。
多元时间序列的各子序列包含不同时间跨度的多尺度特征,现有时间序列预测模型不能有效地捕获多尺度特征以及评估其重要程度。提出一种基于多尺度时序特征融合与双注意力机制的多元时间序列预测网络FFANet,有效融合多尺度特征并关注其中重要部分。通过多尺度时序特征融合模块中并行的时序膨胀卷积层,使模型具有多种感受域,从而提取时序数据在不同尺度上的特征,并根据重要性对其进行自适应融合。利用双注意力模块对融合的时序特征进行重新标定,通过分配时序和通道注意力权重并加权至对应的时序特征,使FFANet聚焦对预测有重要贡献的特征。实验结果表明,相比AR、VARMLP、RNN-GRU、LSTNet-skip、TPA-LSTM、MTGNN和AttnAR时间序列预测模型,FFANet在Traffic、Solar Energy和Electricity数据集上的RRSE预测误差分别平均降低0.152 3、0.120 0、0.074 3、0.035 4、0.021 5、0.012 1、0.020 0。
密码算法识别是开展密码设备监管、密码分析等工作的前提,在对现有密码算法识别方案进行总结和分析的基础上,利用K近邻(KNN)算法和随机性检测工具分析SM4分组密码算法不同工作模式下密文识别准确率低的原因。针对现有方案在SM4算法多种工作模式密文混合场景下识别准确率低的现状,证明深度学习应用于SM4分组密码算法工作模式识别问题的可行性,提出一种基于Transformer的SM4算法工作模式密文识别方案。在ECB、CBC、CFB、OFB、CTR工作模式下对文件进行批量加密,密文文件经过数据预处理形成密文数据集,然后输入Transformer模型进行五分类识别。实验结果表明,SM4算法5种工作模式在密文混合场景下识别准确率达到94.94%,证明所提方案可有效提升SM4分组密码算法5种工作模式在密文混合场景下的识别准确率。将密文数据集输入卷积神经网络、循环神经网络、ResNet进行对比实验,结果表明,相较于这3种传统神经网络,基于自注意力机制的Transformer模型识别准确率分别提升18.38、26.96、10.44个百分点。
国密SM9算法是基于双线性对的标识密码算法,其运行过程需进行多次十二次扩域的高次幂运算,其计算性能对SM9算法体制的应用至关重要。SM9签名运算中的高次幂可以预存点,在运算过程中通过查表减少运算时间。由于验签运算中高次幂的底数不确定,无法通过查表进行运算,因此分别使用Comb固定基和NAF算法在算法模型上降低高次幂中十二次扩域乘法运算量。为提高十二次扩域乘法的计算效率,根据R-ate对的特殊性质提出基于分圆子群的快速平方算法,降低扩域乘法所需的基域运算开销,并将其应用于高次幂的运算中。硬件架构创新性地采用基于自定义RISC指令集的ASIP微码控制方式实现,该架构的灵活性有利于在有限的硬件资源下实现复杂的SM9算法逻辑,其中可修改的指令集可以更好地与底层硬件适配。在Xilinx Artix-7系列的FPGA平台上的实验结果表明,在167 MHz的时钟频率条件下,不增加额外的硬件资源开销,该方法完成一次SM9签名的时间仅为0.244 ms。
在目前Android恶意应用检测技术研究中,单维度应用特征检测技术容易被黑客针对该特征的缺点设计恶意代码,而多维度应用特征检测技术存在对新样本检测准确率低的问题。同时,基于用户交互信息的应用行为特征划分方法被广泛运用在多维度应用特征检测技术上,显著提升对新恶意样本的检测准确率。但是,已有的研究工作都是通过在UI控件上的文本信息识别用户有意识行为与应用隐匿行为,而该方法在面对简短文本信息时存在识别困难的问题。为此,设计一种基于用户交互信息的应用行为划分算法。通过捕获应用中发生的用户与应用交互行为,获取交互行为发生的时间信息并进行应用行为划分,得到用户有意识行为特征集与应用隐匿行为特征集。设计并构建一种双通道应用分类模型2ch-LSTM-TCN,同时对用户有意识行为特征集和应用隐匿行为特征集进行学习,并对两者的计算输出统合后进行分类判别。实验结果表明,该算法的准确率和召回率分别达到94.8%和93.3%,能够有效区分Android良性应用和恶意应用,实现一个Android恶意应用自动化检测原型系统。
区块链是一种去中心化的计算范式,在诸多领域具有良好的应用前景。智能合约是区块链应用的关键,然而,智能合约的安全问题时有发生,有些甚至造成重大的经济损失。为了避免智能合约在设计开发阶段出现由逻辑不严谨或错误逻辑所造成的安全漏洞,提出一种基于时间自动机模型的安全智能合约生成方法。相较于直接编写合约代码,该方法通过将证明为正确的模型转换为可执行的智能合约代码,有效解决在智能合约开发设计阶段所存在的安全性问题。利用UPPAAL工具将人类可理解的文本合约建模为时间自动机并通过模型验证来确保模型的安全性和可靠性。通过对智能合约的正式定义建立时间自动机与智能合约的映射规则,根据相应的映射规则,时间自动机被转换为模块化的Solidity智能合约代码。设计一个具体的商品预售活动案例进行分析,结果表明,通过所提方法生成的商品预售合约的Solidity代码可成功编译并部署在以太坊测试网络中。
在深度模型差分隐私保护中,过大的梯度扰动噪声会造成数据可用性下降。提出一种基于粒子群优化算法的深度学习模型,根据粒子群优化策略,将粒子的位置映射到网络参数,寻找个体历史最优位置和全局历史最优位置。对全局最优粒子位置所得梯度进行扰动重新参与模型训练,在不改变参数和梯度结构的前提下利用网络传播属性对噪声参数进行优化,运用带扰动的位置参数获取目标函数,最小化经验风险函数,降低噪声对模型效用的损害。在联邦学习模式下,本地客户端利用粒子位置参数更新出本地环境中个体和全局历史最优位置,找到当前最优参数加以扰动,再上传至中心服务器。当每个客户端再次训练时,从服务器请求获取优化、扰动和聚合后的广播参数,参与合作学习。实验结果表明,该算法模型在保护隐私的同时能更好地保留模型可用性,相比DP-SGD算法,在Mnist、Fashion-Mnist和Cifar-10数据集上的准确率分别提高了5.03%、9.23%和22.77%,能够加快联邦学习中的模型收敛,在独立同分布和非独立同分布数据上都具有较好的表现。
社交网络、通信网络、生物蛋白等海量图数据应用广泛且包含大量个人隐私和商业敏感信息,通常需要对图数据加密并通过云计算提供安全高效的外包查询服务。然而,设计加密图数据上的高效精确最短距离外包计算方案既要保证隐私数据的高安全性,又要提高加密查询等计算的效率,具有一定挑战性。提出一种基于二跳覆盖标记和加法同态的图数据精确最短距离查询外包计算方案。使用广度优先搜索修剪策略对二跳覆盖标记生成的原始标记集合进行预处理,减少预处理的标记数量并提高查询效率。基于加法同态加密和伪随机函数对标记集合进行加密处理并构造安全索引结构,保护图数据的节点和距离信息,实现加密图数据的精确最短距离查询。实验结果表明,该方案能正确进行加密图数据上精确最短距离的外包计算,在半诚实假设下满足随机预言模型下的IND-CPA安全和(L1, L2)安全,能有效保护图结构数据在外包计算中的隐私信息,在图数据加密和最短距离查询阶段相较现有同类方案分别降低了13.04%~24.24%和36.44%~46.13%的时间开销。
在无线传感器网络(WSN)规模逐渐增大与传感器逐渐微型化的背景下,全局信息收集的持续性和实时性的要求与无线传感节点受限能力之间的矛盾日益严峻。传统方法使用压缩、融合、聚合等方式降低数据传输量,并通过优化路由增加网络能力,但越来越难以应对上述挑战。为此,考虑利用计算能力克服存储、传输瓶颈,通过本地化计算范式实现全局信息的感知,并基于超越数论和非定域感知方法,提出一种面向大规模分布式WSN的信息存算与通信一体化方法。通过对网络进行建模,将网络每时每刻产生的信息以去中心化本地计算的方式融合到常数量级的可计算编码中。该方法通过节点邻居之间周期性地交换搭载时空编码的Beacon消息。根据时空编码在相空间中构造具有确定性和因果性的相空间轨迹来存储和交换信息,避免直接存储和传输庞大的原始数据,从而降低计算、通信、存储等开销。实验结果表明,该方法能够实现O(1)的存储和通信开销,具有毫秒级的收敛速率,相较现有WSN存储方法,在通信开销方面具有明显优势。
基于指纹的定位方法是定位技术中的重点研究内容。现有指纹定位方法大多数是为接收端设备的自定位而设计的,无法直接应用到对信号发射端的定位中。为此,设计一种适用于信号发射端的辐射源指纹定位模型,并提出相应的定位算法。利用频谱地图进行指纹定位,基于信号指纹生成算法和指纹匹配定位算法实现指纹匹配定位。信号指纹生成算法将空间插值转化为机器学习多变量回归问题,基于测量点的数据建立数据集并训练随机森林回归模型,结合蛇优化算法改进模型的参数设置,利用改进的随机森林回归模型补全频谱地图中的缺失数据,进而得到信号指纹。指纹匹配定位算法通过深度学习框架完成,利用卷积神经网络从频谱地图中估计辐射源的位置坐标。仿真实验结果表明,该定位模型在使用10%的测量数据时,平均定位误差为12.91 m,且定位误差在20 m以内的置信概率达到了84.5%,能够实现对信号发射端的指纹定位,与其他方法相比, 具有较优的定位精度和定位稳定性。
无线传感器网络的虚拟骨干是承担网络路由任务的结点组成的子集。当一个异质无线传感器网络故障时,原有的虚拟骨干可能就会失去部分功能,然而现有的容错虚拟骨干只能容纳顶点故障,无法解决只有链路故障但没有顶点故障的问题,且虚拟骨干大小会随故障顶点数量的增加呈超线性增加。针对上述问题,研究在异质无线传感器网络链路发生故障时的虚拟骨干重构问题。对于一个只有链路故障的异质无线传感器网络,设计一个虚拟骨干重构近似算法(ZREA22),寻找一个未被控制的点组成的集合,在该集合导出的子图中构造一个极大独立集,并向该极大独立集和原连通控制集中添加结点以形成一个重构的连通控制集。实验结果表明,ZREA22算法能够产生一个大小有界的连通控制集,且虚拟骨干大小相比于WFSK09和SHLO14算法至少减少了9%和31%,同时算法运行时间更短。
基于深度强化学习(DRL)的智能路由算法因兼具深度学习的感知能力和强化学习的决策能力,成为路由决策的重要发展方向。然而,现有基于深度强化学习的智能路由算法无法适应无线网络中动态变化的网络拓扑结构,难以在网络拓扑动态变化时做出恰当的路由决策。针对该问题,提出一种结合消息传递神经网络(MPNN)和DRL的智能路由算法MPNN-DQN。利用MPNN对不规则的网络拓扑进行学习,使其在网络拓扑动态变化时仍然能够做出有效的决策。设计基于k阶邻居信息聚合的逐跳路由生成方法,使得模型在保证决策效果的同时提升算法的可扩展性,能够更广泛地适用于中大型网络拓扑。实验结果表明,相比GCN、DRSIR、DQN等路由算法,该算法具有较优的平均时延、丢包率和网络吞吐量指标,在Germany、GBN和synth50这3种不同的网络场景下,该算法的吞吐量提升3.27%~23.03%,具有较强适应动态网络拓扑的能力。
现有的交通环岛通行优化研究多以无损通信为背景,结合车辆速度等基础数据设计协同策略,忽略了影响交通策略的外界环境等数据,无法满足实际应用的需要。为解决实际通信受限问题,根据智能网联汽车的车-路-环境协同特点,提出一种结合用户画像,基于车辆状态预测的环岛车辆协同换道策略。设计基于时空特征的车辆预测方法AP-LSTM,捕捉车辆关键时空特征以实现小样本轨迹预测,有效提高小样本车辆轨迹预测的准确性和实时性。同时,设计基于预测机制的车辆协同算法PMC,弥补车辆协同决策在实时通信受限的条件下所缺失的车辆状态信息,通过历史数据对车辆未来状态进行预测,在此基础上,结合Stackelberg博弈对交通环岛路口处的车辆进行协同控制。在SUMO平台上的实验结果表明,相比长短时记忆算法,所提AP-LSTM预测方法的均方根误差较低,相比SUMO算法,所提PMC协同算法的加速度标准差降低51.7%,且平均速度提高3.0%,有效提高交通环岛的通行效率和驾驶平稳性。
传统深度学习的图像超分辨率重建网络仅在固定分辨率上提取特征,存在无法综合高级语义信息、只能以特定尺度因子重建图像、泛化能力较弱、网络参数量较大等问题。提出一种基于多分辨率特征融合的任意尺度图像超分辨率重建算法MFSR。在多分辨率特征融合编码阶段设计多分辨率特征提取模块以提取不同分辨率特征, 通过构建双重注意力模块增强网络特征提取能力,使不同分辨率特征之间进行充分交互, 以获取信息丰富的融合特征图。在图像重建阶段利用多层感知机对融合特征图进行解码,实现任意尺度的图像超分辨率重建。实验结果表明,在Set5数据集上分别以尺度因子2、3、4、6、8进行测试,所提算法的峰值信噪比分别为38.62、34.70、32.41、28.96、26.62 dB,模型参数量为0.72×106,在大幅减少参数量的同时能保持重建质量,可以实现任意尺度的图像超分辨率重建,性能优于SRCNN、VDSR、EDSR等主流算法。
卷积神经网络(CNN)单独应用于图像去模糊时感受野受限,Transformer能有效缓解这一问题但计算复杂度随输入图像空间分辨率的增加呈2次方增长。为此,提出一种基于Transformer和多尺度CNN的图像去模糊网络(T-MIMO-UNet)。利用多尺度CNN提取空间特征,并嵌入Transformer全局特性捕获远程像素信息。设计局部增强Transformer模块、局部多头自注意力计算网络和增强前馈网络,采用窗口的方式进行局部逐块多头自注意力计算,通过增加深度可分离卷积层,加强不同窗口之间的信息交互。在GoPro测试数据集上的实验结果表明,T-MIMO-UNet的峰值信噪比相比于MIMO-UNet、DeepDeblur、DeblurGAN、SRN网络分别提升了0.39 dB、2.89 dB、3.42 dB、1.86 dB,参数量相比于MPRNet减少了1/2,能有效解决动态场景下的图像模糊问题。
医学图像配准和分割是医学图像分析中的两项重要任务,将其相结合可以有效提升两者的精度,但现有的单模态图像联合配准分割框架难以适用于多模态图像。针对以上问题,提出基于模态一致性监督和多尺度邻域描述符的CT-MR图像联合配准分割框架,包含一个多模态图像配准网络和两个分割网络。联合配准分割框架利用多模态图像配准产生的形变场在两种模态的分割结果之间建立对应的形变关系,并设计模态一致性监督损失,通过两个分割网络互相监督的方式提升多模态分割的精度。在多模态图像配准网络中,构建多尺度模态独立邻域描述符以增强跨模态信息表征能力,并将该描述符作为结构性损失项加入配准网络,更加准确地约束多模态图像的局部结构对应关系。在118例肝脏CT-MR多模态图像数据集上的实验结果表明,在仅提供30%分割标签的情况下,该方法的肝脏配准Dice相似系数(DSC)达到94.66(±0.84)%,目标配准误差达到5.191(±1.342) mm,CT和MR图像的肝脏分割DSC达到94.68(±0.82)%和94.12(±1.06)%,优于对比的配准方法和分割方法。
在计算机视觉任务中,以卷积神经网络为基础的图像分类模型得到广泛应用,但因其自身的脆弱性容易受到对抗样本的攻击。目前的攻击方法大多会对整张图像进行攻击,产生的全局扰动影响了对抗样本的视觉质量。针对这一问题,提出一种基于显著区域优化的对抗样本攻击方法,利用显著目标检测技术为每张原始图像生成显著图,并将其二值化为显著掩模,将该掩模与对抗扰动相结合,使显著区域内的对抗扰动保留下来,实现对抗扰动的局部添加。通过引入Nadam优化算法, 稳定损失函数更新方向并动态调整学习率,提高损失函数收敛速度,从而在保持较高黑盒攻击成功率的同时,有效降低对抗扰动的可察觉性。在ImageNet数据集上分别进行单模型和集成模型环境下的对抗攻击实验,并对各方法生成的对抗样本图像质量进行对比分析,结果表明,与基准方法相比,该方法在集成模型攻击中的隐蔽性指标实现了27.2%的性能提升,黑盒攻击成功率最高达到了92.7%的水平。
受遥感图像背景复杂、分辨率高、有效信息量少等因素影响,现有目标检测算法在检测小目标过程中存在错检、漏检等问题。提出基于YOLOv5的遥感小目标检测算法YOLOv5-RS。为有效减少图像中复杂背景和负样本的干扰,构建并行混合注意力模块,采用卷积替换全连接层和移除池化层的操作来优化注意力模块生成权重特征图的过程。为获取和传递更丰富且更具判别性的小目标特征,调整下采样倍数并在模型训练过程中增加小目标信息丰富的浅层特征,同时设计卷积与多头自注意力相结合的特征提取模块,通过对局部和全局信息进行联合表征以突破普通卷积提取的局限性,从而获得更大的感受野。采用EIoU损失函数优化预测框与检测框的回归过程,增强小目标的定位能力。在遥感小目标数据集上进行实验以验证该算法的有效性。实验结果表明,与YOLOv5s相比,该算法在参数量减少20%的情况下平均检测精度提升1.5个百分点,其中,小车类目标的平均检测精度提升3.2个百分点;与EfficientDet、YOLOx、YOLOv7相比,该算法能有效兼顾检测精度和实时性。
针对目标空间复杂度高容易造成小尺度目标丢失和边界分割不连续等问题,借鉴DeepLabv3+网络结构,建立基于多级叠加和注意力机制的图像语义分割模型。在编码器阶段,采用不同尺度的平均池化操作构建多尺度平均池化模块,使用不同扩张率的空洞卷积组成多尺度叠加模块扩大卷积运算的感受野,增强对局部特征的获取能力,并利用由通道和空间组成的注意力机制模块抑制无意义的特征,增强有意义的特征,提高对小尺度目标及局部边界的分割精度。在解码器阶段,通过双线性插值法对特征图进行分辨率恢复,并结合通道维度信息进行像素填充补充特征信息,并使用Softmax激活函数进行语义分割的输出预测。实验结果表明,该模型在PASCAL VOC2012和SUIM公开数据集上的平均交并比分别达到85.6%和60.8%,在整体分割精度和小尺度图像的分割效果上明显优于多数图像语义分割模型。
在输电线路检测图像中受绝缘子方向不确定、背景复杂、遮挡物等因素影响,导致漏检和定位准确率降低。提出一种基于自适应关键点的破损旋转绝缘子检测方法。将Oriented RepPoints目标检测算法作为Baseline并加以改进。针对Oriented RepPoints算法的方向信息感知较弱以及特征表示能力差的问题,结合递归特征金字塔和坐标注意力机制,构建递归强化特征金字塔网络(Re-FPN)。其中,CA模块从2个方向聚合特征,捕获方向感知和位置敏感信息,提升模型的定位和识别能力,Re-FPN在经典特征金字塔网络基础上进行递归式特征提取,将输入图像特征进行反复提取,使得目标检测的错误回传信息能够更直接反馈以调整主干网络参数,从而提升提取特征对检测的适用性。在自建绝缘子图像数据集上进行训练和测试,实验结果表明,该方法的绝缘子检测准确率达到96.1%,相比Oriented RepPoints算法提升2.1个百分点,同时该算法性能表现优于现有主流目标检测算法,具有较高的工程应用价值。
针对低照度条件下重型卡车司机异常驾驶行为检测方法存在检测准确率低、检测速度慢等问题,结合图像自适应增强方法和轮廓定位检测思想,提出一种基于自适应伽马校正的异常驾驶行为检测方法。对传入视频图像进行自适应伽马校正,通过抑制噪声、改善暗部和提升信息熵来提高识别准确率。基于图像灰度值和信息熵对双阈值伽马函数进行自适应调节,从而获得更丰富的边缘信息和色彩信息。利用K-近邻背景建模法将驾驶员前景图像分离以确定检测区域,通过边缘检测进行驾驶员头部和手部轮廓识别,获得关键定位点间的欧氏距离,并进行异常驾驶行为判断。在此基础上,结合异常行为次数和时间阈值,解决环境干扰和图像噪声的问题。实验结果表明,与单尺度Retinex、多尺度Retinex以及自适应直方图均衡方法相比,所提方法在提高检测准确率的同时有效提高了检测速度,能在不同环境下有效检测异常驾驶行为。
高分六号多光谱图像的空间冗余和谱间冗余较高,为了降低高分六号多光谱图像所占用的存储空间,提高国产高分多光谱图像的压缩效率,提出一种基于卷积神经网络的端到端多光谱图像压缩模型SMIC。SMIC模型由自编码器、量化结构、熵编码3个部分组成。自编码器通过卷积下采样提取图像的特征,降低数据的空间维度。量化结构采用多进制量化将特征矩阵离散化,减少图像压缩过程中的信息损失。熵编码采用高斯混合模型进行编码,降低码流,减少图像所占用的存储空间。实验结果表明:在相同码率下SMIC模型的高分六号多光谱图像压缩效果明显优于传统图像压缩算法JPEG,重建图像的质量明显提高,图像的峰值信噪比较JPEG高约2 dB,且SMIC重建图像的误差值主要集中在[-100, 100]范围内,区间占比达到80%以上;SMIC模型重建图像的NDVI与原始图像NDVI的决定系数
针对目前肺音识别中因肺音数据集规模较小所致模型过拟合分类精度低的问题,提出一种基于双源域迁移学习的肺音识别方法。一方面,将音频数据集Audio Set上的预训练模型VGGish网络迁移至肺音识别中,融合高效通道注意力ECA-Net以增强识别能力,然后提取肺音的对数梅尔频率谱特征,使用VGGish网络按照时序学习谱图中的信息,并对VGGish网络输出的特征向量经不同大小和扩张率的一维卷积核进行特征增强,将增强后的特征图输入双向门控循环单元以捕获肺音的时序信息;另一方面,将图像数据集ImageNet上的预训练模型VGG19迁移至肺音识别中,将肺音波形数据转换为谱图的形式输入并训练。将两方面的模型训练后作为特征提取器,融合具有高层语义的特征向量融合并输入集成学习算法CatBoost,实现最终的分类。实验结果表明,该方法对Coswara新冠数据集中肺音识别的特异性、敏感性指标和准确率分别达到80.66%、77.69%和79.18%,对ICBHI-2017数据集中肺音识别的特异性、敏感性指标和ICHBI-score分别达到88.75%、72.04%和80.39%,均优于对比的常见识别方法。
兵棋推演是培养现代军事指挥员的重要方法,将人工智能技术引入到兵棋推演中可简化组织流程,提升推演效益。基于机器学习的智能兵棋常因态势信息过于复杂以及推演本身信息不完整,导致自主决策模型的样本决策效率降低。提出一种基于深度强化学习的智能兵棋推演决策方法。针对智能兵棋推演作战决策的效率问题,在策略网络中引入基准线,并加快策略网络训练,随后进行推导证明,提出加入基准线后策略网络参数的更新方法,分析将兵棋推演环境中的状态-价值函数引入到模型的过程。构建低优势策略-价值网络模型及其训练框架,在传统策略-价值网络下用于兵棋推演,结合战场态势感知方法对模型进行构建。实验结果表明,在近似符合军事作战规则的兵棋作战实验环境中,将传统策略-价值网络和低优势策略-价值网络进行对比训练,在400次的自博弈训练中,低优势策略-价值网络模型的损失值从5.3下降到2.3,且收敛速度优于传统策略-价值网络,低优势策略-价值网络模型的KL散度在训练过程中趋近于0。
针对密集人群场景的口罩佩戴检测面临着监控视角下目标密集、互相遮挡、目标小、人脸透视畸变等难题, 同时,涵盖不规范佩戴口罩场景的公开数据集也较为缺乏。提出一种基于YOLO-v5改进的监控视角下密集人群口罩佩戴检测算法MDDC-YOLO。利用空洞卷积构造多分支感受野模块MRF-C3替换YOLO-v5中常规C3模块,解决密集人群中小目标占比大的问题。使用Repulsion Loss基于样本边界框排斥吸引的原则提高模型抗遮挡能力,并充分利用训练过程中的遮挡正样本。在此基础上, 引入ECA注意力机制进行特征通道最优化选择,并提出基于透视变换的离线数据增强方法, 结合使用更适用于生成更多小目标样本的Mosaic-9数据增强方法,解决监控视角下密集人群口罩佩戴数据集缺乏的问题。实验结果表明,MDDC-YOLO算法相较于YOLO-v5算法mAP提升6.5个百分点,并达到32帧/s的检测速度,满足密集人群口罩佩戴检测的应用需求。