维吾尔语机器翻译作为我国低资源机器翻译研究的重要任务之一,其发展与应用可以更好地促进不同地区和民族之间的文化交流与贸易往来。然而,维吾尔语作为一种黏着性语言,在机器翻译领域存在形态复杂、语料稀缺等问题。近年来,在维吾尔语机器翻译发展的不同阶段,研究人员针对其特点在算法和模型上不断优化与创新,取得了一定的研究成果,但缺乏系统性的综述。全面回顾维吾尔语机器翻译的相关研究,并根据方法的不同将其分为基于规则和实例的维吾尔语机器翻译、基于统计的维吾尔语机器翻译以及基于神经网络的维吾尔语机器翻译3种类型,同时对相关学术活动和语料库资源进行汇总。为进一步探索维吾尔语机器翻译的潜力,采用ChatGPT模型对维吾尔语-汉语机器翻译任务进行初步研究,实验结果表明,在Few-shot情景下,随着示例数的增加,翻译性能先升后降,在10-shot时表现最佳。此外,思维链方法在维吾尔语机器翻译任务中并未展示出更优的翻译能力。最后对维吾尔语机器翻译未来的研究方向进行了展望。
区块链网络是构建在TCP/IP体系之上的一类覆盖网络,在不依赖可信中心服务节点和可信信道的前提下,为分布式环境中互不信任的节点之间就账本数据达成一致性提供通信保障。随着区块链挖矿技术的发展,尤其是基于ASIC、GPU等硬件的工作量证明共识挖矿技术在比特币(BTC)、以太坊(ETH)、莱特币等主流加密货币中的应用,支撑矿池挖矿方式的矿池网络引起了研究者的广泛关注,因此归纳并总结区块链矿池网络及其安全方面的研究成果对于追踪区块链技术研究进展和拓展区块链应用范围具有重要价值。首先,结合传统对等(P2P)网络组网模式,针对BTC、ETH和超级账本等典型应用场景,梳理区块链P2P网络运行机制和特点。然后,介绍矿池、矿场以及矿池网络概念,分析矿池网络的组成要素以及GetWork、GetBlockTemplate和Stratum典型矿池网络协议的工作原理。接着,重点讨论针对矿池网络的自私挖矿、跳池、扣块、空块等典型攻击方式的实现过程,并提出相应的防范方法。最后,对矿池网络的未来发展方向进行展望。
由于在大规模数据集上执行精确查询耗时较长,因此近似查询处理(AQP)技术常被用于在线分析处理,目的是以较短的交互延迟返回查询结果,并尽可能地降低查询误差。现有的学习型AQP方法与底层数据解耦,将I/O密集型计算转化为CPU密集型计算,但是由于计算资源的限制,该类方法通常基于随机的数据样本进行模型训练,此类训练数据会引起稀有群组缺失问题,导致模型预测准确性不高。针对上述问题,提出一种基于分层样本学习的混合型和积网络模型,并基于该模型设计一种AQP框架。分层样本能够有效避免稀有群组缺失现象,基于该样本训练的模型预测准确性大幅提升。此外,针对数据动态更新的情况,提出一种模型自适应更新策略,使得模型能够及时检测数据偏移现象并自适应地执行更新。实验结果表明,与基于抽样和基于机器学习的AQP方法相比,该模型在真实数据集和合成数据集上的平均相对误差分别约降低18.3%和2.2%,在数据动态更新的场景下,其准确性和查询时延均呈现出良好的稳定性。
Hyperledger Fabric是一种国内外广泛使用的联盟链框架,在基于Fabric技术的一些业务中具有协同组织众多、交易操作频繁、事务冲突增加等特点。Fabric采用的多版本并发控制技术能够在一定程度上解决部分交易冲突,提升系统并发性,但其机制不完善,会出现部分交易数据无法正常上链存储的问题。为了实现海量交易数据完整、高效、可信的上链存储,提出一种基于Fabric预言机的数据上链预处理机制。设计海量数据冲突预处理(MCPP)方法,通过检测、监听、延时提交、事务加锁、重排序缓存等方式实现主键冲突交易数据的完整上链。引入数据传输保障措施,在传输过程中利用非对称加密技术防止恶意节点伪造认证信息,确保交易数据链外处理前后的一致性。通过理论分析和实验结果表明,该机制可有效解决联盟链平台中海量交易数据上链时的并发冲突问题,当交易数据规模达到1 000和10 000时,MCPP的时效性比LMLS提高了38%和21.4%,且成功率接近100%,具有高效性和安全性,同时在无并发冲突情况下不影响Fabric系统性能。
随着物联网规模化应用的不断落地,海量设备协同工作,产生了大量高价值数据。这些数据若得不到有效的安全保障,就容易遭受数据滥用、隐私泄露以及数据篡改等威胁。因此,去中心化、不可篡改、安全的区块链分片网络逐步取代传统的集中式网络,被应用到该场景中。然而,区块链分片网络受限于复杂环境以及高比例跨片协同事务。针对上述问题,提出一种面向6G物联网设备协同的区块链动态分片优化方案。设计分片系统架构,建立整个系统的吞吐量模型、安全模型以及时延模型。在此基础上,提出两阶段分片优化策略。第一阶段采用信誉分级分片策略筛选节点,第二阶段采用基于深度强化学习算法的动态分片策略,降低跨片协同事务比例,决策分片数量。两阶段的设计目的是在保证安全的情况下最大程度地提升整个系统的吞吐量。实验结果表明,在面向物联网设备协同的区块链分片场景下,相较于传统的基于单一的信誉分级分片策略、均匀分片策略或者随机分片策略的方案,所提方案在保证安全性的情况下,平均每轮减少50%以上的跨片协同事务比例,有效地提升了系统的吞吐量。
作为时序数据分析中的基础技术之一,时间序列的子序列查询旨在寻找与目标序列相似的子序列。现有的子序列查询方法大多仅支持查询与目标序列长度相同的子序列,因而均匀缩放技术常被用于解决子序列查询中的不等长问题。但现有支持均匀缩放的子序列查询技术大多未考虑子序列的Z-标准化,且对查询效率仍有改善的空间。针对该问题,提出一种基于索引技术且支持均匀缩放的子序列查询方法。结合现有索引方法ULISSE提供的树状数据结构,设计可保证非漏报的下界距离,为索引结构的剪枝提供理论保证,并利用索引中存储的元数据,提出精确K-近邻查询算法。所提方法适用于非归一化和归一化两种场景。实验结果表明,较UCR-US和ULISSE基线方法,该基于索引的不等长子序列查询方法在CAP、GAP两个真实数据集以及随机游走人工合成数据集上均实现了查询效率的显著提升,针对在非归一化和归一化两种场景下的不等长子序列查询,该方法的平均效率提升分别为2.33和2.51倍。
面向类集成测试序列的强化学习方法能够自适应地根据系统集成状态调整集成测试策略,是测试优化的关键技术之一,但现有方法普遍存在计算成本高且不适用于大规模软件系统、忽略测试风险的滞后性问题,大幅降低了适用性和可靠性。针对上述问题,提出一种具有重要值加权奖励的基于测试顺序的强化学习方法。优化强化学习建模,忽略节点在测试序列上的具体位置,减弱状态之间的相关性,提升模型可用性。结合深度强化学习模型,端到端地更新集成测试策略,减少值函数的误差。在奖励函数的设计上,引入修正的节点重要值,实现降低整体测试桩复杂度且提升关键类优先级的多目标优化求解。在SIR开源系统上的实验结果表明:优化的强化学习建模方式能够有效降低整体测试桩复杂度,并适用于大规模软件系统;融入修正节点重要值的奖励函数能够有效提升软件系统中关键类的优先级,平均提升幅度为55.38%。
目标级隐性情感分类是自然语言处理中一项重要的情感分析任务。目前多数研究主要侧重于对上下文感知的目标进行建模,且建模信息源较为单一,难以充分捕获到目标词在文本中的隐性情感。针对该问题,提出基于双重多视角表示学习的目标级隐性情感分类方法,采用3种视角对目标和输入文本进行建模,分别设计文本自身的表示学习、图视角下的表示学习以及外部知识视角下的表示学习,并通过卷积神经网络将3种视角下的表示进行深度融合。此外,同时采用上述3种视角对目标进行表示学习,将文本的语义表示和目标的语义表示相结合,并输入到情感极性分类器中。在5个公共数据集上进行实验并与8个基线模型的对比结果表明,该方法性能达到了最优水平,在NewsMTSC-mt和NewsMTSC-rw隐性情感分析数据集上的
已有的图神经网络(GNN)推荐算法大多利用用户-项目交互图的节点编号信息进行训练,学习用户-项目节点的高阶联系去丰富节点表示,但忽略了用户对不同模态信息的偏好,没有利用项目的图片、文本等模态信息,或对于不同模态特征的融合简单相加,不能区分用户对不同模态信息的偏好。针对上述问题,提出多模态融合的GNN推荐模型。首先针对单个模态,结合用户-项目交互二部图构建单模态图网络,在单模态图中学习用户对此模态信息的偏好;然后利用GAT聚合邻居信息,丰富本节点表示,同时根据门控循环单元决定是否聚合邻居信息,达到去噪效果;最后将各个模态图学习到的用户、项目表示通过注意力机制融合得到最终表示并送入预测模块。在MovieLens-20M、H&M两个数据集上的实验结果表明:多模态信息、注意力融合机制能有效提升推荐的准确度,算法模型在Precision@K、Recall@K和NDCG@K 3个指标上相较于基线最优算法均有显著提升;当评估指标K值选取10时,Precision@10、Recall@10和NDCG@10在两个数据集上分别提升了4.67%、2.42%、2.03%和2.49%、5.24%、2.05%。
知识图谱问答(KBQA)旨在理解用户的自然语言问句,在结构化的知识图谱中通过检索、推理等手段来获取答案实体。近年来,多跳KBQA备受关注,然而,复杂问句中通常存在多个关系意图,已有KBQA方法大多忽视了推理关系链的关系顺序问题。为此,提出一种基于层次结构图的多跳知识图谱问答模型(HSG-KBQA),建模自然语言问句的关系层次顺序,指导模型在每个推理步选择合理的关系意图。设计一种层次结构图,显式地体现问句中关系的层次距离,利用LSTM-BiGCN编码层将词语间的依存信息编码到问句中;提出虚拟节点的概念,利用图池化技术过滤不重要的节点,学习推理过程中知识图谱的状态;设计基于注意力机制和层次权重的解码器来优化指令生成,使推理指令更匹配问句中的关系链顺序。实验结果表明,HSG-KBQA在WebQuestionsSP数据集上取得了71.3%的Hits@1分数,在PathQuestions数据集上取得了97.3%(PQ-2H)和89.7%(PQ-3H)的Hits@1分数,均优于对照基准模型,表明HSG-KBQA模型在KBQA任务中具有更好的性能。
模糊粗糙集可突破经典粗糙集仅能处理离散数据的局限,有效对连续型数值进行特征选择。然而,模糊粗糙集以对象为中心计算,时间复杂度高,难以处理高维和大规模数据。为此,基于水平截集提出一种不一致近邻加速策略。该策略跟踪论域中每个对象的模糊近邻集,持续删减其中不影响计算的近邻,若对象的不一致近邻删减至空,则删减该对象,从而提高算法效率。同时,设计一种基于不一致近邻递减的属性重要度,可有效抑制冗余特征入选,提升效率及分类精度。通过理论证明,所提的加速策略及属性重要度不影响属性入选的次序。在此基础上,提出新的模糊粗糙集特征选择算法。在9个UCI和scikit数据集上进行验证,实验结果表明,该算法不仅有效缩短运行时间,并可取得较高的分类精度,相比FA-FSCE、AVDP和IV-FS-FRS-2算法,运行时间至少可缩短9.44%,尤其在高维和大规模数据上可缩短61.01%~99.54%,在支持向量机和K-近邻算法的分类精度上最高可分别提高11.20%和19.95%。
现有基于图对比学习的推荐模型在图数据增强方面通常只采用一种视图增强方法,忽略了单一方法存在的局限性,在对比学习方面通常只对比同一节点的一对视图,未充分利用各个视图不同的层嵌入。为此,提出一种基于多视图融合跨层对比学习的推荐算法框架(MFCCL)。MFCCL分别使用随机边丢弃和随机添加噪声的增强方法构建2个全局视图,使用奇异值分解的方法构建局部视图,通过3种不同的视图增强方法构造全局和局部共3个视图,以实现有效的用户表示。同时,提出一种新的多视图融合跨层对比学习方法,该方法将2个全局视图不同的层嵌入通过平行和交叉2种方式进行融合后作对比,以获取更多的特征信息。将多视图融合跨层对比学习与全局-局部视图对比学习相结合,联合优化模型,从而提升推荐性能。在Yelp、Tmall和Amazon-book这3个公开数据集上进行实验,结果表明,MFCCL在推荐任务中具有有效性和可行性,相较于对比模型中性能最优的基线模型SimGCL,MFCCL在3个数据集中的Recall@20增益分别达到15.0%、13.3%和28.7%,NDCG@20值分别提升14.3%、13.2%和29.6%。
现有基于图的多视图聚类方法通常难以同时考虑不同视图的潜在高阶相关信息和每个视图内的全局几何结构,导致聚类性能受限。为此,提出一种基于加权张量低秩约束的多视图谱聚类方法(WTLR-MSC)。根据多视图数据构建概率转移矩阵,将所有的概率转移矩阵构建为三阶张量,并借助鲁棒主成分分析思想将其分解为目标张量和误差张量。使用加权张量核范数约束目标张量的旋转张量,利用奇异值先验信息准确挖掘多视图数据的潜在高阶相关信息,并利用核范数约束目标张量的每个正切片以刻画每个视图内的全局几何结构。基于此建立数学模型,并设计有效的求解算法。在BBCSport、BBC4View、COIL20、UCI Digits 4个常用数据集上的实验结果表明,WTLR-MSC较ERLRT、MCA2M、MGL-WTNN等聚类方法的性能有显著提升,准确率、标准化互信息、F1值、精确率、召回率相较于次优方法最高提升约1.3、1.0、1.2、1.6和0.8个百分点,大幅增强了多视图聚类的稳健性。
现有软件多样化方法大多需要源代码,基于编译器生成变体二进制,而对二进制代码直接进行转换时由于缺乏调试信息导致难以正确逆向,且易造成高额的性能开销。为此,提出一种面向二进制代码的细粒度软件多样化方法。通过静态二进制重写技术以函数块为单位进行重排序,随机化函数在代码段中的原始位置,同时使程序的内存片段gadgets位置发生改变,使得攻击者对程序的先验知识失效,以防御大规模代码重用攻击。为了进一步提高攻击者破解难度,对基本块内的指令进行依赖性分析,实现基本块内指令随机化,同时使得随机化后基本块的原始语义不变。性能测试结果表明,函数重排序对gadgets存活率的影响大于基本块内指令重排序,两者同时使用时程序的gadgets平均存活率为5.71%;模糊哈希算法Tlsh比较结果显示,该方法能够有效躲避同源性检测;使用工具Bindiff进行测试的结果表明,多样化后基本块内指令重排序的异构度大于函数重排序,且在基准测试集SPEC CPU2006上函数重排序和指令重排序同时使用时平均运行开销仅为3.1%,具有良好的实用性。
开源网络安全知识库已经成为弱点安全加固措施的有效来源,但是受异构信息协同难、历史信息维护难等因素影响,导致开源网络安全知识库弱点信息缺失。针对现有弱点信息补全方法对弱点信息不同邻域特征学习不充分的问题,提出一种基于安全知识图谱和逆向特征的弱点信息补全方法VulKGC-RN。为捕获不同邻域信息,构建关联CVE、CWE、CAPEC和ATT & CK 4类开源网络安全知识库的弱点安全知识图谱,并分析弱点安全知识图谱中安全实体的网络结构,采用逆向知识图谱捕获逆向邻域信息。为学习不同邻域特征,采用图注意力机制,并融合图注意力网络所学习安全实体的正向邻域和逆向邻域的角色特征,以实现弱点安全知识图谱的信息补全。在由5种7 199个安全实体和15种11 817条关联关系组成的开源网络安全数据集上进行实验,结果表明,VulKGC-RN的平均排名达到179,平均倒数排名达到0.671 4,优于基线方法。
决策树在数据分类上具有较好的效果,但容易产生过拟合的现象,解决方案是对决策树进行剪枝处理,然而传统剪枝算法普遍存在预剪枝容易欠拟合、后剪枝时间消耗多、网络搜索剪枝仅适用于小型数据集等问题。为了解决以上问题,提出一种高效的决策树参数剪枝算法。根据网络安全态势感知模型,建立剪枝决策树态势感知系统架构,分析网络数据流。在生成决策树的过程中,利用枚举与二分搜索算法找出决策树最大深度,采用深度优先搜索算法找到节点最小分裂数和最大特征数,最终结合这3个最优参数自上而下完成剪枝。实验结果表明,所提算法在大型数据集上的过拟合风险较小,训练集与测试集准确率都在95%以上,同时相比于后剪枝算法中表现较好的悲观错误剪枝算法快了近20倍。
区块链预言机是一种为上链数据提供可信保障的中间件,可以有效解决链上链下数据传输的信任问题。当前预言机方案大多存在成本高、容错率低、密钥泄露、数据泄漏、签名失效等问题,为此,提出一种基于Schnorr门限聚合签名的区块链预言机改进方案。通过引入可验证随机函数生成可验证随机数,解决签名过程中随机数重复或能够被预测而导致的密钥泄露问题;通过引入可验证秘密分享技术,解决签名过程中密钥分发者作恶而导致的签名失效问题。预言机通过验证密钥碎片检测密钥分发者是否作恶,验证结束后向预言机智能合约发送验证结果,当预言机智能合约收到t个验证失败的结果时向所有预言机发送消息,达成一致性共识后重启签名。在数据提交阶段,只有预言机身份验证通过时才允许其提交,以防止签名过程中的数据泄露。同时,设置预言机信誉与激励机制,保证信誉较好的预言机在有效时间内参与签名并获得奖励。实验结果表明,在预言机节点数量为50、密钥分发者作恶且恶意预言机占预言机群体总数近50%时,该方案消耗的总时间不超过200 ms,gas消耗量不超过
多跳车辆与车辆(V2V)通信可以有效改善车载毫米波网络的连通性和覆盖范围,但是多跳转发会带来时延开销。智能反射面(IRS)可以提供反射增益以补偿远距离传输的高路径损耗,从而增加单跳传输距离,减少转发跳数。利用IRS辅助多跳V2V通信,能够减少转发跳数,降低时延开销。针对现有链路选择机制大多忽略转发车辆之间资源和信号冲突的问题,为车载毫米波网络中IRS辅助的多跳V2V通信提出一种基于向前转发效率和空间复用时分多址接入(FE-STDMA)的链路选择机制。综合转发距离、链路质量和传输时间评估候选链路的向前转发效率,将其作为链路选择的依据。在链路选择中利用空间复用实现并发传输,通过时分接入缓解转发资源冲突问题,从而最大化网络资源利用率。仿真结果表明,FE-STDMA机制的多跳时延相比于NFP机制平均降低49.88%,交付率远高于MFR和RFP机制,相比于NFP机制平均提高11.11%。与常用链路选择机制相比,FE-STDMA机制可在保证交付率的同时大幅改善多跳时延。
网络切片(NS)是5G网络中的一种关键性技术,在多业务动态场景下发挥着重要作用。针对5G网络切片中由切片需求动态变化引起的资源冲突问题,采用一种基于自适应动态预测(ADP)的优化方法,提出“自适应动态预测-模型优化”的优化方案。在自适应动态预测模块,对动态的切片流量进行波动等级划分,以确保切片流量预测的准确性以及自适应性。根据划分结果,分别采用2种不同的循环神经网络算法来预测切片未来时间的流量需求,包括基于注意力机制-双向门控循环单元(Att-BiGRU)的点预测以及基于自举法-BiGRU的区间预测。在模型优化模块,根据预测结果定义用户满意度函数和切片优化配置的开销,将资源冲突优化问题表示为最大化网络收益。由于预测模块的输出可能含有不确定参数,根据鲁棒优化和基于可变粒子数量的粒子群优化算法求解出切片优化配置方案。在仿真部分对所提优化方案进行验证,结果表明,该方法在满足切片动态需求的同时,降低了资源冲突带来的负面影响,其在网络收益以及请求接受率等方面优于对比算法,链路资源利用率达到90%以上。
为了实现区分网络优先级、保证公平性、提高普通站点的性能和效率,在完全-限定(K=1)两级轮询控制系统模型的基础上,提出连续时间完全-限定(K=2)两级轮询控制系统模型。在该模型中,使用限定(K=2)服务和完全服务分别对普通站点和中心站点进行服务。中心站点转换到普通站点进行服务时,使用捎带查询方式。在此基础上,采用马尔可夫链和概率母函数的数学方法建立该轮询系统模型,并推导平均排队队长和时延。利用MATLAB进行仿真实验,结果表明:理论值与仿真值误差较小,验证了理论分析的正确性;与门限-完全服务模型相比,该模型中心站点的队长和时延均小于门限-完全服务中心站点的队长和时延,具有更高的优先级;与一级完全服务和一级限定(K=2)服务模型相比,区分了优先级,性能分别提升11.7%和14.5%,说明两级服务远好于一级服务;与完全-限定(K=1)两级服务模型相比,增加了发送的数据,减少了等待时间,性能提升13.04%左右,进一步优化了普通站点的性能。
边缘计算弥补了传统云计算数据传输开销大的不足,但边缘网络中存储和计算资源受限的特殊性限制了其部署复杂安全算法的能力,更易受到分布式拒绝服务(DDoS)攻击。针对目前边缘网络中DDoS攻击检测方法性能不高、未对卸载任务分类处理、对多属性的流量处理能力弱的问题,提出一种基于任务分类的Attention-1D-CNN DDoS检测模型TCA1C,对通信链路中的流量按不同的卸载任务进行分类,使单个任务受到攻击时不会影响整个链路中计算任务卸载的安全性,再对同一任务下的流量提取属性值并进行归一化处理。处理后的数据输入到Attention-1D-CNN,通道Attention和空间Attention学习数据特征对DDoS检测的贡献度,利用筛选函数剔除低于特征阈值的冗余信息,降低模型学习过程的复杂度,使模型快速收敛。仿真结果表明:TCA1C模型在缩短DDoS检测所用时间的情况下,检测准确率高达99.73%,检测性能优于DT、ELM、LSTM和CNN;当多个卸载任务在面临特定攻击概率时,卸载任务分类能有效降低不同任务的相互影响,使终端设备的计算任务在卸载过程中保持较高的安全性。
在车联网中随着智能网联汽车的升级,新兴车载应用对计算能力提出更高要求,车载单元本身的计算能力已远远不够,移动边缘计算(MEC)的出现可以为车辆提供更加可靠的服务。为解决车联网边缘计算中的任务卸载问题,提出基于负载预测的多目标优化卸载策略算法,降低任务时延并实现边缘服务器负载均衡。通过基于自适应优化神经网络的负载预测算法预测MEC服务器的负载,提前感知MEC服务器的负载变化,解决任务卸载滞后问题。以最小化时延及MEC服务器负载均衡为目标,综合考虑通信环境、计算资源、任务量等因素构建多目标优化模型。通过非支配排序遗传算法-Ⅲ(NSGA-Ⅲ)获得最优任务卸载策略。仿真实验结果表明,该算法能对MEC服务器的负载进行较精确的预测。相比MTUOA、NSGA2、QTD和AOS,该算法的任务时延分别降低1.7%、7.3%、12.4%、17.5%,并在MEC服务器负载均衡中取得显著优势,解决MEC服务器负载不均衡的问题。此外,该算法可以根据不同通信小区的通信环境及车辆数等制定差异化的任务卸载方案。
随着遥感技术的快速发展,遥感图像检测被广泛应用于农业、军事、国防安全等众多领域。遥感图像相较于传统图像检测存在诸多难点,如何实现高效精准的遥感图像检测成为该领域的研究热点。针对遥感图像检测中存在的计算复杂度高、正负样本不平衡、目标尺度小等问题,提出一种基于感知增强Swin Transformer的遥感图像检测网络,以提升遥感图像检测性能。在主干网络设计过程中,利用Swin Transformer分层设计和移动窗口的优点有效减小计算复杂度,同时插入空间局部感知块,加强网络对局部相关性和结构信息的提取能力。设计区域分布回归损失为小目标分配更大的权重,解决了正负样本不平衡的问题,同时结合改进的IoU-aware分类损失消除不同分支之间的差距,降低分类和回归损失。在公共遥感数据集DOTA上的多组实验结果表明,该网络获得了78.47%的平均精度均值和10.8帧/s的检测速度,检测性能优于经典的目标检测网络Faster R-CNN、Mask R-CNN以及现有优秀的遥感图像检测网络,并且在各类不同尺度的目标上均具有较好的性能表现。
由于地铁隧道环境图像对比度低且细节模糊,在后续图像处理过程中难以从图像中准确提取关键的环境信息。为了解决该问题,提出一种融合对比度拉伸的模糊图像复原算法。将隧道图像转换到HSV颜色空间,根据V分量的灰度分布特点构建对比度拉伸模型对V分量进行增强,避免了传统低照度增强算法出现的过度增强问题,且能够自适应增强图像对比度。对增强后的V分量进行模糊类型分析,从而确定地铁隧道图像模糊类型,在此基础上将增强后的V分量图像划分为不同的区域,在各个区域分别选择符合条件的刀刃边缘线并对其扩散函数进行估计,同时以点扩散函数作为先验信息,采用非盲去卷积算法对各区域进行去模糊处理。融合H、S、V 3个分量,完成隧道环境低照度图像整体增强与复原。实验结果表明,所提算法能有效提高隧道图像整体及局部对比度,减少由高斯噪声引起的图像模糊,恢复图像中的细节信息。
智能化害虫检测是目标检测技术在农业领域的重要应用,可以有效提高害虫测报工作效率和可靠性,保障农作物产量和质量。在诱虫灯、粘虫板等固定式诱捕装置下,图像背景简单、光照条件稳定、害虫特征显著易于提取,害虫检测可以达到较高的准确率,但其应用场景固定,检测范围局限于设备周围,无法适应复杂的田间环境。针对田间环境下图像背景复杂和害虫尺寸小带来的难检和漏检问题,提出一种改进YOLOv5的小目标害虫检测算法Pest-YOLOv5,以提高害虫测报的灵活性。在特征提取网络中增加坐标注意力机制,通过结合空间和通道信息,增强对小目标害虫特征的提取能力,在颈部连接部分使用双向特征金字塔网络结构,通过融合多尺度特征,缓解多次卷积带来的小目标信息丢失问题。在此基础上,使用SIoU和变焦损失函数计算损失值,同时通过实验得到最优分类损失权重系数,使模型更关注分类困难的目标样本。在公开数据集AgriPest上的实验结果表明,Pest-YOLOv5模型mAP0.5和召回率分别为70.4%和67.8%,优于原YOLOv5s模型、SSD和Faster R-CNN等经典目标检测模型。与YOLOv5s模型相比,Pest-YOLOv5模型将mAP0.5、mAP0.50:0.95和召回率分别提高8.1%、7.9%和12.8%,改善了难检和漏检情况。
针对Faster R-CNN算法对于小尺寸目标以及遮挡或截断物体检测能力不足的问题,提出一种融合CBAM注意力机制和特征金字塔结构的改进Faster R-CNN算法。为重点聚焦特征图像局部高效信息,在特征提取网络中融入CBAM机制,减少无效目标的干扰,提升面对遮挡或截断物体的检测能力。引入特征金字塔网络结构,联结高层与底层特征数据,获得高分辨率、强语义数据,从而增强小目标物体的检测效果。为缓解梯度消失现象以及减少超参数规模,使用表达能力较强的倒残差VS-ResNet网络替换VGG16网络,VS-ResNet网络在原有ResNet 50基础上修改了部分层次结构,加入辅助分类器,设计倒残差和组卷积方式,使激活函数信息在高维环境中完整保留,提高检测准确率。采用重置候选框分值计算方法弥补非极大值抑制算法误消除重叠检测框的缺陷。实验结果表明,相比VGG16,VS-ResNet在CIFAR-10数据集上的正确率提高2.97个百分点,该算法在Pascal VOC 2012数据集上的目标检测mAP值为76.2%,比原始Faster R-CNN算法的mAP值提高了13.9个百分点。
深度神经网络广泛应用于图像分类、目标检测、自然语言处理等领域,但其容易受到对抗样本攻击。现有的多数攻击都是基于快速梯度符号法,通过在输入中添加相同幅度的扰动达到攻击效果,这些方法虽然有效但并不利于快速找到具有泛化能力的对抗样本。针对对抗样本的泛化性,提出一种结合稳定自适应矩估计和空间域变换的梯度优化算法来改进现有的对抗样本生成算法。将Nesterov算法引入一阶矩估计的更新中,基于AdaBelief算法,将Belief参数应用于二阶矩估计,同时根据指数衰减率计算衰减步长以获取更稳定的梯度。从数据增强的角度考虑,在对抗样本生成的过程中将输入样本在空间域进行变换,通过加权不同变换的梯度来更新原有梯度,从而提高对抗样本的可迁移性。实验结果表明,改进算法对抗样本性能显著提升,其白盒攻击成功率能够保持在99.6%以上,同时黑盒攻击成功率可提高到74.5%。
针对已有彩色图像多阈值分割方法存在的分割精度不高、分割适应性较差等问题,提出一种圆形直方图线性化的高精度高适应性多阈值分割方法。在对输入彩色图像进行超像素预处理后,构建累积分布方差最大化准则,将圆形直方图截断后延展为线性直方图。在线性直方图上,结合Tsallis熵和类间方差构建一个新的多阈值分割目标函数。引入麻雀搜索算法,快速求解多阈值分割目标函数得到最优阈值进行阈值分割。在8幅合成图像和500幅真实世界图像上将提出方法和9种不同的彩色图像分割方法进行全面比较,在峰值信噪比(PSNR)、结构相似性(SSIM)、特征相似度(FSIM)、概率兰德指数、全局一致性误差(GCE)、信息差异6个量化评价指标上的综合实验结果表明,提出方法在计算效率方面与比较方法大致持平,但在分割精度和分割适应性方面明显优于比较方法,在PSNR、SSIM、FSIM和GCE等评价指标上分别以19.95 dB、0.80、0.94和0.16取得最优结果。
目前细粒度图像分类的难点在于如何精准定位图像中高度可辨的局部区域以及其他辅助判别特征。提出一种多区域注意力的细粒度图像分类网络来解决这个问题。首先使用Inception-V3对图像特征进行提取,通过重复使用注意力擦除的方法使模型关注次要特征;然后通过背景去除以及上采样的方法获取图像更精准的局部图像,对提取到的局部特征进行位置统计,并以矩形框的方式获取图像整体,减少细节信息丢失;最后对局部与整体图像进行更加细致的学习。此外,设计联合损失函数,通过动态平衡难易样本和缩小类内差距的方法改善模型的识别效果。实验结果表明,该方法在公开的细粒度图像数据集CUB-200-2011、Stanford-Cars和FGVC-Aircraft上的准确率分别达到89.2%、94.8%、94.0%,相较于对比方法性能更优。
当前大多数低照度图像增强模型在自然环境中难以兼顾照度增强和原图特征保留两方面的效果,而且不能很好地适应多种不同的低照度场景,为此,提出一种基于生成对抗网络的改进模型。首先通过标准卷积提取浅层特征,然后利用光照一致性损失构建全局-局部照明学习(GLIE)模块。在GLIE内部设计基于全局-局部的特征提取结构,通过移位窗口自注意力机制和多尺度空洞卷积分别实现场景级特征提取和光照增强平滑。通过原图特征保留块对GLIE的输出特征和浅层特征进行拼接融合和通道注意力加强,实现对原图特征的保留和噪声抑制。在此基础上,通过改进的损失函数在模型训练过程中同时实现对照度增强和原图特征保留的有效监督。实验结果表明,该模型主观效果真实自然,与Retinex-Net、EnlightenGAN等主流模型相比,其对原图色彩纹理细节保留和噪声抑制的效果更好,在整体测试数据集上自然图像质量评估指标和亮度顺序误差分别达到3.88和199.4,在不同测试数据集中2个指标都取得了前3名的结果,整体性能良好。
现有的多模态检测模型通常对每个模态的特征进行简单拼接,不能对模态之间的相关性进行有效建模,而且很难迁移到标签稀少的领域。提出一种基于预训练和多模态融合的假新闻检测模型PMFD。提取新闻附带图像不同区域的特征作为图像原始向量,合并图像原始向量作为图像引导向量,设计早期融合、中期融合、后期融合3种不同的多模态融合方式。在早期融合阶段,通过图像引导向量初始化文本特征提取器,获取文本原始向量,合并文本原始向量作为文本引导向量。在中期融合阶段,使用模态的原始向量集合与其他模态的引导向量构造模态的特征表示。在后期融合阶段,融合不同模态的特征表示,构造新闻的特征表示。为提高模型的泛化能力,在标签丰富的数据上对PMFD进行预训练,然后再在标签稀少的数据上对PMFD进行微调。在公开数据集上的实验结果表明,PMFD能有效检测假新闻结果,相对传统模型CNN、LSTM、BERT等有10%以上的提升,相对EANN、M_model多模态假新闻检测模型有2%~3%的提升。
乳腺癌是最常见的癌症之一,基于患者的基因组学数据进行预后5年生存预测是乳腺癌研究中的常见任务。针对乳腺癌患者基因组学数据中存在嘈杂性、异质性、序列长以及正负样本不平衡等问题,提出基于多模态学习的乳腺癌预后5年生存预测模型MLBSP。利用单模态模块提取基因表达数据、基因突变累积数、单核苷酸变异以及基因拷贝数变异数4种模态数据的有效信息。在此基础上,为了减少单一模态数据异质性对全局特征造成的影响,将深度可分离卷积和多头自注意力机制作为多模态模块架构对数据进行特征融合,捕获患者多模态基因组数据的全局信息,并使用Focal Loss解决正负样本不平衡的问题,以指导预后5年生存预测。实验结果表明,MLBSP模型在乳腺癌患者真实数据集BRCA Cell、METABRIC、PanCancer Altas上的AUC分别达到91.18%、71.49%、77.37%,与XGBoost、随机森林等主流癌症生存预测方法相比,平均提升了17.69%、6.51%、10.24%。此外,通过通路分析发现一些生物标志物SLC8A3、TP 53等,进一步验证多模态研究的新颖性和有效性。
相似案例匹配任务是文本匹配在司法领域的具体应用之一,目的在于区分法律文书是否相似,对类案检索具有重要意义。与传统文本匹配任务相比,法律文本通常篇幅较长,同时相似案例匹配是针对相同案由案件的匹配,案情文本之间的差异较小,以往的文本匹配方法很难计算文本相似度。针对借贷案件文本匹配存在的问题,建立一种融合借贷案件关键要素的相似案例匹配模型。为了获取文本中更丰富的语义特征,构建正则表达式获得借贷案件的特定案件要素,如借款交付形式、借款人基本属性等,并与原有的案情文本相结合,联合学习法律文本与案件关键要素的语义特征。同时,利用共享权重的预训练模型分别对不同的文书进行编码,并且对预训练模型特定编码层的输出进行融合,得到更加丰富的语义信息。引入有监督对比学习框架,更好地利用样本信息,进一步提高相似案例匹配的性能。在CAIL2019-SCM数据集上的实验结果表明,与LFESM模型相比,该模型在测试集上的准确率提高了1.05个百分点。
目前强化学习在移动机器人领域表现出了强大的潜力,将强化学习算法与机器人导航相结合,不需要依赖先验知识就可以实现移动机器人的自主导航,但是在机器人强化学习过程中存在样本利用率低且泛化能力不强的问题。针对上述问题,在D3QN算法的基础上提出优势后见经验回放算法用于经验样本的回放。首先计算轨迹样本中轨迹点的优势函数值,选择优势函数最大值的点作为目标点,然后对轨迹样本进行重新标记,将新旧轨迹样本一同放入经验池中增加经验样本的多样性,使智能体利用失败的经验样本学习,更高效地实现到目标点的导航。为评估该方法的有效性,基于Gazebo平台搭建不同的实验环境,并采用TurtleBot3机器人在仿真环境下进行导航训练与迁移测试,结果表明,该算法在训练环境下导航成功率高于当前主流算法,在迁移测试环境中导航成功率可达86.33%,能够有效提高导航样本利用率,降低导航策略学习难度,增强移动机器人在不同环境中的自主导航能力和迁移泛化能力。
对于非结构化网格流场数据,现有研究存在不能定位流场中临界点的具体位置、无法对临界点精细分类以及缺乏适用于非结构化网格的种子点选取算法等问题。针对上述问题,基于非结构化网格流场数据, 分别在临界点提取和种子点选取方法上进行改进创新。提出非结构化网格中临界点的定位及分类方法,通过庞加莱指数法判断存在临界点的三角网格。构造质心迭代法定位临界点在网格中的准确位置,并设计三角网格内雅克比矩阵的构造方法,将临界点精细分类。基于非结构化网格提出基于最大得分和网格密度的种子点选取算法,先比较相邻格点的标量值大小来计算每个格点的得分,形成“最大得分”标量场,再按照网格密度动态设置阈值,将得分大于阈值的格点选为种子点,接着以种子点为起始点生成流线,生成的流线可以表达出流场的关键特征与全局信息。基于多个海域流场数据的实验结果表明,临界点分类的准确率可达99%以上,证明了临界点提取算法的准确性以及种子点选取算法对提升流场可视化效果的有效性。
针对氮氧传感器电极微观图像存在的物质边缘模糊、伪影、灰度不均等问题,将U-Net作为基础模型,提出融合多层感知注意力的电极微观图像语义分割方法。首先对U-Net编码层的不同尺度输出特征图使用3×3卷积进行降维,利用双线性插值统一特征尺度,以实现多尺度特征融合,增强特征信息提取能力并补偿编码下采样中的特征损失;其次通过加入空间金字塔池化来提取多尺度信息并通过1×1卷积减小计算量,同时提出多层感知注意力模块,以捕获主干特征图和增强语义信息特征图的空间位置与通道依赖关系;最后计算不同语义信息特征图的相似度关系,结合交叉熵损失提出具有捕获空间相似性能力的损失函数,在训练过程中对关键信息进行监督,辅助主干特征图学习空间位置信息,增强分割性能。实验结果表明,该方法的类别平均像素准确率为96.75%,平均交并比为94.04%,微观F1分数为96.92%,浮点运算次数为7.78×109,网络所含参数量为8.08×106。相对U-Net、SegNet等模型,该方法在提高少量模型复杂度的情况下,能有效改善边缘模糊及物质伪影问题,捕获空间位置与通道信息,保留图像细节特征,提高分割准确率。
实体对齐在自动融合多源异构的石油领域数据资产知识图谱过程中起着至关重要的作用。目前主流基于图神经网络的实体对齐模型多关注实体和图结构的信息,忽略了实体之间的关系、属性与属性值等多邻域的语义信息,在命名规则差异性大、行业特殊、语义实体多的石油领域数据资产知识图谱融合过程中性能一般。提出一种基于图注意力网络改进的多邻域感知网络(MNAN)模型,用于实体对齐。使用基于BERT的多语言预训练模型得到实体及多邻域的初始特征,通过带有Highway Networks的图卷积神经网络聚合邻域实体与图结构特征,利用多邻域感知和实体增强注意力网络聚合实体的多邻域特征,使用最小化基于边际的损失函数训练模型。在石油领域数据资产知识图谱数据集中的2个知识图谱上进行实体对齐实验,实验结果表明,MNAN模型优于所有对比的基于图神经网络实体对齐模型,Hits@1值达86.7%,优于表现最好的对比模型约2.3个百分点。
血管分割对于血管疾病的诊断和治疗具有重要意义,但由于血管边界模糊、病变血管的形状多变且不同样本之间的差异性较大,因此要求分割模型能够准确地挖掘血管与背景类间的差异性以及血管内部的连通性。提出一种基于中心线约束与各向异性注意力的新型三维血管分割网络CAU-Net。针对血管分割的难点,对基础网络结构ResU-Net进行改进,构建各向异性注意力模块,该模块根据管腔结构特有的空间各向异性,从3个方向提取血管空间各向异性特征,并对特征通道间的相关性进行建模,学习血管的三维空间信息。采用主-辅双分支模型,b-Net对血管进行语义分割,a-Net学习血管中心线的连续性特征,约束b-Net的血管分割结果,保证血管分割结果的完整性。在公开数据集3D-IRCADb-01上的实验结果表明,对于门静脉及肝静脉的分割,CAU-Net分别取得(74.80±8.05)%和(76.14±6.89)%的Dice系数、(54.80±8.09)%和(50.40±5.22)%的NSD系数、(72.43±8.26)%和(70.84±6.05)%的clDice系数、(46.47±12.89)%和(39.19±7.97)%的分支检测率以及(67.08±15.59)%和(61.47±9.32)%的树长检测率。在公开脑血管数据集IXI上进行组件消融实验,模型在验证集上的平均Dice、NSD、clDice、BD和TD分别为(94.11±0.39)%、(96.53±0.37)%、(95.83±0.59)%、(98.64±1.63)%和(95.44±1.22)%,相比于Baseline分别提升了0.92%、0.82%、0.92%、1.11%和1.60%。CAU-Net血管分割模型能够显著提升血管分割的精度和完整度。