作者投稿和查稿 主编审稿 专家审稿 编委审稿 远程编辑

最新录用


期刊的电子版内容存储于(但不限于)中国知网 :
https://navi.cnki.net/knavi/journals/ZGYR/detail?uniplatform=NZKPT&language=chs。


Please wait a minute...
  • 全选
    |
  • 路悦, 周翔宇, 张世周, 梁国强, 邢颖慧, 程德, 张艳宁
    录用日期: 2025-01-22
    传统机器学习算法只有当测试集和训练集同分布时才能取得较好的性能,无法增量地学习原训练集中没有的新类别或任务。持续学习使模型得以具备自适应学习的能力,在持续学习新任务的同时能够防止对旧任务的遗忘。当前持续学习仍面临着计算、存储开销以及性能稳定性等挑战。近年来预训练模型的发展为持续学习提供了新的研究方向,有望进一步提高性能表现。对现有基于预训练的持续学习方法进行归纳,按照防止遗忘的机制将其归类为基于提示池的方法、缓慢更新参数的方法、基于扩展主干网络分支的方法、基于参数正则化的方法、基于分类器设计的方法五类,并进一步按照阶段数、微调方式和是否利用语言模态对其归类,总结了各类方法的主要特点和各自优势。之后分析了持续学习方法总体存在的挑战,分别归纳了各类持续学习方法的适用场景和局限性,并在多个评测基准上对现有方法进行了实验比较,分析了各方法的性能差异。最后,对基于预训练的持续学习方法的研究趋势进行了展望。
  • 李瑞, 文敏华, 范寅 , 徐冬阳, 张战炳, 林新华
    录用日期: 2025-01-21
    求解复杂函数的全局最小值点在工程计算和人工智能领域都有广泛的应用,多起始点算法是一种常用的解决此问题的启发式算法,但该算法计算效率较低。为此提出一种基于拒绝采样技巧的新算法,改进了初始点选择的策略,既显著减小了计算时间和函数调用次数,也提高了全局收敛能力。传统多起始点算法采用独立均匀采样获得初始点,会出现起始点聚簇、部分区域无点、迭代效率低等问题。受到k-means++ 算法对初始聚类中心选择的启发,提出拒绝采样方法,通过在每轮采样中限制新采样点到已采样点之间的距离阈值,确保采样点在空间中分布更加匀称,并在数学理论上进行了证明。实验表明相比独立均匀采样,拒绝采样在提高优化效率上具有显著优势:在高维函数的求解中,目标函数调用次数最多减少28%;在存在多个全局最小值点问题中,最多减少41%,通过卡方检验在统计上验证了新算法可以显著提高计算效率。在与目前通用的优化算法比较时,此算法在收敛性和计算时间上也有显著优势。最后还使用并行计算加速此算法,在32核并行下效率高达90%,可以显著降低计算时间, 显示了良好的可扩展性。
  • 王佳鑫, 毛谦昂, 颜嘉麒, 印杰, 何源, 张祎
    录用日期: 2025-01-20
    区块链技术的迅速发展与加密货币的兴起不仅挑战了传统的金融和资产管理观念,也带来了一系列隐私与安全方面的问题。加密货币混币技术作为区块链隐私保护的主要手段,它旨在提升交易的匿名性并保障用户身份的隐私。然而,这种增强的匿名性也使得加密货币成为洗钱、盗窃、欺诈等犯罪活动的工具。因此,亟须全面审视加密货币混币服务的识别、检测与监管技术的研究,以支持执法机构并促进加密货币的安全合规。首先系统地梳理了混币服务的技术原理与机制分类,设计了一套通用的混币工具分类体系,详细探讨了混币服务可能引发的犯罪活动;接着重点讨论了基于人工规则、地址聚类、实体分类、异常交易检测和混币服务追溯五种混币监管技术的最新学术研究进展,并总结了现有工业界中与混币监管相关的工具和平台;最后提出了混币监管目前所面临的挑战,为未来的研究方向提供展望。
  • 李雷, 陈矛, 彭翕成
    录用日期: 2025-01-17
    几何证明题的自动生成是智能教育领域中的热点研究问题。现有方法通常以单个已有习题的原始几何关系为基础,利用几何自动推理技术,推理发现新的几何关系并合成新习题。由它们生成的习题所包含的几何关系全都可以基于输入习题的原始几何关系推理得到,缺乏新颖性。针对这一问题,本文提出了一种通过重组两个已有习题的几何关系以生成新习题的方法。通过引入了向量恒等式理论,为几何关系的表示以及判定源自不同习题的几何关系能否重组为新习题提供了理论依据,进而实现了从已有习题中自动提取几何关系,以及将源自不同习题的几何关系自动重组为新习题的算法。实验分析以及专家的评估结果表明,本文的方法在运行性能以及教育应用方面都具有可行性,并且在相同输入的情况下,本文的方法能够生成现有方法无法生成的更具新颖性的习题。
  • 张安勤, 丁志锋
    录用日期: 2025-01-17
    网络异常检测的目的在于及时识别并响应网络中的恶意活动和潜在威胁。大多数基于图嵌入的异常检测方法主要用于静态图上,这忽略了细粒度的时间信息,无法捕获动态网络行为的连续性,从而降低了网络异常检测的性能。为了提高动态网络异常检测的效率和准确性,提出了一个融合动态图嵌入和Transformer自编码器的网络异常检测框架DGATE-NAD。该方法利用时间游走的图嵌入技术捕获网络拓扑结构和细粒度的时间信息,结合了对比损失的Transformer自编码器来优化节点嵌入表示并捕获长期依赖和全局信息,增强了模型对动态网络的感知能力,能更好地捕捉动态网络中事件随时间的变化,识别网络中的恶意行为。在公开的网络安全领域数据集上进行了大量实验,结果表明,该方法在LANL数据集上的真阳率(TPR)为94.3%、假阳率(FPR)为5.7%、ROC曲线下面积(AUC)为98.3%。在 OpTC数据集上的真阳率(TPR)为99.9%、假阳率(FPR)为0.01%、ROC曲线下面积(AUC)为99.9%。异常检测结果优于多个先进的基准方法,说明该方法可以有效地学习动态网络中的拓扑和长短期时间依赖,从而识别网络中的异常行为。
  • 孟芸, 魏帆, 刘鑫一, 王威, 柴佳辉
    录用日期: 2025-01-17
    为了支持各类移动用户实时数据传输和稳定连接,采用空地协同超密集网络(Ultra Dense Network,UDN)是关键技术方案之一。在这种新型网络结构中,空中基站能够更好的支持用户移动性,而地面UDN能够实现更充分的频谱复用。然而,差异化的信道条件与覆盖范围使得干扰与频谱分配问题面临着新的挑战。因此,本文面向新型的空地协同UDN,针对该网络模型下移动场景中的干扰协调与频谱效率平衡问题,提出基于图神经网络的深度强化学习算法(Graph-DRL),动态调度频谱资源并提高算法的实时性。首先,利用图神经网络构建基站间邻小区的用户移动相关性模型,通过共享本小区的需求信息来加强合作,确定带宽复用度。其次,设计基于价值的学习网络,以网络中的平均吞吐量为优化目标,考虑用户移动性、用户密度和频谱复用度等因素,利用训练好的Q价值网络进行资源分配。最后,通过仿真验证所提出的算法相较于对比算法显著提高了高移动性用户和小区边缘用户的传输速率。
  • 张红, 杨俊译
    录用日期: 2025-01-17
    准确的交通流预测对城市交通至关重要,而交通流中的异常事件(恶劣天气、紧急道路状况等)导致的异常交通流,对现阶段交通流模型预测的准确性提出严峻挑战。现有的交通流预测模型大多难以有效捕捉交通流数据的复杂动态模式,且计算资源开销较大。为了解决这些问题,本文提出一种用于异常交通流预测的时空生成对抗聚类图卷积网络(CG-STGAN)。具体而言,构建了一个基于时空生成对抗网络的模型,其中,生成器用于捕捉并模拟正常交通流数据,鉴别器则对比生成数据与原始数据,判断其是否异常。通过对抗训练,生成器和鉴别器协同提升了异常交通流的检测能力。此外,提出了聚类图卷积网络,将交通图分解为多个子图,以限制图卷积的邻域扩张,从而降低内存使用并提高预测准确性。最后,结合图卷积门控循环单元挖掘交通流的短期时空特征,并通过长短期记忆模块学习交通流的长期依赖。实验结果表明,与基线模型相比,CG-STGAN在异常交通流预测方面表现出最佳性能。
  • 吴长瑞, 蒋景红, 徐建清
    录用日期: 2025-01-17
    矩阵转置是数字信号处理中的一项基础且关键操作,它在阵列信号处理、频谱分析、信号滤波和信号识别等等多个领域重都有广泛应用。传统的矩阵转置方法由于算法复杂、处理时间长、效率不高等问题,已经逐渐不能满足现代信号处理系统对高性能的需求。为了解决这些问题,本文提出了一种基于FPGA和DDR3 SDRAM的分块矩阵转置方法。这种方法的核心在于优化数据映射方式和访问模式,通过将转置过程中的效率瓶颈分散到读写两个环节,有效提高了转置效率。具体来说,该方法利用FPGA的高速并行处理能力,结合DDR3 SDRAM的高速存储特性,实现了对大型矩阵的快速转置。在DDR3 SDRAM中采用乒乓结构,即同时使用两块SDRAM,一块用于读取原矩阵数据,另一块用于写入转置后的数据,从而实现矩阵的实时流水转置。实际硬件平台上测试结果表明,该方法对于处理非2的整数次幂的M x N大型矩阵转置问题具有显著的效果。相比于分布式存储矩阵转置算法,这种方法不受矩阵规模的限制,能够适用于任意大型矩阵的转置,且易于实现,转置效率达到了90%。
  • 宋泉臻, 陈作钧, 秦品乐, 曾建潮
    录用日期: 2025-01-17
    现有的低光图像去噪方法除传统算法外,主要使用Transformer和CNN的特征提取和去噪机制,但仍然会面临两个问题:(1)基于局部窗口的自注意力机制未能充分捕捉图像中的非局部自相似性;(2)通道维度上的自注意力计算未充分利用图像的空间关联性。针对上述问题,在基于窗口划分的视觉Transformer方法上,提出了一种基于超像素引导的策略,可以自适应选择相关窗口进行全局交互。首先,设计了基于窗口交互的Top-N交叉注意力机制(Top-N Cross-channel Attention,TNCA),能够动态选择与目标图像窗口最相似的前N个窗口,并在通道维度上聚合图像窗口的信息,充分考虑了图像非局部自相似性;其次,通过超像素分割引导的方式,显著提升了窗口内局部特征的表达力,同时在通道维度上增强了空间特征的关联性;最后,构建了一个层次式的自适应交互超像素引导的Transformer去噪网络(Adaptive Interaction Superpixel-Guide Transformer,AISGFormer)。实验结果表明,AISGFormer在SIDD和DND真实图像数据集上的峰值信噪比分别为39.98dB和40.06dB,与其他先进网络相比提升了0.02~14.33dB和0.02dB~7.63dB,更能够交互局部与全局的信息和细节,自适应的利用自相似性抑制区域相似噪声。
  • 张悦辰, 葛洪伟, 李 婷
    录用日期: 2025-01-17
    近年来,多视图聚类逐渐成为研究领域的热点问题。多视图子空间聚类算法作为多视图聚类算法的一种,强调在多视图数据中发现潜在的子空间,从而基于子空间进行聚类。具有分组效应的多视图子空间聚类算法是一种多视图子空间聚类算法,主要思想为通过光滑正则化来学习每个视图的子空间表示,同时能够保证跨视图一致性,并最终学习到一致的聚类指标矩阵,处理后得出聚类结果。但是,该算法只考虑到单个视图的局部结构,仍存在一定局限性。为进一步挖掘视图间的多样性,本文提出了一种分组效应的多样性诱导多视图子空间聚类算法。它在保留每个视图局部结构的同时,利用希尔伯特-施密特独立准则来衡量视图间的多样性,并在此基础上使用交替方向最小化进行迭代,在迭代后获得的聚类指标矩阵基础上,进行k-均值聚类,得到最终的结果。在四个公共数据集上与几种先进算法的对比实验证明,该算法拥有参数敏感度低、收敛速度快等优势,且在不同数据集上都表现出了良好的性能。
  • 姜有泽, 刘向阳
    录用日期: 2025-01-13
    (河海大学数学学院,江苏 南京 211106) 摘 要:针对相同地理空间不同时相高分辨率遥感图像之间季节性、气候和光照等干扰因素,提出了基于多时相-ChangeFormer的遥感图像建筑物变化检测(CD)方法. 该方法使用多个不同时相的遥感图像,将最新时相遥感图像与变化前的多个遥感图像在特征差异提取上进行不同尺度下的融合,分别关注图像的综合语义特征,以及图像之间语义信息的细节. 该方法有助于减少季节、光照等因素发生变化时引起的误检;同时考虑变化前多个不同时相遥感图像,将其特征差异融合并引入损失函数作为正则化项,进一步消除非建筑变化以及建筑物非变化区域光照阴影带来的干扰,提高模型的泛化能力. 该研究构建了从农业土地耕地到建筑用地变化的三时相遥感图像数据集,实验结果表明:相较于目前最优的BIT方法,多时相-ChangeFormer方法在F1、IoU、Precision和Recall指标上分别提升了9.04%、9.87%、15.27%、3.4%,显著提高了检测精度,在细节信息处理方面明显优于经典的变化检测方法.
  • 于梦源, 刘向阳
    录用日期: 2025-01-13
    针对单一模态图像在全天候的船舶检测中易受光照、天气等环境影响,导致船舶检测精度低、漏检率高等问题,提出了一种融合可见光与红外图像信息的船舶检测方法VIF-RTDETR。该方法充分利用可见光图像丰富的细节和颜色信息以及红外图像在低光照环境下的稳定表现,构建了四通道输入模型;通过设计可见光与红外图像信息的融合模块VIF,实现了不同模态信息的互补融合,使得在检测网络中更加合理利用两种模态的信息;在主干Backbone特征提取网络中结合通道注意力,通过为通道动态分配不同的权重,以增强通道的特征表达能力来进一步优化特征提取能力;此外,为进一步提升船舶检测中船舶小目标的检测性能,设计了一种加权的边界框损失函数,使模型能够有效地关注不同尺寸目标的特征表达,提高模型在不同目标尺寸下的检测精度。实验结果表明,在船舶可见光和红外数据集上,该模型的检测精度 、 分别达到了78.3%、98.5%,相对于单一模态的可见光和红外模型分别提升了4.7、9.2个百分点;召回率 达到了85.2%,相对于单一模态模型分别提升了3.1、7.3个百分点;显著提高了船舶的检测精度和降低了漏检情况。
  • 李忠伟, 王鹏皓, 罗偲
    录用日期: 2025-01-10
    针对无人车在潮滩这类泥泞崎岖地形中无法高效抵达目标点的问题,提出了一种基于A*算法的改进算法Tidal-A*(TA*)为其规划最优路径。结合潮滩环境特点,提出使用路径土壤含水量(Soil Moisture Content, SMC)、路径高度起伏、路径长度共同衡量生成路径质量。针对环境信息难以直接获取的问题,使用无人机搭载高光谱传感器、激光雷达扫描目标区域,提出了结合光谱预处理与Pearson相关系数的组合降维方法训练SMC反演模型。针对传统A*算法只能依据路径长度搜索路径的问题,在为三条约束分别设计代价函数的基础上,提出了综合多约束的代价函数。针对传统A*算法无法依据需求改变路径的问题,设计系数组合控制代价函数中各约束占比,同时解决了不同约束间数量级不统一的问题。针对传统A*算法可能会忽略更优解的问题,改进启发函数的计算范围,使算法能以路径的冗余换取其它约束的优化。仿真结果表明,使用所训练模型的决定系数R2为0.784,相对分析误差RPD为2.151,相比直接反演分别提升了38%、33.8%;TA*算法生成的路径相比传统算法,路径长度、路径SMC、路径高度起伏最高分别减少3.4%、5.1%、18.7%。
  • 余滔, 董军
    录用日期: 2025-01-10
    在多智能体博弈仿真中,大语言模型的能力已经被广泛研究,但其在模糊任务目标或不确定性环境中引导多智能体合作的决策能力往往出现“失灵”现象。针对这一问题,提出了一种基于分布式贝叶斯推断的多层级协同决策框架。该框架基于分布式贝叶斯推断方法,集成了“决策—互评—监管”三大功能模块,利用多个大语言模型进行协同决策,并在空间囚徒困境博弈中进行了实验验证。实验结果表明,该框架有效克服了大语言模型在模糊任务环境下的决策瓶颈,成功促进了多智能体合作行为的涌现。此外,通过对不同实验场景下模型决策能力的量化评估,发现模型的决策误差与模型规模不呈线性关系。在模糊任务指令下,LLAMA3(70B)模型的决策误差较LLAMA3(8B)模型高出16.6%,较LLAMA2(7B)模型高出7.2%,表明在更复杂环境中,单纯依赖模型规模的扩大未能显著提升决策性能。相反,大语言模型协同决策在提升决策一致性和有效性方面显示出显著优势。这些结果揭示了多模型协同在复杂决策环境中的关键作用,并为未来在不确定性任务下的智能体系统设计提供了重要参考。
  • 王淳, 陈德军
    录用日期: 2025-01-10
    针对以往方法在汉字多种错误类型识别及结构相似性度量方面的不足,本文提出了一种汉字LCCG图的匹配方法,并创新性地引入了基于笔画相对位置和拓扑结构的编码方式。首先,详细阐述了汉字LCCG图的构建过程,定义了节点与边的相似度计算方式;然后,针对多种错误类型,明确了每种编辑操作的适用场景及具体代价设定;最后,结合最大最小蚁群系统算法(MMAS)求解最优匹配路径,实现了高效的图匹配。实验结果表明,该方法能够准确识别多种汉字错误类型,在准确率、匹配代价和运行时间上均优于现有方法。相比传统方法,本文方法不仅显著提升了识别效率,还通过精确的编辑代价定义和创新的笔画及结构相似性计算方法,显著增强了汉字笔画匹配的准确性及结构相似性的计算能力,展现出较高的应用价值。
  • 王群, 李馥娟, 马卓
    录用日期: 2025-01-07
    组成BGP的AS(自治系统)之间存在不同的利益关系和路由策略,当实际的路由宣告超出预期范围时,可能产生路由泄露,从而导致因路由重定向引起的网络安全事件。然而,在BGP路由信息传播中,AS会无条件信任和接受邻居AS对外宣告的路由,而每个AS自主配置本地策略且信息保密,增加了路由策略验证的难度,成为BGP安全领域一直倍受关注且尚未有效解决的难题。区块链以其独有的去中心化、可溯源、防篡改、开放透明等特征,可为AS间的数字资源认证与信任建立提供基础设施保障,有望成为应对路由泄露威胁的关键技术。本文首先明确界定了邻居AS之间,以及GR模型与BGP路由策略之间的关系,明晰了导致路由泄露的根源和防御挑战;其次,梳理了针对路由泄露的传统解决方案的研究脉络,重点分析了其优缺点以及尚未有效解决的问题;然后,提出了区块链技术在防御BGP路由泄露中的优势及技术思路,探讨了典型解决方案的实现原理和应用特点;最后,在阐述存在问题和挑战的基础上,对下一步研究进行了展望。
  • 张蓬鹤, 杨艺宁, 王璧成, 易云齐, 唐忠瑞, 刘 敏
    录用日期: 2025-01-07
    目前用户侧智能电表的维护与检测主要依赖专业人员上门排查,存在现场检验效率低、周期检定任务繁重、严重依赖人工经验等问题。文中基于电网巡检图片构建了电表异常图像数据集,针对电表图像背景复杂、目标尺寸不一、异常接线隐蔽遮挡等问题,提出了一种基于D-DADA数据增广与DBE-YOLO网络的电表异常检测方法。首先,提出改进的双分支特征增强网络DBE-YOLO(Dual-Branch Feature Enhancement YOLO),通过引入级联空洞卷积增强模型对全局上下文信息与多尺度特征的提取,设计双分支聚合结构弥补了原始模型感受野受限、卷积特征捕捉模式固定的缺陷;其次,提出一种多样性感知的可微分自动数据增广算法D-DADA(Diversity-Driven Differentiable Automatic Data Augmentation),设计了搜索策略多样性约束条件促进对更广泛数据增强策略的自动搜索,从而帮助模型学习到不同场景、角度、光照等情况下的检测目标特征和模式,解决数据类内差异较大导致的模型识别性能不足等问题。实验结果表明,改进后的YOLOv8模型对八类电表异常的平均检测精度可达到79.6%,相对于改进前提高了3.4%。
  • 蔡江河, 陈飞, 姜凡, 程航, 王美清
    录用日期: 2025-01-07
    颜色图像引导的深度图超分辨率(GDSR)旨在利用同一场景下高分辨率(HR)彩色图像提供的引导信息,将低分辨率(LR)深度图重建为高分辨率深度图。尽管基于空间域的学习方法可以有效提高深度图的整体重建质量,但在从低分辨率深度图进行重建时,仍然面临“边缘结构模糊”的问题。为了解决该问题,提出了梯度频率引导多阶段整合的深度图重建网络(GFNet),利用颜色图像的梯度先验和频率信息来增强深度边缘结构细节的重建。首先,设计了一个梯度特征提取模块,结合了RGB图像的梯度先验知识来优化LR深度图的梯度结构。其次,设计了一个空间频率双路引导模块,将RGB图像中精确的高频成分传递到LR深度图中,从而引导深度图丢失的高频信息重建。最后,采用一种新颖的隐式神经函数来提高深度图的分辨率。实验结果表明,在8倍缩放因子的情况下,GFNet在数据集NYUv2、Middlebury以及真实场景数据集RGB-D-D上RMSE指标分别达到了2.48cm、1.62cm、2.57cm,相比于结构更复杂的模型GeoDSR,分别提升了0.14cm、0.06cm、 0.12cm,并在边缘结构细节方面优于对比方法,证明了GFNet模型的有效性。
  • 火久元, 李昕, 常琛, 张耀南
    录用日期: 2025-01-03
    滚动轴承是机械设备中的常用部件,传统方法难以对多噪声环境下具有众多复杂特征的信号进行分类,并且常在一维数据通过经典深度学习模型进行故障诊断,无法对复杂特征进行充分提取。因此,提出一种基于ACNN-LFSwin Transformer双通道故障诊断方法分别在一维数据和二维图像上进行故障诊断。首先,将原始信号分别进行基于完全自适应指数模型分解(CEEMDAN)与STFT处理,获取模态分量(IMF)与二维图像;接着,在通道一中将CEEMDAN分解后的IMF放入基于注意力机制的卷积神经网络(ACNN)中进行特征提取;然后,在通道二中将轴承数据构成的二维图像作为局部特征提取的Swin Transformer网络(LFSwin Transformer)的输入,进行图像特征提取。最后,将两通道特征进行串联融合,进行故障诊断。ACNN运用注意力机制对信号特征进行自动权重分配,以强调关键特征;LFSwin Transformer模型在传统Swin Transformer基础上进行向量转换,将输入向量转换为图像并对其进行卷积操作,使模型在故障局部特征提取方面更具优势。所提方法分别采用CWRU数据集和帕德博恩数据集进行实验验证,实验结果表明,故障诊断准确率达97%以上。说明所提出方法不仅能对多种故障进行精确诊断,还可以有效避免复杂噪声环境的干扰。
  • 曾安, 郑嘉裕, 潘丹, 赵靖亮, 黄幸青
    录用日期: 2025-01-03
    主动脉夹层(AD)中心线的提取在AD疾病的定量诊断和治疗中具有极其重要的临床意义。然而,由于AD的解剖结构复杂及血管形态和病变区域多样化等因素,AD中心线的提取任务非常具有挑战性,且目前对这一任务的定量评估研究仍然较为有限。当前多数方法在提取中心线时,需要进行预先分割、全卷扫描操作或计算距离图,随后使用最小路径或骨架算法进行提取。然而,AD腔体难以完整分割,上述方法所得中心线易存在断裂。为此,本文提出了一种基于深度Q网络的中心线跟踪算法,并设计了一个注意力嵌入的空洞残差模块,将其与通道注意力机制结合,能够更有效地提取血管特征并自动追踪复杂病变血管的中心线。此外,还提出了一种改进的奖励函数,引导智能体准确地追踪中心线。在公开数据集上的实验结果表明,提出的方法在中心线重叠度指标上全面优于对比算法。该方法提取一例数据的中心线的平均速度为5s,具有较好的临床应用潜力。
  • 许旻辰, 屈丹, 司念文, 彭思思, 陈雅淇
    录用日期: 2025-01-03
    实现及时有效的虚假信息检测有助于遏止其传播,降低社会危害。目前已有大量深度学习方法被用于虚假信息检测,总结现有研究的检测原理和检测范式对于明确技术优化的方向至关重要。因此结合虚假信息检测的原理和实现路径对现有研究做了全面综述,并首次对大语言模型在该领域的应用进行对比总结。首先,介绍了虚假信息检测任务的相关概念,并汇总分析了常用虚假信息检测数据集的数据结构;然后,根据检测原理和实现方式,分别介绍了如何通过语义特征表示、辅助任务设计、内部知识推断和事实核查检测文本和多模态虚假信息,将其细化为十个子类别,并总结分析各个子类别检测方法的潜在特性;最后,对基于深度神经网络和大语言模型的虚假信息检测范式进行总结,对比两种检测范式的代表性方法在7个虚假信息检测数据集中的检测性能,并分析大语言模型检测虚假信息的优势和局限性,展望大语言模型对虚假信息检测领域带来的机遇与挑战,为后续研究提供参考。
  • 吴沛颖, 李晓慧, 王俊峰
    录用日期: 2025-01-03
    命令与控制(Command and Control,C2)通信在现代高级持续性威胁(Advanced Persistent Threat,APT)中扮演着核心角色,是APT实现长期潜伏和持续控制的关键通信纽带。C2流量检测对于防御APT攻击、保护网络安全至关重要。然而,现有的C2流量检测方法主要基于传统机器学习与深度学习,其中特征工程依赖于专家经验,主观性强且极易产生遗漏,对快速演变的攻击形态和流量模式适应性较差;而传统深度学习模型对深层复杂特征捕捉能力较差,同时对标注数据和训练资源具有较强依赖。为解决以上问题,本文提出一种基于Transformer双向编码表示的C2流量检测方法(C2BT),不同于传统基于特征工程的检测方法,本方法利用双向编码器表示技术(Bidirectional Encoder Representations from Transformers,BERT)大模型自动学习并捕获网络远程控制流量上下文深层特征,进一步引入单独训练的Transformer解码器进行重构和误差计算,以评估编码器的表现质量,并将重构误差融入编码器后续优化训练过程,进一步提升模型的检测效果和鲁棒性。通过在多个不同C2流量数据集上的广泛实验,本方法展现出卓越的性能和强大的泛化能力,准确率、精确率、F1分数分别达98.47%、95.82%和95.91%,并在全新的数据集上保持稳定的效果,证明了本方法在C2流量检测中的有效性。此外,通过引入解码器重构误差评估机制,验证编码器的鲁棒性,进一步提升了检测结果的有效性,为构建更高效的网络安全检测防御体系提供了新的技术路径。
  • 刘海军, 付晓东
    录用日期: 2025-01-03
    现实世界的数据通常遵循长尾分布,假设全局数据分布平衡的联邦学习方法难以对长尾数据中的尾类数据进行准确分类。为此,现有研究为全局模型重新训练一个平衡的分类器来缓解长尾数据带来的影响,但未考虑平衡模型的特征提取器和如何让模型的特征提取器学习高质量的图像特征,导致全局模型性能不佳。因而为了使模型在特征学习阶段没有偏见地学习高质量的图像特征,文中提出了一种结合旋转自监督和对比语言-图像预训练(Contrastive Language-Image Pre-training,CLIP)指导的联邦学习,通过使用旋转自监督学习来指导本地客户端地训练,减少长尾数据对客户端模型造成的影响并使模型更高质量地学习图像中的特征,同时,利用CLIP对模型的正常训练以及旋转后的图片进行指导,将CLIP中丰富的知识转移到客户端模型中,进一步提升特征提取器的性能。在不同长尾分布下的CIFAR-10数据集和CIFAR-100数据集上对该方法进行了测试,并与其他联邦学习方法进行对比,实验结果表明,与现有方法相比,本文的方法可将全局模型的分类准确率提升2.35%到4.72%。
  • 董良才, 岳涵词 , 王维娟
    录用日期: 2024-12-31
    面对日益增长的集装箱吞吐量,如何高效地管理和调度码头资源,成为了提升码头竞争力的关键所在。以自动化集装箱码头堆场为研究对象,针对出口箱的箱位分配和场桥调度问题,提出了一种基于深度强化学习的优化方法。对集装箱码头堆场作业系统进行了全面分析,构建了一个多目标优化模型,该模型以减少场桥作业时间、内集卡等待时间和箱区翻箱量为主要目标,同时兼顾场桥间的安全距离和作业量均衡等约束条件。为了解决模型求解的复杂性,提出了基于深度强化学习的Actor-Critic算法。设计了不同规模的算例,通过与遗传算法和CPLEX精确解的对比分析,展示了Actor-Critic算法在求解速度和解的质量上的优势。实验结果表明,该算法在小规模问题上能够快速准确地求解,在大规模问题上也能获得近似最优解,尤其在大规模问题求解上,相较于遗传算法展现了显著的优越性。通过对比实验,进一步探讨了场桥数量和分区平衡混堆策略对优化结果的影响。实验结果表明,分区平衡混堆策略在均衡场桥作业量、减少场桥空闲时间方面优于传统堆存策略。
  • 王晓川, 刘青青, 王晨, 牟恒辰, 廖要明, 刘瑞军
    录用日期: 2024-12-31
    目前,关于降水空间插值的深度学习方法仅依赖站点之间的位置关系,忽略了区域内特征的有效表示以及复杂特征依赖关系,尤其是降水与高度之间的关系考虑不足。为此,提出地理先验嵌入的降水空间插值方法GeoPriFormer。该方法以Transformer作为主骨网络,通过引入地理先验数据来增强特征表示能力,从而提高降雨空间插值的精度和可靠性。一方面引入高程-多头注意力子模块以提高对复杂地形影响的理解和适应能力;另一方面,使用拉普拉斯方法来学习地理坐标的上下文感知向量编码,以增强模型对地点关系和区域特性的理解。最终形成一个嵌入地理先验的特征表示。在河南、京津冀和BW数据集上进行对比实验,结果表明,GeoPriFormer均优于基线模型。以京津冀数据集为例,RMSE降低1.6%,MAE降低5.1%,NSE提升1.56%,优于当前主流方法。
  • 王伟成, 万书振, 张晓磷, 程泽敏
    录用日期: 2024-12-31
    医疗结构化数据在现实医疗体系中应用广泛,由于其特殊性,通常具有多源异构、大量潜在候选特征等性质,表现出不规则的数据模式,对神经网络的特征处理过程提出了挑战。因此,提出了一种类Transformer架构的特征嵌入级循环定向特征处理网络RDFP-NET(Recurrent directed feature processing network),它拥有良好特征组织模式,直接对原始采集的医疗数据进行端到端处理,能够充分利用有效信息并摒弃不利特征的负面影响,并通过循环结构关联上下文特征信息,进一步改善网络任务性能。具体包括(1)非线性嵌入特征嵌入方法。(2)一种排序特征交互模块。通过计算各特征信息值和特定掩码操作,在普通注意力机制中纳入归纳偏差,实现不同贡献值特征间的定向信息流动和特征交互。(3)一种过滤特征选择模块,通过对ELU激活函数的调整,以类似过滤器的方式对冗余特征进行舍弃。(4)包括两种模块的循环结构,实现良好的数据拟合,上下文特征信息流动并逐步处理特征的不规则模式。RDFP-NET在包含2种不同目标任务的5个数据集取得了2.2最优平均排名和0.75排名标准差,显示出优秀的任务性能及稳定性,能够为医疗工作者带来更有效的临床决策辅助信息。
  • 周运梁, 何源夏, 冯子麒, 郑乃弋, 徐晓刚, 徐冠雷, 陈少辉
    录用日期: 2024-12-30
    血压作为评估心血管健康的关键指标,在日常居家血压监测中,除传统的血压仪外,目前研究人员采用的主流方式仍为使用多个生理信号结合等一些非端到端测量方式,这些方式存在的缺点是采集多个生理信号较为困难且成本昂贵,另外难以保持采集信号的时间同步性。另一种现存的利用人脸视频预测血压,即端到端的方式,这种方式在一定程度上提拓宽了适用场景,但大多方法在感兴趣区域的选取、预测准确度等方面仍存在问题。为解决这些问题,提出一种融合多尺度注意力结构在可见光场景下远程血压预测方法。首先对每个人脸视频候选窗口进行分类和回归提取有效皮肤区域,并利用基于光流的技术从连续的有效人脸区域中提取远程光学脉动(Remote Photoplethysmography)信号,并将完整的rPPG信号通过小波变换滤波,去趋势等方式提取稳健rPPG信号。其次提出的EBP-Net引入并改进一种新的高效多尺度注意力模块(EMA)和多尺度融合模块(MSF),不仅能够在不降低通道维度的情况下增强深度视觉表示的特征,而且可以通过多尺度特征的捕捉和层次化表达,显著提升模型对生理信号的理解能力和预测能力。实验结果显示,收缩压在两个数据集上的表现在已达到英国高血压协会(BHS)C级标准,同时,舒张压达到B级标准,收缩压和舒张压的MAE分别达到6.82和5.17,低于近期同等研究结果。与其他模型相比,本文方法更具有泛化能力和更低的误差,为人脸血压水平检测提供有效方法和建议。
  • 冯伟毅, 任雪婷, 王盈森, 王月莹, 赵涓涓, 强彦, 孔晓梅 , 赵慧兰
    录用日期: 2024-12-30
    由于病变分期标准存在模糊性,不同诊断专家可能会得出不同的诊断结果,这导致了实例标签的噪声,即标签准确性受到观察者差异的影响。深度学习依赖于数据的质量,而这些带有噪声标签的数据往往会导致模型的性能下降。为应对尘肺病分期中噪声标签带来的挑战,提出了一种双分支动态样本选择策略。该方法通过在模型的关键层引入蒙特卡洛随机丢弃,在关键层进行多次前向传播进行不确定性估计预测结果,同时将模型的预测概率与混合高斯模型相结合洞察样本的特征空间分布,最终实现可选择的不确定性估计分支和混合高斯模型特征分布预测分支。然后为每一个分支中每一个样本数据设立一个阈值,阈值随着模型训练的推进动量更新,最终依据该动态样本选择模块进行样本划分和差异化约束,减小噪声样本对模型的负面影响。在临床收集的尘肺病X光数据集上进行评估,实验结果表明,该方法在5%、10%、20%以及40%实例噪声比下的性能显著优于同类方法,证明了其在噪声标签学习中的有效性和鲁棒性。
  • 张春昊, 解滨, 张佳豪
    录用日期: 2024-12-26
    时间序列数据异常检测在金融、医疗、工业监控等领域具有重要意义,然而,传统方法在处理时间序列数据时常常面临特征提取能力有限、泛化能力差且实时性不佳等挑战,甚至忽视了数据之间的时序关系。为充分考虑数据的时间依赖性,进一步提高对时间序列数据异常检测的能力,提出了一种无监督时间序列数据异常检测方法 -VAE-BiLSTM。首先,在重新设计VAE模块网络结构使其更适合数据重构进行异常检测的基础上通过引入超参数 控制证据下界中KL(Kullback-Leibler Divergence)散度项的权重,从而增强编码器模块对于潜在空间的解耦性和表达能力,获取更有力的数据潜在表示。然后,采用长短期记忆网络模块估计潜在表示的长期相关性,捕捉其前向和后向的依赖关系,并对其进行时序预测。最后,通过对预测结果平均融合和解码器重构进而计算重构误差,通过网格搜索最优阈值来检测时序异常。实验结果表明,该方法在多个公开时间序列数据集上具有优越的异常检测性能,能够有效提取时间相关的复杂数据特征,实现高效计算和实时异常检测,识别异常点和异常区域,提高了检测精度和鲁棒性,减少了误报和漏报。
  • 武东辉, 王金凤, 仇森, 刘国志
    录用日期: 2024-12-25
    手语识别近年来受到广泛关注,但现有手语识别模型存在训练时间长,计算成本大的问题。为此,本研究基于穿戴式数据手套提出一种融合注意力机制(Attention)的首层宽卷积核扩展深度卷积神经网络(EWDCNN)和双向长短期记忆网络(BiLSTM)的混合深度学习方法。首先通过加宽首层卷积层来减少模型参数量,提升计算速度,再通过扩展WDCNN卷积层深度来提高模型自动提取手语特征的能力。其次引入BiLSTM作为时间建模器捕捉手语序列数据的时间动态信息,有效处理传感器数据中的时序关系。最后利用Attention机制通过映射加权和学习参数矩阵赋予BiLSTM隐含状态不同权重,通过计算每个时间段的注意力权重,模型自动选择与手势动作相关的关键时间段。本研究以STM32F103为主控模块,采用MPU6050与Flex4.5传感器为核心搭建数据手套手语采集平台。选取16种动态手语动作用于构建GR-Dataset数据训练模型。同一实验条件下,相对于CLT-net、CNN-GRU、CLA-net、CNN-GRU-ATT模型,EWBiLSTM-ATT识别率为99.40%,分别提升了10.36%、8.41%、3.87%、3.05%。训练总时间分别为CLT-net、CNN-GRU、CLA-net、CNN-GRU-ATT对比模型的0.57、0.61、0.55、0.56倍。
  • 杨家豪, 王雷
    录用日期: 2024-12-23
    现有的个体关注目标检测主要是利用面部信息进行,难以应对因人脸部分遮挡、人脸模糊或隐私保护等情况导致面部精细信息缺失的场景,并且忽视时间信息也会一定程度上影响方法在视频任务中的效果。提出基于多特征融合的时空推理网络,利用卷积神经网络分别提取个体的头部外观与面部信息、个体姿态信息以及相关场景信息的关键特征,通过空间推理编码器的注意力机制和自定义的模型训练策略,学习不同特征的重要程度并降低对单个特征的过分依赖,实现空间特征加权融合。采用卷积长短时记忆网络整合视频帧序列中的时空信息,用于视频任务中的个体关注目标检测工作。实验结果表明,在GazeFollow数据集和VideoAttentionTarget数据集上反映方法整体性能的AUC值分别达到了0.936和0.902。与现有最好的研究方法相比,该方法在相同两个数据集上的AUC值分别提高了1.7和3.2个百分点,在个体关注目标检测任务中具有更好的准确性和鲁棒性,能用于更复杂的现实场景。
  • 胡静丹, 李波, 杨静
    录用日期: 2024-12-23
    数学应用题问题(Math Word Problem,MWP)的计算机自动求解是当前学术界的研究热点。尽管现有研究已取得显著进展,但多数研究将MWP中的数值替换为占位符并作为普通文本进行处理,忽略了数值语义对于MWP求解的重要性。因此,本文基于“编码器—解码器”的通用架构提出了一种增强数值表示的MWP求解模型。模型引入了两项新颖的设计来增强数值编码能力并提升MWP的求解性能:(1)利用图卷积神经网络来显示建模数值之间以及数值与上下文文本之间的语义关系;(2)引入辅助学习任务来指导模型充分捕捉与任务相关的数值语义,显著增强编码器的数值建模能力。在常用的MWP数据集Math23K和MAWPS上的实验证明,本文所提出的模型充分利用到了数值语义,模型整体性能优于现有的主流MWP求解模型。
  • 王淑芸, 马腾飞, 夏洁, 杨志勇
    录用日期: 2024-12-23
    中小学生课后常受游戏、短视频等诱惑,自制力尚未成熟,自主学习易分心。家长难以全时监督,导致学习成效不佳。为了提升孩子学习效率,减轻家长焦虑,需要高可靠低入侵的学习状态监测系统。现有学习状态监测方法中,基于计算机视觉和穿戴设备的方法存在依赖设备和环境、影响用户舒适度或侵犯个人隐私等弊端。针对上述问题,以不同学习状态下的微小动作为识别目标,将学习行为分为打游戏、阅读、写字、休息四种状态,提出一种基于WiFi信道状态信息(CSI)的非接触式学习状态监测方法——Wi-LSM。该方法由WiFi网卡采集CSI原始数据后,首先利用相位校准与线性插值算法预处理数据,以消除原始相位偏移并填补缺失数据包;然后提取滤波降噪后幅值的时频域信息,再结合相位差共同形成识别特征;最后将感知特征输入到构建的多层机制卷积神经网络模型SE_BN_CNN中,实现不同学习状态的分类。实验结果与分析表明,该方法在室内不同环境下最佳识别准确率达到96%,验证了系统在学习状态监测方面的有效性。
  • 王硕, 李克, 李泽霖
    录用日期: 2024-12-23
    实体对齐是对不同来源的知识图谱进行知识融合时的一个关键步骤,现有方法通常只考虑两两图谱间的实体对齐,而很多实际应用场景中需要对多个图谱进行融合。在解决多图谱实体对齐问题时现有的方法往往只能转化为多个图谱对的对齐任务,忽略了多个图谱的等价实体间内在联系和约束,从而影响了最终的对齐性能。针对上述问题,在系统地分析了现有实体对齐优化方法的基础上,利用等价实体在多个图谱间的传递性约束特征提出了一种面向多知识图谱融合的实体对齐优化方法,并通过与现有的两图谱间实体对齐方法相结合提出一种通用的多图谱实体对齐优化框架。首先根据每个知识图谱中各实体的嵌入表示计算得到各图谱对的实体预对齐矩阵,然后经过多图谱间对齐优化方法修正预对齐矩阵得到最终结果。其中对齐优化方法融合了双向归一化、延迟接受算法、关系实体感知调整算法和传递性约束优化算法。在DBP15K、FB15K和YAGO15K等多个数据集上的实验表明,和不采用多图谱间对齐优化的基线模型相比性能均得到显著提升,其中Hit@1和Hit@10指标分别最大可提升18.8%和18.05%。
  • 王合庆, 魏杰, 景红雨, 宋晖, 徐波
    录用日期: 2024-12-23
    大语言模型(Large Language Model, LLM)在对话、推理和知识保留能力方面展现了显著进步,但在处理电力领域知识密集型任务时仍面临事实准确性不足、知识更新难题以及高质量领域数据集匮乏的问题。本研究旨在解决这些挑战,通过引入一种改进的检索增强生成(Retrieval Augmented Generation, RAG)策略,该策略融合了混合检索策略和经过微调的生成模型,提供了更高效的知识捕获和更新能力。基于对现有方法的深入分析,提出了Meta-RAG(Metadata-Driven Retrieval Augmented Generation)新框架,专门为电力领域的知识问答任务设计。Meta-RAG框架包含数据准备、模型微调和检索推理三个阶段。数据准备阶段包括文档转换、元信息抽取与增强及文档解析模块,借助元信息的提取与增强,确保了电力规范文档的高效索引和结构化处理。特别构建了电力领域的EleQA(Electricity Question Answering)数据集,这是一个包含19560个问答对的电力规范问答数据集。模型微调阶段通过多问题生成、思维链提示生成和指令微调数据集构建模块,优化了模型在特定电力问答任务上的推理能力。检索推理阶段则采用混合编码和重排序策略,结合检索和生成模块,进一步提高了答案的准确性和合理性。通过一系列实验,Meta-RAG的有效性得到验证。与Self-RAG、Corrective-RAG、Adaptive-RAG和RA-ISF等基线模型相比,Meta-RAG展示了更高的回答准确率和检索命中率。其中,基于Qwen1.5-14B-Chat模型的Meta-RAG达到了整体准确率80.43%,高于其他方法。消融实验和文档召回实验结果表明文档检索对框架流程影响最大,失去检索能力整体准确率下降了29.28%。
  • 刘健, 章步镐, 方匡弛, 刘宣锋, 孙国道, 梁荣华, 梁浩然
    录用日期: 2024-12-23
    随着全球数据规模的不断增大,如何以低成本的方式有效提升数据的访问性能是存储系统面临的一项重要挑战,使用低延迟、高带宽的SSD和低成本、高存储密度的SMR来构建缓存系统成为了一种有效的解决方案。但由于SMR固有的机械运动和多磁道堆叠的特性,其写性能特别是随机写性能较差,SSD中的脏数据频繁写回SMR所导致的大量RMW操作可能会引起严重的长尾延迟现象。本文基于SSD-SMR混合存储架构提出了一种结合强化学习Q-Learning算法的缓存替换优化策略,通过学习SMR设备的I/O负载状况与延迟之间的经验知识来控制对SMR的写入,当SMR负载较大时,通过控制缓存中脏数据的逐出来减少SMR因回写而产生大量的读-合并-写操作,从而优化系统在不同负载下的尾部延迟开销。本文将Q-Learning算法与传统的基于数据流行度的缓存算法LRU以及当前先进的基于SMR感知的缓存算法SAC进行结合,使用真实企业Trace和YCSB生成的模拟Trace进行测试的实验结果表明,本文提出的方法能够有效提升现有缓存算法的性能,显著降低平均延迟和尾部延迟57.06%和87.49%。
  • 余正涛, 孙资钦, 张勇丙, 高盛祥, 黄于欣, 谭凯文
    录用日期: 2024-12-20
    序列推荐利用用户历史序列行为建模用户兴趣并进行内容推荐,常被用于新闻、广告和电子商务等领域。基于对比学习的自监督序列推荐是当前研究热点,然而,真实的序列数据具有动态不确定,且对比学习中存在采样偏移问题,限制了推荐的性能。为缓解这些问题,本文提出了基于随机自注意力和动量对比学习的自监督序列推荐方法,其中随机自注意力用于缓解序列动态不确定问题,动量对比学习用于缓解对比学习中存在采样偏移问题。为验证模型性能,本文在Beauty、Office、Yelp和Toys等四个常用数据集上进行了实验。结果表明该方法在HR@K、NDCG@K等多个指标上均优于其他基线模型,展示了该方法在准确性和鲁棒性方面的显著提升。
  • 杨欣怡, 何小海, 滕奇志, 陈洪刚, 卿粼波 , 吴晓红
    录用日期: 2024-12-20
    提出了一种基于语义联合的跨模态命名实体识别(NER)框架,旨在解决传统单模态NER方法在处理多模态信息时的局限性。提出的框架不同于传统的预训练语言模型加条件随机场(CRF)的方法,而是将图片信息引入命名实体识别任务,并结合了图片所表达的语义。首先介绍了命名实体识别任务的研究现状,然后详细说明了提出的跨模态命名实体识别框架的两个核心模块,一是图像文本语义联合模块,二是双向跨模态匹配模块。具体而言,图像文本语义联合模块根据文本对应图像所体现的语义生成文字表达,并与原有的文本信息联合形成新的文本序列,双向跨模态匹配模块利用新生成的文本序列与图像进行跨模态匹配,这种联合图像语义和文本之后再进行跨模态匹配的方法不仅可以提高命名实体识别的准确性,还能够丰富命名实体的语义表示,最后通过在标准数据集(Twitter-2015、Twitter-2017)上进行对比实验和消融实验验证,证明了提出的框架在命名实体识别任务中的有效性和优越性,为对包含多模态信息的数据进行命名实体识别提供了新的思路和方法。
  • 杨兴宇, 周骅, 田有亮, 杨科迪
    录用日期: 2024-12-20
    本文针对元宇宙环境中的身份动态认证与恶意用户身份追溯问题,提出了一种基于软硬协同技术和签密算法的元宇宙身份安全认证方案。研究首先设计了一种结合硬件特性和国密算法的可追溯身份认证协议,以保护用户匿名性并实现身份的分布式认证与追踪。接着,利用现场可编程门阵列(FPGA)构建的软硬协同平台对签密过程进行优化,提高了签密效率。最终,通过构建的身份认证协议验证平台对性能消耗进行了分析。实验结果显示,该方案优化后能够显著提升签密计算性能,相较于中央处理器(CPU),性能提升达到了13.6倍。本研究为元宇宙环境中的身份认证提供了一种高效、安全的解决方案。
  • 胡康源, 郭涛, 穆楠
    录用日期: 2024-12-20
    卷积网络在文物修复中由于卷积核的局部感受野对于全局上下文和复杂结构的理解较弱,又因卷积操作的平移不变性对文物表面复杂的几何形态处理不充分,在进行文图图像修复时容易出现无关结构和伪影等问题。具有自注意力机制的Transformer模型在处理文物图像的细节和局部特征时,对特定区域的细节关注不足,难以获取足够的深层特征,从而影响修复的精度和细腻度,对图像的远距离语义获取不充分,导致修复图像的直观视觉性不足。本文提出了一种基于SwinTransformer的文物图像修复模型(Dynamic mask on SwinTransformer,DMSWT)。该模型通过对网络中的自注意力模块进行多项改进,以优化网络结构。首先是删除层归一化,且用残差连接替换全连接层,提高网络的深层特征提取能力;其次是引入动态掩膜机制,缓解修复大规模缺失图像时默认采样造成的有效像素减少的问题;最后改进损失函数,注重直观性感受,提高修复图像的直观视觉性。通过在不同场景下修复的实验结果表明,DMSWT模型能够学习到更多的结构先验信息并生成符合现实直觉的修复图像,且在定量评估下指标有明显提高。
  • 张想, 彭力
    录用日期: 2024-12-19
    自动驾驶场景理解是自动驾驶技术的关键环节之一,地图感知和拓扑关系推理是场景理解的重要组成部分。地图感知任务主要包括道路元素感知和交通元素感知,拓扑关系推理在地图感知的基础上构建感知结果间的拓扑关系。然而,在传感器受到遮挡或感知范围超过传感器范围时,传统方法的地图感知性能会受到影响。同时,由于拓扑关系推理依赖于地图感知结果,地图感知误差会进一步影响拓扑关系推理的准确性。为此,提出了一种融合标精地图先验的地图感知不确定性建模方法,并基于地图感知不确定性实现鲁棒的拓扑关系推理。首先,通过引入标精地图先验信息,有效提升了遮挡场景下的地图感知性能。随后,使用Laplace分布建模地图感知结果,实现了对地图感知不确定性的建模。最后,基于地图感知结果及其不确定性,提出了一种基于概率的拓扑关系推理方法,有效提升了拓扑关系构建精度。在公开数据集OpenLaneV2上进行大量实验,结果表明,所提方法在地图感知和拓扑关系推理任务上性能均优于传统方法。
  • 林海, 王和钰, 曹越, 王丽园, 王世杰
    录用日期: 2024-12-19
    边缘智能面临计算实时性、资源受限等挑战,且不同设备间差异较大。多数研究通过模型压缩设计轻量化网络,以满足边缘场景下的快速推理需求。然而过度压缩导致精度下降的同时并不能缩短推理延时,从而影响边缘智能的性能。为了满足实时需求与计算资源约束的条件下提高模型精度,本文基于神经网络架构搜索,提出了面向硬件感知的边缘智能框架:LuffyNet框架。框架通过查找表估算模型推理性能,并以计算时延和设备内存资源为约束,实现对边缘设备的硬件感知。为了得出符合时延约束且匹配边缘设备计算资源的高精度网络,LuffyNet框架以模型精度、推理时延和网络大小为优化目标,通过梯度下降完成目标网络模型的构建。为了缩减架构搜索的时间,LuffyNet框架基于Best Optimize策略与Worst Optimize策略,减少搜索过程中的无效计算,降低搜索的时间成本和计算开销。对比实验将3个LuffyNet网络和4个先进模型的性能进行对比,结果表明,LuffyNet-A以1.69ms延迟实现66.50%的Top-1精度,比ResNet50快近5倍,且大小仅6.58MB。LuffyNet-B与LuffyNet-C在2.65ms延迟内实现超过73%的Top-1精度,优于ResNet18、ResNet50、DenseNet121与DenseNet169等先进模型的精度与推理速度表现。消融实验进一步验证了基于Best Optimize策略与Worst Optimize策略的LuffyNet框架不仅能找到匹配边缘设备的网络,而且能将搜索时间缩短接近25%。 关键词 边缘智能;硬件感知;网络架构搜索;推理时延;网络大小
  • 宋天泽, 曹从军, 何佳琪, 王旭升, 刘晨煜
    录用日期: 2024-12-19
    摘 要: 密集行人检测是行人检测领域的一大研究热点。针对密集行人检测场景中被遮挡目标及小目标行人易产生漏检的问题,提出一种改进DETR的目标检测算法Pe-DETR。本算法采用基于多头自注意力机制的Dino-DETR作为基准模型,针对自注意力机制缺少捕获局部特征的能力导致密集行人检测效果较差的问题,对FFN进行多种改进与实验,提出DWSEFFN使模型可以提取到更多局部细节特征;针对ResNet-50骨干网络对重要特征提取效率较低的问题,采用Swin Transformer-L作为特征提取网络,提升骨干网络对重要特征的提取能力,同时使Pe-DETR完全基于注意力机制搭建,结构中不包含深度卷积结构;针对密集行人场景中目标数量多与DETR检测器中的稀疏匹配矛盾的问题,应用密集不同查询有效应对行人密集的场景,且不会引入无效的相似查询。在CrowdHuman密集行人检测数据集上进行实验,所提行人检测算法领先DINO算法3.7%的AP50准确率和4.5%的mAP准确率,实验结果表明在密集行人检测任务中改进后方法的准确率明显优于其他端到端模型。
  • 张志, 尹昱凯, 孙奕灵, 孟雯锦, 彭畅
    录用日期: 2024-12-19
    针对Android恶意软件种类和结构繁杂不一,单一静态特征存在难以区分良性和恶意软件的问题,本文在深入研究Android软件的权限、API、字节码和操作码等特征基础上,提出了一种基于多模态特征融合的构建方法。将字节码转换为RGB图像,通过预训练模型EfficientNetV2B3(E-V2B3)提取字节码图像特征,以表征Android应用的整体特性,再利用局部敏感哈希算法提取操作码序列特征,以表征Android应用的细节特性,进而采用多模态分解双线性池化(Multimodal Factorized Bilinear pooling,MFB)融合算法对字节码图像特征和操作码序列特征进行融合,实现了两种特性数据异质互补,以得到更具区分度的静态特征。在此基础上,本文提出了基于Transformer的Android恶意软件检测模型(Transformer Encoder-based Android Anomaly Detection,TEAAD)。实验结果表明基于融合特征的TEAAD模型优于其他深度模型,检测准确率达到96. 87%,MFB特征融合方法相较于其他的研究方法,具有较高的恶意软件识别能力。
  • 田辉, 段鑫龙, 郝琪雅, 隋文灏, 马裕莹, 虞祖华, 徐杨, 曹仰杰
    录用日期: 2024-12-18
    细胞计数是临床医学研究中的常见任务之一,在生物和临床医学领域发挥着十分重要的作用。针对细胞计数任务中存在的细胞重叠等情况导致将多个细胞统计为单个,从而造成细胞计数精度降低的问题,本文引入了U-Net医学图像分割模型并对其加以改进,提出了一种融合改进ViT和多尺度特征融合的细胞计数方法。计数方法包括四个部分:1)提取深层特征的编码器;2)用于拼接编码器特征和解码器特征的多尺度特征融合模块3)捕获全局上下文信息的改进Vision Transformer(ViT);4)用于恢复特征尺寸输出分割结果的解码器。其中,改进ViT模块利用了新颖的空间注意力模块和通道注意力模块解决了传统ViT在提取特定空间和通道维度上信息能力不足的问题。多尺度特征融合模块将不同尺度的特征图进行融合,提高了模型分割不同尺寸细胞的边界的能力,降低了细胞重叠对计数精度造成的影响。此外,为了进一步提高模型分割重叠细胞的能力,本文提出了一种数据增强策略,通过将原始细胞标注转换为一定半径的圆形标注,调整了细胞标注之间的距离,从而指导模型更好的将存在重叠的细胞进行分离。最后,通过在LiveCell、MBM cells和DCC数据集上进行实验,结果表明本文所提出的计数方法取得了较好的结果,有效解决了由细胞重叠引起的计数精度低的问题。
  • 李明明, 潘子豪
    录用日期: 2024-12-18
    传统的移动机器人路径规划算法通常需要在有地图的条件下才能有效规划路径。相比之下,基于深度强化学习(Deep Reinforcement Learning,DRL)的路径规划因其在无地图条件下的导航能力而备受关注。然而,传统的DRL路径规划算法往往存在样本利用率低、训练速度慢、泛化能力不足等问题。针对这些问题,对双延迟深度确定性策略梯度(Twin Delayed Deep Deterministic Policy gradient,TD3)算法进行改进以提高其在移动机器人路径规划中的性能。具体来说,首先,针对TD3算法持续探索空间能力有限的问题,对其探索策略进行改进,通过使用具有时间相关性的粉红噪声来增强算法的持续探索空间能力。其次,结合了n步方法和损失调整近似Actor优先经验回放(Loss-Adjusted Approximate Actor Prioritized Experience Replay,LA3P)方法。n步方法将经验回放池中的即时奖励扩展为n步的累计折扣奖励,能够更准确地捕捉长期奖励信号,而LA3P方法通过对n步经验的高效利用,提高了样本利用率和算法的性能。最后,通过在Gazebo中搭建了三个不同的环境进行实验,并和多种算法进行了比较。实验结果表明,改进算法在训练时间、平均成功率、平均距离等方面更具优势,证明了改进算法的有效性。
  • 吴永庆, 姜正宇
    录用日期: 2024-12-18
    针对当前交通流预测模型对数据间复杂时空相关性挖掘不充分的问题,提出了一种基于解耦合动态时空卷积循环网络(DDSTCRN)的交通流预测模型。首先,在数据解耦模块中,通过门控机制和残差分解机制解耦出交通数据中所包含的两种不同的隐藏时间序列信号,即扩散信号和独立信号。其次,依据两种信号的特点进行单独建模以提高预测精度,针对扩散信号采用局部扩散卷积捕获交通数据间的扩散过程,对独立信号则采用动态循环图卷积捕获交通数据的全局时空相关性,解决了单一建模会导致精度下降的问题。然后,在图卷积过程中,通过动态图构造器中无需先验知识的动态图构造方法来捕获交通数据间动态变化的空间依赖关系。最后,通过外部组件模块预测天气条件等外部因素对交通数据产生的影响以提高模型的鲁棒性。在METR-LA、PEMS-BAY、PEMS04、PEMS08和NE-BJ等五个公开交通流数据集上的实验结果显示,所提模型相较于表现最优的D2STGNN模型在不同预测长度下的平均绝对误差(MAE)下降了1.2-4.6个百分点,与表现次优的DGCRN模型相比,所提模型在不同预测长度下的MAE下降了3.7-10.5个百分点;与其他代表性模型相比,所提模型预测误差均有下降。实验结果表明,所提模型能充分挖掘交通数据中的复杂时空相关性,并在交通流预测任务上有较好的预测效果。
  • 沈明辉, 刘宇杰, 陈婧, 叶康祈, 高赫远, 刘建, 姜烨, 殷文斐, 王恺豪, 刘振宇
    录用日期: 2024-12-18
    组装电脑主板(Printed circuit board assembly,PCBA)的缺陷检测对于提高流水线生产效率具有重要影响,而在PCBA组装之后的检查通常由人工完成,容易造成人力与时间的浪费和出现漏检与误检的情况。为此提出一种轻量化的YOLOv8s改进方法,该方法有效降低模型复杂度的同时可以提高PCBA缺陷的检测精度。首先,由于没有公开的PCBA相关数据集,构建了一个名为PCBA-DET的组装后PCBA缺陷检测数据集,并对PCBA-DET进行多种方式的数据增强以模拟实际生产场景和改善数据集的平衡性。其次,YOLOv8s的骨干网络最后一个C2f(Cross stage partial network bottleneck with 2 convolutions)模块替换成使用重参数化大核卷积(Reparameterized large kernel network, RepLKNet)以减少计算开销和提高模型的有效感受野,YOLOv8s的颈部网络引入P2小目标检测层和幽灵卷积(Ghost Conv)以捕捉更多的细节信息和有效降低模型参数量。最后,在数据增强后的PCBA-DET数据集上进行评估,mAP@0.95和mAP@0.5与基准模型相比分别上升了2.6%和0.1%,但参数量和基线模型相比下降了36.8%。模型的源代码和数据增强后的PCBA-DET数据集在https://github.com/ismh16/PCBA-Dataset上可用。
  • 刘铭辉, 张恩, 王梦涛, 黄昱晨
    录用日期: 2024-12-13
    为了解决在接触者追踪应用场景中,查询者与“敏感”人群的历史轨迹不完全相同,导致隐私集合交集基数(PSI-CA)协议无法直接应用到接触者追踪这一场景的问题,提出了一种非平衡模糊隐私集合交集基数(uFPSI-CA)协议。uFPSI-CA协议,是隐私集合交集基数协议的一种变体,该协议允许发送方和接收方通过交互共同计算其私有集合的交集的大小,而不泄露其他任何信息。与PSI-CA协议不同的是,双方的交集元素不是完全相等,而是有一定的相似性,且发送方的集合大小远远大于接收方。为了将PSI-CA协议扩展到uFPSI-CA协议,提出了可分类的洗牌不经意伪随机函数(CS-DH-OPRF)算法,该算法在计算接收方的OPRF值时,可以为同组数据添加一个常数的加密作为标签,在后续计算过程中接收方按照标签对数据进行分类。本文设计的uFPSI-CA协议将大量的计算交给作为服务器的发送方,接收方仅做简单的元素加解密操作,并且协议的总体通信开销与接收方的数据元素集合大小正相关。最后,实现了uFPSI-CA协议,在发送方集合大小为 ,接收方集合大小为 时,仅需4s的在线时间及15MB的通信开销,证明了协议是高效的。
  • 赵庶旭, 周宏泽, 王小龙
    录用日期: 2024-12-13
    边缘服务器往往需要在资源有限的情况下通过组建联盟的方式协同执行任务,考虑服务器的资源利用率随任务执行而动态变化的特性,如何确保任务能够尽快完成的同时减少重构联盟耗费的成本是一大难点。针对上述问题,提出了一种基于双重深度Q网络优化的联盟结构优化策略。首先,以最大化完成任务的效率以及最小化构建联盟成本为优化目标,通过定义状态空间、动作空间和奖励函数,将问题建模为引入成本的马尔可夫决策过程(CT-MDP)。其次,针对CT-MDP中高维状态空间下易出现Q值过高估计的问题,提出一种基于双重深度Q网络的轻量化最优联盟结构搜索算法,通过两套独立的Q网络以减少更新过程中的正向累计误差。为满足边缘设备在训练过程中对资源占用率的严格要求,对激活函数进行优化以降低训练模型对存储资源的需求。最后,通过仿真实验将所提算法与Q-learning、DQL、Dueling DQN等算法进行比较分析;结果表明,本文方法具有良好的收敛性和稳定性,且在联盟构建成本与资源占用率方面分别降低了20.36%与12.12%,证明了该方法的有效性。