作者投稿和查稿 主编审稿 专家审稿 编委审稿 远程编辑

最新录用

Please wait a minute...
  • 全选
    |
  • 余肖生, 李盛, 李松璞
    录用日期: 2025-09-02
    摘 要: 噪声干扰与低分辨率问题对特征表达的显著限制,可能导致关键细节丢失和语义信息退化,从而限制了模型在复杂场景下的鲁棒性与泛化能力。针对这一问题,构建了一个视觉语言模型驱动的双分支异常检测网络MSRA-CLIP(Multi scale and Residual Attention-CLIP)。首先,利用两个平行分支来处理图像,上分支设计了一个多尺度注意力的组合注意力单元,它在提高图像超分辨率质量的同时,平衡了计算复杂度和性能;下分支使用了包含残差注意力和跳跃连接的残差注意力模块,通过大量的残差注意力和跳跃连接捕获丰富的全局和局部特征,之后将两个分支处理后的图像特征进行拼接。最后,利用图像-文本多级对齐模块将处理后的图像特征映射到联合嵌入空间,然后与文本特征进行比较生成异常图。为了评估所提出的模型的有效性,在Brain MRI、LiverCT等5个医疗异常检测数据集上的实验结果表明,与MVFA相比,MSRA-CLIP在零样本设置下异常分类的平均AUC提高了5%,异常分割的平均AUC提高了1.1%,在少样本设置下异常分类的平均AUC提高了0.93%。
  • 孔钰龙, 蔺素珍, 晋赞霞
    录用日期: 2025-09-02
    视频描述旨在深入分析视频内容,用自然语言准确、流畅的描述视频内容。概念,对应于视频内容中的对象、动作和属性,可以作为视频描述的媒介。虽然使用概念引导视频描述已经有部分研究,但是仍然存在着两个主要的问题,概念检测精度有限和概念利用率不足。针对这些问题,提出了全局和局部概念引导的多模态视频描述方法(CGMVC),来提高生成描述的质量。首先用不同的骨干网络提取视频的多模态特征,利用HMMC模型通过分层匹配的视频到文本检索提供视频的文本信息,然后使用多模态特征融合和概念检测网络精确检测概念。为了充分利用检测到的概念,通过概念投影模块挖掘视频的潜在主题从全局层面引导解码,通过语义注意力模块和交叉注意力模块分别利用概念和视频的多模态特征,实现局部层面的解码优化。通过充分利用概念和不同模态的信息,生成更加自然和准确的描述。在MSVD和MSR-VTT数据集上CGMVC模型的CIDEr和BLEU@4分别达到了111.2%、57.1%和64.1%、51.2%,对比和消融实验结果表明,CGMVC方法相对于基线方法和其他先进方法的优越性。
  • 亓慧, 张思琪, 史颖 , 祁晓博
    录用日期: 2025-09-02
    随着社会经济的快速发展,居民幸福感已成为衡量社会进步的重要指标。准确预测居民幸福感对于政策制定和社会资源分配具有重要意义。但现有方法在跨群体适用性与政策可解释性方面存在系统性不足。针对此类问题,本文提出了一种特征交互优化与动态加权集成的幸福感预测模型(Feature Interaction-Optimized Dynamic Weighted Ensemble Model,FIO-DWEM)。首先,通过多项式扩展生成二阶交互特征,结合相关性筛选与递归特征消除(RFE)构建特征交互优化机制,提取高信息量特征。然后,采用随机搜索结合留一法对基模型进行超参数调优,基于误差比率动态调整基模型权重,并通过软投票机制集成概率输出。实验结果表明,FIO-DWEM在多个数据集上表现优异:在Somerville数据集上各项指标提升0.54%~39.86%,在跨域验证中保持89.57%~98.89%的准确率。SHAP分析揭示了城市服务信息可用性等关键特征对幸福感的影响机制,为政策制定和个人评估提供了可解释的技术支持。
  • 李泽楷, 鄢志丹, 陈 璨
    录用日期: 2025-09-01
    云台伺服控制系统在追求良好的瞬时响应特性时,往往导致系统稳定裕度的降低;同时,为保证云台伺服系统的高精度性而在控制器设计中引入的较大积分环节,也限制了系统响应速率,并在系统易受机械干扰的60-120Hz频段内引入相位滞后问题,这严重降低了系统抗干扰能力。为解决上述问题,本文提出一种滞后补偿与干扰抑制的高速云台控制方法,即在传统串级双回路比例-积分-微分控制器(PID Controller)基础上,增设线性扩张状态观测器(LESO),并将电机控制的相位滞后时间、转动惯量辨识误差与机械震动等系统内外扰动,扩展成新的状态变量。后将LESO输出作为前馈控制量完成该控制方法的设计。与传统的串级PID控制控制方法相比,该控制方法能够兼顾高响应与高稳定性同时,有效改善云台伺服系统相位滞后问题与抗干扰能力,具有较好的工程应用价值。
  • 萧理阳, 艾欣阳, 谢薇, 顾恺婕
    录用日期: 2025-09-01
    随着无人机技术在农业领域的广泛应用,其高效作业策略的优化问题日益成为研究热点。针对农业喷洒作业中无人机受电池容量与药箱容量双重约束下的路径规划问题,引入多行程作业模式,以最小化作业成本为目标,构建了一个集成喷洒作业顺序优化、飞行路径规划和多机协同调度于一体的整数线性规划模型。为高效求解该复杂组合优化问题,设计了一种改进自适应大邻域搜索(ALNS)算法,结合问题特性构造了四种移除算子与三种插入算子,并引入了模拟退火(SA)算法作为劣解接受机制。通过计算算子得分,算法能够动态调整算子选择策略,从而提升求解性能。通过算法预实验确定了合理的参数设定。基于多组不同规模算例的数值实验表明,该算法在求解效率与解的质量上均显著优于商业求解器CPLEX与基于序列生成的方法。此外,将ALNS算法与主流启发式算法——遗传(GA)算法和蚁群(ACO)算法进行对比。实验结果表明,ALNS算法在中、大规模算例中的求解质量均显著优于GA和ACO算法。在中规模算例中,平均提升幅度分别为6.90%和3.55%;在大规模算例中,平均提升幅度分别为7.84%和4.47%。
  • 蒋欢, 韩华, 黄丽, A. A. M. MUZAHID
    录用日期: 2025-09-01
    深度学习模型在实际应用中越来越广泛,但容易受到对抗性示例的攻击,近年来,物理对抗性示例成为研究热点。现有的研究方法多专注于提高对抗性示例的攻击性和针对性,但对于不同模型之间的共性研究仍有不足,忽略了对抗性样本的通用性与视觉自然性。为此,本文提出一种基于色彩感知约束的物理对抗性伪装生成方法,提升伪装的转移性和自然性。具体来说,首先对给定的3D汽车模型进行预处理生成多层注意力图,然后利用求得的二进制掩码来分离多层目标注意力,对于给定的连通子图,提取其在纹理中的像素集合,计算其与可打印颜色空间的映射,接着优化注意力和颜色联合损失来获得最佳的对抗性伪装,在处理完所有连通子图后,进行全局一致性优化,避免各个子图间出现突兀的边界或颜色不平滑现象,从而提升视觉上的舒适度。本方法不依赖特定模型结构,具备良好的跨模型迁移能力和实际应用潜力。大量实验表明,基于色彩感知约束的物理对抗性伪装生成方法在数字世界和物理世界中都超过了基线方法。
  • 尹新宇, 李雯茜, 许刚, 何胜
    录用日期: 2025-09-01
    随着区域智能化的发展,数据密集型与时延敏感型业务逐渐增多,边缘计算的引入虽然能缓解现有的区域专网压力,但面对设备能耗、时延等指标日益严格的综合性要求,仍需研究更高性能的边缘计算卸载策略。针对上述挑战,基于区域环境,综合考虑任务截止期限、队列积压状态与带宽资源约束,结合信道状况的突变感知提出一种节能的协同任务卸载模型。在构建云端-边缘-终端三端协同的模型时,对任务完成各阶段的时延、多用户卸载比例和带宽分配进行了联合优化,并基于李雅普诺夫优化方法将长时随机优化问题转化为在线决策框架。引入改进型粒子群算法,设计Lyapunov-PSO混合优化架构,增强非凸约束下的全局搜索能力,实现多目标协同优化。同时提出分层阈值映射编码方法以解决离散卸载决策与连续优化空间的映射冲突。实验结果表明,相比仅使用其他启发式算法和人工智能方法,所提算法可有效实现资源的整体优化配置,进一步节省了任务处理所产生的能耗。
  • 刘凤春, 韩宏帅, 张春英, 马将
    录用日期: 2025-09-01
    当前的甲状腺结节分割方法在图像特征解析中可能导致图像边界模糊或细节丢失,且甲状腺超声图像本身还存在质量低、噪点多等问题影响特征精确提取。为此,基于最新的视觉状态空间模型(VMamba),提出一种融合因子化VSS与特征频带分离的甲状腺结节超声图像分割网络FMVM-DFFT。该网络架构的主要创新在于:(1) 结合因子分解机(Factorization Machine, FM)和外部注意力(External Attention, EA),提出一种VSS(Visual State Space)模块的因子化变体FMVSS,利用其高效提取输入特征在不同维度上的信息,并自适应调整特征权重,增强对关键信息和局部细节的捕捉能力;(2) 提出一种包含双分支快速傅里叶变换的DFFT模块,对编码器输出特征进行频带动态分离和精细提取,以提高网络对细节与宏观信息的捕捉能力,并结合通道注意力(Channel Attention,CA)自适应控制各通道的权重;(3) 提出一种基于Laplacian算子和新型损失函数BDELoss的边缘优化策略应用于训练过程中,进一步增强网络对图像边缘区域的学习能力。通过在TN3K和DDTI两个数据集上进行对比实验,结果表明:与主流分割网络和最新图像分割网络相比,FMVM-DFFT表现出最佳分割性能,尤其在重要指标DSC与IoU上表现出色,在TN3K上两项指标可达88.50%与79.37%,在DDTI上两项指标可达78.85%与65.09%。
  • 焦瑞璇, 秦佳, 秦品乐, 曾建潮, 柴锐
    录用日期: 2025-09-01
    由于人体器官的形态变化复杂且多样,可变形三维医学图像配准面临诸多挑战。尽管已有多种先进的配准模型被提出,但卷积神经网络的感受野大小受限且卷积核大小固定,导致其在特征提取过程中对全局上下文信息的感知和捕捉能力仍显不足。针对这一问题,在可变形三维医学图像配准方法中引入频率域信息,构建了一种基于空频双域的可变形三维医学图像配准网络(Spatial-Frequency Deformable Registration Network, SFDR-Net),通过空频双域和动态门控融合相结合的方法增强不同尺度特征的表征能力和协同作用。首先,考虑到傅里叶变换能够有效提取高低频信息的同时对形变较为敏感,将其引入可变形三维医学图像配准,并提出了一种高效的空频双域Transformer模块(Space-Frequency Dual-Domain Transformer Block, SFTB),通过频率域快速傅里叶变换(Fast Fourier Transform, FFT)提取紧凑的全局结构信息,并与空间域多尺度卷积结合,通过不同粒度特征的相互作用精准估计大范围形变;其次,采用动态门控融合模块(Dynamic Gating Fusion Module, DGFM),对多个尺度的空间-频率优化特征进行融合增强,并有选择地将其引入下一阶段形变估计中,避免由于远距离特征信息的退化导致形变估计的不准确。实验结果表明,SFDR-Net在Mindboggle-101、OASIS和IXI数据集上的平均Dice分数分别为64.33%、81.89%和79.81%,与其他先进网络相比平均提升了5.20%、2.75%和2.34%,更具备有效交互整体特征与细节信息的能力,能够自适应地平衡不同尺度形变特征,实现各种形变场景下更精确的配准。
  • 高磊, 蒋海龙, 闵帆, 杨梅
    录用日期: 2025-08-29
    地震数据中的面波作为典型的相干噪声,因其能量强、传播方向复杂且波形特征与有效信号高度相似,成为地震数据去噪中的主要难点。现有深度学习方法依赖网络深度堆叠或单模态特征表征,虽能压制面波,但存在多尺度特征融合不足和长程依赖建模局限,易导致有效信号模糊或低频成分丢失。为此,本文提出一种多尺度注意力-空洞卷积融合网络(MA-DCNet),由方向自适应特征增强模块(DAFEM)、多尺度特征融合模块(MSFFM)、通道局部增强注意力模块(CLAM)和全局上下文自注意力模块(GCSAM)组成。DAFEM利用多轴自注意力机制自适应增强关键方向信息,MSFFM通过风车卷积构建多尺度感受野,CLAM结合通道注意力与深度可分离卷积增强同相轴连续性,GCSAM基于全局上下文注意力建立全道集依赖关系以区分面波与有效信号。实验表明,相比四种先进方法,MA-DCNet在显著压制面波的同时更好地保持同相轴连续性。
  • 赵娅, 朱婉珍, 贾迪, 单可欣, 姚文达
    录用日期: 2025-08-29
    传统的重建方法虽然能有效拟合人脸全局形状与基础拓扑结构,但在捕捉面部复杂表情变化和高频细节特征时存在一定的局限性。为了解决这一问题,论文提出了一种融合表情感知与细节增强的三维人脸重建方法,旨在通过对表情参数的语义化映射与局部高频细节提取,实现人脸模型的高保真重建。表情感知模块基于EfficientViT网络构建表情编码器,结合注意力机制与表情基矩阵动态表征不同表情变化下的面部几何形变,并设计表情交叉熵损失优化表情参数判别性,提升表情建模的准确性。其次,细节增强模块采用可形变卷积网络提取面部高频纹理特征,融合掩膜信息与多尺度语义特征引导面部区域的细节重建。同时,引入基于小波变换的局部细节一致性损失,在不同频域子带上约束细节特征,增强面部细节表现力。实验结果表明,相较于现有重建方法,论文方法在均方根误差(RMSE,1.36)和归一化平均误差(NME,3.04)等关键指标上表现出色,验证了其在表情重建精度与细节还原能力上的卓越性能,同时表现出对极端表情及大姿态头部变化的强鲁棒性。
  • 林荣鑫, 李硕豪, 董力铭, 郝思齐
    录用日期: 2025-08-28
    随着社交媒体平台传播的信息量指数级增长,虚假新闻检测成为信息鉴伪领域的关键任务。当前研究方法聚焦于单一模态的语义分析,未能有效地解决多模态新闻的跨模态语义矛盾;且现有模型决策过程可信度不足,缺乏可解释的辅助信息支撑。针对上述问题,本研究提出一种面向多模态新闻的视觉语言大模型检测框架。首先,引入视觉语言大模型推理新闻内容,通过生成图文描述集来增强检测的可解释性;其次,设计多粒度协同注意力机制,实现文本、图像以及辅助描述的多粒度特征对齐。本研究采用多模态视觉语言大模型Qwen2.5-VL作为新闻解释性工具,设计新闻提示模板,引导模型对新闻图像提取关键对象和场景要素,利用模型的语言生成能力增强新闻文本的上下文,形成可解释的辅助决策依据。多粒度协同注意力融合机制以协同注意力层为基础,通过多层级特征交互,在高维语义空间中捕捉新闻图文中的潜在伪造模式。本研究在Weibo、GossipCop和Pheme多模态虚假新闻数据集进行实验,实验结果表明,在准确率上分别达到90.4%、99.7%和86.6%。
  • 钟子山, 唐建航, 金柯兵, 章阳, 杜罗乐, 姚徽
    录用日期: 2025-08-28
    数字孪生(Digital Twin,DT)技术是基于现实物理实体映射的虚拟模型,为了使DT能够随着物理实体的变化而更新,物理实体应定期向DT发送实时的状态和信息。在数字孪生系统中,实时数据的处理和历史数据的存储与分析分别代表了实时数字孪生(实时DT)和历史数字孪生(历史DT)。在边缘计算中,虚拟与物理设备之间的信息交互时延是制约数字孪生实时类业务性能的关键因素。在实际部署中,流量大的关键边缘节点面临存储、带宽和计算资源的紧张局面,而流量较小的边缘节点则存在资源闲置的问题。不同地理位置的边缘服务器之间服务能力和可用资源分布极为不均,导致整体系统资源利用率低下、服务质量难以保障。本研究提出一种深度强化学习的联合部署策略,通过深度强化学习方法优化实时DT和历史DT的边缘部署方案。该方法通过建立联合边缘放置模型,考虑实时数据流时效性高的特性,根据实时DT与历史DT的耦合性,综合考虑实时DT和历史DT的部署成本,建立部署时间最小化问题,利用深度Q学习来平衡实时DT和历史DT之间的资源分配、时延优化以及服务质量保障。对于提出的任务请求,利用变分近似互信息选出与任务相关性最高的实时DT与历史DT,并为任务提供服务。通过仿真实验表明,所提出的深度强化学习算法能够在多种场景下自适应地调整边缘设备的资源分配策略,相对于基准算法平均降低了34%虚实信息同步时延,内存利用率平均可以提高7%。
  • 刘玉杰, 王一雯
    录用日期: 2025-08-27
    微姿态是由内在情感驱动的无意识细微动作,能够反映个体隐藏情绪,在情感计算中具有重要价值。其在时间维度上具有瞬时性,在空间维度上幅度微小、边界模糊,属于典型的细粒度行为,传统方法难以提取有效特征。为此,本文提出一种基于多模态协同增强的微姿态识别方法,将视频、骨架与文本构建为互补表征三元组。该框架突破传统视觉—语言模型的局限性,引入骨架模态作为运动学先验,结合视觉上下文和语义引导,构建多源互补的特征表征体系。此外,提出双层级协同模块:视频—姿态协同模块(VPCM),融合视频的细节特征与骨架的全局运动信息,采用跨时间注意力机制扩展特征表示,增强时序建模能力;文本—姿态协同模块(TPCM),引入文本模态的语义先验,采用基于Top-K的融合策略强化骨架特征的语义关联性,提升对细粒度特征的捕获效果。为进一步优化多模态融合性能,提出两阶段训练策略—先对单模态编码器进行预训练,再通过轻量化适配器与协同模块进行协同学习,有效提升了模型的精度。在主流微姿态数据集上的实验表明,本模型的识别准确率超越了当前最优方法,达到了70.40%的精度。
  • 郝金隆, 张 祯, 李秀华, 曾胡爽, 黄河澎, 蔡春茂
    录用日期: 2025-08-27
    针对资源受限场景中多尺度目标检测模型难以兼顾高精度与低参数量、低计算复杂度的问题,提出了一种基于YOLOv8的边缘端轻量级多尺度目标检测方法。首先,在主干网络的跨阶段部分双特征融合模块中嵌入了自主设计的轻量级通道-空间注意力模块,通过融合高效通道注意力机制和多尺度深度可分离低秩卷积,在模块复杂度较低的同时实现通道和空间双维度特征增强。其次,设计了跨层自适应加权融合模块,建立跨层连接,通过自适应加权机制融合浅层细节特征与深层语义信息。再次,将颈部网络跨阶段部分双特征融合模块中的瓶颈结构替换为通用倒置瓶颈,在维持检测精度的同时降低计算复杂度。最后,提出了聚焦式尺度自适应动态交并比损失,通过尺度自适应调制项与聚焦机制,动态调整误差惩罚力度并强化对难检测目标的关注。在BDD100K数据集上,与当前先进的YOLO11m模型相比,LMS-YOLO-m在mAP@50与mAP分别提升了0.5%和0.1%,参数量减少了2.4%,计算量降低了5.8%,结果表明该方法在检测精度更高的同时具有更低的参数量和更低的计算复杂度。
  • 黎博文, 谭泰, 李杰, 张建伟, 张祥瑞
    录用日期: 2025-08-27
    六自由度无人机空战是一个极具挑战性的场景,包含高维连续状态和动作空间以及非线性动力学。针对上述场景,提出了一种渐进式多目标策略优化算法(Progressive Multi-objective Strategy Optimization, PMSO),该算法通过动态调整动作空间的粒度并结合多目标奖励函数来提升策略学习效果。针对连续动作空间维度高、搜索空间过大导致的算法决策困难甚至难以学习到有效策略的问题,设计了渐进式离散化机制,该机制初始阶段采用较粗粒度的离散动作指令以快速探索策略空间,旨在利用动作指令控制效果的局部相似性来减小动作搜索空间;随着训练迭代和任务难度增加,动作指令的离散化程度逐渐缩小,从而保留了动作指令的控制精度。针对空战任务中普遍存在的稀疏奖励问题,设计了包括角度、距离和高度的多目标奖励函数,通过这些奖励的协同来引导算法更好地理解当前行为对空战任务的影响,加快收敛速度。在涵盖优势、均势、劣势的随机空战场景的仿真实验中,本文提出的PMSO算法都能快速收敛并学习到有效的空战策略,其收敛速度和学习到的策略的效果优于现有的空战算法。
  • 王韵涵, 胡雅冰, 陈榆杰, 刘英
    录用日期: 2025-08-27
    在无人机执行任务的过程中,识别潜在的碰撞风险并采取必要的机动措施是确保安全飞行的关键。针对环境障碍物及多无人机防撞问题,提出一种基于自适应人工势场的协商防撞算法。首先,综合考虑时间和距离两方面因素进行冲突检测,并引入自适应冲突判定系数以减少不必要的避撞机动。其次,提出自适应调整斥力增益系数的方法,防止因机动性能限制和初始斥力增益系数设置不当而造成碰撞的行为。同时,设计了基于关键度的多无人机协商策略,减少了机间冗余的避撞动作。此外,基于无人机运动学模型,根据最新时刻获得的信息,对邻居无人机的状态进行预测,以降低数据链时延和丢包引起的误差。与传统人工势场法相比,所提算法在斥力增益系数较小时仍能有效避撞,且将总路径长度缩短约1.76%。当数据链时延不超过200ms以及丢包率低于50%时,所提算法均能表现出良好的避撞性能。
  • 李学相, 郑永利, 张怡泽, 段鹏松
    录用日期: 2025-08-27
    随着互联网的普及与应用程序的多样化,海量网络流量的精细化分类成为优化服务质量和分析用户行为模式的关键。对基于机器学习和基于预训练模型的网络流量分析方法进行概述,旨在通过多维度对比与分析,推动该领域研究的进一步发展。首先,解析了流量分类的完整流程,涵盖数据采集、预处理、特征提取过程,分析了数据平衡技术的实践价值。介绍了主流公共数据集的数据格式、规模及场景适配性等,从多角度进行对比分析,指出其存在的数据分布、特征冗余与时效性问题。其次,不仅在方法层面总结了传统算法在高维数据处理与实时性上的局限性,还重点通过实验结果对比分析,总结了流量分析领域应用预训练模型技术的趋势,包括基于Transformer的预训练模型BERT、与深度学习的融合模型和轻量化模型在流量分类中的突破性进展。最后,结合动态研究趋势,探讨了未来应用预训练模型存在的机遇和挑战,分析了其在计算成本与隐私保护方面的局限性,提出了未来的研究方向并对研究前景进行展望。
  • 朱海峰, 易畅言, 吴昊, 郑好, 戴兴安, 左坤, 顾友华
    录用日期: 2025-08-27
    航天伺服系统因其特殊的工作环境,在使用永磁同步电机驱动具有高阶非线性运动特性的负载时,其传感器仅能测得电机角度反馈而无法测得负载位置反馈。在上述工作场景中,不准确的负载位置反馈让传统的基于闭环反馈的控制算法,如PID三环控制,表现出了跟踪精度低、指令适应能力不足的问题。为了解决上述问题,使用双延迟深度确定性策略梯度算法训练强化学习智能体,其对位置环中与负载位置近似的电机位置反馈进行调优,以克服半闭环带来的精度损失,增强控制器在多项任务下的控制性能。同时,将智能体的策略模型轻量化部署至TMS320C6713B DSP上并验证其运行的实时性。实验结果表明,基于深度强化学习的调优方案相较于对比控制方案在负载位置特性方面有2.07%的提升,在负载速度特性方面有59%的提升;在负载频率特性试验方面普遍优于对比控制方案,并且能够部署在算力有限的边缘控制器上实现实时控制。
  • 曾毅, 高燕, 施显会, 郭心诚
    录用日期: 2025-08-27
    电网异构故障处置面临三元组重叠识别困难、多模态特征融合低效等挑战。针对于异构化故障信息,不同数据类型的表达差异和关联性挖掘困难增加了解决问题的复杂性。为此,提出基于对抗训练与自适应关系权重的联合优化框架(Heterogeneous knowledge graph - Adaptive weight graphical convolutional networks, HKG-AWGCN)。首先,构建电网领域本体符号,定义5类实体和8种关系,建立实体-关系的标准化映射规则。在知识抽取阶段,设计多阶段对抗训练机制。通过(BERT-BiLSTM)ATT-CRF模型提取基础三元组后,在CRF层注入FGM对抗扰动优化实体边界识别,并采用关系感知注意力模块解决重叠关系路径冲突。在知识优化阶段,提出自适应权重异构图卷积网络,通过电气参数约束的关系权重计算聚合故障传播多模态子图特征,并设计联合损失函数同步优化节点嵌入与拓扑结构。实验部分分别从时序建模性能、图结构数据处理性能、多模态特征融合性能进行对比试验,通过与BiLSTM-CRF、GraphTransformer等8类基线模型对比发现,HKG-AWGCN在准确率、召回率、F1值等核心指标上分别达到96.07%、95.58%和95.15%,为电网故障处置提供了可解释的决策支持。
  • 冯国平, 王海吉, 洪亮, 方家良
    录用日期: 2025-08-21
    社交媒体中虚假信息的传播对公共安全构成严峻威胁,现有基于外部知识增强的检测方法常因知识冗余与噪声干扰导致性能受限。本文引入基于条件最优传输(Conditional Optimal Transport,COT)的关键特征提取方法,将原始文本的全局语义作为先验条件,最小化与大语言模型(Large Language Modal,LLM)生成的外部知识间的条件KR(Kantorovich-Rubinstein)距离,提取外部知识的关键特征。进一步设计空间序列映射模块,显式建模文本位置信息以保留结构特征,并结合交叉注意力机制和余弦相似度动态加权外部知识,实现外部知识的自适应融合。在公共数据集Weibo与GossipCop上的实验表明,提取外部知识后的检测方法的F1分数分别超越最优基线模型3.1%与1.3%,消融实验验证了COT模块与空间序列映射模块的有效性。此外,参数敏感性分析显示模型在超参数波动下保持稳定(F1波动<±0.015),证明其强鲁棒性。本研究为知识增强的虚假信息检测提供了新的理论范式与技术路径。
  • 杨媛, 张恩, 李功丽
    录用日期: 2025-08-21
    针对联邦学习中模型聚合时可能会泄露用户的私有数据,以及服务器可能篡改聚合结果以获取某些非法利益的问题,提出一种双服务器架构下基于博弈论的高效可验证的隐私保护联邦学习方案。首先,使用基于种子同态伪随机生成器的单掩码方案来保护数据隐私,同时通过Shamir(t, n)门限秘密共享方案对掩码进行分发与重构,从而使所提方案能够在保证隐私的同时允许部分用户因网络环境不稳定而退出;其次,构造基于Hadamard乘积的轻量级的验证方法,使得用户最后仅需要进行简单的向量乘积运算即可验证聚合结果的正确性,从而减少验证所需的计算开销;最后,引入博弈论中的囚徒契约和背叛契约,通过激励策略促进两个服务器不发起合谋攻击,解决双服务器架构中面临的服务器合谋问题,保障用户隐私的安全性以及全局模型的可信性。实验结果表明,所提方案能够在不影响模型准确率的情况下对用户梯度进行隐私保护,且与现有方案相比,其计算效率和通信效率均有所提升,这种优势在用户退出时更明显。
  • 林明生, 沈立炜, 董震
    录用日期: 2025-08-21
    在家庭服务场景中,多机器人系统需处理非专业用户发出的自然语言指令,这对自动化任务调度提出更高要求。针对现有多机器人调度方法在任务理解、依赖管理和资源优化方面的不足,本研究提出DAG-LLM调度方法,实现从自然语言输入到多机协作的全流程自动化。该方法首先,利用大语言模型(LLM)结合环境信息进行语义解析与任务分解,通过抽象链(CoA)机制生成具备执行约束的子任务集合;其次,基于LLM自动构建子任务间的有向无环图(DAG),取代传统人工建模流程,准确表征任务依赖关系;最后采用回溯算法匹配机器人技能与子任务需求,结合异步执行策略提升执行,在保证依赖顺序前提下通过动态调度减少等待时间。为验证方法有效性,在AI2-THOR仿真环境中设计三类不同复杂度的家庭任务(含4组场景)开展对比实验。实验数据显示,DAG-LLM在任务成功率上相较SMART-LLM提升43.3%,相较AutoTAMP提升60.0%;运行时间分别缩短32.8%和39.4%。消融实验进一步表明任务依赖建模和异步执行机制对提升系统性能具有关键作用。该方法无需人工参与任务分解与依赖建模,适用于多机器人智能体在家庭等自然语言驱动的应用场景下的高效协作调度。
  • 孙海峰, 姚俊萍, 李晓军, 刘延飞, 辜弘炀
    录用日期: 2025-08-21
    短期动作预测作为视频理解领域的重要任务,旨在通过建模历史动作的时空与语义特征,将观测到的物理动作转化为对动作意图和目标的推断,精准预测未来数秒内的交互行为,在人机协作、安防监控、自动驾驶、增强现实等领域具有广泛应用前景。近年,随着深度学习尤其是特征提取模型和高质量数据集在视频理解领域的突破,短期动作预测已经从知识驱动的机器学习范式转向数据驱动的深度学习范式。本综述系统回顾了该领域在深度学习方法中的最新技术,以期为相关研究及场景应用分析提供借鉴和参考。首先从模型架构创新、训练策略应用与上下文建模方法三个维度构建分类体系,分析领域内关键技术与挑战,并对每类方法的特点、适用场景及研究进展进行阐述。然后简要归纳任务中常用的数据集并梳理多种方法在主流数据集上的性能对比。最后提出了当前面临的挑战,从多视角协同预测、实时模型推理验证、弱监督未裁剪数据学习、小样本类增量泛化研究、动态开放场景自适应、可变时间间隔预测等未来可能的研究方向进行展望。
  • 赖国燕, 陈辉
    录用日期: 2025-08-20
    :针对多语言机器翻译中数据隐私保护问题,研究提出了一种结合差分隐私机制的多语言文本到文本转换模型(mT5)翻译模型,旨在保护用户隐私的同时维持翻译质量。首先,在模型微调阶段引入梯度裁剪操作,对每个样本的梯度施加范数限制,以控制单个样本对参数更新的最大影响,从源头压缩整体敏感度,为差分隐私提供理论基础;其次,在裁剪后的梯度基础上注入满足差分隐私约束的高斯噪声,通过对聚合梯度扰动,增强模型对成员推断攻击的抵抗能力;最后,依据差分隐私理论设定隐私预算,并调节训练轮数与噪声强度,在隐私保护与翻译性能之间实现优化权衡。实验基于标准多语言翻译数据集,采用双语评估替代(BLEU)指标评估模型性能。消融实验进一步验证了三种技术的协同作用,结果表明,翻译质量下降控制在9%-28%之间,符合实际应用中的合理范围。在相同数据集上与其他机器翻译模型进行实验对比,尽管BLEU分数平均下降约5%-6%,但在保证翻译质量的同时,模型的隐私保护能力得到了有效提高。通过成员推断攻击实验,标准Transformer模型的攻击成功率为78.3%,而差分隐私mT5模型的攻击成功率降低至52.4%,进一步证明了本模型在隐私保护方面的优势。
  • 王闪闪, 杜存鹏, 王星童, 马昊, 陈贞翔, 杨波
    录用日期: 2025-08-15
    型语言模型(Large Language Model, LLM)在各个领域展现出了卓越的性能。然而,其安全性漏洞,特别是越狱攻击(jailbreak attack)问题,引发了广泛关注。本研究提出了一种新颖且更易实施的间接越狱攻击方法,称为自检索诱导自越狱(SRIS)。该方法利用 LLM 自身的知识检索能力,基于其内部生成的信息,引导模型输出有害内容。SRIS不依赖外部知识,使越狱攻击更加可行且更易执行。在七个当前最先进的 LLM 上进行了广泛实验。实验结果表明,SRIS 在攻击成功率方面显著优于现有方法,最高可达 74.76%(GPT-3.5)和 56.8%(GPT-4)。在大多数问题领域中,SRIS 方法的攻击成功率显著领先,表现出较强的稳定性和广泛适用性。研究结果凸显了在 LLM 训练过程中谨慎选择训练数据的必要性。我们呼吁进一步研究更安全的开发实践,以提升 LLM 在实际应用中的安全性和可靠性。
  • 郇战, 王毅, 王澄 , 王文韬, 林知权
    录用日期: 2025-08-15
    随着工业物联网(IIoT)技术的快速发展,智能设备的不断涌现给传统以太网络带来了巨大的计算和传输压力。此外,由于工业任务的异构性,如任务类型、优先级以及对计算资源需求的差异,任务的确定性传输通常难以保证。因此,将边缘计算(edge computing, EC)和时间敏感网络(time-sensitive networking, TSN)融合能更好地满足复杂工业网络中的任务卸载和资源分配要求。综合考虑任务的截止时间、设备的计算能力、最大发射功率和能耗,提出了一种旨在最小化所有任务平均总延迟和能耗的MAPPO-Conv策略。该策略基于多智能体近端策略优化(MAPPO),设计针对不同优先级任务的奖励函数,确保终端设备在各时隙内做出实时、高效的功率控制和卸载动作,并引入凸优化方法对所采取动作为任务分配所需计算资源并进行能耗优化。实验结果表明,所提出方案不仅在时延和能耗这两个性能指标上表现出明显优势,还能在资源受限的网络环境中确保高优先级任务的实时处理需求;在包含30个终端设备的仿真中,与其他多智能体强化学习算法(IPPO,MADDPG)和基准算法相比,时延平均减少25.9%,能耗平均减少18.9%。
  • 曹天涯, 李康, 贾俊杰
    录用日期: 2025-08-15
    协同过滤推荐系统因其开放的架构特性,面临着恶意用户通过攻击模型进行托攻击从而干扰推荐准确性的问题。现有的检测方法根据不同攻击模型的特点从评分中提取特征,由于评分本身的范围限制,导致提取的特征差异性不足,且现有的方法常忽略用户之间的交互信息,使得提取到的检测特征存在完整性缺陷。针对现有问题,提出一种基于加权评分与加权交互的托攻击检测算法。算法使用项目的流行度为评分加权,并将其转化为灰度图像表示,利用卷积神经网络提取更具差异性的评分特征;使用用户的相似度为交互数据加权,利用全连接神经网络有效捕获用户之间的关联特征。最后通过神经网络进行特征融合,得到包含信息更加完整的用户特征,提高分类器在托攻击检测中的性能。在MovieLens-100k数据集上的实验结果表明,在不同填充率和不同攻击强度下,对于不同攻击模型算法均能够有效、稳定地检测。在MovieLens-1m数据集上的实验结果表明算法能够应对四种攻击模型同时存在的较为复杂的情况,具有较好的鲁棒性。
  • 郑洋, 王雷, 盛捷
    录用日期: 2025-08-13
    多模态情感分析利用多模态数据来推断人类情感。然而现有模型在应对模态信息缺失、文本依赖及跨模态冲突等情况下性能下降明显。为此提出一种基于生成式补全与动态知识融合的多模态情感分析模型(Generative Completion and Dynamic Knowledge Fusion Model,GC-DKF)。首先模型通过生成式提示学习模块,对原始数据中缺失的模态内及模态间信息进行补全,生成缺失的模态特征,提升模型对不确定模态场景的适应能力。然后设计一种主导模态动态选择机制,依据情感比例因子动态选定主导模态,同时引入知识编码器增强单一模态的表征能力,获取各模态的知识增强表征。最后在主导模态特征的引导下,进一步学习其他次要模态,生成互补性的多模态融合联合表征,实现更为高效、精准的多模态情感分析。在公开的CMU-MOSI和CMU-MOSEI数据集上的实验验证显示,所提模型在二分类准确率、F1分数、平均绝对误差和Pearson相关系数等指标上,均超越现有的主流多模态情感识别方法,情感识别准确率分别高达83.55%和83.02%。这充分证明提出的模型在多模态情感识别任务中具备较强竞争力。
  • 杨龙飞, 赖惠成, 杜浩浩, 张过
    录用日期: 2025-08-12
    针对正弦余弦算法(Sine - Cosine Algorithm, SCA)在优化问题中存在的收敛速度慢、策略单一的问题,以及在局部动态路径规划中存在的路径曲折及动态避障震荡的不足,本文提出一种多策略自适应网络正弦余弦算法(Multi - Strategy Adaptive Network Sine - Cosine Algorithm, MANSCA)。首先,通过引入差分策略、全局更新策略和局部更新策略,构建多策略自适应网络,并基于轮盘赌选择机制动态调整策略权重,增强算法的全局搜索与局部开发能力。其次,针对路径规划问题,提出目的导向策略,通过改进引力势场函数平衡目标点吸引力,减少路径震荡;同时设计动态避障策略,结合障碍物运动方向调整机器人避障方向,避免传统节点删除法的方向性缺失问题。首先,MANSCA算法的有效性在CEC2015基准函数和CEC2022基准函数问题中得到了验证,并且与其他最新元启发算法相比具有竞争力。其次,MANSCA应用于包含静态和动态障碍的复杂环境中的多机器人局部路径规划,所提出的算法相较于SCA在总行驶距离和最大节点数上分别降低了约62.6%和63%。
  • 王向前, 潘仕伟, 吕亚飞, 项云龙, 景琨
    录用日期: 2025-08-12
    针对深度学习模型的效率优化技术是当下人工智能应用领域的研究热点之一。在部署深度学习模型时,可通过降低模型中的算子调度开销与提高算子的执行效率的方式来获得模型效率的提升。该文针对在各时序网络中被频繁使用的双向长短期记忆(Bi-directional Long-Short Term Memory,BiLSTM)结构,基于其结构中包含的正向与逆向的长短期记忆(Long-Short Term Memory,LSTM)细胞的输入可复用特性,同时应用算子融合与张量计算合并技术,提出一种应用于LUNA芯片的Bi-LSTM算子效率优化方法,该方法通过消除冗余操作、进行数据复用与合并张量计算的方法降低时间开销,提升Bi-LSTM算子的执行效率。该算法亦可推广到Bi-RNN及Bi-GRU等时序网络算子中。同时基于边缘端国产LUNA芯片,建立对优化算法验证的实验平台。实验结果表明,应用本文提出的Bi-LSTM算法效率优化方法,能够实现最大37.6%的优化效果。
  • 郭慧, 丁春涛, 张俊娜
    录用日期: 2025-08-12
    随着物联网设备的广泛应用,如何在资源受限的物联网设备上高效部署强鲁棒性的卷积神经网络(Convolutional Neural Network, CNN)成为一项重要挑战。现有的云服务器辅助物联网设备训练CNN模型的方法虽然可以降低云和设备间的参数传输量,但并未降低推理所需计算量且鲁棒性有限。为了解决上述问题,提出了一种分组的多非线性变换函数生成滤波器方法(Group-based method for generating filters using multiple nonlinear transformation functions, GroupMNL)。首先,在每层卷积层中随机生成少量的标准滤波器作为种子滤波器。将种子滤波器分组并对每组的种子滤波器使用不同类型的非线性变换函数按需生成多样性的滤波器,且参数是不学习的,从而降低了CNN模型的可学习参数量。其次,将种子滤波器和生成的滤波器进行拼接生成完整卷积层,并在卷积操作中引入分组卷积机制以降低模型的计算量。最后,为了进一步增强CNN模型的鲁棒性,引入组归一化技术并结合多非线性变换函数对模型的正则化作用,从而提升模型的鲁棒性。实验结果表明,基于GroupMNL方法的ResNet101模型相比标准模型,减少了87%的可学习参数量、降低了71%的计算量,并将模型鲁棒性提高了6.09%。
  • 林佳熔, 刘力
    录用日期: 2025-07-31
    多目标跟踪在计算机视觉领域面临着诸多挑战,如目标遮挡、相似外观等,这些问题极大地制约了跟踪的准确性与鲁棒性。为有效应对此类难题,提出一种新的多目标跟踪方法TBSTrack。该方法由时序预测、特征提取和分段匹配三个核心模块组成。时序预测模块通过构建时序信息缓存区,并结合自注意力机制计算当前帧的预测结果,强化目标的时空关联,从而精准预测目标位置。特征提取模块针对遮挡目标进行分块处理,运用卷积神经网络提取各分块信息,再依据遮挡状况进行拼合,有效去除干扰,实现目标特征的有效表征。分段匹配模块采用两阶段匹配策略,借助可学习锚点在匹配时恢复遗漏目标,再从背景中挖掘潜在目标,综合两者得到最终跟踪结果,以此更新时序信息。为验证方法性能,在MOT17、DanceTrack和SportsMOT数据集上展开实验,结果显示,在HOTA指标方面,该方法分别达到了63.9%、57.3%、75.6%,在IDF1指标方面,也分别取得了79.6%、56.7%、78.8%的成绩。实验结果表明,该方法显著提升了多目标跟踪的准确性和鲁棒性,尤其在复杂场景下优势明显,为多目标跟踪提供了切实有效的解决方案。
  • 冯广, 项峰, 黄荣灿, 周垣桦, 郑润庭, 杨燕茹, 刘天翔, 李伟辰
    录用日期: 2025-07-31
    在多模态情感分析任务中,传统方法依赖于直接融合多模态信息,而每个模态特有的私有特征往往被跨模态交互所忽略,这可能导致模型在处理复杂情感表达时的准确性和鲁棒性不足。特别是在智慧教育场景中,教师需要通过学生的语音、表情和文本反馈来精准判断其学习状态和情绪波动,因此,提升多模态情感分析的精度对于个性化教学和课堂交互具有重要意义。为了解决这一问题,本研究提出了一种结合私有特征学习和对比学习的情感分析模型。首先,为了充分利用私有特征,该模型将共享特征与原始的文本、音频和视觉特征进行相似性比较,从而识别在跨模态交互中被忽视的私有特征,再通过融合私有特征和共享特征来增强模型的表达能力。其次,提出了一种模态无关对比损失(Modality-Agnostic Contrastive Loss,MACL),该方法通过对多模态融合特征进行对比学习,有效利用多模态数据中的情感信息,减少模态间的差距,进而获得统一的情感表示。实验结果表明,在CMU-MOSI和CMU-MOSEI数据集上,该模型的F1值分别提升到了85.98%和85.95%,二分类准确率分别提升到了86.01%和85.97%,显著高于次优模型,验证了该模型的有效性。
  • 王珂珂, 严南南
    录用日期: 2025-07-31
    区块链因其不可篡改、可追溯等特性,为数据存储和交易提供了透明度和安全保障,在金融、民生服务与公共管理等领域展现了其广泛适用性。随着区块链技术在多元化应用场景中的深度渗透,其底层架构需要应对海量数据存储与高频交易处理的双重压力。为突破区块链系统的扩展性瓶颈,区块链分片技术应运而生,其通过分布式并行计算机制有效提升了系统整体吞吐量,这一技术已在以太坊2.0中获得成功验证。然而,当前区块链网络分片中仍存在跨分片交易频繁、重配置开销大和分片间负载不均的问题。针对这些问题,本文提出基于增量图划分的区块链动态网络分片策略,将增量图划分技术用于划分区块链网络交易图,根据网络中节点的变化适时调整分片,在新节点加入交易图中时只处理新增部分,无需从头开始重新划分,降低了跨分片交易比例,更适应区块链网络的动态变化;提出一种动态分片负载优化算法(DSLO,Dynamic Sharding Load Optimization Algorithm)计算交易在各分片上的权值,在算法中引入频时计数器(LFU-TTL,Least Frequently Used - Time To Live),通过结合交易频率和存活时间预测分片负载情况,优化负载均衡。实验结果表明,本方案能有效降低跨分片交易比例、分片重配置时的数据复制成本,改善分片间的负载均衡。
  • 王辛迪, 柴小丽, 许晓斐, 佘平
    录用日期: 2025-07-31
    航海领域现有的轨迹相似性度量方法多以传统算法为主,计算复杂度较高,尽管已经提出了一些基于深度学习的方法,但存在空间-时间联合建模不足的问题,导致相似性度量的准确性和鲁棒性有待提升。针对上述问题,本文提出了MDU-net(Marine Density U-Net)模型,该模型能够自动提取船舶轨迹的低维特征,从而高效可靠地检索与指定目标相似的轨迹。首先对轨迹数据进行等时间间隔插值,再采用核密度估计生成融合空间与速度信息的核密度灰度图,实现轨迹像素化。随后,采用基于U-net结构的神经网络进行无监督学习,获得轨迹的低维表示;最终通过计算低维特征向量间的余弦距离构建相似矩阵,量化轨迹间的相似性。实验结果表明,MDU-net 在多个评估指标上显著优于传统方法与主流深度学习模型。与经典动态时间规整(DTW)方法相比,MDU-net前十条轨迹命中率提升了7.7个百分点;与Hausdorff相比提升约 14.7 个百分点。与深度模型对比,MDU-net 的优势更为突出,相较于卷积自编码器(CAE),前十条轨迹的命中率提升了25个百分点,充分验证了MDU-net在船舶轨迹相似性度量任务中的优越效果。
  • 朱家辰, 杨晔, 胡喜友, 王佳明
    录用日期: 2025-07-31
    本研究旨在设计并实现一款新型的模块化仿生象鼻抓取器,采用基于近端策略优化(Proximal Policy Optimization, PPO)强化学习算法的运动控制策略。该抓取器巧妙地融合了刚性与柔性的设计原则,构建了模块化的结构,从而显著增强了系统的灵活性和可扩展性。在硬件设计层面,应用了刚柔结合的策略:刚性部分保障了结构的强度与稳定性,而柔性部分则致力于适应各种形状和硬度的物体,以实现精准抓取。通过对仿生象鼻抓取器运用PPO算法进行运动控制,本研究成功模拟了象鼻的复杂运动行为,并将训练完成的模型应用于实际抓取任务中。在物理仿真环境下,设置了多种抓取任务,并通过PPO算法的持续迭代优化进行训练,使得抓取器逐渐学会在各种环境条件下自适应调整运动轨迹的能力,以实现精确抓取不同的物体。实验结果证实了该模块化仿生象鼻抓取器在多样化抓取任务中的出色表现,其抓取成功率超过90%,且抓取动作流畅自如。本研究的成果不仅验证了PPO算法在解决复杂的机器人抓取任务上的有效性,同时也为模块化机器人系统的设计及应用开辟了新途径,未来有望在智能制造、医疗辅助和灾害救援等多个领域发挥重要作用。
  • 胡静, 黄文韬, 贺秉毅
    录用日期: 2025-07-22
    单图像超分辨率(SISR)任务当前面临的主要难题在于,如何在恢复低分辨率图像的高频细节同时降低计算复杂度和避免伪影的产生。为了有效解决这些问题,提出了融合小波卷积的多尺度大核网络WEMA-Net。该网络首先把小波变换卷积与大核分解策略结合,在频域内进行卷积操作,扩展了感受野并降低了计算复杂度。再设计多尺度分组机制,在不同尺度上捕获长距离依赖和局部纹理信息,结合小波卷积减少大核卷积可能导致的伪影。接着提出了自适应门控空间注意力单元,能够根据不同区域的特征动态调整注意力权重,从而优化局部和全局特征的融合,增强了细节和边缘的恢复能力。另外还设计了调制卷积单元模块,通过提升对异常值的鲁棒性,进一步提高了特征提取的灵活性。在Set5,Set4,B100,Urban100和Manga109等数据集上测试,实验结果表明,WEMA-Net在峰值信噪比(PSNR)上相较于轻量化模型RFDN,BSRN,LKDN,RepRFN,OSFFNet等上均有提升。在4倍超分中,相比于LKDN的Urban100和Manga109分别提高了0.18dB和0.2dB。实验结果验证了该网络在图像细节恢复、计算效率及鲁棒性方面的优越性,表明该方法具有广泛的应用前景。
  • 党伟超, 裴丽仙, 高改梅, 刘春霞
    录用日期: 2025-07-22
    针对现有弱监督动作定位研究存在的未充分利用动作的时序特性、全局特性和动作语义一致性等问题,提出视频文本语义对齐与全视频依赖的方法(FVD-ALM),充分利用多源信息以提升动作定位的准确性和鲁棒性。首先,依托膨胀卷积扩大模型的感受野,结合注意力机制对视频内动作的变化实施精确的特征强化,确保获得准确的时序特征,捕捉动作的动态变化。然后,采用基于高斯混合模型的期望最大化算法提取并强化视频中的全局信息,生成精确的时序激活图,理解视频的整体内容,辅助动作的定位过程。最后,设计视频文本语义对齐模块,结合动作标签中的文本信息全面理解动作,训练模型补全描述动作的文本信息,增强模型对动作类别一致性的认知并有效区分不同动作类别。实验结果表明,在THUMOS14和ActivityNet1.3这两个主流数据集上,该方法均有效,其中在THUMOS14上实现了39.1%平均mAP,比DTRP-Loc方法提高了2.0个百分点,证实了结合多源信息的方法能够显著提高动作定位的准确性,为弱监督动作定位任务提供了一种有效的解决方案。
  • 肖志强, 贾俊铖
    录用日期: 2025-07-22
    数据隐私法规要求机器学习模型具备安全移除用户数据的能力,以高效响应遗忘请求。然而,在去中心化联邦学习(DFL)环境中,遗忘学习面临多轮参数传播导致的重训练成本高昂问题,同时客户端计算能力、通信带宽异构性及非独立同分布(Non-IID)特性显著阻碍模型收敛。现有研究多集中于中心化联邦学习场景,对去中心化联邦遗忘机制的探索不足。为此,本文提出了一种基于聚类的去中心化联邦遗忘方法(CDFU),通过客户端聚类和高效的拓扑学习提升遗忘效率。CDFU采用本文设计的分层聚类算法(HCK),根据计算能力、通信带宽和数据分布特征进行粗聚类与细粒度划分,形成时间同步且数据分布均衡的集群,将遗忘重训练限定于受影响集群,从而降低计算和通信开销。划分完成后,CDFU通过时延优化的拓扑学习算法(LOTL)构建并优化集群内通信拓扑,减少通信延迟,加速模型收敛。实验表明,CDFU在多个数据集上显著提升训练效率,测试准确率平均提高10.2%,优于现有方法。
  • 顾雨迪, 狄奕成, 狄岚
    录用日期: 2025-07-22
    点击率预测是推荐系统中的一项关键任务,是为用户进行项目推荐的最终步骤。现有的大多数前沿方法主要集中于研究复杂的隐式和显式特征交互;然而,这些方法忽略了混杂因素引起的虚假相关问题,从而降低了模型的泛化能力。为了解决上述挑战,提出了一种基于相关性筛选的联邦点击率预测框架(Federated Click-through Rate Prediction, FedCRP),它包含两个关键组件。首先,动态循环协作网络(Dynamic Recurrent Collaboration Network, DRCN)使模型能够从多尺度特征结构中挖掘各类非线性耦合。其次,相关性筛选策略(Relevance Screening Strategy, RSS) 利用变量隔离分析和样本优先级调节消除复杂特征交互中的虚假相关,使模型专注于触发特征。最后,使用联邦学习方法训练模型,利用多样化的特征交互,以避免对虚假相关的单一依赖。在4个公开数据集上进行实验,实验结果表明了FedCRP的可行性和有效性。相较于最优基线,评估指标AUC在4个数据集上的提升分别为4.10%、5.29%、1.48%和0.59%。
  • 付佳伟, 陈俊仕, 安 虹
    录用日期: 2025-07-22
    数据流编程是一种新型的并行编程范式,通过细粒度的任务拆分实现高性能的并行计算,但也带来了额外的编程复杂性。本文提出了一种新型的程序转换方法与编译流程,借助两层程序中间表示(IR),实现了将控制流结构的计算程序全自动无缝转换为数据流结构。由于两种编程模型在程序的表达方式上具有诸多差异,自动化转换过程中面临着许多挑战,本文将其细化为四个具体的类别,并逐一提出应对方案。在 PolyBench/C 数据集上的实验结果表明,通过本文设计的转换方案产生的数据流程序,其整体并行计算性能接近基于 SDFG 的 OpenMP 并行化方案,并在近一半的样例中超越 OpenMP 方案。本文还选择了多个具体的程序进行深入分析,讨论了不同编译方案产生的结果存在性能差异的原因,展现了 Codelet 模型在大量线程下面对不规则并行模式的优越性。
  • 霍子月, 武优西, 耿萌, 刘靖宇, 李艳
    录用日期: 2025-07-16
    序列模式挖掘旨在从数据中提取频繁有序子序列。然而,序列模式本身并不直接表示因果关系,即早期事件的出现并不必然触发后续事件。因果推断能够揭示序列数据库中的因果模式,但现有的序列数据因果发现方法大多依赖于专家定义的先验知识,这限制了它们在知识稀缺场景中的应用。为了解决这一问题,提出了一种基于正序列模式挖掘和负序列模式挖掘的CP算法(Causal Pattern Mining,CP),采用模式连接策略,以减少候选正序列模式的数量;采用基于交集的方法高效计算候选负序列模式的出现列表;使用匹配序列对算法,提高了结果的可信度。实验结果表明,CP算法相比CP-a、CP-b、CP-d、CP-e和CP-m算法在运行时间上分别提升了11.8%、60.336%、55.501%、25.737%、84.252%,在候选因果模式数量上比CP-m减少了56.057%,在候选正模式数量上比CP-b和CP-d均减少了66.415%。此外,与NOTEARS相比,CP算法的F1-score提升了约50%。相比之下,PC算法仅能挖掘单变量因果模式,而CP算法能够挖掘出组合变量的因果模式。综上,CP算法在因果模式挖掘中的性能优于现有对比算法。
  • 燕齐鸿, 杨文军
    录用日期: 2025-07-16
    目前,加密流量分类的研究备受关注。然而,现有的许多加密流量分类方法仅提取流级特征,由于统计特征不可靠而无法处理短流量,或者将头部和有效负载同等对待,导致无法探索字节之间的潜在关联。此外,卷积神经网络(CNN)和循环神经网络(RNN)存在着无法获取原始字节中包含的判别信息的问题。因此,提出了一种GraphSAGE和GAT相结合的细粒度加密流量分类模型(ETC-SAT),该方法基于点互信息(PMI)来构建字节级流量图。具体而言,在该方法中设计了一个双重嵌入层,该层用于将字节级流量图嵌入到图模型当中。同时还设计了一个GraphSAGE和GAT相结合的流量图编码器,该编码器中GraphSAGE提供了稳定的邻居特征聚合方式,GAT通过引入注意力机制增强选择性聚合,从而更有利于图特征的提取。之后应用自适应深度特征融合机制,该机制可以将分别处理的数据包头部和有效载荷的信息融合在一起以获得更强的特征表示。在ISCX-VPN2016和ISCX-Tor2016这两个公开数据集上的实验结果表明,ETC-SAT算法能够有效识别加密流量的类型,而且性能明显优于基线算法。
  • 李彦青, 朱宏擎
    录用日期: 2025-07-15
    磁共振成像是临床辅助诊断、病变检测的重要手段。基于卷积神经网络的磁共振图像重建在速度和精准度上取得较大进展。但现有模型多依赖单一域的特征提取,且受限于局部感受野,导致复杂解剖结构的重建质量略低。为解决这些问题,基于并行框架提出一种改进的混合注意力增强的双域多模态重建网络(AMC-Net)。该网络构造MMFF多模态特征融合模块,匹配并融合多模态输入之间的共享特征,补充初始输入中缺失的结构特征,尽量减轻初始输入的伪影干扰。基于迭代收缩阈值算法构建双分支的PIRN重建子网络,采用多层迭代和双域信息交互数据流实现渐进式重建,并引入注意力机制改进的卷积实现全局特征学习。此外,协同通道-空间注意力和自注意力机制以精细化重建结果,突出细节特征并抑制伪影,从而提升微小结构的恢复质量和整体视觉效果。实验结果表明,AMC-Net在静态脑部MRI数据集IXI和BraTS2018上的重建效果优于主流算法,能适应多种采样条件。在5倍随机采样下,模型平均PSNR达到42.66且SSIM超过0.97,生成具备高清晰度和细节还原的重建图像。
  • 王坪烨, 马李欢, 孙卓, 高远, 惠英
    录用日期: 2025-07-14
    贴合现实场景的多车多无人机协同配送问题由于其复杂性,成为路径优化问题的关键挑战。综合考虑每辆卡车可携带多架无人机、无人机在单航程内可多次配送以及客户存在配送时间要求等约束,提出带时间窗的多车多无人机协同配送问题,并以最小化总配送成本目标建立混合整数规划模型。为求解该问题,设计了一种结合自适应大邻域搜索算法和模拟退火算法的双链混合启发式算法。其中,双链编码结构通过分离客户配送顺序和配送工具,直观展示卡车和无人机协同配送路径,便于计算对应客户的时间窗约束,还有利于破坏算子与修复算子快速生成新解。最后,通过算例分析验证了算法的有效性和双链编码结构对该复杂场景的适应性。结果表明该算法在小、中、大规模算例中均能快速生成高质量解,小规模算例中相较于Gurobi求解器计算时间平均缩短94.34%,大规模算例中比可变邻域搜索算法总成本平均减少9.11%。此外,灵敏度分析进一步表明,卡车携带无人机数量和无人机成本是影响总配送成本和路径方案制定的关键因素。
  • 薄凯彬, 李叶文, 张中海, 谭光明
    录用日期: 2025-07-14
    碱基识别作为纳米孔测序技术中将原始电信号转换为DNA序列的核心环节,其计算效率直接影响基因组分析流程的时效性。针对现有碱基识别工具在计算加速、硬件适配和系统优化方面存在的不足,本研究提出并实现了三大创新性优化方案,显著提升了碱基识别任务的计算性能和国产化部署能力。本研究主要创新体现在:第一,构建了基于异构计算架构的OpenKoi加速库,通过算子级优化实现了算法层面的突破。针对LSTM和条件随机场等核心算子,创新性地设计了矩阵拼接策略与并行化执行方案,将LSTM单步计算所需的GEMM操作从8次降为1次,并开发了基于线程块粒度的集束搜索算法。第二,提出了异构流水线架构,攻克了传统流程中的I/O瓶颈问题,实现了数据读取、GPU计算与结果写入的三级流水并行,在DCU平台获得线性扩展效率。第三,研发了首个支持国产海光DCU的碱基识别系统DCUCaller,其创新性体现在硬件适配与量化技术的协同优化。通过HIP编程框架实现跨平台兼容,采用本研究的OpenKoi库与异构流水线框架来优化碱基识别算法的吞吐量。本研究通过算法优化、系统架构创新和硬件生态建设的三维突破,不仅显著提升了碱基识别任务的执行效率,更为国产计算平台在生物信息领域的大规模应用提供了关键技术支撑,对推动基因测序技术的自主化发展具有重要战略意义。
  • 赵云康, 徐明
    录用日期: 2025-07-14
    针对水声传感器网络(UASN)中数据机密性、动态授权与高效检索的协同难题,提出了一种面向水声传感器网络的可搜索授权关键字加密方案,方案采用双重安全机制。在数据层,结合小整数解(SIS)问题的抗量子特性与身份基加密(IBE)框架,设计基于格基陷门算法的抗量子安全公钥加密机制,实现了抗量子攻击的公钥加密;在授权层,提出时间约束的离散高斯令牌分发协议,利用格基拒绝采样技术生成轻量级授权签名,支持权威机构按需授予节点细粒度关键词搜索权限,实现权限动态撤销与更新,合法节点通过生成的授权陷阱门实现细粒度检索。技术实现中,通过格基扩展算法优化格基运算效率,结合IBE方案简化公钥管理流程,使方案适配水声传感器节点的低带宽与有限计算特性。在实现授权搜索的同时保障量子安全性,同时还有效降低了通信开销。最后,进行了详细且严格的正确性分析和安全性证明,证明所提出的方案实现了IND-sID-CKA和T-EUF安全性,满足水下声学通信中低带宽和有限计算能力的需求。
  • 翟社平, 康超越, 杨锐, 曹世龙
    录用日期: 2025-07-14
    实用拜占庭容错算法(Practical Byzantine Fault Tolerance,PBFT)算法在实际应用中存在通信复杂度高、节点管理机制不完善及缺乏动态行为评估等问题,限制了其在大规模区块链系统中的性能与安全表现。为解决上述问题,设计了一种基于信誉分组的改进算法。首先,通过设计节点信誉评估机制,节点根据信誉值被划分为优节点、良节点和观察节点,前两类参与共识,领导者优先从优节点中选取。信誉较低但未作恶的节点作为观察节点,仅同步账本,不参与共识;存在作恶行为的节点将被识别并隔离,提升系统的安全性与鲁棒性。其次,引入BLS(Boneh–Lynn–Shacham)多重签名技术,通过聚合多个节点的签名为固定长度的签名,减少了节点数据传输过程中的签名数据量,降低了组内和组间广播过程中的通信负担。最后,设计了一种节点动态管理机制,允许节点根据需求灵活加入或退出系统,从而增强系统的动态适应能力和鲁棒性。实验结果表明,与PBFT、DT-PBFT、NBR-PBFT算法相比,该算法在共识时延上分别降低了约45.3、29.3和17.4个百分点;在吞吐量上分别提高了约17.4、10.6和4.5个百分点。
  • 谢鑫刚 , 芦照烜, 梁静坤
    录用日期: 2025-07-14
    近年来,气候变化和海洋污染导致珊瑚礁退化,珊瑚自动检测成为海洋生态系统监测的迫切需求,水下珊瑚检测任务中图像对比度低、珊瑚形状复杂和生长密集等问题限制了通用检测算法的性能。针对上述问题,提出了一种基于YOLO架构的软珊瑚检测模型CoralDet,首先,设计多路径融合模块 (MPFB) 来捕捉多个尺度的珊瑚特征,针对水下不均匀光照和图像模糊现象提高了模型的鲁棒性,同时使用重新参数化来提高推理效率。其次,引入GSConv和VoV-GSCSP轻量级设计组件,可在不牺牲性能的情况下降低计算成本。引入了一种自适应幂变换(APT)标签分配策略来动态调整锚点匹配度量,并且使用了软标签和软中心区域损失以使模型专注于高质量、对齐准确的预测。最后,在Soft-Coral 数据集上对CoralDet进行评估,推理延迟仅为9.52 毫秒,平均精度均值(mAP)50 达到 81.9,超过了 YOLOv5(79.9)、YOLOv6(79.4)、YOLOv8(79.5)、YOLOv9(78.3)、YOLOv10(79.5)、MambaYOLO(80.1)和RT-DETR(81.6),并在 Coral-lwptl 数据集上进行了泛化实验,CoralDet在多个关键指标上均优于 MambaYOLO、YOLOv8 和 YOLOv10 等传统模型,结果证明了 CoralDet 在水下珊瑚检测方面的有效性和实用性。