作者投稿和查稿 主编审稿 专家审稿 编委审稿 远程编辑

最新录用

Please wait a minute...
  • 全选
    |
  • 郝耀辉, 蔡锦添, 崔新悦, 卢贤玲
    录用日期: 2026-02-04
    针对依据平均场理论的传染病模型预测分析舆论信息传播中,难以通过模型自身迭代修正参数,易导致预测偏差,以及LSTB模型对舆论信息传播长期预测精度较差等问题,提出一种融合传播动力学与深度学习技术的SEI⊃3;R-BiLSTM模型。首先,改进SEIR传播模型,划分网络舆论信息传播过程中用户状态为S(信息未知者)、E(信息犹豫者)、I1(正面传播者)、I2(负面传播者)、I3(中立传播者)、R(信息免疫者)6类,设置各状态间的转换关系;然后,结合BiLSTM神经网络模型,引入注意力机制、残差连接等提升模型精度,预测舆论信息传播者数量变化;最后,采集“姜平数学竞赛”、“秦朗丢作业”和“胖猫跳江”3个热点舆论事件,共65.9万条微博平台舆论数据,进行实验验证与分析。结果表明,SEI⊃3;R-BiLSTM模型预测I₁、I₂、I₃三类传播者数量时序变化曲线与实际传播走势整体上一致,拟合精度高;依据RMSE(0.162)、MAPE(16.6%)、Jaccard(0.74) 、F1-score值(0.72) 4个评估指标数值,SEI⊃3;R-BiLSTM模型性能优于SEI⊃3;R-LSTM、SEI⊃3;R-ARIMA等4个融合型基准模型;消融实验部分证明了模型的合理性与有效性,为预测网络舆情发展提供了一种模型参考。
  • 罗养霞, 姚元乐, 李晓雨, 赵金龙
    录用日期: 2026-02-04
    针对恶意软件数量及变种指数级增长,且传统检测方法对未知威胁识别能力有限的问题,提出结合“多模态图像化+轻量化”的MobileNetV2_AD检测方法。主要特点是多源语义视觉融合,将字节熵、反汇编指令流与API 调用序列表征为RGB三通道图像,实现“一图融三域”,揭示不同语义模态在图像空间的互补判别规律,较灰度图挖掘特征粒度更细;其次,轻量骨架强尺度感知,在MobileNetV2中植入空洞空间金字塔池化(ASPP),提升模型感受野,增强多尺度特征提取能力。并且采用“类别-特征”双解耦蒸馏,以ResNeXt50为教师,将宏观分类逻辑与微观特征分布同步迁移,解决轻量学生“精度-泛化”跷跷板难题,蒸馏后学生模型在未知家族样本上F1提升11.7%。最后,进行跨数据集性能验证,在Kaggle(400 GB)与DataCon(最新攻防赛)双公开基准上,MobileNetV2_AD准确率分别达96.41%与98.68%,较原始MobileNetV2提升6.31%与4.21%,且推理速度达280样本/秒,满足终端实时检测需求。实验结果表明,所提方法在资源受限场景下,显著提升了恶意软件检测效果,为网络安全防护提供了有效的技术方案。
  • 黄建文, 陈绪行, 程良伦, 黄佳杰, 霍烨景
    录用日期: 2026-02-03
    为解决现有三维牙齿关键点检测方法中存在的几何姿态感知不足及多类型牙齿统一建模困难问题,提出了一种基于四元数几何感知与自适应专家网络(QGAE-Net)的关键点检测算法。该方法设计了多尺度几何位置编码器(MS-QGPE),利用四元数表示结合几何形状描述子对点云的局部与全局结构进行多尺度建模,增强几何关系感知能力;构建了四元数引导的几何姿态注意力模块(QG-GPA),通过引入四元数相似度对注意力权重施加约束,引导模型依据真实几何关系完成特征聚合;同时,引入分类驱动的专家路由机制(CD-ERM),通过动态激活不同专家子网络实现多牙型的统一建模与个性化特征提取。在包含19200个牙齿样本的临床数据集上,所提方法在切牙、尖牙、前磨牙和磨牙上的平均绝对误差分别为0.179 mm、0.233 mm、0.188 mm和0.301 mm,召回率分别为85.1%、87.1%、91.5%和67.5%,整体分类准确率达到97.5%。此外,在Teeth3DS+与KeypointNet公开数据集上亦获得优于现有方法的关键点检测性能,验证了模型在公开基准与跨类别场景下的泛化能力。综合结果显示,QGAE-Net不仅有效提升了关键点检测精度,也具备较高的部署效率和结构扩展性,适用于多类复杂牙型场景下的自动化关键点标注任务。
  • 龚虹邑, 陆安文, 汤艺君, 王向学, 徐军, 焦一平
    录用日期: 2026-02-03
    通过深度学习整合病理图像与基因组数据,可显著提升癌症预后预测的精准性。然而在临床数据中,仅有部分患者具备完整的基因组测序结果,这限制了多模态模型的全面应用。如何充分利用有限的基因数据增强病理模型的预后能力,是提升多模态临床适用性与泛化能力的关键。为此,本文提出一种基于变分专家混合(VMoE)模块的病理增强框架VMEF,用于应对病理图像完整但部分样本缺失基因数据的训练场景。该框架利用具备完整模态的样本学习病理基因间的跨模态映射关系,为缺失样本生成插补特征,从而提升整体预后性能。VMEF包含三个核心模块:(1)多源病理编码模块,融合全局组织结构与肿瘤微环境先验信息,为基因特征生成提供丰富的病理学基础;(2)基于VMoE的插补模块,通过双专家结构与动态路由机制建模病理到基因的多样映射关系,自适应生成生物学合理的基因表征;(3)先验特征引导的融合模块,通过先验特征引导基因特征与病理表示的相互校准,有效缓解模态间异质性。在TCGA三种癌症数据集上的实验表明,当训练集中仅60%样本具备基因测序数据时,平均C-index达到0.6149;在模态完整情况下,平均C-index达到0.6370并超越现有多模态方法。实验结果展现了VMEF框架在模态缺失情况下癌症预后的有效性与鲁棒性,为其在随机缺失场景中的应用提供了有力支撑。
  • 王会勇, 周茹梦, 张屹, 冯涛, 张晓明
    录用日期: 2026-02-03
    近年来,大语言模型在自然语言处理任务中展现出卓越性能。然而,在医学等专业领域的问答任务中,由于轻量级大语言模型缺乏足够的垂直领域知识支撑,其生成的结果在可靠性与准确性方面仍存在不足。为提升轻量级大语言模型在医学领域问答任务中的准确性,本文提出了一种基于实体识别与知识筛选的知识图谱增强大语言模型医学问答方法(ERKF-MedQA),该方法主要包括两个部分:精确的初始实体识别与知识筛选。实体识别采用多阶段提示的方法,首先在问题当中进行实体标准化检索,然后再对检索的实体进行相关性评估,以确定最终的有效实体。知识筛选采用多任务语义评分模型(M-TSSM)完成,该模型融合问题与路径信息,对初步检索的知识进行评分,筛选出与问题高度相关的知识。最后将筛选出的相关知识整合后以提示词的方式输入至大语言模型,由模型完成推理并生成答案。实验结果表明,所提方法在BERTScore指标上均优于各基线模型,且与效果最优的基线模型相比,Precision、Recall和F1_Score分别提升了0.44%、0.25%和0.34%。
  • 罗理, 李波, 吴佳妮, 文源, 戴路
    录用日期: 2026-02-02
    城市地下管道缺陷检测是保障地下管道系统正常运行的重要措施。由于城市地下管道缺陷种类多样、形态复杂及尺度多变,导致现有检测方法检测精度不足,存在较多误检和漏检问题。基于RT-DETR模型提出一种有效的地下管道缺陷检测模型MEG-DETR。设计基于多尺度注意力的尺度内特征交互模块(M-AIFI),通过结合多尺度多头自注意力(M2SA),在高语义层特征内部建立通道与空间依赖关系,实现对地下管道缺陷细微特征的充分捕获;构建空间先验多尺度特征金字塔网络(SP-MSFPN),引入高效局部注意力机制(ELA)及添加浅层特征层,实现不同尺度层级间特征的高效融合,增强对小目标缺陷的检测能力;设计门控语义增强模块(GSEM),结合多尺度通道门控线性单元和GSBottleneck模块,实现语义与结构特征的协同增强,提升模型对复杂缺陷语义和细节结构的表征能力。实验结果表明,所提出的MEG-DETR模型能够更准确地检测地下管道缺陷,mAP达到83.44%,较原始模型提升2.74%;Precision和Recall分别提升1.69%和3.03%。与主流检测模型进行对比,MEG-DETR整体性能均优于其他主流方法,验证了模型在复杂缺陷场景下的有效性。
  • 云健 , 张雪怡
    录用日期: 2026-02-02
    针对数据隐私与合规约束制约跨域协同的问题,联邦学习(FL)与区块链融合虽能缓解传统FL的中心化风险,但现有方案仍面临模型更新质量评估不足与验证节点可信危机等挑战。本研究提出一种去中心化区块链联邦学习框架,其核心创新在于构建了一个质量-信任-权益协同的动态闭环系统,具体表现为:1)验证者质量评分,采用多轮次交叉验证与时空权重算法量化验证者表现,将质量评分转化为动态投票权重以抑制共谋攻击;2)模型质量因子,基于滑动窗口追溯工人节点历史贡献,结合验证者准确率动态调整更新阈值,区分高价值更新与恶意扰动;3)模型质量驱动的动态权益证明机制,将节点权益与贡献质量绑定,确保高权益节点具备高质量输出。在多个数据集上的实验表明,该框架通过上述机制的协同作用,在非独立同分布场景下遭遇恶意节点干扰时,模型精度相较于基线方法平均提升12.5%,在CIFAR-10等复杂数据集上对特定攻击的防御效果提升高达38%,恶意节点的权益累计占比被成功压制至约1%,远低于基线方案的13%。同时,通信开销与基线相当,有效解决了模型更新质量与验证者表现的一致性问题。
  • 刘诚可, 关东海, 袁伟伟
    录用日期: 2026-01-30
    平衡时间序列分类是深度学习领域的一项重大挑战,尤其是当关键信息集中于少数类时。传统的数据增强方法(如欠采样和过采样)旨在提升少数类样本比例,但往往会导致信息丢失、过拟合风险增加以及噪声引入等问题。尽管“双重增强联合标签学习”(JobDA)已被证明在一定程度上可缓解此类问题,但其并未对少数类做针对性的处理。针对这一难题,研究提出一种名为“少数类标签合并双重增强”(DAMLM)的新方法。该方法首先通过样本与标签的双重增强扩展训练集,随后利用标签映射机制对少数类标签进行融合,相比于JobDA有效提升了少数类样本的比例。具体而言,该方法通过重复原始数据的方式进行样本增强,避免了噪声引入。同时,在训练过程中对多数类采用联合标签、对少数类保留原始标签,相比于其他方法形成了更清晰的分类边界。在UCR档案的38个不平衡数据集上,本文在6种时间序列分类模型上分别开展实验,并对结果取平均进行比较。与7种代表性基线增强方法相比,DAMLM的平均F1提升1.24–6.27个百分点,并在G-mean等指标上取得最优。
  • 王亮, 邓松
    录用日期: 2026-01-30
    电力系统作为关键基础设施,易受设备故障及恶意数据篡改等威胁,而异常样本的稀缺性导致传统检测模型性能受限。为了解决电力系统异常数据不平衡问题,提出基于混合专家生成对抗网络的数据增强方法(LT-MoEWGAN)。该方法创新性地集成了LSTM与TCN作为双专家模块,通过门控网络实现特征层级的动态权重分配,构建多尺度时序特征提取器以生成高质量样本。基于真实电力数据集的仿真实验结果表明:1) 基于Wasserstein距离度量,本方法生成数据与真实样本分布差异最小(中位数分别为0.043和0.135),且以WGAN为基准,生成稳定性提升33%;2) 在XGBoost、LightGBM、Random Forest、Decision Tree、CNN、GAT以及MTGF-Conv分类器上,在本文提出算法的基础上,AUC较SMOTE、ADASYN、Borderline-SMOTE和GAN、WGAN、WGAN-GP、DCGAN、WM_CVAE等基线方法提升1.5%-2%。该方法通过高质量数据增强有效改善异常检测性能,为电力系统异常检测提供了可靠的数据增强解决方案,其创新架构对时序数据生成任务具有理论参考价值。
  • 朱国政, 彭万达, 张朔, 程心如, 张立晔, 李鹏飞
    录用日期: 2026-01-30
    图像模型的跨域迁移已成为解决视频理解问题的有效范式,但其使用的方法仍有改进空间:全量微调计算开销大且易产生性能波动;多数参数高效迁移学习(PETL)方案采用单一适配器,在长程时序依赖与小样本场景中的时空表征能力易受限,更关键的是,现有方法普遍依赖隐式时序建模而忽视显式运动先验,导致难以充分捕捉复杂运动模式。为此,本文提出结构化适配器框架FDA4Video,基于PETL范式实现图像模型的高效适配:设计解耦式双路径适配器架构,同步捕捉局部动作细节与长程时序关联;提出光流移位协同注意力机制,将显式运动表征深度融合到时序建模过程中以强化跨帧依赖;同步引入可学习时间位置嵌入提供时序坐标基准,通过分阶段残差融合策略保障表征完整性。实验表明,该框架在Kinetics-400、UCF101和HMDB51上分别取得85.6%、98.2%与83.9%的准确率,较基线方法在减少约26%新增参数的前提下平均精度提升1.6%~2.2%,整体性能可媲美先进PETL策略,为图像模型的视频化迁移提供了一条兼顾精度、轻量与效率的技术路径。
  • 王耀宁, 王郅瑞, 李云
    录用日期: 2026-01-30
    大型视觉语言模型(Large Vision-Language Models, LVLM)在多模态理解与生成任务中取得了重要进展,但近期研究表明它们在对抗攻击下表现出显著脆弱性。尽管已有针对LVLM的黑盒有目标攻击方法尝试提升对抗样本的跨模型迁移性,但迁移效果和稳定性仍不理想。为解决此问题,本文提出了一种基于中间层特征对齐的高可迁移性黑盒有目标攻击方法(Intermediate-Guided Transfer Attack, IGTA)。该方法利用预训练的视觉编码器作为代理模型,通过在代理模型的中间层精确对齐对抗样本与目标图像的特征表示。这种中间层对齐策略旨在更直接、更深层次地影响模型对视觉语义的理解与高层决策逻辑。此外,为了进一步增强迁移性,该方法还结合了细粒度数据增强操作。在多种主流LVLM上的大量黑盒攻击实验结果表明,IGTA在不同模型架构和任务场景中均能高效生成具有迁移性的对抗样本,其攻击性能显著优于现有基线方法。本研究不仅揭示了当前LVLM在视觉结构理解上的潜在安全风险,也为未来设计更鲁棒的多模态模型及相应的防御机制提供了重要参考。
  • 畅舒妮, 闫苗苗, 程永强, 郝润芳, 施熠炜, 卫阳阳, 赵磊, 樊昱萱
    录用日期: 2026-01-30
    尘肺病是一种慢性进展性间质性肺病,其精准分期对临床诊断、治疗策略制定及患者预后评估具有重要意义。针对现有单分支深度学习模型难以同时提取肺部全局与局部特征、导致跨区域病灶信息丢失的问题,构建了一种两阶段的双分支特征融合分期模型。第一阶段进行胸部X线影像数据预处理,利用DualAttention-Net++分割网络,通过通道与空间双注意力机制去除心脏及纵膈干扰,并结合Biorthogonal小波频域重构与空间纹理融合策略实现小样本类别数据增强。第二阶段设计双分支特征融合网络(Dual-Branch Feature Fusion Network,DBFF-Net),主分支采用EfficientNetV2提取全局形态特征,辅分支基于InceptionV3网络多尺度提取局部病灶特征,二者通过自适应融合模块实现跨模态特征互补。局部区域划分基于GBZ70-2015肺野分区规范,采用KD-Tree算法定位关键点以实现精确区域分割。基于来自多家医院的3006张胸片数据(含正常及尘肺I–III期)进行验证,模型在分期任务中的准确率为86.2%,精确率为89%,召回率为88.5%,特异性为98.5%,F1分数为86.1%,AUC值为92.4%。结果表明,该方法能够有效提高尘肺病影像分期的准确性与鲁棒性,为临床自动化诊断提供可行的技术途径。
  • 刘腾, 陈兴宇, 栗风永
    录用日期: 2026-01-30
    针对微尺度篡改难识别与多域特征融合不足的问题,本文提出融合频域增强(FDE)与瓶颈聚合注意力(CFAM)的图像篡改检测框架。方法采用RGB+DCT双流:FDE在频域将特征划分为低/中/高频子带,利用频段注意力抑制冗余低频、强化篡改敏感频段,并以多尺度卷积捕捉边界与中高频扰动;增强后经IDCT回流,实现空间和频域信息互补。融合阶段,CFAM在 1×1 瓶颈内并行建模通道重要性与空间显著性,并通过同域线性聚合对齐两类注意力,区别于现有注意力机制(如SE、CBAM)的串行或单一维度建模,既降低计算开销,又减少信息传递损耗,显著提升对小目标与弱边界的响应。训练中引入加权损失与扰动增强缓解类不平衡并强化鲁棒性。多组公开数据集的统一口径评测与消融实验表明,本方法在精度、鲁棒性与跨域泛化方面优于近期可比方法,且FDE与CFAM具有协同增益;在重压缩、模糊与缩放等强扰动场景中仍能生成高精度篡改掩模,具备良好的效率与可部署性。
  • 周彦, 赵小乐
    录用日期: 2026-01-30
    图像复杂度预测在视觉认知和计算机视觉领域具有重要研究意义。现有方法在有效模拟人类视觉系统、平衡模型复杂度与效率,以及生成可解释的像素级热力图等方面仍面临挑战。针对这些问题,现提出一种可解释的全局-局部复杂度融合网络(Interpretable Global-Local Complexity Fusion Network, IGLCFN),IGLCFN主要由三个关键模块构成:复杂度感知编码块、跨域交互模块,以及可解释图像复杂度热力图生成模块。复杂度感知编码块采用双分支结构,融合了Vision Transformers的全局语义建模能力和卷积神经网络的局部微观建模能力,从而模拟人类视觉系统对图像复杂度的多层次感知过程。跨域交互模块充分考虑了不同分支提取特征的特性,并负责对齐Transformer序列特征与卷积神经网络空间特征。此外,可解释图像复杂度热力图生成模块通过构建基于局部感知分数累加的伪标签数据集进行监督学习,从而生成符合人类视觉系统感知且具有可解释性的像素级热力图。在IC9600数据集上的定量实验结果显示,IGLCFN在所有关键指标上均取得了当前最优性能。相比于多种主流基线、图像质量及图像复杂度预测模型,IGLCFN在保持较低计算资源占用的同时,实现了最高的预测性能。此外,在SAVOIAS数据集上的实验也验证了模型的泛化能力和稳定性。消融实验进一步证实了复杂度感知编码块和跨域交互模块等关键模块的设计合理性和有效性。定性分析表明,IGLCFN生成的热力图能够更精准地聚焦人类视觉感知区域。
  • 张萱, 曹素珍, 刘国锐, 韩磊, 张田昊, 杨小东
    录用日期: 2026-01-30
    供应链数字化转型背景下,多源数据交互与跨企业共享面临数据泄露、策略暴露等安全风险,传统属性基加密方案因效率低、动态管控不足,难以适配场景需求。针对此问题,本文提出云边协同架构下基于属性的策略全隐藏可撤销密文检索方案,以应对供应链复杂场景下的高效数据交互与隐私安全需求。该方案融合边缘实时处理能力与云端强大算力,通过云边协同优化性能:边缘端提供预解密服务,结合云端外包存储,经协作密文缓存管理加速数据获取,依托边缘近用户端低延迟特性,显著降低用户解密等待时间与本地计算负载;采用支持通配符的多值属性与门访问结构与布隆过滤器结合,实现访问策略完全隐藏,有效防范供应链数据传输与存储中的敏感策略泄露,强化数据隐私性;引入区块链与智能合约实现高效检索与动态撤销,设计“搜索合约”自动化验证关键字陷门以缩短匹配时间,通过“撤销合约”动态更新权限完成属性撤销。方案在DBDH假设下满足选择明文攻击不可区分性安全,性能分析表明其计算开销较低,尤其搜索阶段计算开销较BADS方案提升近三分之二,为供应链协同管理提供高效数据检索与安全保障。
  • 陈欣, 王明文
    录用日期: 2026-01-30
    现有的自监督单目深度估计模型通常使用卷积神经网络和Transformer进行特征编码与解码,难以灵活高效地捕捉场景中不规则和复杂物体的几何特征,并且随着神经网络层数的加深,图像中的高频边缘信息被逐渐弱化,导致深度特征缺少关键的边缘细节而影响模型的性能。为解决这些问题,提出一种融合图神经网络与拉普拉斯金字塔的自监督单目深度估计模型。首先,引入视觉图神经网络(Vision Graph Neural Network, ViG)作为骨干网络,对场景的全局拓扑结构关联进行建模。其次,设计了拉普拉斯残差融合模块,将拉普拉斯金字塔残差与编码特征,解码特征在空间维度上拼接融合后使用通道注意力重新校准通道权重,从而实现拉普拉斯金字塔在空间和通道两个维度上的高效融合,以增强解码特征的边缘细节。最后,提出边缘引导的图推理模块,将位于边界处的像素视为图节点并进行显式地图推理,提高物体边界处深度估计的质量。通过在KITTI数据集上进行实验评估,结果显示所提模型与基线方法Monodepth2相比,绝对相对误差Abs Rel降低了12.2%,平方相对误差Sq Rel降低了21.4%,阈值为1.25的准确率提升到89.6%。此外,Make3D数据集的实验结果表明了模型在未见场景上同样具有良好的深度估计性能。相关可视化也验证了模型在预测边缘清晰,细节丰富的深度图上具有一定的优越性。
  • 苗清清, 徐明
    录用日期: 2026-01-30
    在海洋信息化进程中,水声通信面临着多普勒频移、带宽资源有限、量子攻击等挑战。传统的密钥封装机制在应对这些问题时无法满足水声通信复杂的需求。为有效解决上述难题,首先利用正交频分复用(Orthogonal Frequency Division Multiplexing,OFDM)技术结合N 次截断多项式环(N-th Truncated Polynomial Ring Unit,NTRU)双重加密方案提出了一种自适应选择密文攻击(Indistinguishability under Adaptive Chosen-Ciphertext Attack, IND-CCA2)安全的基于NTRU的水下多载波密钥封装机制(DTRM),从而实现了水声通信过程中的抗量子攻击。其次,针对水声通信带宽资源有限的难题,提出了一种小密文扩展的OFDM多载波分片传输方案,从而显著提升了有限带宽下的密文传输效率。另外,针对水声通信网络中复杂的攻击环境,在密钥生成阶段设计了一种基于海洋噪声的拉丁方会话密钥结构来实现后续动态密钥更新机制,该机制实现了在不恢复会话密钥且存在部分密钥分片丢失的情况下对会话密钥进行安全更新,从而显著提升了系统的前向安全性与鲁棒性。并且形式化证明了方案的IND-CCA2安全性。最后通过实验验证分析,DTRM在通信效率上有所提升,而且还实现了抗量子安全,显著优化了水声加密通信系统的整体性能。
  • 李 亮, 肖名志, 陈 曦
    录用日期: 2026-01-27
    针对集中式新闻架构存在单点故障、篡改风险、验证不透明和虚假信息扩散等问题,提出并实现了基于区块链的去中心化新闻检索与聚合架构,实现多源新闻数据的可信存储、可验证检索与透明治理。架构融合区块链、智能合约与分布式存储,形成“链—合约—存储”一体化信任体系;通过共识机制保障数据来源可信,智能合约自动执行治理规则,实现可追溯与高可信性。提出MVF鲁棒任务分配算法与KMPT/TMPT双层可验证索引机制,用于优化任务调度与索引验证,以提升检索与验证效率。系统引入Merkle树完整性验证与多源信誉加权机制,实现信源信誉自适应调整,增强检索准确性和系统鲁棒性。系统在OpenStack私有云环境下完成分布式部署,并基于2024年采集的106,532条闻数据进行实验验证。实验结果表明,该架构相较传统方案,可信验证准确率提升15.6%(P<0.01),抗篡改检测成功率达99.6%,虚假新闻抑制率达92.4%。检索与验证流程的深度融合使可信检索综合效能提升22.3%(P<0.05)。研究结果验证了区块链在可信检索与数据治理中的可行性与工程有效性,为构建高透明度、可追溯的新闻生态体系提供理论支持与工程参考。
  • 张森, 李杰, 张建伟, 李辉, 吴寿英, 吴冯国
    录用日期: 2026-01-27
    深度强化学习(DRL)在无人机(UAV)决策领域的最新研究中展现出强大潜力,已在多种控制任务中取得显著成效。然而,现有将DRL用于无人机控制的研究大多默认“零延迟”理想环境,忽略了真实链路中普遍存在的信号延迟;直接把在 MuJoCo 等基准任务中验证的通用延迟处理方法迁移到高动态无人机平台,往往难以复现其原有效果,甚至加剧性能衰减。本研究通过仿真实验验证了经过深度强化学习训练的无人机智能体在信号延迟下出现的显著性能下降,并深入分析了性能衰退的原因。论文提出了一种状态预测与自适应决策增强框架SPADE,能够有效处理固定与非固定延迟,在1v1近距离格斗任务中实现了与无延迟系统相媲美的控制效果:在300–2400 毫秒延迟区间内,SPADE较基线方法平均胜率增幅为19.4%(固定延迟)13.0%(非固定延迟),显著补偿了软演员-评论家(SAC)算法因延迟造成的性能衰减,且优于现有缓解深度强化学习无人机控制延迟效应的方法。总体而言,本研究揭示了信号延迟对无人机控制系统的负面影响,并提出了创新的状态预测与决策增强框架(SPADE)以应对此挑战,显著提升了在延迟条件下的无人机控制性能。
  • 钟志峰, 彭宅琨, 黄培沛, 王君怡, 王惠芳, 宋宇凡
    录用日期: 2026-01-27
    针对无人机小目标检测中多尺度特征解耦困难、形变目标表征不足及浅层特征保留受限等问题,提出一种基于改进YOLOv8s的目标检测算法AC-YOLO(Accurate-YOLO),以更好适应无人机影像的检测需求。该算法在主干网络中引入多尺度膨胀卷积残差机制改进卷积模块及结构,通过设计不同膨胀率的并行卷积结构,在增强局部细节感知的同时拓展感受野,同时降低冗余参数。特征融合阶段结合轻量化结构与额外引入的P2检测层重构颈部网络,有效增强浅层特征的利用率,显著降低漏检率。为应对目标轮廓复杂、背景尺度变化大的情况,提出改进的可变形卷积动态检测头,通过学习关键区域的可变卷积采样位置,实现对非规则形状目标的自适应感知与表征。此外,在Shape-IoU损失函数构建中引入Inner-IoU思想,以Inner-shapeIoU替代原有损失函数,从而进一步增强目标定位精度与边界框拟合性能。实验在VisDrone-2019数据集上开展对比验证,结果显示改进模型在mAP50指标上相较基线提升12.8个百分点,达到52.6%,在mAP50-95上提升9.1个百分点至32.6%;在Flow-Img数据集上,mAP50达84.5%。上述结果表明,所提模型在无人机视角下的小目标检测任务中具备更优精度与良好泛化能力。
  • 杜晓刚, 张翠, 王营博, 刘统飞, 雷涛
    录用日期: 2026-01-27
    :医学图像分割在疾病诊断、治疗规划与手术导航中发挥着关键作用。但传统方法多依赖大量标注数据,难以满足医疗隐私保护需求。无源域适应因无需源域原始数据、契合医疗隐私保护需求成为研究焦点,但仍面临空间一致性缺失、多尺度特征表征不足及伪标签噪声显著等问题。针对以上问题,提出了一种基于多分支协同校准与可靠加权一致性的无源域适应分割网络(MCC-RWC)。MCC-RWC具有两个优势:首先,设计了一个多分支协同校准模块,利用多解码器预测与逆变换校准生成高质量且空间一致的概率预测,并通过内嵌层级特征聚合模块捕捉细节解剖结构和长距离特征依赖,以增强多尺度特征的表达能力。其次,设计了一个可靠加权一致性模块,通过三次差异化的前向传播与置信度筛选生成高质量伪标签,并利用加权损失与一致性约束抑制噪声,来提升模型的鲁棒性。在多中心心脏MRI和息肉分割数据集上的实验表明,MCC-RWC的性能显著优于现有方法,为临床跨中心分割任务提供了高效且隐私安全的解决方案。
  • 罗纯颖, 丁世飞, 张健, 李璇, 杜威
    录用日期: 2026-01-27
    尽管价值分解方法在多智能体强化学习中广泛应用,但由于自举和最大化操作引起的偏差传播,Q值常被过度估计,导致智能体陷入次优策略,训练结果在成功与失败之间波动较大。传统的探索策略难以有效解决这一问题,因为它们无法引导智能体摆脱次优策略。为此,本文提出了Quest方法,通过动态低估Q值来打破训练中的次优收敛的平衡,并通过非对称偏差引导智能体进行更有效的策略搜索。本文的核心贡献在于突破了传统通过优化Q网络分解来提升性能的局限,提出了一种外部干预机制,通过动态引导智能体的探索,绕过了复杂分解结构的瓶颈,从而有效提升了智能体的表现。为了验证该方法的有效性,本文在StarCraft II的多智能体环境中进行了实验。实验结果表明,Quest显著提高了智能体对次优收敛的鲁棒性,减少了训练过程中的性能波动。根据“抵抗次优收敛的鲁棒性(RASC)”指标测量,在如6h_vs_8z等复杂环境中,Quest的RASC指标平均提高了130%,同时平均胜率提升了190%。这些实验结果表明,Quest在复杂的多智能体环境中有效优化了探索策略,增强了智能体的学习稳定性和最终性能。
  • 吴晓宁, 杜思琪, 罗潘亚欣, 韩锐, 邱可, 侯海婷, 陈铮, 赵玉, 王硕
    录用日期: 2026-01-23
    随着海防部队信息化加速,联邦学习成为分布式数据安全共享的重要手段。然而,海防站点(如前线/后勤部队、设备中心)面临任务差异大导致知识负迁移,和本地模型持续更新但受限于通信带宽(边海防地处偏远)难以共享知识两大难题。现有联邦持续学习方法主要聚焦模型参数与数据特征,缺乏对任务层面的持续学习研究。本文提出任务粒度联邦持续学习方法FedTask,适配图像、文本、表格等多模态海防数据,支持任务粒度的模型知识提取,面向通信窄带宽的限制实现紧凑权重压缩。在中心化/去中心化场景下,通过对相似任务对的识别和聚合,FedTask实现了分布式客户端(海防站点)之间的知识正迁移。同时,本文构建了联邦持续学习系统架构,该系统提供了一体化的数据处理流程和可扩展的算法容器,并支持分布式节点的低代码化协同训练。基于真实的海防数据,本文对比了最新的9种联邦持续方法,测试结果表明,在同等训练时间下,FedTask分别提升中心化和去中心化联邦学习任务平均准确率14.78%和9.78%,并减少75%和85%的通信时间。
  • 欧璇璇, 侯文涵, 胡信豪, 赵金东
    录用日期: 2026-01-23
    :联邦学习通过在分布式设备上本地训练模型并共享参数更新,提高了保护数据安全的能力,但仍面临隐私泄露与恶意客户端攻击的挑战。传统安全聚合协议存在服务器的推理攻击导致的客户端隐私泄露,另一方面,恶意客户端的投毒攻击会导致影响全局模型的性能恶化、收敛性降低,甚至是针对性误分类。针对这个问题,提出一种双向防御联邦学习框架:客户端上传本地模型中的全连接层和通过添加噪声后得到的本地模型参数密文。全连接层参数用于服务器检测投毒攻击,加密后的模型参数用于防止服务器的推理攻击,客户端所添加的噪声在服务器聚合运算中自动抵消,不影响聚合结果的正确性。在统一的框架下,既保护了客户端隐私,也防范了恶意客户端的投毒攻击。分析表明,使用优化的椭圆曲线密钥生成算法,在减少了开销的前提下实现了隐私保护,与此同时,实验发现,该方法在MNIST和CIFAR-10数据集上对四类投毒攻击的检测准确率都达到了较高的水平,误报率低于6%。为联邦学习提供了高效、鲁棒的双向隐私与安全防御方案。
  • 秦 娜, 宋梦浩, 刘 远, 赵一静
    录用日期: 2026-01-23
    深度学习模型作为一种重要的知识产权,其安全可信的部署对推动人工智能应用与创新具有重要意义。当前基于单一触发集响应的模型水印方法存在安全缺陷:其一,触发集的静态决策边界易受对抗扰动攻击,导致验证准确率骤降;其二,基于模型特征的水印机制对模型结构动态重构及高比例参数剪枝高度敏感。针对上述问题提出一种双重交叉验证水印框架(Double cross-validation watermarking, DCVW),首先采用投影梯度下降合成对抗触发样本集作为第一重水印,接着调用深度特征提取网络针对模型应用场景获取其高阶隐式表征,进一步利用Bloom滤波器生成动态哈希链构建第二重水印,并将水印与密钥交由第三方机构保存作为模型指纹。在验证过程中,所有权声明需同时满足触发集响应与模型特征零水印哈希相似度的匹配。水印的鲁棒性实验结果表明,DCVW方案在75%的结构化剪枝下仍能保持模型较高的准确率;在面对歧义攻击时的比特差异率和伪造检测率较对比算法分别提升5.15%和1.04%。双重交叉验证机制保证了模型水印的不可伪造性,为深度学习模型的版权保护提供了一种有效的解决方案。
  • 薛寒冰, 倪晨, 李渔迎, 关佳, 方恺, 崔文倩
    录用日期: 2026-01-23
    知识图谱在构建过程中常因异构数据源或信息抽取错误而引入实体冗余,即多个节点表示同一真实世界实体,严重影响图谱质量与应用性能。针对单知识图谱内的实体规范化问题,本文提出一种名为CRGC-SRM的两阶段框架。该框架的核心创新在于:(1) 提出对比表示引导聚类(CRGC)方法,它结合实体上下文与定义的双视图信息进行对比学习,并利用最小描述长度(MDL)准则对层次聚类结果进行自适应切割,避免了人工设定阈值的难题;(2) 设计了子模冗余最小化(SRM)算法,将代表实体选择问题建模为带分割拟阵约束的子模覆盖最大化问题,在保证近似比的同时,显式地平衡知识覆盖率与冗余度;(3) 针对实体规范化任务的特性,引入了类型一致性惩罚与硬负样本挖掘策略,有效抑制了同形异义实体导致的“过合并”问题。在多个公开及内部数据集上的实验结果表明,CRGC-SRM在聚类质量上相比最强基线平均提升约2.7个百分点,进而将实体冗余率平均从29.7%降至7.8%(较原始图谱削减73.7%),同时保持不低于98%的知识覆盖率,显著改善了图谱质量;并将SPARQL工作负载的平均倒数排名(MRR)提升约15.4%、首位命中率(Hits@1)提升约18.5%,查询延迟95分位数(P95)降低27.7–35.9%,有效提升了查询性能。本文所提框架为解决单图实体规范化问题提供了一套兼具理论保证与工程实用性的高效解决方案。
  • 王宇, 杨军
    录用日期: 2026-01-22
    移动边缘计算(MEC)作为应对计算密集型应用低延迟与低能耗需求的关键技术,能够通过任务卸载有效缓解终端计算压力。然而,在异构多服务器环境中,传统启发式方法及单智能体深度强化学习(DRL)算法普遍存在感知与决策脱节、动作空间高维难以学习、约束处理效率低等问题,导致卸载策略收敛缓慢、适应性不足。为此,研究提出一种高效耦合协同计算多智能体深度强化学习框架(ECCC-MADRL),以实现异构多服务器场景下的高效任务卸载与资源分配优化。该框架构建“客户端-主控”双代理协同结构,通过高效耦合特征提取模块捕捉任务与资源的多维耦合特征,并基于Per-action DQN决策机制分解高维组合动作,实现多用户多服务器间的动态协同。框架设计引入“约束内化”降维方法,将子信道编号从状态与动作空间中剥离,显著降低动作维度;同时建立异构多服务器协同模型,以特征匹配度与负载均衡机制实现跨服务器资源的动态调度。实验结果表明,ECCC-MADRL相较于MAPPO与MADDPG系列基线算法在多个典型场景中实现了30–37%的奖励提升,并将任务超期率降低25–55%;在电量紧张场景下,其设备电量越线率亦减少约40%,充分体现了所提方法在收敛性、效率与鲁棒性方面的显著优势。研究表明,ECCC-MADRL框架能够在异构边缘环境中实现高效、鲁棒的任务卸载决策,为智能边缘计算系统的优化设计提供参考。
  • 黄晨, 高弋羽, 蒋翠玲, 万永菁
    录用日期: 2026-01-21
    精细语义分割对于获取准确的目标边界具有重要作用。然而实际成像场景中,物体的边缘区域往往存在模糊现象,若缺乏对边缘特征的有效建模,容易导致分割结果在细节处不够准确。现有方法通常未能充分关注物体的边缘区域,或依赖额外步骤提取边缘信息,增加了处理的复杂性。为此,本文提出了一种边缘感知的语义分割网络EAM-UNet(Edge Aware Mamba-UNet),该网络利用改进的视觉Mamba捕捉长距离依赖关系并通过双向空洞选择性扫描机制降低现有视觉Mamba模块的计算量;再利用空域引导动态上采样模块对边缘区域上采样过程进行动态调控,确保边缘细节的准确分割;同时,设计边缘聚合感知模块从语义特征中提取并聚合边缘特征,增强模型对边缘区域的表达能力。实验结果表明,EAM-UNet在多个有高边缘分割精度要求的场景中表现优异。在医学图像分割数据集ISIC 2017与ISIC 2018中,该方法分别实现了82.52%与84.07%的mIoU,准确刻画了病灶边界,有助于提高诊断可靠性。在镜架分割的工业数据集GIS上,该方法的mIoU达到98.37%,显著提升了镜架虚拟试戴的可靠性。此外在专注于评估边缘分割质量的Boundary IoU指标上EAM-UNet同样优于现有方法。 关键词:语义分割;精细分割;双向空洞选择性扫
  • 孟坤, 李明兴, 丁建文, 周华春
    录用日期: 2026-01-16
    随着企业数字化转型深入,越来越多企业将核心业务迁移至云端,云计算的弹性扩缩容与 “随买随用” 特性显著提升运营效率,但自然灾害、网络攻击、人为操作失误、硬件故障等风险也随之加剧,一旦发生将导致云上业务中断与关键数据丢失,给企业造成巨大经济损失,因此云灾备技术已成为保障企业信息技术架构稳定、确保业务连续性的核心环节。云灾备技术历经多阶段演进,从早期高成本的本地磁带备份与自建数据中心,逐步发展到结合虚拟化技术的初步探索,再到如今依托云计算实现的多元化灾备方案,衍生出云上、混合云、多云等多种业务类型,不同类型在RPO(Recovery Point Objective, 恢复点目标)、RTO(Recovery Time Objective, 恢复时间目标)等技术指标要求上存在明显差异。然而,当前行业内针对云灾备技术体系的系统性梳理与整合研究仍较为缺乏。基于此,本文综合现阶段云灾备发展现状,研究分析其发展历程中的关键节点、明确备份与容灾的核心概念及金融、制造、医疗等典型应用场景,再聚焦两地三中心这一主流云灾备架构,深入分析数据同步、分布式一致性校验、故障检测等关键技术的研究进展,最后总结异构云资源同步、集群脑裂恢复等现存挑战,并指出结合AI实现智能故障预测等未来研究方向,为企业制定容灾上云策略提供技术参考。
  • 王明军, 李超峰
    录用日期: 2026-01-16
    无线通信的开放性和广播性使得传输信号极易受到非法窃听或恶意攻击的威胁,尽管近年来物理层安全通信技术已成为提升无线传输保密性的有效途径,但现有方法普遍存在密钥空间受限、加密参数固定以及信号保密性能不足等问题,难以有效抵御窃听者日益增强的攻击能力。因此,为了提升无线通信物理层的安全传输性能,该文提出一种新型三维混沌映射动态调控的多域联合调制安全通信方法。通过向Hénon映射中引入正弦、余弦和指数非线性项,构建了三维埃农正余弦指数混沌映射函数(3D-HSCE),并借助分岔图、Lyapunov指数谱与相图验证了其混沌特性。随后,引入极化调制(PM)以扩展信号调制维度,并结合广义多参数加权分数傅里叶变换(GMPWFRFT)进行信号星座扰乱。此外,还利用3D-HSCE混沌映射来实施信号星座幅相加密,并设计了其初始值的状态反馈更新机制来动态调控系统密钥参数,从而实现了信号星座的动态加密。仿真结果表明,所提方法加密后的信号呈现类高斯分布特性,密钥空间可达2326,具备高敏感性与强安全性,即使窃听端密钥与正确密钥存在10-16或10-15的微小误差,其误比特率始终接近0.5,无法解密出任何有效信息,显著增强了系统抗参数扫描与调制识别攻击能力。与2D-HCE-DDL-GMPWFRFT方法相比,本文方法的密钥空间提升了2108倍,当SNR=10 dB时,系统误比特率下降了约2个量级,三种参数条件下的系统安全容量分别提升了约332.5%、45.8%、6.7%,故所提方法能够实现物理层的安全传输。
  • 丁同光, 杜胜东, 赵晗, 钱为, 郭楚珊, 刘凡
    录用日期: 2026-01-14
    短期光伏功率预测是电力系统实现优化调度的核心基础,其精度直接影响系统整体效能。然而,光伏发电功率受多重气象因素影响,所呈现出的短期波动性和随机性给高精度预测的实现带来严峻挑战。近年来,深度学习技术凭借其挖掘数据内在关联特征的卓越能力,为突破性提升短期光伏功率预测精度开辟了全新路径。全面梳理了现有深度学习技术在短期光伏功率预测任务中的应用进展。首先,阐述了深度学习在该预测任务中的典型应用范式;然后,介绍了在可用数据充足、静态且无增量的理想场景下,卷积神经网络、循环神经网络、转换器及图神经网络等深度神经网络在该任务中的应用现状;继而,剖析了基于深度数据增强、迁移学习、联邦学习、在线学习等技术的深度神经网络,在应对数据匮乏、访问受限等现实数据挑战时,在该任务中的应用思路与进展;最后,探讨了当前基于深度学习的短期光伏功率预测研究在鲁棒性、泛化性、适应性等方面面临的挑战,并从模型架构、优化策略等角度对未来技术路线进行了前瞻性展望。
  • 黄颖, 欧阳鹏, 侯英威, 吴维刚
    录用日期: 2026-01-14
    在现实的云边端分层联邦学习场景(如车联网环境)中,终端设备因物理位置的移动会切换边缘服务器,导致终端移动后新连接的边缘服务器的梯度更新会基于不同边缘节点的不同版本模型,从而引发聚合结果偏差、训练效率下降等问题。现有研究仅考虑了在全局聚合后重新分配设备归属边缘节点,且传统的异步联邦学习算法难以适应设备频繁移动的场景,难以解决移动终端跨域的问题。为此,该研究提出了面向移动设备的云边端分层联邦压缩算法FedSAQ(Federated Learning with Staleness-aware Adaptive Quantization):该算法首先通过计算终端设备下载模型与上传梯度的轮次差、衡量本地模型与边缘节点模型的差异计算陈旧度系数,然后根据该系数调整边缘服务器的聚合权重,并采用基于陈旧度的自适应量化梯度压缩算法,能有效利用跨域的训练结果并减少通信开销,与基准算法相比,模型精度提升了0.6%-5%,通信开销降低了至多50%。
  • 武婧婧, 贾向东
    录用日期: 2026-01-14
    无线信号固有的广播特性使通信系统面临潜在的窃听与干扰威胁,尤其在通感一体化(ISAC)系统中,雷达探测信号中常同时承载着通信用户的机密信息,使其安全问题更为复杂。针对这一挑战,在本文中探讨一种有源可重构智能表面(RIS)辅助的安全ISAC系统,提出一种基于人工噪声(AN)的联合安全传输机制,用以增强物理层安全性。在存在潜在窃听者的多用户通信与感知场景中,通过联合设计基站(BS)发射预编码、AN干扰信号和RIS反射系数,在考虑合法用户通信质量的同时,最小化感知性能指标克拉美罗界(CRB),从而实现通信、感知与安全的协同优化。为解决由此产生的多变量耦合非凸问题,提出基于交替优化(AO)、半定松弛(SDR)与主化最小化(MM)的高效算法,将原问题转化为两个子问题进行高效求解。仿真结果显示,与无AN方案相比,所提方案可使窃听信干噪比(SINR)降低约20.3 dB(下降约99.07%),而感知性能仅损失约0.5 dB(约11.28%),实现了安全性与感知精度之间的平衡。与无源RIS相比,所提有源RIS辅助方案在安全性能方面显著提升,并验证了“以感知增强物理层安全”的有效性,为ISAC系统的安全设计提供了可行的方法。
  • 张安勤, 李梓健, 薛梅
    录用日期: 2026-01-13
    随着网络攻击的频发与隐蔽性增强,传统防御机制难以及时识别未知威胁,网络入侵检测作为安全防护体系的核心环节,可在攻击早期实现异常识别与预警,对构建智能化主动防御体系具有重要意义。现有网络入侵检测方法在高阶拓扑依赖建模、全局与局部信息协同以及对抗扰动下的鲁棒性方面仍存在不足,难以同时兼顾检测准确性与泛化能力。针对这些问题,本文提出了一种基于多尺度图扩散对比学习的网络入侵检测模型(MGDCL-IDS)。模型构建了一个面向网络入侵检测任务的多尺度图表示学习框架,针对攻击模式的特质,设计了具有任务导向特征增强与信息协同机制的模型结构。通过拓扑感知的特征优化与多层级对比建模,模型在结构与语义两方面实现了统一表征与高鲁棒检测性能。模型在私有的真实网络入侵检测数据集上准确率达到98.57%,F1分数达到98.68%,精确度达到98.41%,曲线下面积(AUC)达到98.75%;在NF_CSE_CIC_IDS2018数据集上较近期方法准确率提升2.21%,F1分数提升2.08%,精确率提升1.79%,AUC提升0.74%。实验表明,该方法在高阶依赖建模和结构鲁棒性方面均取得有效改进,在检测准确率与误报控制上表现出显著优势,为构建高效、可靠的入侵检测系统提供了可行思路。
  • 闫越, 徐桂琼, 李卫民
    录用日期: 2026-01-13
    近年来,传统图神经网络已广泛应用于谣言检测任务,其核心优势在于能够有效捕捉谣言的传播结构特征。然而,现有模型大多仅聚焦于传播过程中推文间的显式交互关系,既未能充分挖掘用户与推文的深层交互逻辑,也未有效建立推文内容间的语义关联,这一缺陷直接制约了谣言检测性能的进一步提升。针对上述问题,本文提出一种融合用户、传播、语义及时间特征的双超图神经网络模型——UPST-HGNN。具体而言,模型首先引入用户特征与高阶传播特征,构建“用户—传播”超图,以刻画跨主体的复杂交互关系;同时,引入推文语义特征并计算语义相似性,构建“语义—时序”超图,实现语义关联与时间演化特征的联合建模。在此基础上,采用超图卷积网络结合图注意力网络提取超图特征,基于注意力机制动态融合多维度特征表示,最终将整合后的特征输入分类器,完成谣言检测判断。实验结果表明,在公开的PHEME与WEIBO数据集上,UPST-HGNN模型的准确率分别达到86.27%和94.10%。相较于最优基线模型,其准确率进一步提升1.67%与2.8%。这一结果证实,该模型能够更全面地捕捉谣言相关信息,深刻理解传播过程的多样性与复杂性,从而有效提升检测性能,并为谣言检测研究提供了新的思路。
  • 孙菁, 商科峰, 孟利超, 吴康凯, 李晶晶
    录用日期: 2026-01-13
    随着巨型星座逐步成为空天地一体化网络的核心基础设施,其资源调度正面临高维约束、动态任务分配与多目标优化等多重挑战。针对这一领域的智能调度方法,可归纳为三类:基于数学模型驱动、基于启发式算法以及基于深度学习与强化学习的方法。其中,数学模型驱动方法借助混合整数规划、图论建模等工具构建优化模型,通过精确的数学推演描述资源调度中的约束条件与目标函数,在静态场景下能够提供理论最优解,但其计算复杂度会随问题规模呈指数级增长,难以应对大规模动态调度需求。启发式算法依托仿生机制快速生成近似解,在处理中等规模问题时展现出较高的效率与灵活性,不过解的质量易受参数设置影响,且缺乏全局最优性保证。深度学习与强化学习方法凭借数据驱动和交互学习机制,能够从海量调度数据中挖掘隐含规律,通过智能体与环境的持续交互优化决策策略,在动态拓扑、突发任务等复杂场景中表现出独特优势,但其对训练数据的依赖性较强,且决策过程的可解释性仍有待提升。当前研究在跨层协同调度、鲁棒性优化、异构资源融合等方面仍存在不足,未来需进一步探索多模态学习与自适应决策机制,推动巨型星座资源调度向智能化、高效化、可靠化方向发展,为空天地一体化网络的大规模部署与应用提供关键技术支撑。
  • 杜阔, 陈俊芬, 谢博鋆, 李艳
    录用日期: 2026-01-13
    针对2D关键点检测误差较大以及不同关节点的空间结构关系建模能力不足的问题,提出了基于图卷积(GCN)和时空交叉融合注意力(Graph Convolutional Cross-Fusion Attention, GCCFA)的3D人体姿态估计模型。该模型首先设计GCN模块,从局部与全局两个层面建模人体骨架的拓扑信息,增强关节点之间的结构约束与表达能力。然后引入可学习查询融合模块,通过交叉注意力实现关键点特征的动态选择与融合,增强特征的区分性与鲁棒性。最后提出基于Transformer的骨骼长度校正后处理方法,通过自适应学习训练数据中的骨骼长度分布,优化初始3D估计结果,有效缓解由2D检测误差带来的姿态估计偏差。在Human3.6M数据集上的实验表明,骨骼长度校正后,模型的P1误差为38.4 mm,P2误差为30.4 mm,达到当前先进水平。在MPI-INF-3DHP数据集上进行实验进一步验证了方法的有效性。
  • 逄瑞相, 万立, 张智, 吴露露, 周友龙
    录用日期: 2026-01-09
    基于多算法适配需求,设计了一种可重构专用指令集处理器,用于高效支持分组密码与哈希函数。该架构采用超长指令字(VLIW)结构,结合分簇对称执行单元与跨簇寄存器访问机制,实现了逻辑运算、移位、查表等操作的并行化处理。在指令设计上,引入逻辑与查表融合指令、多模式移位指令及向量化操作,减少流水线停顿并提升指令密度。流水线方面,采用三级取指-译码-执行结构,并通过旁路机制解决数据相关问题,缩短关键路径。在算法映射与优化中,分组密码算法如SM4与AES利用Tbox查表与四簇并行调度,将每轮运算压缩至4与7个周期;哈希类算法如SHA-256与SM3通过多模式移位与布尔逻辑指令融合实现,每轮保持在8个周期;SHA-3则基于三阶段映射策略,将五个运算步骤重组为三步流水化执行,显著缓解依赖带来的停顿。硬件实现方面,在Xilinx Kintex-7 FPGA(XC7K325TFFG676-2)平台上完成综合,消耗11105个查找表(LUT)、1564个触发器(FF)、25个片上存储(BRAM),主频为125MHz。在该条件下,处理器实现了SM4 125 Mbps、AES 228.6 Mbps、SHA-256 125 Mbps、SM3 125 Mbps、SHA-3 75.6Mbps的吞吐率。实验结果表明,该架构在低资源开销下实现了多算法的统一加速,性能优于通用处理器扩展方案,具有良好的灵活性与可扩展性。
  • 吉训生, 付凯旋
    录用日期: 2026-01-09
    时间序列预测在金融、气象、交通等领域具有广泛应用,尤其在多分辨率预测场景中,不同粒度的预测需求日益凸显。传统的确定性模型难以刻画未来序列的不确定性,而现有生成式模型如变分自编码器等则在生成质量与建模灵活性方面存在一定局限。为此,提出一种面向多分辨率时间序列预测的协变量条件扩散模型(MrC⊃2;DM)。该模型以历史时间序列与未来协变量作为条件输入,通过引入分辨率类别嵌入控制预测粒度,并利用扩散生成机制从噪声中逐步还原未来序列,从而实现对未来动态的不确定性建模与高质量预测。实验结果表明,MrC⊃2;DM在七个公开数据集上平均较最优确定性模型分别提升5.4%的MAE和13.5%的MSE性能,较最优生成式模型在CRPS指标上提升28.1%,同时在跨分辨率预测任务中保持更高的稳定性与泛化能力。
  • 杨春霞, 王宇龙 , 王新奥
    录用日期: 2026-01-06
    随着城市化与工业化的快速推进,空气污染问题日益严峻,精准预测空气质量指数(AQI)对公众健康与环境保护具有重要意义。然而,现有基于时空图神经网络的空气质量预测方法仍存在明显局限:一方面,受模型结构限制,难以有效建模其他站点在长期历史中通过复杂时空传播路径对目标站点形成的影响;另一方面,现有动态图学习方法主要依赖短序列,无法从长期观测数据中挖掘更具代表性的空间关联模式。为此,提出一种时空上下文感知图网络模型(ST-CAGN)。设计了基于预训练编码器的长序列时空上下文提取模块,将长序列历史数据编码为富含语义信息的低维表示,并高效捕捉跨站点的长期时空依赖;同时,提出一种基于长序列的多尺度动态图学习机制,克服仅利用短期序列构建动态图的局限性。该机制通过从长期历史序列的低维表示中提取稳态空间依赖特征,并与近期波动中捕捉的瞬时空间关联进行自适应融合,从而更精确地刻画站点间复杂的动态空间依赖关系。实验结果表明,ST-CAGN在三个真实空气质量数据集上均显著优于主流基线模型,在6小时、12小时和24小时预测任务中,MAE分别平均下降4.19%、5.47%和6.53%,RMSE平均降低2.10%、3.14%和3.95%,验证了该模型在长序列时空预测任务中的有效性与优越性。
  • 王琦军, 刘庆程, 顾阳, 郁彦珩
    录用日期: 2026-01-06
    针对无人机影像中目标尺寸微小、背景复杂干扰强等问题,传统目标检测算法在特征提取与多尺度融合过程中容易出现特征退化与信息损失,从而导致检测精度下降。为此,本文提出了一种基于混合动态重参数化的微小目标检测算法(HDR-YOLO)。首先,由于传统卷积在微小目标特征提取上的局限,通过引入风车形卷积(Pinwheel-shaped Convolution, PConv)重构了C3K2-PC模块,显著增强了骨干网络对目标底层细节的感知与捕捉能力。其次,针对多尺度融合中的信息退化难题,本文设计了混合动态重参数化模块(Hybrid Dynamic Reparameterization Module, HDRep),通过低失真尺度变换与深层特征精炼相结合,实现高保真多尺度特征重建。基于此,进一步提出了全新的多尺度特征融合颈部结构(Multi-Scale Feature Fusion Neck, MSFPN),该结构通过优化跨层信息流,有效提升了模型在复杂背景下的鲁棒性。在 VisDrone2019 数据集上的实验结果表明,HDR-YOLO 在 mAP@50 和 mAP@50:95上分别达到 43.7% 和 26.5%,较 YOLOv11n 基线模型分别提升 10.2% 和 7.0%。同时,在公开的 AI-TOD 数据集及自建的 HVL-Cond 数据集上的实验进一步验证了所提算法的优越泛化性能与稳定性。
  • 翟洁, 孟天鑫, 阮彤, 刘井平, 李彬彬
    录用日期: 2026-01-05
    线上“轻问诊”决策树是为轻症患者提供导诊科室、初步诊断或治疗建议的问诊决策树。基于医学文献文本构建“轻问诊”决策树,无法满足真实“轻问诊”场景中情况各异患者的问诊需求,在研究特定疾病领域最新进展方面也存在滞后性。若由医学专家基于个体经验人工构建“轻问诊”决策树,不仅效率低,而且缺乏统一的标准化表征。因此提出了一个全新的决策树生成任务,基于线上“轻问诊”对话文本数据集生成决策树(Medical Decision Tree Generation based on Online Light Consultation (DTGOLC)。面向该任务,提出了基于大语言模型的“轻问诊”决策信息摘要生成方法LCDTSG-LLM (Light Consultation Decision Text Summarization Generation Method Based on Large Language Models)和基于问诊决策路径融合的“轻问诊”决策树生成方法MDPFDT(Medical Decision Path Fusion for Decision Tree)。本文生成了5547条决策路径以及近30棵“轻问诊”决策树。最终本文将决策树集合作为外部知识库进行了检索增强生成(RAG)实验,实验结果表明,本文生成的决策树在辅助轻问诊决策任务方面的表现显著优于基线模型,其F1分数相较于以原始问诊对话文本作为知识库的基线模型,平均提高达27.58%。
  • 郭伟, 樊子茜, 曲海成
    录用日期: 2026-01-05
    针对无人机电力巡检中绝缘子缺陷图像存在的目标尺度差异大导致的小目标缺陷漏检率高以及复杂背景下检测精度低等问题,本文提出了时频协同注意力绝缘子缺陷检测算法。首先,为扩大卷积核感受野、增强对图像低频信息的提取能力,在网络主干上集成小波变换卷积模块WTCM;并在此基础上,设计多尺度卷积注意力增强模块MCAAM,通过结合通道与空间注意力机制,进一步抑制复杂背景对绝缘子目标的干扰;其次,为进一步提升模型在复杂环境下的鲁棒性,设计频域调制注意力机制FMAM,这一机制通过融合频域与空域信息,使模型能够更全面地感知图像特征,确保检测结果的稳定性和可靠性;最后,设计自适应加权特征融合AWFF,通过动态调整特征融合权重增强跨维度特征交互,进一步提升网络表征能力。实验结果表明,该算法的mAP50达到92.4%,较基线模型提升4.8%,小目标缺陷召回率提升5.2%,推理速度由112提升到了132。此外,绝缘子损坏、锤子和闪络三类缺陷的AP值分别提高了7.6%、1.7%和9.8%。相比基线模型YOLO11n,改进模型在检测精度与推理效率方面均表现出更优性能。
  • 徐智霞, 王蕊, 沈晓卫, 何兵, 康伟杰
    录用日期: 2026-01-05
    组网雷达干扰资源分配问题是典型的NP问题,同时也是一大难题,需采用各种优化算法对其进行求解,针对传统干扰资源分配优化算法计算速度慢、适应性差的问题,系统梳理了干扰资源分配的智能优化算法的研究进展。首先构建了组网雷达干扰资源分配的数学模型及求解框架,分析了其求解难点,强调智能优化算法在计算效率、全局优化能力及鲁棒性等方面的明显优势;然后以遗传算法、粒子群算法、蚁群算法及其各种改进算法为典型代表,对智能优化算法在组网雷达干扰资源分配中的实施流程、求解效果及优缺点等进行详细分析,并对融合算法及其它仿生/机器学习智能优化算法在该领域的应用进行总结归纳,从适应性、收敛性、全局搜索能力等方面对比分析了各类算法的优劣,充分展现了智能优化算法在该应用方向上的发展现状;最后结合当前组网雷达干扰资源分配所面临的多重挑战,从算法对比、寻优速度、融合创新与动态适应性四个方面对智能优化算法未来的发展方向做出了展望,对组网雷达干扰资源分配中智能优化算法的研究及工程实践具有重要的参考价值。
  • 胡静, 赵新瑜, 彭铭超
    录用日期: 2026-01-05
    跨模态图文检索作为多模态理解的核心任务之一,面对图像与文本在模态表达、语义抽象层级和结构组织等方面的天然异质性,如何实现高精度语义对齐与模态间鸿沟的跨越成为当前研究的关键挑战。为此,本文提出一种跨域特征解耦与语义原型引导的图文检索模型(DPNet),旨在提升复杂场景下的细粒度图文匹配能力与检索鲁棒性。该模型设计了频域-空间联合解耦、层次化语义增强以及双模态交互注意力机制,实现跨模态特征的结构化重构与判别表达的增强。针对传统方法难以兼顾空间结构与频域纹理的建模缺陷,提出的频域-空间解耦模块采用异构多头注意力机制,在保留局部空间语义的同时挖掘全局周期模式,实现视觉特征的多维协同表达;为弥补局部词汇与全局语义对齐的失衡,语义增强模块融合词性标注与深度可分离卷积,引导模型聚焦关键语义区域,提升对事实描述与主观评价等语义模式的建模能力;此外,针对训练样本不平衡和噪声敏感问题,提出的动态边界三元组损失可自适应调整相似度判别边界,结合语义原型对比学习进一步增强类内紧致性与类间分离性。在Flickr30K与MSCOCO两个主流数据集上的实验结果表明,所提方法在细粒度图文检索任务中在MSCOCO数据集上的R@1、R@5、R@10指标上分别取得1.0%、0.1%、0.2%和1.4%、0.6%、0.3%的性能提升,显著优于现有主流方法。本研究为复杂跨模态场景下的高精度、实时检索提供了一种高效可行的解决思路。
  • 欧阳玲, 李辉, 兰巨龙, 邬江兴
    录用日期: 2026-01-05
    动态异构冗余架构(DHR)采用多维动态重构实现执行体的异构和冗余,基于策略裁决的闭环迭代实现系统的动态更新,赋予系统内在安全基因,使其具备天然的主动防御能力。然而,DHR通常需要执行体有较大的异构性以避免共有漏洞而造成的攻击逃逸现象,异构性带来的差异会导致执行体出现因应用程序状态转换不一致、加密输出不一致,导致的输出结果无法裁决的问题。本文针对上述问题,以分布式共识理论为基础,提出了一种隐藏领导者分布式共识算法。该算法采用基于相对时间的程序进程同步方法,解决异构执行体运行状态失步问题;采用密源归一化策略,解决异构执行体数据加密和报文中的随机数差异问题。具体介绍了算法的运行机理,给出了算法流程;最后搭建了验证平台对算法的有效性进行了对比测试。测试结果表明,在复杂进程调度应用中的不同实验场景下,该算法相较于已有的同步方法,可分别提升0.82%和5.65%的进程同步率,并能实现加密数据的正确裁决处理,吞吐量相较基于加密解密的密文裁决方法可提升大约68.38%。
  • 徐冲聪, 周志峰
    录用日期: 2026-01-05
    脊柱侧凸的诊断依赖Cobb角的精确测量,而传统手工测量Cobb角存在主观性强、效率低及一致性差的问题,难以满足临床标准化与高效性需求。本研究提出了一种基于几何约束混合注意力 SwinUNet的脊柱Cobb角自动测量方法(GHA-SwinUNet)。该方法以U-Net为基础架构,引入Swin Transformer模块增强全局结构建模能力,结合混合局部通道注意力(MLCA)提升椎体局部细节感知,并设计几何约束后处理策略解决椎体黏连问题;同时,在Cobb角计算阶段,采用端板直线拟合法规避传统中点法的几何偏差。实验结果表明,该方法在自建脊柱X光数据集上分割性能优异:Dice相似系数(DSC)达0.9483、精确率(Precision)为0.9504、平均交并比(mIoU)为0.9483,较传统U-Net的DSC提升1.11%、较 MA-Net的DSC提升0.27%。同时,在Synapse和AASCE2019公开数据集的跨验证中,模型保持稳定性能(DSC分别为 0.9512、0.9425)。Cobb角自动测量与人工测量的一致性相关系数(ICC)大于0.90,平均绝对偏差(MAD)约为 3°,表明一致性良好。综上,该方法在保证分割与测量精度的同时兼顾效率,且在多源影像上泛化能力强,为脊柱侧凸的定量化评估与临床辅助诊断提供了可靠技术支撑。
  • 兰晨曦, 沈宗亮, 冯建周, 张华
    录用日期: 2025-12-30
    大语言模型具有强大的上下文学习和文本生成能力,在信息检索与简报写作等任务中潜力显著,但在处理对于时效性、真实性以及规范性有较高要求的任务时能力不足,例如在特定领域的格式化文档生成方面仍缺少有效方法。因此需要将智能体技术和模型微调技术两者结合。该文提出了融合大模型智能体架构与大语言模型微调的格式化文档生成方法,通过大模型智能体架构实现实时新闻信息的获取并验证过滤,构建特定领域大模型微调数据集,采用微调技术增强其生成风格规范文本的能力。在不同领域数据集下进行了测试优化与效果验证,实验结果表明该方法在语义相似度、文本相似性等评价指标上性能均优于基线方法。表明该方法可有效强化模型对特定领域的理解与文本生成能力,并为生成文本的时效性与真实性提供可靠保障。
  • 高六龙, 黄正坤, 姜晓巍, 孙功星, 李佳枫
    录用日期: 2025-12-30
    近年来,深度学习在计算机视觉、自然语言处理等应用领域取得了巨大的成功,致使高能物理研究者也开始关注深度学习技术,并探索其在强子喷注标记任务中的应用。最初研究者们将喷注数据转化成图像和序列数据,采用卷积神经网络和循环神经网络对喷注进行标注,但存在计算效率慢和可解释性差的问题。为了解决这些问题,研究人员对网络结构进行了多方面的改进,并在构建的多种喷注标记数据集进行训练,提升了模型分类的性能。本文对新型网络模型的重要模块进行深入分析综述,包括基于集合表示喷注的方法、等变性神经网络的应用以及喷注基础模型的探索。同时,对各种标记分类器进行了分析和比较,评估各种网络结构的性能,并对相关模型现状进行了分析与总结,探讨了深度学习模型在喷注标记任务中的应用前景。
  • 韩振, 于瓅
    录用日期: 2025-12-30
    遥感图像中的小目标检测由于特征表征能力不足、复杂背景干扰以及多尺度变化显著而面临较大挑战,尤其在资源受限的应用环境下,更需要在检测精度与模型复杂度之间实现有效平衡。针对这一问题,提出了一种高效的小目标检测框架——多尺度空间注意力YOLO(MSSA-YOLO)。首先使用自主设计的层次化特征模块(HFBlock),通过动态尺度选择和双轴多尺度卷积机制增强小目标的特征表征能力;其次设计轻量化下采样模块(LDSample),结合高效下采样与残差连接技术,在降低计算量的同时尽可能保留小目标的重要特征信息;最后引入Focal-WIoU损失函数,通过自适应加权和梯度抑制机制优化边界框回归过程,从而进一步提升检测精度。在VEDAI、VisDrone2019和AI-TOD三个公开数据集上的实验结果表明,MSSA-YOLO分别实现了0.754、0.436和0.519的mAP50指标,相较于基线模型YOLOv11s,在参数量减少8.9%的同时,mAP50分别提升7%、4.4%和18.5%。此外,与SP-YOLOv8s和SMN-YOLO等先进检测模型的对比实验显示,MSSA-YOLO在检测精度和模型效率上均取得较为明显的优势。结果表明,该方法不仅适用于小目标检测任务,还在不同尺度目标的检测中表现出较强的泛化能力,能够在资源受限和实时处理场景下提供一种可行的解决方案。