作者投稿和查稿 主编审稿 专家审稿 编委审稿 远程编辑

最新录用

Please wait a minute...
  • 全选
    |
  • 赵培源, 龚晓亮
    录用日期: 2025-12-04
    针对现有康复机器人仿真研究中生物力学特性与机器人控制策略失配、人机耦合仿真自动化不足等问题,本研究创新性地整合了机器人运动学分析、训练轨迹规划设计以及肌肉骨骼模型生物力学特征,构建了一种基于OpenSim和MATLAB的上肢康复机器人人机联合仿真系统,并提出了一套自动化人机耦合仿真流程。系统实现了对匹配完成模型的同步关节角度调节与运动播放可视化展示。在机器人仿真层中,提供了正向运动学、逆向运动学的计算,并针对不同应用场景提供了四种轨迹规划算法,计算结果经格式转换后传递至生物力学仿真层。在生物力学仿真层中,结合残差缩减与计算肌肉控制补偿未建模外力(即间接补偿机器人外力数据误差)并优化肌肉激活度求解,同时支持对仿真计算结果中的肌肉激活程度、肌肉纤维长度等生物信息进行可视化展示,帮助康复医师更加精准地判断患者的康复效果。实验验证证明,与传统人工处理方法相比,RSVH系统将仿真准备时间减少约40%,并且简化了跨平台仿真操作的复杂度。更得益于其多任务并行执行能力,RSVH系统在仿真效率与自动化程度上显著优于单任务处理模式的现有系统。
  • 崔浩然, 全婷, 陈茂伟, 戴荣
    录用日期: 2025-12-04
    在计算流体力学问题求解过程中,使用AMG算法能够有效提高求解速度。作为目前最常用的CFD开源软件,OpenFOAM中采用了基于LDU矩阵格式的GAMG算法,在CPU上实现了流场求解加速。近年来CPU+GPU的异构并行计算系统蓬勃发展,国产GPGPU也取得了突破,实现了国产化替代。面向上述异构计算系统,广泛开展了CFD中的GPU加速算法研究,在国产平台上实现对OpenFOAM中GAMG算法的异构并行化设计,能够充分发挥国产算力性能,大幅度提高流场仿真效率。面向CPU+国产GPGPU加速卡的异构计算平台,设计并实现了一种针对LDU矩阵格式的GAMG并行加速方法,充分利用了GPU多线程的并行优势,实现了GAMG全部算法组件在GPU上的并行优化。最后通过对3D顶盖驱动方腔流和motorBike绕流算例的基准测试,在不同算例规模下对异构平台上的GAMG进行正确性验证和性能测试。经实验表明,所提出的算法在计算精度方面和原版本保持一致,基于Jacobi平滑器配置的GAMG异构算法相较于基于Gauss-Seidel平滑器配置的CPU串行方式实现了10-27倍的加速效果。性能分析表明耗时占比较大的限制算子和光滑算子的计算速度得到显著提高。实验结果验证了该GAMG并行求解框架在国产异构平台上的有效性和计算潜力,为CFD求解器在国产GPGPU平台上的异构并行化与工程应用提供了可行路径与技术基础。
  • 王豪, 秦进, 杨昌好
    录用日期: 2025-12-03
    蚁群优化(ACO)算法被广泛应用于求解组合优化问题时,好的启发信息有助于快速收敛到高质量的解。现有神经蚁群优化算法,如深度蚁群优化(DeepACO)和生成流蚁群采样器(GFACS)利用深度强化学习自动化设计启发信息,显著提高了现有ACO算法的求解质量。然而,现有神经蚁群优化算法仅基于问题实例的静态特征生成启发信息,未考虑每只蚂蚁的部分解时序特征。这导致启发信息难以有效引导不同蚂蚁基于探索进程进行差异化搜索,丧失多样性。同时,现有神经蚁群优化算法采用图神经网络(GNN)聚合信息时,仅聚合节点特征,未考虑将边特征与节点特征融合后再聚合,导致GNN聚合的信息不够充分。为此,融合时序特征与边特征的神经蚁群优化(TEF-NACO)算法被提出。TEF-NACO算法通过循环神经网络(RNN)提取每只蚂蚁的时序特征,再与全局图结构信息融合。并且,在GNN的节点信息聚合阶段,充分考虑节点特征与边特征,以提升GNN的信息捕捉能力。同时,为损失函数添加基于边注意力的正则项以提高训练的稳定性。实验表明,TEF-NACO算法在24个组合优化任务中的最佳表现的数量超过ACO、DeepACO和GFACS的百分比分别为100%、87.5%和75%,平均精度提升分别为21.5%、3.4%和3.2%。
  • 伍清波, 武友新, 于程远
    录用日期: 2025-12-03
    三维高斯溅射(3DGS)在新视图合成与高精度场景重建中表现卓越,然而,其过高的模型存储开销严重限制了实际应用。为此,提出了一种轻量化压缩方法,以降低3DGS模型存储开销并提升渲染效率。首先,引入基于局部颜色差异与冗余度的重要性评分度量方法,以识别并剔除冗余高斯基元;此外,提出一种融合高斯滤波与下采样的抗混叠渐进式训练策略,以提高训练的稳定性与效率;在此基础上,针对高斯基元的不同属性,采用混合量化方案以进一步提高压缩比;最后,结合Morton编码与残差编码对高斯基元的坐标属性进行压缩,进一步减少模型体积。为验证方法有效性,模型在多个真实数据集上与多种现有压缩模型进行了对比实验,结果表明,所提方法在保持与Reduced-3DGS相当渲染质量的同时,模型体积相较于原始3DGS降低97.8%,相较于Reduced-3DGS进一步压缩38.8%,同时提升了训练与渲染效率,相较于现有的其他压缩模型均具有显著优势。模型实现了压缩率与渲染质量之间的良好平衡,为推进3DGS在三维场景重建中的实际应用提供了有效解决方案。
  • 吕王靖, 戚兆波, 刘心岩, 张北辰, 张维刚
    录用日期: 2025-12-02
    长时动作预测作为计算机视觉领域的重要任务之一,旨在基于第一人称视角视频,预测视频主体在未来长时序范围内可能执行的动作序列。该任务的挑战在于未来行为具有不确定性,视频中的行动者在相同情境下可能遵循多种合理的行动轨迹,而数据集中的视频样本往往只涉及其中一种,限制了模型对多样性的学习。此外,模型输入的视频片段较短,而需预测较长的未来过程,观测信息不足与推理跨度较大的矛盾进一步加剧了预测难度。为缓解上述挑战,提出了一种名为引导协同网络的预测框架,该框架基于大小模型协同的机制,由小模型预测模块和大模型辅助模块构成,两个模块分别承担预测建模与预测空间约束的功能。小模型由视觉编码器、 提取器以及动作预测器组成,依次对输入视频进行编码、视觉辅助信息提取,并生成未来动作的预测分布。视觉辅助信息提取器通过融合手部线索与物体区域特征,引入交叉注意力机制,建模手部和物体的交互关系。大模型辅助模块基于大型语言模型,识别当前场景中出现可能性较低的物体名词,并将其用于约束小模型的预测器,通过对预测空间中不合理选项进行屏蔽,有效提升预测的准确性与合理性。此外,对损失函数进行了优化,设计名词时序平滑损失,约束预测名词的分布,使其在时序上具有连贯性。在Ego4D和50Salads数据集上进行验证评估。实验结果表明,在Ego4D数据集上与基线模型相比引导协同网络在名词的预测上取得了8.9%的改进,在动词上取得4.2%的改进。
  • 励皓轩, 张志远, 刘芮, 许沛华, 田昕
    录用日期: 2025-11-27
    高分辨率的气象数据对于本地和区域尺度的生产生活有重要意义,而基于深度学习的降尺度技术能有效弥合现有气象低分辨率数据与应用需求间的鸿沟。目前深度学习气象降尺度方法常受限于固定整数缩放因子,导致多倍率场景下训练成本高。并且,现有方法在气象数据中仍存在高频细节预测不准、结果模糊的问题。针对上述问题,研究提出一种融合隐式神经表达和自适应特征编码的深度学习超分辨率网络,用于任意倍率气象降尺度。其核心动态像素特征聚合模块利用可学习调制器动态调整特征提取过程,使像素特征能自适应不同缩放因子;图像级隐式表达模块则通过注意力机制融合坐标线性差异与邻域非线性特征,实现连续域像素值预测。结合高阶退化训练策略,在ECMWF HRES和ERA5数据集上的实验表明,同固定倍率方法相比,该方法在×2倍率下的PSNR指标可高出至少0.7 dB;而同任意倍率方法相比,该方法在×2倍率下的PSNR指标可高出至少0.48 dB。这些结果说明该方法优于现有经典方法,为气象数据应用提供了更加灵活高效的解决方案。
  • 宋呈群, 张可, 杨梦杰, 程俊
    录用日期: 2025-11-26
    针对大型设施与复杂场所安全监控中人工巡逻效率低、存在安全风险等问题,本文旨在在保证全域覆盖的同时优先关注高风险区域,并提升路径规划的效率与稳健性。为此提出风险导向的智能巡逻策略:将巡逻任务建模为“全面巡逻+单次巡逻”的组合;基于高斯混合模型构建静态/动态风险热图以评估优先级;设计基于双曲正切权重的目标点更新方法,抑制目标过度聚集,实现风险与空间分布的均衡。在路径生成方面,提出多目标点快速扩展随机树算法,包括多目标点可行路径规划与信息子集优化:多目标点可行路径规划估计任意两点间可行代价,并结合蚁群优化确定访问顺序,拼接得到贯穿所有目标点的单条可行路径;信息子集优化在以起终点为焦点、由当前最优代价确定主轴的椭圆信息子集内采样,并结合改进的快速扩展随机树重连对该路径进行迭代精炼,输出更短、更光滑的优化路径。仿真结果表明,相较于以欧氏距离为成本的基线方法,所提方法显著缩短最终路径长度,在迭代受限条件下具有更高的求解成功率与更快的收敛速度;系统能够实现全区域覆盖,并对高风险区域分配更高的巡逻频率,适用于工业厂房、危险品仓储与大型公共建筑等场景。
  • 张珑耀, 温东新, 马庄宇, 舒燕君, 李庆, 刘明义, 左德承
    录用日期: 2025-11-26
    基于大语言模型的多智能体系统虽在处理复杂任务方面展现巨大潜力,但其分布式特性与交互不确定性易引发多样化异常,威胁系统可靠性。为系统化识别并分类此种异常,本研究进行全面综述。研究选取七个代表性多智能体系统及相应数据集,收集13,418段运行轨迹,采用LLM初步分析与专家人工校验相结合的方法进行数据分析。研究构建了一个涵盖模型理解感知异常、智能体交互异常、任务执行异常和外部环境异常四个层级的细粒度异常分类框架,并结合典型案例揭示了各类异常产生的内在逻辑与外部诱因。统计分析显示,模型理解感知异常占比最高,其中“上下文幻觉”和“任务指令误解”是主要问题;智能体交互异常占16.8%,“信息隐瞒”是主因;任务执行异常占27.1%,主要表现为“决策重复出错”;外部环境异常占18.3%,以“记忆冲突”为主。此外,模型理解感知异常常作为根源性诱因,引发其他层级的异常,凸显了提升模型基础能力的重要性。此分类和根源分析旨在为构建高可靠的基于大语言模型的多智能体系统提供理论支撑与实践参考。
  • 王雯, 杨奎武, 仝松松, 魏江宏, 薛岩, 周荣魁
    录用日期: 2025-11-26
    模型知识产权保护已成为模型安全中不可忽视的问题,水印技术作为模型溯源的核心手段,通过将特殊标识嵌入模型参数或生成内容中,为版权验证提供技术支撑。然而,训练完成的含水印模型非常容易被复制并扩散,这使得攻击者能够通过微调、剪枝或对抗样本攻击等特定技术手段,破坏或去除DNN模型中嵌入的水印,使得模型所有权无法验证。为了更深入地了解模型水印攻击方法,首先对模型水印攻击进行介绍,其次对模型水印攻击方法进行分类,根据攻击者对目标模型的访问权限和信息获取能力,分为白盒水印攻击和黑盒水印攻击两类,对DNN模型水印攻击的动因、危害、攻击原理和具体实施手段梳理和分析,同时对现有模型水印攻击研究从攻击者能力以及性能影响等方面进行比较与总结。最后,进一步探讨了神经网络模型水印攻击在未来研究中的潜在积极作用,为模型安全和知识产权保护领域的深入研究提供建议。
  • 张俊娜, 王泓尊, 丁春涛
    录用日期: 2025-11-25
    后训练量化(Post-Training Quantization, PTQ)是一种高效的模型压缩方法,它无需重新训练模型,只需少量(或无需)无标签校准数据即可将高精度浮点模型的参数转换为低比特整数表示。该方法在显著降低存储与计算开销的同时,能够最大限度地保留原始模型的推理精度,因而受到学术界与工业界的广泛关注。本文从PTQ的量化步骤、方法分类、工具生态和应用进展四个维度,系统总结了PTQ的研究进展。首先,构建了清晰的量化流程框架,涵盖动态范围统计、量化参数计算、权重与激活量化、误差优化和模型生成等步骤;其次,提出了一个完整的量化方法分类体系,从量化粒度、位宽、校准方法到结构导向量化;再次,分析了支持PTQ规模化应用的工具生态,探讨了其在硬件适配和工程部署中的应用价值;最后,总结了PTQ方法的融合与应用进展,并指出PTQ方法在实践中面临的挑战,尤其是跨模态一致性、极低比特语义崩塌与硬件适配等难题。这些实践挑战的总结不仅揭示了当前技术的局限性,也为未来研究提供了重要方向。本综述为学术界与工业界提供了PTQ方法的参考框架,助力推动人工智能在资源受限场景中的广泛应用。
  • 张可, 陈嘉豪
    录用日期: 2025-11-21
    多跳图卷积网络(Multi-Hop GCN)在缓解过压缩问题上具有一定成效,然而多跳传播设计在信息聚合过程中存在一定的参数化信息压缩损失以及对局部拓扑结构敏感,导致该类模型进行节点分类任务时难以达到理想的预测效果。针对上述问题,本文从多跳图卷积模型的层内与层间两个角度出发,采用基于预测传播解耦的解耦式技术和知识跳跃模块对上述问题进行优化,从而构建一种新型多跳图卷积网络——知识-半解耦式多跳网络DrJK-Net。首先,提出一种保留激活函数的半解耦式技术简化多跳传播层内结构,通过去除隐藏层中的线性层,减少多跳传播过程中特征变化次数,降低参数化的信息压缩损失;然后,在传播层间添加知识跳跃连接,通过连接所有隐藏层嵌入,提高模型对隐藏层嵌入的自适应选择能力,降低对局部拓扑结构的敏感度;紧接着,将多跳图卷积骨架与简化层内信息传播的半解耦式技术、建立层间信息通道的知识跳跃连接模块结合,提出参数化信息压损损失更低、对局部拓扑结构适应性更强的模型框架DrJK-Net。最后,在Citeseer、CoraFull与Actor等多个公开论文网络以及社交网络数据集上进行了对比实验与消融实验,对比实验结果表明DrJK-Net在节点分类准确性上超过多数前沿模型且运行速度优势明显,而消融实验结果进一步验证了提出的半解耦式技术与引入的知识跳跃连接机制的有效性,为多跳图卷积网络的发展提供了新的思路与方法。
  • 钮 焱, 孙 杨, 李 军
    录用日期: 2025-11-21
    多模态情感识别旨在理解复杂的人类情感表达,现有方法在处理情感表达的细微差别和模态间复杂交互时,普遍面临准确性和鲁棒性不足的挑战。具体而言,传统语音特征提取方法难以全面捕捉跨越多时间尺度的情感信息,且现有融合策略在整合互补信息与处理模态间复杂关联方面效率有限,同时,类别不平衡和边界样本问题也常导致模型性能下降。针对上述问题,本文提出了一种面向语音和面部图像的多模态情感识别新方法。该方法首先在语音特征提取阶段引入多尺度注意力机制,替代传统多层感知机,能够自适应地聚焦并捕获从微观音素变化到宏观韵律模式的情感特征,实现了更全面的情感信息提取;其次,设计了自适应多专家协调决策架构,通过专家网络和自适应多模态专家协调网络,高效整合不同模态的互补信息并处理模态间的复杂交互;最后,提出了边界交叉熵损失函数,结合交叉熵与合页损失的优势,以增强模型对边界样本和类别不平衡问题的处理能力。在RAVDESS数据集上的实验表明,该方法准确率达到了89.8%,相较于基线模型提升3.1个百分点,验证了模型改进的有效性。
  • 郭伟, 孟巧巧, 金海波, 田聪聪
    录用日期: 2025-11-20
    业质检领域,钢表面缺陷检测普遍存在目标特征融合不足、边缘细微缺陷漏检及样本分类不均衡等问题,为此提出一种多尺度交互与动态协同的钢表面缺陷检测算法。在主干网络中,通过融合移位稀疏卷积和倒置残差结构,强化不同感受野下缺陷特征的交互融合,提升多尺度缺陷的特征表达能力;引入大分离核注意力机制,动态增强对细微缺陷区域的特征响应,降低裂纹、夹杂的漏检率;在颈部网络中,结合DySample动态上采样策略,实现基于缺陷内容的动态上采样,在提高小目标缺陷轮廓清晰度的同时减少计算冗余,适配边缘设备部署;此外,设计融合指数移动平均与滑动阈值机制的EMASlideLoss损失函数,动态平衡难易样本的学习权重,改善缺陷样本分布不均导致的检测偏差。在NEU-DET数据集上的实验表明,该算法平均精度均值mAP50%达到84.4%,相比于原始YOLO11n提升5.8%,精确率和召回率分别提升5.2%、4.8%的同时计算量下降8%。该算法在优化计算效率的同时提高了检测精度,更能满足工业场景下的检测需求。
  • 刘颖, 张润宇, 杨朝树
    录用日期: 2025-11-20
    日志结构合并树(Log-Structured Merge tree,LSM-tree)被广泛用于键值存储系统,凭借顺序写入机制实现高效的写入性能,但同时也带来了读写放大率高、合并任务开销大及数据冗余等问题。传统优化方案通过调整树结构、优化合并策略以及采用键值分离机制等方式提升系统性能。然而,在大数据时代,数据规模急剧飙升,LSM-tree 需要处理更频繁的写入与合并任务,导致 CPU 计算资源持续紧张,逐渐成为系统性能提升的瓶颈。此外,传统优化方案未能避免主机与存储设备间大量的I/O操作,仍面临高昂的冗余数据迁移开销。计算存储技术为应对上述挑战带来了新思路。该技术在存储层部署额外算力资源,通过任务卸载减轻CPU负担,或进一步通过近数据处理降低数据迁移带来的性能损耗。本文聚焦于基于计算存储技术的LSM-tree优化研究。首先,对计算存储技术架构进行梳理。然后,针对大数据背景下系统面临的主要瓶颈,从合并任务优化与数据迁移优化两个方面对现有方案进行分类介绍和对比讨论。最后,结合当前研究的局限性与发展趋势,对未来的研究方向进行了展望。
  • 贡同, 卢晓黎, 桑雨, 李思漫, 于博文
    录用日期: 2025-11-19
    夜间目标检测场景中,由于目标亮度较低且手动标注大规模夜间图像成本高昂,很难进行大规模的有监督训练。为解决这一问题,提出了一种基于改进RT-DETR的夜间图像域适应目标检测方法DTN-DETR。首先,设计了一种光度一致性匹配方法,将白天源域的光度特性与夜间目标域相匹配,生成类似目标域的夜间图像。其次,提出了双域优化模块改进的骨干网络,包含两个核心设计:特征优化模块和双域信息交互模块。特征优化消除特征通道中的冗余信息。双域信息交互则利用频率域和空间域信息交互,处理具有不一致频率的眩光和噪声,解决夜间场景局部多光源的耦合性现象。最后,引入了P2检测头,通过多层次特征融合提升夜间场景小目标的感知能力。在公共数据集BDD100K,SODA10M和Foggy Cityscapes上的实验结果表明,所提出的方法在目标检测任务中相较于现有的最先进方法具有显著的性能优势,验证了其有效性和鲁棒性。
  • 谭台哲, 杨洋, 战荫伟, 杨卓
    录用日期: 2025-11-14
    煤矿井下复杂光照环境导致图像存在对比度低、细节模糊的情况,现有的图像增强算法存在特征捕捉能力不够全面,且针对不同层次的语义特征之间融合方式低效等问题,本文提出了融合卷积和MLLA的煤矿井下图像增强方法(ICM),在卷积阶段堆叠了多个具有退化感知的混合专家模块,使模型能够自适应恢复在图像增强过程中由于丢失的局部纹理细节,解决伪影、细节特征不清晰的问题。使用具有背景感知能力的MLLA(Mamba Like Linear Attention)模块对图像中的长期依赖关系进行建模来提高输出增强图像的全局结构一致性和改善纹理保真度。引入交互式融合分支以编码主干特征和重建特征之间的阶段相关性,有效利用局部和全局特征辅助图像增强效果。分段损失函数在不同增强阶段设置不同的损失目标,使得网络能够在每个阶段自适应地优化。与近期表现优秀的深度学习方法对比,ICM方法在评价指标PSNR、SSIM、NIQE和LPIPS展现出最佳效果,分别为30.524dB、0.946、3.06和0.23,能够有效地提升煤矿井下低照度图像的亮度、对比度和清晰度,为矿井安全监测与智能决策提供可靠视觉支持。
  • 段杰, 宋丽娟, 马子睿
    录用日期: 2025-11-13
    基于深度学习的生存预测在整合全玻片图像(Whole Slide Images, WSI)与基因组学数据方面取得进展,但WSI的超高分辨率与转录组的高维特性使特征提取与跨模态融合面临挑战。原型聚合虽可将图块与基因表达压缩为形态学与通路原型以降复杂度,仍存在两大瓶颈:难以捕捉两种模态原型间的细粒度交互; WSI形态学原型与基因通路原型间存在显著的表示异质性。为此,本文提出基于多层次最优传输的弱监督生存预测模型(MOTSurv),包含三项协同创新:其一,双模态原型编码器(病理编码器集成金字塔位置编码PPEG、通路编码器建模通路内相关性)以强化模态内结构与保留模态特异性;其二,级联的多层次最优传输融合机制,先完成粗粒度全局对齐,再细化匹配并纠偏误配,兼顾对齐精度与信息保持;其三,正交解缠模块(ODM),通过模态间特异性正交、模态内特异-共享正交与全局特异-共享正交的多层约束,实现特征解缠并提升可解释性。基于TCGA的BLCA、BRCA与LUAD三数据集的实验结果表明,MOTSurv较先进方法在C-index上平均提升4.22%,消融研究进一步验证了各组件的独立与协同贡献,展示了模型在多模态对齐、结构化表征与生物学可解释性方面的综合优势。
  • 王泽宇, 吉根林, 朱炜
    录用日期: 2025-11-13
    基于骨架的零样本动作识别任务借助的是文本标签描述信息和骨架动作信息来对可见类别与未见类别的动作进行区分。现有的方法通常受到视觉特征生成质量不高问题的限制,无法准确对齐语义造成在相似动作的识别上效果欠佳。为了解决这个问题,本文提出了基于双鉴别器和时空自校准的方法(DD-STSC)来探索视觉语义对齐。该方法通过变分自编码器和生成对抗网络的结合,利用鉴别器和生成器进行对抗训练,挖掘不同特征间的差异化信息,同时在解纠缠中更好的分离出有用信息与无用信息,以此进一步提升生成样本的质量。此外,还引入了动作自校准模块(ASCM),通过在时空方向对骨架信息进行学习可以更有效地获得需要的关键运动信息,从而提高分类任务的准确率。在公开数据集NTU60、NTU120、PKU51上进行了实验,结果表明所提出的方法优于现有主流的方法。
  • 徐海喆, 黄凌霄, 姚新波, 高勇占, 周开元
    录用日期: 2025-11-13
    针对基于对比语言-图像预训练(CLIP)的弱监督语义分割(WSSS)中存在的图像细粒度语义对齐不足、文本上下文局部细节感知有限和伪标签图像局部细节感知不足、噪声扩散等关键问题,提出特征融合对比学习框架FFCLIP,该框架以冻结的CLIP模型为骨干,通过引入全景感知注意力(PPA)、矩形校准模块(RCM)和加权跨模态融合(WFF)三大创新模块,显著提升了跨模态语义对齐能力、局部边界感知能力以及伪标签质量。基于CLIP主干网络构建的多阶段弱监督语义分割训练架构,在VOC2012验证集和测试集上分别取得76.9%和77.5%的mIoU,较主流方法CTI提升2.8%和4.3%;在COCO2014数据集上的达到47.1%的mIoU,显著优于CPAL等基线模型。实验表明,FFCLIP在保持低计算成本(新增6M参数,显存占用峰值6.2GB)的同时,显著提升了弱监督条件下的语义分割精度,为多模态学习与弱监督分割的融合提供了新思路。代码链接:https://github.com/xuwudang/FFCLIP
  • 苏娜, 裴厚清, 徐力 , 王经钧 , 纪淑娟
    录用日期: 2025-11-11
    现有日志异常检测技术在语义建模中往往忽略时间上下文信息,模态融合能力不足,并且普遍过度依赖日志解析,这些局限使模型难以捕捉语义内容突变与时间行为异常并存的复杂模式。为解决上述挑战,本文提出了一种无日志解析的端到端检测模型(Log Spatio-Temporal Fusion,LogSTF)。该模型采用语义与时间双分支结构,语义分支获取上下文感知的语义特征,时间分支以时间级与序列级的双粒度建模同时捕捉局部突发与全局演化的时间模式;在此基础上,通过跨模态的双向交叉注意力实现模态融合,显式建立语义与时间之间的细粒度依赖,从而提升对复杂日志行为的建模与判别能力。在HDFS、BGL和Thunderbird三个公开日志数据集上进行实验,结果表明LogSTF在三个数据集上的F1值分别达到99.64%、98.45%和99.67%,与最新的两个基准模型LAnoBERT和LogFormer相比,F1值平均相对提升5.20%和2.03%,通过消融实验验证了时间信息与模态协同对性能提升的关键作用。基于轻量语义扰动下的鲁棒性测试,验证了LogSTF在非理想日志条件下的稳健性与泛化表现。该方法在无需日志解析的前提下,实现了对复合型异常模式的高精度识别。
  • 李旭, 罗德哲, 王红军
    录用日期: 2025-11-10
    随着全球海上运输的快速发展,船舶轨迹预测在航运安全与管理中扮演着重要角色。然而,面对大规模船舶轨迹数据及复杂海上环境的不确定性,如何实现高精度且物理合理的连续轨迹预测仍是一个关键挑战。传统预测方法在处理复杂海上环境和大规模动态数据时存在局限。为此,本文提出了一种基于地理约束的多方法融合船舶轨迹预测模型。该模型通过引入地理约束损失函数,优化了轨迹预测中的位置精度、航向稳定性和物理合理性。同时,结合双向门控循环单元、注意力机制和多尺度卷积等模块,设计了多方法融合的船舶轨迹预测网络结构,提升了时序特征提取和多尺度信息融合的能力。实验结果表明,本文模型在多个海域数据集上均表现出较低的预测误差,特别是在长时间预测中相较于现有模型具有显著优势。研究证明该模型在船舶轨迹预测中具有较高的准确性和稳定性,能够为海事领域的实际应用提供有效支持。
  • 姚迅, 何园, 胡新荣, 杨捷
    录用日期: 2025-11-10
    序列推荐系统在捕捉用户动态兴趣方面表现出色,但其开放性使其极易遭受数据投毒攻击。攻击者通过篡改物品的文本描述,能有效操纵推荐结果,这对模型的鲁棒性构成了严峻挑战。现有防御策略大多依赖静态规则或固定强度的扰动,难以应对语义层面日益复杂和多变的文本攻击。为解决此问题,本文提出了一个名为RADAR的双阶段协同防御框架。该框架有机融合了训练时鲁棒性增强与推理时实时防护:首先,在训练阶段引入动态对抗训练,提升模型抵御未知文本扰动的内在能力;其次,在推理阶段利用大语言模型(LLM)进行精准的语义级异常检测与内容修复。实验结果表明,RADAR框架防御性能卓越。在Scientific数据集的攻击测试中,相较于最强的基准模型(Cert-LLM),RADAR能将恶意项目曝光的增幅从3.1796%锐减至0.9921%,有力地证明了该框架在增强序列推荐系统安全性与鲁棒性方面的有效性。
  • 郭洋, 孙静宇
    录用日期: 2025-11-07
    随着量子计算技术的发展,传统图像加密算法面临抗量子攻击能力不足的挑战,而现有量子图像加密算法存在量子比特消耗大、混沌系统参数空间有限等问题。针对上述待解问题,本文提出一种基于混沌系统的双量子图像加密算法,以实现低资源消耗与高安全性的平衡。首先,提出双位平面量子图像表示模型(DBRQI),仅需 个量子比特存储 灰度图像,较 BRQI 模型减少50%量子比特消耗,其次,构建三维超混沌系统(3D-CHCMM),4个控制参数的参数空间较现有系统提升33%,3个李雅普诺夫指数均为正值且通过15项NIST测试,可生成高随机性伪随机序列。算法通过DBRQI映射量子态,经奇偶位平面置乱与行列随机置乱打乱像素信息,再与伪随机序列执行异或操作生成密文。实验结果表明:加密图像水平相关性低至0.0041、信息熵达7.9993、NPCR为99.6251%,抗攻击与抗干扰能力显著增强。本文算法为当前量子硬件受限场景下的图像加密提供了高效解决方案。
  • 张瑶, 张俊三, 马俊朋, 姚宗全, 刘天一
    录用日期: 2025-11-07
    针对复杂场景下多尺度目标检测任务中存在的跨层级特征交互不足、特征表达能力有限等问题,提出一种基于 YOLOv8 的改进模型CAFR-YOLO。首先,设计了一种新颖的跨尺度特征重组流程,构建了通道注意力引导的跨尺度特征重组模块(CAFR)。该模块通过以特定层级为融合主干,结合尺度对齐、注意力加权融合及特征子集拼接策略,有效缓解了传统特征金字塔结构中跨层级交互不足的问题。其次,在局部层面,主干网络中引入 C2f_DCNv3 模块,利用可变形卷积的动态采样特性显著提升了模型的几何适应性;在全局角度,结合可切换空洞卷积(SAC)与 C2f 模块构建 C2f_SAConv 模块,通过动态空洞率优化了多尺度语义特征融合,二者从不同维度增强了模型对复杂场景的鲁棒性。最后,采用 SPDConv 替代传统卷积架构,通过空间-通道维度的特征重组增强了模型表征能力,同时降低了计算复杂度。实验结果表明,在PASCAL VOC数据集上,CAFR-YOLO取得了86.3%的mAP@0.5和67.2%的mAP@0.5:0.95,计算量与原模型相当;在MS COCO数据集上,map@0.5和mAP@0.5:0.95分别提升了3.5%和3.9%。与现有主流方法相比,CAFR-YOLO在多项指标上均表现出显著优势,在保持计算效率的同时,显著提升了多尺度目标检测的精度和鲁棒性,为实时目标检测任务提供了新的解决方案。
  • 田红鹏, 李志强, 杨赛
    录用日期: 2025-11-05
    在轻小型无人机图像目标检测任务中,常面临检测精度低、背景复杂、目标尺度变化大、分布密集以及模型参数量较大的问题,因此提出一种基于改进 RT-DETR无人机目标检测算法。首先,使用热传导模块HeatBlock和空间选择注意力模块LskBlock改进C2f得到C2f-Heat-Lsk模块,然后使用C2f-Heat-Lsk模块和C2f模块来重新设计RT-DETR主干网络,提高主干网络对小目标的特征提取能力并减少模型参数量。其次,提出特征融合结构SOFEP替代原网络的特征金字塔,缓解小目标细节信息丢失的问题,并增强小目标的特征表示。最后,结合Focaler-IoU和MPDIoU两种损失函数来构造Focaler-MPDIoU损失函数,提高边界框的回归精度进而减少模型的漏检率。实验结果表明,在VisDrone测试集上,改进模型参数量较RT-DETR降低16.9%,mAP0.5和mAP0.5:0.9指标分别提升2.6%和1.9%,在DOTAv1.0和HIT-UAV 数据集上均优于RT-DETR算法。改进模型在保持较小参数量的同时,提高了检测精度,满足了无人机航拍图像小目标检测的应用需求。
  • 梁士超, 温雯, 冯雅莉, 郑佳碧, 郝志峰
    录用日期: 2025-11-05
    如何建模和学习用户行为的时间模式是时序推荐中的重要问题,但现有的时序推荐研究大多聚焦于单一类型行为的模式学习,未能充分挖掘多类型行为(如点击、购买、收藏等)的内在多元模式,制约了推荐效果的提升。本文着眼于行为数据中个体行为的多季节序列依赖特性以及不同类型行为间随时间变化的复杂依赖关系,构建了一类针对多类型行为时序模式学习的深度模型(MSMB)。具体而言,该模型包含一个融合了多尺度指数移动平均(EMA)机制的双通道序列编码器,能够精准捕捉各行为序列中多季节的时变规律;同时引入了跨行为依赖模块,兼顾不同周期粒度,以有效建模不同行为间的动态关联性。在三个基准数据集上进行的大量实验验证了所提模型的有效性和优越性。
  • 陈浩芝, 蔡瑞初, 李梓健, 郝志峰
    录用日期: 2025-11-05
    时间序列分割是时间序列分析中的一项重要任务,在生物行为分析和物理系统分析等领域得到了广泛的应用。然而,现有的时间序列分割方法普遍忽略了分布偏移下时间序列的非稳态特性,导致模型在非稳态时间序列中难以实现精准分割。为了解决这个问题,首先,提出一个基于现实场景的数据因果生成过程假设。在该假设下,观测数据背后的隐变量可分为稳态隐变量和非稳态隐变量,其中稳态变量表示不变或周期性变化的信息,非稳态变量表示动态变化的信息。其次,基于该因果生成过程假设,设计了稳态非稳态解耦模型,该模型将稳态和非稳态变量进行解耦,可以更加关注时间序列中的非稳态依赖关系。此外,为了准确解耦与提取变量,利用变分推断的证据下界(ELBO)来构造模型的损失函数,并基于该证据下界,通过稳态和非稳态先验神经网络模块来提高隐变量解耦的准确性。最后,通过实验证明,在各种基准数据集上,该模型的性能优于几种最新的时间序列分割方法,突显了其在实际场景中的优势。
  • 赵巍岳, 吴婧雅, 卢文岩, 李晓维, 鄢贵海
    录用日期: 2025-11-05
    新兴业务在数据中心中引入了大量的大粒度RDMA通信需求.RDMA依赖物理地址通信,大粒度访问时地址翻译所需使用的地址翻译页表项(Page Table Entry, PTE)超过了硬件设备的缓存空间.目前高性能的商用方案使用主机内存储存PTE,但这种结构使大粒度访存只能在读取主机内存的PTE之后才能执行传输,这引入了PCIe穿透和主机内存访问延迟,导致地址翻译效率严重下降和主机CPU开销.为实现高效的大粒度RDMA,本文设计可配置的高性能地址映射结构:息壤(XiRang).XiRang通过流取机制和层级缓存设计高效扩展访存粒度,通过可配置的地址翻译阵列实现了灵活、高吞吐的地址翻译性能.XiRang原型基于DPU实现,实验表明:1) XiRang有效卸载RDMA数据面地址翻译负荷,与主机CPU解耦;2) XiRang使用的流取扩展机制有效降低存储开销,并发模式下高速缓存消耗仅为10 Byte级别,并发的存储开销可忽略不计;3) XiRang在高并发访存请求数量下,保持接近100%的翻译表项查询命中率,翻译引擎空闲时间相比RNIC架构降低2到3个数量级;4) XiRang的翻译吞吐是RNIC翻译架构的60倍以上,是基础DPU地址映射结构的3.5倍以上;5) 使用性能增强模式,XiRang的地址翻译速度可支持1.4 TB/s的数据传输带宽.
  • 贾兴隆, 秦俊平, 闫凯, 刘铮, 王丹, 邵欣然, 邵泽州
    录用日期: 2025-11-05
    针对野外复杂背景下濒危动物识别精度不足的问题,该研究对YOLOv8模型进行改进。首先,在主干网络中引进蛇形动态卷积(DSConv),增强模型对遮挡情况下的检测性能;其次,在颈部网络中引入全局注意力模块(GAM),提高模型对濒危动物相关信息的关注度,对环境等不相关的特征进行抑制,减少冗余信息;然后,在头部网络设计小目标检测头,对浅层特征图进行融合,提高网络对小目标的感知和定位能力;最后,使用基于最小点距离的边界框损失回归函数(MPDIoU)替换传统的CIoU算法,从而提高算法的收敛速度和定位精度。实验结果表明,本文模型对于复杂背景下的濒危动物检测精度和平均精确度分别为96.2%和97.2%,相较于基础的YOLOv8n检测精度和平均精确度分别提高了2.1和2.4个百分点。利用相同数据集在不同的目标检测模型上进行对比实验,与Faster-RCNN、SSD、YOLOv5、YOLOv7等模型相比,平均精度均值分别提升了28.7、22.5、3.5、2.4个百分点。实验证明,改进YOLOv8模型可为实现复杂背景下的濒危动物检测提供理论依据。
  • 吴仕勋, 汤培尧, 蓝章礼, 徐凯, 张淼
    录用日期: 2025-11-04
    基于接收信号强度指示(RSSI)的WiFi指纹定位技术凭借其部署便捷性与成本优势而备受关注。然而,现有指纹定位方法高度依赖于海量数据的模型训练,且数据增强方法生成的虚拟样本数据质量参差不齐,进而影响模型定位性能。此外,模型泛化能力不足,一旦环境发生变化,模型定位性能会急剧下降。为应对以上挑战,本文通过构建深度融合注意力机制的卷积神经网络(CNN)定位模型,结合元学习驱动的小样本学习(FSL),采用粒子群优化(PSO)算法在超参数空间物理约束下进行自动化数据精选与模型协同调优,提出了基于小样本学习驱动的多参数优化WiFi指纹定位方法。实验结果表明,所提方法在CJU数据集和Tampere公开数据集上分别实现了0.52米和6.88米的平均定位误差,相较多种对比算法定位精度分别至少提升了49.5%和8.7%;同时,在CJU-2024数据集上进行了模型泛化性测试,通过少量数据使模型快速适应新环境,所提方法仍能达到2.17米的平均定位误差,定位精度至少提高26.7%。由此表明,所提出的方法能够有效提高室内定位的精度并且能够在新环境下有出色的性能表现,展现出良好的泛化能力。
  • 杨莹莹, 车进, 白雪冰, 肖龙, 简丽琼
    录用日期: 2025-11-04
    现有的无监督行人Re-ID方法通常只关注行人的整体特征导致全局特征偏差以及数据多样性不足而影响识别精度,为解决该问题,本文创新性地提出了一种基于ViT的融合多层次数据增强(MDAM)与特征净化(FP)的无监督行人Re-ID方法(DAFP)。首先,设计了包含几何空间变换、表观特征扰动和遮挡模拟的MDAM,扩展了训练样本多样性,提升模型跨摄像头场景的鲁棒性。此外,构建FP模块,将Transformer输出的局部特征按空间位置划分为上下两部分,并与全局特征进行多视图距离矩阵的自适应加权融合,结合DBSCAN聚类算法生成高质量伪标签,有效缓解了传统方法因依赖单一全局特征而导致的相似行人误聚类问题。最后,通过全局-局部聚类对比损失函数,动态更新全局与局部聚类中心,实现了对行人细粒度特征的增强学习。在Market1501、DukeMTMC-reID和MSMT17三个数据集上的mAP/Rank-1结果分别达到90.5%/96.0%,77.6%/87.6%和64.5%/86.0%,显著超越了最先进的同类方法,验证了本方法的优越性。
  • 唐尉淋, 王俊峰, 葛文翰, 张成程, 詹维璐
    录用日期: 2025-11-04
    网络威胁情报(CTI)在缓解网络攻防的不对称性方面具有关键作用,但现有战术、技术和程序(TTP)提取方法主要依赖人工标注的全监督语言模型,存在效率低、一致性差的问题。尽管MITRE ATT&CK框架通过标准化分类缓解了TTP描述问题,但当前基于自然语言处理(NLP)的方法仍面临泛化能力不足、版本适配滞后和可解释性差三大挑战。为此,通过融合大语言模型先验知识与外部可信知识,提出了一种基于零样本学习的大模型TTP抽取方法DetecTTive。该方法创新性地利用ATT&CK官方知识库作为外部知识源,融合向量语义知识检索和图增强关联推理,结合智能体工作流实现自动化白盒推理,在提升零样本性能的同时确保结果可追溯。实验表明,该零样本方案在基准数据集上F1达到80.02%,召回率达到83.46%,有效解决了传统模型的数据偏差和版本适配问题,为动态威胁环境下的TTP抽取提供了可解释的低成本解决方案。
  • 范钦龙, 孙业鹏, 卢记仓, 祝涛杰, 刘伊琳
    录用日期: 2025-11-04
    随着互联网的普及和发展,海量用户对热点话题的评论与传播,深刻影响着现实世界中事件的进程与发展。因此,挖掘公众对热点话题的立场与态度,对于网络舆情监测、社会安全治理等领域具有重要的现实意义。立场检测技术旨在从用户生成的文本中识别其对特定对象的态度。尽管已有许多研究提出了不同的任务场景和技术方法,但针对立场检测任务,仍未形成统一的分类标准。首先,本文从任务场景和技术方法两个维度对立场检测任务进行了综述,系统梳理了该领域的研究现状与发展趋势。从任务场景的角度,将立场检测任务划分为面向特定对象、对象迁移和对象泛化三种场景,突出了研究从特定领域向更广泛应用逐步演进的趋势。从技术方法的角度,将立场检测方法归纳为基于模型工程、知识工程和数据工程的三大类,并分析了各类方法的优势与局限性。此外,本文还从多个维度对公开的数据资源进行了统计与实验分析,揭示了立场检测数据集的关键特征及发展趋势。最后,对全文进行了总结,并展望了未来的发展方向及面临的挑战。
  • 武倩楠, 丁卫平, 樊晓雪, 鞠恒荣, 周琳琳, 王静
    录用日期: 2025-10-31
    特征选择可从复杂数据中筛选有效特征,提升信息处理效率,然而在部分标签数据场景下,标签具有模糊性、样本间复杂关系以及特征重要性评估困难,都致使传统特征选择方法面临诸多挑战。为此,本文提出一种针对部分标签数据集的有效特征选择框架MFG-FS。首先,针对部分标签的模糊性,设计一种基于MLP-Mixer模型和对比学习的端到端消歧方法,以优化样本特征表示空间,增强区分能力,从而获得更可靠的标签置信度;其次,为准确刻画部分标签数据下复杂的样本关系,构建了一种融合多源信息的模糊相似关系信息粒,能有效融合基于特征空间的局部结构、基于消歧后标签的全局关联以及标签约束;然后,在构建的模糊信息粒基础上,定义并利用模糊互信息度量进行特征评价,该度量能够量化特征子集与标签的相关性及内部冗余性,为高质量特征子集选择提供可靠依据;最后,本文提出的方法在包含了5个合成数据集和4个真实数据集上进行了相关实验,结果表明该MFG-FS能够选择出更具区分度和鲁棒性的特征子集,在部分标签消歧和分类准确率方面具有较好的性能。
  • 黄玉琦, 杨晓霞, 杨容浩, 廖方舟, 严乐, 郭俊强, 李明涵
    录用日期: 2025-10-30
    面向自动驾驶感知的道路目标检测旨在实时定位与识别车载视觉范围内的机动车、非机动车及行人等交通参与者,为环境感知模块提供精准输入,支撑自动驾驶系统的决策与控制。由于道路场景背景复杂、目标形态多样且尺度差异大,导致感知系统的误检率与漏检率较高。针对形变目标检测精度低、多尺度目标检测不足、全局感知能力弱的问题,提出基于YOLOv8n的改进算法YOLOv8-DDL。首先,引入可变形注意力DAttention改进骨干网络的C2f,通过动态学习特征偏移,增强对交通场景中多种形态目标的捕捉能力,提升模型对复杂空间分布的适应性,有效减少错检。其次,融合大核可分离注意力LSKA改进SPPF,通过大核卷积扩大感受野,增强模型的全局上下文建模能力,提升复杂背景下的鲁棒性。最后,设计动态多尺度自适应融合模块DMAF及动态特征金字塔网络Dynamic-FPN重构颈部网络,通过动态融合高低层特征,增强模型在多尺度特征融合中的表达能力,改善多尺度目标检测效果。在公开数据集SODA10M上进行实验,结果表明,相较YOLOv8n,YOLOv8-DDL在精确率P、召回率R、F1值、平均精确度mAP@0.5上分别提升了5.9%、1.3%、3%、1.5%;在公开数据集BDD100K上进行辅助验证,精确率P、召回率R、F1值、平均精确度mAP@0.5分别提升了2%、0.6%、1%、2%。
  • 陈俊宏, 周凤, 田有亮, 杨科迪, 张起嘉
    录用日期: 2025-10-29
    随着各行业数据训练需求的增加,数据已成为关键生产要素。数据确权可明确数据权属并分配利益,防止未经授权的使用。然而,现有确权方案在数据收集、存储和使用等方面存在权属不可控、确权效率较低等问题。为解决以上难题,提出一种基于陷门哈希的权属可控数据确权方案。首先,为防止流转过程中数据所有权丢失,构建了持有权、管理权、使用权三权分离的确权模型,实现权属的精细化划分。其次,针对现有确权算法管理权生成不可控的问题,提出一种基于陷门哈希的数据确权算法,实现数据管理权生成可控与变更的同时,提高了确权的效率。此外,结合区块链技术设计了一种授权可追责的数据交易协议,通过精细化控制数据的收集与访问,并将确权信息上链,实现了数据交易的不可抵赖性和可追溯性。最后,通过安全性分析和性能分析得出,所提方案与传统方案相比,在保证权属签名不可伪造的同时,本方案的计算与存储开销方面具有优势。
  • 高建伟, 赵舒通, 黄宁泊
    录用日期: 2025-10-28
    在人工智能快速发展的背景下,针对当前应急决策中公众参与不足和专业知识依赖性强等问题,提出一种基于大语言模型与检索增强生成技术的群体智能应急决策方法。旨在整合社交媒体公众数据与领域知识库,构建“公众-专家”协同的多属性决策模型,提升灾害应对的科学性与响应效能,并将其应用于突发应急管理中。首先,利用Python爬虫工具从微博平台获取公众评论,形成应急灾害需求数据库;其次,基于RAG技术整合应急管理专业数据库以增强模型生成能力,通过提示词工程引导主题分类,构建主题词共现网络,采用Louvain算法聚类,结合专家校验优化,生成应急决策的属性集;然后,综合重要性和内聚性两方面因素,构建属性权重测度模型;最后,考虑决策者心理行为,采用TODIM方法对备选应急方案进行排序优化。以7•20河南暴雨事件为例,实验结果表明,本文所提方法能够生成符合公众需求的应急决策主题,在主题的一致性和多样性表现较好,分别为0.583和0.943,验证本文所提方法的科学性和有效性。
  • 赵庶旭, 陈彦红, 王小龙, 蒋恺俊
    录用日期: 2025-10-28
    :针对移动边缘计算中因需求波动与大规模突发任务引发的资源失配、负载瓶颈及服务不稳定等问题,提出 一种基于近似Shapley值的合作供给策略ASVC。首先,构建了基于双向偏好匹配的任务分配模型,结合用户任务 的性能需求与边缘节点的资源状态,通过Gale-Shapley算法实现供需最优匹配;其次,为降低构建联盟时Shapley 值的计算复杂度,提出了基于自适应抽样的 Shapley 值计算优化方案,该方案在保证计算精度的前提下,实现了 Shapley 值计算时间的阶跃式减少;最后,依据节点贡献度比例进行任务数据分配,提升系统公平性与资源利用效 率。仿真结果表明,提出的 ASVC 算法相较于现有算法,在服务质量、时延控制、任务完成率和系统负载均衡方 面分别提升约27.8%、31.0%、30.8%和21%。
  • 吕艳丽, 江伊雯, 冯函宇, 郭振奇, 向声
    录用日期: 2025-10-28
    随着生成式人工智能技术在敏感行业的深入应用,生成式大模型在微调阶段对训练数据的过度“记忆”问题日益严重,易导致用户身份、行为轨迹等敏感信息在推理阶段被重现,造成隐私泄露风险。针对这一问题,提出一种融合差分隐私(Differential Privacy, DP)与低秩适配(Low-Rank Adaptation, LoRA)的微调训练方法,在冻结预训练模型主体参数的基础上,仅对插入的LoRA模块进行梯度更新,并在训练过程中引入差分隐私随机梯度下降(DP-SGD)机制,对单样本梯度实施范数裁剪与高斯噪声注入,以控制模型对个体样本的敏感依赖。该方法以Qwen2-1.5B语言模型为基础,构建包含用户画像的指令式微调数据集,并设计针对身份标识、行为特征、位置信息等典型敏感字段的攻击样本,对比传统全参数微调与DP-LoRA方法在防泄露能力上的差异。实验结果表明,全参数微调模型在130条攻击样本中敏感信息匹配率高达73.07%,显示出严重的隐私风险;而DP-LoRA微调模型的匹配率显著降低至1.5%,整体生成内容与原始数据相关性极低。该方法有效降低了敏感信息重现概率,为生成式模型在数据安全要求较高的实际场景中提供了一种低成本、高适应性的训练策略。
  • 杨国正, 齐冬震, 陈攀, 沈照斌, 尹鹏语, 霍彦霖
    录用日期: 2025-10-27
    资源公钥基础设施(RPKI)是保障BGP路由安全性的一项重要机制,通过路由源授权(ROA)和路由源验证(ROV)两项核心功能,实现对自治系统(AS)发布路由宣告的合法性验证。近年来,随着RPKI应用的持续拓展,研究者围绕ROA配置问题与ROV部署测量开展了大量工作,从不同维度刻画了RPKI在现实网络中的运行状态与防御能力。当前RPKI相关综述集中于对RPKI体系本身研究的阐述,着重强调RPKI体系的脆弱性,对于RPKI实际部署中遇到的关键问题及其相关研究并没有进行系统梳理和深入总结。对近年来RPKI系统部署问题的相关研究进行了系统综述,重点梳理了ROA配置中常见错误类型,包括ROA良性冲突以及松散ROA展开系统性分析,揭示其成因与对路由安全的影响;对现有的ROV部署测量方法进行了综合归纳,并进行了对比分析,同时总结了对ROV验证有效性与路径传播影响的评估方法,最后给出RPKI部署问题研究的未来发展方向,为后续在RPKI部署优化、安全评估与策略研究等方向提供了理论基础与方法参考,有利于促进RPKI体系的部署推广,有效防御BGP前缀劫持。
  • 刘玫瑰, 张能, 李佳乐, 赵玉琦, 李增扬
    录用日期: 2025-10-27
    软件项目中的冗余依赖可能导致构建体积增加、性能开销上升以及维护负担加重。尽管已有研究关注Maven生态系统中的冗余依赖问题,但对冗余依赖在不同依赖作用域(如编译和测试)中的分布特征、演化模式及其对项目受欢迎程度等的影响仍缺乏分析。为此,选取GitHub平台上2,214个Java Maven开源项目作为研究对象,采用mvn命令识别各项目中引入但未被实际使用的冗余依赖,并结合依赖的作用域信息进行冗余比例的定量分析。接着,在698个项目的3,817个历史版本中采用Mann-Kendall非参数趋势检验方法,识别冗余依赖的演变趋势。此外,为评估冗余依赖与项目受欢迎程度和社区活跃度之间的关系,构建包括Star增长率、Fork增长率、Issue关闭率等在内的五种GitHub流行度和活跃度指标,并进行皮尔逊相关性分析。实验结果显示,冗余依赖主要分布在编译和测试作用域,其冗余比例中位数分别为33.33%和30.00%;在演化趋势上,48.1%的项目冗余比例保持稳定,36.2%的项目冗余比例波动,少数呈现增加或减少趋势;在相关性分析中,仅Issue关闭率与冗余依赖比例表现出显著弱负相关性。研究结果可为开发者提供细致的依赖管理视角,助力优化项目配置与提升软件可维护性。
  • 高嵩, 高博麟, 芦健, 吴粤隆, 王鹤, 徐月云
    录用日期: 2025-10-27
    如何量化不同传感器感知算法对物理世界映射的差异并识别边界数据,是实现高价值边界数据自动化提取的关键问题。本文提出了一种基于多源传感数据的差异引擎,用于边界数据的自动发现。该引擎由差异认知模块和差异率计算模块组成。在差异认知模块中,我们定义差异率来构建差异率与感知映射差异的关联模型,并将一个数据集的平均差异率作为基准差异率以量化感知映射差异,辨别边界数据。其中,由测试集计算的激光雷达、毫米波雷达、视觉感知算法的基准差异率分别为0.17、0.23、0.19。在差异率计算模块中,针对相机目标与激光雷达目标、毫米波雷达目标、相机目标的匹配,使用了基于卡方分布与威尔士损失的2D像素距离匹配策略。通过与只使用3D距离匹配策略的融合算法比较,二者与真值在测试集的差异率分别为0.16和0.14,证明了改进匹配策略能有效提高融合算法匹配的准确率。最后,在真实道路场景验证差异引擎的有效性,其场景为城市直行道路、简单路口以及复杂路口3个基本场景组成的75个场景。结果表明,差异引擎对激光雷达、毫米波雷达和视觉感知算法的边界数据识别平均准确率分别达到了 0.85、 0.74 和 0.82,证明了该引擎在感知边界数据识别中的有效性。
  • 余成文, 谢斌, 周波波, 李祥
    录用日期: 2025-10-27
    超大规模多输入多输出(XL-MIMO)系统被认为是实现6G通信的关键技术之一。然而,由于XL-MIMO系统天线数量大幅增加,导致信道呈现混合场特性,从而给信道估计带来巨大挑战。针对这一问题,提出了一种基于深度学习的自适应频率滤波并行联合卷积网络(AFF-PJCN)信道估计算法。首先利用自适应频率滤波网络对接收信号进行处理,该网络配备可学习的滤波器,能够依据输入数据自动优化滤波参数,在频域中实现自适应的信号分析与建模,并有效滤除噪声干扰。再通过并行联合卷积网络,并行结构的多尺度卷积操作可以有效捕获接收信号的全局和局部特征,进一步提升信道估计性能。为了增强模型的泛化能力,采用分段混合数据训练策略,通过在不同信噪比区间内独立随机采样构建训练集,确保模型在多样化的信道条件下均能保持稳健性能。实验结果表明,在XL-MIMO系统的混合场信道模型中,所提出的AFF-PJCN算法与现有的其他信道估计方案相比,不仅具有更优的估计精度并且展现出更强的普适性、鲁棒性。
  • 范政巍, 苌道方, 满星妤, 王崇文
    录用日期: 2025-10-21
    X射线检测作为管道焊缝缺陷无损检测(NDT)的一种直观手段,对预防管道安全事故具有关键作用。然而,从低灰度值、低对比度且色调偏暗的X射线图像中精确识别微小缺陷仍面临巨大挑战。为此,针对低光照焊缝图像的缺陷检测问题,提出了一种创新方法,聚焦于低光照条件下管道焊缝X射线图像的显示效果优化,并在缺陷检测精度上实现一定的提升。首先引入改进的Retinex-Net的网络框架,在网络中加入注意力机制残差块,对低光照X射线图像进行光照恢复与细节增强,抑制噪声与伪影,输出自然和无明显失真的增强图像,为后续检测提供高质量输入;其次设计了一种基于漂移高斯算法的焊缝定位与特征提取算法,自适应跟踪不规则长焊缝并自动裁取焊缝区域,显著降低背景干扰并提升处理效率;最后对基于跨层特征融合的焊接缺陷检测算法进行优化,构建基于RSU模块的特征编解码架构,在特征提取阶段集成注意力机制,强化跨层多尺度特征融合,从而提升检测精度并降低漏检率。研究结果显示,所提出的方法在公共GDXray数据集中显著提升了性能指标,不仅有效增强了图像质量,还实现了焊缝缺陷检测的高自动化程度与快速响应能力,证明了其在实际应用场景中的高效性与准确性。
  • 张斌、李润浩、冯超
    录用日期: 2025-10-20
    堆内存自动布局是实现软件内存破坏漏洞利用代码生成的核心技术,其目标是通过精确控制堆内存的分配状态,为漏洞利用构造必要的内存布局条件。然而现有基于搜索和求解的内存自动布局方法在布局效率等方面存在明显局限。针对这些挑战,本文创新性提出一种基于大语言模型的内存自动布局方法,该方法首先利用大语言模型对目标堆分配器的公开文档、源码注释和分析资料进行自动学习,获取堆分配器的运行机制和关键特性。在此基础上,借助大语言模型强大的推理能力和反馈思考能力,采用“规划-验证-重规划”的迭代布局策略,结合调试器的运行结果不断反馈修正布局规划策略,最终实现自动化的内存布局。实验验证表明,该方案成功在12个真实Linux用户态程序的真实漏洞中实现了精准内存布局,并在针对6个不同堆分配器共包含3735个测试样本的基准测试中达到94.54%的布局成功率。相比于基于搜索的Gollum布局系统,布局速度提升2.33倍;相比于基于求解的MAZE和BAGUA系统,可在不显著降低布局速度的条件下将堆分配器行为学习时间由星期级缩短至平均7.3分钟,验证了本方案能够兼顾布局的高效性和可扩展性,为基于大语言模型的漏洞利用自动化研究提供了新的技术范式。
  • 陈博加, 何廷年, 张连杰, 陈书安
    录用日期: 2025-10-20
    跨域推荐系统在电商和内容平台应用广泛。近年来提出的双目标跨域推荐(DTCDR)虽突破性地实现了双领域性能同步提升,但仍面临两大挑战:1)生成的用户-项目表征相关性与多样性不足;2)共享偏好中混杂的语义噪声导致负迁移问题。为此,提出基于异构图和层次偏好解耦的双目标跨域推荐模型(HGPD-DTCDR),其核心创新包括:1)提出异构图协同学习框架,整合用户-项目交互、用户社交网络与项目属性相似性,构建多关系异构图,通过关系图卷积网络(R-GCN)生成高阶语义表征,增强表征的多样性与相关性;2)设计两阶段解耦流程,先通过变分图编码器分离领域共享与特定偏好,再引入语义过滤网络优化领域共享偏好质量。在五个真实跨域数据集上的实验表明,该模型的性能提升源于异构图建模和层次解耦机制的协同作用。相较于最优基线,在命中率、归一化折损累计增益指标和平均倒数排名上分别平均提升3.55%、7.27%和15.57%。在数据稀疏场景下,性能提升更为显著,平均增益达10.35%。消融研究进一步验证了各技术组件的有效性及其协同效应。
  • 徐浩宇, 张菁, 张佳敏
    录用日期: 2025-10-20
    针对高压架空输电线路隐患检测中目标尺度小、背景复杂及现有检测模型的特征表征不足等问题,提出一种改进的轻量级实时检测模型LG-DETR。首先,设计轻量化主干网络ResNet-WT,引入小波变换卷积以增强多尺度特征提取能力并降低计算复杂度,同时在特征融合阶段利用分频自注意力机制,改进特征交互模块HL-AIFI,减少背景干扰。然后,提出跨层级多尺度聚合特征融合网络CMIAFPN优化特征传递路径,结合门控模块提升特征信息保留效率,避免高级特征的细节丢失。通过将Focal Loss的缩放因子引入Wise-IoU,提出Focal-WIoU损失函数,动态调整难易样本权重,提升小目标检测精度。实验结果表明,LG-DETR在高压架空输电线路隐患图像数据集上的 较基础模型提升6.94个百分点,并且参数量降低 23.9%,验证了模型改进的有效性。
  • 汪睿璇, 李妍, 钟经华, 姚登峰, 徐成, 任天宇
    录用日期: 2025-10-17
    汉语盲文是我国盲人使用的文字,是国家语言文字的重要组成部分。目前,虽然已经有一些技术实现了中文到盲文的自动转换,但是仍然存在不足。盲文分词是汉盲转换中的重要一环,对汉盲转换效果影响显著,也是盲文信息化研究的一项重要任务。尽管预训练模型在中文自然语言处理领域已经被广泛采用,但目前在盲文信息化领域的应用仍较为有限。盲文与汉字属于同一语言在不同文字体系下的表现形式,两者之间存在相似性和可迁移性,预训练模型在盲文信息化领域具有良好发展空间。本文将BERT预训练模型引入盲文分词任务,利用BERT模型提取特征,结合全词掩码策略和CRF解码器,实现了BERT-CRF-wwm编码器-解码器结构的分词模型。针对BERT模型原有的汉语分词信息可能干扰盲文分词的问题,在嵌入层引入一种新的盲文特征嵌入,最终形成BeBERT-CRF-wwm模型。通过在汉语盲文语料库上进行训练,最终达到了98.80%的精确率和98.71%的召回率,与现有的盲文分词方法进行对比,在各项评估指标上都达到了更好的效果。
  • 黄英来, 熊雪闪, 万浪怡, 贺杨, 杨柳松
    录用日期: 2025-10-17
    脑肿瘤的精准分类在医学影像诊断中至关重要,然而传统基于专家经验的诊断方法效率低,以及现有的深度学习方法存在难以建模长距离依赖和无法平衡全局建模与局部特征的问题,导致识别精度低。针对这些问题,提出一种层次化协同残差Transformer网络(HCR-TNet)。首先,使用Conv-Pool-Transformer复合模块(CPT-Block)来增强局部特征和跨级上下文建模,从而提升了对肿瘤异质区域的表征能力。其次,引入高频特征提取模块(HFFE)旨在更好地捕获肿瘤边界纹理和细微病变,有效抑制噪声。最后,设计多尺度残差块(MSRB)与CPT-Block残差融合,实现从宏观到微观结构的跨尺度特征优化。该方法在公共脑肿瘤MRI数据集上的实验结果表明,分类准确率达到98.26%,Kappa达到97.52%和MCC达到97.52%,相比于ViT模型,准确率提升了1.48%,Kappa提升2.08%。消融实验和对比实验结果证明了所提出的HCR-Net模型在脑肿瘤分类任务中的有效性,为医学图像分析和自动诊断系统提供可行的方法和思路。
  • 林海, 余果, 尹泽明, 徐显冲, 刘玉海
    录用日期: 2025-10-17
    在长上下文和高并发场景下,由于自注意力机制中键值缓存(KV Cache)的显存占用呈平方级增长,大语言模型(LLM)推理时面临显存需求过高、吞吐量受限的困境。KV Cache稀疏化方法是用于解决此问题的高效方法,但现有稀疏化方法存在显存占用、滑动窗口设计复杂度及计算访存效率方面的不足。DoubleSparse++方法集成三重优化技术弥补上述不足:一是使用基于环形缓冲区的滑动窗口,将KV Cache大小与文本长度解耦,并将缓冲区更新复杂度由O(L)降为O(1);二是采用指数衰减稀疏均衡策略,根据层索引动态分配令牌稀疏度,实现逐层增强稀疏性;三是进行稀疏化推理内核优化,通过算子融合与设备流异步流水线,实现长上下文推理场景下计算与访存重叠,大幅提升计算强度并降低访存次数。实验在国产加速卡和多种主流LLM(包括OPT-6.7B、Vicuna-7B-v1.5、LLaMA-2-7B、LLaMA-3.1-8B、Qwen-2.5-7B)上进行,结果表明,在4K Tokens生成任务中,DoubleSparse++相比DoubleSparse实现平均1.31X推理加速和0.72X显存占用;在13K Tokens场景下显存占用比进一步降低至0.56X。综合性能验证表明,DoubleSparse++是一种高效的KV Cache稀疏化方法,适用于LLM长上下文推理与流式部署。