作者投稿和查稿 主编审稿 专家审稿 编委审稿 远程编辑

最新录用

Please wait a minute...
  • 全选
    |
  • 田红鹏, 李志强, 杨赛
    录用日期: 2025-11-05
    在轻小型无人机图像目标检测任务中,常面临检测精度低、背景复杂、目标尺度变化大、分布密集以及模型参数量较大的问题,因此提出一种基于改进 RT-DETR无人机目标检测算法。首先,使用热传导模块HeatBlock和空间选择注意力模块LskBlock改进C2f得到C2f-Heat-Lsk模块,然后使用C2f-Heat-Lsk模块和C2f模块来重新设计RT-DETR主干网络,提高主干网络对小目标的特征提取能力并减少模型参数量。其次,提出特征融合结构SOFEP替代原网络的特征金字塔,缓解小目标细节信息丢失的问题,并增强小目标的特征表示。最后,结合Focaler-IoU和MPDIoU两种损失函数来构造Focaler-MPDIoU损失函数,提高边界框的回归精度进而减少模型的漏检率。实验结果表明,在VisDrone测试集上,改进模型参数量较RT-DETR降低16.9%,mAP0.5和mAP0.5:0.9指标分别提升2.6%和1.9%,在DOTAv1.0和HIT-UAV 数据集上均优于RT-DETR算法。改进模型在保持较小参数量的同时,提高了检测精度,满足了无人机航拍图像小目标检测的应用需求。
  • 梁士超, 温雯, 冯雅莉, 郑佳碧, 郝志峰
    录用日期: 2025-11-05
    如何建模和学习用户行为的时间模式是时序推荐中的重要问题,但现有的时序推荐研究大多聚焦于单一类型行为的模式学习,未能充分挖掘多类型行为(如点击、购买、收藏等)的内在多元模式,制约了推荐效果的提升。本文着眼于行为数据中个体行为的多季节序列依赖特性以及不同类型行为间随时间变化的复杂依赖关系,构建了一类针对多类型行为时序模式学习的深度模型(MSMB)。具体而言,该模型包含一个融合了多尺度指数移动平均(EMA)机制的双通道序列编码器,能够精准捕捉各行为序列中多季节的时变规律;同时引入了跨行为依赖模块,兼顾不同周期粒度,以有效建模不同行为间的动态关联性。在三个基准数据集上进行的大量实验验证了所提模型的有效性和优越性。
  • 陈浩芝, 蔡瑞初, 李梓健, 郝志峰
    录用日期: 2025-11-05
    时间序列分割是时间序列分析中的一项重要任务,在生物行为分析和物理系统分析等领域得到了广泛的应用。然而,现有的时间序列分割方法普遍忽略了分布偏移下时间序列的非稳态特性,导致模型在非稳态时间序列中难以实现精准分割。为了解决这个问题,首先,提出一个基于现实场景的数据因果生成过程假设。在该假设下,观测数据背后的隐变量可分为稳态隐变量和非稳态隐变量,其中稳态变量表示不变或周期性变化的信息,非稳态变量表示动态变化的信息。其次,基于该因果生成过程假设,设计了稳态非稳态解耦模型,该模型将稳态和非稳态变量进行解耦,可以更加关注时间序列中的非稳态依赖关系。此外,为了准确解耦与提取变量,利用变分推断的证据下界(ELBO)来构造模型的损失函数,并基于该证据下界,通过稳态和非稳态先验神经网络模块来提高隐变量解耦的准确性。最后,通过实验证明,在各种基准数据集上,该模型的性能优于几种最新的时间序列分割方法,突显了其在实际场景中的优势。
  • 赵巍岳, 吴婧雅, 卢文岩, 李晓维, 鄢贵海
    录用日期: 2025-11-05
    新兴业务在数据中心中引入了大量的大粒度RDMA通信需求.RDMA依赖物理地址通信,大粒度访问时地址翻译所需使用的地址翻译页表项(Page Table Entry, PTE)超过了硬件设备的缓存空间.目前高性能的商用方案使用主机内存储存PTE,但这种结构使大粒度访存只能在读取主机内存的PTE之后才能执行传输,这引入了PCIe穿透和主机内存访问延迟,导致地址翻译效率严重下降和主机CPU开销.为实现高效的大粒度RDMA,本文设计可配置的高性能地址映射结构:息壤(XiRang).XiRang通过流取机制和层级缓存设计高效扩展访存粒度,通过可配置的地址翻译阵列实现了灵活、高吞吐的地址翻译性能.XiRang原型基于DPU实现,实验表明:1) XiRang有效卸载RDMA数据面地址翻译负荷,与主机CPU解耦;2) XiRang使用的流取扩展机制有效降低存储开销,并发模式下高速缓存消耗仅为10 Byte级别,并发的存储开销可忽略不计;3) XiRang在高并发访存请求数量下,保持接近100%的翻译表项查询命中率,翻译引擎空闲时间相比RNIC架构降低2到3个数量级;4) XiRang的翻译吞吐是RNIC翻译架构的60倍以上,是基础DPU地址映射结构的3.5倍以上;5) 使用性能增强模式,XiRang的地址翻译速度可支持1.4 TB/s的数据传输带宽.
  • 贾兴隆, 秦俊平, 闫凯, 刘铮, 王丹, 邵欣然, 邵泽州
    录用日期: 2025-11-05
    针对野外复杂背景下濒危动物识别精度不足的问题,该研究对YOLOv8模型进行改进。首先,在主干网络中引进蛇形动态卷积(DSConv),增强模型对遮挡情况下的检测性能;其次,在颈部网络中引入全局注意力模块(GAM),提高模型对濒危动物相关信息的关注度,对环境等不相关的特征进行抑制,减少冗余信息;然后,在头部网络设计小目标检测头,对浅层特征图进行融合,提高网络对小目标的感知和定位能力;最后,使用基于最小点距离的边界框损失回归函数(MPDIoU)替换传统的CIoU算法,从而提高算法的收敛速度和定位精度。实验结果表明,本文模型对于复杂背景下的濒危动物检测精度和平均精确度分别为96.2%和97.2%,相较于基础的YOLOv8n检测精度和平均精确度分别提高了2.1和2.4个百分点。利用相同数据集在不同的目标检测模型上进行对比实验,与Faster-RCNN、SSD、YOLOv5、YOLOv7等模型相比,平均精度均值分别提升了28.7、22.5、3.5、2.4个百分点。实验证明,改进YOLOv8模型可为实现复杂背景下的濒危动物检测提供理论依据。
  • 吴仕勋, 汤培尧, 蓝章礼, 徐凯, 张淼
    录用日期: 2025-11-04
    基于接收信号强度指示(RSSI)的WiFi指纹定位技术凭借其部署便捷性与成本优势而备受关注。然而,现有指纹定位方法高度依赖于海量数据的模型训练,且数据增强方法生成的虚拟样本数据质量参差不齐,进而影响模型定位性能。此外,模型泛化能力不足,一旦环境发生变化,模型定位性能会急剧下降。为应对以上挑战,本文通过构建深度融合注意力机制的卷积神经网络(CNN)定位模型,结合元学习驱动的小样本学习(FSL),采用粒子群优化(PSO)算法在超参数空间物理约束下进行自动化数据精选与模型协同调优,提出了基于小样本学习驱动的多参数优化WiFi指纹定位方法。实验结果表明,所提方法在CJU数据集和Tampere公开数据集上分别实现了0.52米和6.88米的平均定位误差,相较多种对比算法定位精度分别至少提升了49.5%和8.7%;同时,在CJU-2024数据集上进行了模型泛化性测试,通过少量数据使模型快速适应新环境,所提方法仍能达到2.17米的平均定位误差,定位精度至少提高26.7%。由此表明,所提出的方法能够有效提高室内定位的精度并且能够在新环境下有出色的性能表现,展现出良好的泛化能力。
  • 杨莹莹, 车进, 白雪冰, 肖龙, 简丽琼
    录用日期: 2025-11-04
    现有的无监督行人Re-ID方法通常只关注行人的整体特征导致全局特征偏差以及数据多样性不足而影响识别精度,为解决该问题,本文创新性地提出了一种基于ViT的融合多层次数据增强(MDAM)与特征净化(FP)的无监督行人Re-ID方法(DAFP)。首先,设计了包含几何空间变换、表观特征扰动和遮挡模拟的MDAM,扩展了训练样本多样性,提升模型跨摄像头场景的鲁棒性。此外,构建FP模块,将Transformer输出的局部特征按空间位置划分为上下两部分,并与全局特征进行多视图距离矩阵的自适应加权融合,结合DBSCAN聚类算法生成高质量伪标签,有效缓解了传统方法因依赖单一全局特征而导致的相似行人误聚类问题。最后,通过全局-局部聚类对比损失函数,动态更新全局与局部聚类中心,实现了对行人细粒度特征的增强学习。在Market1501、DukeMTMC-reID和MSMT17三个数据集上的mAP/Rank-1结果分别达到90.5%/96.0%,77.6%/87.6%和64.5%/86.0%,显著超越了最先进的同类方法,验证了本方法的优越性。
  • 唐尉淋, 王俊峰, 葛文翰, 张成程, 詹维璐
    录用日期: 2025-11-04
    网络威胁情报(CTI)在缓解网络攻防的不对称性方面具有关键作用,但现有战术、技术和程序(TTP)提取方法主要依赖人工标注的全监督语言模型,存在效率低、一致性差的问题。尽管MITRE ATT&CK框架通过标准化分类缓解了TTP描述问题,但当前基于自然语言处理(NLP)的方法仍面临泛化能力不足、版本适配滞后和可解释性差三大挑战。为此,通过融合大语言模型先验知识与外部可信知识,提出了一种基于零样本学习的大模型TTP抽取方法DetecTTive。该方法创新性地利用ATT&CK官方知识库作为外部知识源,融合向量语义知识检索和图增强关联推理,结合智能体工作流实现自动化白盒推理,在提升零样本性能的同时确保结果可追溯。实验表明,该零样本方案在基准数据集上F1达到80.02%,召回率达到83.46%,有效解决了传统模型的数据偏差和版本适配问题,为动态威胁环境下的TTP抽取提供了可解释的低成本解决方案。
  • 范钦龙, 孙业鹏, 卢记仓, 祝涛杰, 刘伊琳
    录用日期: 2025-11-04
    随着互联网的普及和发展,海量用户对热点话题的评论与传播,深刻影响着现实世界中事件的进程与发展。因此,挖掘公众对热点话题的立场与态度,对于网络舆情监测、社会安全治理等领域具有重要的现实意义。立场检测技术旨在从用户生成的文本中识别其对特定对象的态度。尽管已有许多研究提出了不同的任务场景和技术方法,但针对立场检测任务,仍未形成统一的分类标准。首先,本文从任务场景和技术方法两个维度对立场检测任务进行了综述,系统梳理了该领域的研究现状与发展趋势。从任务场景的角度,将立场检测任务划分为面向特定对象、对象迁移和对象泛化三种场景,突出了研究从特定领域向更广泛应用逐步演进的趋势。从技术方法的角度,将立场检测方法归纳为基于模型工程、知识工程和数据工程的三大类,并分析了各类方法的优势与局限性。此外,本文还从多个维度对公开的数据资源进行了统计与实验分析,揭示了立场检测数据集的关键特征及发展趋势。最后,对全文进行了总结,并展望了未来的发展方向及面临的挑战。
  • 武倩楠, 丁卫平, 樊晓雪, 鞠恒荣, 周琳琳, 王静
    录用日期: 2025-10-31
    特征选择可从复杂数据中筛选有效特征,提升信息处理效率,然而在部分标签数据场景下,标签具有模糊性、样本间复杂关系以及特征重要性评估困难,都致使传统特征选择方法面临诸多挑战。为此,本文提出一种针对部分标签数据集的有效特征选择框架MFG-FS。首先,针对部分标签的模糊性,设计一种基于MLP-Mixer模型和对比学习的端到端消歧方法,以优化样本特征表示空间,增强区分能力,从而获得更可靠的标签置信度;其次,为准确刻画部分标签数据下复杂的样本关系,构建了一种融合多源信息的模糊相似关系信息粒,能有效融合基于特征空间的局部结构、基于消歧后标签的全局关联以及标签约束;然后,在构建的模糊信息粒基础上,定义并利用模糊互信息度量进行特征评价,该度量能够量化特征子集与标签的相关性及内部冗余性,为高质量特征子集选择提供可靠依据;最后,本文提出的方法在包含了5个合成数据集和4个真实数据集上进行了相关实验,结果表明该MFG-FS能够选择出更具区分度和鲁棒性的特征子集,在部分标签消歧和分类准确率方面具有较好的性能。
  • 黄玉琦, 杨晓霞, 杨容浩, 廖方舟, 严乐, 郭俊强, 李明涵
    录用日期: 2025-10-30
    面向自动驾驶感知的道路目标检测旨在实时定位与识别车载视觉范围内的机动车、非机动车及行人等交通参与者,为环境感知模块提供精准输入,支撑自动驾驶系统的决策与控制。由于道路场景背景复杂、目标形态多样且尺度差异大,导致感知系统的误检率与漏检率较高。针对形变目标检测精度低、多尺度目标检测不足、全局感知能力弱的问题,提出基于YOLOv8n的改进算法YOLOv8-DDL。首先,引入可变形注意力DAttention改进骨干网络的C2f,通过动态学习特征偏移,增强对交通场景中多种形态目标的捕捉能力,提升模型对复杂空间分布的适应性,有效减少错检。其次,融合大核可分离注意力LSKA改进SPPF,通过大核卷积扩大感受野,增强模型的全局上下文建模能力,提升复杂背景下的鲁棒性。最后,设计动态多尺度自适应融合模块DMAF及动态特征金字塔网络Dynamic-FPN重构颈部网络,通过动态融合高低层特征,增强模型在多尺度特征融合中的表达能力,改善多尺度目标检测效果。在公开数据集SODA10M上进行实验,结果表明,相较YOLOv8n,YOLOv8-DDL在精确率P、召回率R、F1值、平均精确度mAP@0.5上分别提升了5.9%、1.3%、3%、1.5%;在公开数据集BDD100K上进行辅助验证,精确率P、召回率R、F1值、平均精确度mAP@0.5分别提升了2%、0.6%、1%、2%。
  • 陈俊宏, 周凤, 田有亮, 杨科迪, 张起嘉
    录用日期: 2025-10-29
    随着各行业数据训练需求的增加,数据已成为关键生产要素。数据确权可明确数据权属并分配利益,防止未经授权的使用。然而,现有确权方案在数据收集、存储和使用等方面存在权属不可控、确权效率较低等问题。为解决以上难题,提出一种基于陷门哈希的权属可控数据确权方案。首先,为防止流转过程中数据所有权丢失,构建了持有权、管理权、使用权三权分离的确权模型,实现权属的精细化划分。其次,针对现有确权算法管理权生成不可控的问题,提出一种基于陷门哈希的数据确权算法,实现数据管理权生成可控与变更的同时,提高了确权的效率。此外,结合区块链技术设计了一种授权可追责的数据交易协议,通过精细化控制数据的收集与访问,并将确权信息上链,实现了数据交易的不可抵赖性和可追溯性。最后,通过安全性分析和性能分析得出,所提方案与传统方案相比,在保证权属签名不可伪造的同时,本方案的计算与存储开销方面具有优势。
  • 高建伟, 赵舒通, 黄宁泊
    录用日期: 2025-10-28
    在人工智能快速发展的背景下,针对当前应急决策中公众参与不足和专业知识依赖性强等问题,提出一种基于大语言模型与检索增强生成技术的群体智能应急决策方法。旨在整合社交媒体公众数据与领域知识库,构建“公众-专家”协同的多属性决策模型,提升灾害应对的科学性与响应效能,并将其应用于突发应急管理中。首先,利用Python爬虫工具从微博平台获取公众评论,形成应急灾害需求数据库;其次,基于RAG技术整合应急管理专业数据库以增强模型生成能力,通过提示词工程引导主题分类,构建主题词共现网络,采用Louvain算法聚类,结合专家校验优化,生成应急决策的属性集;然后,综合重要性和内聚性两方面因素,构建属性权重测度模型;最后,考虑决策者心理行为,采用TODIM方法对备选应急方案进行排序优化。以7•20河南暴雨事件为例,实验结果表明,本文所提方法能够生成符合公众需求的应急决策主题,在主题的一致性和多样性表现较好,分别为0.583和0.943,验证本文所提方法的科学性和有效性。
  • 赵庶旭, 陈彦红, 王小龙, 蒋恺俊
    录用日期: 2025-10-28
    :针对移动边缘计算中因需求波动与大规模突发任务引发的资源失配、负载瓶颈及服务不稳定等问题,提出 一种基于近似Shapley值的合作供给策略ASVC。首先,构建了基于双向偏好匹配的任务分配模型,结合用户任务 的性能需求与边缘节点的资源状态,通过Gale-Shapley算法实现供需最优匹配;其次,为降低构建联盟时Shapley 值的计算复杂度,提出了基于自适应抽样的 Shapley 值计算优化方案,该方案在保证计算精度的前提下,实现了 Shapley 值计算时间的阶跃式减少;最后,依据节点贡献度比例进行任务数据分配,提升系统公平性与资源利用效 率。仿真结果表明,提出的 ASVC 算法相较于现有算法,在服务质量、时延控制、任务完成率和系统负载均衡方 面分别提升约27.8%、31.0%、30.8%和21%。
  • 吕艳丽, 江伊雯, 冯函宇, 郭振奇, 向声
    录用日期: 2025-10-28
    随着生成式人工智能技术在敏感行业的深入应用,生成式大模型在微调阶段对训练数据的过度“记忆”问题日益严重,易导致用户身份、行为轨迹等敏感信息在推理阶段被重现,造成隐私泄露风险。针对这一问题,提出一种融合差分隐私(Differential Privacy, DP)与低秩适配(Low-Rank Adaptation, LoRA)的微调训练方法,在冻结预训练模型主体参数的基础上,仅对插入的LoRA模块进行梯度更新,并在训练过程中引入差分隐私随机梯度下降(DP-SGD)机制,对单样本梯度实施范数裁剪与高斯噪声注入,以控制模型对个体样本的敏感依赖。该方法以Qwen2-1.5B语言模型为基础,构建包含用户画像的指令式微调数据集,并设计针对身份标识、行为特征、位置信息等典型敏感字段的攻击样本,对比传统全参数微调与DP-LoRA方法在防泄露能力上的差异。实验结果表明,全参数微调模型在130条攻击样本中敏感信息匹配率高达73.07%,显示出严重的隐私风险;而DP-LoRA微调模型的匹配率显著降低至1.5%,整体生成内容与原始数据相关性极低。该方法有效降低了敏感信息重现概率,为生成式模型在数据安全要求较高的实际场景中提供了一种低成本、高适应性的训练策略。
  • 杨国正, 齐冬震, 陈攀, 沈照斌, 尹鹏语, 霍彦霖
    录用日期: 2025-10-27
    资源公钥基础设施(RPKI)是保障BGP路由安全性的一项重要机制,通过路由源授权(ROA)和路由源验证(ROV)两项核心功能,实现对自治系统(AS)发布路由宣告的合法性验证。近年来,随着RPKI应用的持续拓展,研究者围绕ROA配置问题与ROV部署测量开展了大量工作,从不同维度刻画了RPKI在现实网络中的运行状态与防御能力。当前RPKI相关综述集中于对RPKI体系本身研究的阐述,着重强调RPKI体系的脆弱性,对于RPKI实际部署中遇到的关键问题及其相关研究并没有进行系统梳理和深入总结。对近年来RPKI系统部署问题的相关研究进行了系统综述,重点梳理了ROA配置中常见错误类型,包括ROA良性冲突以及松散ROA展开系统性分析,揭示其成因与对路由安全的影响;对现有的ROV部署测量方法进行了综合归纳,并进行了对比分析,同时总结了对ROV验证有效性与路径传播影响的评估方法,最后给出RPKI部署问题研究的未来发展方向,为后续在RPKI部署优化、安全评估与策略研究等方向提供了理论基础与方法参考,有利于促进RPKI体系的部署推广,有效防御BGP前缀劫持。
  • 刘玫瑰, 张能, 李佳乐, 赵玉琦, 李增扬
    录用日期: 2025-10-27
    软件项目中的冗余依赖可能导致构建体积增加、性能开销上升以及维护负担加重。尽管已有研究关注Maven生态系统中的冗余依赖问题,但对冗余依赖在不同依赖作用域(如编译和测试)中的分布特征、演化模式及其对项目受欢迎程度等的影响仍缺乏分析。为此,选取GitHub平台上2,214个Java Maven开源项目作为研究对象,采用mvn命令识别各项目中引入但未被实际使用的冗余依赖,并结合依赖的作用域信息进行冗余比例的定量分析。接着,在698个项目的3,817个历史版本中采用Mann-Kendall非参数趋势检验方法,识别冗余依赖的演变趋势。此外,为评估冗余依赖与项目受欢迎程度和社区活跃度之间的关系,构建包括Star增长率、Fork增长率、Issue关闭率等在内的五种GitHub流行度和活跃度指标,并进行皮尔逊相关性分析。实验结果显示,冗余依赖主要分布在编译和测试作用域,其冗余比例中位数分别为33.33%和30.00%;在演化趋势上,48.1%的项目冗余比例保持稳定,36.2%的项目冗余比例波动,少数呈现增加或减少趋势;在相关性分析中,仅Issue关闭率与冗余依赖比例表现出显著弱负相关性。研究结果可为开发者提供细致的依赖管理视角,助力优化项目配置与提升软件可维护性。
  • 高嵩, 高博麟, 芦健, 吴粤隆, 王鹤, 徐月云
    录用日期: 2025-10-27
    如何量化不同传感器感知算法对物理世界映射的差异并识别边界数据,是实现高价值边界数据自动化提取的关键问题。本文提出了一种基于多源传感数据的差异引擎,用于边界数据的自动发现。该引擎由差异认知模块和差异率计算模块组成。在差异认知模块中,我们定义差异率来构建差异率与感知映射差异的关联模型,并将一个数据集的平均差异率作为基准差异率以量化感知映射差异,辨别边界数据。其中,由测试集计算的激光雷达、毫米波雷达、视觉感知算法的基准差异率分别为0.17、0.23、0.19。在差异率计算模块中,针对相机目标与激光雷达目标、毫米波雷达目标、相机目标的匹配,使用了基于卡方分布与威尔士损失的2D像素距离匹配策略。通过与只使用3D距离匹配策略的融合算法比较,二者与真值在测试集的差异率分别为0.16和0.14,证明了改进匹配策略能有效提高融合算法匹配的准确率。最后,在真实道路场景验证差异引擎的有效性,其场景为城市直行道路、简单路口以及复杂路口3个基本场景组成的75个场景。结果表明,差异引擎对激光雷达、毫米波雷达和视觉感知算法的边界数据识别平均准确率分别达到了 0.85、 0.74 和 0.82,证明了该引擎在感知边界数据识别中的有效性。
  • 余成文, 谢斌, 周波波, 李祥
    录用日期: 2025-10-27
    超大规模多输入多输出(XL-MIMO)系统被认为是实现6G通信的关键技术之一。然而,由于XL-MIMO系统天线数量大幅增加,导致信道呈现混合场特性,从而给信道估计带来巨大挑战。针对这一问题,提出了一种基于深度学习的自适应频率滤波并行联合卷积网络(AFF-PJCN)信道估计算法。首先利用自适应频率滤波网络对接收信号进行处理,该网络配备可学习的滤波器,能够依据输入数据自动优化滤波参数,在频域中实现自适应的信号分析与建模,并有效滤除噪声干扰。再通过并行联合卷积网络,并行结构的多尺度卷积操作可以有效捕获接收信号的全局和局部特征,进一步提升信道估计性能。为了增强模型的泛化能力,采用分段混合数据训练策略,通过在不同信噪比区间内独立随机采样构建训练集,确保模型在多样化的信道条件下均能保持稳健性能。实验结果表明,在XL-MIMO系统的混合场信道模型中,所提出的AFF-PJCN算法与现有的其他信道估计方案相比,不仅具有更优的估计精度并且展现出更强的普适性、鲁棒性。
  • 范政巍, 苌道方, 满星妤, 王崇文
    录用日期: 2025-10-21
    X射线检测作为管道焊缝缺陷无损检测(NDT)的一种直观手段,对预防管道安全事故具有关键作用。然而,从低灰度值、低对比度且色调偏暗的X射线图像中精确识别微小缺陷仍面临巨大挑战。为此,针对低光照焊缝图像的缺陷检测问题,提出了一种创新方法,聚焦于低光照条件下管道焊缝X射线图像的显示效果优化,并在缺陷检测精度上实现一定的提升。首先引入改进的Retinex-Net的网络框架,在网络中加入注意力机制残差块,对低光照X射线图像进行光照恢复与细节增强,抑制噪声与伪影,输出自然和无明显失真的增强图像,为后续检测提供高质量输入;其次设计了一种基于漂移高斯算法的焊缝定位与特征提取算法,自适应跟踪不规则长焊缝并自动裁取焊缝区域,显著降低背景干扰并提升处理效率;最后对基于跨层特征融合的焊接缺陷检测算法进行优化,构建基于RSU模块的特征编解码架构,在特征提取阶段集成注意力机制,强化跨层多尺度特征融合,从而提升检测精度并降低漏检率。研究结果显示,所提出的方法在公共GDXray数据集中显著提升了性能指标,不仅有效增强了图像质量,还实现了焊缝缺陷检测的高自动化程度与快速响应能力,证明了其在实际应用场景中的高效性与准确性。
  • 张斌、李润浩、冯超
    录用日期: 2025-10-20
    堆内存自动布局是实现软件内存破坏漏洞利用代码生成的核心技术,其目标是通过精确控制堆内存的分配状态,为漏洞利用构造必要的内存布局条件。然而现有基于搜索和求解的内存自动布局方法在布局效率等方面存在明显局限。针对这些挑战,本文创新性提出一种基于大语言模型的内存自动布局方法,该方法首先利用大语言模型对目标堆分配器的公开文档、源码注释和分析资料进行自动学习,获取堆分配器的运行机制和关键特性。在此基础上,借助大语言模型强大的推理能力和反馈思考能力,采用“规划-验证-重规划”的迭代布局策略,结合调试器的运行结果不断反馈修正布局规划策略,最终实现自动化的内存布局。实验验证表明,该方案成功在12个真实Linux用户态程序的真实漏洞中实现了精准内存布局,并在针对6个不同堆分配器共包含3735个测试样本的基准测试中达到94.54%的布局成功率。相比于基于搜索的Gollum布局系统,布局速度提升2.33倍;相比于基于求解的MAZE和BAGUA系统,可在不显著降低布局速度的条件下将堆分配器行为学习时间由星期级缩短至平均7.3分钟,验证了本方案能够兼顾布局的高效性和可扩展性,为基于大语言模型的漏洞利用自动化研究提供了新的技术范式。
  • 陈博加, 何廷年, 张连杰, 陈书安
    录用日期: 2025-10-20
    跨域推荐系统在电商和内容平台应用广泛。近年来提出的双目标跨域推荐(DTCDR)虽突破性地实现了双领域性能同步提升,但仍面临两大挑战:1)生成的用户-项目表征相关性与多样性不足;2)共享偏好中混杂的语义噪声导致负迁移问题。为此,提出基于异构图和层次偏好解耦的双目标跨域推荐模型(HGPD-DTCDR),其核心创新包括:1)提出异构图协同学习框架,整合用户-项目交互、用户社交网络与项目属性相似性,构建多关系异构图,通过关系图卷积网络(R-GCN)生成高阶语义表征,增强表征的多样性与相关性;2)设计两阶段解耦流程,先通过变分图编码器分离领域共享与特定偏好,再引入语义过滤网络优化领域共享偏好质量。在五个真实跨域数据集上的实验表明,该模型的性能提升源于异构图建模和层次解耦机制的协同作用。相较于最优基线,在命中率、归一化折损累计增益指标和平均倒数排名上分别平均提升3.55%、7.27%和15.57%。在数据稀疏场景下,性能提升更为显著,平均增益达10.35%。消融研究进一步验证了各技术组件的有效性及其协同效应。
  • 徐浩宇, 张菁, 张佳敏
    录用日期: 2025-10-20
    针对高压架空输电线路隐患检测中目标尺度小、背景复杂及现有检测模型的特征表征不足等问题,提出一种改进的轻量级实时检测模型LG-DETR。首先,设计轻量化主干网络ResNet-WT,引入小波变换卷积以增强多尺度特征提取能力并降低计算复杂度,同时在特征融合阶段利用分频自注意力机制,改进特征交互模块HL-AIFI,减少背景干扰。然后,提出跨层级多尺度聚合特征融合网络CMIAFPN优化特征传递路径,结合门控模块提升特征信息保留效率,避免高级特征的细节丢失。通过将Focal Loss的缩放因子引入Wise-IoU,提出Focal-WIoU损失函数,动态调整难易样本权重,提升小目标检测精度。实验结果表明,LG-DETR在高压架空输电线路隐患图像数据集上的 较基础模型提升6.94个百分点,并且参数量降低 23.9%,验证了模型改进的有效性。
  • 汪睿璇, 李妍, 钟经华, 姚登峰, 徐成, 任天宇
    录用日期: 2025-10-17
    汉语盲文是我国盲人使用的文字,是国家语言文字的重要组成部分。目前,虽然已经有一些技术实现了中文到盲文的自动转换,但是仍然存在不足。盲文分词是汉盲转换中的重要一环,对汉盲转换效果影响显著,也是盲文信息化研究的一项重要任务。尽管预训练模型在中文自然语言处理领域已经被广泛采用,但目前在盲文信息化领域的应用仍较为有限。盲文与汉字属于同一语言在不同文字体系下的表现形式,两者之间存在相似性和可迁移性,预训练模型在盲文信息化领域具有良好发展空间。本文将BERT预训练模型引入盲文分词任务,利用BERT模型提取特征,结合全词掩码策略和CRF解码器,实现了BERT-CRF-wwm编码器-解码器结构的分词模型。针对BERT模型原有的汉语分词信息可能干扰盲文分词的问题,在嵌入层引入一种新的盲文特征嵌入,最终形成BeBERT-CRF-wwm模型。通过在汉语盲文语料库上进行训练,最终达到了98.80%的精确率和98.71%的召回率,与现有的盲文分词方法进行对比,在各项评估指标上都达到了更好的效果。
  • 黄英来, 熊雪闪, 万浪怡, 贺杨, 杨柳松
    录用日期: 2025-10-17
    脑肿瘤的精准分类在医学影像诊断中至关重要,然而传统基于专家经验的诊断方法效率低,以及现有的深度学习方法存在难以建模长距离依赖和无法平衡全局建模与局部特征的问题,导致识别精度低。针对这些问题,提出一种层次化协同残差Transformer网络(HCR-TNet)。首先,使用Conv-Pool-Transformer复合模块(CPT-Block)来增强局部特征和跨级上下文建模,从而提升了对肿瘤异质区域的表征能力。其次,引入高频特征提取模块(HFFE)旨在更好地捕获肿瘤边界纹理和细微病变,有效抑制噪声。最后,设计多尺度残差块(MSRB)与CPT-Block残差融合,实现从宏观到微观结构的跨尺度特征优化。该方法在公共脑肿瘤MRI数据集上的实验结果表明,分类准确率达到98.26%,Kappa达到97.52%和MCC达到97.52%,相比于ViT模型,准确率提升了1.48%,Kappa提升2.08%。消融实验和对比实验结果证明了所提出的HCR-Net模型在脑肿瘤分类任务中的有效性,为医学图像分析和自动诊断系统提供可行的方法和思路。
  • 林海, 余果, 尹泽明, 徐显冲, 刘玉海
    录用日期: 2025-10-17
    在长上下文和高并发场景下,由于自注意力机制中键值缓存(KV Cache)的显存占用呈平方级增长,大语言模型(LLM)推理时面临显存需求过高、吞吐量受限的困境。KV Cache稀疏化方法是用于解决此问题的高效方法,但现有稀疏化方法存在显存占用、滑动窗口设计复杂度及计算访存效率方面的不足。DoubleSparse++方法集成三重优化技术弥补上述不足:一是使用基于环形缓冲区的滑动窗口,将KV Cache大小与文本长度解耦,并将缓冲区更新复杂度由O(L)降为O(1);二是采用指数衰减稀疏均衡策略,根据层索引动态分配令牌稀疏度,实现逐层增强稀疏性;三是进行稀疏化推理内核优化,通过算子融合与设备流异步流水线,实现长上下文推理场景下计算与访存重叠,大幅提升计算强度并降低访存次数。实验在国产加速卡和多种主流LLM(包括OPT-6.7B、Vicuna-7B-v1.5、LLaMA-2-7B、LLaMA-3.1-8B、Qwen-2.5-7B)上进行,结果表明,在4K Tokens生成任务中,DoubleSparse++相比DoubleSparse实现平均1.31X推理加速和0.72X显存占用;在13K Tokens场景下显存占用比进一步降低至0.56X。综合性能验证表明,DoubleSparse++是一种高效的KV Cache稀疏化方法,适用于LLM长上下文推理与流式部署。
  • 李仕优, 廉德萌, 周鑫, 韩孟之
    录用日期: 2025-10-17
    CUDA线性代数模板库(CUTLASS)中的CUDA稀疏矩阵模版库(CUTLASS-Sparse)用于构建可定制化且高性能的稀疏矩阵-稠密矩阵乘法(SpMM)内核,其在科学计算、深度学习等众多领域发挥着重要作用。但其仅针对NVIDIA GPU进行实现和优化,并不能应用于国产加速器。为了解决该问题,提出CUTLASS-Sparse面向国产加速器的移植与优化方案。在移植阶段,针对国产加速器硬件架构对数据访问模块、数据计算模块和数据写回模块进行适配。在优化阶段,针对其中存在的共享内存物理存储体(bank)冲突率高且共享内存带宽利用率低、数据流水线并行度低和数据写回效率低的问题,提出两种共享内存数据重排算法、基于数据预取与寄存器双缓冲的数据流水线策略和基于数据聚集的数据写回策略。实验结果表明,三种优化方法均显著提升了移植后的CUTLASS-Sparse的性能。对于TF32和FP16数据类型,经过优化后的CUTLASS-Sparse的整体性能相较于优化前分别平均提升了30%和115%,分别平均达到NVIDIA GPU L20上CUTLASS-Sparse性能的76%和60%。在两种硬件版本下,移植与优化后的CUTLASS-Sparse性能分别平均为国产加速器平台的SPARSE数学库性能的2.36倍和3.09倍。实验结果验证了移植与优化方案的有效性。
  • 岳明慧, 何宇轩, 任源鑫, 张立晔
    录用日期: 2025-10-16
    视频理解任务面临两大挑战:计算资源不足和视频数据集稀缺。现有视频模型参数量庞大,训练过程依赖高性能计算设备且耗时长;同时,视频数据集规模相对有限,制约了模型的训练和泛化能力。为解决上述问题,引入了一种高效的迁移学习方法:适配器训练策略。通过冻结预训练视觉转换器(ViT)模型的全部权重,仅微调适配器中参数,能够在显著降低资源消耗的同时,充分保留了预训练模型的表征优势。基于适配器训练策略,设计了层次化适配器与ViT骨干网络共同构建视频ViT适配器(VVA)模型。层次化适配器中使用三个维度不同的时空卷积,有助于兼顾细节和全局的时空关系。此外,引入具有强大跨模态学习能力的对比语言-图像预训练模型(CLIP)作为预训练模型,为VVA模型性能提供丰富的特征表示,促进不同数据模态间的有效融合。实验结果表明,VVA在三个标准动作识别数据集取得了优异的成绩,仅训练参数9.50M,在Kinetics-400、UCF101和HMDB51数据集上分别获得了79.32%、97.77%和81.78%的准确率。上述结果充分证明,适配器的高效性和便利性,能够有效应对并妥善解决所面临的挑战。
  • 丁霖, 杨洋, 郭彩丽, 郭建章, 李政
    录用日期: 2025-10-16
    文本转SQL任务旨在将自然语言查询自动转换为结构化查询语言(Structured Query Language),是实现非技术人员便捷访问数 据库的关键技术,对提升数据利用效率具有重要意义。针对大语言模型在文本转SQL任务中面临的模型对提示模板中数据库模式信 息理解不足的问题,提出了一种基于表格创建信息微调的大模型文本转SQL方法。现有方法多依赖于复杂冗长的提示模板设计或大 量的微调数据,面临着两大瓶颈:(1)包含完整提示内容的模板稀释了其中少数的关键提示,导致模型在长上下文理解中出现注意力 分散,降低了推理性能;(2)需要人工收集和处理上万样本的大规模微调数据才能使模型微调后获得稳定的文本转SQL任务理解能力。 为此,提出了一种融合提示工程和微调的文本转SQL生成策略,通过语义相似度筛选出与问题最相关的表格创建信息,并结合精简 的提示模板构建轻量的人工微调数据集。该数据集通过监督微调指导大语言模型理解提示模板中的表格模式信息,增强模型对表格 与问题之间关联的掌握能力,从而生成更准确的SQL查询语句。实验证明,所提方法能够有效降低模型对提示模板中额外信息的依 赖,缓解模型在推理时产生的注意力分散问题,生成SQL查询的执行精准度达到83.37%,相较于基准方法提高了0.49个百分点。
  • 贺广成, 李德识
    录用日期: 2025-10-16
    随着工业互联网的发展,传统尽力而为转发模式已经不能满足确定性时延通信的需求,IEEE 802.1工作组提出了循环排队和转发机制实现确定性传输。然而由于固定粒度的时隙转发存在过多资源占用、确定性时延范围受限的问题。因此,针对具有严格时延需求的时间触发流量调度,本文提出一种层次化循环排队和转发机制,设计快速转发模式,以降低时间触发流量时延并减少资源占用。同时,以确定转发模式和帧注入时隙的流量调度问题为研究对象,构建了最大化网络吞吐量的优化模型;由于求解该问题具有NP-hard性,设计了一种启发式的优先级迭代增量调度算法,采用流量聚类分组、优先级顺序更新和增量调度,实现大规模确定性流量的调度计算。实验结果表明,该机制相较于原始机制调度能力增强,可实现的确定性时延下限降低一半,资源占用平均降低了25.77%;在多种拓扑、不同流量特性和规模多组实验中,所提算法在调度成功流量的数目上均优于4种对比方案,相较于禁忌搜索、IRFS和Naive方案平均提升3.52%、2.04%和51.77%。
  • 杨红菊 刘娜 李尧 曹付元
    录用日期: 2025-10-16
    草图引导的图像修复技术在照片修复、创意编辑等领域具有重要的应用价值,但面临用户草图数据稀缺与几何偏差导致的修复失真双重挑战.现有方法依赖边缘检测生成伪草图,但忽略用户手绘偏差(如手抖、笔触断裂),导致复杂场景下结构错位与细节模糊.针对上述挑战,该研究提出一种联合可变形草图生成网络与双阶段引导修复的创新框架.首先构建可变形草图生成网络,通过建模典型手绘偏差,生成具有真实几何变形特征的大规模草图-图像配对数据集,有效缓解数据稀缺问题;其次设计两阶段修复框架包含:第一阶段针对用户输入草图进行几何失准校正与结构断裂修复,实现草图优化,第二阶段将优化后的草图信息有效融入修复网络,实现全局结构约束与局部纹理生成的协同优化.通过在基准数据集上的实验验证了该方法的有效性,在CelebA-HQ数据集上,该方法取得峰值信噪比25.78dB、结构相似性0.852.实验充分证明,该方法有效解决了用户草图数据稀缺与几何偏差问题,显著提升了草图引导图像修复在结构准确性和感知质量方面的性能.
  • 孙伟, 陈俊杰
    录用日期: 2025-10-13
    玉米是重要的经济作物,广泛应用于工业、畜牧业及粮油加工等领域,病害的及时识别对保障产量具有重要意义。当前,卷积神经网络(CNN)等深度学习方法已广泛应用于病害识别,但多数方法仅依赖图像信息,忽略其他模态特征,且模型参数规模较大,部署成本较高,限制了实际应用。为解决上述问题,提出一种基于图像-文本多模态的轻量级缓存模型MF-cache,模型参数量仅为0.061M,兼具低计算开销与较高识别精度。该模型借助多模态预训练模型CLIP提取图像与文本特征,通过并行融合策略获取融合特征,用于构建含领域知识的可学习key-value缓存结构。此外,采用加权的两阶段融合机制,用于动态调整不同模态对分类结果的贡献比例,提高分类稳定性与合理性。为增强鲁棒性,还引入多种数据增强策略,提升样本多样性,缓解小样本带来的过拟合问题。在自建数据集CornI&T与公开数据集PlantVillage上的实验结果显示,该方法分别达到99.72%与98.80%的准确率,具备良好的泛化性能。结果表明,所提方法在保持低计算开销的同时,具备良好的识别性能,为作物病害检测提供了一种高效可行的解决方案,并展示了多模态预训练模型与小样本学习在农业智能识别领域的应用潜力。
  • 蒋雨宏, 蒋清泉, 张瑞, 席慧娟, 吴炯桃
    录用日期: 2025-10-13
    在电子商务平台中,用户的点击数据急剧增长。在推荐系统中通过对电商用户的长期行为序列建模,对于捕获用户的偏好至关重要。目前普遍使用两阶段点击率(Click-through Rate , CTR)预测模型来预测长序列用户的点击率,即第一阶段通过近似检索从海量历史行为中筛选与目标项目相关的子序列,第二阶段对子序列进行精细兴趣建模。但是,在两阶段模型中存在着第二阶段搜索过程中存在着较少关注用户行为趋势性特征的问题;存在着跨阶段语义错配问题,导致第二阶段子序列未能完整传递用户真实兴趣结构。为此,提出一种可以感知趋势的概率注意力结构。该模型提出趋势感知特征建模,捕捉用户行为中的时序趋势。且结合概率注意力机制,统一跨阶段的兴趣表征,显著提升了长序列电商用户点击率预测的预测精度。为了验证模型的有效性,在两个真实的电商数据集上进行了实验。与最先进的基线模型相比,该模型在AUC和Logloss两个指标上最高提升了1.14%和4.2%。说明该模型不仅能识别用户行为中的趋势特征与动态偏好结构,更验证了跨阶段语义一致性的优化价值。
  • 杨春霞, 王新奥, 王宇龙
    录用日期: 2025-10-11

    高精度的空气污染预测对环境治理与公共健康防护至关重要。本文针对预测任务中存在的时空异质性和多特征耦合问题,提出了一种多重解耦的时空动态图卷积网络(MD-STDGCN),旨在精细化建模本地污染物排放的特异性时序模式和跨区域污染物输送的动态交互过程。该模型首先采用双路径自监督掩码预训练进行特征增强,时间路径通过局部子序列重建强化时序特征提取能力,空间路径通过节点序列重建捕捉空间异质性,从而缓解分布偏移和异质性带来的表征退化问题。其次,模型引入多级残差分解与层级式预测框架,逐步提取时空序列的全局时序模式、局部时空模式和短期扰动成分:利用通道独立卷积与多尺度因果时间注意力提取宏观趋势;通过自适应权重估计门与动态图卷积,建模具有方向性和时滞性的空间输送特征;再由GRU补充性地建模短期扰动成分。最终,模型融合双路径增强表征与多分支预测结果,实现端到端的多步预测。实验结果表明,MD-STDGCN全面优于基线模型,其预测精度在所有数据集上均有显著提升:在KnowAir、长三角和KnowAir_V2数据集上,平均MAE分别降低了7.34%、1.88%和12.57%,RMSE分别降低了7.64%、2.44%和11.29%。MD-STDGCN通过双路径特征增强、多级解耦与动态图学习有效缓解了特征纠缠和异质性的影响,提升了预测精度与鲁棒性,可为空气质量监测与治理决策提供可靠支持。

  • 冯国平, 陈志坚, 林志煜, 洪亮
    录用日期: 2025-10-11
    以电力领域为例对术语识别任务进行了研究,旨在解决电力行业在数字化转型过程中面临的术语识别挑战。电力行业面临着数据孤岛和知识难以活化利用的问题,要求有更高效的方法将文档中的术语实体转化为可操作的知识以支持决策制定和技术创新。为了应对专业术语难以辨认、新颖术语难以发现等问题,提出了一种基于动态领域图谱与大小模型协同的术语识别方法,从候选术语提取和术语筛选分类两个任务阶段中分别提高术语自动识别的查全率和查准率。首先使用已有术语库构建初代知识图谱,然后查询目标文本相关的节点并结合术语特征进行模型过滤,利用检索增强提示辅助大语言模型提取候选术语,再通过对抗训练获得术语分类的深度学习模型,根据深度学习模型的分类结果迭代动态术语知识图谱。实验结果显示,方法的准确率、召回率和F1值在迭代过程中逐步提升,最终达到了0.8647、0.8565和0.8542,与其他术语识别方法相比,在上述三者指标上均显示出优越性。
  • 李光, 周义强, 高心丹
    录用日期: 2025-09-29
    RGB-T(RGB-Thermal)语义分割是在照明不良或者完全黑暗的情况下实现可靠的语义场景理解的一种解决方案。热成像通过捕捉物体红外辐射特征,能在低光条件下保持稳定的边缘检测能力,可以有效弥补RGB图像在低光下导致的纹理细节丢失问题。然而,对于现有的RGB-T语义分割方法,在多个层次的信息交互中,未能对不同模态之间的有效信息进行充分利用,导致产生不准确的预测结果。为了解决这一问题,构建了CMFANet(Cross-Modal Fusion Attention Network)跨模态融合的注意力网络。首先设计了一个跨模态融合模块,旨在建立RGB图像和热图像特征之间的互补关系;其次考虑到多维度和多尺度信息的重要性,在编码端引入多维度注意力模块用来强化深层特征提取,在解码端引入多尺度特征聚合模块来帮助模型捕捉纹理细节和轮廓信息;最后在解码端引入小波变换与卷积优势互补,提高分割精确性。在MFNet数据集上,平均准确率(mAcc)和平均交并比(mIoU)指标分别达到73.8%和59.0%;在PST900数据集上,mAcc和mIoU指标分别达到90.71%和85.15%。与现有前沿方法相比,模型在关键目标(如MFNet的汽车、行人、自行车和PST900的幸存者、背包)上表现尤为突出,可视化结果验证了其能有效融合RGB与热成像模态信息,在低光场景下恢复纹理细节与目标轮廓,展现出了更好的分割效果和良好的泛化能力。
  • 许岱, 张秀再, 杨昌军, 钟扬, 郭琳
    录用日期: 2025-09-29
    高分辨率遥感影像的高原湖泊水体精准识别对区域生态保护和水资源管理具有重要意义。针对高原场景中水体占比低、细节特征易丢失所引发的多尺度特征融合不充分与高频细节衰减,进而导致边界模糊、细小水体漏检及复杂场景误分割等难题,提出基于频域-空域协同的双分支多级融合网络(Wavelet-ResNet-Swin Network, WRS-Net)。通过自适应多级小波分解提取水体的低频轮廓与高频细节特征,同时采用多阶段ResNet50,在各阶段末通过高频门控单元增强纹理响应,捕获空间语义信息;继而设计跨模态注意力融合模块实现多尺度语义与细节的协同优化,结合特征对齐模块解决跨层级特征错位问题;最后通过Swin Transformer进行全局上下文建模。在自建高原湖泊数据集上的实验表明结果,WRS-Net的Acc和mIoU两个指标分别为96.52%和93.44%,优于其它对比网络,提升了对遥感影像中高原湖泊水体识别的精度。
  • 李洁, 李林森
    录用日期: 2025-09-29
    随着物流业务的发展,无人机群协同配送成为降本增效的关键方案。面向传统配送业务的需求及无人机自身的约束,提出一种面向时间窗约束的无人机群绿色协同配送机制。首先,构建多任务点配送场景,设定任务时间窗、任务等级、无人机载重能力与飞行姿态相关能耗等参数,建立以任务收益最大化和能耗最小化为优化目标的多约束模型;然后,通过对斑马优化算法进行离散化处理,使其适应于无人机群路径规划和任务分配的离散问题,设计个体编码规则,引导种群在解空间中进行高效搜索,生成配送方案;最后,在不同任务规模和约束条件下构建仿真环境,对该机制进行系统性测试和对比验证。实验结果表明,所提出的机制在能耗控制、任务收益与收敛速度等方面均显著优于IGCPA、AGA和ACO算法,能够在满足复杂任务约束的同时提升配送效率、降低能源消耗,展现出良好的工程应用前景。
  • 张丽娜, 张晨煜, 王博毅, 姜天, 申腾飞
    录用日期: 2025-09-29
    心血管疾病的全球蔓延使得心电图(electrocardiogram,ECG)信号分析成为临床诊断的关键工具。然而,ECG信号的多标签分类多依赖完整的12导联,且面临导联间的时空特征融合不充分、类别不平衡等挑战。为此,提出了一种基于少数导联的端对端深度学习模型,通过轻量化多尺度倒残差特征提取模块提取ECG信号的跨尺度时域特征,结合时序卷积网络与双向门控循环单元捕捉信号中的时序依赖,提升模型对复杂时空特征的建模能力。为优化特征融合过程,设计了一种双向的时域-时序交叉注意力模块,自适应融合多导联时空信息。针对类别不平衡问题,设计动态加权焦点损失函数,该损失函数通过动态调整样本权重增强少数类识别能力。在CPSC-2018数据集上的实验结果表明,在仅使用I、II和V1导联信号的情况下,该模型平均F1-score达到0.841,其中房颤、左/右束支传导阻滞的F1-score分别为0.942、0.906和0.951。在PTB-XL数据集上的实验结果同样表现优异,验证了其在资源受限环境中的应用潜力,为精简导联下的ECG多标签分类提供了新思路。
  • 张东, 彭长根, 谭伟杰, 蔡传达
    录用日期: 2025-09-29
    可搜索加密的提出为云端数据的加密搜索提供了有效的解决方案,有效缓解了本地存储与计算资源受限的问题。然而,目前大多数方案主要依赖关键字词频统计或单一语义检索,不能同时支持关键字和语义并存的检索任务;且大多数方案普遍采用树形存储结构,对于大规模数据集的检索效率不高。因此,本文基于Milvus向量数据库及其内置的分层可导航小世界图(Hierarchical Navigable Small World,HNSW)数据结构,提出一种高效的混合密文检索方案。方案采用北京智源研究院推出的第三代通用文本嵌入模型(BAAI General Embedding Model v3,BGE-M3)提取高质量的文档语义向量和关键字向量,通过AES、基于哈希的消息认证码密钥派生函数(HMAC-based Extract-and-Expand Key Derivation Function,HKDF)及随机矩阵变换等密码学技术对原始向量进行加密处理,利用加密后的向量构建HNSW索引,并存储到Milvus向量数据库。检索时,通过动态加权融合排序对语义与关键字检索结果进行重排序,在大规模数据环境下实现实时、高效的密文检索。同时,方案支持动态插入、更新和删除操作,具有良好的扩展性。在真实数据集上的实验结果表明,所提出的方案在保障数据安全的同时,提升了检索效率和检索精度,降低了计算开销。
  • 刘浩南, 周刚, 刘江涛, 贾振红, 王佳佳
    录用日期: 2025-09-25
    棉花生长期间各类昆虫种群动态直接影响农业决策,精准掌握不同昆虫的种群密度是棉花科学种植与虫害防控的关键前提。在虫害检测任务中,目前的小目标检测算法虽然可以有效地检测到小目标昆虫,但在处理较大的昆虫时往往失效。为此,本研究提出了MSDSR-YOLO(Multi-scale Dynamic Super-Resolution Reconstruction YOLO)目标检测模型,利用图像超分辨率技术与动态卷积的有机结合,在提升小目标检测能力的同时进一步优化对其他尺度目标的检测性能。该模型设计了一种新的特征图超分辨率重建网络SMAR-SRNet(Self-Modulated Attention-Residual Super-Resolution Network)并将其嵌入到YOLOv11模型中配合P5-to-P3的特征融合策略,实现了主干深层特征的精准重建并与原始浅层特征进行跨层级融合,增强了对小目标样本的检测能力以及对局部和非局部特征的捕获能力。然后,本研究将全维动态卷积(ODConv)引入网络的主干和颈部结构,结合C3K2模块构建了C3K2-OD,其通过多维动态卷积核提升了模型捕获丰富上下文线索的能力,增强了网络对多尺度昆虫检测的鲁棒性。最后,本研究构建了一个包含7种不同尺度棉田昆虫的新疆地区黄色粘虫板棉田昆虫数据集XJ-CottonPest2024。实验表明在自建数据集和公开数据集上,MSDSR-YOLO均能达到最优的mAP50值,且对不同尺度昆虫进行对比分析后进一步证明所提网络在以小目标为主、多尺度共存昆虫检测中的优势,有助于在智慧农业领域的应用。
  • 李佳坤, 刘艳青, 杜方, 余振华, 冯宇, 王慧, 霍显浩
    录用日期: 2025-09-25
    针对通用医学大模型在脑肿瘤领域存在的专业数据匮乏、临床适应性不足及生成内容准确性有限等问题,提出了一种专用于脑肿瘤诊疗领域的大型语言模型BrainTumorLLM。该模型基于Meta-Llama-3-8B-Instruct模型,通过监督微调(Supervised Fine-tuning,SFT)和人类反馈强化学习(Reinforcement Learning with Human Feedback,RLHF)技术优化,结合自建的高质量脑肿瘤问答数据集BrainTumorQA进行训练。数据集采用宏观-微观协同的构建框架,共包含11,000条问答对,涵盖宏观医学知识(症状、诊断方法、治疗方案)及微观临床病例(1252份真实脑肿瘤MRI报告),并通过脱敏处理与信息约束策略保障数据安全。技术实现中,采用低秩适配(Low-Rank Adaptation,LoRA)技术提升训练效率,设计宏观与微观两级提示模板引导模型生成专业化回答,并引入人类反馈学习,通过专家偏好驱动优化机制以及近端策略优化(Proximal Policy Optimization,PPO)算法强化生成内容的临床一致性。实验结果表明,BrainTumorLLM在脑肿瘤问答任务中显著优于通用及医学领域模型,在自动评估环节,其BLUE-1、BLUE-2上分别达到了0.3383和0.2684,ROUGE-1、ROUGE-2和ROUGE-L得分分别为0.3237、0.1466和0.2611,与较基底模型相比困惑度从20.362大幅降至7.674,充分显示了该模型在脑肿瘤诊疗领域的专业性、精准性及临床应用潜力,为脑肿瘤的诊断、治疗决策以及医学科研等工作提供有力的智能化辅助支持。
  • 耿永康, 庞春颖, 李佳, 周苇锟, 马圣哲
    录用日期: 2025-09-23
    近年来,多模态磁共振成像技术在脑疾病诊断与脑网络分析中展现出显著优势,但如何有效在磁共振数据rs-fMRI(静息态功能连接)、DTI(白质纤维结构)等多模态进行数据优化和关联化,并提取具有强拓扑表征能力的低维脑网络特征的研究仍面临挑战。针对多模态脑网络(rs-fMRI/DTI)分析中特征优化与拓扑信息捕获和利用的问题,本文提出联合优化框架。首先,为缓解特征分布偏移与模态异质性,提出基于SPAMS的多模态字典学习数据增强策略,通过联合优化功能连接的脑网络、弥散结构脑网络,构建共享稀疏字典,生成解剖-功能一致性增强数据,来提升组间相似性与特征质量。其次,为有效捕获脑网络复杂拓扑信息,提出黎曼流形约束损失自编码器(RM-Loss AE),将特征空间建模为正定矩阵流形,引入对数欧氏度量(Log-Euclidean Metric)等优化重构损失。在ADNI(阿尔茨海默病)和ABIDE-II(自闭症)数据集上的综合实验表明,本文方法显著提升了特征可分性(Fisher Score)、分类性能(AUC)以及rs-fMRI与DTI模态间的耦合强度等指标,为多模态脑网络表征学习提供了新范式,推动其在精准医疗中的应用。
  • 闫平, 杨杰龙, 黄道缘, 钟石峰
    录用日期: 2025-09-19
    强化学习在机器人控制中面临奖励函数设计困难的挑战,而模仿学习虽规避了奖励工程的难题,却需依赖高成本的专家动作数据。为此,研究提出一种基于预测-协同优化的机械臂零动作模仿学习框架。该方法融合模型预测控制(MPC)与最大后验概率(MAP)的贝叶斯修正,通过多步动作序列优化实现机械臂精准操控,同时消除对专家动作数据和人工奖励设计的依赖。框架的核心是利用MPC的滚动优化机制,以最小化多步状态误差为目标,动态调整动作序列,增强对噪声和预测不确定性的鲁棒性。在此过程中,MAP方法被引入到单步优化,通过先验分布与似然性修正每个动作,提升动作优化的局部合理性与效率。与传统方法不同,该框架仅依赖专家状态而非专家动作,通过预测模型生成目标状态,避免了专家动作数据收集的困难,同时克服了预测误差累积的问题。实验结果表明,该方法在多种机械臂仿真任务中均优于现有基线方法,其中平均回报提升约45.8%,预测误差降低约50.7%,展现了更高的动作执行精度和对复杂环境的适应能力,并在真实机械臂平台上实现了稳定的控制,验证了跨平台工程化潜力。
  • 陈自良, 钟原, 李平
    录用日期: 2025-09-19
    联邦学习框架下,各参与方通过共享模型参数而非原始数据来协同训练全局模型,这种分布式训练方式在保护数据隐私的同时,也带来了新的安全挑战。由于分布式的本地训练难以监督,联邦学习系统更容易遭受模型中毒攻击。大多数现有的模型中毒攻击方法是对模型所有参数进行操作,通过统计相似性检查,可较容易检测到模型的显著改变。为了进一步分析该类攻击方法可能存在的隐秘方式,研究了一种针对联邦学习敏感参数扰动的模型中毒攻击方法(FedMSP)。该方法通过分析模型参数的梯度变化,精准识别出对模型性能具有显著影响的敏感参数,并对这些敏感参数施加扰动,以提高本地中毒模型的抗检测性,降低整体模型性能。此外,还提出了一种基于距离和方向不变性的攻击机制。该机制通过保持攻击向量的距离和方向不变,使攻击者能够有效规避现有的防御机制,显著提升模型中毒攻击的成功率。实验结果表明,针对Fashion-MNIST和CIFAR-100数据集构建联邦预测模型,当无防御条件时,该攻击方法将模型的测试准确率由原来的99.48%和61.37%分别降低至14.43%、8.27%;加入防御机制后,模型准确率回升至15.75%、10.87%,但仍显著低于正常水平。此外,FedMSP在多种安全聚合算法中展现出最优或接近最优的攻击效果,充分证明了其降低模型性能和减缓收敛速度的能力,为联邦学习的安全性研究提供了新的视角和挑战。
  • 晏燕, 王龙, 寇馨予
    录用日期: 2025-09-19
    针对现有轨迹隐私保护方法存在轨迹效用性不高和隐私保护不充分的问题,提出一种基于Peephole LSTM的生成对抗网络轨迹隐私保护方案。该方案设计了融合窥孔链接机制的生成器模型,使各门控单元能够根据细胞状态的即时值自适应调整,从而更有效地感知上下文信息并捕捉轨迹序列内的依赖关系;判别器则利用长短期记忆网络判断合成轨迹的真伪。通过生成器和判别器的对抗训练,生成符合原有统计特征的轨迹数据,降低了攻击者识别用户的概率,从而增强用户轨迹信息的隐私保护。针对轨迹生成任务的多维特性,设计了新的轨迹损失函数,用以度量合成轨迹与真实轨迹在空间、时间、兴趣点类别上的相似度损失。通过在真实世界语义轨迹数据集Foursquare NYC上执行的轨迹-用户链接任务等实验证明,与LSTM-TrajGAN、TCAC-GAN等模型相比,本文方案生成的合成轨迹在降低重新识别概率的同时更好地保留了原始轨迹的空间、时间和兴趣点类别属性特征,从而有效平衡了轨迹数据的隐私性和效用性,确保其在时空分析和地理应用中的有效性。
  • 李伟, 李小玲, 刘子琼, 黄颖
    录用日期: 2025-09-19
    处理约束多目标优化最关键的是如何在满足约束条件和目标函数最小化的同时,平衡算法的多样性和收敛性。现有的基于分解的约束多目标优化算法在面对具有复杂约束前沿的问题时,不能很好的利用不可行解信息,且难以平衡种群的收敛性和多样性。针对这一问题,提出一种基于强化学习双种群的约束分解多目标优化算法。该算法使用基于强化学习ε约束自适应策略和双种群合作信息学习策略帮助种群收敛到真正约束前沿上。前者利用强化学习的Q-learning自适应选择ε约束方法,通过将强化学习引入到自适应选择ε约束方法,可以让种群根据实时进化状态确定最优的ε约束方法,以增强全局搜索能力,使算法更好地逼近真实的前沿。后者设计一种双种群合作信息学习策略,通过两个种群的合作信息交流学习和不同的子代产生和后代选择策略指导算法充分利用不可行解的信息找到真正的约束前沿,从而平衡种群的收敛性和多样性。最后还将提出的算法与六个先进的约束多目标优化算法在33个测试问题进行对比,并应用在四杆桁架实际问题上进行仿真实验,实验结果表明所提算法在求解理论问题和实际问题时较其他算法具有更好的性能。
  • 薛立德, 王明政, 肖楚乔, 杨昊
    录用日期: 2025-09-19
    随着分布式能源的快速渗透,智能电网在能源交易的高效性、实用性和安全性方面面临日益严峻的挑战。现有区块链解决方案因存储/计算开销过大及可扩展性限制,难以满足资源受限的电网端侧设备需求,尤其在动态负载场景下性能瓶颈显著。本文旨在设计一种轻量化、高扩展的区块链系统,以优化分布式能源交易系统性能,降低节点运营成本,并提升电网资源利用率。为此,提出一种时空优化驱动的双层区块链系统——E-chain,该系统通过利用能源交易的时空聚合特性,构建了一种优化的区块链体系结构,其采用两层架构设计,集成了创新的链上轻量级数据结构与链下交易验证机制。这种双重机制在有效减轻主链负担的同时实现了系统级负载均衡和链下交易的高度安全,从而高度适用于边缘电网设备。通过形式化分析与大规模原型实验验证,E-chain可在10,000节点规模下实现电网资源利用率≥90%、交易确认延迟稳定于10秒量级且节点通信计算成本与网络规模、系统运行时间等因素解耦并保持在近常数水平,这相较于现有的分布式能源交易区块链协议具有显著优势。E-chain通过时空优化解耦设计,解决了电网端侧设备资源约束与系统可扩展性之间的核心矛盾,为构建大规模动态能源网络提供了创新解决方案。
  • 周杰钦, 冯毅雄, 金柯兵, 唐建航, 吴轩宇, 肖溪, 谭建荣
    录用日期: 2025-09-18
    无人机(UAV)边缘计算系统通过将无人机部署为移动边缘服务器,为各大用户提供低成本且具备隐蔽性的服务。然而,由于用户设备在地理位置上的不均匀分布和无人机自身的资源受限,部署不当会导致严重后果:包括用户密集区域出现覆盖盲区造成服务中断、无人机间距离过远导致协作通信时延超过阈值、以及部分无人机负载过重而其他无人机资源闲置的不均衡现象。因此,如何在保证服务覆盖、通信质量与能耗效率之间找到最优平衡,成为亟待解决的核心问题。为此,本文提出基于动态协作卸载任务并且混合智能算法的技术创新来同时解决无人机部署的离散优化问题和任务卸载的连续决策问题。具体而言,本文将计算任务进行智能拆分,通过动态卸载比例实现不同无人机负载的实时平衡,从而提高整体计算效率。在满足延迟约束的前提下,为最小化任务执行时延,本文研究了无人机部署、任务协作卸载以及计算与通信资源分配的联合优化问题,并构建了一个针对非凸混合整数组合优化问题的优化框架。在无人机位置部署方面,采用融合不同算法动态调整变异强度和交叉率的混合智能方法,实现了比传统算法更快的收敛速度;在卸载决策和资源分配方面,提出基于增强型深度确定性策略梯度(DDPG)的DP-Hybrid算法,实现了卸载决策和资源分配的协同优化。仿真实验结果表明,与现有基线方法相比,所提出的算法在能耗与时延之间实现了更优的平衡,显著降低了系统整体成本。
  • 邓君函, 王彬, 张泽华
    录用日期: 2025-09-18
    在复杂智能决策任务中,领域标注偏差能导致模型训练数据的质量下降,进而影响系统的泛化能力和决策性能。这种偏差通常源于以下两种原因:(1)相关专家资源稀缺导致的专家标注数据的稀疏性,这导致传统监督学习方法在性能受限,(2) 专家倾向不同导致专家知识异质性(包括专业背景差异、风险偏好多样性等)引发决策冲突。现有研究尚未有效解决专家标注稀疏问题、专家多倾向问题和专家知识融合冲突带来的不确定性问题。为此,本文提出针对领域标注偏差问题的多专家多视角方法(Decision Making with MoE,DM-MoE),融合了混合专家策略(MoE,Mixture of Experts)与不确定推理的方法理论,构建协同决策框架。该方法通过LLMs(包括DeepSeek、GPT-4、文心一言)基于提示工程针对不同领域构建跨领域多专家,根据专家实时的倾向变化动态地生成决策标注。并采用动态三支决策机制对多倾向多视角的专家决策信息进行建模。最后设计双阶段优化策略,对决策待定域中的不确定性通过基于LLMs的层次分析法指定多准则权重,并结合优劣解距离法进行多准则迭代优化。实验表明,DM-MoE相较于传统决策方法有更优秀的准确率和稳定性。