作者投稿和查稿 主编审稿 专家审稿 编委审稿 远程编辑

最新录用


期刊的电子版内容存储于(但不限于)中国知网 :
https://navi.cnki.net/knavi/journals/ZGYR/detail?uniplatform=NZKPT&language=chs。


Please wait a minute...
  • 全选
    |
  • 浦震宇, 刘志伟, 黄勃, 何书锋, 陈南希, 郗文增
    录用日期: 2025-04-25
    在现代工业领域,文本数据的感知和分析已成为推动智能制造和优化生产流程的重要手段。然而,工业文本数据通常具有高专业性、多样性和复杂性等特点,且标注成本较高,因此传统的大规模标注方法难以适用。现有的小样本命名实体识别方法多采用原型网络对实体进行分类,其中原型为属于同一类别的所有样本特征的平均值。然而,这类方法对于支持集数据的敏感性较强,容易出现样本选择性偏差的问题。因此,本文提出了基于分布矫正的小样本命名实体识别模型—DC-NER(Distribution Calibration-based Named Entity Recognition),该模型创新性地将任务分解为跨度检测和实体分类两个阶段。在实体分类阶段,通过精准的距离度量函数识别源域与目标域间的相似类别,并据此矫正目标域样本分布,生成更准确的类别原型。在同领域数据集(Few-NERD)和跨领域数据集(Cross-NER)上的实验结果表明,DC-NER在F1分数上显著优于对比模型,验证了其在小样本命名实体识别中的有效性。
  • 张可佳, 王晓凡, 刘涛, 刘宗堡, 张岩, 王晨雨, 王浩然
    录用日期: 2025-04-25
    成岩相样本标注是保证成岩相智能识别准确的关键环节。针对成岩相样本自动标注技术存在着样本需求量大和准确率不高的问题,本文提出了一种融合亲和传播聚类和图卷积神经网络相结合的自动标注方法——AP-GCN,该方法充分融合了亲和传播聚类捕捉复杂关联关系的优势和图卷积神经网络挖掘空间分布特征的能力,选取松辽盆地三肇凹陷州六区块扶余油层为靶区,实现成岩相样本的自动标注。首先,归纳成岩相类型并预处理测井曲线数据,进行少量标签标注,由此构建自动标注数据集,为后续自动标注过程奠定了基础;其次,利用亲和传播聚类构造图结构,建立测井曲线深度节点之间的关联关系;然后,通过图卷积层聚合节点特征,实现成岩相的快速准确标注。最后,设计对比实验验证所提方法有效性。实验结果显示,AP-GCN方法对各类成岩相标注Precision在86%以上,Recall在90%以上,F1分数在88%以上,成岩相样本自动标注准确率在90.6%,证明了该方法的有效性和实用性,为成岩相样本自动标注提供了新的解决思路。
  • 张凌浩, 谭海波, 赵赫, 陈中
    录用日期: 2025-04-24
    近年来,大模型已经成为人类生活的重要工具之一。作为人类与大模型沟通的桥梁,提示词发挥着至关重要的作用。虽然高质量提示词能够充分激发大模型的潜力,但其设计不仅需要专业技能,还需耗费大量资源,这促使提示词交易市场以及授权服务模式的出现。然而,将提示词作为商品存在以下三个问题:1.提示词明文一旦泄露就会被轻易地复制以及传播致使其失去价值。2. 缺乏客观的提示词质量标准和价格体系。3. 用户难以对虚假提示词的提供者追究责任,同时中心化平台的行为亦会影响提供者的权益。针对上述挑战,本文提出了PromptDEX,一种基于区块链的大模型提示词服务平台。基于智能合约的提示词租用机制和基于LangChain的服务模版,使提供者直接与需求方对接,削弱中心化机构对参与者利益和隐私的影响。同时所有交易记录将被公开透明地记录在链上,确保交易流程安全可靠可追责。此外,平台还设计了以需求方评分为依据的动态定价机制。实验结果表明:PromptDEX引入区块链所带来的额外成本开销以角为单位计算,几乎可以忽略不计。提供者仅需约10行代码即可构建的API服务,且对于网络带宽要求极低,具备较强的可行性与实用性。
  • 杜康宁, 杨晓晨, 张本奎, 王金晓, 宋沛然, 曹林
    录用日期: 2025-04-24
    随着恐怖袭击事件的频发,现有的疏散路径规划方法在面对复杂、动态环境时显得力不从心,尤其在面临突发恐怖分子袭击时,无法有效应对路径的阻塞和危险因素的变化。因此,如何在复杂和高密度环境中实现高效、安全的人群疏散成为一个亟待解决的技术问题。针对室内公共场所人群疏散路径规划问题,提出一种基于近端策略优化(Proximal Policy Optimization, PPO)算法的路径规划方法,以提高行人疏散效率和安全性。首先,对室内恐怖袭击场景进行描述,采用元胞自动机模型对室内公共场所的静态障碍物、空闲位置、动态障碍物、出口和行人进行建模。在此基础上,提出基于距离信息的特征构建方法,结合无威胁环境和面临威胁情况下行人到出口的距离,构建包括最短路径特征和安全路径特征在内的行人特征,以此刻画疏散路径的逃生难度。最后,通过将疏散路径规划问题描述为强化学习问题,设计基于疏散效率、死亡惩罚和成功逃离奖励的奖励函数。通过实时环境的反馈,为行人提供疏散策略,进而实现PPO算法对逃生路径的整体优化。与现有场域方法相比,该方法能够提高不同仿真场景下的人群疏散效率和安全性,尤其在复杂和高密度环境中。同时,通过消融实验验证了最短路径特征和安全路径特征的有效性。
  • 刘洋宏, 付杨悠然, 董性平
    录用日期: 2025-04-24
    高清(HD)环境语义地图的生成是自动驾驶系统中不可或缺的关键技术。针对相机与激光雷达在感知任务中存在的模态差异问题,本文提出了一种创新的多模态融合范式HDMapFusion。与传统的直接融合原始传感器数据方法不同,本方法通过将相机和激光雷达特征统一转化为鸟瞰图(BEV)表示,实现了多模态信息的物理可解释性融合。在nuScenes基准数据集上的实验结果表明,HDMapFusion在HD地图生成精度方面显著优于现有基准模型,其中IoU得分提升了23.0%,充分验证了该方法的有效性和优越性。
  • 高雨菲, 贾鑫, 黄张驰, 许志男, 霍鹏飞, 陆芷茵
    录用日期: 2025-04-21
    多视图三维重建旨在通过多张二维图像恢复给定对象的三维形状。然而,现有方法忽略学习对象的旋转不变性以及区域一致性,难以准确聚合多视图特征,造成重建结果细节丢失。为了解决该问题,提出了一种基于旋转不变区域一致性的双视图点云重建方法(Dual-view Point cloud reconstruction based on Rotation-invariant Regional consistency),称为DPR2。它以两张RGB图像作为输入,在探索对象区域旋转不变性的基础上,学习跨视图对象的区域一致性促进多视图特征聚合,并重建给定对象的精细点云。编码阶段,首先引入点云初始化网络为每个视图初始化一个粗糙点云。其次,提出区域级旋转不变特征提取网络,通过计算点-点之间的欧氏距离捕捉粗糙点云不同区域的旋转不变特征。解码阶段,设计双阶段交叉注意力机制,它可以构建跨视图点云的高质量区域一致性,从而准确实现多视图特征聚合。另外,开发点云细化网络,利用被聚合的特征,将粗糙点云细化为具有细粒度细节和光滑表面的点云。在ShapeNet和Pix3D数据集上的大量实验表明,所提出的DPR2在重建性能方面优于现有先进方法。与最新方法P2M++和MVP2M++相比,CD指标分别改善了23.62%和9.06%。
  • 梁月冰, 钱博豪, 朱梦莹 , 郑小林
    录用日期: 2025-04-21
    随着微服务架构在数字服务网络中的广泛应用,数字服务网络中服务节点规模的庞大和调用关系的复杂性给运维管理带来了严峻挑战。目前,分布式追踪技术在研究和应用领域已经取得显著进展。然而,该技术仍面临诸多限制,这些限制包括需要侵入系统源代码、依赖特定中间件,甚至在生成追踪路径时的准确性和完整性不足,导致调用链出现链路缺失,从而影响基于可观测数据进行的下游分析任务的可靠性。为此,本文提出了一种面向追踪-度量的异质动态图神经网络(TM-HEDGE)。首先,构建了引入度量数据的调用异质动态有向图,通过快照内异质注意力编码器和快照间Transformer编码器进行节点异质时空表征学习;然后,通过链路补全分类器实现缺失调用链的补全,进而完成追踪链路重建。实验结果表明,本文提出的TM-HEDGE在三个公开数据集上执行追踪链路重建任务的准确率相比现有链路补全模型平均提升了5.22%。本方法显著提高了数字服务网络中调用链的完整性,为数字服务网络的高效治理提供了可靠的技术支持。
  • 郭宇新, 贾向东, 李月
    录用日期: 2025-04-21
    智能反射面(RIS)被认为是未来无线通信技术中具有潜力的技术之一。无人机(UAV)也因其独特优势在无线通信领域日益受到关注。然而,随着通信环境的日益复杂化,信息传输面临着日益严峻的窃听风险,RIS与UAV的结合则为未来的无线通信领域开辟了新的解决路径与可能性。为此提出了一种基于RIS-UAV的保密无线通信系统。该系统利用UAV的灵活性和RIS的动态调整能力,有效抵御潜在窃听行为。从物理层安全角度出发,该系统考虑了RIS的相移和UAV的飞行轨迹,旨在最大化系统的平均保密速率。由于该问题本质上是非凸的,本文的解决方案将问题分解为两个子问题。首先通过系统的特殊结构推导出了相移的闭式解,其次通过一阶泰勒展开将UAV的飞行轨迹转化为凸问题,并采用逐次凸逼近法进行迭代求解。最后仿真结果显示,该系统在平均保密速率方面表现良好,与基准方案相比,该系统的平均保密速率提升了约 ;与固定RIS和无RIS方案相比,性能也提升显著。此外,该方案在安全性、计算复杂度等方面也显示出明显优势,计算复杂度为 。
  • 张瑞佳, 马慧芳, 张映月, 彭生江
    录用日期: 2025-04-21
    溶解气体分析(Dissolved Gas Analysis, DGA)旨在通过监测绝缘油中的溶解气体来识别潜在的故障类型。然而,现有DGA方法受到有限标记数据制约导致性能不佳。在这项工作中,提出一种新的图知识蒸馏方法(GKDG),旨在提高DGA的准确性和效率。具体而言,采用了双视角图构建策略从样本邻域中获得额外的监督,通过传播直接从其他样本中聚合信息。进一步地,将教师图神经网络中的知识蒸馏到学生图神经网络模型中,确保学生模型能够有效地捕捉并解释溶解气体之间的复杂关系。此外,为了对齐嵌入空间中的学生图和教师图,引入了多种知识,从而增强学生模型的学习能力,可以更好地从教师模型中学习。广泛的实验验证了本文方法在提升DGA性能方面的显著效果,为电力设备的维护和故障检测提供了有力支持。
  • 罗莉, 冯权友, 周理, 铁俊波, 龚锐, 潘国腾
    录用日期: 2025-04-17
    芯粒已成为芯片设计的新趋势,随着微处理器结构向多核化、众核化发展,Cache一致性协议也日趋复杂。多芯粒集成的微处理器中,Cache一致性协议的验证更是一个具有重要应用价值的技术问题。基于目录的Cache协议是最广泛应用的硬件实现方法,本文针对自主研发的分布式目录控制器,研究了多芯粒集成的处理器目录控制器的敏捷验证技术,随机测试采用否定选择免疫算法的优化机制,随机测试激励减少40%的条件下,功能覆盖率提高了28%;随机测试激励和定向测试激励相结合,功能覆盖率最终达到100%;同时还设计了一致性检查器,监视一致性协议事务的生命周期,可以快速定位设计错误,追踪问题的精确场景,定位设计错误占90%,有效提高了验证效率和验证质量。
  • 梁子仪, 王子豪, 刘天权, 李丽萍, 朱远飞, 鹿存跃
    录用日期: 2025-04-16
    在临床医学领域,患者组织切片的病理学分析是评估复杂疾病的金标准。传统的超分辨率方法在处理病理图像时,常因无法有效捕捉图像中的细微结构和纹理,导致重建效果不佳。为解决这一问题,提出了一种基于并联注意力机制的超分辨率生成式对抗网络算法PASRGAN(Parallel Attention Super-Resolution Generating Adversarial Network, PASRGAN)。该算法通过通道和空间注意力机制的并联运行,有效解决了传统注意力机制的信息分散问题。此外,本文引入特征分组和通道混乱(shuffle)策略,在保持计算开销低的前提下提升了特征多样性,从而显著提升病理图像的重建性能。鉴于现有的病理图像超分辨率研究大多是在模拟数据集上进行的,无法完全揭示现实图像超分辨率的挑战。因此,本文基于Camelyon16数据集构建了真实低分辨率与高分辨率图像对,验证了算法在病理图像超分任务中的优越性。实验表明,与当前超分辨率算法(如ESRGAN、CWT-Net、Histo-Diffusion和URCDM)相比,PASRGAN在PSNR(25.33dB)、SSIM(0.6659)和感知指标PI(5.14)上均优于其他算法。同时,PASRGAN的参数量(10.8M)和FLOPs(48.9G)显著低于传统方法,验证了其在计算效率上的优势。消融实验进一步分析了并联注意力机制、shuffle操作以及生成器和判别器结构的有效性。
  • 李天然 , 朴勇 , 孔子涵
    录用日期: 2025-04-16
    如今,开源软件在各个行业,尤其是航空航天、汽车电子等关键领域广泛应用,但大部分开源软件存在安全漏洞。在我国,针对开源软件的成分分析和验证在软件开发及评测中严重缺失,导致关键领域软件安全难以保障。因此,软件成分分析对确保软件安全不可或缺,其中,准确的第三方依赖项(Third Party Dependencies, TPDs)识别是软件漏洞管理与合规性评估的关键。 针对上述问题,本文提出了一种面向软件成分分析的轻量化依赖分析方法,提高了TPD识别的准确性和大规模项目文件处理的效率,主要内容如下:第一,方法包含一种针对Java语言Maven项目的分析算法,算法通过识别项目的构建配置文件,构建项目结构模型并提取第三方依赖项信息;第二,方法包含一种基于Winnowing算法的冗余依赖检测算法,算法通过分步对比代码文件与识别到第三方依赖项信息的哈希指纹,检测第三方依赖项的实际使用情况,排除冗余依赖项;第三,基于提出的算法,设计并实现了一种轻量化的成分分析框架,该框架通过特定的分析器类包装分析算法,使用Java中的ServiceLoader API注册并执行分析任务。 为了验证方法的有效性,我们构建了一个包含56870个不同版本TPD的数据库,并从GitHub收集了4个真实的开源项目进行实验验证,结果表示,提出的算法在检测准确度上表现出色:与基于机器学习的聚类算法和基于代码相似性比较的技术相比,提出的算法有更高的准确率和F1分数和更低的检测耗时。另外,该系统应用的ServiceLoader API使得系统有较强的拓展性,便于增加不同的分析算法,有较强的实用性,为后续实现多语言TPD检测工作打下基础。 关键词:软件成分分析;依赖检测;Java语言;Maven工具;软件系统
  • 魏方达, 刘淼, 孙毅, 王晶, 赵胜辉
    录用日期: 2025-04-15
    近年来,深度学习在计算机视觉以及语音信号处理等领域取得了重大成功。然而,深度学习的飞速发展也带来了负面影响,各类伪造视频,语音在网络上泛滥成灾,一些不法分子利用深度学习技术替换原始视频的人脸、编辑面部属性、合成说话人语音、克隆语音,通过制作色情视频、虚假新闻、政治谣言等造成社会动荡、混乱,威胁个人利益、国家安全。为了消除这些负面影响,众多学者从不同的角度提出解决方案。早期伪造主要集中在单模态伪造,因此,目前大多数解决方案侧重单模态的伪造识别问题,未能充分考虑音频和视频之间的内在联系,现有的单模态鉴伪方式在处理音频与视频均被伪造的情况时常常表现出次优的识别性能。近期,随着研究的深入,部分学者开始探索使用多模态模型鉴伪,取得了显著的成果。本综述回顾了视频、语音伪造及鉴伪技术,收集整理了视频、语音、音视频伪造数据集,并总结归纳了多模态鉴伪方法。最后对如今检测技术存在的问题和研究方向进行了分析并给出建议。
  • 徐志刚, 余浩
    录用日期: 2025-04-14
    摘 要: 壁画作为重要的文化遗产,其数字化保护和修复在近年来得到了广泛关注。然而,在壁画图像的超分辨率重建过程中,往往面临纹理模糊和原有信息丢失的问题。针对这一问题,本文提出了一种基于参考的两阶段壁画图像超分辨率重建方法(Reference-based Two-stage Mural Image Super-Resolution Reconstruction, RTMISR)。首先,采用多尺度残差特征提取模块,通过精准捕捉高分辨率与低分辨率壁画图像间的特征联系,确保低分辨率图像信息的完整保留,并实现对壁画轮廓和部分细节的初步重建。随后,通过纹理特征增强模块,利用由粗到细的特征匹配方法,从参考图像中提取高质量纹理信息,并将其有效融合至重建图像中,以增强纹理细节表现。此外,为了确保参考图像的相关性和质量,本文设计了一种参考图像筛选模块,用以选择与目标低分辨率图像高度相关的参考图像。在壁画数据集上的实验结果表明,与SRGAN、MADNet、ESRT等代表性超分辨率方法相比,RTMISR在客观指标 PSNR、SSIM取得了更好的表现:在×2尺寸下,PSNR平均提升了2.83dB,SSIM平均提升了0.04。在×4尺寸下,PSNR平均提升了2.00dB,SSIM平均提升了0.02;在主观视觉效果上,RTMISR能够在保留壁画原始信息的同时,增强壁画图像的纹理细节,更好地平衡了模型复杂度与重建性能。
  • 孙宇, 王红杰, 杜彦辉, 刘楠
    录用日期: 2025-04-14
    深度神经网络语言模型在应用过程中容易受到对抗样本攻击,通过在原始样本中添加微小扰动,生成对抗样本,以误导模型做出错误决策。通过研究对抗样本的生成方法,可以有效发现并评估模型的鲁棒性缺陷。现有的中文对抗样本生成方法大多关注于如何提升对抗样本的攻击成功率,而忽略了对抗样本的隐蔽性等质量指标。该研究关注中文文本对抗样本生成技术,结合中文在字形结构和语义特征方面的独特性,提出了一种结合汉字字形和语义信息的多级对抗样本生成方法CMSPSO。CMSPSO通过利用粒子群优化算法在预先设计的替换知识库中搜索合适的替换组合生成对抗样本。其中,CMSPSO-M结合汉字的多语言形近字特征,通过训练的孪生神经网络计算形近字相似度,构建了高质量视觉替换字知识库以生成字符级对抗样本;CMSPSO-S则基于HowNet和WordNet构建语义替换词知识库生成词级对抗样本,并通过攻击效果和攻击代价指标进行评估。实验结果表明,CMSPSO在多个模型和数据集上均展现出了显著的攻击效果,尤其在XNLI数据集上,CMSPSO-M对Roberta模型的攻击成功率达到了84.22%。此外,在攻击代价指标方面,CMSPSO也表现出明显优势,整体性能优于基线方法。
  • 刘根壕, 张能, 郑子彬
    录用日期: 2025-04-11
    API使用约束是开发者在调用API时必须遵守的条件或限制,以确保正确使用并避免API误用。API文档是提取这些约束的重要来源。现有的基于自然语言处理的API使用约束提取方法通常依赖于句法模式,但对复杂并列句的处理能力有限,且对语法模式要求严格。为此,本文提出了一种基于大语言模型的API使用约束知识提取方法,记为AUCK。AUCK首先对Java API文档进行预处理,提取包含API使用约束的句子;其次,总结并列句的句法模式并设计相应案例,指导大语言模型将并列句拆分为简单句;最后,针对简单句总结出三元组句法模式,并设计案例指导大语言模型提取API使用约束三元组。实验结果表明,在Java API文档上,AUCK的准确率和召回率分别达92.23%和93.14%,显著优于现有方法DRONE(准确率80.61%、召回率86.81%)、主流三元组提取工具OpenIE(准确率76.92%、召回率52.63%)以及大语言模型ChatGPT-3.5(准确率82.23%、召回率67.71%)。此外,将AUCK应用于Android和Python API文档的实验验证了其良好的迁移能力。
  • 李阳, 姜毅, 陈帅, 闫世超, 王磊, 马礼
    录用日期: 2025-04-11
    个性化联邦学习算法在处理非独立同分布(Non-IID,Non-Independent and Identically Distributed)数据集和客户端模型个性化方面有着巨大优势。而基于超网络的个性化联邦学习利用客户端各自的超网络实现了客户端模型的个性化训练。然而,针对客户端超网络参数和客户端数据的共享对客户端个性化模型的准确率的影响相对不明确。因此,本文提出多层超网络个性化联邦学习(pFedMHN,Multi-Layer Hypernetwork Personalized Federated Learning)框架,通过利用局部和全局超网络完成客户端超网络模型加权聚合,进而优化客户端模型。在服务器端学习全局超网络和每个客户端的多层局部超网络,并加权聚合得到客户端超网络,在客户端利用超网络参数迭代更新客户端模型,超网络参数的共享实现了客户端更精确的个性化模型。实验结果表明,在通用公开数据集上,在准确率上pFedMHN优于四种基准算法,有效解决了在Non-IID数据集上个性化联邦学习中面临的数据异构性和模型准确性问题,通过利用超网络参数和客户端数据共享实现了客户端更精确的个性化模型。
  • 梁绪宁, 王思琪, 杨海龙, 栾钟治, 刘轶, 钱德沛
    录用日期: 2025-04-11
    大语言模型(LLMs)在多种自然语言处理任务中展现出卓越性能。然而,LLM拥有极高的参数规模,使得有限的GPU内存容量成为推理任务的性能瓶颈。面向LLM推理服务场景提出AdaptiveLLM,根据推理任务负载特征在张量交换和张量重算中实现卸载策略自适应选择。为了评估推理任务负载特征,AdaptiveLLM通过算子粒度计算复杂度分析建立黑盒ML模型实现张量重算开销预测,通过细粒度KV Cache内存占用分析实现张量交换开销预测。为了进行卸载策略自适应选择,AdaptiveLLM针对抢占调度阶段设计了基于开销感知的内存优化策略,在GPU内存不足时选择开销较小的卸载方式。同时,针对启动调度阶段设计了基于公平性的用户请求调度策略,在GPU内存空余时基于公平性原则调度更多用户请求。实验结果表明,相比于当前广泛使用的LLM推理基准框架,AdaptiveLLM实现了整体吞吐率提升,同时降低平均带权周转时间,实现了公平调度。
  • 魏欣, 彭宁宁
    录用日期: 2025-04-11
    针对于目前已有的复杂网络图像形状分类算法中复杂网络构建的稳定性不足,在复杂情形下提取的形状特征分类性能较差等问题,提出一种基于持续同调与复杂网络的图像形状分类算法。该算法将复杂网络与Vietoris-Rips复形过滤相结合,在图像轮廓点云上构建持续性复杂网络,利用持续同调计算持续性复杂网络中不同维度的全局拓扑特征;选择从度分布提取的度特征和相关度特征作为局部形状特征,分别融合全局拓扑特征得到两组特征PHCND和PHCNJD,使得图像具有更为丰富的形状特征表示。将融合后的特征向量通过LDA进行分类,在9个公共图像数据集上,与其他传统算法以及ResNet-50进行对比实验,同时设计消融实验验证了全局拓扑特征的有效性,以及在持续性复杂网络下局部形状特征与全局拓扑特征的互补性。实验结果表明,该算法在其中5个公共数据集上,取得了最高的准确率和F1值。相较于其他7种传统图像形状分类算法分类准确率提高了2.2%~30.3%,F1值提高了2.2%~30.9%。最后表明该算法在图像形状数据集上的分类上是有效的,且提取出的形状特征具有一定的鲁棒性。
  • 王小龙, 王家梁, 吉青, 侯丰尧
    录用日期: 2025-04-10
    近年来某国产深度学习加速器发展迅速,硬件资源持续变化并引入一系列张量核心指令,使得开发者在该加速器进行卷积算子的手工适配和优化面临巨大挑战。为此,本文提出了一种面向该国产加速器的卷积代码生成器,以简化卷积算子的适配与优化过程。该生成器提供配置参数作为对外接口,用户仅需配置参数即可生成特定的卷积算子。生成器本身由三层架构组成:指令层封装底层指令,并根据硬件架构进行区分;组件层根据预设的硬件架构信息组织相应指令,从线程块和线程束角度提供高度抽象且可复用的功能组件。算子构建层则按照隐式卷积算法拼接功能组件,最终生成卷积算子。为保证卷积算子的计算性能,生成器从两方面进行优化:使用向量化算法和线程划分算法优化全局访存性能;使用转置算法转化乘累加指令的线程结构以优化写回性能。测试结果表明:该生成器的优化算法可显著提升算子性能;在两种硬件版本下,NHWC存储布局的卷积算子性能分别达到官方算子性能的95%与90%。该生成器为国产加速器的卷积算子适配优化提供了一种全新的解决方案。
  • 刘相滨, 方 诚, 刘 帅
    录用日期: 2025-04-10
    实时语义分割作为计算机视觉领域的核心任务之一,在无人驾驶、交通管控等诸多方面均发挥着极为关键的作用。现有基于编码器-解码器结构的实时语义分割算法通常以牺牲分割精度的代价来达到实时性的效果,然而,这类算法为了保证实时性,其感受野通常较小,从而导致对道路场景中的大尺度物体分割效果较差。为此,本文基于编码器-解码器结构提出了一个针对道路场景的实时语义分割算法来解决这个问题。算法首先在特征提取阶段设计了一个多尺度特征融合机制,对较大尺度内的感受野特征进行有效融合,提升对大尺度物体的分割效果,然后在编码器末端融入了一个极化自注意力机制,增强大尺度感受野中的局部感知,进一步提升了大尺度物体的分割效果。算法在数据集Cityscapes与Camvid上进行了测试,实验结果表明,采用单个NVIDIA RTX 3090分别在43.5FPS和91.2FPS下取得了80.6和81.1的MIoU,获得了更高的分割精度。
  • 吴正江, 王梦松, 武星晨
    录用日期: 2025-04-10
    为解决非对称容差关系存在冗余容差类问题以及为提高近似集的计算效率。本文通过改进的非对称容差关系,介绍了不完备信息系统中上、下近似集的布尔矩阵表示方法,设计了计算近似集的矩阵分块算法,并在GPU上实现近似集计算过程的加速。具体来说,本文提出了一种最近容差关系,构建了不完备信息系统中对象之间的层次结构,这些结构被转换成多个局部关系矩阵,以此来快速计算最近容差类。最后,向量化的最近容差类被分批加载到显存来计算近似集。UCI数据集和用户自定义数据集上的实验结果表明,在基于最近容差关系上,减少了容差类,矩阵分块算法在GPU上实现了对近似集计算过程的有效加速,相比于CPU计算和分布式计算,GPU分块算法执行速度平均分别提高了16.69倍和3.89倍。
  • 何明研, 李斯源, 刘鹏, 黄剑华
    录用日期: 2025-04-10
    对手建模作为多智能体博弈对抗的关键技术,其目的为学习对手的行为以减少环境的不确定性并帮助决策。而现有的对手建模方法大多采用离线训练加在线适应的结构,在离线训练中采用传统神经动力学模型对智能体进行一步一步地预测,容易形成单步误差进而形成累计误差,且在在线适应中面对未知对手时,亦会导致受控智能体计划状态偏离数据集分布。为解决上述问题,提出基于扩散模型并利用交叉注意力和对手建立关联的框架,其利用扩散模型可以同时生成多步规划序列这一特点解决了累计偏差问题。提出了策略集的概念,通过在线微调的方式不仅解决了计划偏离问题也解决了在线训练初始阶段会破坏离线策略的问题。在开放的密集奖励和稀疏奖励的竞争环境中的实验结果都充分证明了这一方法卓越的性能。
  • 毛煜阳, 徐崇钧, 杨华雨, 翟溪林, 张华
    录用日期: 2025-04-10
    车载第三方服务访问恶意网站的数量迅速增加,已成为车联网安全的重大威胁。目前,车联网恶意网站检测面临三大瓶颈:传统工具处理大规模网站数据时存在较长的检测时延,恶意网站统一资源定位符(URL)混淆问题影响识别准确性,且恶意网站数据集的获取困难,这些因素均严重制约了检测的效率和准确性。针对这些问题,本文提出了一种基于逻辑回归的多阶段恶意网站快速检测方法。使用搜索引擎对合法网站进行初步过滤,减少计算资源的浪费。通过对恶意混淆技术的分析归纳,设计匹配规则,并提出了一种基于启发式规则的恶意网站过滤方法,实现混淆网站URL的有效过滤,克服了传统工具无法有效检测带有恶意混淆URL的问题。为进一步提升检测准确性,构建了全面和轻量的恶意网站检测特征集合,并使用逻辑回归分类方法对特征提取分析。实验结果表明,该方法在恶意网站检测的准确性和效率方面显著优于传统方法,在公开数据集上达到98.1%的准确率,检测时间减少了75%左右。
  • 韩彦岭, 朱晓俊, 王静, 潘海燕, 张云
    录用日期: 2025-04-09
    海冰厚度是全球气候变化研究中的关键参数之一,其在调节地球气候系统、海洋环流和热量交换中具有重要作用。但是由于海冰的物理特性高度变化的影响,使得海冰厚度的精确反演面临巨大挑战。针对上述问题,本文提出了一种多特征融合和改进Transformer的被动微波遥感海冰厚度反演方法SIT-TransNET,该方法利用AMSR2卫星的亮度温度数据,并结合辅助数据(包括雪表面温度、海面盐度和1.4GHz亮度温度),探讨了这些数据与海冰厚度之间的复杂关联,分析了不同特征的重要性并通过建立不同的特征融合方案,加强了对海冰厚度的有效表征;通过SIT-TransNet模型的自注意力机制和多头注意力机制捕捉不同特征及组合对于海冰厚度反演的贡献,并能够动态调整不同特征的权重,实现海冰厚度的精确反演。实验结果表明,相比其他方法,本文提出的SIT-TransNET方法显著提高了海冰厚度反演的精度,决定系数(R⊃2;)达到了0.96,均方根误差(RMSE)为9cm,表明此方法适用于海冰厚度反演,为实现大范围海冰厚度监测和气候变化研究提供了有效的技术手段。
  • 潘可悦, 呙维, 程湘, 刘异
    录用日期: 2025-04-09
    场景要素是理解城市地理信息的核心,准确提取场景要素对于智慧城市建设和地理信息系统发展至关重要。为应对街景图像场景的复杂性、现有视觉深度学习模型在理解复杂场景和要素方面的局限,以及视觉信息与上下文关联的挑战,提出了一种基于大型多模态模型的典型街景场景要素提取方法。首先,基于LLaVA模型引入多层感知机和高分辨率视觉编码器,构建GeoLLaVA模型;其次,针对街景场景要素提取任务构建街景视觉-指令跟随数据集,提供多维度指令,通过视觉指令微调模型,增强其对复杂街景场景的上下文理解,同时,引入低秩自适应技术(LoRA)降低计算资源需求;最后,通过GeoLLaVA模型生成街景图像的多维度场景描述,并提取关键词以获得典型场景要素。在与语义分割、目标检测及其他多模态模型的对比实验中,GeoLLaVA表现出了显著优势,在交通信号灯、交叉路口和停车场要素提取任务中分别取得了0.938、0.842和0.829的F1分数。模型微调前后的对比展现了微调的有效性。消融实验进一步验证GeoLLaVA改进结构对性能提升的帮助以及LoRA在降低计算资源方面的有效性。区域应用实验通过批量推理特定区域的街景图像,提取要素并结合地理位置进行可视化展示,与开放街景地图(OSM)数据对比,验证了模型的准确性并揭示了OSM在提供要素信息方面的不足。
  • 刘军平, 王润鹏, 胡新荣, 彭涛, 王帮超, 杨华利, 朱 强
    录用日期: 2025-04-09
    实体链接是一项将自然文本中的实体提及链接到知识库中相应实体的任务,在信息检索和问答系统等领域发挥着重要的作用。实体链接的挑战在于如何利用提及的上下文和知识库中实体的特征信息,生成候选实体并选择其中正确的实体。尽管一些方法依靠某种策略生成了相关的候选实体,并结合特征信息选择了合适的实体。但是这些方法往往未能学习更深层次的语义信息,导致不能得到高质量的候选实体,甚至正确的实体不包含在候选实体中。同时,在一些特定领域,实体信息资源会出现不充分的情况,使得一些方法缺乏在多个层面上进行交互的能力。为了解决以上问题,本文采用了一个两阶段的实体链接方法,首先生成了高质量的候选实体,随后聚合实体特征信息实现粗粒度和细粒度层面的重排序。具体来说,本文使用基于混合负样本采样的对比学习方法检索得到高质量的候选实体。随后,本文利用弱监督的方式预测实体细粒度的类型,并使用粗粒度和细粒度的类型信息对候选实体进行重排序。最终,本文在三个公共数据集上证明了本方法可以有效提升实体链接的效果。
  • 吴艺鹏, 霍志坤, 韩孟之
    录用日期: 2025-04-09
    目前,通用图形处理单元(GPGPU)因其强大的并行处理能力而被广泛应用于各种计算任务。然而,采用单指令多线程(SIMT)并行执行模型的GPGPU在程序执行时,核函数会产生非一致控制流行为,从而引发线程束分化,降低加速器的整体性能。针对核函数执行过程中因非一致控制流引起的性能下降问题,提出一种特定场景下的分支编译优化方法——连续分支合并(MergeCFG)。在编译器中间代码优化阶段,通过控制流分析,识别出控制流图中含相同条件跳转的连续分支结构,以确定潜在的优化机会。接着,基于指令分析,评估优化的可行性,判断是否存在能够减少分支跳转的优化空间。最后,运用基本块复制与合并技术,对控制流结构进行优化,以减少程序中的分支跳转操作,从而简化控制流,提高程序执行效率。为验证方法的可行性,在国产GPGPU上使用7个合适的基准测试套件进行实验。结果显示,该方法有效减少了程序中的分支跳转操作,优化后的测试用例在性能上获得了显著提升。所测用例的平均加速比提高了2%至12%,个别测试用例的性能提升超过5倍。
  • 赖小玲, 贺嫚嫚, 胡伟, 张艺, 杜璞良, 刘蕊, 宋晓彤, 郑婷婷
    录用日期: 2025-04-08
    针对传统电力负荷预测方法存在精度不高、负荷数据噪声大等问题,提出一种基于改进变分模态分解(VMD)、卷积神经网络(CNN)和形变长短时记忆网络(Mogrifier LSTM)的多因素电力负荷预测方法。首先,运用麻雀搜索算法(SSA)对变分模态分解进行优化,得到最佳效果的分解子序列,有效减轻了负荷数据噪声对预测精度的影响;其次,分析各因素对负荷预测的影响机理,利用皮尔逊(Pearson)相关系数推导各影响因素与负荷之间的相关性,剔除冗余特征,大大降低了模型失准的发生概率;最后,采用CNN提取特征向量,将分解后的负荷数据及温度、湿度等特征数据输入到CNN-Mogrifier LSTM深度网络模型中,通过CNN-Mogrifier LSTM深度网络模型对特征数据进行多维分析,使短期负荷预测精度得到提高。算例分析结果表明,本文所提出的多因素电力负荷预测模型具有较好的适配性和预测效果。与文中次优VMD-CNN-Mogrifier LSTM模型相比,本文所提模型在两份所用真实数据集上的预测精度分别提升0.5和2.4个百分点,这为短期电力负荷预测提供了一种可行的解决思路。
  • 马依拉木•木斯得克, 高雨欣, 张思拓, 冯珂, 阿布都克力木•阿布力孜, 哈里旦木•阿布都克里木
    录用日期: 2025-04-08
    随着通用人工智能技术的快速发展,基础模型在多个领域的应用日益受到广泛关注。在图像分割领域,“分割一切模型”(Segment Anything Model, SAM)作为一种核心基础模型,在提升图像理解和处理效率方面展现出了显著优势。尽管SAM在图像分割任务中表现出色,但在功耗、计算效率以及在不同应用场景中的适应性等方面,仍然存在一定的优化空间。为此,文中从多个维度对SAM的改进方向进行了深入探索,包括提升速度和计算效率、增强模型的精度与鲁棒性、提高模型的适应性与通用性、优化提示工程设计,以及提升数据利用效率和强化迁移学习能力等方面。通过这些改进,SAM不仅能够在更复杂的任务中保持高效性能,还能更好地适应各领域和应用场景的需求。在此基础上,总结SAM在医学、遥感、机械等多个领域中的实际应用,展示了其在不同场景下的适用性与挑战。此外,文中还详细介绍了图像分割领域常用的数据集和评价指标,通过实验对比分析,进一步评估了Vision Transformer变体对SAM性能的影响,以及Efficient SAM、EfficientViT-SAM、MobileSAM和Robust SAM等改进模型的性能表现。最后,总结了SAM及其改进模型在实际应用中面临的挑战,并展望了未来的发展方向,旨在帮助科研工作者更全面地了解SAM及其变体的改进与应用,为新模型的提出提供启发。
  • 钟依慧, 马瑛, 江少进, 杨丰玉
    录用日期: 2025-04-08
    摘 要 在工业生产领域,缺陷分类对于保障产品质量和安全性扮演着至关重要的角色。但工业缺陷数据集存在类内差异大、类间差异小的特性,加上缺陷样本数量有限,致使现有缺陷分类模型在实际工业环境中的表现欠佳。针对这一问题,本文创新性地提出了基于变分特征解缠和锐度感知的工业缺陷分类算法。首先,引入变分自编码器将缺陷特征解缠为类别判别特征和类内方差特征,然后通过重采样策略增强类内方差特征,与原始特征结合以提升特征表示的区分度,VFD使模型能够更加专注于缺陷的类别判别特征,同时对与缺陷类别无关的细节和背景具有一定的容忍度,进而提高模型的缺陷分类性能。此外,通过引入锐度感知训练策略,优化损失函数的几何形状,进一步提升了模型的泛化能力。在轧钢缺陷数据集 NEU-CLS、金属缺陷数据集GC10-DET和自制紧固件缺陷数据集上的实验显示,VFD-SA的准确率分别达到100%、93.52%和99.48%,显著超越现有缺陷分类算法,能够充分满足各类工业场景下缺陷分类的需求。
  • 王鑫鑫, 胡海峰 , 张索非, 周飞飞, 龚锐
    录用日期: 2025-04-07
    关于跨视角地理定位的既有研究主要聚焦于判断查询图像是否准确对应于预定义图集中某个特定地理位置。然而,这种研究模式往往忽略了地理空间中固有的大量多空间尺度结构信息。为了实现更为稳健的定位效果,模型不仅需要捕捉局部建筑细节,还需理解通过建筑群和环境特征体现的目标之间的空间关系,从而在不同空间尺度下提高定位的准确性。为应对这些挑战,我们提出了一项新任务,称为多空间尺度跨视角地理定位,并推出了专门为此任务构建的ML-Campus数据集。ML-Campus数据集包含多视角、多来源的建筑图像,并为每个图像标注了多空间尺度标签,以体现不同空间尺度下的关联性和连续性。基于该数据集,我们对现有的跨视角地理定位方法进行了实证评估,以此为基准衡量其在此背景下的性能表现。为了进一步提升模型性能,我们使用提出的CV-HAPPIER方法进行训练,以增强模型在不同空间尺度下的特征表示能力。大量在ML-Campus数据集上的实验结果表明,CV-HAPPIER显著提升了跨视角地理定位检索排名结果的空间鲁棒性。
  • 汪雅琪, 王明文
    录用日期: 2025-04-07
    为解决人脸识别技术中隐私保护与识别性能间的矛盾,在这里提出了一种结合生成和嵌入网络的人脸隐私保护识别方法。该方法首先利用卷积神经网络生成模型对人脸图像像素值进行随机扰动,生成无法被人类视觉识别但可由特定深度神经网络识别的失真人脸图像,形成可撤销人脸模板。随后,通过预训练的FaceNet嵌入网络模型提取特征进行识别。在训练过程中,为保证人脸模板的可识别性,在生成网络模型中利用残差结构,从原始图像中有效地提取关键特征,增强图像的表现力,并在一定程度上减少信息丢失。为增大原始图像和生成图像之间的差异和提高生成图像的多样性,引入了生成混合损失函数和多样性损失函数。为提高识别准确率,利用改进的三元损失函数来优化模型。研究结果显示,该方法不仅提升了人脸模板的隐私安全性,还通过多样性损失函数增强了生成图像间的差异性,提高了模型鲁棒性。在Aberdeen、GT和LFW数据集上的实验表明,改进的三元损失函数在余弦嵌入空间中获得了更具代表性的特征表示,识别准确率分别达到了99.87%、99.29%和98.59%。
  • 贾书婷, 温昕, 郝雁嵘, 曹锐
    录用日期: 2025-04-07
    基于稳态视觉诱发电位(SSVEP)的脑机接口(BCI),由于个体差异和非目标刺激干扰问题面临分类性能瓶颈,且现有方法尚未深入探究视觉分散干扰与个体差异之间的量化关系。为此,本研究提出一种视觉分散自适应补偿的SSVEP多域协同解码算法,其核心包含视觉分散自适应标签平滑技术与多域联合解码模型两部分。首先,基于视觉拥挤效应理论,构建信号幅值与标签噪声的自适应量化模型,通过动态调节标签平滑强度实现个体视觉分散程度的量化表征。在缓解模型过拟合的同时,削弱非目标刺激的干扰影响,抑制个体差异的不利影响。进一步提出一种多域联合解码模型,先通过特征提取框架实现时频空域深度协同,再引入双向长短期记忆网络(Bi-LSTM)对时序全局依赖关系建模,形成兼具局部感受野与长程上下文感知能力的复合特征表达。在3个公开SSVEP数据集上以两个不同长度的时间窗(0.5s和1.0s)分别进行验证。实验表明,在所有实验设置下,该算法的平均识别准确率和平均信息传输率都更具优势。消融实验表明,视觉分散自适应补偿机制,在各实验设置下均能发挥作用,尤其是短时间窗口下,最高能提升18个百分点。表明该方法为神经解码中的个体适应性优化与时频特征融合提供了新的方法论框架。
  • 付威, 纪青然, 陈录城, 初佃辉, 涂志莹, 秦承刚, 董李扬
    录用日期: 2025-04-07
    面向多工艺式布局车间,针对不同工艺之间存在共有工序会导致资源浪费的问题,建立以最小化最大完工时间、最小化总加工成本以及最小化总加工能耗为目标的多车间作业任务协同调度多目标优化模型,旨在提高车间资源利用率,实现降本增效。提出一种新的禁忌搜索与快速非支配排序遗传融合算法TSNSGA-Ⅱ,将遗传算法交叉后的染色体采用禁忌搜索变异策略产生新个体,增强搜索空间的探索能力,最后采用层次分析法从工厂角度权衡三个目标以选择最优调度方案。实验部分首先在模拟数据集上验证了TSNSGA-Ⅱ算法的有效性,然后在不同规模的标准数据集上对比了TSNSGA-Ⅱ算法与MOGWO、ENSGA-Ⅱ元启发式算法的性能,并与单独的NSGA-Ⅱ和单独的TS模块进行消融对比。结果表明,该算法在以总加工成本为最高优先级时,该算法在Brandimarte中90%的mk数据集上都获得了最低的总加工成本,与ENSGA-Ⅱ算法相比求解时间更短,与改进前的NSGA-II算法相比提高了1.6%;在以最大完工时间为最高优先级的情况下,该算法在80%数据集上获得了最小的最大完工时间,与改进前的NSGA-Ⅱ算法相比提高了2.2%。
  • 沈思彤, 王耀吾, 谢在鹏, 唐斌
    录用日期: 2025-04-01
    多智能体强化学习(MARL)在解决复杂协作任务中具有重要作用。然而,传统方法在动态环境和信息非平稳性方面存在显著局限性。针对这些挑战,本文提出了一种基于角色学习的多智能体强化学习框架(RoMAC)。该框架通过基于动作属性的角色划分,并借助角色分配网络实现智能体角色的动态分配,以提升多智能体协作效率。同时,框架采用分层通信设计,包括基于注意力机制的角色间通信和基于互信息的智能体间通信。在角色间通信中,RoMAC利用注意力机制生成高效的通信信息,以实现角色代理间的协调;在智能体间通信中,通过互信息生成有针对性的信息,从而提升角色组内部的决策质量。实验在星际争霸多智能体挑战(SMAC)环境中进行,结果表明,RoMAC胜率平均提高了约8.62%,收敛时间缩短了0.92百万步,通信负载平均降低了28.18%。消融实验进一步验证了RoMAC各模块在提升性能中的关键作用,体现了模型的稳健性与灵活性。综合实验结果表明,RoMAC在多智能体强化学习和协作任务中具有显著优势,为复杂任务的高效解决提供了可靠支持。
  • 李维淦, 桂宁, 钱育蓉, 陈嘉颖
    录用日期: 2025-04-01
    多模态关系抽取(MRE)方法通过利用多模态信息辅助关系抽取任务。现有MRE模型要达到良好的关系抽取效果,通常需要在大量标注数据的基础上进行有效训练,然而在少样本情况下却表现不佳,针对上述问题,本文充分利用关系标签中丰富的语义知识和先验知识,提出一种新的提示调优分层网络。首先,设计实现基于知识注入的文本提示模块,具体来说,通过利用关系标签中隐含的实体信息,引入虚拟实体类型词构建提示模板,使模型可以感知样本中潜在的实体类型范围,并利用上下文对引入的虚拟关系答案词进行不断优化,以表达最佳的语义信息,从而提升模型在少样本情况下的性能。其次,利用实体对与关系之间的相互制约关系,设计实现实体-关系协同优化模块,以进一步提升关系抽取效果。最后,在文本编码器的每个自注意力层中,通过引入基于视觉前缀的注意力机制,将分层的多尺度视觉特征与文本信息深度融合,从而生成更加有效且鲁棒的文本表示,显著降低模型对错误的敏感性。在多模态神经关系抽取数据集(MNRE)上的实验结果表明,该模型的精确率,召回率,F1值分别达到84.97%、83.91%与84.43%,较基准模型均有一定提升,特别是在少样本情况下,本文所提模型显著优于基准模型,展现出良好的关系抽取效果。
  • 肖斌, 谢珊, 汪敏, 刘德琦, 姚瑞滢, 李雨茹
    录用日期: 2025-04-01
    电力负荷预测是电网优化调度的重要环节,但面对复杂的动态环境和非完全平稳的负荷特性,现有纯数据驱动方法和结合领域知识的策略仍存在对长期趋势和周期性规律捕捉不足的问题,影响预测精度和鲁棒性。为此,本文提出了一种基于领域先验知识融合的电力负荷预测模型(DPK-ELF)。该模型通过先验知识抽取模块,深入分析时间序列数据的动态行为特征,构建针对具体数据的领域先验知识,并利用动态分段堆叠平均平滑法提取电力负荷的先验趋势。接着,先验趋势分解模块将电力负荷序列分解为先验平滑趋势和残差局部随机波动,再结合PatchTST数据驱动模型进行预测。同时,在模型训练阶段采用软约束优化技术,将领域先验知识作为损失函数的边界约束,提升模型的鲁棒性。在四个公开电力负荷数据集上的验证结果表明,等先进对比模型。其中,与PatchTST模型相比,DPK-ELF在澳大利亚电价与电力负荷数据集上,MSE提升高达28.31%,MAE提升19.57%,RSE提升14.94%;在PDB电力需求数据集上,MSE提升12.25%,MAE提升7.77%,RSE提升6.29%。这些结果充分证明了DPK-ELF模型在提升预测精度方面的显著优势。
  • 李岩, 孙久兴, 陈昕, 薛一鸣, 刘戬
    录用日期: 2025-03-27
    量子计算机的发展威胁到了现有公钥密码系统的安全性,为防止“先存储,后解密”的攻击,现有公钥密码系统向后量子密码系统迁移迫在眉睫。基于理想格构造的Aigis-sig数字签名方案和Aigis-enc密钥封装方案为我国密码算法设计竞赛一等奖作品,具有抗量子攻击的优势。为了使Aigis-sig/enc能够在有限的硬件资源中高效应用,本文对两系统的代码进行整合、提高了资源利用率,在硬件模块上设计了两组蝶形运算器,通过流水线操作大幅提升快速数论变换(NTT)的计算效率;以此为基础,提出了Aigis-sig方案和Aigis-enc方案的软硬件协同实现方法。经实验测试,本文所设计方案相较于纯软件实现有可观的性能提升,其中ROM空间占用降低65%,数字签名/验签平均运行时间分别缩短29%和11%,密钥封装/解封装平均运行时间分别缩短13%和21%。本文的研究对后量子密码的实用化有重要的参考价值。
  • 李金茹, 潘庆先, 高照龙, 魏凯, 范泽群
    录用日期: 2025-03-27
    为了解决众包任务推荐存在的数据稀疏问题和提高众包任务推荐的准确性,本文提出了一种基于协同知识图谱与混合神经网络的众包任务推荐方法。该方法首先利用任务实体对齐融合工人-任务二分图与众包任务知识图谱形成工人-任务协同知识图谱,来缓解数据稀疏性的问题;其次,采用双向门控循环单元编码工人和任务之间的多条路径,在考虑路径之间关联性的情况下利用注意力机制将编码多条路径得到的信息加权聚合,以更准确地学习工人的偏好,从而更加准确地的推荐众包任务;同时,采用图卷积网络捕捉众包任务间的高相关性来充分考虑实体复杂的语义信息;最后,根据得到的工人和任务的嵌入表示向工人综合推荐。在MovieLens-1M、Yelp、Book-Crossing、Music、Zhu-Bajie和CHI六个公开数据集的实验结果显示,与基准模型相比,本文所提方法在AUC指标方面平均提升了5.8%、7.85%、5.75%、6.3%、5.47%和4.58%,在其他指标方面本文模型也均有提高。实验结果证明了本文方法的有效性与稳定性,可以为众包任务推荐领域提供一个研究思路。
  • 郑德生,  郑舜天,  李晓瑜,  殷浩,  王聪
    录用日期: 2025-03-25
    深度神经网络(Deep Neural Networks, DNNs)容易受到对抗样本的攻击,仅需在干净图像中添加微小扰动就能导致分类器产生错误分类。基于决策的攻击是一类只依赖目标模型预测硬标签输出的黑盒攻击。它将目标模型视为黑匣子,攻击时只需对目标模型结果进行查询,而无需了解模型内部结构和参数信息,这种特性对现实世界的应用程序构成了严重的威胁。目前基于决策的攻击方法通常利用梯度估计在目标模型决策边界附近发动攻击,但需要高昂的查询代价且生成的对抗样本质量效果不佳,失真较为严重。本文研究发现,图像在频率空间中的低频信息能够有效表征其重要特征。在低频空间执行决策攻击,不仅有助于降低查询次数,还能生成高质量的对抗样本。为此,该研究提出一种基于圆几何性质的黑盒攻击方法,称为CBA。该方法利用离散余弦变换,将攻击位置选择在频率空间中进行,利用低频信息在其决策边界附近利用圆的几何性质不断迭代得到低频空间中的对抗样本。最后,逆离散余弦变换将其变换回输入空间。它避免了梯度估计,在保证攻击成功率的同时显著降低查询次数。在ImageNet数据集上的实验结果表明,CBA在查询量分别为500,1000,2000的情况下,生成对抗样本的攻击成功率均比最新利用决策边界的几何性质的黑盒攻击方法高。同时,CBA在相同查询量不同约束条件下,也具有更高的攻击成功率。以上结果表明,CBA减少了生成对抗样本所需的查询量,且生成的对抗样本失真更小,图像质量更佳。除此之外,还在现实世界模型中测试了CBA的有效性。
  • 李忠伟, 李可一, 刘昕
    录用日期: 2025-03-25
    在推荐系统中,序列推荐旨在通过用户的历史交互序列来预测其未来兴趣。然而,现有深度学习模型通常侧重于捕捉用户的长期行为模式,而对时间信息的细粒度建模有所忽视,从而限制推荐效果的提升。为了解决这一问题,提出了一种结合全局与局部自注意力机制的方法,通过分块处理用户交互序列并引入权重衰减机制,根据时序距离为不同序列块分配差异化权重,从而更精确地捕捉用户长短期兴趣的变化。然而,这种方法会引入更多的参数,增加模型的复杂度。虽然随机共享嵌入(SSE)技术能够减少参数量并缓解过拟合,但其随机嵌入方式可能会引入噪声数据,影响推荐结果的准确性。针对此问题,提出了一种结合生成对抗网络(GAN)与SSE技术的策略,通过GAN生成符合用户兴趣分布的高质量交互数据,并结合SSE中的随机替换机制进行数据增强,在随机选择生成的数据时,增加由GAN生成的高质量数据,从而降低噪声引入的风险,同时保留了SSE技术降低过拟合方面的优势。在Movielens-1M、Amazon Beauty和Yahoo Music三个公开数据集进行实验,结果表明,所提出方法在归一化折损累计增益(NDCG)、命中率(HR)以及平均倒数排名(MRR)指标上表现优异。
  • 赵涛, 董立红, 秦昳
    录用日期: 2025-03-25
    在煤矿智能化建设背景下,煤矿井下人员实时监测对于保障矿井安全具有重要意义。然而,目前常见检测模型在井下部署时由于参数过大,难以满足实时监测的需求,同时由于煤矿井下环境复杂,人员检测存在漏检、误检等情况,为此,提出了一种融合注意力和轻量级网络的井下人员检测算法。首先,针对模型参数量过大导致难以部署的问题,采用重构轻量化模块C2f_RepGhost替换模型主干网络的C2f模块。其次,为了提高模型检测准确率,在主干网络中添加EMA注意力机制。然后,为了增强模型的小目标人员检测能力,引入DyHead动态检测头。最后,使用Inner-CIoU替换原损失函数,优化目标定位精度。并在PASCAL VOC 2012数据集和自建煤矿井下数据集上进行对比实验,结果表明:在VOC 2012数据集上,改进后的模型相较原模型准确率提升了1.3%,召回率提升了1.2%。在自建数据集上,改进后的模型参数减少了29.6%,准确率和召回率相较原模型分别提升了2.4%和3.5%,达到了95.3%和90%,改进后的模型在减少参数的同时改善了模型漏检、误检的情况,能够满足煤矿井下人员检测的实际要求。
  • 李整, 李志霄, 秦金磊, 郭长珍
    录用日期: 2025-03-21
    针对综合能源系统负荷噪声大、波动性强、周期信息提取困难问题,提出一种基于模式互相关和时序片段关联机制的多元负荷预测方法。通过互相关函数分析外界影响因素与多元负荷间的交叉滞后关系,确定最相关的时滞并据此重构和嵌入数据;在此基础上,提出模式互相关机制,根据数据的变化趋势将其抽象为模式数据,以减轻数据波动与噪声的影响,然后基于互相关理论识别和提取关键时刻及周期信息;同时,设计时序片段关联机制,将序列划分为多个子序列,基于互信息方法分析和筛选子序列,增强模型对序列局部连续性信息的捕获能力。在美国亚利桑那州立大学坦佩校区综合能源系统数据集上进行多项消融实验和对比实验。消融实验结果表明,交叉滞后分析重构的数据有效提升了模型的预测精度,模式互相关机制和时序片段关联机制分别增强了模型的关键时刻识别能力和局部信息捕捉能力。对比实验结果表明,所提方法在多项评估指标上优于5种主流预测模型,具有较高的预测精度。
  • 贾俊杰, 李天乐, 刘世龙
    录用日期: 2025-03-21
    随着互联网平台的快速发展,推荐系统在提供个性化服务的同时,依旧面临着托攻击行为导致的推荐准确度下降问题。现有的托攻击检测算法大多以一个或几个评价指标从用户评分差异的视角进行,且较少考虑用户选择项目的偏好相关性,导致对用户行为特征建模不够全面,易造成检测误判率较高或适用攻击模式较少的问题。针对这一问题,提出一种多视角特征融合的托攻击检测算法。算法根据变分自编码器获取用户评分潜在特征与分布特征的基础上,从评分长短期依赖、概率密度分布的视角学习用户概貌的时空分布特征,结合用户历史偏好相关性,利用神经网络模型进行多视角特征融合,形成具有综合检测能力的用户概貌表示,以提升托攻击检测精度。实验结果表明,本算法对虚假用户检测精度有较大提升,在大多数情况下均能达到95%以上。在不同填充率和不同攻击规模下,该算法对托攻击行为均具有较好的检测效果,且具有较好的鲁棒性。
  • 金晶, 胡楚笛, 陈刚
    录用日期: 2025-03-20
    近年来,Transformer 模型凭借其出色的全局信息捕获能力和强大的表示能力,在医学图像分割领域被广泛应用,并 取得了显著成效。然而,这些方法在对图像进行序列化时,会将图像分割成固定大小的块,仅提取单一尺度的全局特征,一 定程度上割裂了图像的语义特征,最终导致分割精度不佳。鉴于此,我们提出了一种多尺度自注意力 Transformer 架构 (MultiFormer)。该架构首先采用连续卷积和下采样模块对图像进行处理,然后使用多尺度卷积投影模块来替换原来 1*1 的 投影模块,最后在自注意力模块生成的特征图中引入了可变形卷积。与传统 Transformer 图像序列化过程相比,这种连续卷积 在产生相同分辨率的特征时,有效增大了感受野,保留 2D 图像的空间相关性,避免固定位置和大小的图像块带来的语义信 息损失;其次,多尺度卷积投影模块利用四种不同大小的卷积核捕捉图像中的上下文信息,并通过通道拼接实现多尺度特征 的融合,反应了不同尺度下局部与局部间的注意力,而不仅限于单一尺度,实现了模型对不同尺度语义信息的聚合能力,进 一步减轻了语义割裂的问题。此外,可变形卷积通过引入一个额外的卷积层来学习并生成偏移场,使得卷积核能够灵活调整 其形状,以适应图像中形态多变的病变或器官,提升模型对复杂医学图像的处理能力。将该模块分别插入到 SETR、TransUnet、 TransFuse 三个网络结构中,并在 ACDC 心脏数据集和 ISIC2018 皮肤病变数据集上进行实验,结果表明 Dice 系数分别提升了 3.63%、1.06%、2.30%和 1.22%、2.31%、3.01%。MultiFormer 具有即插即用性,能够轻松地集成到各种下游医学图像分析任 务中。
  • 饶东宁, 马卓文
    录用日期: 2025-03-20
    事件抽取是信息抽取领域中的一个重要任务,其目标是从自然语言文本中识别并提取出特定的事件或事实信息。事件重叠的是事件抽取任务的一个关键问题,即同一个词语可能充当不同事件类型的触发词或者在不同事件中扮演不同的角色。目前的重叠事件抽取方法往往未能充分考虑论元角色之间的关联关系,这在一定程度上影响了事件抽取的效果。针对事件抽取领域的事件嵌套挑战,该研究提出了一种基于论元关联图的级联类型事件抽取模型模型—AAGCTEE(Cascading Type Event Extraction Model Based On Argument Association Graph)。AAGCTEE依托XLM-roberta-base实现深度编码,并通过条件层归一化及空洞卷积技术优化词对间的表征。在触发词识别模块中,AAGCTEE的级联类型预测器(Cascade Type Predictor, CTP)能够精准辨识多类事件相关的触发词,有效解决了传统事件抽取中常见的触发词嵌套难题。在论元识别分类模块中,AAGCTEE借助论元关联图(Argument Association Graph, AAG)和全局归一化解码策略(Global Normalization Decoding, GND),高效处理了复杂的嵌套论元结构。 AAGCTEE的触发词识别、触发词分类、论元识别、论元分类四个指标的平均F1值在中文数据集DUEE、FewFC与英文数据集PHEE、CASIE上均表现出色,在四个数据集上分别比对比模型平均高9.67%、9.22%、18.95%和37.31%。与分别缺失级联类型预测器、论元关联图和的消融实验相比AAGCTEE在上述四个评价指标的平均F1得分上平均提高了6.92%、6.68%和6.45%,验证了AAGCTEE在提取复杂事件方面的有效性。
  • 彭李湘松, 张著洪
    录用日期: 2025-03-18
    方面级情感分析旨在获取句法结构复杂的语句中特定方面词的情感极性。现有基于依存树与图神经网络的模型因难以完整提取句法结构与深层语义特征,以及特征融合机制有效融合语义特征与句法结构难,导致情感分析中句子情感极限判断的准确率低。为此,建立基于DeBERTa的新型方面级情感分析模型。首先,借助DeBERTa生成文本词向量,同时利用方面感知注意力机制提取方面词的特征,以及利用抽象语义表示获取文本句法结构,减少特征信息因提取不完整而对后续情感分析的影响;其次,构建融合句法结构与深层语义特征的新型三角形乘法机制;最后,经由三角形自注意力机制和全连接网络将方面词的情感极性特征映射到情感分类层,使无关噪声的干扰能得到有效抑制,提升情感极性判断的准确率。11种模型参与求解5种数据集的实验结果表明,相较于最新的基线模型,所获模型的情感极性判断准确率和宏平均F1值分别平均提升0.93%和1.39%,因此该模型更能有效获取句子的句法结构与深层语义,且情感极性的分类准确率高。
  • 付翌蕊, 陈海燕, 周智慧, 袁立罡
    录用日期: 2025-03-18
    空域交通复杂度是影响民航运行效率和安全重要因素。为了进一步提高空域交通复杂度的评估精度,本文提出了一种基于多尺度空域交通时空图像和深度度量学习的复杂度评估方法。具体而言,本文将交通流数据以像素点的方式填充到网格化的目标空域图像中,并在时空两个维度进行插值,以充分捕捉交通流在时间和空间上的动态变化,最终生成20组不同尺度的空域交通时空图像集;接着,提出了一种基于深度度量学习的空域交通复杂度评估模型,该模型以多尺度空域交通图像集作为输入,使用排序代理锚损失函数优化样本在高维嵌入空间的距离分布,使同类样本之间的距离更紧密,而异类的样本之间的距离更分散;最后,利用分类器对空域交通复杂度进行五个等级的评估。实验采用了中南空域的实际交通数据生成多尺度时空图像集,并进行了一系列对比实验。实验结果表明,空域交通图像集的时空尺度对评估结果有重要影响;与现有其他评估方法相比,本文所提的方法能够显著提高空域交通复杂度评估的准确率和性能。
  • 谭台哲, 龚智远, 杨卓
    录用日期: 2025-03-14
    基于多张不同曝光的低动态范围(LDR)图像重建高动态范围(HDR)图像是一项具有挑战性的任务,尤其是在存在相机和物体运动的情况下,运动区域常常会产生伪影,从而影响最终重建图像的质量。这一问题的根本原因在于多张LDR图像在内容上的对齐不佳,图像之间的几何差异会显著影响重建效果。为了解决这一问题,本文提出了一种特征预对齐的高动态范围图像重建网络,该网络旨在通过特征的预对齐来提高HDR重建的效果。该网络由两个主要部分组成:特征预对齐部分和HDR重建部分。在特征预对齐部分,设计了一个特征对齐网络,该网络能够引导输入图像的特征与参考图像对齐,从而减少运动引起的伪影。重建部分通过选择性状态空间模型来对预对齐后的特征进行全局上下文的建模,并通过简化的HDR恢复网络生成最终的HDR图像。为了评估所提网络的性能,本文在Kalantari数据集上进行了广泛的实验,实验结果显示,该网络在多个客观指标上优于现有方法,并在主观视觉感受上也呈现出不错效果。另外,为验证该网络模型的泛化能力,在Kalantari数据集的训练集上训练了所提出的网络,并随后将该训练好的网络在Sen的数据集上进行测试,结果表明本文所提网络具有一定的泛化能力。