作者投稿和查稿 主编审稿 专家审稿 编委审稿 远程编辑

热点文章

Please wait a minute...
  • 全选
    |
  • 前沿观点与综述
    郭斌, 吴磊, 刘希明, 李明泽, 张周阳子, 刘思聪, 於志文
    计算机工程. 2026, 52(3): 1-40. https://doi.org/10.19678/j.issn.1000-3428.0253199
    摘要 (64) PDF全文 (55) HTML (8)   可视化   收藏

    群体智能是国家《新一代人工智能发展规划》提出的5个趋势方向之一, "群体智能是如何涌现的"也被《Science》于2021年列为未来亟待攻克的125个关键科学问题之一。当前关于群体智能涌现的研究多以鸟群、鱼群等生物集群为主要对象, 强调简单个体在局部交互规则下形成全局有序行为; 相比之下, 人类社会的群智涌现不仅包含行为层面的协同与组织, 更体现出知识、文化与创新层面的高阶智能与复杂内涵。面对这一差异与空白, 本文系统梳理与阐释人类社会群体智能的概念框架与核心内涵, 围绕人群行进、群体智慧、共识形成、社会合作、社会学习、知识文化与集智创新7类典型现象展开深入分析, 归纳其关键机制、主要模型、驱动要素与演化规律, 进而构建人类社会群智涌现理论体系。在此基础上, 进一步探讨人类群智向人工群智的映射路径与机理, 提炼群智机理驱动的典型人工群智系统范式与实现要点, 为面向复杂任务的人工群智系统设计、构建与发展提供基础理论依据与方法支撑。

  • 前沿观点与综述
    廖勇, 韩小金, 刘金林, 汪浩
    计算机工程. 2026, 52(3): 41-61. https://doi.org/10.19678/j.issn.1000-3428.0069925
    摘要 (443) PDF全文 (160) HTML (10)   可视化   收藏

    人工智能在诸多领域的应用取得了突破性的进展, 引起了全球各国对其研发的高度重视。然而, 人工智能的快速发展也带来了一系列的问题, 过度依赖和盲目信任人工智能模型可能导致严重的风险。因此, 可解释人工智能成为构建可信、透明的智能系统的关键要素, 其研发变得尤为迫切。为此, 本文综述可解释人工智能的国内外研究进展, 从多维度、多层次进行全面梳理与归纳。首先, 基于当前行业内的研究成果, 将可解释人工智能的关键技术细分为解释模型、解释方法、安全测试及实验验证4类, 旨在明确各领域的技术焦点与发展方向。然后, 探讨可解释人工智能在多个关键行业领域的具体应用实例, 包括但不限于教育、医疗、金融、自动驾驶及司法等, 展示其在提升决策透明度等方面的重要作用。最后, 深入剖析可解释人工智能当前面临的主要技术挑战, 并展望其未来的发展趋势, 尤其针对当前备受瞩目的大模型可解释性问题, 进行了专项调研与探讨分析。

  • 计算机视觉与图形图像处理
    唐克, 魏飞鸣, 李东瀛, 郁文贤
    计算机工程. 2026, 52(3): 97-106. https://doi.org/10.19678/j.issn.1000-3428.0070085
    摘要 (735) PDF全文 (152) HTML (12)   可视化   收藏

    针对无人机图像中小目标实例多、目标间存在遮挡所导致的漏检和误检等现象, 提出一种基于改进YOLOv8的轻量化无人机图像小目标检测算法。首先, 在颈部引入三特征编码器(TFE)、尺度序列特征融合(SSFF)模块, 增强了网络对不同尺度特征的提取能力。接着, 设计小目标检测层(SMOH), 并将其与改进的颈部特征提取网络进行融合, 在头部引入一个额外的检测头, 减小小目标特征的损失, 增强网络对小目标的识别能力。然后, 针对完整交并比(CIoU)的缺陷, 结合适应交并比(Wise-IoU)、内部交并比(Inner-IoU)和最小点距离交并比(MPDIoU), 提出了一种回归损失函数Wise-Inner-MPDIoU。最后, 为了实现算法在移动端和嵌入式场景下的轻量化应用需求, 进行了基于幅度的层自适应稀疏化剪枝, 在保证模型精度的同时进一步压缩了模型大小。实验结果表明, 相比于原YOLOv8s算法模型, 改进后的模型在mAP@0.5提高6.8百分点的同时参数量、计算量、模型大小分别降低76.4%、17.1%、73.5%, 在检测精度与轻量化方面均取得了显著提升, 具有很强的实用价值。

  • 多模态与信息融合
    张志, 尹昱凯, 孙奕灵, 孟雯锦, 彭畅
    计算机工程. 2026, 52(3): 243-254. https://doi.org/10.19678/j.issn.1000-3428.0070175
    摘要 (294) PDF全文 (69) HTML (0)   可视化   收藏

    针对Android恶意软件种类和结构繁杂不一、单一静态特征难以区分良性和恶意软件的问题, 在深入研究Android软件的权限、API、字节码、操作码等特征的基础上, 提出一种基于多模态特征融合的构建方法。将字节码转换为RGB图像, 通过预训练模型EfficientNetV2B3提取字节码图像特征, 以表征Android应用的整体特性。利用局部敏感哈希(LSH)算法提取操作码序列特征, 以表征Android应用的细节特性。采用多模态分解双线性池化(MFB)融合算法对字节码图像特征和操作码序列特征进行融合, 实现2种特征数据的异质互补, 以得到更具区分度的静态特征。在此基础上, 提出一种基于Transformer的Android恶意软件检测模型(TEAAD)。实验结果表明, 基于融合特征的TEAAD模型优于其他深度模型, 检测准确率达到96.87%, MFB特征融合方法相较于其他方法具有更高的恶意软件识别能力。

  • 计算机视觉与图形图像处理
    曹继卫, 罗飞, 丁炜超
    计算机工程. 2026, 52(3): 119-127. https://doi.org/10.19678/j.issn.1000-3428.0070159
    摘要 (199) PDF全文 (66) HTML (8)   可视化   收藏

    近年来, 基于深度学习的目标检测算法在准确率和鲁棒性等方面取得了巨大进步, 并且在工业界得到广泛应用。但是, 在小目标检测领域, 当前的目标检测算法仍然存在漏检率和误检率高的问题。因此, 提出一种基于SCConv和BSAM注意力机制的YOLO小目标检测算法BS-YOLO。首先, 针对特征提取网络存在大量冗余信息的问题, 利用SCConv重构主干网络, 提出一种新的模块C3SC, 对提取到的特征图从空间和通道两个方面减少冗余信息, 提升主干网络提取到的特征图质量, 从而提高检测精度; 其次, 结合CBAM和BiFormer自注意力机制提出一种新的注意力机制BSAM, 在空间和通道两个方面合理分配权重, 使特征图更加关注有效信息, 抑制背景的干扰; 最后, 为了解决小目标检测存在的难易样本分布不均的问题, 利用Slideloss优化损失函数, 从而提高小目标检测的效果。在RSOD数据集上的实验结果表明, BS-YOLO算法的精确率为94.2%, 召回率为91.6%, 均值平均精度(mAP@0.5)为95.9%, 相对于原始的YOLOv5算法, 分别提高了3.3、0.1、3.6百分点, 表明BS-YOLO算法可以有效提高小目标检测的精度, 降低漏检率。

  • 前沿观点与综述
    秦颖鑫, 张可佳, 潘海为, 巨亚昊
    计算机工程. 2026, 52(2): 46-68. https://doi.org/10.19678/j.issn.1000-3428.0069826
    摘要 (593) PDF全文 (266) HTML (29)   可视化   收藏

    深度学习引领人工智能蓬勃发展, 被广泛用于计算机视觉, 在图像识别、目标检测、目标跟踪、人脸识别等复杂任务上取得了突破性进展和显著的成果, 展现出其卓越的识别和预测能力。但深度学习模型的脆弱性和漏洞也逐渐暴露, 以卷积神经网络为代表的深度学习技术对精心设计的对抗样本极为敏感, 容易对模型的安全性和隐私性造成影响。首先, 总结对抗攻击的概念、对抗样本产生的原因以及相关术语, 概述数字域和物理域中几类经典的对抗攻击策略, 对其优缺点进行分析; 其次, 专注计算机视觉, 从数字域和物理域两个方面分别总结目标检测、人脸识别、目标跟踪、单目深度估计、光流估计中对抗攻击的最新研究进展以及常用于研究的各种数据集, 简单介绍现阶段对抗样本的防御和检测方法, 归纳对抗样本防御和检测方法的优缺点, 阐述不同视觉任务对抗样本防御的应用实例; 最后, 基于对抗攻击方法的总结, 探索并分析现有计算机视觉对抗攻击的不足和挑战。

  • 前沿观点与综述
    方仪豪, 邹丹平
    计算机工程. 2026, 52(2): 13-23. https://doi.org/10.19678/j.issn.1000-3428.0070059
    摘要 (314) PDF全文 (141) HTML (20)   可视化   收藏

    随着人工智能与机器人技术的深度融合, 多旋翼无人机在多个领域中得到了广泛应用, 展现了其灵活性和高效性。然而, 在开发和验证多旋翼无人机的飞行控制算法或解决方案时, 研究人员面临着高成本和高风险的挑战。为了降低这些风险并提高算法测试和优化的效率, 多旋翼无人机仿真平台提供了一个安全、可控的环境。首先, 介绍了多旋翼无人机的常规机型, 选取了常用的四旋翼无人机作为多旋翼无人机的代表机型, 根据不同仿真程度阐述了其动力学模型。接着, 对多旋翼无人机仿真平台的常规系统结构框架进行概述, 并探讨了其评价方式和分类方法。从功能和性能两个方面出发, 进一步细化了仿真平台的评价方式。多旋翼无人机仿真平台的分类一方面根据其是否支持交互学习环境进行划分, 另一方面依据不同侧重点, 从动力学、传感器和多机集群3个方面进行分类。然后, 回顾了现有无人机飞行任务的主要解决方案, 在传统解决方案和基于学习方式的解决方案背景下, 分析了现有的典型多旋翼无人机仿真平台。最后, 对多旋翼无人机仿真平台未来发展进行了展望。

  • 前沿观点与综述
    王梓, 王洪强, 杨晓艺, 兰雨晴
    计算机工程. 2026, 52(2): 24-45. https://doi.org/10.19678/j.issn.1000-3428.0069799
    摘要 (129) PDF全文 (53) HTML (9)   可视化   收藏

    操作系统(OS)作为信息时代关键基础设施, 广泛应用于军事、工业、医疗等核心领域。其可靠性与安全性直接决定关键领域运行稳定, 漏洞易致系统崩溃、数据泄露等严重后果, 因此构建系统化安全保障体系具有重要理论与工程价值。以"形式规约-形式验证-工程落地"为框架, 梳理近十年该领域研究成果, 剖析技术路径与实践应用。在形式规约层面, 明确基于迁移系统等数学结构描述系统功能的模型规约与基于线性时序逻辑(LTL)定义安全、活性需求的性质规约的差异, 从功能正确性和安全属性两个方面进行阐述, 其中, 功能正确性涵盖任务管理调度、内存分配回收、异常中断处理、任务间通信与文件系统读写一致性, 安全属性聚焦访问控制的BLP模型与BIBA模型、分离内核多域隔离、信息流无干扰与无泄漏理论。在形式验证层面, 阐述依托霍尔逻辑验证程序一致性的推理证明、基于LTL与计算树逻辑(CTL)验证时序属性的模型检测、属性验证标准化流程3类核心方法, 并以首个通过机器证明实现功能正确与信息流无干扰的seL4微内核为案例, 揭示理论到工程的转化路径。在工程应用上, 总结汽车领域控制器局域网(CAN)总线通信验证、智能手机Android系统组件间通信鲁棒性检测的成果。本文的系统性梳理旨在为相关领域的研究奠定基础, 为大语言模型提供数据集支持, 并为最终的技术工程落地提供参考。

  • 多模态与信息融合
    李健浪, 吴新电, 陈灵, 阳波, 唐文胜
    计算机工程. 2026, 52(2): 299-310. https://doi.org/10.19678/j.issn.1000-3428.0070113
    摘要 (772) PDF全文 (222) HTML (20)   可视化   收藏

    针对自动驾驶场景中行人和车辆的目标识别与定位问题, 提出一种四维(4D)毫米波雷达与视觉融合的CDCAM-BEV算法, 以提高目标检测的精度。首先, 设计雷达柱体网络, 将4D雷达点云编码为伪图像, 并通过正交特征变换(OFT)将单目图像转换为鸟瞰图(BEV)特征; 其次, 基于交叉注意力机制, 设计共同信息提取模块(CICAM)和差异信息提取模块(DICAM), 充分挖掘雷达和图像的公共信息和差异信息; 最后, 基于CICAM和DICAM设计BEV特征融合模块, 实现图像信息和雷达信息在BEV空间的特征级融合。在VOD数据集上进行实验, 将CDCAM-BEV算法与其他5种三维(3D)目标检测算法进行对比。实验结果表明, CDCAM-BEV在多个模式下检测性能均优于其他算法。在3D模式下, CDCAM-BEV的平均检测精度比排名第二的Part-A2高出3.65百分点; 在BEV模式下, 比排名第二的PointPillars高出5.04百分点; 在平均方向相似度(AOS)模式下, 比排名第二的Part-A2高出2.62百分点。结果显示, CDCAM-BEV在各模式下均表现出卓越性能, 能够有效融合图像和4D雷达点云特征, 显著提高目标检测的精度和可靠性。

  • 大模型与生成式人工智能
    王合庆, 魏杰, 景红雨, 宋晖, 徐波
    计算机工程. 2026, 52(2): 383-392. https://doi.org/10.19678/j.issn.1000-3428.0070415
    摘要 (577) PDF全文 (1185) HTML (13)   可视化   收藏

    大语言模型(LLM)在对话、推理和知识保留能力方面展现了显著优势, 但在处理电力领域知识密集型任务时仍面临事实准确性不足、知识更新难以及高质量领域数据集匮乏的问题。针对这些挑战, 引入一种改进的检索增强生成(RAG)策略, 该策略融合了混合检索策略和经过微调的生成模型, 提供了更高效的知识捕获和更新能力。基于对现有方法的深入分析, 针对电力领域的知识问答(QA)任务, 提出了元数据驱动的RAG框架Meta-RAG, 该框架包含数据准备、模型微调和检索推理3个阶段。数据准备阶段包括文档转换、元信息抽取与增强及文档解析模块, 在此阶段, 借助元信息的提取与增强确保了电力规范文档的高效索引和结构化处理, 并且构建了电力领域的EleQA(Electricity Question Answering)数据集, 这是一个包含19 560个问答对的电力规范问答数据集。在模型微调阶段, 通过多问题生成、思维链提示生成和监督指令微调数据集构建模块, 优化了模型在特定电力问答任务上的推理能力。在检索推理阶段则采用混合编码和重排序策略, 结合检索和生成模块, 进一步提高了答案的准确性和合理性。通过一系列实验, Meta-RAG的有效性得到验证。与Self-RAG、Corrective-RAG、Adaptive-RAG、RA-ISF等基线模型相比, Meta-RAG具有更高的回答准确率和检索命中率, 其中, 基于Qwen1.5-14B-Chat模型的Meta-RAG达到了整体准确率0.804 3, 高于其他方法。消融实验和文档召回实验结果表明文档检索对框架性能影响最大, 失去检索能力整体准确率下降了0.292 8。

  • 大模型时代的服务计算
    林丹, 卢顺峰, 刘姿妍, 张博昭, 何龙, 蒋子规, 吴嘉婧, 郑子彬
    计算机工程. 2026, 52(1): 1-21. https://doi.org/10.19678/j.issn.1000-3428.0253233
    摘要 (253) PDF全文 (132) HTML (12)   可视化   收藏

    区块链已逐渐发展成支撑数字经济的重要基础设施, 但其匿名性、跨链互操作性、多方参与等特征, 导致诈骗、洗钱与攻击等安全事件频发, 严重威胁生态系统的稳定与合规。尽管现有分析工具与方法在区块链服务安全领域取得了一定进展, 但仍普遍存在泛化能力不足、推理能力有限、难以适应复杂业务逻辑演化等问题。与此同时, 生成式大语言模型(LLM)的快速发展正在深刻重塑服务计算范式, 其在自然语言理解、知识推理与多模态融合等方面的优势, 为区块链服务安全研究提供了新的思路与技术路径。系统梳理LLM在事前智能合约审计、事中异常行为检测、事后多链行为关联任务中的应用进展, 归纳其优势与局限, 总结LLM赋能区块链服务安全的典型实践。最后, 展望LLM赋能区块链服务安全面临的开放科学问题与未来研究方向, 为构建可信、可解释、高效的区块链服务计算与治理体系提供参考。

  • 大模型时代的服务计算
    张珑耀, 温东新, 马庄宇, 舒燕君, 李庆, 刘明义, 左德承
    计算机工程. 2026, 52(1): 22-32. https://doi.org/10.19678/j.issn.1000-3428.0252754
    摘要 (268) PDF全文 (120) HTML (13)   可视化   收藏

    基于大语言模型(LLM)的多智能体系统(MAS)虽在处理复杂任务方面展现出巨大潜力, 但其分布式特性与交互不确定性易引发多样化异常, 威胁系统可靠性。为系统化识别并分类此种异常, 进行全面综述。研究选取7个代表性MAS及相应数据集, 收集13 418段运行轨迹, 采用LLM初步分析与专家人工校验相结合的方法进行数据分析。构建一个涵盖模型理解感知异常、智能体交互异常、任务执行异常和外部环境异常4个层级的细粒度异常分类框架, 并结合典型案例揭示各类异常产生的内在逻辑与外部诱因。统计分析显示: 模型理解感知异常占比最高, 其中"上下文幻觉"和"任务指令误解"是主要问题; 智能体交互异常占16.8%, "信息隐瞒"是主因; 任务执行异常占27.1%, 主要表现为"决策重复出错"; 外部环境异常占18.3%, 以"记忆冲突"为主。此外, 模型理解感知异常作为根源性诱因, 引发其他层级的异常, 凸显了提升模型基础能力的重要性。此分类和根源分析旨在为构建高可靠的基于LLM的MAS提供理论支撑与实践参考。

  • 大模型时代的服务计算
    张俊娜, 王泓尊, 丁春涛
    计算机工程. 2026, 52(1): 33-60. https://doi.org/10.19678/j.issn.1000-3428.0252721
    摘要 (227) PDF全文 (560) HTML (7)   可视化   收藏

    后训练量化(PTQ)是一种高效的模型压缩方法, 它无需重新训练模型, 只需少量(或无需)无标签校准数据即可将高精度浮点模型的参数转换为低比特整数表示。该方法在显著降低存储与计算开销的同时能够最大限度地保留原始模型的推理精度, 因而受到学术界与工业界的广泛关注。从PTQ的量化步骤、方法分类、工具生态、应用进展4个维度, 系统总结PTQ的研究进展。首先, 构建了量化流程框架, 涵盖动态范围统计、量化参数计算、权重与激活量化、误差优化和模型生成等步骤; 其次, 提出一个完整的量化方法分类体系, 从量化粒度、位宽、校准方法到结构导向量化; 再次, 分析了支持PTQ规模化应用的工具生态, 探讨了其在硬件适配和工程部署中的应用价值; 最后, 总结了PTQ方法的融合与应用进展, 并指出PTQ方法在实践中面临的挑战, 尤其是跨模态一致性、极低比特语义崩塌与硬件适配等难题。这些实践挑战的总结不仅揭示了当前技术的局限性, 也为未来研究提供了重要方向。本综述为学术界与工业界提供了PTQ方法的参考框架, 助力推动人工智能在资源受限场景中的广泛应用。

  • 计算机视觉与图形图像处理
    黎东丰, 陈雨人, 余博
    计算机工程. 2026, 52(1): 154-165. https://doi.org/10.19678/j.issn.1000-3428.0252294
    摘要 (260) PDF全文 (87) HTML (21)   可视化   收藏

    在现有基于U-Net的路面裂缝检测方法中, 编码器各层次特征间的交互未能得到充分考虑, 容易因下采样过程中的信息丢失而导致检测结果不完整或出现漏检。为此, 提出一种基于多层次特征融合的路面裂缝检测方法。首先, 在编码阶段, 提取裂缝在不同层次上的特征, 形成从浅层到深层的裂缝特征表示; 其次, 在跳跃连接部分, 采用基于改进通道交叉Transformer(CCT)的跨层次融合策略, 增强各层次特征间的互补性, 丰富裂缝特征的表达; 最后, 在解码阶段, 通过特征融合模块优化解码器对编码器特征的利用方式, 促进裂缝特征的传递, 提高对裂缝特征的感知能力。为验证所提方法的有效性, 在DeepCrack和CRACK500 2个公开数据集上进行一系列的对比和消融实验, 结果表明, 所提方法的综合表现优于DeepCrack、Swin-UNet等6种方法, 在DeepCrack数据集上的F1值相较DeepCrack、Swin-UNet分别提高了2.30和2.51百分点, 在CRACK500数据集上则分别提高了1.65和1.00百分点。

  • 网络空间安全
    蒋翠玲, 程梓源, 俞新贵, 万永菁
    计算机工程. 2026, 52(1): 242-253. https://doi.org/10.19678/j.issn.1000-3428.0069948
    摘要 (249) PDF全文 (155) HTML (6)   可视化   收藏

    人脸深度伪造技术的滥用给社会和个人带来了极大的安全隐患, 因此深度伪造检测技术已成为当今研究的热点。目前基于深度学习的伪造检测技术在高质量(HQ)数据集上效果较好, 但在低质量(LQ)数据集和跨数据集上的检测效果不佳。为提升深度伪造检测的泛化性, 提出一种基于多尺度双流网络(MSDSnet)的深度伪造检测方法。MSDSnet输入分为空域特征流和高频噪声特征流, 首先采用多尺度融合(MSF)模块捕获不同情况下图像在空域被篡改的粗粒度人脸特征和伪造图像的细粒度高频噪声特征信息, 然后通过MSF模块将空域流和高频噪声流的双流特征充分融合, 由多模态交互注意力(MIA)模块进一步交互以充分学习双流特征信息, 最后利用FcaNet(Frequency Channel Attention Network)获取伪造人脸特征的全局信息并完成检测分类。实验结果表明, 该方法在HQ数据集Celeb-DF v2上的准确率为98.54%, 在LQ数据集FaceForensics++上的准确率为93.11%, 同时在跨数据集上的实验效果也优于其他同类方法。

  • 热点与综述
    廖牛语, 田沄, 李岩松, 薛海峰, 杜长坤, 张国华
    计算机工程. 2025, 51(12): 1-17. https://doi.org/10.19678/j.issn.1000-3428.0253230
    摘要 (420) PDF全文 (318) HTML (47)   可视化   收藏

    近年来, 以GPT、LLaMA、Qwen、DeepSeek等为代表的大模型在自然语言处理、计算机视觉及多模态等领域取得了突破性进展。然而, 受限于其推理机制、参数规模和固有的训练数据知识等因素, 这些模型在处理复杂任务、解答专业领域问题及生成时效性内容时, 常出现答案不准确乃至事实性偏差幻觉等问题, 严重制约了其在高可靠性场景中的应用。为突破上述能力瓶颈, 工具学习范式应运而生并迅速成为研究热点, 其核心旨在使大模型理解并使用外部工具以完成特定任务。通过调用数据库、搜索引擎、数学工具等外部工具, 大模型能够超越自身参数化知识, 提升其推理、决策和执行能力, 缓解幻觉问题。本文系统综述了大模型工具学习的发展脉络与技术进展, 剖析了工具对大模型能力的扩展, 梳理了从上下文学习到微调训练的工具调用机制, 进而探讨了工具调用性能优化、自适应工具生成等关键问题, 分析了大模型工具调用的测评方法, 最后总结了当前工具学习面临的挑战并对大模型工具学习未来发展方向进行展望。

  • 人工智能与模式识别
    袁英华, 金英然, 高赟
    计算机工程. 2025, 51(12): 96-108. https://doi.org/10.19678/j.issn.1000-3428.0069871
    摘要 (350) PDF全文 (545) HTML (46)   可视化   收藏

    孪生跟踪网络是主流的目标跟踪框架之一,其包括骨干网络、融合网络和定位网络3个模块。对于融合网络模块,Transformer是较新且有效的融合网络实现方法。Transformer的编码器和解码器中使用自注意力机制对卷积神经网络(CNN)特征进行增强。然而,自注意力机制仅能从空间维度进行特征增强,未考虑从通道维度进行特征增强。为了使得Transformer的自注意力网络同时对特征的空间维度和通道维度进行增强,为目标定位网络提供准确的相关性信息,提出一种基于双维度特征增强的Transformer跟踪器,对Transformer融合网络进行改进。首先,采取骨干网络的第三和第四阶段特征作为输入;然后,在Transformer编码器与解码器的自注意力模块中,通过CAE-Net网络进行通道维度的特征增强,用于增强通道上的重要性,通过SAE-Net网络实现两阶段特征的加权融合与线性变换,获取自注意力因子QKV;最后,通过自注意力运算实现空间维度特征增强。在5个主流的公开基准数据集上进行实验,结果表明,改进后的Transformer特征融合模块可以用极小的速度代价提升跟踪器的跟踪性能。

  • 移动互联与通信技术
    王华华, 黄烨霞, 李玲, 王嘉程
    计算机工程. 2025, 51(12): 255-267. https://doi.org/10.19678/j.issn.1000-3428.0069877
    摘要 (310) PDF全文 (854) HTML (12)   可视化   收藏

    在无蜂窝网络环境下实施联邦学习(FL)时, 用户调度和资源分配策略对优化系统时间开销、提升用户可达速率以及加速FL收敛速率至关重要。为解决资源分配不均的问题, 设计一种联合用户调度、CPU处理频率和功率分配的优化方案。通过最大化系统的最小用户速率来实现资源的公平分配, 并提升FL性能。联合优化问题被分解为用户调度和功率分配两个子问题。在用户调度方面, 设计基于k-means聚类的贪婪调度算法, 以综合评估用户的信道状态和数据"价值", 并将用户划分为不同的群组。随后, 针对每个群组的资源占用情况, 为组内用户制定个性化的CPU处理频率分配方案。最后, 通过在各群组中独立执行用户调度, 实现高效且精准的用户选择, 并通过提前分组有效降低用户选择的复杂度。在功率分配方面, 引入基于二分法的功率分配算法(BM-PA)。该算法不仅考虑了用户间的公平性, 还针对资源受限用户进行了优先处理, 以确保其能够获得更优质的资源分配。BM-PA算法通过低复杂度的迭代优化过程, 实现了功率分配的快速收敛, 并在保证系统性能的同时, 显著提升了资源的利用效率。合理的用户调度策略是功率分配子问题获得最优解的基础, 采用交替迭代的方法允许在每个子问题中独立进行优化, 同时考虑到另一个子问题的解。这种相互依赖的关系通过多轮迭代优化过程, 确保功率资源被合理地分配给那些最需要或最有可能有效利用它们的用户, 从而使系统整体性能得到提升, 实现联合优化求解, 显著提升系统整体性能。仿真实验结果表明, 与基准算法相比, 所提算法在下行可达速率方面, 最佳平均提升幅度高达103.34%, 在上行可达速率方面, 最佳提升幅度达到102.78%。此外, 相较于基准算法还能平均节省67.44%的FL任务训练时间, 特别是在FL学习模型精度达到90%时, 所提算法的时间开销最小。

  • 图形图像处理
    王国明, 贾代旺
    计算机工程. 2025, 51(12): 294-303. https://doi.org/10.19678/j.issn.1000-3428.0070027
    摘要 (752) PDF全文 (332) HTML (49)   可视化   收藏

    深度学习在目标检测领域的广泛应用显著提升了对大中目标的检测能力。然而, 针对小目标检测, 由于其固有的尺度小、背景复杂等挑战, 传统的目标检测算法常常会出现漏检、误检。为了提高小目标检测的精度, 对YOLOv8模型进行研究。首先, 将主干部分的卷积模块替换为RFAConv模块, 增强了模型对于复杂图像的处理能力; 其次, 在Neck部分引入混合局部通道注意力(MLCA)机制, 能够在保持计算效率的同时, 帮助模型更高效地融合不同层次的特征; 再次, 将YOLOv8的Detect头替换为Detect_FASFF头, 以解决不同特征尺度间的一致性问题, 并增强模型对小目标的检测能力; 最后, 将完全交并比(CIoU)损失函数替换为Focaler-IoU损失函数, 使模型更关注难以精确定位的小目标。实验结果显示: 改进后的模型在小目标稀疏的FloW-Img数据集上mAP@0.5提高了4.8百分点, mAP@0.5:0.95提高了3.0百分点; 在小目标密度高的VisDrone2019数据集上, mAP@0.5提升了5.9百分点, mAP@0.5:0.95提高了4.0百分点。同时还在低空数据集AU-AIR以及行人密集检测数据集WiderPerson上做了泛化对比实验。结果表明, 优化后的模型相比较原模型在小目标检测精度上有显著提升, 且适用范围更广。

  • 开发研究与工程应用
    朱亚州, 杜平川, 柴志雷
    计算机工程. 2025, 51(12): 337-345. https://doi.org/10.19678/j.issn.1000-3428.0069437
    摘要 (393) PDF全文 (177) HTML (9)   可视化   收藏

    Kubernetes作为容器编排的主流工具, 可支持自动部署、服务发现以及负载均衡, 且具有高可用性、高效能的特点。然而, Kubernetes采用的最佳适应算法或最小负载法等调度策略忽略了节点的异构性和性能的差异性。此外, Kubernetes工具仅考虑CPU资源和内存资源且预先设置统一权重机制, 容易导致负载不均衡、性能下降以及无法满足精细化调度等问题。针对这些问题, 提出了一种基于多维度资源的异构任务调度(A-KCSS)算法, 该算法基于集群的异构计算资源, 增加磁盘输入/输出(I/O)、网络I/O负载以及GPU资源作为评价指标进行过滤和筛选, 更全面地考虑了node的异构性。此外, 引入一种基于多维度资源因素的权重计算模型, 依据待调度任务的资源需求, 计算待调度任务各维度资源因素的权重值, 结合集群node的实时资源利用率计算出每一个node的评分, 依据评分进行优先级排序, 并选择优先级最高的node进行调度。通过实验在Kubernetes集群上测试了A-KCSS算法的性能, 该算法与Kubernetes默认的调度算法以及Kubernetes容器调度(KCSS)算法相比, 平均响应时间分别减少10%和4%, 吞吐量分别提高30%和15%, 可用性分别提高40%和30%, 负载均衡性分别提高23%和18%, 集群的整体性能得到提高。

  • 热点与综述
    孙丽郡, 孟繁军, 徐行健
    计算机工程. 2025, 51(11): 1-21. https://doi.org/10.19678/j.issn.1000-3428.0069543
    摘要 (618) PDF全文 (4524) HTML (51)   可视化   收藏

    在教育信息化持续推进的背景下, 构建精准且高效的课程知识图谱已成为推动教育个性化发展的关键任务之一。课程知识图谱作为一种结构化的知识表示模型, 旨在揭示课程内容与学习目标之间的复杂关联关系, 以优化教育资源配置, 并为学习者定制个性化的学习路径。围绕课程知识图谱的构建技术进行探讨, 首先阐述知识图谱、教育知识图谱、课程知识图谱的基本概念及其之间的内在联系与显著差异; 其次深入剖析课程知识图谱构建的关键技术, 涵盖课程本体设计、实体抽取、关系抽取等方面, 并对其发展历程、特点及局限性展开详细分析与总结; 再次, 探讨课程知识图谱在学习资源推荐、学习者画像建模和多模态课程知识图谱构建等场景中的应用价值; 最后, 聚焦于课程知识图谱在构建过程中所面临的难题, 如数据多样性和异构性、知识图谱质量难以评估以及多课程交叉融合不足等, 从深度学习、大语言模型(LLM)等前沿技术的角度出发, 对未来的发展趋势进行展望。

  • 热点与综述
    邸钦渤, 陈劭力, 时良仁
    计算机工程. 2025, 51(11): 35-44. https://doi.org/10.19678/j.issn.1000-3428.0069780
    摘要 (497) PDF全文 (609) HTML (32)   可视化   收藏

    随着多变量时序数据在各行业中的广泛应用, 开发有效的异常检测方法对于保障系统的稳定运行和安全性变得极为关键, 由于多变量时序数据内在的复杂性和动态变化特性, 对异常检测算法提出了更高的要求。针对现有异常检测方法在处理含有复杂变量关系的高维数据时存在效率不足的问题, 提出一种基于图神经网络(GNN)与扩散模型的多变量时序数据异常检测算法GRD。通过节点嵌入和图结构学习, GRD算法能有效地捕捉和表示变量间的复杂关系, 并通过门控循环单元(GRU)和去噪扩散概率模型(DDPM)进一步提取特征, 实现了对异常数据的高精度检测。在以往的实验评估中, 大多数算法在评分前会采用点调整(PA)评估协议, 该协议会严重高估算法的检测能力。为了更准确地评估算法性能, 采用新的评估协议和评价指标。实验结果表明, GRD算法在3个公开数据集上的F1@k指标分别是0.741 4、0.801 7、0.767 1, 性能优于现有方法。特别是在高维数据处理方面, GRD算法展现出显著优势, 证明了其在现实场景的异常检测应用中的实用性和鲁棒性。

  • 热点与综述
    俞继涛, 程路维, 韩伟力
    计算机工程. 2025, 51(11): 22-34. https://doi.org/10.19678/j.issn.1000-3428.0069794
    摘要 (200) PDF全文 (103) HTML (17)   可视化   收藏

    口令泄露事件常常涉及用户口令和用户身份信息的泄露。由于用户在多个网络服务中习惯于重用口令, 这使得攻击者能够通过调整泄露的口令来针对性地攻击用户的账户, 称为凭证调整攻击。通过分析大规模的泄露口令和相应的用户身份信息, 发现用户创建口令的策略往往与用户身份信息相关联。然而, 目前关于凭证调整攻击的研究在预测用户调整口令的策略时仅依据泄露口令的结构, 而忽略了泄露的用户身份信息。为了提升凭证调整攻击的准确性, 设计了一种基于用户身份信息的凭证调整攻击优化方法。在预处理阶段, 从用户身份信息中提取用户名信息和地域信息, 按照地域统计用户选择不同口令创建策略的概率。在训练阶段, 结合地域信息学习用户在泄露口令上采取的字符级编辑操作。在口令生成阶段, 设计了一种综合字符级编辑操作、结构级编辑操作和用户名信息的口令生成方法。实验结果表明, 在猜测次数为103的攻击中, 该方法的命中率和现有最优的方法(PassBERT)相比最高提升了41.8%, 说明利用用户身份信息能扩大凭证调整攻击对口令安全带来的威胁。

  • 热点与综述
    肖志鹏, 何书峰, 田春岐
    计算机工程. 2025, 51(11): 54-62. https://doi.org/10.19678/j.issn.1000-3428.0069761
    摘要 (165) PDF全文 (85) HTML (15)   可视化   收藏

    针对面部情绪识别过程中存在的难以捕获有效特征信息、无法使关键面部信息占据更主要地位的问题, 提出一种基于UniRepLKNet的面部情绪识别网络。为了更精确地提取面部情绪特征, 设计一个掩码极化自注意力模块, 其结合了U-Net和极化自注意力机制。这一模块能够深入挖掘通道和空间之间的依赖关系, 并通过多尺度特征融合策略, 强化人脸局部关键信息在情绪识别过程中的影响力。同时, 对大核卷积神经网络(CNN)UniRepLKNet进行优化, 提出EmoRepLKNet神经网络结构。在EmoRepLKNet中, 利用掩码极化自注意力模块使网络专注于提取面部情绪识别的关键信息, 并结合大核CNN感受野广的特点, 实现对面部情绪的有效识别。实验结果表明, 在面部情绪识别数据集FER2013上, 该方法达到了76.20%的准确率, 不仅超越了现有的对比模型, 而且相较于UniRepLKNet也显著提高了面部情绪识别的准确率。同时, 在RAF-DB数据集的单标签部分进行实验, 所提方法取得了89.67%的准确率。

  • 网络空间安全
    凌海, 凌捷
    计算机工程. 2025, 51(11): 162-170. https://doi.org/10.19678/j.issn.1000-3428.0069983
    摘要 (195) PDF全文 (148) HTML (8)   可视化   收藏

    对抗样本可以在不知道黑盒模型内部的结构以及参数时利用代理模型进行迁移性攻击, 现有研究针对黑盒模型的定向目标攻击可迁移性都比较弱。提出一种基于特征融合增强图像定向目标攻击可迁移性的方法。通过模型集成攻击得到对抗样本, 以现有对抗样本的梯度方向为基准, 利用从原图提取出的干净特征作为干扰来微调现有的对抗样本, 以提高定向目标攻击的可迁移性。对于模型集成, 根据每个模型对整体对抗目标的贡献大小引入梯度自适应模块, 为减少不同模型之间的梯度差异, 提出梯度滤波器来同步控制梯度方向, 通过特征融合模块混合原图的干净特征对现有对抗样本的梯度方向进行微调以缓解过度关注特定特征的问题。在ImageNet-Compatible数据集上的对比实验结果表明, 所提方法对非鲁棒性训练模型, 相较CFM(Clean Feature Mixup)方法平均攻击成功率提升了7.7百分点, 对鲁棒性训练模型以及Tansformer模型, 相较CFM方法平均攻击成功率提升了5.3百分点, 验证了方法的有效性。

  • 热点与综述
    路悦, 周翔宇, 张世周, 梁国强, 邢颖慧, 程德, 张艳宁
    计算机工程. 2025, 51(10): 1-17. https://doi.org/10.19678/j.issn.1000-3428.0070575
    摘要 (557) PDF全文 (535) HTML (57)   可视化   收藏

    传统机器学习算法只有当测试集和训练集同分布时才能取得较好的性能, 无法增量地学习原训练集中没有的新类别或任务。持续学习使模型得以具备自适应学习能力, 在持续学习新任务的同时能够防止对旧任务的遗忘。当前持续学习仍面临计算开销大、存储成本高以及性能不稳定等挑战。近年来, 预训练模型的发展为持续学习提供了新的研究方向, 有望进一步提高性能表现。首先, 分析了现有基于预训练的持续学习方法, 按照防止遗忘的机制将其归纳为基于提示池、缓慢更新参数、基于扩展主干网络分支、基于参数正则化、基于分类器设计5类方法, 进一步按照阶段数、微调方式和是否利用语言模态对其进行归类并总结了各类方法的主要特点和各自优势。然后, 分析了持续学习方法存在的主要挑战, 归纳了各类持续学习方法的适用场景和局限性, 在多个评测基准上对各类方法进行实验比较并讨论各方法的性能差异。最后, 对基于预训练的持续学习方法的研究趋势进行展望。

  • 热点与综述
    彭龙, 高元钧, 刘晓东, 余杰
    计算机工程. 2025, 51(10): 37-52. https://doi.org/10.19678/j.issn.1000-3428.0069708
    摘要 (279) PDF全文 (621) HTML (34)   可视化   收藏

    算力和网络技术的发展使得机器人逐渐向小型化、群体化、智能化方向发展,部署在硬件设备上的机器人软件需要集成从底层设备驱动和控制到上层运动规划和推理等多种软件模块,软件架构日益复杂。群体机器人通信编程框架从机器人软件标准化、模块化、平台化等目标出发,减轻了机器人通信编程的复杂度。分析总结机器人软硬件架构发展趋势,得出群体机器人系统是由各类计算节点、执行器、传感器等硬件设备通过有线或无线网络互联构成的多域异构分布式系统。这种硬件设备的异构性使得软件模块难以通过单一框架集成。归纳分析现有群体机器人系统通信编程框架在易用性、可移植性等方面的特点,从编程模型、异构硬件平台支持、组件间通信机制、编程语言等核心能力方面对通信编程框架进行对比,并在实时性、虚拟化、组件编排和容错支持等扩展能力方面展望通信编程框架的发展趋势,聚焦于以元操作系统(OS)为底座的下一代编程框架,以期构建人机物泛在融合的群体机器人软件架构。

  • 热点与综述
    李亚康, 李健芳, 胡鹏, 陈娟, 王声翔, 齐法制, 陈刚
    计算机工程. 2025, 51(10): 53-70. https://doi.org/10.19678/j.issn.1000-3428.0069651
    摘要 (206) PDF全文 (196) HTML (18)   可视化   收藏

    探讨人工智能(AI)技术在中子散射实验全生命周期中的应用,旨在梳理AI技术如何革新中子散射实验装置、数据采集、数据处理等关键环节。首先介绍中子散射技术的基本原理和实验流程,然后重点讨论AI技术在中子散射实验中的多方面应用,包括实验基础设施的优化设计、数据采集与成像的数据预处理以及中子衍射、中子反射、非弹性中子散射(INS)等实验样品表征方面的应用,展示AI技术在提高实验的智能化水平、加快数据处理速度、提升数据分析的准确性和可靠性等方面的重要性。此外,对AI技术在中子散射实验中的未来应用进行深入讨论,指出随着多模态学习、可解释模型、大语言模型、AI-Ready数据库等技术的不断进步和应用领域的拓展,AI技术有望为中子散射实验带来革命性的变革,为揭示复杂物质系统的微观结构和性质开辟新的途径。

  • 人工智能与模式识别
    张红, 李峰, 马彦宏, 姬文宣, 郑启鹏
    计算机工程. 2025, 51(10): 140-149. https://doi.org/10.19678/j.issn.1000-3428.0069489
    摘要 (242) PDF全文 (225) HTML (14)   可视化   收藏

    准确的光伏功率预测对于提高电网稳定性和用电效率至关重要。针对现有研究难以同时考虑光伏功率长期依赖性和短期变化模式的缺陷,提出一种金字塔注意力模块(PAM)结合时间卷积网络(TCN)优化Transformer的光伏功率预测方法Solarformer。基于多种特征选择机制筛选输入特征,增强对光伏数据特征的表征能力;利用粗粒度构造模块和PAM优化Transformer编码器,在多尺度上捕获光伏功率的长期时间依赖特征;利用光伏功率日出日落效应约束机制和TCN优化Transformer解码器,增强光伏功率的短期变化特征,以更好地捕捉其短期变化模式。在澳大利亚Sanyo数据集上进行实验,结果表明,Solarformer能够有效提高光伏功率的预测精度,相比DLinear模型,其均方根误差(RMSE)、平均绝对误差(MAE)和对称平均绝对百分比误差(SMAPE)分别降低了约7.45%、6.99%和14.10%。

  • 图形图像处理
    肖剑, 黄博, 程鸿亮, 胡欣, 袁晔
    计算机工程. 2025, 51(10): 319-326. https://doi.org/10.19678/j.issn.1000-3428.0069182
    摘要 (218) PDF全文 (172) HTML (15)   可视化   收藏

    传统的人脸识别系统在最终人脸分类问题上,通常借助各种仿生学算法与支持向量机(SVM)相结合组成相应的人脸识别模型。该方法通过算法的迭代选取最优SVM参数,然而这种策略在人脸识别方法上存在分类精度较低、训练时间较长且容易陷入局部最优解的问题。针对上述问题,提出利用改进人工蜂鸟算法(AHA)优化SVM的人脸识别算法。首先通过引入Tent映射的混沌序列改进人工蜂鸟算法,使蜂鸟种群初始化更为均匀,避免算法陷入局部最优解;其次在SVM进行人脸识别的方法中引入改进AHA,通过设定一定的迭代次数,选择用来优化SVM的最优相关参数,达到提高人脸识别准确率的目的。实验结果表明,将改进的人工蜂鸟算法与灰狼优化(GWO)算法、麻雀搜索算法(SSA)、鲸鱼优化算法(WOA)进行对比,改进AHA在基准函数的求解上具有更快的收敛速度, 同时在ORL人脸数据库进行人脸识别实验,将改进AHA与SVM相结合,相比于将GWO、SSA和WOA与SVM相结合,在人脸识别的准确率指标方面,改进AHA结合SVM方案具有更高的准确率和召回率,并且模型推理速度更快。

  • AI算力赋能的车载边缘计算
    秦敏浩, 孙未未
    计算机工程. 2025, 51(9): 1-13. https://doi.org/10.19678/j.issn.1000-3428.0069416
    摘要 (347) PDF全文 (747) HTML (54)   可视化   收藏

    交通信号灯控制对缓解交通拥堵、提升城市通勤效率有着重要作用。近年来,以实时交通数据为输入的基于深度强化学习的信号灯控制算法已取得突破性进展。然而,现实场景中的交通数据通常伴随着数据失真。传统方法在修复失真数据后使用强化学习算法控制信号灯,但一方面信号灯相位的动态性给失真修复引入了额外不确定性,另一方面失真修复难以与深度强化学习框架相结合来提升性能。为此,提出基于隐状态预测的失真交通信号灯路口控制模型HCRL。HCRL模型由编码子模型、控制子模型和编码预测子模型组成,通过引入信号灯路口的隐状态表示机制,更好地适应深度强化学习框架,有效表达信号灯路口的控制状态,并使用特殊的迁移训练方法避免数据失真对控制子模型的干扰。使用两个真实数据集验证了数据失真对智能信号灯控制算法的影响。实验结果表明,HCRL模型在所有失真场景和失真率下均优于基于失真修复的信号灯控制模型,并在与其他基线模型的对比中表现出了对数据失真更强的鲁棒性。

  • 图形图像处理
    王舒梦, 徐慧英, 朱信忠, 黄晓, 宋杰, 李毅
    计算机工程. 2025, 51(9): 280-293. https://doi.org/10.19678/j.issn.1000-3428.0069353
    摘要 (1072) PDF全文 (474) HTML (69)   可视化   收藏

    在无人机(UAV)航拍中, 目标通常是密集分布、特征不明显的小目标, 且物体尺度变化较大。因此, 目标检测容易出现漏检和误检的问题。为了解决这些问题, 提出了一种基于改进YOLOv8n的航拍轻量化小目标检测算法: PECS-YOLO。该算法通过在Neck部分增加P2小目标检测层, 将浅层和深层的特征图进行拼接, 以更好地捕捉小目标的细节信息; 将轻量化卷积PartialConv引入全新的结构CSPPC(Cross Stage Partial PartialConv), 替换Neck网络中的C2f(Concatenation with Fusion), 实现模型轻量化; 引入SPPELAN(Spatial Pyramid Pooling with Efficient Layer Aggregation Network), 以有效地捕捉小目标特征; 通过在Neck部分每个检测头前加入压缩和激励(SE)注意力机制, 使网络更好地关注有用的通道, 减少复杂环境中背景噪声对小目标检测任务的干扰; 最后使用EfficiCIoU作为边界框损失函数, 将边界框的形状差异也考虑在内, 以增强模型对小目标的检测能力。实验结果表明: 相比YOLOv8n, PECS-YOLO目标检测算法在VisDrone2019-DET数据集上交并比为0.5的平均精度(mAP@0.5)提高了3.5%, 交并比为0.5∶0.95的平均精度(mAP@0.5∶0.95)提高了3.7%, 模型参数量减少了约25.7%, 检测速度提高了约65.2%。综上所述, PECS-YOLO模型适合于UAV航拍下的小目标检测任务。

  • AI算力赋能的车载边缘计算
    崔萌萌, 施静燕, 项昊龙
    计算机工程. 2025, 51(9): 25-37. https://doi.org/10.19678/j.issn.1000-3428.0069836
    摘要 (449) PDF全文 (202) HTML (37)   可视化   收藏

    为了进一步优化车载服务的服务质量(QoS),移动边缘计算(MEC)被深度整合于车联网(IoV)中,旨在为车辆提供地理位置较近的计算资源,降低任务处理延迟和能耗。然而,传统的MEC服务器部署主要依赖于地面基站(BS),这不仅导致高昂的部署成本,而且限制其覆盖范围,难以确保为所有车辆提供无间断服务。为了应对上述挑战,空地协同IoV作为一种新兴的技术方案应运而生。无人机(UAV)能够借助其视距链路的灵活性动态地协助路边单元(RSU),为车辆用户提供更为灵活的计算资源,进而保障车载服务的连续性和高效性。提出一种基于空地协同的动态车载边缘任务卸载方法(DVETOM)。该方法采用车-路-空架构,构建了车辆到RSU(V2R)链路和车辆到UAV(V2U)链路。针对车辆任务的本地执行、卸载至RSU执行和卸载至UAV执行3种模式分别构建传输模型和计算模型,并以最小化系统时延和能耗作为联合优化目标构建目标函数。DVETOM将任务卸载问题转化为马尔可夫决策过程(MDP),基于深度强化学习(DRL)的分布式深度确定性策略梯度(D4PG)算法优化任务卸载策略。与5种基准方法进行对比,实验结果表明,DVETOM在提升车辆用户QoS的同时,在降低系统时延方面优于现有方法3.45%~23.7%,在降低系统能耗方面优于现有方法5.8%~23.47%。综上所述,DVETOM有效地优化了IoV中的车载边缘任务卸载,为IoV用户提供了更高效、更节能的服务解决方案,展现了其在智能交通系统领域的广泛应用潜力。

  • AI算力赋能的车载边缘计算
    朱思远, 李佳圣, 邹丹平, 何迪, 郁文贤
    计算机工程. 2025, 51(9): 14-24. https://doi.org/10.19678/j.issn.1000-3428.0069534
    摘要 (297) PDF全文 (214) HTML (47)   可视化   收藏

    非结构化道路的缺陷目标检测任务对道路交通安全具有重要意义,但检测所需的标注数据集相对有限。为了解决非结构化道路标注数据集缺乏以及现有模型对无标注数据学习能力不足的问题,提出一种MAM(Multi-Augmentation with Memory)半监督目标检测算法。首先,引入缓存机制存储无标注图像和带有伪标注图像的框回归位置信息,避免了后续匹配造成的计算资源浪费。其次,设计混合数据增强策略,将缓存的伪标签图像与无标签图像混合输入学生模型,以增强模型对新数据的泛化能力,并使图像的尺度分布更加均衡。MAM算法不受目标检测模型的限制,并且更好地保持了目标框的一致性,避免了计算一致性损失。实验结果表明,MAM算法相比其他全监督学习和半监督学习算法更具优越性,在自建的非结构化道路缺陷数据集Defect上,在标注比例为10%、20%和30%的场景下,MAM算法的均值平均精度(mAP)相比于Soft Teacher算法分别提升了6.8、11.1和6.0百分点,在自建的非结构化道路坑洼数据集Pothole上,在标注比例为15%和30%的场景下,MAM算法的mAP相比于Soft Teacher算法分别提升了5.8和4.3百分点。

  • 人工智能与模式识别
    翟志鹏, 曹阳, 沈琴琴, 施佺
    计算机工程. 2025, 51(9): 139-148. https://doi.org/10.19678/j.issn.1000-3428.0069439
    摘要 (332) PDF全文 (125) HTML (23)   可视化   收藏

    精准的交通流预测是实现智能交通系统的关键前提,对加强系统的仿真和控制、提高管理者的决策等方面具有重要意义。针对大多数现有的图卷积网络(GCN)模型忽略交通流数据的动态时空变化、对节点信息使用不足导致时空相关性提取不充分的问题,提出一种基于多时空图融合与动态注意力的交通流预测模型。首先,以不同的卷积单元提取交通流数据中多时域状态下的时间特征;然后,构建多时空图体现节点在空间分布中的动态变化趋势和异质性,并结合GCN提取空间特征;最后,利用多头自注意力机制分别对时空特征进行分析与融合,输出预测结果。在两个实际的公共数据集PeMS04和PeMS08上进行实验分析,并与基于注意力的时空图卷积网络(ASTGCN)、多视角的时空Transformer网络(MVSTT)和动态时空感知图神经网络(DSTAGNN)等基于时空图卷积网络的基准模型对比,结果表明所提模型在平均绝对误差(MAE)、平均绝对百分比误差(MAPE)和均方根误差(RMSE)指标上分别平均降低了7.10%、7.22%和6.47%,具有较强的适应性和鲁棒性。

  • 热点与综述
    赵楷, 胡煜环, 闫俊桥, 毕雪华, 张琳琳
    计算机工程. 2025, 51(8): 1-15. https://doi.org/10.19678/j.issn.1000-3428.0069147
    摘要 (493) PDF全文 (280) HTML (71)   可视化   收藏

    区块链作为一种分布式可信数据库,在数字版权保护领域得到有效应用,引起学术界和工业界的广泛关注。传统数字版权保护技术存在侵权追踪难、版权交易复杂、合法权益保护不足等问题,严重制约数字版权保护研究的发展。区块链的防篡改、可追溯和去中心化等特性为解决数字版权侵权风险提供了可信、透明和安全的解决思路。首先介绍了区块链技术的基本原理;然后针对传统版权保护方案存在的问题,介绍了区块链结合传统版权保护技术的最新研究成果;接着评估了区块链在实际应用中的效果和潜力,强调其对版权保护体系的积极影响;最后探讨了区块链版权保护面临的挑战和未来发展趋势,以实现更加完善和可持续的区块链版权保护体系。

  • 人工智能与模式识别
    王帅, 史艳翠
    计算机工程. 2025, 51(8): 190-202. https://doi.org/10.19678/j.issn.1000-3428.0069636
    摘要 (478) PDF全文 (259) HTML (58)   可视化   收藏

    序列推荐算法通过对用户的历史行为进行动态建模, 以预测其可能感兴趣的内容。聚焦对比式自监督学习(SSL)在序列推荐中的应用, 通过设计有效的自监督信号, 增强模型在稀疏数据场景下的表征能力。首先, 针对随机数据增强易引入数据噪声的问题, 提出融合用户偏好的个性化数据增强方法, 通过用户评分引导增强过程, 同时对长、短序列使用不同的增强方法组合, 生成符合用户偏好的增强序列; 其次, 为了缓解训练中出现的数据特征学习不平衡问题, 设计一种混合增强训练法, 在训练前期, 通过随机选择增强方法生成增强序列, 提高模型的性能和泛化能力, 在训练后期, 选择与原始序列相似度较高的增强序列, 使模型全面学习用户的实际偏好和行为模式; 最后, 将传统的序列预测目标与SSL目标相结合, 推断出用户的表示。在数据集Beauty、Toys和Sports上进行实验验证, 结果表明, 相较于基线模型中的最优结果, 所提方法的HR@5指标分别提升了6.61%、3.11%和3.76%, NDCG@5指标分别提升了11.40%、3.50%和2.16%, 上述实验结果验证了该方法的合理性和有效性。

  • 开发研究与工程应用
    高庆鑫, 刘聪, 张在贵, 郭娜, 苏轩, 曾庆田
    计算机工程. 2025, 51(8): 396-405. https://doi.org/10.19678/j.issn.1000-3428.0069301
    摘要 (263) PDF全文 (75) HTML (20)   可视化   收藏

    作为组织数字化转型的关键技术,机器人流程自动化(RPA)近年来得到了学术界和产业界的广泛关注。成功部署RPA的关键是确定哪些活动应该自动化。然而,现有的部署策略缺乏对流程的分析,导致RPA机器人的部署错误,造成资源的浪费。此外,已有的基于流程挖掘的RPA机器人部署方法过度依赖于专家的领域知识,缺乏通用性。针对上述问题,将流程挖掘与RPA相结合,提出一种基于流程挖掘的RPA机器人优化部署方法。首先提出从事件日志中挖掘全局流程模型的方法,挖掘得到含有时间信息的时间Petri网模型;其次通过关键流程路径识别方法得到关键流程路径;最后提出RPA机器人优化部署策略,结合时间和成本约束确定RPA机器人的最佳部署结点集合。该方法已在开源流程挖掘工具平台ProM中实现,并将其与已有的4种部署方法进行时间效率提升实验比较。实验结果表明,与其他部署方法相比,该方法在不依赖于专家领域知识的前提下,流程的性能提升率为22%~41%,RPA机器人的部署正确率达到1,验证了该方法的通用性和准确性。

  • 图形图像处理
    郝宏达, 罗健旭
    计算机工程. 2025, 51(8): 270-280. https://doi.org/10.19678/j.issn.1000-3428.0069269
    摘要 (309) PDF全文 (113) HTML (26)   可视化   收藏

    深度学习逐渐被广泛应用于医学图像分割领域,基于注意力机制的分割算法是目前研究的主要方法。现有大多数基于注意力机制的2D图像分割模型在多器官分割任务中往往关注切片的整体分割效果,而忽略了切片中小目标特征信息的丢失或欠分割问题,使模型分割性能受到限制。针对这一问题,提出一种基于多尺度特征融合和改进注意力机制的多器官语义分割模型DASC-Net。DASC-Net的整体框架基于编码器-解码器架构,编码器采用ResNet 50,与解码器之间设置跳跃连接。注意力机制由1个双重注意力模块(DAM)和1个小目标提取(SOC)模块的并联结构实现,从而进行多尺度区域特征融合。DASC-Net不仅可以感知到较大目标的特征信息,还可以通过注意力权重重建的方式保留小目标的特征信息,提高了模型的分割性能。在CHAOS数据集上的实验结果表明,DASC-Net在灵敏度、Jaccard相似系数、正类预测值(PPV)、Dice相似系数和平均交并比(mIoU)上分别可以达到83.72%、75.79%、87.75%、85.63%和77.60%,在Synapse数据集上的Dice相似系数和95%豪斯多夫距离(HD95)指标数值分别为82.44%和21.25 mm。DASC-Net在2个数据集上的表现均优于其他分割网络,具有可靠、准确的分割性能。

  • 图形图像处理
    苗茹, 李祎, 周珂, 张俨娜, 常然然, 孟更
    计算机工程. 2025, 51(8): 292-304. https://doi.org/10.19678/j.issn.1000-3428.0068856
    摘要 (280) PDF全文 (175) HTML (29)   可视化   收藏

    针对遥感图像背景复杂、目标种类多和尺度差异大所造成的目标漏检和误检问题,提出一种改进Faster R-CNN多目标检测模型。首先,采用Swin Transformer来替代ResNet 50骨干网络,增强模型特征提取能力;其次,添加平衡特征金字塔(BFP)模块融合浅层和高层语义信息,进一步加强特征融合效果;最后,在分类和回归分支中,添加动态权重机制,促进网络在训练过程中更关注高质量候选框,提高目标定位和分类的精确度。在RSOD数据集上的实验结果表明,所提模型相较于Faster R-CNN模型每秒浮点运算次数(FLOPs)大幅度减少,并且模型的mAP@0.5 ∶0.95提高了10.7百分点,平均召回率提高10.6百分点。相较于其他主流检测模型,所提模型在降低漏检率的同时,取得了更高的精度,能显著提高复杂背景下遥感图像的检测精度。

  • 热点与综述
    张锦, 陈铸, 陈照云, 时洋, 陈冠军
    计算机工程. 2025, 51(7): 1-11. https://doi.org/10.19678/j.issn.1000-3428.0068870
    摘要 (439) PDF全文 (714) HTML (49)   可视化   收藏

    在众多科学领域的研究与开发中,模拟器都扮演着不可替代的角色。在体系结构领域尤其如此,模拟器提供了一个安全、成本低廉的虚拟环境,使研究人员能够快速开展实验分析和评测。同时,模拟器还可以加速芯片设计和验证的过程,从而节省时间和资源成本。然而,随着处理器体系结构的演化进步,尤其是专用处理器发展呈现多元化特点,为了能够对体系结构设计探索提供重要的反馈,模拟器的重要作用日益凸显。综述了体系结构模拟器目前的发展与应用现状,重点介绍了几种目前较为典型的体系结构模拟器。通过对专用于不同处理器的模拟器技术手段的分析,深入了解不同架构下模拟器的侧重点及技术难点。此外,还对体系结构模拟器未来发展的关键点进行了思考与评述,以展望其在处理器设计研究领域的前景。

  • 人工智能与模式识别
    彭菊红, 张弛, 高谦, 张光明, 谈栋华, 赵明俊
    计算机工程. 2025, 51(7): 152-160. https://doi.org/10.19678/j.issn.1000-3428.0069283
    摘要 (935) PDF全文 (489) HTML (94)   可视化   收藏

    在工业场景下钢材表面缺陷检测技术存在检测精度低、收敛速度慢等问题。为此, 提出一种改进的YOLOv8算法YOLOv8n-MDC。首先, 在骨干网络中加入多尺度交叉融合网络(MCN), 通过在特征层之间建立更紧密的连接, 促进信息的均匀传递, 减少跨层特征融合时的语义信息损失, 从而增强模型对钢材缺陷的感知能力; 其次, 在模块中引入可变形卷积, 自适应地改变卷积核的形状与位置, 从而更灵活地捕捉不规则缺陷的边缘特征, 减少信息丢失, 提升检测的准确性; 最后, 加入坐标注意力(CA)机制, 将位置信息嵌入到通道中, 解决了位置信息丢失的问题, 使模型能够更精确地感知缺陷的位置及其形态特征, 从而提升检测的精度和稳定性。在NEU-DET数据集上的实验结果表明, YOLOv8n-MDC算法的mAP@0.5达到了81.0%, 相比原基准网络提升了4.2百分点, 该算法收敛速度较快、精度较高, 更能满足实际工业生产的要求。

  • 图形图像处理
    刘春霞, 孟吉星, 潘理虎, 龚大立
    计算机工程. 2025, 51(7): 326-338. https://doi.org/10.19678/j.issn.1000-3428.0069510
    摘要 (424) PDF全文 (125) HTML (28)   可视化   收藏

    针对现有的目标检测方法在处理背景复杂、有效信息量少的遥感图像时存在的误检、漏检等问题,提出了一种多模态遥感小目标检测方法——BFMYOLO。设计了像素级的红-绿-蓝(RGB)和红外(IR)图像的融合模块, 即多模态融合模块(BFM),充分利用不同模态的互补性,实现两种模态信息的有效融合;设计了全尺度自适应更新模块(AA),解决特征融合过程中的多目标信息冲突问题,通过结合CARAFE上采样算子并进一步融入浅层特征,在加强非相邻层间融合的同时增强小目标的空间信息;设计了改进的任务解耦检测头(IDHead),将分类和回归任务分开处理,以降低不同任务的相互干扰,融合深层语义特征,进一步提升模型的检测性能。采用归一化Wasserstein距离(NWD)损失函数作为定位回归损失函数,降低位置偏差的敏感性。实验结果表明,该方法在VEDAI、NWPU VHR-10和DIOR数据集上的阈值设定为0.5时的均值平均精度(mAP@0.5)分别达到78.6%、95.5%和73.3%,优于其他先进模型, 在遥感小目标检测中表现出良好的性能。

  • 图形图像处理
    沙宇洋, 陆京涛, 杜浩凡, 翟小兵, 孟维宇, 廉旭, 罗刚, 李克峰
    计算机工程. 2025, 51(7): 314-325. https://doi.org/10.19678/j.issn.1000-3428.0068674
    摘要 (346) PDF全文 (220) HTML (28)   可视化   收藏

    图像分割是环境感知中的一项关键技术,被广泛应用于无人驾驶、虚拟现实等实际任务中。随着技术的不断发展,基于计算机视觉技术的导盲系统日趋成熟,并且在精度、稳定性等方面优于传统的解决方案。在视觉导盲系统中,道路图像的语义分割是非常重要的一部分,系统通过分析算法的输出结果可以获取目前所处的环境状态,从而指导用户躲避前方障碍物,获取最优的移动路径。视觉导盲系统的使用环境复杂,对模型的运行效率和分割精度具有极高的要求。然而,常用的高精度语义分割算法参数量大、运行速度慢,因此无法直接应用于导盲系统。针对这一问题,提出了一种基于多尺度特征的轻量化道路图像分割算法。模型含有两个特征提取分支,即Detail Branch和Semantic Branch,其中Detail Branch用来提取图像的低层细节信息,Semantic Branch用来提取图像的高层语义信息,并且两个分支中的多尺度特征也会被所设计的特征映射模块处理和使用,进而提升模型对于特征的建模能力。此外,设计了一种简单且高效的特征融合模块,通过融合不同尺度的特征,增强模型对于上下文信息的编码能力。采集和标注了适用于导盲场景的大量道路分割数据,并制作成了相应的数据集。基于该数据集对所提出的算法进行训练和测试,实验结果显示: 所提出的道路分割算法的平均交并比(mIoU)为96.5%,优于现有的图像分割模型;以1 024×1 024像素的图像作为输入,所提算法的轻量化版本在NVIDIA GTX 3090Ti平台的运行速度为201帧/s,优于现有轻量化图像分割模型;将模型部署到NVIDIA AGX Xavier设备中,其在实际场景中的测试速度为53帧/s,满足实际需求。

  • 人工智能与模式识别
    宋杰, 徐慧英, 朱信忠, 黄晓, 陈晨, 王泽宇
    计算机工程. 2025, 51(7): 127-139. https://doi.org/10.19678/j.issn.1000-3428.0069257
    摘要 (385) PDF全文 (171) HTML (32)   可视化   收藏

    在室内场景下, 受角度、光线变化等因素的影响, 导致现有目标检测算法检测跌倒事件时检测精度降低、实时性变差。为此, 提出一种基于YOLOv8改进的跌倒检测算法OEF-YOLO。采用全维动态卷积(ODConv)模块改进YOLOv8中的C2f模块, 优化了核空间的4个维度以增强特征提取能力, 而且有效减少了计算负担。同时, 为了捕获更细粒度的特征, 在颈部网络中引入高效多尺度注意力(EMA)模块, 进一步聚合像素级特征, 提高网络在跌倒场景中的处理能力。在CIoU损失函数中融入Focal Loss思想, 使模型对难分类样本给予更多关注, 优化模型整体性能。实验结果表明, 相比YOLOv8n, OEF-YOLO跌倒检测算法在mAP@0.5指标上提升了1.5百分点, mAP@0.5∶0.95提升1.4百分点, 参数量和计算量分别为3.1×106和6.5 GFLOPs, 在图形处理器(GPU)上FPS提高了44, 在提高精度检测跌倒事件的同时, 兼顾了低算力场景下的部署要求。

  • 热点与综述
    庞鑫, 葛凤培, 李艳玲
    计算机工程. 2025, 51(6): 1-19. https://doi.org/10.19678/j.issn.1000-3428.0069005
    摘要 (403) PDF全文 (263) HTML (44)   可视化   收藏

    声学场景分类(ASC)旨在让计算机模拟人类听觉识别不同的声学环境,是计算机听觉领域中具有挑战性的任务之一。随着智能音频处理技术以及神经网络学习算法的快速进步,近年来ASC任务也涌现出一系列新算法和新技术。为了全面展示该领域的技术发展脉络和演进过程,梳理了该领域的早期工作和近期发展,全面介绍了ASC任务。首先描述了ASC的应用场景和面临的挑战;其次详细介绍了ASC的主流框架,重点阐述了应用于此领域的深度学习算法;然后系统性地总结了ASC的前沿探索与延伸任务以及公开数据集;最后对ASC的发展趋势进行探讨与展望。

  • 网络空间安全
    姚玉鹏, 魏立斐, 张蕾
    计算机工程. 2025, 51(6): 223-235. https://doi.org/10.19678/j.issn.1000-3428.0069133
    摘要 (535) PDF全文 (135) HTML (33)   可视化   收藏

    联邦学习实现了各参与方在不泄露原始数据的前提下联合建模,有效解决了分布式数据隐私的问题,但随着研究的深入,联邦学习还存在隐私推断攻击或恶意客户端投毒攻击等安全问题。现有联邦学习改进方案大多仅从隐私保护或抗投毒攻击方面进行改进,不能兼顾两种攻击。为了同时解决联邦学习中的推断攻击和投毒攻击,提出一个隐私保护的抗投毒攻击联邦学习(APFL)方案。设计一个模型检测算法,使用差分隐私(DP)技术,根据模型间余弦相似度赋予各客户端相应聚合权重,使用同态加密技术将本地模型加权聚合。在MNIST和CIFAR10数据集上的实验结果表明,APFL在保证数据隐私的同时能有效筛选恶意模型,抵御投毒攻击,当投毒比例不超过50%时,APFL模型性能与无投毒攻击环境下联邦平均(FedAvg)方案一致,模型测试错误率较Krum方案平均降低19%,较FLTrust方案平均降低9%。

  • 热点与综述
    秦永旺, 张洋, 胡星, 刘胜, 李少青
    计算机工程. 2025, 51(6): 29-37. https://doi.org/10.19678/j.issn.1000-3428.0068882
    摘要 (273) PDF全文 (162) HTML (25)   可视化   收藏

    随着集成电路设计复杂度的急剧攀升,其呈现出全球化和分工化的发展趋势,需要越来越多的第三方知识产权(IP)核提供者的参与。第三方IP核的广泛使用会引入硬件木马,为了检测和评估第三方IP核是否存在硬件木马以及硬件木马的功能,迫切需要探索出一种可行的IP核硬件安全评估方法,数字电路模块的功能识别作为硬件木马分析的基础研究引起了人们的广泛关注。将电路功能检测任务转换为多分类任务,结合电路结构和图数据结构的特点,提出一种基于图注意力网络(GAT)的门级电路功能分类和检测方法。首先,针对门级网表缺乏功能识别数据集的问题,通过搜集具有代表性的寄存器传输级(RTL)代码并综合生成门级网表,构建一个规模适当、种类多样的门级电路数据集。然后,为了提取和处理电路特征信息,开发了一种基于文本识别的软件工具,将复杂的电路互连结构映射为结构简单的JSON(JavaScript Object Notation)格式,便于神经网络处理。最后,采用图注意力神经网络,利用构建的门级网表数据集对多分类器进行训练,经过训练后的多分类器能够对未知门级电路进行分类和识别。实验结果表明,该多分类器通过对自建数据集中6类共计3 000多条网表数据进行学习后,最终对6类645个网表能够达到90%的分类正确率。

  • 网络空间安全
    曹蓓, 赵奎
    计算机工程. 2025, 51(6): 193-203. https://doi.org/10.19678/j.issn.1000-3428.0070158
    摘要 (403) PDF全文 (143) HTML (16)   可视化   收藏

    在信息爆炸且真伪难辨的网络环境中,精准识别虚假新闻成为一项重要的研究课题。现有研究多采用多种深度学习模型提取多元语义特征,以捕捉文本中不同层次的语义信息,但简单拼接这些特征会导致信息冗余和噪声,限制检测的准确性和泛化性,目前缺乏有效的深度融合方法。此外,现有研究往往忽视了新闻内容与其对应评论共同构建的双重情感对揭示新闻真实性的影响。针对上述问题,提出一种基于双重情感和多特征融合的虚假新闻检测(DEMF-FND)模型。首先,通过情感分析提取新闻和评论的情感特征,并利用相似度计算引入反映两者关联性的情感差异特征,构建双重情感特征集。然后,采用基于多头注意力的融合机制,将双向长短期记忆网络(BiLSTM)与设计的集成静态-动态嵌入的卷积神经网络(ISDE-CNN)所捕捉的新闻文本全局与局部语义特征进行深度融合。最终,将双重情感特征集与经深度融合得到的语义特征拼接融合,输入由全连接层构成的分类层,以判断新闻的真假。实验结果显示,该方法在Weibo20、Twitter15和Twitter16 3个真实数据集上的基准指标均优于基线方法,在准确率上分别实现了2.5、2.3和5.5百分点的提升,凸显了双重情感和深度融合语义特征在提升虚假新闻检测性能方面的重要性。

  • 热点与综述
    刘凯, 任洪逸, 李蓥, 季怡, 刘纯平
    计算机工程. 2025, 51(6): 49-56. https://doi.org/10.19678/j.issn.1000-3428.0068910
    摘要 (211) PDF全文 (128) HTML (18)   可视化   收藏

    医学视觉问答(Med-VQA)需要对医学图像内容与问题文本内容进行理解与结合,因此设计有效的模态表征及跨模态的融合方法对Med-VQA任务的表现至关重要。目前,Med-VQA方法通常只关注医学图像的全局特征以及单一模态内注意力分布,忽略了图像的局部特征所包含的医学信息与跨模态间的交互作用,从而限制了图像内容理解。针对以上问题,提出一种交叉模态注意力特征增强的Med-VQA模型(CMAG-MVQA)。基于U-Net编码有效增强图像局部特征,从交叉模态协同角度提出选择引导注意力方法,为单模态表征引入其他模态的交互信息,同时利用自注意力机制进一步增强选择引导注意力的图像表征。在VQA-RAD医学问答数据集上的消融与对比实验表明,所提方法在Med-VQA任务上有良好的表现,相比于现有同类方法,其在特征表征上性能得到较好改善。