作者投稿和查稿 主编审稿 专家审稿 编委审稿 远程编辑

阅读排行

  • 一年内发表的文章
  • 两年内
  • 三年内
  • 全部
Please wait a minute...
  • 全选
    |
  • 热点与综述
    任书玉, 汪晓丁, 林晖
    计算机工程. 2024, 50(12): 16-32. https://doi.org/10.19678/j.issn.1000-3428.0068553
    摘要 (773) PDF全文 (1143) HTML (81)   可视化   收藏

    Transformer在自然语言处理中表现出优越的性能激励了研究人员开始探索其在计算机视觉任务中的应用。基于Transformer的目标检测模型DETR将目标检测视为一个集合预测问题, 引入Transformer模型来解决目标检测任务, 从而避免了传统方法中的提案生成和后处理步骤。最初的DETR在训练收敛和小物体检测方面存在速度慢、效率低的问题。为了解决这些问题, 研究人员进行了多方面改进, 提升了DETR的性能。对DETR的基本模块和增强模块进行深入研究, 包括对主干结构的修改、查询设计策略和注意力机制的改进, 同时对各种检测器进行比较分析, 评估它们的性能和网络架构, 探讨了DETR在计算机视觉任务中的潜力和应用前景以及目前存在的局限性和面临的挑战, 并对相关模型进行分析与总结。根据目标检测发展的现状, 分析注意力模型的优势与局限性, 并对注意力模型在目标检测领域的研究方向加以展望。

  • 图形图像处理
    赵南南, 高翡晨
    计算机工程. 2025, 51(1): 198-207. https://doi.org/10.19678/j.issn.1000-3428.0068677
    摘要 (712) PDF全文 (675) HTML (78)   可视化   收藏

    提出一种基于改进型YOLOv8的实例分割算法(DE-YOLO)。为减少图像中复杂背景的干扰, 引入高效多尺度注意力机制, 跨维交互使各特征组内空间语义特征平均分布。在主干网络部分, 使用可变形卷积DCNv2结合C2f卷积层, 突破原始卷积限制, 提升可变性。为减小有害梯度并提升检测器精度, 采用动态非单调聚焦机制Wise-交并比(WIoU)替代联合完全交并(CIoU)损失函数进行质量评估, 优化检测框定位, 提升分割精度。同时, 通过开启Mixup数据增强处理, 充实数据集, 丰富训练特征, 提升模型学习能力。实验结果表明, DE-YOLO在城市景观数据集Cityscapes中的掩模平均精度均值(mAPmask)较基准模型YOLOv8n-seg提高了2.0百分点, IoU阈值为0.5时的平均精度提升了3.2百分点, 所提算法在提升精度的同时, 保持了优良的检测速度和较少的参数量, 模型参数量较同类模型低2.2~31.3百分点。

  • 图形图像处理
    王舒梦, 徐慧英, 朱信忠, 黄晓, 宋杰, 李毅
    计算机工程. 2025, 51(9): 280-293. https://doi.org/10.19678/j.issn.1000-3428.0069353
    摘要 (700) PDF全文 (302) HTML (19)   可视化   收藏

    在无人机(UAV)航拍中, 目标通常是密集分布、特征不明显的小目标, 且物体尺度变化较大。因此, 目标检测容易出现漏检和误检的问题。为了解决这些问题, 提出了一种基于改进YOLOv8n的航拍轻量化小目标检测算法: PECS-YOLO。该算法通过在Neck部分增加P2小目标检测层, 将浅层和深层的特征图进行拼接, 以更好地捕捉小目标的细节信息; 将轻量化卷积PartialConv引入全新的结构CSPPC(Cross Stage Partial PartialConv), 替换Neck网络中的C2f(Concatenation with Fusion), 实现模型轻量化; 引入SPPELAN(Spatial Pyramid Pooling with Efficient Layer Aggregation Network), 以有效地捕捉小目标特征; 通过在Neck部分每个检测头前加入压缩和激励(SE)注意力机制, 使网络更好地关注有用的通道, 减少复杂环境中背景噪声对小目标检测任务的干扰; 最后使用EfficiCIoU作为边界框损失函数, 将边界框的形状差异也考虑在内, 以增强模型对小目标的检测能力。实验结果表明: 相比YOLOv8n, PECS-YOLO目标检测算法在VisDrone2019-DET数据集上交并比为0.5的平均精度(mAP@0.5)提高了3.5%, 交并比为0.5∶0.95的平均精度(mAP@0.5∶0.95)提高了3.7%, 模型参数量减少了约25.7%, 检测速度提高了约65.2%。综上所述, PECS-YOLO模型适合于UAV航拍下的小目标检测任务。

  • 人工智能与模式识别
    彭菊红, 张弛, 高谦, 张光明, 谈栋华, 赵明俊
    计算机工程. 2025, 51(7): 152-160. https://doi.org/10.19678/j.issn.1000-3428.0069283
    摘要 (631) PDF全文 (403) HTML (56)   可视化   收藏

    在工业场景下钢材表面缺陷检测技术存在检测精度低、收敛速度慢等问题。为此, 提出一种改进的YOLOv8算法YOLOv8n-MDC。首先, 在骨干网络中加入多尺度交叉融合网络(MCN), 通过在特征层之间建立更紧密的连接, 促进信息的均匀传递, 减少跨层特征融合时的语义信息损失, 从而增强模型对钢材缺陷的感知能力; 其次, 在模块中引入可变形卷积, 自适应地改变卷积核的形状与位置, 从而更灵活地捕捉不规则缺陷的边缘特征, 减少信息丢失, 提升检测的准确性; 最后, 加入坐标注意力(CA)机制, 将位置信息嵌入到通道中, 解决了位置信息丢失的问题, 使模型能够更精确地感知缺陷的位置及其形态特征, 从而提升检测的精度和稳定性。在NEU-DET数据集上的实验结果表明, YOLOv8n-MDC算法的mAP@0.5达到了81.0%, 相比原基准网络提升了4.2百分点, 该算法收敛速度较快、精度较高, 更能满足实际工业生产的要求。

  • 上海市计算机学会40周年庆
    齐凤林, 沈佳杰, 王茂异, 张凯, 王新
    计算机工程. 2025, 51(4): 1-14. https://doi.org/10.19678/j.issn.1000-3428.0070222
    摘要 (606) PDF全文 (858) HTML (67)   可视化   收藏

    人工智能(AI)的快速发展已为众多领域赋能, 对社会带来了深远的影响, 其出色的处理效果、广泛的适用性以及强大的扩展能力, 为高校信息化服务提供了坚实的技术基础。从AI和高校信息化的发展史出发, 探讨了两者的发展历程及其关联, 在国内外高校信息化建设中, 尽管各自对AI的关注点有所不同, 但均展现了其在提升教育质量、优化管理流程等方面的巨大潜力。从聚焦高校信息化建设者的角度, 在教师教学、学生学习、学校管理、教学评估、智能考试等五大核心领域, 详尽归纳并分析了AI赋能高校信息化中的典型应用案例, 展现了其如何有效提升教育质量与管理效率, 同时指出了AI在高校信息化应用过程中可能面临的数据隐私保护、算法偏见、技术依赖风险等问题, 列举了常见的应对策略, 如加强数据安全防护、优化算法透明度与公平性、培养师生信息素养等。基于这些分析, 进一步展望了AI在高校信息化中的未来优化方向, 强调技术创新与伦理规范并重, 倡导建立跨学科合作机制, 共同推动AI技术在高校信息化领域的健康、可持续发展。

  • 网络空间安全
    吴若岚, 陈玉玲, 豆慧, 张洋文, 龙钟
    计算机工程. 2025, 51(2): 179-187. https://doi.org/10.19678/j.issn.1000-3428.0068705
    摘要 (568) PDF全文 (10424) HTML (27)   可视化   收藏

    联邦学习作为新兴的分布式学习框架, 允许多个客户端在不共享原始数据的情况下共同进行全局模型的训练, 从而有效保护了数据隐私。然而, 传统联邦学习仍然存在潜在的安全隐患, 容易受到中毒攻击和推理攻击的威胁。因此, 为了提高联邦学习的安全性和模型性能, 需要准确地识别恶意客户端的行为, 同时采用梯度加噪的方法来避免攻击者通过监控梯度信息来获取客户端的数据。结合恶意客户端检测机制和本地差分隐私技术提出了一种鲁棒的联邦学习框架。该算法首先利用梯度相似性来判断和识别潜在的恶意客户端, 减小对模型训练任务产生的不良影响; 其次, 根据不同查询的敏感性以及用户的个体隐私需求, 设计一种基于动态隐私预算的本地差分隐私算法, 旨在平衡隐私保护和数据质量之间的权衡。在MNIST、CIFAR-10和MR文本分类数据集上的实验结果表明, 与3种基准算法相比, 该算法在准确性方面针对sP类客户端平均提高了3百分点, 实现了联邦学习中更高的安全性水平, 显著提升了模型性能。

  • 热点与综述
    李硕, 赵朝阳, 屈音璇, 罗亚平
    计算机工程. 2024, 50(12): 33-47. https://doi.org/10.19678/j.issn.1000-3428.0068276
    摘要 (542) PDF全文 (1041) HTML (64)   可视化   收藏

    指纹识别是应用最早、使用最成熟的一项生物特征识别技术, 在民用领域的门禁考勤、移动支付以及刑侦领域检视嫌疑人线索等方面均有着广泛的应用。近年来, 深度学习技术给计算机视觉以及生物特征领域带来了深刻变革, 也给指纹研究人员提供了一种自动处理以及应用融合特征有效表示指纹的新方法, 在指纹识别的各个阶段均有着优异的效果。概述指纹识别的发展历史与应用背景, 阐述指纹识别图像预处理、特征提取以及指纹匹配3个阶段的主要处理流程, 分别对深度学习技术在不同阶段的应用现状进行归纳和总结, 比较不同深度神经网络在图像分割、图像增强、方向场估计、细节特征提取以及指纹匹配等具体环节的应用效果。最后, 分析当前指纹识别领域存在的一些问题与挑战, 并对构建公开指纹数据集、进行多尺度指纹特征提取以及训练端到端指纹识别模型等未来的发展方向进行展望。

  • 图形图像处理
    张旭, 陈慈发, 董方敏
    计算机工程. 2024, 50(12): 318-328. https://doi.org/10.19678/j.issn.1000-3428.0068588
    摘要 (514) PDF全文 (503) HTML (26)   可视化   收藏

    在PCB缺陷检测领域中检测精度的提高一直是1个具有挑战性的任务。为了解决这个问题, 提出一系列基于PCB缺陷检测的改进方法。首先, 引入一种新的注意力机制, 即BiFormer注意力机制, 这种机制利用双层路由实现动态的稀疏注意力, 从而减少计算量; 其次, 采用一种创新的上采样算子CARAFE, 能够结合语义信息与内容信息进行上采样, 使得上采样过程更加全面且高效; 最后, 基于MPDIoU度量采用一种新的损失函数, 即LMPDIoU损失函数, 能够有效地处理不平衡类别、小目标和密集性问题, 从而进一步提高图像检测的性能。实验结果表明, 所提改进后的模型在平均精度均值(mAP)方面取得了显著提高, 达到了93.91%, 与原YOLOv5模型相比提高了13.12个百分点, 同时, 在识别精度方面, 所提改进后的模型表现也非常出色, 达到了90.55%, 与原YOLOv5模型相比提高了8.74个百分点。引入BiFormer注意力机制、CARAFE上采样算子以及LMPDIoU损失函数, 对于提高PCB缺陷检测的精度和效率具有非常积极的作用, 为工业检测领域的研究提供了有价值的参考。

  • 热点与综述
    庞文豪, 王嘉伦, 翁楚良
    计算机工程. 2024, 50(12): 1-15. https://doi.org/10.19678/j.issn.1000-3428.0068694
    摘要 (506) PDF全文 (638) HTML (47)   可视化   收藏

    在大数据背景下, 随着科学计算、人工智能等领域的快速发展, 各领域对硬件的算力要求越来越高。图形处理器(GPU)特殊的硬件架构, 使其适合进行高并行度的计算, 并且近年来GPU与人工智能、科学计算等领域互相发展促进, 使GPU功能细化, 逐渐发展出了成熟的通用图形处理器(GPGPU), 目前GPGPU已成为中央处理器(CPU)最重要的协处理器之一。然而, GPU硬件配置在出厂后不容易更改且显存容量有限, 在处理大数据集时显存容量不足的缺点对计算性能造成较大的影响。统一计算设备架构(CUDA)6.0推出了统一内存, 使GPGPU和CPU可以共享虚拟内存空间, 以此来简化异构编程和扩展GPGPU可访问的内存空间。统一内存为GPGPU处理大数据集提供了一项可行的解决方案, 在一定程度上缓解了GPU显存容量较小的问题, 但是统一内存的使用也带来了一些性能问题, 如何在统一内存中做好内存管理成为性能提升的关键。本研究对CUDA统一内存的发展和应用进行综述, 包括CUDA统一内存的特性、发展、优势和局限性以及在人工智能、大数据处理系统等领域的应用和未来的发展前景, 为未来使用和优化CUDA统一内存的研究工作提供有价值的参考。

  • 人工智能与模式识别
    张国胜, 李彩虹, 张耀玉, 周瑞红, 梁振英
    计算机工程. 2025, 51(1): 88-97. https://doi.org/10.19678/j.issn.1000-3428.0068738
    摘要 (490) PDF全文 (1026) HTML (53)   可视化   收藏

    针对人工势场(APF)法在机器人局部路径规划中存在的局部极小值陷阱和路径冗余等问题, 提出一种基于模糊控制(FC)和虚拟目标点改进人工势场的FC-V-APF算法。首先设计虚拟目标点避障策略, 并加入障碍物跨越机制和目标点更新阈值, 构建V-APF算法引导机器人摆脱陷阱区域; 其次提出基于累计转角和的控制策略, 帮助机器人走出多U型复杂陷阱; 然后针对路径冗余问题, 将V-APF算法与模糊控制算法相结合, 提出FC-V-APF算法, 通过激光雷达传感器的实时数据和权重函数对当前环境进行评估, 选取模糊控制器输出辅助力, 提前规避障碍物。最后在机器人操作系统(ROS)平台上搭建仿真环境对FC-V-APF算法进行路径规划性能的对比实验, 并对路径长度、运行时间和速度曲线等进行比较。实验结果表明, 所设计的FC-V-APF算法能够快速摆脱陷阱, 减少冗余路径, 提高路径平滑度并减少规划时间。

  • 热点与综述
    马恒志, 钱育蓉, 冷洪勇, 吴海鹏, 陶文彬, 张依杨
    计算机工程. 2025, 51(2): 18-34. https://doi.org/10.19678/j.issn.1000-3428.0068386
    摘要 (474) PDF全文 (399) HTML (37)   可视化   收藏

    随着大数据和人工智能技术的不断发展, 知识图谱应用越来越广泛, 知识图谱嵌入技术也得到了飞速发展。知识图谱嵌入通过在低维矢量空间中实现结构化知识表示来提高知识表示和推理效率。对知识图谱嵌入技术进行全面概述, 包括其基本概念、模型类别、评价指标以及应用前景。首先介绍了知识图谱嵌入的基本概念及背景, 将知识图谱嵌入分为基于翻译机制的嵌入模型、基于语义匹配机制的嵌入模型、基于神经网络的嵌入模型和基于附加信息的嵌入模型4个主要类别, 并对相关模型的核心思想、评分函数、优缺点、应用场景进行细致梳理; 然后总结了知识图谱嵌入的常见数据集和评价指标, 以及链接预测和三元组分类等相关应用与实验结果, 同时介绍了问答系统、推荐系统等下游任务; 最后对知识图谱嵌入技术进行回顾总结, 概述了当前知识图谱嵌入技术存在的局限性和主要问题, 探讨了未来知识图谱嵌入领域存在的机遇和挑战以及具有潜力的研究方向, 并对研究前景进行展望。

  • 人工智能与模式识别
    周翰祺, 方东旭, 张宁波, 孙文生
    计算机工程. 2025, 51(4): 57-65. https://doi.org/10.19678/j.issn.1000-3428.0069100
    摘要 (433) PDF全文 (692) HTML (68)   可视化   收藏

    无人机(UAV)多目标跟踪技术在交通运营、安全监测、水域巡检等领域受到广泛关注。然而, 目前已有的多目标跟踪算法多用于单无人机多目标跟踪, 而单无人机的视角通常具有一定的局限性, 当目标被遮挡时目标发生ID切换会导致跟踪失败。为了解决该问题, 提出一种多无人机多目标跟踪(MUMTTrack)算法。采用基于检测的跟踪(TBD)范式, 利用多架无人机同时跟踪目标, 弥补单无人机视角的局限性。为了有效融合多架无人机的跟踪结果, 为MUMTTrack设计一种基于加速鲁棒特征(SURF)算法的图像匹配策略和ID分配策略。将MUMTTrack算法的性能与当前主流的单无人机多目标跟踪算法在MDMT数据集上进行实验比较。实验结果表明, MUMTTrack算法在识别F1(IDF1)值和多目标跟踪精度(MOTA)这两个多目标跟踪性能指标上均表现出明显的优势。

  • 人工智能与模式识别
    陈浩, 陈珺, 刘飞
    计算机工程. 2025, 51(1): 60-70. https://doi.org/10.19678/j.issn.1000-3428.0068764
    摘要 (432) PDF全文 (356) HTML (33)   可视化   收藏

    移动机器人在路径规划过程中, 当面对未知且动态变化的环境时, 会存在与障碍物碰撞率高、易陷入局部最优等问题。针对这些问题, 提出一种基于双延迟深度确定性策略梯度(TD3)算法的改进算法TD3pro, 以提高移动机器人在未知动态环境下的路径规划性能。首先, 引入长短期记忆(LSTM)神经网络并与TD3算法相结合, 通过门结构筛选历史状态信息, 并感知探测范围内障碍物的状态变化, 帮助机器人更好地理解环境的动态变化和障碍物的移动模式, 使移动机器人能够准确预测和响应动态障碍物的行为, 从而降低与障碍物的碰撞率。其次, 加入OU (Ornstein-Uhlenbeck)探索噪声, 帮助移动机器人持续探索周围环境, 增强移动机器人的探索能力和随机性。在此基础上, 将单个经验池设置为成功、失败和临时3个经验池, 以此提高有效经验样本的采样效率, 进而减少训练时间。最后, 在2个不同的动、静态障碍物混合场景中进行路径规划实验仿真。实验结果表明: 场景1中该算法相较于深度确定性策略梯度(DDPG)算法以及TD3算法, 模型收敛的回合数减少了100~200个, 路径长度缩短了0.5~0.8, 规划时间减少了1~4 s; 场景2中该算法相较于TD3算法, 模型收敛的回合数减少了100~300个, 路径长度缩短了1~3, 规划时间减少了4~8 s, DDPG算法失败, 移动机器人无法成功抵达终点。由此可见, 改进的算法具有更好的路径规划性能。

  • 人工智能与模式识别
    黄昆, 齐肇建, 王娟敏, 胡倩, 胡伟超, 皮建勇
    计算机工程. 2025, 51(5): 133-142. https://doi.org/10.19678/j.issn.1000-3428.0069026
    摘要 (424) PDF全文 (311) HTML (37)   可视化   收藏

    密集行人检测是公共智能监控的关键技术, 其采用目标检测方法对视频中的行人位置和数量进行检测, 进而实现对视频中人群的智能监控。在人员密集场景下因遮挡和行人的目标太小造成漏检。为此, 提出一种改进YOLOv8检测模型Crowd-YOLOv8。首先, 在主干网络使用nostride-Conv-SPD模块, 增强对图像小目标特征等细粒度信息的提取能力; 其次, 在YOLOv8网络的颈部引入小目标检测头和CARAFE上采样算子对各尺度特征进行融合, 以提高在小目标情况下的检测效果。实验结果表明, 所提模型在CrowdHuman数据集上mAP@0.5和mAP@0.5∶0.95分别取得了84.3%和58.2%的检测效果, 与原YOLOv8n相比分别提高了3.7和5.2百分点; 在WiderPerson数据集上取得了88.4%和67.4%, 与原YOLOv8n相比提高了1.1和1.5百分点。

  • 网络空间安全
    姚玉鹏, 魏立斐, 张蕾
    计算机工程. 2025, 51(6): 223-235. https://doi.org/10.19678/j.issn.1000-3428.0069133
    摘要 (402) PDF全文 (104) HTML (20)   可视化   收藏

    联邦学习实现了各参与方在不泄露原始数据的前提下联合建模,有效解决了分布式数据隐私的问题,但随着研究的深入,联邦学习还存在隐私推断攻击或恶意客户端投毒攻击等安全问题。现有联邦学习改进方案大多仅从隐私保护或抗投毒攻击方面进行改进,不能兼顾两种攻击。为了同时解决联邦学习中的推断攻击和投毒攻击,提出一个隐私保护的抗投毒攻击联邦学习(APFL)方案。设计一个模型检测算法,使用差分隐私(DP)技术,根据模型间余弦相似度赋予各客户端相应聚合权重,使用同态加密技术将本地模型加权聚合。在MNIST和CIFAR10数据集上的实验结果表明,APFL在保证数据隐私的同时能有效筛选恶意模型,抵御投毒攻击,当投毒比例不超过50%时,APFL模型性能与无投毒攻击环境下联邦平均(FedAvg)方案一致,模型测试错误率较Krum方案平均降低19%,较FLTrust方案平均降低9%。

  • 热点与综述
    次天钊, 杨昊, 周游, 谢长生, 吴非
    计算机工程. 2025, 51(3): 1-23. https://doi.org/10.19678/j.issn.1000-3428.0068673
    摘要 (392) PDF全文 (781) HTML (56)   可视化   收藏

    智能手机已成为人们日常生活中不可或缺的一部分。安卓系统以其开源、生态完备等优点成为目前市场份额占比最大的移动操作系统。在安卓手机中, 存储子系统是关键的组成部分, 对用户体验有重要影响。不同于服务器场景, 安卓手机存储系统的设计需要考虑诸多独特因素, 如资源受限、成本敏感、前台应用优先等, 学术界对此已经展开大量研究。针对该方向研究现状进行总结分析, 首先将安卓手机存储系统用户体验保障面临的问题凝练为主机端写放大、内存交换、文件系统碎片化、闪存设备性能以及I/O优先级反转5类; 然后围绕如何解决这5类问题, 对现有工作进行分类介绍, 并总结常用的手机存储系统测试与分析工具; 最后对安卓手机存储系统用户体验保障技术的研究现状进行总结, 并讨论了未来潜在的研究方向。

  • 热点与综述
    赵楷, 胡煜环, 闫俊桥, 毕雪华, 张琳琳
    计算机工程. 2025, 51(8): 1-15. https://doi.org/10.19678/j.issn.1000-3428.0069147
    摘要 (386) PDF全文 (251) HTML (57)   可视化   收藏

    区块链作为一种分布式可信数据库,在数字版权保护领域得到有效应用,引起学术界和工业界的广泛关注。传统数字版权保护技术存在侵权追踪难、版权交易复杂、合法权益保护不足等问题,严重制约数字版权保护研究的发展。区块链的防篡改、可追溯和去中心化等特性为解决数字版权侵权风险提供了可信、透明和安全的解决思路。首先介绍了区块链技术的基本原理;然后针对传统版权保护方案存在的问题,介绍了区块链结合传统版权保护技术的最新研究成果;接着评估了区块链在实际应用中的效果和潜力,强调其对版权保护体系的积极影响;最后探讨了区块链版权保护面临的挑战和未来发展趋势,以实现更加完善和可持续的区块链版权保护体系。

  • 开发研究与工程应用
    张博强, 陈新明, 冯天培, 吴兰, 刘宁宁, 孙朋
    计算机工程. 2025, 51(4): 373-382. https://doi.org/10.19678/j.issn.1000-3428.0068338
    摘要 (381) PDF全文 (309) HTML (12)   可视化   收藏

    在限定场景内, 无人转运车辆在路径规划过程中不能与周围障碍物保持安全距离, 导致发生车辆与障碍物发生剐蹭的问题, 提出基于混合A*算法和修正RS曲线融合的路径规划。首先, 将提出的基于KD-Tree算法的距离代价函数加入到混合A*算法的代价函数中。其次, 改变混合A*算法的扩展策略, 根据车辆周围环境动态改变节点扩展距离, 实现节点的动态扩展, 提高算法的节点搜索效率。最后, 改进混合A*算法的RS曲线生成机制, 使生成的RS曲线直线部分与周围障碍物边界保持平行, 从而符合厂区内道路行驶要求, 通过对局部路径进行平滑处理, 在保证路径符合车辆运动学约束的条件下满足路径曲率变化的连续性, 从而提高生成路径的质量。实验结果表明, 与传统算法相比, 提出算法的搜索时间缩短了38.06%, 最大曲率减少了25.2%, 路径到障碍物的最近距离增加了51.3%, 有效提高了混合A*算法生成路径的质量, 并能较好地在限定场景中运行。

  • 人工智能与模式识别
    王帅, 史艳翠
    计算机工程. 2025, 51(8): 190-202. https://doi.org/10.19678/j.issn.1000-3428.0069636
    摘要 (370) PDF全文 (222) HTML (43)   可视化   收藏

    序列推荐算法通过对用户的历史行为进行动态建模, 以预测其可能感兴趣的内容。聚焦对比式自监督学习(SSL)在序列推荐中的应用, 通过设计有效的自监督信号, 增强模型在稀疏数据场景下的表征能力。首先, 针对随机数据增强易引入数据噪声的问题, 提出融合用户偏好的个性化数据增强方法, 通过用户评分引导增强过程, 同时对长、短序列使用不同的增强方法组合, 生成符合用户偏好的增强序列; 其次, 为了缓解训练中出现的数据特征学习不平衡问题, 设计一种混合增强训练法, 在训练前期, 通过随机选择增强方法生成增强序列, 提高模型的性能和泛化能力, 在训练后期, 选择与原始序列相似度较高的增强序列, 使模型全面学习用户的实际偏好和行为模式; 最后, 将传统的序列预测目标与SSL目标相结合, 推断出用户的表示。在数据集Beauty、Toys和Sports上进行实验验证, 结果表明, 相较于基线模型中的最优结果, 所提方法的HR@5指标分别提升了6.61%、3.11%和3.76%, NDCG@5指标分别提升了11.40%、3.50%和2.16%, 上述实验结果验证了该方法的合理性和有效性。

  • 人工智能与模式识别
    宋英华, 徐亚安, 张远进
    计算机工程. 2025, 51(1): 51-59. https://doi.org/10.19678/j.issn.1000-3428.0068372
    摘要 (364) PDF全文 (400) HTML (16)   可视化   收藏

    空气污染是城市环境治理的主要问题之一, 而PM2.5是影响空气质量的重要因素。针对传统时间序列预测模型对PM2.5浓度预测缺少季节性因素分析, 预测精度不够高的问题, 提出一种基于机器学习的季节性差分自回归滑动平均-支持向量机(SARIMA-SVM)融合模型。该融合模型为串联型融合模型, 将数据拆分为线性部分与非线性部分。SARIMA模型在差分自回归滑动平均(ARIMA)模型的基础上增加了季节性因素提取参数, 能有效分析PM2.5浓度数据的季节性规律变化趋势, 较好地预测数据未来的线性变化趋势。结合SVM模型对预测数据的残差序列进行优化, 利用滑动步长预测法确定残差序列的最优预测步长, 通过网格搜索确定最优模型参数, 实现对PM2.5浓度数据的长期预测, 同时提高整体预测精度。通过对武汉市近5年的PM2.5浓度监测数据进行分析, 结果表明该融合模型的预测准确率相较于单一模型有很大提升, 在相同的实验环境下比单一的ARIMA、Auto ARIMA、SARIMA模型分别提升了99%、99%、98%, 稳定性也更好, 为PM2.5浓度预测研究提供了新的思路。

  • 开发研究与工程应用
    李猛坤, 袁晨, 王琪, 赵冲, 陈景轩, 刘立峰
    计算机工程. 2025, 51(1): 287-294. https://doi.org/10.19678/j.issn.1000-3428.0068656
    摘要 (360) PDF全文 (455) HTML (25)   可视化   收藏

    目前目标检测技术日趋成熟, 但是针对在线听课行为的识别仍存在挑战。针对在线课堂人为监管力度不足、目标检测模型复杂度较高所导致的在线课堂行为识别不精准、模型计算量较高等问题, 提出一种基于改进的YOLOv8在线听课行为检测与识别方法。首先在YOLOv8n的基础上添加BiFPN双向特征金字塔网络来进行特征融合, 以增加特征提取的能力, 提高模型识别准确度; 其次在Head端采用C3Ghost模块替代C2f模块, 以大幅减少模型计算量。实验结果表明, 提出的YOLOv8n-BiFPN-C3Ghost模型在线上听课行为数据集上的mAP@0.5和mAP@0.5∶0.95指标分别为98.6%和92.6%, 相比其他课堂行为识别模型在精度上最高提升了4.2%和5.7%, 计算量为6.6 GFLOPS, 比原模型降低了19.5%。YOLOv8n-BiFPN-C3Ghost模型能以更低的运算成本精确地实现在线听课行为的检测和识别, 可以实现对学生在线课堂学习情况的动态、科学识别。

  • 图形图像处理
    陈子民, 关志涛
    计算机工程. 2024, 50(12): 296-305. https://doi.org/10.19678/j.issn.1000-3428.0068512
    摘要 (358) PDF全文 (369) HTML (24)   可视化   收藏

    深度学习模型在图像分类等领域取得了较好的结果, 但是深度学习模型容易受到对抗样本的干扰威胁, 攻击者通过对抗样本制作算法, 精心设计微小扰动, 构造肉眼难以分辨却能引发模型误分类的对抗样本, 给图像分类等深度学习应用带来严重的安全隐患。为提升图像分类模型的鲁棒性, 利用条件扩散模型, 提出一种综合对抗样本检测和对抗样本净化的对抗样本防御方法。在不修改目标模型的基础上, 检测并净化对抗样本, 提升目标模型鲁棒性。所提方法包括对抗样本检测和对抗样本净化2个模块。对于对抗样本检测, 采用不一致性增强, 通过训练一个融入目标模型高维特征和图片基本特征的图像修复模型, 比较初始输入和修复结果的不一致性, 检测对抗样本; 对于对抗样本净化, 采用端到端的对抗样本净化方式, 在去噪模型执行过程中加入图片伪影, 实现对抗样本净化。在保证目标模型精度的前提下, 在目标模型前增加对抗样本检测和净化模块, 根据检测结果, 选取相应的净化策略, 从而消除对抗样本, 提升目标模型的鲁棒性。在CIFAR10数据集和CIFAR100数据集上与5种现有方法进行对比实验, 实验结果表明: 对于扰动较小的对抗样本, 所提方法的检测精度较Argos方法提升了5~9个百分点; 相比于ADP方法, 所提方法在面对不同种类对抗样本时防御效果更稳定, 且在BPDA攻击下, 其对抗样本净化效果较ADP方法提升了1.3个百分点。

  • 热点与综述
    张锦, 陈铸, 陈照云, 时洋, 陈冠军
    计算机工程. 2025, 51(7): 1-11. https://doi.org/10.19678/j.issn.1000-3428.0068870
    摘要 (358) PDF全文 (678) HTML (38)   可视化   收藏

    在众多科学领域的研究与开发中,模拟器都扮演着不可替代的角色。在体系结构领域尤其如此,模拟器提供了一个安全、成本低廉的虚拟环境,使研究人员能够快速开展实验分析和评测。同时,模拟器还可以加速芯片设计和验证的过程,从而节省时间和资源成本。然而,随着处理器体系结构的演化进步,尤其是专用处理器发展呈现多元化特点,为了能够对体系结构设计探索提供重要的反馈,模拟器的重要作用日益凸显。综述了体系结构模拟器目前的发展与应用现状,重点介绍了几种目前较为典型的体系结构模拟器。通过对专用于不同处理器的模拟器技术手段的分析,深入了解不同架构下模拟器的侧重点及技术难点。此外,还对体系结构模拟器未来发展的关键点进行了思考与评述,以展望其在处理器设计研究领域的前景。

  • 图形图像处理
    赵宏, 宋馥荣, 李文改
    计算机工程. 2025, 51(2): 300-311. https://doi.org/10.19678/j.issn.1000-3428.0068481
    摘要 (349) PDF全文 (378) HTML (19)   可视化   收藏

    对抗样本是评估深度神经网络(DNN)鲁棒性和揭示其潜在安全隐患的重要手段。基于生成对抗网络(GAN)的对抗样本生成方法(AdvGAN)在生成图像对抗样本方面取得显著进展, 但该方法生成的扰动稀疏性不足且幅度较大, 导致对抗样本的真实性较低。为解决这一问题, 基于AdvGAN提出一种改进的图像对抗样本生成方法(SE-AdvGAN)。SE-AdvGAN通过构造SE注意力生成器和SE残差判别器来提高扰动的稀疏性。SE注意力生成器用于提取图像关键特征, 限制扰动生成位置, SE残差判别器指导生成器避免生成无关扰动。同时, 在SE注意力生成器的损失函数中加入以l2范数为基准的边界损失以限制扰动的幅度, 从而提高对抗样本的真实性。实验结果表明, 在白盒攻击场景下, SE-AdvGAN相较于现有方法生成的对抗样本扰动稀疏性更高、幅度更小, 并且在不同目标模型上均取得了更好的攻击效果, 说明SE-AdvGAN生成的高质量对抗样本可以更有效地评估DNN模型的鲁棒性。

  • 开发研究与工程应用
    汤静雯, 赖惠成, 王同官
    计算机工程. 2025, 51(4): 303-313. https://doi.org/10.19678/j.issn.1000-3428.0068897
    摘要 (345) PDF全文 (206) HTML (20)   可视化   收藏

    智慧社区场景下的行人检测需要精准识别行人以应对各类情况的发生, 然而面对遮挡和远距离行人的情景, 现有检测器会出现漏检、误检以及模型过大不易部署的问题。针对以上问题, 提出基于YOLOv8的行人检测算法ME-YOLO。设计一种高效特征提取模块(EM), 使得网络更好地学习行人特征和捕捉行人特点, 在减少网络参数量的同时提高检测精度。设计一个重构的检测头模块, 重新整合后的检测层增强了网络对小目标的识别能力, 有效检测小目标行人。引入双向特征金字塔网络来设计新的颈部网络, 即双向扩张残差-特征金字塔网络(BDR-FPN), 利用扩张残差模块和附权注意力机制来扩展感受野及有所侧重地学习行人特征, 缓解网络对遮挡行人不敏感问题。实验结果表明, 在CityPersons数据集上进行训练和验证, 相比原算法YOLOv8, ME-YOLO算法的AP50提高了5.6百分点, 模型参数量减少了41%, 模型大小压缩了40%, 在TinyPerson数据集上验证算法的有效性和泛化性, AP50提高了4.1百分点, AP50∶95提高了1.7百分点。该算法在大幅度减少模型参数和大小的同时, 有效提高了检测精度, 在智慧社区场景中有较好的应用价值。

  • 图形图像处理
    火久元, 苏泓瑞, 武泽宇, 王婷娟
    计算机工程. 2025, 51(1): 246-257. https://doi.org/10.19678/j.issn.1000-3428.0069825
    摘要 (339) PDF全文 (247) HTML (17)   可视化   收藏

    针对交通道路中小目标车辆存在的识别困难、检测精度低以及误检和漏检等问题, 提出一种基于YOLOv8算法的大内核、多尺度梯度组合的道路交通小目标车辆检测模型RGGE-YOLOv8。首先, 使用RepLayer模型替换YOLOv8网络的主干部分, 引入大内核深度可分离卷积结构, 拓展上下文信息, 以增强模型对小目标的信息捕获能力; 其次, 使用GIoU代替原损失函数, 解决IoU在预测框与真实框没有重叠时存在的无法优化问题; 然后, 引入全局注意力机制(GAM), 通过减少信息丢失并增强全局交互信息来提高网络的特征表达能力; 最后, 引入CSPNet并重参化梯度组合特征金字塔, 使得模型具有较大感受野和高形状偏差。实验结果表明, RGGE-YOLOv8在Visdrone数据集和自有数据集上mAP@0.5指标分别达到34.8%和94.7%, 相较于原始YOLOv8n算法精度分别提高了2.2和5.51百分点, 证明了RGGE-YOLOv8模型对道路小目标车辆检测的有效性。

  • 图形图像处理
    胡涌涛, 黄洪琼
    计算机工程. 2025, 51(1): 225-234. https://doi.org/10.19678/j.issn.1000-3428.0068392
    摘要 (336) PDF全文 (94) HTML (12)   可视化   收藏

    换装行人重识别(CC Re-ID)是行人重识别中的一个新兴研究课题, 旨在找出被换衣的行人。当前方法主要集中在使用多模态数据辅助解耦表征学习, 如通过脸、步态、身体轮廓等辅助数据解耦行人自身属性以减少服装影响, 但这些方法泛化能力较差, 需要大量额外工作。此外, 仅使用原始数据的方法对于相关信息的提取不够充分, 性能较弱。针对CC Re-ID存在的上述问题, 提出一种结合特征融合和通道注意力的多分支换装行人重识别方法(MBFC)。通过在主干网络中融入通道注意力机制, 在特征通道层面学习关键信息, 设计局部与全局特征融合方法以提高网络对行人细粒度特征的提取能力。此外, MBFC模型采用多分支结构, 使用服装对抗损失、交叉熵标签平滑损失等多种损失函数引导模型学习与服装无关的信息, 减少服装对模型的影响, 从而提取到更有效的行人信息。在PRCC和VC-Clothes数据集上进行广泛实验, 结果表明, 所提模型在RANK-1和平均精度均值(mAP)指标上优于对比的CC Re-ID方法。

  • 热点与综述
    庞鑫, 葛凤培, 李艳玲
    计算机工程. 2025, 51(6): 1-19. https://doi.org/10.19678/j.issn.1000-3428.0069005
    摘要 (327) PDF全文 (242) HTML (38)   可视化   收藏

    声学场景分类(ASC)旨在让计算机模拟人类听觉识别不同的声学环境,是计算机听觉领域中具有挑战性的任务之一。随着智能音频处理技术以及神经网络学习算法的快速进步,近年来ASC任务也涌现出一系列新算法和新技术。为了全面展示该领域的技术发展脉络和演进过程,梳理了该领域的早期工作和近期发展,全面介绍了ASC任务。首先描述了ASC的应用场景和面临的挑战;其次详细介绍了ASC的主流框架,重点阐述了应用于此领域的深度学习算法;然后系统性地总结了ASC的前沿探索与延伸任务以及公开数据集;最后对ASC的发展趋势进行探讨与展望。

  • AI算力赋能的车载边缘计算
    崔萌萌, 施静燕, 项昊龙
    计算机工程. 2025, 51(9): 25-37. https://doi.org/10.19678/j.issn.1000-3428.0069836
    摘要 (314) PDF全文 (157) HTML (22)   可视化   收藏

    为了进一步优化车载服务的服务质量(QoS),移动边缘计算(MEC)被深度整合于车联网(IoV)中,旨在为车辆提供地理位置较近的计算资源,降低任务处理延迟和能耗。然而,传统的MEC服务器部署主要依赖于地面基站(BS),这不仅导致高昂的部署成本,而且限制其覆盖范围,难以确保为所有车辆提供无间断服务。为了应对上述挑战,空地协同IoV作为一种新兴的技术方案应运而生。无人机(UAV)能够借助其视距链路的灵活性动态地协助路边单元(RSU),为车辆用户提供更为灵活的计算资源,进而保障车载服务的连续性和高效性。提出一种基于空地协同的动态车载边缘任务卸载方法(DVETOM)。该方法采用车-路-空架构,构建了车辆到RSU(V2R)链路和车辆到UAV(V2U)链路。针对车辆任务的本地执行、卸载至RSU执行和卸载至UAV执行3种模式分别构建传输模型和计算模型,并以最小化系统时延和能耗作为联合优化目标构建目标函数。DVETOM将任务卸载问题转化为马尔可夫决策过程(MDP),基于深度强化学习(DRL)的分布式深度确定性策略梯度(D4PG)算法优化任务卸载策略。与5种基准方法进行对比,实验结果表明,DVETOM在提升车辆用户QoS的同时,在降低系统时延方面优于现有方法3.45%~23.7%,在降低系统能耗方面优于现有方法5.8%~23.47%。综上所述,DVETOM有效地优化了IoV中的车载边缘任务卸载,为IoV用户提供了更高效、更节能的服务解决方案,展现了其在智能交通系统领域的广泛应用潜力。

  • 人工智能与模式识别
    高锐涛, 林达伟, 郭亮, 金鸿, 王红
    计算机工程. 2024, 50(12): 133-141. https://doi.org/10.19678/j.issn.1000-3428.0068464
    摘要 (311) PDF全文 (237) HTML (24)   可视化   收藏

    随着农业信息技术的发展, 在互联网中积累了大量与水稻种植相关的数据。为解决农民在种植过程中难以快速获取准确答案的问题, 从水稻种植领域出发, 构建了基于知识图谱的智能问答系统。通过手工收集与爬虫技术获取相关数据, 通过构建命名实体识别模型和意图识别模型等自然语言处理技术并结合前后端技术, 最终实现了水稻种植领域智能问答系统的开发。实验结果表明, 在命名实体识别与意图识别模块中, 所构建模型的F1值分别达到89.17%和96.54%, 均高于其他常见模型。基于知识图谱的水稻种植智能问答系统能够准确回答农民在种植水稻过程中遇到的大部分问题, 实现了对水稻种植知识图谱数据的管理和可视化展示。

  • 人工智能与模式识别
    付立东, 艾肖同, 豆增发
    计算机工程. 2024, 50(12): 142-150. https://doi.org/10.19678/j.issn.1000-3428.0069040
    摘要 (302) PDF全文 (105) HTML (13)   可视化   收藏

    关键节点识别已经成为复杂网络领域的一个重要研究范畴, 但目前关键节点识别方法存在时间复杂度较高、得到的关键节点集不够准确以及节点中心性指标考虑不够充分等问题。基于此, 提出一种基于层级划分和节点特征的关键节点识别框架, 在该框架内, 为避免选取节点初始覆盖集时效率低下的问题, 提出一种基于层级划分的关键节点初始覆盖集选取方法, 该方法可在线性时间内计算出初始节点覆盖集, 随后通过节点中心性指标向原网络中回添节点, 直到解集中的节点数满足预定义阈值数。为解决回添节点过程中易陷于局部最优解的问题, 综合考虑网络拓扑结构和节点的多种属性, 提出一种节点综合特征的中心性指标。对比5种初始覆盖集选取算法以及5个中心性指标, 在真实网络上进行方法的应用和分析, 结果表明, 所提基于层级划分和节点特征的方法能够在不同类型的网络中更准确有效地识别关键节点, 且该方法的鲁棒性更好, 性能也优于其他方法。

  • 开发研究与工程应用
    周思瑜, 徐慧英, 朱信忠, 黄晓, 盛轲, 曹雨淇, 陈晨
    计算机工程. 2025, 51(5): 326-339. https://doi.org/10.19678/j.issn.1000-3428.0069259
    摘要 (301) PDF全文 (124) HTML (15)   可视化   收藏

    手机屏幕作为人机交互的主窗口, 已成为影响用户体验和终端整体性能的重要因素。因此, 市场对解决手机屏幕瑕疵的需求日益增长。为满足这一需求, 针对在手机屏幕瑕疵检测过程中存在检测精度低、小目标瑕疵漏检率高与检测速度慢的情况, 提出一种以YOLOv8n作为基准模型的PGS-YOLO算法。PGS-YOLO通过增加一个专门的微小目标检测头, 并结合SeaAttention注意力模块, 有效提升对小目标的探测能力; 将骨干网络和特征融合网络分别融入PConv与GhostNetV2轻量化模块, 在保证精度的同时降低模型的参数量, 提高瑕疵检测的速度与效率。实验结果表明, 在北京大学手机屏幕表面瑕疵数据集中, 相较于YOLOv8n, PGS-YOLO算法的mAP@0.5提升了2.5百分点, mAP@0.5∶0.95提升了2.2百分点, 在手机屏幕瑕疵检测过程中不仅能对大片的瑕疵做到精准检测, 还能对小瑕疵保持一定的准确度。此外, 检测性能优于YOLOv5n、YOLOv8s等大部分YOLO系列算法。同时, 参数量仅为2.0×106, 小于YOLOv8n, 满足工业场景对手机屏幕瑕疵检测的需求。

  • 人工智能与模式识别
    戴康佳, 徐慧英, 朱信忠, 李悉钰, 黄晓, 陈国强, 张志雄
    计算机工程. 2025, 51(3): 95-104. https://doi.org/10.19678/j.issn.1000-3428.0068950
    摘要 (299) PDF全文 (297) HTML (29)   可视化   收藏

    传统的视觉同步定位与建图(SLAM)系统是基于静态环境这一假设的, 然而在现实场景中往往存在动态物体, 这可能导致SLAM位姿估计和地图构建的精度下降、鲁棒性变差, 甚至出现跟踪丢失的情况。针对上述问题, 基于ORB-SLAM2提出新的语义SLAM系统(YGL-SLAM)。该系统首先使用轻量级目标检测算法YOLOv8n追踪动态对象, 获得动态对象的语义信息。然后在跟踪线程的同时提取点特征和线特征, 根据获取的语义信息利用Z-score和对极几何算法剔除动态特征, 以改进SLAM在动态场景中的表现。此外, 鉴于轻量级目标检测算法在追踪动态对象时存在连续帧的漏检测问题, 设计了基于相邻帧的检测补偿方法。在公开数据集TUM和Bonn上的测试结果表明, 相比ORB-SLAM2, YGL-SLAM系统准确率提升超过90%, 对比其他动态SLAM, YGL-SLAM也具有较高的准确度和鲁棒性。

  • 李沂杨, 陆声链, 王继杰, 陈明
    录用日期: 2024-12-11
    目标检测领域中,卷积神经网络(CNN)长期占据主导地位,并以其准确性和可扩展性在学术界得到广泛认可。目标检测领域先后涌现出多个代表性模型,如R-CNN系列(包括FastRCNN、FasterRCNN等)和YOLO系列。随着Transformer在自然语言处理领域的成功,研究者开始探索将其用于计算机视觉,由此产生了如ViT和Swin-ViT等视觉骨干网络。2020年,Facebook团队为减少目标检测任务中的先验知识和后处理,推出了基于Transformer的 DETR,一种端到端目标检测算法。尽管DETR在目标检测领域展现出潜力,但也存在诸如收敛速度慢、准确性较差、目标查询的物理意义不明确等缺点。这促使诸多研究人员对该算法开展了进一步的研究和改进。本文旨在分析整理总结针对DETR的改进探索,并分析他们的优势与不足,同时对利用DETR开展的前沿研究和细分应用领域进行概括,最后给出DETR在计算机视觉领域的未来展望。
  • 图形图像处理
    刘圣杰, 何宁, 王鑫, 于海港, 韩文静
    计算机工程. 2025, 51(2): 278-288. https://doi.org/10.19678/j.issn.1000-3428.0068375
    摘要 (287) PDF全文 (305) HTML (16)   可视化   收藏

    人体姿态估计被广泛应用于运动健身、手势控制、无人超市、娱乐游戏等诸多领域, 但姿态估计任务仍面临着诸多挑战。针对目前主流的人体姿态估计网络参数量大、计算复杂度高的问题, 提出一种基于高分辨率网络的轻量级姿态估计网络(LitePose)。首先, 采用Ghost卷积降低特征提取网络的参数; 其次, 通过采用解耦的全连接(DFC)注意力模块, 更好地捕获远距离空间位置像素间的依赖关系, 减少由于参数量下降而导致的提取特征缺失, 提高人体关键点回归的准确率; 然后, 设计一个特征增强模块, 对骨干网络提取的特征进行进一步增强; 最后, 设计一个新的坐标解码方法, 降低热图解码过程中的误差, 提高关键点回归的准确率。在人体关键点检测数据集COCO和MPII上对LitePose进行验证, 并与当前的主流方法进行对比。实验结果表明, LitePose相比基线网络HRNet精度损失0.2%, 但参数量不及基线网络的1/3, LitePose在保证少量精度损失的同时能够大幅降低网络模型的参数量。

  • 开发研究与工程应用
    陈梓延, 王晓龙, 何迪, 安国成
    计算机工程. 2025, 51(5): 314-325. https://doi.org/10.19678/j.issn.1000-3428.0069122
    摘要 (287) PDF全文 (119) HTML (20)   可视化   收藏

    现有的高精度车辆检测模型参数与计算量过高, 无法在交通智能设备上良好运行, 而轻量化的车辆检测模型精度普遍较低, 不适用于实际任务。为此, 提出一种改进YOLOv8的轻量化车辆检测网络, 将主干网络替换为计算量和内存访问更小的FasterNet网络, 并且将颈部的双向特征金字塔网络替换为加权双向特征金字塔网络(BiFPN), 简化特征融合过程。同时, 引入一种融合注意力机制的动态检测头, 实现检测头和注意力的无冗余结合; 此外, 针对完全交并比(CIoU)在检测精度和收敛速度上的缺陷, 提出一种尺度不变交并比(SIoU)结合归一化高斯Wasserstein距离(NWD)的回归损失算法。最后, 为尽量减小模型对边缘设备的算力需求, 进行基于幅值的层自适应稀疏化剪枝, 进一步压缩模型大小。实验结果表明, 提出的改进模型相较于原模型YOLOv8s, 在精度上升1.5百分点的情况下, 参数量降低78.9%, 计算量下降67.4%, 模型尺寸降低77.8%, 达到了比较优秀的轻量化效果, 具有很强的实用性。

  • 图形图像处理
    刘春霞, 孟吉星, 潘理虎, 龚大立
    计算机工程. 2025, 51(7): 326-338. https://doi.org/10.19678/j.issn.1000-3428.0069510
    摘要 (287) PDF全文 (92) HTML (17)   可视化   收藏

    针对现有的目标检测方法在处理背景复杂、有效信息量少的遥感图像时存在的误检、漏检等问题,提出了一种多模态遥感小目标检测方法——BFMYOLO。设计了像素级的红-绿-蓝(RGB)和红外(IR)图像的融合模块, 即多模态融合模块(BFM),充分利用不同模态的互补性,实现两种模态信息的有效融合;设计了全尺度自适应更新模块(AA),解决特征融合过程中的多目标信息冲突问题,通过结合CARAFE上采样算子并进一步融入浅层特征,在加强非相邻层间融合的同时增强小目标的空间信息;设计了改进的任务解耦检测头(IDHead),将分类和回归任务分开处理,以降低不同任务的相互干扰,融合深层语义特征,进一步提升模型的检测性能。采用归一化Wasserstein距离(NWD)损失函数作为定位回归损失函数,降低位置偏差的敏感性。实验结果表明,该方法在VEDAI、NWPU VHR-10和DIOR数据集上的阈值设定为0.5时的均值平均精度(mAP@0.5)分别达到78.6%、95.5%和73.3%,优于其他先进模型, 在遥感小目标检测中表现出良好的性能。

  • 热点与综述
    路悦, 周翔宇, 张世周, 梁国强, 邢颖慧, 程德, 张艳宁
    计算机工程. 2025, 51(10): 1-17. https://doi.org/10.19678/j.issn.1000-3428.0070575
    摘要 (284) PDF全文 (331) HTML (13)   可视化   收藏

    传统机器学习算法只有当测试集和训练集同分布时才能取得较好的性能, 无法增量地学习原训练集中没有的新类别或任务。持续学习使模型得以具备自适应学习能力, 在持续学习新任务的同时能够防止对旧任务的遗忘。当前持续学习仍面临计算开销大、存储成本高以及性能不稳定等挑战。近年来, 预训练模型的发展为持续学习提供了新的研究方向, 有望进一步提高性能表现。首先, 分析了现有基于预训练的持续学习方法, 按照防止遗忘的机制将其归纳为基于提示池、缓慢更新参数、基于扩展主干网络分支、基于参数正则化、基于分类器设计5类方法, 进一步按照阶段数、微调方式和是否利用语言模态对其进行归类并总结了各类方法的主要特点和各自优势。然后, 分析了持续学习方法存在的主要挑战, 归纳了各类持续学习方法的适用场景和局限性, 在多个评测基准上对各类方法进行实验比较并讨论各方法的性能差异。最后, 对基于预训练的持续学习方法的研究趋势进行展望。

  • 图形图像处理
    沙宇洋, 陆京涛, 杜浩凡, 翟小兵, 孟维宇, 廉旭, 罗刚, 李克峰
    计算机工程. 2025, 51(7): 314-325. https://doi.org/10.19678/j.issn.1000-3428.0068674
    摘要 (279) PDF全文 (194) HTML (16)   可视化   收藏

    图像分割是环境感知中的一项关键技术,被广泛应用于无人驾驶、虚拟现实等实际任务中。随着技术的不断发展,基于计算机视觉技术的导盲系统日趋成熟,并且在精度、稳定性等方面优于传统的解决方案。在视觉导盲系统中,道路图像的语义分割是非常重要的一部分,系统通过分析算法的输出结果可以获取目前所处的环境状态,从而指导用户躲避前方障碍物,获取最优的移动路径。视觉导盲系统的使用环境复杂,对模型的运行效率和分割精度具有极高的要求。然而,常用的高精度语义分割算法参数量大、运行速度慢,因此无法直接应用于导盲系统。针对这一问题,提出了一种基于多尺度特征的轻量化道路图像分割算法。模型含有两个特征提取分支,即Detail Branch和Semantic Branch,其中Detail Branch用来提取图像的低层细节信息,Semantic Branch用来提取图像的高层语义信息,并且两个分支中的多尺度特征也会被所设计的特征映射模块处理和使用,进而提升模型对于特征的建模能力。此外,设计了一种简单且高效的特征融合模块,通过融合不同尺度的特征,增强模型对于上下文信息的编码能力。采集和标注了适用于导盲场景的大量道路分割数据,并制作成了相应的数据集。基于该数据集对所提出的算法进行训练和测试,实验结果显示: 所提出的道路分割算法的平均交并比(mIoU)为96.5%,优于现有的图像分割模型;以1 024×1 024像素的图像作为输入,所提算法的轻量化版本在NVIDIA GTX 3090Ti平台的运行速度为201帧/s,优于现有轻量化图像分割模型;将模型部署到NVIDIA AGX Xavier设备中,其在实际场景中的测试速度为53帧/s,满足实际需求。

  • 开发研究与工程应用
    史昕, 曹凤腾, 纪艺, 马峻岩
    计算机工程. 2024, 50(12): 346-357. https://doi.org/10.19678/j.issn.1000-3428.0068659
    摘要 (275) PDF全文 (75) HTML (8)   可视化   收藏

    交通流预测在规划交通系统、优化道路资源和缓解交通拥堵等方面具有重要意义。针对交通流预测中时间周期性特征提取不充分的问题, 提出一种基于多尺度时空特征和软注意力机制的交通流预测方法MSTFSA。首先, 利用图交谈注意力网络(GTHAT)提取空间数据的非欧几里得结构特征, 通过分配动态权重表征不同时间相邻道路交通流的影响程度; 其次, 利用双向增强注意力门控循环单元(Bi-EAGRU)结构提取时间数据的连续性关联特征, 增强每个时刻的时间特征与上下时刻的联系; 然后, 基于软注意力机制融合周周期、日周期和近邻时间3个尺度下的相似交通流趋势, 实现对时间周期性特征的充分提取, 最后, 结合高速公路数据集PeMS04和PeMS08验证MSTFSA的预测精度。实验结果表明, MSTFSA的交通流预测精度表现出良好效果, 与基线模型STSGCN和ASTGCN相比, 在PeMS04数据集上的预测均方根误差(RMSE)分别降低7.15%和3.8%, 平均绝对误差(MAE)分别降低7.79%和3.99%。MSTFSA能较充分地提取并融合交通数据的多时间尺度时空特征, 在交通流预测精度提升方面表现出一定的优势。

  • 热点与综述
    田青, 王斌, 周子枭
    计算机工程. 2025, 51(7): 12-30. https://doi.org/10.19678/j.issn.1000-3428.0069698
    摘要 (272) PDF全文 (128) HTML (10)   可视化   收藏

    从多个不同的摄像机中检索出一个特定的行人是行人重识别(ReID)的主要任务。随着深度神经网络的发展和智能视频监控需求的增加,行人ReID逐渐受到研究人员的关注。现有的行人ReID方法大多利用带有标签的数据集进行有监督训练,但该方式的数据标注成本高昂,使得有监督行人ReID难以扩展到大型的未标记数据集场景。无监督行人ReID可以有效地改善行人ReID模型的扩展问题,更符合现实场景的应用,并逐渐成为研究热点。尽管已有行人ReID的相关综述,但它们主要聚焦于有监督学习领域的方法和应用。为此,对现有无监督行人ReID研究工作进行系统归纳、分析和总结,以便为该领域研究人员提供参考。首先,全面回顾无监督场景的行人ReID方法,根据模型训练是否使用源域监督信息,将无监督行人ReID研究划分为无监督域适应方法和完全无监督方法,并对这2类方法进行分析和总结。然后,介绍和归纳总结行人ReID研究相关的经典数据集,并展示和讨论不同行人ReID方法在这些数据集上的性能和优劣。最后,指出当前无监督行人ReID研究所面临的问题,并提出未来发展方向。

  • 人工智能与模式识别
    宋杰, 徐慧英, 朱信忠, 黄晓, 陈晨, 王泽宇
    计算机工程. 2025, 51(7): 127-139. https://doi.org/10.19678/j.issn.1000-3428.0069257
    摘要 (270) PDF全文 (152) HTML (24)   可视化   收藏

    在室内场景下, 受角度、光线变化等因素的影响, 导致现有目标检测算法检测跌倒事件时检测精度降低、实时性变差。为此, 提出一种基于YOLOv8改进的跌倒检测算法OEF-YOLO。采用全维动态卷积(ODConv)模块改进YOLOv8中的C2f模块, 优化了核空间的4个维度以增强特征提取能力, 而且有效减少了计算负担。同时, 为了捕获更细粒度的特征, 在颈部网络中引入高效多尺度注意力(EMA)模块, 进一步聚合像素级特征, 提高网络在跌倒场景中的处理能力。在CIoU损失函数中融入Focal Loss思想, 使模型对难分类样本给予更多关注, 优化模型整体性能。实验结果表明, 相比YOLOv8n, OEF-YOLO跌倒检测算法在mAP@0.5指标上提升了1.5百分点, mAP@0.5∶0.95提升1.4百分点, 参数量和计算量分别为3.1×106和6.5 GFLOPs, 在图形处理器(GPU)上FPS提高了44, 在提高精度检测跌倒事件的同时, 兼顾了低算力场景下的部署要求。

  • 基于感知信息的图像处理
    周宇, 谢威, 邝得互, 江健民
    计算机工程. 2025, 51(1): 20-30. https://doi.org/10.19678/j.issn.1000-3428.0069369
    摘要 (267) PDF全文 (424) HTML (27)   可视化   收藏

    视频快照压缩成像(SCI)是一种基于计算的成像技术, 通过在时间域和空间域上的混合压缩来实现高效成像。在视频SCI中, 利用信号的稀疏性以及它在时间域和空间域中的相关性并采用合适的视频SCI算法, 有效地重建原始视频信号。虽然基于深度学习的重建算法在多数任务中取得了良好的效果, 但是还存在过高的模型复杂度和较慢的重建速度。为解决这些问题, 提出一个基于三元自注意力的视频快照压缩成像重建网络模型SCT-SCI, 利用多分支分组自注意力机制来利用时间域和空间域的相关性。SCT-SCI模型由一个特征提取模块、一个视频重建模块和多个三元自注意力模块SCT-Block组成。每个SCT-Block由一个窗口自注意力分支、一个通道自注意力分支和一个时序自注意力分支组成, 同时引入空间聚合模块SC-2DFusion和全局聚合模块SCT-3DFusion加强特征融合。实验结果显示, 在模拟视频数据集上, 该模型具有低复杂度的优势, 在保证接近的重建质量的前提下相比EfficientSCI模型节省了31.58%的重建时间, 提升了实时性能。

  • 网络空间安全
    陈先意, 丁思哲, 王康, 闫雷鸣, 付章杰
    计算机工程. 2025, 51(1): 138-147. https://doi.org/10.19678/j.issn.1000-3428.0068349
    摘要 (267) PDF全文 (183) HTML (15)   可视化   收藏

    联邦学习作为一种新型的深度学习范式, 允许多个参与方在客户端本地共同训练模型, 极大地保护了用户的数据隐私, 得到了广泛关注和研究。然而, 联邦学习作为一种分布式学习方式, 极易遭受非法复制、恶意分发及客户端懒惰不作为等攻击。针对上述问题, 提出一种支持安全联邦学习的主动保护模型水印框架。首先, 设计了一个基于护照层水印的个性化参数聚合方法, 在解决水印冲突问题的同时防止懒惰客户端盗窃模型; 其次, 设计了一个基于向量承诺的全局水印聚合方法, 有效抵御了恶意攻击者伪造私有水印进行歧义攻击。实验结果表明, 与当前最好的FedIPR相比, 所提方法具有更高的水印容量, 可以支持更大型的联邦学习系统; 在差分隐私、客户端选择等安全联邦学习策略下能保持近100%的水印提取率, 在遭遇微调、剪枝等攻击时也能保持98%以上的水印提取率。

  • 热点与综述
    毛竞争, 胡潇锐, 徐庚辰, 吴国栋, 孙彦斌, 田志宏
    计算机工程. 2025, 51(2): 1-17. https://doi.org/10.19678/j.issn.1000-3428.0068374
    摘要 (264) PDF全文 (244) HTML (19)   可视化   收藏

    基于数字孪生(DT)的工业控制系统(ICS)在提升系统安全性、保障稳定运行及优化生产效率方面具有重要作用, 其在工控安全领域的应用主要涵盖两方面: 安全态势感知和工业网络靶场。基于DT的安全态势感知通过实时监测、异常检测、漏洞分析和威胁识别, 实现系统安全的可视化管理。基于DT的工业网络靶场作为策略验证平台, 支持工控系统的攻防模拟, 评估安全策略有效性, 强化关键设施防护, 并提供人员培训支持。首先, 分析了ICS的安全现状, 并阐述了DT技术在ICS安全态势中的应用进展及其对风险评估的提升作用; 然后, 介绍了基于DT的工控网络靶场在工控安全中的优化作用; 最后, 通过智能电网典型案例验证了DT技术在工控安全中的重要作用, 并进一步探讨了DT技术在工控安全领域的未来发展方向。

  • 图形图像处理
    阳丽莎, 李茂军, 胡建文, 王鼎湘
    计算机工程. 2025, 51(1): 208-215. https://doi.org/10.19678/j.issn.1000-3428.0068397
    摘要 (263) PDF全文 (105) HTML (12)   可视化   收藏

    针对带钢表面缺陷检测任务存在的小目标检测效率低、缺陷定位不准确、检测算法参数量大、难以部署在终端设备上等问题, 提出一种改进的YOLOv7-tiny检测算法。首先, 使用GSConv替换颈部网络中的标准卷积, 基于GSConv设计一种改进的高效聚合网络(ELAN-G), 保证带钢表面缺陷特征信息被充分融合同时降低算法的参数量; 其次, 在预测头和颈部网络之间增加针对低分辨率和小缺陷的SPDConv模块, 模块生成一个中间特征图, 通过对中间特征图中的小缺陷特征信息进行过滤学习得到最终特征图, 以此提高预测头对小缺陷的检测精度; 最后, 引入MPDIoU损失函数, 合理利用边界回归框的几何性质, 简化损失函数计算过程并提高缺陷定位精度。实验结果表明, 在NEU-DET数据集上, 改进算法比其他6种先进目标检测算法效果更好, 性能更均衡, 其平均精度均值(mAP)可达74.1%, 且参数量和计算量低于所有对比算法, 可应用于工业环境中的带钢表面缺陷检测系统。

  • 开发研究与工程应用
    张财, 马自强, 闫博
    计算机工程. 2024, 50(12): 386-395. https://doi.org/10.19678/j.issn.1000-3428.0068530
    摘要 (263) PDF全文 (72) HTML (14)   可视化   收藏

    针对政务微博评论杂乱、审核困难的问题, 提出一种基于机器学习的政务微博情感分析模型。该模型能够量化分析政务微博中的情感, 为自动审核提供有效依据。以2022年北京冬奥会和中国足协的微博为例, 首先扩展与案例相关的词汇, 并进行数据清洗和文本特征表示; 然后采用机器学习模型进行情感倾向判断, 并结合大连理工大学中文情感词汇文本计算情感强度。分别采用基于词袋模型和Word2vec模型的决策树、朴素贝叶斯和支持向量机模型进行预测, 并对它们的性能进行对比评估。实验结果表明, 在基于Word2vec的支持向量机模型下, 情感分类的准确率达到84.3%, 这表明所提模型在预测政务微博情感方面具有有效性, 可应用于政务微博自动审核任务。

  • 图形图像处理
    王林, 赵莉, 王无为
    计算机工程. 2024, 50(12): 265-275. https://doi.org/10.19678/j.issn.1000-3428.0068620
    摘要 (259) PDF全文 (182) HTML (6)   可视化   收藏

    针对高动态场景下无人机(UVA)空对空目标检测任务中机载设备计算资源有限和UVA小目标检测困难的问题, 提出一种基于轻量级注意力机制的无人机空对空目标检测算法SGC-YOLOv5。首先, 设计S-Ghost模块和SD-Ghost结构构建特征提取网络SD-GhostNet, 降低模型参数量和计算复杂度; 其次, 引入更高效的GSConv和VOVGSCSP结构细化特征融合网络, 将SD-GhostNet和细化的特征融合网络相结合使模型达到最佳的轻量化效果; 最后, 在特征融合网络中加入轻量级卷积块注意力模块(CBAM)来突出图像中感兴趣的UVA特征, 抑制背景冗余信息, 提高检测精度。在数据集Det-Fly上的实验结果表明, SGC-YOLOv5算法的精确率为74.9%、参数量为4 313 695、检测速度为169.42帧/s、每秒浮点运算次数(FLOPs)为9.0×109, 与基准YOLOv5s算法相比, 检测精确率提升2.5%、参数量减少48.5%、检测速度提升26.17帧/s、FLOPs降低57.5%, 在实现模型轻量化的同时取得了较好的检测精确率。

  • 图形图像处理
    胡倩, 皮建勇, 胡伟超, 黄昆, 王娟敏
    计算机工程. 2025, 51(3): 216-228. https://doi.org/10.19678/j.issn.1000-3428.0068753
    摘要 (256) PDF全文 (222) HTML (34)   可视化   收藏

    针对现有的行人检测方法对于密集行人或小目标行人检测精度低的问题, 提出一种基于YOLOv5的综合改进算法模型YOLOv5_Conv-SPD_DAFPN。首先, 针对小目标或密集行人的特征信息易丢失这一问题, 在骨干网络中引入Conv-SPD网络模块替代原有的跨步卷积, 有效缓解特征信息丢失的问题; 其次, 针对非相邻特征图不直接融合从而引起特征融合率较低的问题, 提出新的双层渐进金字塔网络(DAFPN), 提高行人检测的准确性和精度; 最后, 基于EIoU_Loss和CIoU_Loss引入EfficiCIoU_Loss定位损失函数, 以调整和提高帧回归率, 促进网络模型更快收敛。模型在CrowdHuman和WiderPerson行人数据集上相比于原YOLOv5模型, mAP@0.5、mAP@0.5∶0.95分别提升了3.9、5.3百分点和2.1、2.1百分点; 引入EfficiCIoU_Loss后, 模型收敛速度分别提升了11%、33%。这些改进使得基于YOLOv5的密集行人检测在特征信息保留、多尺度融合和损失函数优化等方面都取得了显著进展, 提高了其在实际应用中的性能和效率。

  • 汤伟博, 方强, 李沛根, 艾龙金, 熊金红, 夏海廷
    录用日期: 2024-12-05
    针对无人机航拍图像中检测性能低、遮挡严重、小目标特征提取难度大及模型参数量大的问题,提出了基于YOLOv8s的RSD-YOLO算法。首先,设计了感受野注意力模块(CSP-RFA)替代C2f模块,以提升小目标特征提取能力,有效应对传统卷积操作对位置变化不敏感的问题。其次,主干网络和特征融合网络进行了轻量化处理,新增了大尺寸特征图检测分支,并提出了感受野金字塔网络(RFPN),优化特征流动方向,增强特征表达能力。同时,检测头模块经过优化,将多尺度特征集成至具多级注意力机制的检测头中,并替换了损失函数,提升了模型对小目标的检测性能。在模型压缩方面,采用LAMP剪枝,进一步减少了模型的参数量和大小。实验结果表明,轻量化后的RSD-YOLO在公开数据集VisDrone2019上较基线模型有显著提升,精度(P)提高了10.0%,mAP0.5提升9.5%(增幅24.1%),mAP0.5:0.95提高6.9%(增幅29.4%)。模型参数量从11.12M减少至4.05M(减少63.6%),计算量从42.7GFLOPs降至25.5GFLOPs(减少40%)。此外,在仅检测遮挡小目标的新数据集上,RSD-YOLO在P、mAP0.5、mAP0.5:0.95上分别提升了9.1%、16.1%和10.7%。