作者投稿和查稿 主编审稿 专家审稿 编委审稿 远程编辑

阅读排行

  • 一年内发表的文章
  • 两年内
  • 三年内
  • 全部
Please wait a minute...
  • 全选
    |
  • 热点与综述
    任书玉, 汪晓丁, 林晖
    计算机工程. 2024, 50(12): 16-32. https://doi.org/10.19678/j.issn.1000-3428.0068553
    摘要 (729) PDF全文 (1125) HTML (72)   可视化   收藏

    Transformer在自然语言处理中表现出优越的性能激励了研究人员开始探索其在计算机视觉任务中的应用。基于Transformer的目标检测模型DETR将目标检测视为一个集合预测问题, 引入Transformer模型来解决目标检测任务, 从而避免了传统方法中的提案生成和后处理步骤。最初的DETR在训练收敛和小物体检测方面存在速度慢、效率低的问题。为了解决这些问题, 研究人员进行了多方面改进, 提升了DETR的性能。对DETR的基本模块和增强模块进行深入研究, 包括对主干结构的修改、查询设计策略和注意力机制的改进, 同时对各种检测器进行比较分析, 评估它们的性能和网络架构, 探讨了DETR在计算机视觉任务中的潜力和应用前景以及目前存在的局限性和面临的挑战, 并对相关模型进行分析与总结。根据目标检测发展的现状, 分析注意力模型的优势与局限性, 并对注意力模型在目标检测领域的研究方向加以展望。

  • 图形图像处理
    赵南南, 高翡晨
    计算机工程. 2025, 51(1): 198-207. https://doi.org/10.19678/j.issn.1000-3428.0068677
    摘要 (646) PDF全文 (660) HTML (68)   可视化   收藏

    提出一种基于改进型YOLOv8的实例分割算法(DE-YOLO)。为减少图像中复杂背景的干扰, 引入高效多尺度注意力机制, 跨维交互使各特征组内空间语义特征平均分布。在主干网络部分, 使用可变形卷积DCNv2结合C2f卷积层, 突破原始卷积限制, 提升可变性。为减小有害梯度并提升检测器精度, 采用动态非单调聚焦机制Wise-交并比(WIoU)替代联合完全交并(CIoU)损失函数进行质量评估, 优化检测框定位, 提升分割精度。同时, 通过开启Mixup数据增强处理, 充实数据集, 丰富训练特征, 提升模型学习能力。实验结果表明, DE-YOLO在城市景观数据集Cityscapes中的掩模平均精度均值(mAPmask)较基准模型YOLOv8n-seg提高了2.0百分点, IoU阈值为0.5时的平均精度提升了3.2百分点, 所提算法在提升精度的同时, 保持了优良的检测速度和较少的参数量, 模型参数量较同类模型低2.2~31.3百分点。

  • 热点与综述
    黄开基, 杨华
    计算机工程. 2024, 50(10): 16-34. https://doi.org/10.19678/j.issn.1000-3428.0068580
    摘要 (588) PDF全文 (2203) HTML (54)   可视化   收藏

    图像匹配的目标是从两个或多个图像中找到相似结构之间的对应关系, 是计算机视觉技术的重要基础, 在机器人、遥感、自动驾驶等领域具有广泛应用。近年来随着深度学习技术的发展, 基于深度学习的二维(2D)图像匹配算法在特征提取、特征描述、特征匹配3个方面不断进行改进, 其性能在匹配精度、鲁棒性等方面远超传统算法, 取得了重大突破。首先, 总结近10年基于深度学习特征的2D图像匹配算法, 将其分为基于局部特征的双阶段图像匹配、联合特征检测和描述的图像匹配、无特征检测的图像匹配3类算法, 阐述这3类算法的发展过程、分类方法、性能评价指标并归纳其优点及局限性。然后, 介绍2D图像匹配算法的典型应用场景, 分析2D图像匹配算法的研究进展对其应用领域的影响。最后, 总结并展望2D图像匹配算法的发展趋势。

  • 上海市计算机学会40周年庆
    齐凤林, 沈佳杰, 王茂异, 张凯, 王新
    计算机工程. 2025, 51(4): 1-14. https://doi.org/10.19678/j.issn.1000-3428.0070222
    摘要 (554) PDF全文 (836) HTML (55)   可视化   收藏

    人工智能(AI)的快速发展已为众多领域赋能, 对社会带来了深远的影响, 其出色的处理效果、广泛的适用性以及强大的扩展能力, 为高校信息化服务提供了坚实的技术基础。从AI和高校信息化的发展史出发, 探讨了两者的发展历程及其关联, 在国内外高校信息化建设中, 尽管各自对AI的关注点有所不同, 但均展现了其在提升教育质量、优化管理流程等方面的巨大潜力。从聚焦高校信息化建设者的角度, 在教师教学、学生学习、学校管理、教学评估、智能考试等五大核心领域, 详尽归纳并分析了AI赋能高校信息化中的典型应用案例, 展现了其如何有效提升教育质量与管理效率, 同时指出了AI在高校信息化应用过程中可能面临的数据隐私保护、算法偏见、技术依赖风险等问题, 列举了常见的应对策略, 如加强数据安全防护、优化算法透明度与公平性、培养师生信息素养等。基于这些分析, 进一步展望了AI在高校信息化中的未来优化方向, 强调技术创新与伦理规范并重, 倡导建立跨学科合作机制, 共同推动AI技术在高校信息化领域的健康、可持续发展。

  • 网络空间安全
    吴若岚, 陈玉玲, 豆慧, 张洋文, 龙钟
    计算机工程. 2025, 51(2): 179-187. https://doi.org/10.19678/j.issn.1000-3428.0068705
    摘要 (538) PDF全文 (10414) HTML (19)   可视化   收藏

    联邦学习作为新兴的分布式学习框架, 允许多个客户端在不共享原始数据的情况下共同进行全局模型的训练, 从而有效保护了数据隐私。然而, 传统联邦学习仍然存在潜在的安全隐患, 容易受到中毒攻击和推理攻击的威胁。因此, 为了提高联邦学习的安全性和模型性能, 需要准确地识别恶意客户端的行为, 同时采用梯度加噪的方法来避免攻击者通过监控梯度信息来获取客户端的数据。结合恶意客户端检测机制和本地差分隐私技术提出了一种鲁棒的联邦学习框架。该算法首先利用梯度相似性来判断和识别潜在的恶意客户端, 减小对模型训练任务产生的不良影响; 其次, 根据不同查询的敏感性以及用户的个体隐私需求, 设计一种基于动态隐私预算的本地差分隐私算法, 旨在平衡隐私保护和数据质量之间的权衡。在MNIST、CIFAR-10和MR文本分类数据集上的实验结果表明, 与3种基准算法相比, 该算法在准确性方面针对sP类客户端平均提高了3百分点, 实现了联邦学习中更高的安全性水平, 显著提升了模型性能。

  • 人工智能与模式识别
    彭菊红, 张弛, 高谦, 张光明, 谈栋华, 赵明俊
    计算机工程. 2025, 51(7): 152-160. https://doi.org/10.19678/j.issn.1000-3428.0069283
    摘要 (537) PDF全文 (364) HTML (36)   可视化   收藏

    在工业场景下钢材表面缺陷检测技术存在检测精度低、收敛速度慢等问题。为此, 提出一种改进的YOLOv8算法YOLOv8n-MDC。首先, 在骨干网络中加入多尺度交叉融合网络(MCN), 通过在特征层之间建立更紧密的连接, 促进信息的均匀传递, 减少跨层特征融合时的语义信息损失, 从而增强模型对钢材缺陷的感知能力; 其次, 在模块中引入可变形卷积, 自适应地改变卷积核的形状与位置, 从而更灵活地捕捉不规则缺陷的边缘特征, 减少信息丢失, 提升检测的准确性; 最后, 加入坐标注意力(CA)机制, 将位置信息嵌入到通道中, 解决了位置信息丢失的问题, 使模型能够更精确地感知缺陷的位置及其形态特征, 从而提升检测的精度和稳定性。在NEU-DET数据集上的实验结果表明, YOLOv8n-MDC算法的mAP@0.5达到了81.0%, 相比原基准网络提升了4.2百分点, 该算法收敛速度较快、精度较高, 更能满足实际工业生产的要求。

  • 热点与综述
    李硕, 赵朝阳, 屈音璇, 罗亚平
    计算机工程. 2024, 50(12): 33-47. https://doi.org/10.19678/j.issn.1000-3428.0068276
    摘要 (518) PDF全文 (1007) HTML (57)   可视化   收藏

    指纹识别是应用最早、使用最成熟的一项生物特征识别技术, 在民用领域的门禁考勤、移动支付以及刑侦领域检视嫌疑人线索等方面均有着广泛的应用。近年来, 深度学习技术给计算机视觉以及生物特征领域带来了深刻变革, 也给指纹研究人员提供了一种自动处理以及应用融合特征有效表示指纹的新方法, 在指纹识别的各个阶段均有着优异的效果。概述指纹识别的发展历史与应用背景, 阐述指纹识别图像预处理、特征提取以及指纹匹配3个阶段的主要处理流程, 分别对深度学习技术在不同阶段的应用现状进行归纳和总结, 比较不同深度神经网络在图像分割、图像增强、方向场估计、细节特征提取以及指纹匹配等具体环节的应用效果。最后, 分析当前指纹识别领域存在的一些问题与挑战, 并对构建公开指纹数据集、进行多尺度指纹特征提取以及训练端到端指纹识别模型等未来的发展方向进行展望。

  • 人工智能与模式识别
    戴磊, 曹林, 郭亚男, 张帆, 杜康宁
    计算机工程. 2024, 50(10): 100-109. https://doi.org/10.19678/j.issn.1000-3428.0068106
    摘要 (473) PDF全文 (76) HTML (10)   可视化   收藏

    为了降低深度伪造技术滥用带来的社会风险, 提出一种基于生成对抗网络的主动防御深度伪造方法, 通过在原始图像上增加微弱扰动制作对抗样本, 使多个伪造模型输出产生明显失真。提出模型由对抗样本生成模块和对抗样本优化模块组成。对抗样本生成模块包括生成器和鉴别器, 生成器在接收原始图像生成扰动后, 通过对抗训练约束扰动的空间分布, 降低扰动的视觉感知, 提高对抗样本的真实性; 对抗样本优化模块由基础对抗水印、深度伪造模型和鉴别器等组成, 通过模拟黑盒场景攻击多个深度伪造模型, 提高对抗样本的攻击性和迁移性。在常用深度伪造数据集CelebA和LFW上进行训练和测试, 实验结果表明, 相比现有主动防御方法, 提出方法在实现跨模型主动防御的基础上, 防御成功率达到85%以上, 并且对抗样本生成效率比传统算法提高20~30倍。

  • 热点与综述
    庞文豪, 王嘉伦, 翁楚良
    计算机工程. 2024, 50(12): 1-15. https://doi.org/10.19678/j.issn.1000-3428.0068694
    摘要 (472) PDF全文 (623) HTML (41)   可视化   收藏

    在大数据背景下, 随着科学计算、人工智能等领域的快速发展, 各领域对硬件的算力要求越来越高。图形处理器(GPU)特殊的硬件架构, 使其适合进行高并行度的计算, 并且近年来GPU与人工智能、科学计算等领域互相发展促进, 使GPU功能细化, 逐渐发展出了成熟的通用图形处理器(GPGPU), 目前GPGPU已成为中央处理器(CPU)最重要的协处理器之一。然而, GPU硬件配置在出厂后不容易更改且显存容量有限, 在处理大数据集时显存容量不足的缺点对计算性能造成较大的影响。统一计算设备架构(CUDA)6.0推出了统一内存, 使GPGPU和CPU可以共享虚拟内存空间, 以此来简化异构编程和扩展GPGPU可访问的内存空间。统一内存为GPGPU处理大数据集提供了一项可行的解决方案, 在一定程度上缓解了GPU显存容量较小的问题, 但是统一内存的使用也带来了一些性能问题, 如何在统一内存中做好内存管理成为性能提升的关键。本研究对CUDA统一内存的发展和应用进行综述, 包括CUDA统一内存的特性、发展、优势和局限性以及在人工智能、大数据处理系统等领域的应用和未来的发展前景, 为未来使用和优化CUDA统一内存的研究工作提供有价值的参考。

  • 图形图像处理
    张旭, 陈慈发, 董方敏
    计算机工程. 2024, 50(12): 318-328. https://doi.org/10.19678/j.issn.1000-3428.0068588
    摘要 (462) PDF全文 (494) HTML (22)   可视化   收藏

    在PCB缺陷检测领域中检测精度的提高一直是1个具有挑战性的任务。为了解决这个问题, 提出一系列基于PCB缺陷检测的改进方法。首先, 引入一种新的注意力机制, 即BiFormer注意力机制, 这种机制利用双层路由实现动态的稀疏注意力, 从而减少计算量; 其次, 采用一种创新的上采样算子CARAFE, 能够结合语义信息与内容信息进行上采样, 使得上采样过程更加全面且高效; 最后, 基于MPDIoU度量采用一种新的损失函数, 即LMPDIoU损失函数, 能够有效地处理不平衡类别、小目标和密集性问题, 从而进一步提高图像检测的性能。实验结果表明, 所提改进后的模型在平均精度均值(mAP)方面取得了显著提高, 达到了93.91%, 与原YOLOv5模型相比提高了13.12个百分点, 同时, 在识别精度方面, 所提改进后的模型表现也非常出色, 达到了90.55%, 与原YOLOv5模型相比提高了8.74个百分点。引入BiFormer注意力机制、CARAFE上采样算子以及LMPDIoU损失函数, 对于提高PCB缺陷检测的精度和效率具有非常积极的作用, 为工业检测领域的研究提供了有价值的参考。

  • 人工智能与模式识别
    张国胜, 李彩虹, 张耀玉, 周瑞红, 梁振英
    计算机工程. 2025, 51(1): 88-97. https://doi.org/10.19678/j.issn.1000-3428.0068738
    摘要 (453) PDF全文 (1016) HTML (47)   可视化   收藏

    针对人工势场(APF)法在机器人局部路径规划中存在的局部极小值陷阱和路径冗余等问题, 提出一种基于模糊控制(FC)和虚拟目标点改进人工势场的FC-V-APF算法。首先设计虚拟目标点避障策略, 并加入障碍物跨越机制和目标点更新阈值, 构建V-APF算法引导机器人摆脱陷阱区域; 其次提出基于累计转角和的控制策略, 帮助机器人走出多U型复杂陷阱; 然后针对路径冗余问题, 将V-APF算法与模糊控制算法相结合, 提出FC-V-APF算法, 通过激光雷达传感器的实时数据和权重函数对当前环境进行评估, 选取模糊控制器输出辅助力, 提前规避障碍物。最后在机器人操作系统(ROS)平台上搭建仿真环境对FC-V-APF算法进行路径规划性能的对比实验, 并对路径长度、运行时间和速度曲线等进行比较。实验结果表明, 所设计的FC-V-APF算法能够快速摆脱陷阱, 减少冗余路径, 提高路径平滑度并减少规划时间。

  • 热点与综述
    孙仁科, 许靖昊, 皇甫志宇, 李仲年, 许新征
    计算机工程. 2024, 50(10): 1-15. https://doi.org/10.19678/j.issn.1000-3428.0070036
    摘要 (428) PDF全文 (863) HTML (28)   可视化   收藏

    近年来随着人工智能(AI)技术在计算机视觉与自然语言处理等单模态领域表现出愈发优异的性能, 多模态学习的重要性和必要性逐渐展现出来, 其中基于视觉-语言预训练模型的零样本迁移(ZST)方法得到了国内外研究者的广泛关注。得益于预训练模型强大的泛化性能, 使用视觉-语言预训练模型不仅能提高零样本识别任务的准确率, 而且能够解决部分传统方法无法解决的零样本下游任务问题。对基于视觉-语言预训练模型的ZST方法进行概述, 首先介绍了零样本学习(FSL)的传统方法, 并对其主要形式加以总结; 然后阐述了基于视觉-语言预训练模型的ZST和FSL的区别及其可以解决的新任务; 其次介绍了基于视觉-语言预训练模型的ZST方法在样本识别、目标检测、语义分割、跨模态生成等下游任务中的应用情况; 最后对现有的基于视觉-语言预训练模型的ZST方法存在的问题进行分析并对未来的研究方向进行展望。

  • 开发研究与工程应用
    谢竞, 邓月明, 王润民
    计算机工程. 2024, 50(11): 338-349. https://doi.org/10.19678/j.issn.1000-3428.0068742
    摘要 (416) PDF全文 (1054) HTML (29)   可视化   收藏

    针对当前主流的交通标志目标检测算法在复杂环境中对小目标检测精度低、存在误检和漏检的问题, 提出一种改进的基于YOLOv8s的交通标志检测算法。该算法在主干网络中使用Pconv卷积并设计C2faster模块, 以实现轻量化网络结构同时维持网络精度。为更好地利用底层和高层特征之间的信息, 并增强区域上下文关联能力, 根据SPPF的思想设计SPPFCSPC模块作为空间金字塔池化模块。通过添加GAM注意力机制进一步增强网络的特征提取能力, 有效提高检测精度。为改善对微小目标的检测能力, 在网络颈部添加四倍下采样分支, 优化目标定位。此外, 使用Focal-EIoU损失函数替换原CIoU损失函数, 对预测框的宽高比进行准确定义, 缓解正负样本不平衡的问题。实验结果表明, 在CCTSDB-2021交通标志数据集上, 改进算法的精确率、召回率和mAP@0.5分别达到86.1%、73.0%和81.2%, 相比原始的YOLOv8s算法分别提高了0.8%、6.3%和6.9%。此外, 该算法在复杂天气和恶劣环境下的误检和漏检问题得到明显改善, 综合检测性能明显优于对比算法, 具有较大的实用价值。

  • 智能态势感知与计算
    郭尚伟, 刘树峰, 李子铭, 欧阳德强, 王宁, 向涛
    计算机工程. 2024, 50(11): 1-9. https://doi.org/10.19678/j.issn.1000-3428.0069758
    摘要 (405) PDF全文 (592) HTML (52)   可视化   收藏

    伴随着网络技术的飞速发展, 网络安全面临的风险也日益增加, 网络攻击呈现复杂化、多样化的特征, 给现有网络攻击应对措施带来了巨大挑战。态势感知技术作为一种新兴概念, 为网络安全领域带来了新的思路。针对现有网络安全态势感知方法存在数据特征提取及较长时间序列数据处理能力不足的问题, 提出一种融合堆栈稀疏自编码器(SSAE)、卷积神经网络(CNN)、双向门控循环单元(BiGRU)和注意力机制(AM)的模型。通过SSAE和CNN提取数据特征, 利用AM强化BiGRU对关键信息的关注度, 实现对异常流量的攻击类别判定, 并结合网络安全态势量化指标, 对网络安全态势进行量化评分并划分等级。实验结果表明, 融合模型在各项指标上均优于传统深度学习模型, 能够准确感知网络态势。

  • 热点与综述
    马恒志, 钱育蓉, 冷洪勇, 吴海鹏, 陶文彬, 张依杨
    计算机工程. 2025, 51(2): 18-34. https://doi.org/10.19678/j.issn.1000-3428.0068386
    摘要 (400) PDF全文 (385) HTML (25)   可视化   收藏

    随着大数据和人工智能技术的不断发展, 知识图谱应用越来越广泛, 知识图谱嵌入技术也得到了飞速发展。知识图谱嵌入通过在低维矢量空间中实现结构化知识表示来提高知识表示和推理效率。对知识图谱嵌入技术进行全面概述, 包括其基本概念、模型类别、评价指标以及应用前景。首先介绍了知识图谱嵌入的基本概念及背景, 将知识图谱嵌入分为基于翻译机制的嵌入模型、基于语义匹配机制的嵌入模型、基于神经网络的嵌入模型和基于附加信息的嵌入模型4个主要类别, 并对相关模型的核心思想、评分函数、优缺点、应用场景进行细致梳理; 然后总结了知识图谱嵌入的常见数据集和评价指标, 以及链接预测和三元组分类等相关应用与实验结果, 同时介绍了问答系统、推荐系统等下游任务; 最后对知识图谱嵌入技术进行回顾总结, 概述了当前知识图谱嵌入技术存在的局限性和主要问题, 探讨了未来知识图谱嵌入领域存在的机遇和挑战以及具有潜力的研究方向, 并对研究前景进行展望。

  • 人工智能与模式识别
    黄昆, 齐肇建, 王娟敏, 胡倩, 胡伟超, 皮建勇
    计算机工程. 2025, 51(5): 133-142. https://doi.org/10.19678/j.issn.1000-3428.0069026
    摘要 (376) PDF全文 (289) HTML (31)   可视化   收藏

    密集行人检测是公共智能监控的关键技术, 其采用目标检测方法对视频中的行人位置和数量进行检测, 进而实现对视频中人群的智能监控。在人员密集场景下因遮挡和行人的目标太小造成漏检。为此, 提出一种改进YOLOv8检测模型Crowd-YOLOv8。首先, 在主干网络使用nostride-Conv-SPD模块, 增强对图像小目标特征等细粒度信息的提取能力; 其次, 在YOLOv8网络的颈部引入小目标检测头和CARAFE上采样算子对各尺度特征进行融合, 以提高在小目标情况下的检测效果。实验结果表明, 所提模型在CrowdHuman数据集上mAP@0.5和mAP@0.5∶0.95分别取得了84.3%和58.2%的检测效果, 与原YOLOv8n相比分别提高了3.7和5.2百分点; 在WiderPerson数据集上取得了88.4%和67.4%, 与原YOLOv8n相比提高了1.1和1.5百分点。

  • 人工智能与模式识别
    周翰祺, 方东旭, 张宁波, 孙文生
    计算机工程. 2025, 51(4): 57-65. https://doi.org/10.19678/j.issn.1000-3428.0069100
    摘要 (376) PDF全文 (665) HTML (61)   可视化   收藏

    无人机(UAV)多目标跟踪技术在交通运营、安全监测、水域巡检等领域受到广泛关注。然而, 目前已有的多目标跟踪算法多用于单无人机多目标跟踪, 而单无人机的视角通常具有一定的局限性, 当目标被遮挡时目标发生ID切换会导致跟踪失败。为了解决该问题, 提出一种多无人机多目标跟踪(MUMTTrack)算法。采用基于检测的跟踪(TBD)范式, 利用多架无人机同时跟踪目标, 弥补单无人机视角的局限性。为了有效融合多架无人机的跟踪结果, 为MUMTTrack设计一种基于加速鲁棒特征(SURF)算法的图像匹配策略和ID分配策略。将MUMTTrack算法的性能与当前主流的单无人机多目标跟踪算法在MDMT数据集上进行实验比较。实验结果表明, MUMTTrack算法在识别F1(IDF1)值和多目标跟踪精度(MOTA)这两个多目标跟踪性能指标上均表现出明显的优势。

  • 热点与综述
    次天钊, 杨昊, 周游, 谢长生, 吴非
    计算机工程. 2025, 51(3): 1-23. https://doi.org/10.19678/j.issn.1000-3428.0068673
    摘要 (359) PDF全文 (766) HTML (48)   可视化   收藏

    智能手机已成为人们日常生活中不可或缺的一部分。安卓系统以其开源、生态完备等优点成为目前市场份额占比最大的移动操作系统。在安卓手机中, 存储子系统是关键的组成部分, 对用户体验有重要影响。不同于服务器场景, 安卓手机存储系统的设计需要考虑诸多独特因素, 如资源受限、成本敏感、前台应用优先等, 学术界对此已经展开大量研究。针对该方向研究现状进行总结分析, 首先将安卓手机存储系统用户体验保障面临的问题凝练为主机端写放大、内存交换、文件系统碎片化、闪存设备性能以及I/O优先级反转5类; 然后围绕如何解决这5类问题, 对现有工作进行分类介绍, 并总结常用的手机存储系统测试与分析工具; 最后对安卓手机存储系统用户体验保障技术的研究现状进行总结, 并讨论了未来潜在的研究方向。

  • 人工智能与模式识别
    陈浩, 陈珺, 刘飞
    计算机工程. 2025, 51(1): 60-70. https://doi.org/10.19678/j.issn.1000-3428.0068764
    摘要 (348) PDF全文 (334) HTML (27)   可视化   收藏

    移动机器人在路径规划过程中, 当面对未知且动态变化的环境时, 会存在与障碍物碰撞率高、易陷入局部最优等问题。针对这些问题, 提出一种基于双延迟深度确定性策略梯度(TD3)算法的改进算法TD3pro, 以提高移动机器人在未知动态环境下的路径规划性能。首先, 引入长短期记忆(LSTM)神经网络并与TD3算法相结合, 通过门结构筛选历史状态信息, 并感知探测范围内障碍物的状态变化, 帮助机器人更好地理解环境的动态变化和障碍物的移动模式, 使移动机器人能够准确预测和响应动态障碍物的行为, 从而降低与障碍物的碰撞率。其次, 加入OU (Ornstein-Uhlenbeck)探索噪声, 帮助移动机器人持续探索周围环境, 增强移动机器人的探索能力和随机性。在此基础上, 将单个经验池设置为成功、失败和临时3个经验池, 以此提高有效经验样本的采样效率, 进而减少训练时间。最后, 在2个不同的动、静态障碍物混合场景中进行路径规划实验仿真。实验结果表明: 场景1中该算法相较于深度确定性策略梯度(DDPG)算法以及TD3算法, 模型收敛的回合数减少了100~200个, 路径长度缩短了0.5~0.8, 规划时间减少了1~4 s; 场景2中该算法相较于TD3算法, 模型收敛的回合数减少了100~300个, 路径长度缩短了1~3, 规划时间减少了4~8 s, DDPG算法失败, 移动机器人无法成功抵达终点。由此可见, 改进的算法具有更好的路径规划性能。

  • 网络空间安全
    姚玉鹏, 魏立斐, 张蕾
    计算机工程. 2025, 51(6): 223-235. https://doi.org/10.19678/j.issn.1000-3428.0069133
    摘要 (340) PDF全文 (78) HTML (11)   可视化   收藏

    联邦学习实现了各参与方在不泄露原始数据的前提下联合建模,有效解决了分布式数据隐私的问题,但随着研究的深入,联邦学习还存在隐私推断攻击或恶意客户端投毒攻击等安全问题。现有联邦学习改进方案大多仅从隐私保护或抗投毒攻击方面进行改进,不能兼顾两种攻击。为了同时解决联邦学习中的推断攻击和投毒攻击,提出一个隐私保护的抗投毒攻击联邦学习(APFL)方案。设计一个模型检测算法,使用差分隐私(DP)技术,根据模型间余弦相似度赋予各客户端相应聚合权重,使用同态加密技术将本地模型加权聚合。在MNIST和CIFAR10数据集上的实验结果表明,APFL在保证数据隐私的同时能有效筛选恶意模型,抵御投毒攻击,当投毒比例不超过50%时,APFL模型性能与无投毒攻击环境下联邦平均(FedAvg)方案一致,模型测试错误率较Krum方案平均降低19%,较FLTrust方案平均降低9%。

  • 开发研究与工程应用
    李猛坤, 袁晨, 王琪, 赵冲, 陈景轩, 刘立峰
    计算机工程. 2025, 51(1): 287-294. https://doi.org/10.19678/j.issn.1000-3428.0068656
    摘要 (338) PDF全文 (451) HTML (21)   可视化   收藏

    目前目标检测技术日趋成熟, 但是针对在线听课行为的识别仍存在挑战。针对在线课堂人为监管力度不足、目标检测模型复杂度较高所导致的在线课堂行为识别不精准、模型计算量较高等问题, 提出一种基于改进的YOLOv8在线听课行为检测与识别方法。首先在YOLOv8n的基础上添加BiFPN双向特征金字塔网络来进行特征融合, 以增加特征提取的能力, 提高模型识别准确度; 其次在Head端采用C3Ghost模块替代C2f模块, 以大幅减少模型计算量。实验结果表明, 提出的YOLOv8n-BiFPN-C3Ghost模型在线上听课行为数据集上的mAP@0.5和mAP@0.5∶0.95指标分别为98.6%和92.6%, 相比其他课堂行为识别模型在精度上最高提升了4.2%和5.7%, 计算量为6.6 GFLOPS, 比原模型降低了19.5%。YOLOv8n-BiFPN-C3Ghost模型能以更低的运算成本精确地实现在线听课行为的检测和识别, 可以实现对学生在线课堂学习情况的动态、科学识别。

  • 人工智能与模式识别
    匡鑫, 阳波, 马华, 唐文胜, 肖宏峰, 陈灵
    计算机工程. 2024, 50(10): 119-136. https://doi.org/10.19678/j.issn.1000-3428.0068502
    摘要 (337) PDF全文 (377) HTML (10)   可视化   收藏

    针对蜣螂优化算法(DBO)搜索精度较差、全局搜索能力不足、容易陷入局部最优等问题, 提出一种多策略改进的蜣螂优化算法。选用混沌反向学习策略初始化蜣螂种群, 使得蜣螂个体在解空间内分布均匀, 提升种群多样性; 引入带非线性权重的黄金正弦策略改进滚球行为, 协调算法的全局搜索与局部挖掘能力; 借鉴麻雀搜索算法的加入者位置更新策略改进觅食行为, 促使种群向最优位置靠近, 提高算法收敛速度与收敛精度; 以分段函数形式改进偷窃行为, 利于种群在迭代前期对全局充分探索, 避免算法过早收敛; 采用非线性权重的柯西-高斯变异策略对当前最优位置进行随机扰动, 引导算法跳出局部最优位置。将所提算法与5种优化算法在23个基准函数、12个CEC2022测试函数及2个工程优化问题上进行实验对比, 结果表明, 所提算法至少在21个基准函数、10个CEC2022测试函数及2个工程优化问题上的性能指标优于其他算法, 且排名第1, 相比于原始蜣螂优化算法, 在收敛精度、收敛速度、全局搜索能力以及稳定性上都有较大提升。

  • 人工智能与模式识别
    宋英华, 徐亚安, 张远进
    计算机工程. 2025, 51(1): 51-59. https://doi.org/10.19678/j.issn.1000-3428.0068372
    摘要 (333) PDF全文 (392) HTML (9)   可视化   收藏

    空气污染是城市环境治理的主要问题之一, 而PM2.5是影响空气质量的重要因素。针对传统时间序列预测模型对PM2.5浓度预测缺少季节性因素分析, 预测精度不够高的问题, 提出一种基于机器学习的季节性差分自回归滑动平均-支持向量机(SARIMA-SVM)融合模型。该融合模型为串联型融合模型, 将数据拆分为线性部分与非线性部分。SARIMA模型在差分自回归滑动平均(ARIMA)模型的基础上增加了季节性因素提取参数, 能有效分析PM2.5浓度数据的季节性规律变化趋势, 较好地预测数据未来的线性变化趋势。结合SVM模型对预测数据的残差序列进行优化, 利用滑动步长预测法确定残差序列的最优预测步长, 通过网格搜索确定最优模型参数, 实现对PM2.5浓度数据的长期预测, 同时提高整体预测精度。通过对武汉市近5年的PM2.5浓度监测数据进行分析, 结果表明该融合模型的预测准确率相较于单一模型有很大提升, 在相同的实验环境下比单一的ARIMA、Auto ARIMA、SARIMA模型分别提升了99%、99%、98%, 稳定性也更好, 为PM2.5浓度预测研究提供了新的思路。

  • 开发研究与工程应用
    张博强, 陈新明, 冯天培, 吴兰, 刘宁宁, 孙朋
    计算机工程. 2025, 51(4): 373-382. https://doi.org/10.19678/j.issn.1000-3428.0068338
    摘要 (328) PDF全文 (288) HTML (7)   可视化   收藏

    在限定场景内, 无人转运车辆在路径规划过程中不能与周围障碍物保持安全距离, 导致发生车辆与障碍物发生剐蹭的问题, 提出基于混合A*算法和修正RS曲线融合的路径规划。首先, 将提出的基于KD-Tree算法的距离代价函数加入到混合A*算法的代价函数中。其次, 改变混合A*算法的扩展策略, 根据车辆周围环境动态改变节点扩展距离, 实现节点的动态扩展, 提高算法的节点搜索效率。最后, 改进混合A*算法的RS曲线生成机制, 使生成的RS曲线直线部分与周围障碍物边界保持平行, 从而符合厂区内道路行驶要求, 通过对局部路径进行平滑处理, 在保证路径符合车辆运动学约束的条件下满足路径曲率变化的连续性, 从而提高生成路径的质量。实验结果表明, 与传统算法相比, 提出算法的搜索时间缩短了38.06%, 最大曲率减少了25.2%, 路径到障碍物的最近距离增加了51.3%, 有效提高了混合A*算法生成路径的质量, 并能较好地在限定场景中运行。

  • 图形图像处理
    王非凡, 陈希爱, 任卫红, 管宇, 韩志, 唐延东
    计算机工程. 2024, 50(10): 352-361. https://doi.org/10.19678/j.issn.1000-3428.0068407
    摘要 (325) PDF全文 (417) HTML (12)   可视化   收藏

    在低光环境下的检测任务中, 由于低亮度、低对比度以及噪声等不利因素影响, 会存在对目标的漏检、错检等现象。针对此问题, 提出基于图像自适应增强的低照度目标检测算法。将传统图像处理方法与深度学习相结合, 设计图像自适应增强网络, 使用多个可调滤波器通过级联的方式进行结合, 对输入的低光图像进行逐步增强, 各滤波器的调节参数由卷积神经网络根据输入图像的全局信息进行预测。将图像自适应增强网络与YOLOv5目标检测网络相结合进行端到端的联合训练, 使图像增强效果更有利于目标检测。由于在低光目标检测过程中易出现漏检现象, 对通道注意力机制SE-Net进行改进, 设计特征增强网络, 并嵌入到YOLOv5网络中Neck部分的末端, 以减少网络特征融合过程中造成潜在目标特征的信息损失。实验结果表明, 所提算法在真实低光数据集ExDark上的检测精度达到了77.3%, 相较于原始YOLOv5目标检测网络提高了2.1个百分点, 检测速度达到79帧/s, 能够实现实时检测的效果。

  • 图形图像处理
    赵宏, 宋馥荣, 李文改
    计算机工程. 2025, 51(2): 300-311. https://doi.org/10.19678/j.issn.1000-3428.0068481
    摘要 (325) PDF全文 (373) HTML (15)   可视化   收藏

    对抗样本是评估深度神经网络(DNN)鲁棒性和揭示其潜在安全隐患的重要手段。基于生成对抗网络(GAN)的对抗样本生成方法(AdvGAN)在生成图像对抗样本方面取得显著进展, 但该方法生成的扰动稀疏性不足且幅度较大, 导致对抗样本的真实性较低。为解决这一问题, 基于AdvGAN提出一种改进的图像对抗样本生成方法(SE-AdvGAN)。SE-AdvGAN通过构造SE注意力生成器和SE残差判别器来提高扰动的稀疏性。SE注意力生成器用于提取图像关键特征, 限制扰动生成位置, SE残差判别器指导生成器避免生成无关扰动。同时, 在SE注意力生成器的损失函数中加入以l2范数为基准的边界损失以限制扰动的幅度, 从而提高对抗样本的真实性。实验结果表明, 在白盒攻击场景下, SE-AdvGAN相较于现有方法生成的对抗样本扰动稀疏性更高、幅度更小, 并且在不同目标模型上均取得了更好的攻击效果, 说明SE-AdvGAN生成的高质量对抗样本可以更有效地评估DNN模型的鲁棒性。

  • 图形图像处理
    陈子民, 关志涛
    计算机工程. 2024, 50(12): 296-305. https://doi.org/10.19678/j.issn.1000-3428.0068512
    摘要 (320) PDF全文 (357) HTML (17)   可视化   收藏

    深度学习模型在图像分类等领域取得了较好的结果, 但是深度学习模型容易受到对抗样本的干扰威胁, 攻击者通过对抗样本制作算法, 精心设计微小扰动, 构造肉眼难以分辨却能引发模型误分类的对抗样本, 给图像分类等深度学习应用带来严重的安全隐患。为提升图像分类模型的鲁棒性, 利用条件扩散模型, 提出一种综合对抗样本检测和对抗样本净化的对抗样本防御方法。在不修改目标模型的基础上, 检测并净化对抗样本, 提升目标模型鲁棒性。所提方法包括对抗样本检测和对抗样本净化2个模块。对于对抗样本检测, 采用不一致性增强, 通过训练一个融入目标模型高维特征和图片基本特征的图像修复模型, 比较初始输入和修复结果的不一致性, 检测对抗样本; 对于对抗样本净化, 采用端到端的对抗样本净化方式, 在去噪模型执行过程中加入图片伪影, 实现对抗样本净化。在保证目标模型精度的前提下, 在目标模型前增加对抗样本检测和净化模块, 根据检测结果, 选取相应的净化策略, 从而消除对抗样本, 提升目标模型的鲁棒性。在CIFAR10数据集和CIFAR100数据集上与5种现有方法进行对比实验, 实验结果表明: 对于扰动较小的对抗样本, 所提方法的检测精度较Argos方法提升了5~9个百分点; 相比于ADP方法, 所提方法在面对不同种类对抗样本时防御效果更稳定, 且在BPDA攻击下, 其对抗样本净化效果较ADP方法提升了1.3个百分点。

  • 图形图像处理
    胡涌涛, 黄洪琼
    计算机工程. 2025, 51(1): 225-234. https://doi.org/10.19678/j.issn.1000-3428.0068392
    摘要 (311) PDF全文 (88) HTML (5)   可视化   收藏

    换装行人重识别(CC Re-ID)是行人重识别中的一个新兴研究课题, 旨在找出被换衣的行人。当前方法主要集中在使用多模态数据辅助解耦表征学习, 如通过脸、步态、身体轮廓等辅助数据解耦行人自身属性以减少服装影响, 但这些方法泛化能力较差, 需要大量额外工作。此外, 仅使用原始数据的方法对于相关信息的提取不够充分, 性能较弱。针对CC Re-ID存在的上述问题, 提出一种结合特征融合和通道注意力的多分支换装行人重识别方法(MBFC)。通过在主干网络中融入通道注意力机制, 在特征通道层面学习关键信息, 设计局部与全局特征融合方法以提高网络对行人细粒度特征的提取能力。此外, MBFC模型采用多分支结构, 使用服装对抗损失、交叉熵标签平滑损失等多种损失函数引导模型学习与服装无关的信息, 减少服装对模型的影响, 从而提取到更有效的行人信息。在PRCC和VC-Clothes数据集上进行广泛实验, 结果表明, 所提模型在RANK-1和平均精度均值(mAP)指标上优于对比的CC Re-ID方法。

  • 热点与综述
    张锦, 陈铸, 陈照云, 时洋, 陈冠军
    计算机工程. 2025, 51(7): 1-11. https://doi.org/10.19678/j.issn.1000-3428.0068870
    摘要 (307) PDF全文 (648) HTML (21)   可视化   收藏

    在众多科学领域的研究与开发中,模拟器都扮演着不可替代的角色。在体系结构领域尤其如此,模拟器提供了一个安全、成本低廉的虚拟环境,使研究人员能够快速开展实验分析和评测。同时,模拟器还可以加速芯片设计和验证的过程,从而节省时间和资源成本。然而,随着处理器体系结构的演化进步,尤其是专用处理器发展呈现多元化特点,为了能够对体系结构设计探索提供重要的反馈,模拟器的重要作用日益凸显。综述了体系结构模拟器目前的发展与应用现状,重点介绍了几种目前较为典型的体系结构模拟器。通过对专用于不同处理器的模拟器技术手段的分析,深入了解不同架构下模拟器的侧重点及技术难点。此外,还对体系结构模拟器未来发展的关键点进行了思考与评述,以展望其在处理器设计研究领域的前景。

  • 开发研究与工程应用
    汤静雯, 赖惠成, 王同官
    计算机工程. 2025, 51(4): 303-313. https://doi.org/10.19678/j.issn.1000-3428.0068897
    摘要 (300) PDF全文 (196) HTML (16)   可视化   收藏

    智慧社区场景下的行人检测需要精准识别行人以应对各类情况的发生, 然而面对遮挡和远距离行人的情景, 现有检测器会出现漏检、误检以及模型过大不易部署的问题。针对以上问题, 提出基于YOLOv8的行人检测算法ME-YOLO。设计一种高效特征提取模块(EM), 使得网络更好地学习行人特征和捕捉行人特点, 在减少网络参数量的同时提高检测精度。设计一个重构的检测头模块, 重新整合后的检测层增强了网络对小目标的识别能力, 有效检测小目标行人。引入双向特征金字塔网络来设计新的颈部网络, 即双向扩张残差-特征金字塔网络(BDR-FPN), 利用扩张残差模块和附权注意力机制来扩展感受野及有所侧重地学习行人特征, 缓解网络对遮挡行人不敏感问题。实验结果表明, 在CityPersons数据集上进行训练和验证, 相比原算法YOLOv8, ME-YOLO算法的AP50提高了5.6百分点, 模型参数量减少了41%, 模型大小压缩了40%, 在TinyPerson数据集上验证算法的有效性和泛化性, AP50提高了4.1百分点, AP50∶95提高了1.7百分点。该算法在大幅度减少模型参数和大小的同时, 有效提高了检测精度, 在智慧社区场景中有较好的应用价值。

  • 图形图像处理
    火久元, 苏泓瑞, 武泽宇, 王婷娟
    计算机工程. 2025, 51(1): 246-257. https://doi.org/10.19678/j.issn.1000-3428.0069825
    摘要 (293) PDF全文 (240) HTML (14)   可视化   收藏

    针对交通道路中小目标车辆存在的识别困难、检测精度低以及误检和漏检等问题, 提出一种基于YOLOv8算法的大内核、多尺度梯度组合的道路交通小目标车辆检测模型RGGE-YOLOv8。首先, 使用RepLayer模型替换YOLOv8网络的主干部分, 引入大内核深度可分离卷积结构, 拓展上下文信息, 以增强模型对小目标的信息捕获能力; 其次, 使用GIoU代替原损失函数, 解决IoU在预测框与真实框没有重叠时存在的无法优化问题; 然后, 引入全局注意力机制(GAM), 通过减少信息丢失并增强全局交互信息来提高网络的特征表达能力; 最后, 引入CSPNet并重参化梯度组合特征金字塔, 使得模型具有较大感受野和高形状偏差。实验结果表明, RGGE-YOLOv8在Visdrone数据集和自有数据集上mAP@0.5指标分别达到34.8%和94.7%, 相较于原始YOLOv8n算法精度分别提高了2.2和5.51百分点, 证明了RGGE-YOLOv8模型对道路小目标车辆检测的有效性。

  • 人工智能与模式识别
    高锐涛, 林达伟, 郭亮, 金鸿, 王红
    计算机工程. 2024, 50(12): 133-141. https://doi.org/10.19678/j.issn.1000-3428.0068464
    摘要 (286) PDF全文 (231) HTML (19)   可视化   收藏

    随着农业信息技术的发展, 在互联网中积累了大量与水稻种植相关的数据。为解决农民在种植过程中难以快速获取准确答案的问题, 从水稻种植领域出发, 构建了基于知识图谱的智能问答系统。通过手工收集与爬虫技术获取相关数据, 通过构建命名实体识别模型和意图识别模型等自然语言处理技术并结合前后端技术, 最终实现了水稻种植领域智能问答系统的开发。实验结果表明, 在命名实体识别与意图识别模块中, 所构建模型的F1值分别达到89.17%和96.54%, 均高于其他常见模型。基于知识图谱的水稻种植智能问答系统能够准确回答农民在种植水稻过程中遇到的大部分问题, 实现了对水稻种植知识图谱数据的管理和可视化展示。

  • 热点与综述
    庞鑫, 葛凤培, 李艳玲
    计算机工程. 2025, 51(6): 1-19. https://doi.org/10.19678/j.issn.1000-3428.0069005
    摘要 (284) PDF全文 (224) HTML (28)   可视化   收藏

    声学场景分类(ASC)旨在让计算机模拟人类听觉识别不同的声学环境,是计算机听觉领域中具有挑战性的任务之一。随着智能音频处理技术以及神经网络学习算法的快速进步,近年来ASC任务也涌现出一系列新算法和新技术。为了全面展示该领域的技术发展脉络和演进过程,梳理了该领域的早期工作和近期发展,全面介绍了ASC任务。首先描述了ASC的应用场景和面临的挑战;其次详细介绍了ASC的主流框架,重点阐述了应用于此领域的深度学习算法;然后系统性地总结了ASC的前沿探索与延伸任务以及公开数据集;最后对ASC的发展趋势进行探讨与展望。

  • 开发研究与工程应用
    周思瑜, 徐慧英, 朱信忠, 黄晓, 盛轲, 曹雨淇, 陈晨
    计算机工程. 2025, 51(5): 326-339. https://doi.org/10.19678/j.issn.1000-3428.0069259
    摘要 (266) PDF全文 (117) HTML (12)   可视化   收藏

    手机屏幕作为人机交互的主窗口, 已成为影响用户体验和终端整体性能的重要因素。因此, 市场对解决手机屏幕瑕疵的需求日益增长。为满足这一需求, 针对在手机屏幕瑕疵检测过程中存在检测精度低、小目标瑕疵漏检率高与检测速度慢的情况, 提出一种以YOLOv8n作为基准模型的PGS-YOLO算法。PGS-YOLO通过增加一个专门的微小目标检测头, 并结合SeaAttention注意力模块, 有效提升对小目标的探测能力; 将骨干网络和特征融合网络分别融入PConv与GhostNetV2轻量化模块, 在保证精度的同时降低模型的参数量, 提高瑕疵检测的速度与效率。实验结果表明, 在北京大学手机屏幕表面瑕疵数据集中, 相较于YOLOv8n, PGS-YOLO算法的mAP@0.5提升了2.5百分点, mAP@0.5∶0.95提升了2.2百分点, 在手机屏幕瑕疵检测过程中不仅能对大片的瑕疵做到精准检测, 还能对小瑕疵保持一定的准确度。此外, 检测性能优于YOLOv5n、YOLOv8s等大部分YOLO系列算法。同时, 参数量仅为2.0×106, 小于YOLOv8n, 满足工业场景对手机屏幕瑕疵检测的需求。

  • 人工智能与模式识别
    付立东, 艾肖同, 豆增发
    计算机工程. 2024, 50(12): 142-150. https://doi.org/10.19678/j.issn.1000-3428.0069040
    摘要 (265) PDF全文 (99) HTML (8)   可视化   收藏

    关键节点识别已经成为复杂网络领域的一个重要研究范畴, 但目前关键节点识别方法存在时间复杂度较高、得到的关键节点集不够准确以及节点中心性指标考虑不够充分等问题。基于此, 提出一种基于层级划分和节点特征的关键节点识别框架, 在该框架内, 为避免选取节点初始覆盖集时效率低下的问题, 提出一种基于层级划分的关键节点初始覆盖集选取方法, 该方法可在线性时间内计算出初始节点覆盖集, 随后通过节点中心性指标向原网络中回添节点, 直到解集中的节点数满足预定义阈值数。为解决回添节点过程中易陷于局部最优解的问题, 综合考虑网络拓扑结构和节点的多种属性, 提出一种节点综合特征的中心性指标。对比5种初始覆盖集选取算法以及5个中心性指标, 在真实网络上进行方法的应用和分析, 结果表明, 所提基于层级划分和节点特征的方法能够在不同类型的网络中更准确有效地识别关键节点, 且该方法的鲁棒性更好, 性能也优于其他方法。

  • 人工智能与模式识别
    戴康佳, 徐慧英, 朱信忠, 李悉钰, 黄晓, 陈国强, 张志雄
    计算机工程. 2025, 51(3): 95-104. https://doi.org/10.19678/j.issn.1000-3428.0068950
    摘要 (263) PDF全文 (272) HTML (23)   可视化   收藏

    传统的视觉同步定位与建图(SLAM)系统是基于静态环境这一假设的, 然而在现实场景中往往存在动态物体, 这可能导致SLAM位姿估计和地图构建的精度下降、鲁棒性变差, 甚至出现跟踪丢失的情况。针对上述问题, 基于ORB-SLAM2提出新的语义SLAM系统(YGL-SLAM)。该系统首先使用轻量级目标检测算法YOLOv8n追踪动态对象, 获得动态对象的语义信息。然后在跟踪线程的同时提取点特征和线特征, 根据获取的语义信息利用Z-score和对极几何算法剔除动态特征, 以改进SLAM在动态场景中的表现。此外, 鉴于轻量级目标检测算法在追踪动态对象时存在连续帧的漏检测问题, 设计了基于相邻帧的检测补偿方法。在公开数据集TUM和Bonn上的测试结果表明, 相比ORB-SLAM2, YGL-SLAM系统准确率提升超过90%, 对比其他动态SLAM, YGL-SLAM也具有较高的准确度和鲁棒性。

  • 热点与综述
    顾宇衡, 潘嘉诚, 钱江波, 董一鸿
    计算机工程. 2024, 50(10): 35-50. https://doi.org/10.19678/j.issn.1000-3428.0068719
    摘要 (263) PDF全文 (417) HTML (11)   可视化   收藏

    阿尔茨海默病(AD)是一种不可逆的神经退行性疾病, 会导致认知能力的逐渐下降。AD症状的演变过程可能很长, 在不同的神经成像模式中可检测到脑区生物标志物的细微变化, 但其早期检测具有挑战性。由于神经成像数据的高度复杂性和大脑网络的不规则性, 传统的机器学习和深度神经网络模型存在许多不足, 开发基于图神经网络(GNN)的计算机辅助诊断(CAD)模型可以为分析非欧几里得空间的神经影像模式以及探究生物标志物提供极大帮助。首先, 对基于GNN分类方法的AD预测进行详细的调研和概述。然后, 从基于单模态数据和基于多模态数据两个视角进行梳理, 重点介绍和分析这些方法在单模态和多模态数据应用场景中的数据提取、脑网络建模、特征学习、信息融合等过程, 并评述部分方法的性能。最后, 针对GNN应用于AD诊断的主要挑战和未来研究方向进行了展望, 为AD辅助诊断的进一步研究提供有益的建议。

  • 图形图像处理
    沙宇洋, 陆京涛, 杜浩凡, 翟小兵, 孟维宇, 廉旭, 罗刚, 李克峰
    计算机工程. 2025, 51(7): 314-325. https://doi.org/10.19678/j.issn.1000-3428.0068674
    摘要 (258) PDF全文 (187) HTML (9)   可视化   收藏

    图像分割是环境感知中的一项关键技术,被广泛应用于无人驾驶、虚拟现实等实际任务中。随着技术的不断发展,基于计算机视觉技术的导盲系统日趋成熟,并且在精度、稳定性等方面优于传统的解决方案。在视觉导盲系统中,道路图像的语义分割是非常重要的一部分,系统通过分析算法的输出结果可以获取目前所处的环境状态,从而指导用户躲避前方障碍物,获取最优的移动路径。视觉导盲系统的使用环境复杂,对模型的运行效率和分割精度具有极高的要求。然而,常用的高精度语义分割算法参数量大、运行速度慢,因此无法直接应用于导盲系统。针对这一问题,提出了一种基于多尺度特征的轻量化道路图像分割算法。模型含有两个特征提取分支,即Detail Branch和Semantic Branch,其中Detail Branch用来提取图像的低层细节信息,Semantic Branch用来提取图像的高层语义信息,并且两个分支中的多尺度特征也会被所设计的特征映射模块处理和使用,进而提升模型对于特征的建模能力。此外,设计了一种简单且高效的特征融合模块,通过融合不同尺度的特征,增强模型对于上下文信息的编码能力。采集和标注了适用于导盲场景的大量道路分割数据,并制作成了相应的数据集。基于该数据集对所提出的算法进行训练和测试,实验结果显示: 所提出的道路分割算法的平均交并比(mIoU)为96.5%,优于现有的图像分割模型;以1 024×1 024像素的图像作为输入,所提算法的轻量化版本在NVIDIA GTX 3090Ti平台的运行速度为201帧/s,优于现有轻量化图像分割模型;将模型部署到NVIDIA AGX Xavier设备中,其在实际场景中的测试速度为53帧/s,满足实际需求。

  • 开发研究与工程应用
    陈梓延, 王晓龙, 何迪, 安国成
    计算机工程. 2025, 51(5): 314-325. https://doi.org/10.19678/j.issn.1000-3428.0069122
    摘要 (257) PDF全文 (110) HTML (16)   可视化   收藏

    现有的高精度车辆检测模型参数与计算量过高, 无法在交通智能设备上良好运行, 而轻量化的车辆检测模型精度普遍较低, 不适用于实际任务。为此, 提出一种改进YOLOv8的轻量化车辆检测网络, 将主干网络替换为计算量和内存访问更小的FasterNet网络, 并且将颈部的双向特征金字塔网络替换为加权双向特征金字塔网络(BiFPN), 简化特征融合过程。同时, 引入一种融合注意力机制的动态检测头, 实现检测头和注意力的无冗余结合; 此外, 针对完全交并比(CIoU)在检测精度和收敛速度上的缺陷, 提出一种尺度不变交并比(SIoU)结合归一化高斯Wasserstein距离(NWD)的回归损失算法。最后, 为尽量减小模型对边缘设备的算力需求, 进行基于幅值的层自适应稀疏化剪枝, 进一步压缩模型大小。实验结果表明, 提出的改进模型相较于原模型YOLOv8s, 在精度上升1.5百分点的情况下, 参数量降低78.9%, 计算量下降67.4%, 模型尺寸降低77.8%, 达到了比较优秀的轻量化效果, 具有很强的实用性。

  • 开发研究与工程应用
    史昕, 曹凤腾, 纪艺, 马峻岩
    计算机工程. 2024, 50(12): 346-357. https://doi.org/10.19678/j.issn.1000-3428.0068659
    摘要 (247) PDF全文 (69) HTML (4)   可视化   收藏

    交通流预测在规划交通系统、优化道路资源和缓解交通拥堵等方面具有重要意义。针对交通流预测中时间周期性特征提取不充分的问题, 提出一种基于多尺度时空特征和软注意力机制的交通流预测方法MSTFSA。首先, 利用图交谈注意力网络(GTHAT)提取空间数据的非欧几里得结构特征, 通过分配动态权重表征不同时间相邻道路交通流的影响程度; 其次, 利用双向增强注意力门控循环单元(Bi-EAGRU)结构提取时间数据的连续性关联特征, 增强每个时刻的时间特征与上下时刻的联系; 然后, 基于软注意力机制融合周周期、日周期和近邻时间3个尺度下的相似交通流趋势, 实现对时间周期性特征的充分提取, 最后, 结合高速公路数据集PeMS04和PeMS08验证MSTFSA的预测精度。实验结果表明, MSTFSA的交通流预测精度表现出良好效果, 与基线模型STSGCN和ASTGCN相比, 在PeMS04数据集上的预测均方根误差(RMSE)分别降低7.15%和3.8%, 平均绝对误差(MAE)分别降低7.79%和3.99%。MSTFSA能较充分地提取并融合交通数据的多时间尺度时空特征, 在交通流预测精度提升方面表现出一定的优势。

  • 智能态势感知与计算
    毕千, 钱程, 张可, 王成
    计算机工程. 2024, 50(11): 10-17. https://doi.org/10.19678/j.issn.1000-3428.0069710
    摘要 (247) PDF全文 (440) HTML (33)   可视化   收藏

    在智能态势感知应用场景中, 多智能体角度跟踪问题常出现在需要对移动目标进行监测和控制的场景。与传统的目标跟踪方法不同, 角度跟踪任务不仅需要追踪目标的空间坐标, 还需确定目标间的相对角度。现有控制方法在处理这类规模较大且易受环境变化影响的问题时往往效果不稳定或性能降低。为此, 提出一种基于多智能体强化学习(MARL)的解决方案, 首先建立多智能体角度跟踪问题的基础模型, 然后设计1个多层次的仿真决策框架并提出针对此问题适应性更强的多智能体强化学习算法AR-MAPPO, 通过动态调整数据复用轮数以提升学习效率和模型稳定性。实验结果表明, 该方法在多智能体角度跟踪任务中相比传统方法和其他强化学习方法具有更高的收敛效率和更优的角度跟踪性能。

  • 图形图像处理
    刘圣杰, 何宁, 王鑫, 于海港, 韩文静
    计算机工程. 2025, 51(2): 278-288. https://doi.org/10.19678/j.issn.1000-3428.0068375
    摘要 (246) PDF全文 (300) HTML (12)   可视化   收藏

    人体姿态估计被广泛应用于运动健身、手势控制、无人超市、娱乐游戏等诸多领域, 但姿态估计任务仍面临着诸多挑战。针对目前主流的人体姿态估计网络参数量大、计算复杂度高的问题, 提出一种基于高分辨率网络的轻量级姿态估计网络(LitePose)。首先, 采用Ghost卷积降低特征提取网络的参数; 其次, 通过采用解耦的全连接(DFC)注意力模块, 更好地捕获远距离空间位置像素间的依赖关系, 减少由于参数量下降而导致的提取特征缺失, 提高人体关键点回归的准确率; 然后, 设计一个特征增强模块, 对骨干网络提取的特征进行进一步增强; 最后, 设计一个新的坐标解码方法, 降低热图解码过程中的误差, 提高关键点回归的准确率。在人体关键点检测数据集COCO和MPII上对LitePose进行验证, 并与当前的主流方法进行对比。实验结果表明, LitePose相比基线网络HRNet精度损失0.2%, 但参数量不及基线网络的1/3, LitePose在保证少量精度损失的同时能够大幅降低网络模型的参数量。

  • 李沂杨, 陆声链, 王继杰, 陈明
    录用日期: 2024-12-11
    目标检测领域中,卷积神经网络(CNN)长期占据主导地位,并以其准确性和可扩展性在学术界得到广泛认可。目标检测领域先后涌现出多个代表性模型,如R-CNN系列(包括FastRCNN、FasterRCNN等)和YOLO系列。随着Transformer在自然语言处理领域的成功,研究者开始探索将其用于计算机视觉,由此产生了如ViT和Swin-ViT等视觉骨干网络。2020年,Facebook团队为减少目标检测任务中的先验知识和后处理,推出了基于Transformer的 DETR,一种端到端目标检测算法。尽管DETR在目标检测领域展现出潜力,但也存在诸如收敛速度慢、准确性较差、目标查询的物理意义不明确等缺点。这促使诸多研究人员对该算法开展了进一步的研究和改进。本文旨在分析整理总结针对DETR的改进探索,并分析他们的优势与不足,同时对利用DETR开展的前沿研究和细分应用领域进行概括,最后给出DETR在计算机视觉领域的未来展望。
  • 图形图像处理
    杨雨迪, 葛海波, 辛世澳, 薛紫涵, 袁昊
    计算机工程. 2024, 50(11): 284-296. https://doi.org/10.19678/j.issn.1000-3428.0068647
    摘要 (244) PDF全文 (160) HTML (8)   可视化   收藏

    为了应对遥感图像目标检测中小目标像素低、背景复杂、硬件资源有限等问题, 提出一种融合超分辨率(SR)和特征增强的小目标检测模型。采用GhostNet网络中的Ghost卷积层替换YOLOv8网络中的传统卷积层Conv, 在不影响检测精度的情况下降低网络模型的参数量和计算量。在主干网络中, 构建超分辨率辅助增强(SRAE)模块提升图像的分辨率和特征提取能力。利用三层特征融合(TFF)模块, 获取主干网络较低层的空间特征, 改善快速空间金字塔池化(SPPF)层特征空间提取不足的问题, 提高小目标空间定位能力。设计自注意力信息转移(SAT)模块, 在保证模型轻量化的同时增强小目标的语义信息和全局信息。实验结果表明, 改进模型在DIOR数据集上实现了90.5%的mAP@0.5、15.1×106的参数量和30.3×109的每秒浮点运算次数(FLOPs), 相比于其他模型在实现网络轻量化的同时提升了小目标检测精度。

  • 图形图像处理
    胡倩, 皮建勇, 胡伟超, 黄昆, 王娟敏
    计算机工程. 2025, 51(3): 216-228. https://doi.org/10.19678/j.issn.1000-3428.0068753
    摘要 (243) PDF全文 (209) HTML (33)   可视化   收藏

    针对现有的行人检测方法对于密集行人或小目标行人检测精度低的问题, 提出一种基于YOLOv5的综合改进算法模型YOLOv5_Conv-SPD_DAFPN。首先, 针对小目标或密集行人的特征信息易丢失这一问题, 在骨干网络中引入Conv-SPD网络模块替代原有的跨步卷积, 有效缓解特征信息丢失的问题; 其次, 针对非相邻特征图不直接融合从而引起特征融合率较低的问题, 提出新的双层渐进金字塔网络(DAFPN), 提高行人检测的准确性和精度; 最后, 基于EIoU_Loss和CIoU_Loss引入EfficiCIoU_Loss定位损失函数, 以调整和提高帧回归率, 促进网络模型更快收敛。模型在CrowdHuman和WiderPerson行人数据集上相比于原YOLOv5模型, mAP@0.5、mAP@0.5∶0.95分别提升了3.9、5.3百分点和2.1、2.1百分点; 引入EfficiCIoU_Loss后, 模型收敛速度分别提升了11%、33%。这些改进使得基于YOLOv5的密集行人检测在特征信息保留、多尺度融合和损失函数优化等方面都取得了显著进展, 提高了其在实际应用中的性能和效率。

  • 图形图像处理
    阳丽莎, 李茂军, 胡建文, 王鼎湘
    计算机工程. 2025, 51(1): 208-215. https://doi.org/10.19678/j.issn.1000-3428.0068397
    摘要 (242) PDF全文 (102) HTML (10)   可视化   收藏

    针对带钢表面缺陷检测任务存在的小目标检测效率低、缺陷定位不准确、检测算法参数量大、难以部署在终端设备上等问题, 提出一种改进的YOLOv7-tiny检测算法。首先, 使用GSConv替换颈部网络中的标准卷积, 基于GSConv设计一种改进的高效聚合网络(ELAN-G), 保证带钢表面缺陷特征信息被充分融合同时降低算法的参数量; 其次, 在预测头和颈部网络之间增加针对低分辨率和小缺陷的SPDConv模块, 模块生成一个中间特征图, 通过对中间特征图中的小缺陷特征信息进行过滤学习得到最终特征图, 以此提高预测头对小缺陷的检测精度; 最后, 引入MPDIoU损失函数, 合理利用边界回归框的几何性质, 简化损失函数计算过程并提高缺陷定位精度。实验结果表明, 在NEU-DET数据集上, 改进算法比其他6种先进目标检测算法效果更好, 性能更均衡, 其平均精度均值(mAP)可达74.1%, 且参数量和计算量低于所有对比算法, 可应用于工业环境中的带钢表面缺陷检测系统。

  • 图形图像处理
    刘春霞, 孟吉星, 潘理虎, 龚大立
    计算机工程. 2025, 51(7): 326-338. https://doi.org/10.19678/j.issn.1000-3428.0069510
    摘要 (239) PDF全文 (78) HTML (8)   可视化   收藏

    针对现有的目标检测方法在处理背景复杂、有效信息量少的遥感图像时存在的误检、漏检等问题,提出了一种多模态遥感小目标检测方法——BFMYOLO。设计了像素级的红-绿-蓝(RGB)和红外(IR)图像的融合模块, 即多模态融合模块(BFM),充分利用不同模态的互补性,实现两种模态信息的有效融合;设计了全尺度自适应更新模块(AA),解决特征融合过程中的多目标信息冲突问题,通过结合CARAFE上采样算子并进一步融入浅层特征,在加强非相邻层间融合的同时增强小目标的空间信息;设计了改进的任务解耦检测头(IDHead),将分类和回归任务分开处理,以降低不同任务的相互干扰,融合深层语义特征,进一步提升模型的检测性能。采用归一化Wasserstein距离(NWD)损失函数作为定位回归损失函数,降低位置偏差的敏感性。实验结果表明,该方法在VEDAI、NWPU VHR-10和DIOR数据集上的阈值设定为0.5时的均值平均精度(mAP@0.5)分别达到78.6%、95.5%和73.3%,优于其他先进模型, 在遥感小目标检测中表现出良好的性能。

  • 热点与综述
    赵楷, 胡煜环, 闫俊桥, 毕雪华, 张琳琳
    计算机工程. 2025, 51(8): 1-15. https://doi.org/10.19678/j.issn.1000-3428.0069147
    摘要 (237) PDF全文 (113) HTML (10)   可视化   收藏

    区块链作为一种分布式可信数据库,在数字版权保护领域得到有效应用,引起学术界和工业界的广泛关注。传统数字版权保护技术存在侵权追踪难、版权交易复杂、合法权益保护不足等问题,严重制约数字版权保护研究的发展。区块链的防篡改、可追溯和去中心化等特性为解决数字版权侵权风险提供了可信、透明和安全的解决思路。首先介绍了区块链技术的基本原理;然后针对传统版权保护方案存在的问题,介绍了区块链结合传统版权保护技术的最新研究成果;接着评估了区块链在实际应用中的效果和潜力,强调其对版权保护体系的积极影响;最后探讨了区块链版权保护面临的挑战和未来发展趋势,以实现更加完善和可持续的区块链版权保护体系。

  • 热点与综述
    毛竞争, 胡潇锐, 徐庚辰, 吴国栋, 孙彦斌, 田志宏
    计算机工程. 2025, 51(2): 1-17. https://doi.org/10.19678/j.issn.1000-3428.0068374
    摘要 (235) PDF全文 (211) HTML (12)   可视化   收藏

    基于数字孪生(DT)的工业控制系统(ICS)在提升系统安全性、保障稳定运行及优化生产效率方面具有重要作用, 其在工控安全领域的应用主要涵盖两方面: 安全态势感知和工业网络靶场。基于DT的安全态势感知通过实时监测、异常检测、漏洞分析和威胁识别, 实现系统安全的可视化管理。基于DT的工业网络靶场作为策略验证平台, 支持工控系统的攻防模拟, 评估安全策略有效性, 强化关键设施防护, 并提供人员培训支持。首先, 分析了ICS的安全现状, 并阐述了DT技术在ICS安全态势中的应用进展及其对风险评估的提升作用; 然后, 介绍了基于DT的工控网络靶场在工控安全中的优化作用; 最后, 通过智能电网典型案例验证了DT技术在工控安全中的重要作用, 并进一步探讨了DT技术在工控安全领域的未来发展方向。

  • 网络空间安全
    陈先意, 丁思哲, 王康, 闫雷鸣, 付章杰
    计算机工程. 2025, 51(1): 138-147. https://doi.org/10.19678/j.issn.1000-3428.0068349
    摘要 (234) PDF全文 (181) HTML (9)   可视化   收藏

    联邦学习作为一种新型的深度学习范式, 允许多个参与方在客户端本地共同训练模型, 极大地保护了用户的数据隐私, 得到了广泛关注和研究。然而, 联邦学习作为一种分布式学习方式, 极易遭受非法复制、恶意分发及客户端懒惰不作为等攻击。针对上述问题, 提出一种支持安全联邦学习的主动保护模型水印框架。首先, 设计了一个基于护照层水印的个性化参数聚合方法, 在解决水印冲突问题的同时防止懒惰客户端盗窃模型; 其次, 设计了一个基于向量承诺的全局水印聚合方法, 有效抵御了恶意攻击者伪造私有水印进行歧义攻击。实验结果表明, 与当前最好的FedIPR相比, 所提方法具有更高的水印容量, 可以支持更大型的联邦学习系统; 在差分隐私、客户端选择等安全联邦学习策略下能保持近100%的水印提取率, 在遭遇微调、剪枝等攻击时也能保持98%以上的水印提取率。