作者投稿和查稿 主编审稿 专家审稿 编委审稿 远程编辑

阅读排行

  • 一年内发表的文章
  • 两年内
  • 三年内
  • 全部
Please wait a minute...
  • 全选
    |
  • 图形图像处理
    王舒梦, 徐慧英, 朱信忠, 黄晓, 宋杰, 李毅
    计算机工程. 2025, 51(9): 280-293. https://doi.org/10.19678/j.issn.1000-3428.0069353
    摘要 (824) PDF全文 (379) HTML (48)   可视化   收藏

    在无人机(UAV)航拍中, 目标通常是密集分布、特征不明显的小目标, 且物体尺度变化较大。因此, 目标检测容易出现漏检和误检的问题。为了解决这些问题, 提出了一种基于改进YOLOv8n的航拍轻量化小目标检测算法: PECS-YOLO。该算法通过在Neck部分增加P2小目标检测层, 将浅层和深层的特征图进行拼接, 以更好地捕捉小目标的细节信息; 将轻量化卷积PartialConv引入全新的结构CSPPC(Cross Stage Partial PartialConv), 替换Neck网络中的C2f(Concatenation with Fusion), 实现模型轻量化; 引入SPPELAN(Spatial Pyramid Pooling with Efficient Layer Aggregation Network), 以有效地捕捉小目标特征; 通过在Neck部分每个检测头前加入压缩和激励(SE)注意力机制, 使网络更好地关注有用的通道, 减少复杂环境中背景噪声对小目标检测任务的干扰; 最后使用EfficiCIoU作为边界框损失函数, 将边界框的形状差异也考虑在内, 以增强模型对小目标的检测能力。实验结果表明: 相比YOLOv8n, PECS-YOLO目标检测算法在VisDrone2019-DET数据集上交并比为0.5的平均精度(mAP@0.5)提高了3.5%, 交并比为0.5∶0.95的平均精度(mAP@0.5∶0.95)提高了3.7%, 模型参数量减少了约25.7%, 检测速度提高了约65.2%。综上所述, PECS-YOLO模型适合于UAV航拍下的小目标检测任务。

  • 人工智能与模式识别
    彭菊红, 张弛, 高谦, 张光明, 谈栋华, 赵明俊
    计算机工程. 2025, 51(7): 152-160. https://doi.org/10.19678/j.issn.1000-3428.0069283
    摘要 (744) PDF全文 (444) HTML (70)   可视化   收藏

    在工业场景下钢材表面缺陷检测技术存在检测精度低、收敛速度慢等问题。为此, 提出一种改进的YOLOv8算法YOLOv8n-MDC。首先, 在骨干网络中加入多尺度交叉融合网络(MCN), 通过在特征层之间建立更紧密的连接, 促进信息的均匀传递, 减少跨层特征融合时的语义信息损失, 从而增强模型对钢材缺陷的感知能力; 其次, 在模块中引入可变形卷积, 自适应地改变卷积核的形状与位置, 从而更灵活地捕捉不规则缺陷的边缘特征, 减少信息丢失, 提升检测的准确性; 最后, 加入坐标注意力(CA)机制, 将位置信息嵌入到通道中, 解决了位置信息丢失的问题, 使模型能够更精确地感知缺陷的位置及其形态特征, 从而提升检测的精度和稳定性。在NEU-DET数据集上的实验结果表明, YOLOv8n-MDC算法的mAP@0.5达到了81.0%, 相比原基准网络提升了4.2百分点, 该算法收敛速度较快、精度较高, 更能满足实际工业生产的要求。

  • 上海市计算机学会40周年庆
    齐凤林, 沈佳杰, 王茂异, 张凯, 王新
    计算机工程. 2025, 51(4): 1-14. https://doi.org/10.19678/j.issn.1000-3428.0070222
    摘要 (670) PDF全文 (879) HTML (77)   可视化   收藏

    人工智能(AI)的快速发展已为众多领域赋能, 对社会带来了深远的影响, 其出色的处理效果、广泛的适用性以及强大的扩展能力, 为高校信息化服务提供了坚实的技术基础。从AI和高校信息化的发展史出发, 探讨了两者的发展历程及其关联, 在国内外高校信息化建设中, 尽管各自对AI的关注点有所不同, 但均展现了其在提升教育质量、优化管理流程等方面的巨大潜力。从聚焦高校信息化建设者的角度, 在教师教学、学生学习、学校管理、教学评估、智能考试等五大核心领域, 详尽归纳并分析了AI赋能高校信息化中的典型应用案例, 展现了其如何有效提升教育质量与管理效率, 同时指出了AI在高校信息化应用过程中可能面临的数据隐私保护、算法偏见、技术依赖风险等问题, 列举了常见的应对策略, 如加强数据安全防护、优化算法透明度与公平性、培养师生信息素养等。基于这些分析, 进一步展望了AI在高校信息化中的未来优化方向, 强调技术创新与伦理规范并重, 倡导建立跨学科合作机制, 共同推动AI技术在高校信息化领域的健康、可持续发展。

  • 网络空间安全
    吴若岚, 陈玉玲, 豆慧, 张洋文, 龙钟
    计算机工程. 2025, 51(2): 179-187. https://doi.org/10.19678/j.issn.1000-3428.0068705
    摘要 (617) PDF全文 (10433) HTML (34)   可视化   收藏

    联邦学习作为新兴的分布式学习框架, 允许多个客户端在不共享原始数据的情况下共同进行全局模型的训练, 从而有效保护了数据隐私。然而, 传统联邦学习仍然存在潜在的安全隐患, 容易受到中毒攻击和推理攻击的威胁。因此, 为了提高联邦学习的安全性和模型性能, 需要准确地识别恶意客户端的行为, 同时采用梯度加噪的方法来避免攻击者通过监控梯度信息来获取客户端的数据。结合恶意客户端检测机制和本地差分隐私技术提出了一种鲁棒的联邦学习框架。该算法首先利用梯度相似性来判断和识别潜在的恶意客户端, 减小对模型训练任务产生的不良影响; 其次, 根据不同查询的敏感性以及用户的个体隐私需求, 设计一种基于动态隐私预算的本地差分隐私算法, 旨在平衡隐私保护和数据质量之间的权衡。在MNIST、CIFAR-10和MR文本分类数据集上的实验结果表明, 与3种基准算法相比, 该算法在准确性方面针对sP类客户端平均提高了3百分点, 实现了联邦学习中更高的安全性水平, 显著提升了模型性能。

  • 热点与综述
    马恒志, 钱育蓉, 冷洪勇, 吴海鹏, 陶文彬, 张依杨
    计算机工程. 2025, 51(2): 18-34. https://doi.org/10.19678/j.issn.1000-3428.0068386
    摘要 (541) PDF全文 (409) HTML (44)   可视化   收藏

    随着大数据和人工智能技术的不断发展, 知识图谱应用越来越广泛, 知识图谱嵌入技术也得到了飞速发展。知识图谱嵌入通过在低维矢量空间中实现结构化知识表示来提高知识表示和推理效率。对知识图谱嵌入技术进行全面概述, 包括其基本概念、模型类别、评价指标以及应用前景。首先介绍了知识图谱嵌入的基本概念及背景, 将知识图谱嵌入分为基于翻译机制的嵌入模型、基于语义匹配机制的嵌入模型、基于神经网络的嵌入模型和基于附加信息的嵌入模型4个主要类别, 并对相关模型的核心思想、评分函数、优缺点、应用场景进行细致梳理; 然后总结了知识图谱嵌入的常见数据集和评价指标, 以及链接预测和三元组分类等相关应用与实验结果, 同时介绍了问答系统、推荐系统等下游任务; 最后对知识图谱嵌入技术进行回顾总结, 概述了当前知识图谱嵌入技术存在的局限性和主要问题, 探讨了未来知识图谱嵌入领域存在的机遇和挑战以及具有潜力的研究方向, 并对研究前景进行展望。

  • 人工智能与模式识别
    周翰祺, 方东旭, 张宁波, 孙文生
    计算机工程. 2025, 51(4): 57-65. https://doi.org/10.19678/j.issn.1000-3428.0069100
    摘要 (507) PDF全文 (732) HTML (78)   可视化   收藏

    无人机(UAV)多目标跟踪技术在交通运营、安全监测、水域巡检等领域受到广泛关注。然而, 目前已有的多目标跟踪算法多用于单无人机多目标跟踪, 而单无人机的视角通常具有一定的局限性, 当目标被遮挡时目标发生ID切换会导致跟踪失败。为了解决该问题, 提出一种多无人机多目标跟踪(MUMTTrack)算法。采用基于检测的跟踪(TBD)范式, 利用多架无人机同时跟踪目标, 弥补单无人机视角的局限性。为了有效融合多架无人机的跟踪结果, 为MUMTTrack设计一种基于加速鲁棒特征(SURF)算法的图像匹配策略和ID分配策略。将MUMTTrack算法的性能与当前主流的单无人机多目标跟踪算法在MDMT数据集上进行实验比较。实验结果表明, MUMTTrack算法在识别F1(IDF1)值和多目标跟踪精度(MOTA)这两个多目标跟踪性能指标上均表现出明显的优势。

  • 热点与综述
    孙丽郡, 孟繁军, 徐行健
    计算机工程. 2025, 51(11): 1-21. https://doi.org/10.19678/j.issn.1000-3428.0069543
    摘要 (476) PDF全文 (4419) HTML (31)   可视化   收藏

    在教育信息化持续推进的背景下, 构建精准且高效的课程知识图谱已成为推动教育个性化发展的关键任务之一。课程知识图谱作为一种结构化的知识表示模型, 旨在揭示课程内容与学习目标之间的复杂关联关系, 以优化教育资源配置, 并为学习者定制个性化的学习路径。围绕课程知识图谱的构建技术进行探讨, 首先阐述知识图谱、教育知识图谱、课程知识图谱的基本概念及其之间的内在联系与显著差异; 其次深入剖析课程知识图谱构建的关键技术, 涵盖课程本体设计、实体抽取、关系抽取等方面, 并对其发展历程、特点及局限性展开详细分析与总结; 再次, 探讨课程知识图谱在学习资源推荐、学习者画像建模和多模态课程知识图谱构建等场景中的应用价值; 最后, 聚焦于课程知识图谱在构建过程中所面临的难题, 如数据多样性和异构性、知识图谱质量难以评估以及多课程交叉融合不足等, 从深度学习、大语言模型(LLM)等前沿技术的角度出发, 对未来的发展趋势进行展望。

  • 人工智能与模式识别
    黄昆, 齐肇建, 王娟敏, 胡倩, 胡伟超, 皮建勇
    计算机工程. 2025, 51(5): 133-142. https://doi.org/10.19678/j.issn.1000-3428.0069026
    摘要 (472) PDF全文 (320) HTML (42)   可视化   收藏

    密集行人检测是公共智能监控的关键技术, 其采用目标检测方法对视频中的行人位置和数量进行检测, 进而实现对视频中人群的智能监控。在人员密集场景下因遮挡和行人的目标太小造成漏检。为此, 提出一种改进YOLOv8检测模型Crowd-YOLOv8。首先, 在主干网络使用nostride-Conv-SPD模块, 增强对图像小目标特征等细粒度信息的提取能力; 其次, 在YOLOv8网络的颈部引入小目标检测头和CARAFE上采样算子对各尺度特征进行融合, 以提高在小目标情况下的检测效果。实验结果表明, 所提模型在CrowdHuman数据集上mAP@0.5和mAP@0.5∶0.95分别取得了84.3%和58.2%的检测效果, 与原YOLOv8n相比分别提高了3.7和5.2百分点; 在WiderPerson数据集上取得了88.4%和67.4%, 与原YOLOv8n相比提高了1.1和1.5百分点。

  • 网络空间安全
    姚玉鹏, 魏立斐, 张蕾
    计算机工程. 2025, 51(6): 223-235. https://doi.org/10.19678/j.issn.1000-3428.0069133
    摘要 (448) PDF全文 (112) HTML (25)   可视化   收藏

    联邦学习实现了各参与方在不泄露原始数据的前提下联合建模,有效解决了分布式数据隐私的问题,但随着研究的深入,联邦学习还存在隐私推断攻击或恶意客户端投毒攻击等安全问题。现有联邦学习改进方案大多仅从隐私保护或抗投毒攻击方面进行改进,不能兼顾两种攻击。为了同时解决联邦学习中的推断攻击和投毒攻击,提出一个隐私保护的抗投毒攻击联邦学习(APFL)方案。设计一个模型检测算法,使用差分隐私(DP)技术,根据模型间余弦相似度赋予各客户端相应聚合权重,使用同态加密技术将本地模型加权聚合。在MNIST和CIFAR10数据集上的实验结果表明,APFL在保证数据隐私的同时能有效筛选恶意模型,抵御投毒攻击,当投毒比例不超过50%时,APFL模型性能与无投毒攻击环境下联邦平均(FedAvg)方案一致,模型测试错误率较Krum方案平均降低19%,较FLTrust方案平均降低9%。

  • 热点与综述
    路悦, 周翔宇, 张世周, 梁国强, 邢颖慧, 程德, 张艳宁
    计算机工程. 2025, 51(10): 1-17. https://doi.org/10.19678/j.issn.1000-3428.0070575
    摘要 (448) PDF全文 (503) HTML (42)   可视化   收藏

    传统机器学习算法只有当测试集和训练集同分布时才能取得较好的性能, 无法增量地学习原训练集中没有的新类别或任务。持续学习使模型得以具备自适应学习能力, 在持续学习新任务的同时能够防止对旧任务的遗忘。当前持续学习仍面临计算开销大、存储成本高以及性能不稳定等挑战。近年来, 预训练模型的发展为持续学习提供了新的研究方向, 有望进一步提高性能表现。首先, 分析了现有基于预训练的持续学习方法, 按照防止遗忘的机制将其归纳为基于提示池、缓慢更新参数、基于扩展主干网络分支、基于参数正则化、基于分类器设计5类方法, 进一步按照阶段数、微调方式和是否利用语言模态对其进行归类并总结了各类方法的主要特点和各自优势。然后, 分析了持续学习方法存在的主要挑战, 归纳了各类持续学习方法的适用场景和局限性, 在多个评测基准上对各类方法进行实验比较并讨论各方法的性能差异。最后, 对基于预训练的持续学习方法的研究趋势进行展望。

  • 开发研究与工程应用
    张博强, 陈新明, 冯天培, 吴兰, 刘宁宁, 孙朋
    计算机工程. 2025, 51(4): 373-382. https://doi.org/10.19678/j.issn.1000-3428.0068338
    摘要 (436) PDF全文 (319) HTML (15)   可视化   收藏

    在限定场景内, 无人转运车辆在路径规划过程中不能与周围障碍物保持安全距离, 导致发生车辆与障碍物发生剐蹭的问题, 提出基于混合A*算法和修正RS曲线融合的路径规划。首先, 将提出的基于KD-Tree算法的距离代价函数加入到混合A*算法的代价函数中。其次, 改变混合A*算法的扩展策略, 根据车辆周围环境动态改变节点扩展距离, 实现节点的动态扩展, 提高算法的节点搜索效率。最后, 改进混合A*算法的RS曲线生成机制, 使生成的RS曲线直线部分与周围障碍物边界保持平行, 从而符合厂区内道路行驶要求, 通过对局部路径进行平滑处理, 在保证路径符合车辆运动学约束的条件下满足路径曲率变化的连续性, 从而提高生成路径的质量。实验结果表明, 与传统算法相比, 提出算法的搜索时间缩短了38.06%, 最大曲率减少了25.2%, 路径到障碍物的最近距离增加了51.3%, 有效提高了混合A*算法生成路径的质量, 并能较好地在限定场景中运行。

  • 热点与综述
    次天钊, 杨昊, 周游, 谢长生, 吴非
    计算机工程. 2025, 51(3): 1-23. https://doi.org/10.19678/j.issn.1000-3428.0068673
    摘要 (436) PDF全文 (787) HTML (61)   可视化   收藏

    智能手机已成为人们日常生活中不可或缺的一部分。安卓系统以其开源、生态完备等优点成为目前市场份额占比最大的移动操作系统。在安卓手机中, 存储子系统是关键的组成部分, 对用户体验有重要影响。不同于服务器场景, 安卓手机存储系统的设计需要考虑诸多独特因素, 如资源受限、成本敏感、前台应用优先等, 学术界对此已经展开大量研究。针对该方向研究现状进行总结分析, 首先将安卓手机存储系统用户体验保障面临的问题凝练为主机端写放大、内存交换、文件系统碎片化、闪存设备性能以及I/O优先级反转5类; 然后围绕如何解决这5类问题, 对现有工作进行分类介绍, 并总结常用的手机存储系统测试与分析工具; 最后对安卓手机存储系统用户体验保障技术的研究现状进行总结, 并讨论了未来潜在的研究方向。

  • 图形图像处理
    王国明, 贾代旺
    计算机工程. 2025, 51(12): 294-303. https://doi.org/10.19678/j.issn.1000-3428.0070027
    摘要 (431) PDF全文 (198) HTML (4)   可视化   收藏

    深度学习在目标检测领域的广泛应用显著提升了对大中目标的检测能力。然而, 针对小目标检测, 由于其固有的尺度小、背景复杂等挑战, 传统的目标检测算法常常会出现漏检、误检。为了提高小目标检测的精度, 对YOLOv8模型进行研究。首先, 将主干部分的卷积模块替换为RFAConv模块, 增强了模型对于复杂图像的处理能力; 其次, 在Neck部分引入混合局部通道注意力(MLCA)机制, 能够在保持计算效率的同时, 帮助模型更高效地融合不同层次的特征; 再次, 将YOLOv8的Detect头替换为Detect_FASFF头, 以解决不同特征尺度间的一致性问题, 并增强模型对小目标的检测能力; 最后, 将完全交并比(CIoU)损失函数替换为Focaler-IoU损失函数, 使模型更关注难以精确定位的小目标。实验结果显示: 改进后的模型在小目标稀疏的FloW-Img数据集上mAP@0.5提高了4.8百分点, mAP@0.5:0.95提高了3.0百分点; 在小目标密度高的VisDrone2019数据集上, mAP@0.5提升了5.9百分点, mAP@0.5:0.95提高了4.0百分点。同时还在低空数据集AU-AIR以及行人密集检测数据集WiderPerson上做了泛化对比实验。结果表明, 优化后的模型相比较原模型在小目标检测精度上有显著提升, 且适用范围更广。

  • 热点与综述
    赵楷, 胡煜环, 闫俊桥, 毕雪华, 张琳琳
    计算机工程. 2025, 51(8): 1-15. https://doi.org/10.19678/j.issn.1000-3428.0069147
    摘要 (420) PDF全文 (269) HTML (64)   可视化   收藏

    区块链作为一种分布式可信数据库,在数字版权保护领域得到有效应用,引起学术界和工业界的广泛关注。传统数字版权保护技术存在侵权追踪难、版权交易复杂、合法权益保护不足等问题,严重制约数字版权保护研究的发展。区块链的防篡改、可追溯和去中心化等特性为解决数字版权侵权风险提供了可信、透明和安全的解决思路。首先介绍了区块链技术的基本原理;然后针对传统版权保护方案存在的问题,介绍了区块链结合传统版权保护技术的最新研究成果;接着评估了区块链在实际应用中的效果和潜力,强调其对版权保护体系的积极影响;最后探讨了区块链版权保护面临的挑战和未来发展趋势,以实现更加完善和可持续的区块链版权保护体系。

  • 人工智能与模式识别
    王帅, 史艳翠
    计算机工程. 2025, 51(8): 190-202. https://doi.org/10.19678/j.issn.1000-3428.0069636
    摘要 (410) PDF全文 (244) HTML (50)   可视化   收藏

    序列推荐算法通过对用户的历史行为进行动态建模, 以预测其可能感兴趣的内容。聚焦对比式自监督学习(SSL)在序列推荐中的应用, 通过设计有效的自监督信号, 增强模型在稀疏数据场景下的表征能力。首先, 针对随机数据增强易引入数据噪声的问题, 提出融合用户偏好的个性化数据增强方法, 通过用户评分引导增强过程, 同时对长、短序列使用不同的增强方法组合, 生成符合用户偏好的增强序列; 其次, 为了缓解训练中出现的数据特征学习不平衡问题, 设计一种混合增强训练法, 在训练前期, 通过随机选择增强方法生成增强序列, 提高模型的性能和泛化能力, 在训练后期, 选择与原始序列相似度较高的增强序列, 使模型全面学习用户的实际偏好和行为模式; 最后, 将传统的序列预测目标与SSL目标相结合, 推断出用户的表示。在数据集Beauty、Toys和Sports上进行实验验证, 结果表明, 相较于基线模型中的最优结果, 所提方法的HR@5指标分别提升了6.61%、3.11%和3.76%, NDCG@5指标分别提升了11.40%、3.50%和2.16%, 上述实验结果验证了该方法的合理性和有效性。

  • 开发研究与工程应用
    汤静雯, 赖惠成, 王同官
    计算机工程. 2025, 51(4): 303-313. https://doi.org/10.19678/j.issn.1000-3428.0068897
    摘要 (397) PDF全文 (217) HTML (30)   可视化   收藏

    智慧社区场景下的行人检测需要精准识别行人以应对各类情况的发生, 然而面对遮挡和远距离行人的情景, 现有检测器会出现漏检、误检以及模型过大不易部署的问题。针对以上问题, 提出基于YOLOv8的行人检测算法ME-YOLO。设计一种高效特征提取模块(EM), 使得网络更好地学习行人特征和捕捉行人特点, 在减少网络参数量的同时提高检测精度。设计一个重构的检测头模块, 重新整合后的检测层增强了网络对小目标的识别能力, 有效检测小目标行人。引入双向特征金字塔网络来设计新的颈部网络, 即双向扩张残差-特征金字塔网络(BDR-FPN), 利用扩张残差模块和附权注意力机制来扩展感受野及有所侧重地学习行人特征, 缓解网络对遮挡行人不敏感问题。实验结果表明, 在CityPersons数据集上进行训练和验证, 相比原算法YOLOv8, ME-YOLO算法的AP50提高了5.6百分点, 模型参数量减少了41%, 模型大小压缩了40%, 在TinyPerson数据集上验证算法的有效性和泛化性, AP50提高了4.1百分点, AP50∶95提高了1.7百分点。该算法在大幅度减少模型参数和大小的同时, 有效提高了检测精度, 在智慧社区场景中有较好的应用价值。

  • 图形图像处理
    赵宏, 宋馥荣, 李文改
    计算机工程. 2025, 51(2): 300-311. https://doi.org/10.19678/j.issn.1000-3428.0068481
    摘要 (395) PDF全文 (379) HTML (24)   可视化   收藏

    对抗样本是评估深度神经网络(DNN)鲁棒性和揭示其潜在安全隐患的重要手段。基于生成对抗网络(GAN)的对抗样本生成方法(AdvGAN)在生成图像对抗样本方面取得显著进展, 但该方法生成的扰动稀疏性不足且幅度较大, 导致对抗样本的真实性较低。为解决这一问题, 基于AdvGAN提出一种改进的图像对抗样本生成方法(SE-AdvGAN)。SE-AdvGAN通过构造SE注意力生成器和SE残差判别器来提高扰动的稀疏性。SE注意力生成器用于提取图像关键特征, 限制扰动生成位置, SE残差判别器指导生成器避免生成无关扰动。同时, 在SE注意力生成器的损失函数中加入以l2范数为基准的边界损失以限制扰动的幅度, 从而提高对抗样本的真实性。实验结果表明, 在白盒攻击场景下, SE-AdvGAN相较于现有方法生成的对抗样本扰动稀疏性更高、幅度更小, 并且在不同目标模型上均取得了更好的攻击效果, 说明SE-AdvGAN生成的高质量对抗样本可以更有效地评估DNN模型的鲁棒性。

  • AI算力赋能的车载边缘计算
    崔萌萌, 施静燕, 项昊龙
    计算机工程. 2025, 51(9): 25-37. https://doi.org/10.19678/j.issn.1000-3428.0069836
    摘要 (384) PDF全文 (182) HTML (28)   可视化   收藏

    为了进一步优化车载服务的服务质量(QoS),移动边缘计算(MEC)被深度整合于车联网(IoV)中,旨在为车辆提供地理位置较近的计算资源,降低任务处理延迟和能耗。然而,传统的MEC服务器部署主要依赖于地面基站(BS),这不仅导致高昂的部署成本,而且限制其覆盖范围,难以确保为所有车辆提供无间断服务。为了应对上述挑战,空地协同IoV作为一种新兴的技术方案应运而生。无人机(UAV)能够借助其视距链路的灵活性动态地协助路边单元(RSU),为车辆用户提供更为灵活的计算资源,进而保障车载服务的连续性和高效性。提出一种基于空地协同的动态车载边缘任务卸载方法(DVETOM)。该方法采用车-路-空架构,构建了车辆到RSU(V2R)链路和车辆到UAV(V2U)链路。针对车辆任务的本地执行、卸载至RSU执行和卸载至UAV执行3种模式分别构建传输模型和计算模型,并以最小化系统时延和能耗作为联合优化目标构建目标函数。DVETOM将任务卸载问题转化为马尔可夫决策过程(MDP),基于深度强化学习(DRL)的分布式深度确定性策略梯度(D4PG)算法优化任务卸载策略。与5种基准方法进行对比,实验结果表明,DVETOM在提升车辆用户QoS的同时,在降低系统时延方面优于现有方法3.45%~23.7%,在降低系统能耗方面优于现有方法5.8%~23.47%。综上所述,DVETOM有效地优化了IoV中的车载边缘任务卸载,为IoV用户提供了更高效、更节能的服务解决方案,展现了其在智能交通系统领域的广泛应用潜力。

  • 热点与综述
    张锦, 陈铸, 陈照云, 时洋, 陈冠军
    计算机工程. 2025, 51(7): 1-11. https://doi.org/10.19678/j.issn.1000-3428.0068870
    摘要 (379) PDF全文 (682) HTML (44)   可视化   收藏

    在众多科学领域的研究与开发中,模拟器都扮演着不可替代的角色。在体系结构领域尤其如此,模拟器提供了一个安全、成本低廉的虚拟环境,使研究人员能够快速开展实验分析和评测。同时,模拟器还可以加速芯片设计和验证的过程,从而节省时间和资源成本。然而,随着处理器体系结构的演化进步,尤其是专用处理器发展呈现多元化特点,为了能够对体系结构设计探索提供重要的反馈,模拟器的重要作用日益凸显。综述了体系结构模拟器目前的发展与应用现状,重点介绍了几种目前较为典型的体系结构模拟器。通过对专用于不同处理器的模拟器技术手段的分析,深入了解不同架构下模拟器的侧重点及技术难点。此外,还对体系结构模拟器未来发展的关键点进行了思考与评述,以展望其在处理器设计研究领域的前景。

  • 热点与综述
    邸钦渤, 陈劭力, 时良仁
    计算机工程. 2025, 51(11): 35-44. https://doi.org/10.19678/j.issn.1000-3428.0069780
    摘要 (377) PDF全文 (539) HTML (10)   可视化   收藏

    随着多变量时序数据在各行业中的广泛应用, 开发有效的异常检测方法对于保障系统的稳定运行和安全性变得极为关键, 由于多变量时序数据内在的复杂性和动态变化特性, 对异常检测算法提出了更高的要求。针对现有异常检测方法在处理含有复杂变量关系的高维数据时存在效率不足的问题, 提出一种基于图神经网络(GNN)与扩散模型的多变量时序数据异常检测算法GRD。通过节点嵌入和图结构学习, GRD算法能有效地捕捉和表示变量间的复杂关系, 并通过门控循环单元(GRU)和去噪扩散概率模型(DDPM)进一步提取特征, 实现了对异常数据的高精度检测。在以往的实验评估中, 大多数算法在评分前会采用点调整(PA)评估协议, 该协议会严重高估算法的检测能力。为了更准确地评估算法性能, 采用新的评估协议和评价指标。实验结果表明, GRD算法在3个公开数据集上的F1@k指标分别是0.741 4、0.801 7、0.767 1, 性能优于现有方法。特别是在高维数据处理方面, GRD算法展现出显著优势, 证明了其在现实场景的异常检测应用中的实用性和鲁棒性。

  • 开发研究与工程应用
    周思瑜, 徐慧英, 朱信忠, 黄晓, 盛轲, 曹雨淇, 陈晨
    计算机工程. 2025, 51(5): 326-339. https://doi.org/10.19678/j.issn.1000-3428.0069259
    摘要 (354) PDF全文 (126) HTML (18)   可视化   收藏

    手机屏幕作为人机交互的主窗口, 已成为影响用户体验和终端整体性能的重要因素。因此, 市场对解决手机屏幕瑕疵的需求日益增长。为满足这一需求, 针对在手机屏幕瑕疵检测过程中存在检测精度低、小目标瑕疵漏检率高与检测速度慢的情况, 提出一种以YOLOv8n作为基准模型的PGS-YOLO算法。PGS-YOLO通过增加一个专门的微小目标检测头, 并结合SeaAttention注意力模块, 有效提升对小目标的探测能力; 将骨干网络和特征融合网络分别融入PConv与GhostNetV2轻量化模块, 在保证精度的同时降低模型的参数量, 提高瑕疵检测的速度与效率。实验结果表明, 在北京大学手机屏幕表面瑕疵数据集中, 相较于YOLOv8n, PGS-YOLO算法的mAP@0.5提升了2.5百分点, mAP@0.5∶0.95提升了2.2百分点, 在手机屏幕瑕疵检测过程中不仅能对大片的瑕疵做到精准检测, 还能对小瑕疵保持一定的准确度。此外, 检测性能优于YOLOv5n、YOLOv8s等大部分YOLO系列算法。同时, 参数量仅为2.0×106, 小于YOLOv8n, 满足工业场景对手机屏幕瑕疵检测的需求。

  • 热点与综述
    庞鑫, 葛凤培, 李艳玲
    计算机工程. 2025, 51(6): 1-19. https://doi.org/10.19678/j.issn.1000-3428.0069005
    摘要 (354) PDF全文 (247) HTML (40)   可视化   收藏

    声学场景分类(ASC)旨在让计算机模拟人类听觉识别不同的声学环境,是计算机听觉领域中具有挑战性的任务之一。随着智能音频处理技术以及神经网络学习算法的快速进步,近年来ASC任务也涌现出一系列新算法和新技术。为了全面展示该领域的技术发展脉络和演进过程,梳理了该领域的早期工作和近期发展,全面介绍了ASC任务。首先描述了ASC的应用场景和面临的挑战;其次详细介绍了ASC的主流框架,重点阐述了应用于此领域的深度学习算法;然后系统性地总结了ASC的前沿探索与延伸任务以及公开数据集;最后对ASC的发展趋势进行探讨与展望。

  • 人工智能与模式识别
    戴康佳, 徐慧英, 朱信忠, 李悉钰, 黄晓, 陈国强, 张志雄
    计算机工程. 2025, 51(3): 95-104. https://doi.org/10.19678/j.issn.1000-3428.0068950
    摘要 (343) PDF全文 (300) HTML (33)   可视化   收藏

    传统的视觉同步定位与建图(SLAM)系统是基于静态环境这一假设的, 然而在现实场景中往往存在动态物体, 这可能导致SLAM位姿估计和地图构建的精度下降、鲁棒性变差, 甚至出现跟踪丢失的情况。针对上述问题, 基于ORB-SLAM2提出新的语义SLAM系统(YGL-SLAM)。该系统首先使用轻量级目标检测算法YOLOv8n追踪动态对象, 获得动态对象的语义信息。然后在跟踪线程的同时提取点特征和线特征, 根据获取的语义信息利用Z-score和对极几何算法剔除动态特征, 以改进SLAM在动态场景中的表现。此外, 鉴于轻量级目标检测算法在追踪动态对象时存在连续帧的漏检测问题, 设计了基于相邻帧的检测补偿方法。在公开数据集TUM和Bonn上的测试结果表明, 相比ORB-SLAM2, YGL-SLAM系统准确率提升超过90%, 对比其他动态SLAM, YGL-SLAM也具有较高的准确度和鲁棒性。

  • 图形图像处理
    刘春霞, 孟吉星, 潘理虎, 龚大立
    计算机工程. 2025, 51(7): 326-338. https://doi.org/10.19678/j.issn.1000-3428.0069510
    摘要 (334) PDF全文 (104) HTML (20)   可视化   收藏

    针对现有的目标检测方法在处理背景复杂、有效信息量少的遥感图像时存在的误检、漏检等问题,提出了一种多模态遥感小目标检测方法——BFMYOLO。设计了像素级的红-绿-蓝(RGB)和红外(IR)图像的融合模块, 即多模态融合模块(BFM),充分利用不同模态的互补性,实现两种模态信息的有效融合;设计了全尺度自适应更新模块(AA),解决特征融合过程中的多目标信息冲突问题,通过结合CARAFE上采样算子并进一步融入浅层特征,在加强非相邻层间融合的同时增强小目标的空间信息;设计了改进的任务解耦检测头(IDHead),将分类和回归任务分开处理,以降低不同任务的相互干扰,融合深层语义特征,进一步提升模型的检测性能。采用归一化Wasserstein距离(NWD)损失函数作为定位回归损失函数,降低位置偏差的敏感性。实验结果表明,该方法在VEDAI、NWPU VHR-10和DIOR数据集上的阈值设定为0.5时的均值平均精度(mAP@0.5)分别达到78.6%、95.5%和73.3%,优于其他先进模型, 在遥感小目标检测中表现出良好的性能。

  • 开发研究与工程应用
    陈梓延, 王晓龙, 何迪, 安国成
    计算机工程. 2025, 51(5): 314-325. https://doi.org/10.19678/j.issn.1000-3428.0069122
    摘要 (329) PDF全文 (121) HTML (23)   可视化   收藏

    现有的高精度车辆检测模型参数与计算量过高, 无法在交通智能设备上良好运行, 而轻量化的车辆检测模型精度普遍较低, 不适用于实际任务。为此, 提出一种改进YOLOv8的轻量化车辆检测网络, 将主干网络替换为计算量和内存访问更小的FasterNet网络, 并且将颈部的双向特征金字塔网络替换为加权双向特征金字塔网络(BiFPN), 简化特征融合过程。同时, 引入一种融合注意力机制的动态检测头, 实现检测头和注意力的无冗余结合; 此外, 针对完全交并比(CIoU)在检测精度和收敛速度上的缺陷, 提出一种尺度不变交并比(SIoU)结合归一化高斯Wasserstein距离(NWD)的回归损失算法。最后, 为尽量减小模型对边缘设备的算力需求, 进行基于幅值的层自适应稀疏化剪枝, 进一步压缩模型大小。实验结果表明, 提出的改进模型相较于原模型YOLOv8s, 在精度上升1.5百分点的情况下, 参数量降低78.9%, 计算量下降67.4%, 模型尺寸降低77.8%, 达到了比较优秀的轻量化效果, 具有很强的实用性。

  • 人工智能与模式识别
    宋杰, 徐慧英, 朱信忠, 黄晓, 陈晨, 王泽宇
    计算机工程. 2025, 51(7): 127-139. https://doi.org/10.19678/j.issn.1000-3428.0069257
    摘要 (325) PDF全文 (163) HTML (27)   可视化   收藏

    在室内场景下, 受角度、光线变化等因素的影响, 导致现有目标检测算法检测跌倒事件时检测精度降低、实时性变差。为此, 提出一种基于YOLOv8改进的跌倒检测算法OEF-YOLO。采用全维动态卷积(ODConv)模块改进YOLOv8中的C2f模块, 优化了核空间的4个维度以增强特征提取能力, 而且有效减少了计算负担。同时, 为了捕获更细粒度的特征, 在颈部网络中引入高效多尺度注意力(EMA)模块, 进一步聚合像素级特征, 提高网络在跌倒场景中的处理能力。在CIoU损失函数中融入Focal Loss思想, 使模型对难分类样本给予更多关注, 优化模型整体性能。实验结果表明, 相比YOLOv8n, OEF-YOLO跌倒检测算法在mAP@0.5指标上提升了1.5百分点, mAP@0.5∶0.95提升1.4百分点, 参数量和计算量分别为3.1×106和6.5 GFLOPs, 在图形处理器(GPU)上FPS提高了44, 在提高精度检测跌倒事件的同时, 兼顾了低算力场景下的部署要求。

  • 热点与综述
    毛竞争, 胡潇锐, 徐庚辰, 吴国栋, 孙彦斌, 田志宏
    计算机工程. 2025, 51(2): 1-17. https://doi.org/10.19678/j.issn.1000-3428.0068374
    摘要 (316) PDF全文 (259) HTML (23)   可视化   收藏

    基于数字孪生(DT)的工业控制系统(ICS)在提升系统安全性、保障稳定运行及优化生产效率方面具有重要作用, 其在工控安全领域的应用主要涵盖两方面: 安全态势感知和工业网络靶场。基于DT的安全态势感知通过实时监测、异常检测、漏洞分析和威胁识别, 实现系统安全的可视化管理。基于DT的工业网络靶场作为策略验证平台, 支持工控系统的攻防模拟, 评估安全策略有效性, 强化关键设施防护, 并提供人员培训支持。首先, 分析了ICS的安全现状, 并阐述了DT技术在ICS安全态势中的应用进展及其对风险评估的提升作用; 然后, 介绍了基于DT的工控网络靶场在工控安全中的优化作用; 最后, 通过智能电网典型案例验证了DT技术在工控安全中的重要作用, 并进一步探讨了DT技术在工控安全领域的未来发展方向。

  • 图形图像处理
    刘圣杰, 何宁, 王鑫, 于海港, 韩文静
    计算机工程. 2025, 51(2): 278-288. https://doi.org/10.19678/j.issn.1000-3428.0068375
    摘要 (314) PDF全文 (311) HTML (18)   可视化   收藏

    人体姿态估计被广泛应用于运动健身、手势控制、无人超市、娱乐游戏等诸多领域, 但姿态估计任务仍面临着诸多挑战。针对目前主流的人体姿态估计网络参数量大、计算复杂度高的问题, 提出一种基于高分辨率网络的轻量级姿态估计网络(LitePose)。首先, 采用Ghost卷积降低特征提取网络的参数; 其次, 通过采用解耦的全连接(DFC)注意力模块, 更好地捕获远距离空间位置像素间的依赖关系, 减少由于参数量下降而导致的提取特征缺失, 提高人体关键点回归的准确率; 然后, 设计一个特征增强模块, 对骨干网络提取的特征进行进一步增强; 最后, 设计一个新的坐标解码方法, 降低热图解码过程中的误差, 提高关键点回归的准确率。在人体关键点检测数据集COCO和MPII上对LitePose进行验证, 并与当前的主流方法进行对比。实验结果表明, LitePose相比基线网络HRNet精度损失0.2%, 但参数量不及基线网络的1/3, LitePose在保证少量精度损失的同时能够大幅降低网络模型的参数量。

  • 热点与综述
    田青, 王斌, 周子枭
    计算机工程. 2025, 51(7): 12-30. https://doi.org/10.19678/j.issn.1000-3428.0069698
    摘要 (306) PDF全文 (136) HTML (14)   可视化   收藏

    从多个不同的摄像机中检索出一个特定的行人是行人重识别(ReID)的主要任务。随着深度神经网络的发展和智能视频监控需求的增加,行人ReID逐渐受到研究人员的关注。现有的行人ReID方法大多利用带有标签的数据集进行有监督训练,但该方式的数据标注成本高昂,使得有监督行人ReID难以扩展到大型的未标记数据集场景。无监督行人ReID可以有效地改善行人ReID模型的扩展问题,更符合现实场景的应用,并逐渐成为研究热点。尽管已有行人ReID的相关综述,但它们主要聚焦于有监督学习领域的方法和应用。为此,对现有无监督行人ReID研究工作进行系统归纳、分析和总结,以便为该领域研究人员提供参考。首先,全面回顾无监督场景的行人ReID方法,根据模型训练是否使用源域监督信息,将无监督行人ReID研究划分为无监督域适应方法和完全无监督方法,并对这2类方法进行分析和总结。然后,介绍和归纳总结行人ReID研究相关的经典数据集,并展示和讨论不同行人ReID方法在这些数据集上的性能和优劣。最后,指出当前无监督行人ReID研究所面临的问题,并提出未来发展方向。

  • 图形图像处理
    沙宇洋, 陆京涛, 杜浩凡, 翟小兵, 孟维宇, 廉旭, 罗刚, 李克峰
    计算机工程. 2025, 51(7): 314-325. https://doi.org/10.19678/j.issn.1000-3428.0068674
    摘要 (303) PDF全文 (210) HTML (20)   可视化   收藏

    图像分割是环境感知中的一项关键技术,被广泛应用于无人驾驶、虚拟现实等实际任务中。随着技术的不断发展,基于计算机视觉技术的导盲系统日趋成熟,并且在精度、稳定性等方面优于传统的解决方案。在视觉导盲系统中,道路图像的语义分割是非常重要的一部分,系统通过分析算法的输出结果可以获取目前所处的环境状态,从而指导用户躲避前方障碍物,获取最优的移动路径。视觉导盲系统的使用环境复杂,对模型的运行效率和分割精度具有极高的要求。然而,常用的高精度语义分割算法参数量大、运行速度慢,因此无法直接应用于导盲系统。针对这一问题,提出了一种基于多尺度特征的轻量化道路图像分割算法。模型含有两个特征提取分支,即Detail Branch和Semantic Branch,其中Detail Branch用来提取图像的低层细节信息,Semantic Branch用来提取图像的高层语义信息,并且两个分支中的多尺度特征也会被所设计的特征映射模块处理和使用,进而提升模型对于特征的建模能力。此外,设计了一种简单且高效的特征融合模块,通过融合不同尺度的特征,增强模型对于上下文信息的编码能力。采集和标注了适用于导盲场景的大量道路分割数据,并制作成了相应的数据集。基于该数据集对所提出的算法进行训练和测试,实验结果显示: 所提出的道路分割算法的平均交并比(mIoU)为96.5%,优于现有的图像分割模型;以1 024×1 024像素的图像作为输入,所提算法的轻量化版本在NVIDIA GTX 3090Ti平台的运行速度为201帧/s,优于现有轻量化图像分割模型;将模型部署到NVIDIA AGX Xavier设备中,其在实际场景中的测试速度为53帧/s,满足实际需求。

  • 体系结构与软件技术
    刘亮, 毛武平, 李汶蔚, 谭思源, 荆腾祥
    计算机工程. 2025, 51(2): 238-249. https://doi.org/10.19678/j.issn.1000-3428.0069161
    摘要 (302) PDF全文 (106) HTML (10)   可视化   收藏

    受地理因素的影响, 在偏远地区无法大规模建设通信网络的基础设施, 导致这些地区的网络通信质量降低以及一系列时延敏感型任务得不到及时处理和响应。针对偏远地区网络覆盖范围有限的问题, 将空天地一体化网络(SAGIN)与移动边缘计算(MEC)相结合, 提出基于博弈论的任务卸载策略, 可为偏远地区用户的时延敏感型任务卸载提供低延迟和高可靠传输。考虑到SAGIN中卫星资源受限以及本地用户设备能量不足的特点, 首先, 提出一种卫星-无人机集群-地面的三层边缘计算网络架构, 在满足各地面任务的时延要求下, 将任务卸载问题转化为地面用户设备和边缘服务器之间的Stackelberg博弈, 并证明其是NP难的。此外, 利用势博弈证明了地面用户设备之间构成的非合作博弈存在纳什均衡(NE)。最后, 寻找任务的最优卸载策略来最小化系统卸载成本, 通过最优的卸载任务转发百分比策略来最大化边缘服务器的效用函数, 提出一种基于Stackelberg博弈的纳什均衡迭代卸载(NEIO-SG)算法。仿真实验结果表明, 与其他基线算法相比, NEIO-SG在任务卸载过程中的系统总时延减少约13%, 边缘服务器的能耗降低约35%。

  • 人工智能与模式识别
    孙浩淼, 李宗民, 肖倩, 孙文洁, 张雯欣
    计算机工程. 2025, 51(2): 102-110. https://doi.org/10.19678/j.issn.1000-3428.0069106
    摘要 (299) PDF全文 (164) HTML (10)   可视化   收藏

    为满足冰壶智能训练的需求, 结合计算机视觉与深度强化学习(RL)技术, 提出一种新的现场冰壶决策方法AI-Curling。AI-Curling包含冰壶检测(SR-Yolo)以及策略生成(GSP-MCTS) 2个部分。SR-Yolo模块负责感知关键时刻冰壶状态, 提取实景冰壶的位置与种类信息。为提高大场景下的小目标检测精度, 防止不恰当下采样造成的特征损失, 引入浅层细化骨干网络(SRNet), 通过在网络初级阶段增加层级, 捕获更丰富的特征信息。此外, 在多尺度融合网络中, 引入自适应特征优化融合(AFOF)模块, 以增加各层网络有效样本, 避免小尺度目标淹没在复杂背景和噪声中。GSP-MCTS模块通过蒙特卡洛树搜索(MCTS)算法结合策略价值网络的方式, 实现冰壶比赛决策分析。该模块通过引入核函数处理动作空间连续性和执行不确定性, 并在策略价值网络中嵌入全局策略感知模块(GSP), 增强了网络空间感知能力。在实验中, SR-Yolo在常规冰壶数据集Curling上平均精度均值(mAP@0.5)为0.974, 在遮挡较多的复杂冰壶数据集Curling_hard上mAP@0.5为0.723。同时, GSP-MCTS与最新实景冰壶模型Curling MCTS对战获得62%的胜率。实验结果表明, GSP-MCTS具有更好的性能。

  • 网络空间安全
    曹蓓, 赵奎
    计算机工程. 2025, 51(6): 193-203. https://doi.org/10.19678/j.issn.1000-3428.0070158
    摘要 (299) PDF全文 (123) HTML (11)   可视化   收藏

    在信息爆炸且真伪难辨的网络环境中,精准识别虚假新闻成为一项重要的研究课题。现有研究多采用多种深度学习模型提取多元语义特征,以捕捉文本中不同层次的语义信息,但简单拼接这些特征会导致信息冗余和噪声,限制检测的准确性和泛化性,目前缺乏有效的深度融合方法。此外,现有研究往往忽视了新闻内容与其对应评论共同构建的双重情感对揭示新闻真实性的影响。针对上述问题,提出一种基于双重情感和多特征融合的虚假新闻检测(DEMF-FND)模型。首先,通过情感分析提取新闻和评论的情感特征,并利用相似度计算引入反映两者关联性的情感差异特征,构建双重情感特征集。然后,采用基于多头注意力的融合机制,将双向长短期记忆网络(BiLSTM)与设计的集成静态-动态嵌入的卷积神经网络(ISDE-CNN)所捕捉的新闻文本全局与局部语义特征进行深度融合。最终,将双重情感特征集与经深度融合得到的语义特征拼接融合,输入由全连接层构成的分类层,以判断新闻的真假。实验结果显示,该方法在Weibo20、Twitter15和Twitter16 3个真实数据集上的基准指标均优于基线方法,在准确率上分别实现了2.5、2.3和5.5百分点的提升,凸显了双重情感和深度融合语义特征在提升虚假新闻检测性能方面的重要性。

  • AI算力赋能的车载边缘计算
    秦敏浩, 孙未未
    计算机工程. 2025, 51(9): 1-13. https://doi.org/10.19678/j.issn.1000-3428.0069416
    摘要 (291) PDF全文 (694) HTML (45)   可视化   收藏

    交通信号灯控制对缓解交通拥堵、提升城市通勤效率有着重要作用。近年来,以实时交通数据为输入的基于深度强化学习的信号灯控制算法已取得突破性进展。然而,现实场景中的交通数据通常伴随着数据失真。传统方法在修复失真数据后使用强化学习算法控制信号灯,但一方面信号灯相位的动态性给失真修复引入了额外不确定性,另一方面失真修复难以与深度强化学习框架相结合来提升性能。为此,提出基于隐状态预测的失真交通信号灯路口控制模型HCRL。HCRL模型由编码子模型、控制子模型和编码预测子模型组成,通过引入信号灯路口的隐状态表示机制,更好地适应深度强化学习框架,有效表达信号灯路口的控制状态,并使用特殊的迁移训练方法避免数据失真对控制子模型的干扰。使用两个真实数据集验证了数据失真对智能信号灯控制算法的影响。实验结果表明,HCRL模型在所有失真场景和失真率下均优于基于失真修复的信号灯控制模型,并在与其他基线模型的对比中表现出了对数据失真更强的鲁棒性。

  • 图形图像处理
    胡倩, 皮建勇, 胡伟超, 黄昆, 王娟敏
    计算机工程. 2025, 51(3): 216-228. https://doi.org/10.19678/j.issn.1000-3428.0068753
    摘要 (281) PDF全文 (225) HTML (34)   可视化   收藏

    针对现有的行人检测方法对于密集行人或小目标行人检测精度低的问题, 提出一种基于YOLOv5的综合改进算法模型YOLOv5_Conv-SPD_DAFPN。首先, 针对小目标或密集行人的特征信息易丢失这一问题, 在骨干网络中引入Conv-SPD网络模块替代原有的跨步卷积, 有效缓解特征信息丢失的问题; 其次, 针对非相邻特征图不直接融合从而引起特征融合率较低的问题, 提出新的双层渐进金字塔网络(DAFPN), 提高行人检测的准确性和精度; 最后, 基于EIoU_Loss和CIoU_Loss引入EfficiCIoU_Loss定位损失函数, 以调整和提高帧回归率, 促进网络模型更快收敛。模型在CrowdHuman和WiderPerson行人数据集上相比于原YOLOv5模型, mAP@0.5、mAP@0.5∶0.95分别提升了3.9、5.3百分点和2.1、2.1百分点; 引入EfficiCIoU_Loss后, 模型收敛速度分别提升了11%、33%。这些改进使得基于YOLOv5的密集行人检测在特征信息保留、多尺度融合和损失函数优化等方面都取得了显著进展, 提高了其在实际应用中的性能和效率。

  • 开发研究与工程应用
    许德刚, 王双臣, 尹柯栋, 王再庆
    计算机工程. 2025, 51(11): 377-391. https://doi.org/10.19678/j.issn.1000-3428.0069125
    摘要 (271) PDF全文 (64) HTML (1)   可视化   收藏

    为了解决城市车辆目标检测算法中存在检测效果差、误检漏检率高、泛化能力弱的问题, 提出一种改进YOLOv8的城市车辆目标检测算法。首先, 在主干网络尾部融入高效多尺度注意力(EMA)机制, 有助于模型更好地捕捉目标车辆的细节特征, 结合160×160像素尺寸的小目标检测层来加强对小目标的检测能力, 通过维度交互进一步聚合像素级特征, 增强对目标车辆的挖掘能力。其次, 为轻量化网络设计了一种多尺度轻量化卷积(MLConv)模块, 并基于MLConv重构了C2f模块, 提高模型的特征提取能力。最后, 为抑制低质量图像产生的有害梯度, 采用WIoU损失函数替代完全交并比(CIoU)损失函数, 优化网络的边界框损失, 提升模型的收敛速度和回归精度。在Streets车辆数据集上进行验证, 结果表明, 改进算法的mAP@0.5、mAP@0.5∶0.95和召回率相较于基准模型YOLOv8n分别提升了1.9、1.4和2.4百分点。在国内车辆数据集和VisDrone2019小目标数据集上进行验证, 改进算法的各项性能指标都有不同程度的提升, 充分证明了改进算法具有良好的泛化性和鲁棒性。与其他主流算法相比, 改进算法同样表现出了更高的准确率和召回率, 表明该算法对于城市车辆目标检测具有更好的性能。

  • 开发研究与工程应用
    朱亚州, 杜平川, 柴志雷
    计算机工程. 2025, 51(12): 337-345. https://doi.org/10.19678/j.issn.1000-3428.0069437
    摘要 (263) PDF全文 (141) HTML (1)   可视化   收藏

    Kubernetes作为容器编排的主流工具, 可支持自动部署、服务发现以及负载均衡, 且具有高可用性、高效能的特点。然而, Kubernetes采用的最佳适应算法或最小负载法等调度策略忽略了节点的异构性和性能的差异性。此外, Kubernetes工具仅考虑CPU资源和内存资源且预先设置统一权重机制, 容易导致负载不均衡、性能下降以及无法满足精细化调度等问题。针对这些问题, 提出了一种基于多维度资源的异构任务调度(A-KCSS)算法, 该算法基于集群的异构计算资源, 增加磁盘输入/输出(I/O)、网络I/O负载以及GPU资源作为评价指标进行过滤和筛选, 更全面地考虑了node的异构性。此外, 引入一种基于多维度资源因素的权重计算模型, 依据待调度任务的资源需求, 计算待调度任务各维度资源因素的权重值, 结合集群node的实时资源利用率计算出每一个node的评分, 依据评分进行优先级排序, 并选择优先级最高的node进行调度。通过实验在Kubernetes集群上测试了A-KCSS算法的性能, 该算法与Kubernetes默认的调度算法以及Kubernetes容器调度(KCSS)算法相比, 平均响应时间分别减少10%和4%, 吞吐量分别提高30%和15%, 可用性分别提高40%和30%, 负载均衡性分别提高23%和18%, 集群的整体性能得到提高。

  • 热点与综述
    王月昊, 周若华
    计算机工程. 2025, 51(2): 35-53. https://doi.org/10.19678/j.issn.1000-3428.0068739
    摘要 (263) PDF全文 (77) HTML (7)   可视化   收藏

    语音唤醒作为实现人机交互的关键技术, 一直是语音领域的研究热点。随着深度学习技术的发展, 其研究方法的重心已从传统的大词汇连续语音识别(LVCSR)技术逐渐转向基于神经网络的技术, 然而如何在小型设备上实现高效唤醒并利用有限的样本数据进行模型训练仍是低资源语音唤醒系统设计面临的挑战。首先, 定义了语音唤醒中的低资源概念, 区分了语音唤醒和语音识别以及相关术语, 介绍了经典的语音唤醒模型及其适配场景, 阐述了低资源语音唤醒的国内外研究现状。其次, 从语音唤醒系统的结构组成的角度分别说明了声学特征提取与声学模型的主流技术和优化策略。然后, 对语音唤醒模型的轻量化方法展开分析并对其优缺点进行比较, 总结了数据低资源语音唤醒中常见的小样本学习、零样本学习、迁移学习等解决方法, 并介绍了常见语音唤醒数据集和评价指标。最后, 探讨并展望了低资源语音唤醒技术未来的研究方向。

  • 人工智能与模式识别
    饶东宁, 许正辉, 梁瑞仕
    计算机工程. 2025, 51(2): 94-101. https://doi.org/10.19678/j.issn.1000-3428.0068433
    摘要 (260) PDF全文 (91) HTML (7)   可视化   收藏

    知识库问答旨在利用事先构建好的知识库来回答用户提出的问题。现有的知识库问答研究主要通过对候选实体和关系路径进行排序, 最后将三元组的尾实体作为答案返回。用户给出的问题经过实体识别模型和实体消歧模型之后, 可以链接到知识库中与答案相关的候选实体。利用语言模型的生成能力, 可以将答案拓展为一句话并返回, 这对用户而言是更加友好的。为了提高模型的泛化能力和弥补问题文本与结构化知识之间的差别, 将候选实体及其一跳关系子图通过提示模板进行组织输入到生成模型中, 并在回答模板的引导下生成通俗流畅的回答。在NLPCC 2016 CKBQA和KgCLUE两个中文数据集上的实验结果表明: 该方法在BLEU、METEOR和ROUGE指标上分别平均比BART-large模型提高了2.8、2.3和1.5百分点; 在Perplexity指标上, 该方法与ChatGPT的回答表现相当。

  • 人工智能与模式识别
    孙子文, 钱立志, 袁广林, 杨传栋, 凌冲
    计算机工程. 2025, 51(4): 158-168. https://doi.org/10.19678/j.issn.1000-3428.0068892
    摘要 (258) PDF全文 (168) HTML (11)   可视化   收藏

    基于Transformer的目标跟踪方法广泛应用在计算机视觉领域, 并取得了优异的效果。但是, 由于在实际跟踪任务中受目标变换、目标遮挡、光照变化以及目标快速运动等因素的影响, 导致目标信息发生变化, 现有方法对目标模板变化信息利用不足, 限制了跟踪性能的提高。为此, 通过附加一条动态模板更新分支反映目标最新的外观和运动状态, 提出一种基于实时动态模板更新的Transformer目标跟踪方法TransTRDT。该分支通过模板质量评分头对模板是否更新进行判断, 当判定可以进行更新时, 随后将初始模板、前一帧动态模板以及裁剪后的最新预测结果传入动态模板更新网络中更新动态模板, 通过获取更可靠的模板从而实现更准确的目标跟踪。在公共数据集上的实验结果表明, TransTRDT在GOT-10k、LaSOT以及TrackingNet上的跟踪性能优于SwinTrack和StarK等算法, 在OTB100中的跟踪成功率为71.9%, 跟踪速度为36.82帧/s, 达到目前行业的领先水平。

  • 人工智能与模式识别
    翟志鹏, 曹阳, 沈琴琴, 施佺
    计算机工程. 2025, 51(9): 139-148. https://doi.org/10.19678/j.issn.1000-3428.0069439
    摘要 (258) PDF全文 (106) HTML (17)   可视化   收藏

    精准的交通流预测是实现智能交通系统的关键前提,对加强系统的仿真和控制、提高管理者的决策等方面具有重要意义。针对大多数现有的图卷积网络(GCN)模型忽略交通流数据的动态时空变化、对节点信息使用不足导致时空相关性提取不充分的问题,提出一种基于多时空图融合与动态注意力的交通流预测模型。首先,以不同的卷积单元提取交通流数据中多时域状态下的时间特征;然后,构建多时空图体现节点在空间分布中的动态变化趋势和异质性,并结合GCN提取空间特征;最后,利用多头自注意力机制分别对时空特征进行分析与融合,输出预测结果。在两个实际的公共数据集PeMS04和PeMS08上进行实验分析,并与基于注意力的时空图卷积网络(ASTGCN)、多视角的时空Transformer网络(MVSTT)和动态时空感知图神经网络(DSTAGNN)等基于时空图卷积网络的基准模型对比,结果表明所提模型在平均绝对误差(MAE)、平均绝对百分比误差(MAPE)和均方根误差(RMSE)指标上分别平均降低了7.10%、7.22%和6.47%,具有较强的适应性和鲁棒性。

  • 热点与综述
    蒋淇淇, 张亮, 彭凌祺, 阚海斌
    计算机工程. 2025, 51(3): 24-33. https://doi.org/10.19678/j.issn.1000-3428.0069378
    摘要 (256) PDF全文 (357) HTML (36)   可视化   收藏

    大数据时代的到来与信息种类的丰富对数据的受控共享提出了更加细粒度的要求, 基于属性的分布式加密(DABE)可以支持多个参与方之间的数据细粒度访问控制。时兴的物联网数据共享场景对于数据的跨域访问、透明可信度与可控性都有着更高需求, 传统的基于属性的加密(ABE)方案的计算开销对于资源有限的小型设备造成了一定的负担。为了解决上述问题, 提出一种基于区块链的可问责可验证外包分层属性加密方案。该方案支持数据跨域流通, 通过区块链技术保障数据流通的透明度与可信性, 引入可验证凭证(VC)概念解决用户身份认证问题, 借助外包思想将复杂的加解密过程造成的负担分散给外包计算节点, 最终利用分层思想实现更加细粒度的数据访问控制。安全性分析表明, 该方案可以抵抗选择明文攻击。通过使用Docker模拟算力有限的小型设备进行实验, 结果表明该方案相较现有方案具有更低的计算开销, 在属性个数为30时各个算法的计算开销不超过2.5 s, 平均开销为1 s, 适用于资源受限的应用场景。

  • 体系结构与软件技术
    孟凡丰, 王子聪, 张金涛, 王彦景, 欧洋, 吴利舟, 肖侬
    计算机工程. 2025, 51(3): 180-188. https://doi.org/10.19678/j.issn.1000-3428.0068707
    摘要 (254) PDF全文 (77) HTML (22)   可视化   收藏

    大数据时代的各类数据中心应用程序对大规模数据的存储与计算需求越来越大, 海量数据的访问开销成为限制应用程序性能的主要瓶颈, 计算快速链路(CXL)互联协议的出现为这一问题提供了新的解决思路。提出一种基于CXL的内存池系统软硬件设计。在硬件层面, 基于CXL扩展内存协议, 在系统结构模拟器gem5上构建CXL扩展内存设备。通过将设备内存暴露在中央处理器(CPU)地址空间内, 使得CPU可以直接使用load/store指令访问设备内存。在操作系统层面, 编写CXL设备的驱动程序, 为管理和访问设备提供了完整的软件栈。通过在用户态使用memkind库整合主机与设备内存, 从而向应用程序提供统一的内存视图。通过gem5的全系统模式搭建完整的CXL扩展内存池原型系统, 对系统进行全面的性能评估。使用基准测试membench和STREAM对主机本地动态随机存取内存(DRAM)与主机管理设备内存(HDM)进行了延迟和带宽的对比分析, 实验结果显示: HDM延迟约为DRAM的1.5倍, HDM的带宽约为DRAM的50%~63%。此外, 在DRAM和HDM上运行了真实的键值存储引擎Viper, 发现在DRAM容量受限的场景下, 使用扩展的HDM有2~7倍的性能提升。

  • 热点与综述
    袁亚剑, 毛力
    计算机工程. 2025, 51(3): 54-63. https://doi.org/10.19678/j.issn.1000-3428.0069042
    摘要 (250) PDF全文 (213) HTML (19)   可视化   收藏

    交通标志检测在辅助驾驶中扮演着不可或缺的角色, 为安全驾驶提供了至关重要的支持。在实际交通环境中, 在黑夜或雨天产生的背景噪声会加大交通标志检测的难度。现有模型往往难以有效检出远处的小目标交通标志, 此外, 在设计交通标志检测模型时应当考虑到实际部署对模型体积的要求。为此, 在YOLOv8的基础上提出一种增强前景的轻量级交通标志目标检测模型。首先, 设计了1个轻量级的PC2f模块替换掉原本Backbone中的部分C2f模块, 该模块降低了模型的参数量和计算量, 在保留更多浅层信息的同时进一步丰富了梯度流信息, 同时实现了模型轻量化和提升检测性能; 其次, 设计了前景增强模块(FEM)并将其引入Neck位置, 该模块能够有效放大前景信息并减弱背景噪声; 最后, 增加了一层小目标检测层, 用于在高分辨率的图像上提取浅层特征, 加强模型对小目标交通标志的检测性能。实验结果表明, 优化后的模型在数据集CCTSDB 2021和GTSDB上的mAP50分别达到了82.5%和95.3%, 相较于原模型分别提升了3.6和1百分点, 并且模型权重大小减小了0.22×106。这些结果验证了所提模型在实际应用中的有效性。

  • 图形图像处理
    王杨, 宋世佳, 王鹤琴, 袁振羽, 赵立军, 吴其林
    计算机工程. 2025, 51(2): 312-321. https://doi.org/10.19678/j.issn.1000-3428.0068905
    摘要 (246) PDF全文 (68) HTML (5)   可视化   收藏

    光照一致性是增强现实(AR)系统中实现虚实有机融合的关键因素之一。由于拍摄视角的局限性和场景光照的复杂性, 开发者在估计全景照明信息时通常忽略局部光照一致性, 从而影响最终的渲染效果。为解决这一问题, 提出一种基于改进视觉Transformer(ViT)结构的局部光照一致性估计框架(ViTLight)。首先利用ViT编码器提取特征向量并计算回归球面谐波(SH)系数, 进而恢复光照信息; 其次改进ViT编码器结构, 引入多头自注意力交互机制, 采用卷积运算引导注意力头之间相互联系, 在此基础上增加局部感知模块, 扫描每个图像分块并对局部像素进行加权求和, 捕捉区域内的特定特征, 有助于平衡全局上下文特征和局部光照信息, 提高光照估计的精度。在公开数据集上对比主流特征提取网络和4种经典光照估计框架, 实验和分析结果表明, ViTLight在图像渲染准确率方面高于现有框架, 其均方根误差(RMSE)和结构相异性(DSSIM)指标分别为0.129 6和0.042 6, 验证了该框架的有效性与正确性。

  • 人工智能与模式识别
    蔡瑞初, 许遵鸿, 陈道鑫, 杨振辉, 李梓健, 郝志峰
    计算机工程. 2025, 51(3): 105-112. https://doi.org/10.19678/j.issn.1000-3428.0068937
    摘要 (236) PDF全文 (44) HTML (12)   可视化   收藏

    在量子化学领域, 分子性质预测是一项基础而关键的任务, 广泛应用于药物发现、化学合成预测等多个领域。随着人工智能的发展, 深度学习方法在该领域得到了广泛应用。然而, 当前的方法往往采用微观和宏观视图两种极端的抽象层次来对分子性质进行建模, 导致难以推广到分布之外样本的挑战。化学的介观视图提供了一个有益的中间层次, 通过包含与性质相关的功能基团的介观成分来描述分子性质。通过考虑这些介观成分, 并从因果关系的角度对其进行建模, 可以更加关注与性质相关的功能基团。为了实现该目标, 提出一种介观成分识别模型。该模型基于分子数据的介观因果生成过程和变分自编码器的框架, 通过学习与分子性质相关的介观成分的表示, 实现对分子性质的预测。首先假设原子隐变量遵循高斯分布和语义隐子结构遵循多元伯努利分布, 将分子数据输入神经网络来识别原子隐变量和语义隐子结构。接着利用识别出来的原子隐变量和语义隐子结构来预测分子性质。为了能够识别出原子隐变量和语义隐子结构, 利用变分下界和稀疏项来构造模型的损失函数。实验结果表明, 该模型不仅在性能上取得先进的结果, 而且提供了深入的解释, 为模型预测提供了更全面的理解, 提高分子性质预测的准确性和泛化能力。

  • 开发研究与工程应用
    张佳承, 韦锦, 陈义时
    计算机工程. 2025, 51(7): 362-374. https://doi.org/10.19678/j.issn.1000-3428.0069524
    摘要 (236) PDF全文 (52) HTML (18)   可视化   收藏

    针对道路两侧绿篱修剪的目标检测过程中对算法实时性、轻量化的要求以及算法在实际检测中的精度和光照鲁棒性问题,提出一种基于YOLOv8n的算法MGW-YOLO,并给出一种新的C2f_ModuGhost+模块来替换主干网络中的C2f模块,其中设计的调制可变形卷积增加了偏移量特征通道数,以加速模型的推理,增强算法实时性。在颈部网络中引入分组空间卷积(GSConv)轻量级卷积技术和slim-neck设计范式,并通过融合标准卷积、深度可分离卷积和Shuffle模块的思想,降低模型的参数量,实现模型的轻量化。设计一种具有双重加权机制的Focal-WIoU损失函数,WIoU中的双层交叉注意力机制可有效降低多个绿篱相连和遮挡时的误检率,并且利用Focal Loss权重因子提升对特殊形状绿篱等难分类样本的检测精度。另外采用TRADES方法的对抗训练策略,在分类问题鲁棒性与精度之间进行有效权衡。实验结果表明,相比基线算法YOLOv8n,MGW-YOLO的mAP@0.5和mAP@0.5 ∶0.95分别提高了3.29和2.87百分点,在无人驾驶底盘上的实验结果表明,MGW-YOLO相较于原始算法的预处理时间、每帧平均推理时间和每帧后处理时间分别降低了0.7 ms、10.7 ms和0.7 ms,检测速度提升了15.7帧/s,适用于绿篱修剪机在道路两侧实时性作业的需求。

  • 空天地一体化算力网络
    王克文, 张维庭, 孙童
    计算机工程. 2025, 51(5): 52-61. https://doi.org/10.19678/j.issn.1000-3428.0069471
    摘要 (234) PDF全文 (195) HTML (10)   可视化   收藏

    为满足卫星数据处理、车辆远程控制等快速响应和大范围覆盖的应用场景需求, 聚焦于采用分层控制和人工智能技术的方法, 设计一种空天地一体化算力网络资源调度机制。将空天地网络划分为3个域, 分别部署域控制器, 负责本地域的资源管理, 同时通过卫星和无人机的覆盖范围进行地面区域划分, 确保地面区域能够得到有效的服务保障, 以实现高效的数据传输和任务处理。为了优化空天地算力网络资源利用率, 引入多智能体强化学习算法, 对不同场景下产生的计算任务进行实时处理, 将每个域控制器视为具备任务调度和资源分配能力的智能体, 在满足时延和能耗的约束下, 通过协同学习和分布式决策实现计算任务智能调度和高效分配。实验结果表明, 该机制能够有效提高资源利用率和缩短任务响应时间。

  • AI算力赋能的车载边缘计算
    朱思远, 李佳圣, 邹丹平, 何迪, 郁文贤
    计算机工程. 2025, 51(9): 14-24. https://doi.org/10.19678/j.issn.1000-3428.0069534
    摘要 (228) PDF全文 (192) HTML (41)   可视化   收藏

    非结构化道路的缺陷目标检测任务对道路交通安全具有重要意义,但检测所需的标注数据集相对有限。为了解决非结构化道路标注数据集缺乏以及现有模型对无标注数据学习能力不足的问题,提出一种MAM(Multi-Augmentation with Memory)半监督目标检测算法。首先,引入缓存机制存储无标注图像和带有伪标注图像的框回归位置信息,避免了后续匹配造成的计算资源浪费。其次,设计混合数据增强策略,将缓存的伪标签图像与无标签图像混合输入学生模型,以增强模型对新数据的泛化能力,并使图像的尺度分布更加均衡。MAM算法不受目标检测模型的限制,并且更好地保持了目标框的一致性,避免了计算一致性损失。实验结果表明,MAM算法相比其他全监督学习和半监督学习算法更具优越性,在自建的非结构化道路缺陷数据集Defect上,在标注比例为10%、20%和30%的场景下,MAM算法的均值平均精度(mAP)相比于Soft Teacher算法分别提升了6.8、11.1和6.0百分点,在自建的非结构化道路坑洼数据集Pothole上,在标注比例为15%和30%的场景下,MAM算法的mAP相比于Soft Teacher算法分别提升了5.8和4.3百分点。

  • 人工智能与模式识别
    李淑怡, 阳波, 陈灵, 沈玲, 唐文胜
    计算机工程. 2025, 51(3): 86-94. https://doi.org/10.19678/j.issn.1000-3428.0068626
    摘要 (227) PDF全文 (83) HTML (11)   可视化   收藏

    针对机器人清洁作业过程中现有曲面覆盖方法难以适应曲面变化且覆盖效率低的问题, 提出一种自适应奖励函数的近端策略优化(PPO)曲面覆盖方法(SC-SRPPO)。首先, 将目标曲面离散化, 以球查询方式获得协方差矩阵, 求解点云的法向量, 建立3D曲面模型; 其次, 以曲面局部点云的覆盖状态特征和曲率变化特征作为曲面模型观测值以构建状态模型, 有利于机器人移动轨迹拟合曲面, 提高机器人对曲面变化的适应能力; 接着, 基于曲面的全局覆盖率和与时间相关的指数模型构建一种自适应奖励函数, 引导机器人向未覆盖区域移动, 提高覆盖效率; 最后, 将曲面局部状态模型、奖励函数、PPO强化学习算法相融合, 训练机器人完成曲面覆盖路径规划任务。在球形、马鞍形、立体心形等3种曲面模型上, 以点云覆盖率与覆盖完成时间作为主要评价指标进行实验, 结果表明, SC-SRPPO的平均覆盖率为90.72%, 与NSGA Ⅱ、PPO、SAC这3种方法对比, 覆盖率分别提升4.98%、14.56%、27.11%, 覆盖完成时间分别缩短15.20%、67.18%、62.64%。SC-SRPPO能够在适应曲面变化的基础上使机器人更加高效地完成曲面覆盖任务。