作者投稿和查稿 主编审稿 专家审稿 编委审稿 远程编辑

阅读排行

  • 一年内发表的文章
  • 两年内
  • 三年内
  • 全部
Please wait a minute...
  • 全选
    |
  • 图形图像处理
    王舒梦, 徐慧英, 朱信忠, 黄晓, 宋杰, 李毅
    计算机工程. 2025, 51(9): 280-293. https://doi.org/10.19678/j.issn.1000-3428.0069353
    摘要 (1113) PDF全文 (477) HTML (75)   可视化   收藏

    在无人机(UAV)航拍中, 目标通常是密集分布、特征不明显的小目标, 且物体尺度变化较大。因此, 目标检测容易出现漏检和误检的问题。为了解决这些问题, 提出了一种基于改进YOLOv8n的航拍轻量化小目标检测算法: PECS-YOLO。该算法通过在Neck部分增加P2小目标检测层, 将浅层和深层的特征图进行拼接, 以更好地捕捉小目标的细节信息; 将轻量化卷积PartialConv引入全新的结构CSPPC(Cross Stage Partial PartialConv), 替换Neck网络中的C2f(Concatenation with Fusion), 实现模型轻量化; 引入SPPELAN(Spatial Pyramid Pooling with Efficient Layer Aggregation Network), 以有效地捕捉小目标特征; 通过在Neck部分每个检测头前加入压缩和激励(SE)注意力机制, 使网络更好地关注有用的通道, 减少复杂环境中背景噪声对小目标检测任务的干扰; 最后使用EfficiCIoU作为边界框损失函数, 将边界框的形状差异也考虑在内, 以增强模型对小目标的检测能力。实验结果表明: 相比YOLOv8n, PECS-YOLO目标检测算法在VisDrone2019-DET数据集上交并比为0.5的平均精度(mAP@0.5)提高了3.5%, 交并比为0.5∶0.95的平均精度(mAP@0.5∶0.95)提高了3.7%, 模型参数量减少了约25.7%, 检测速度提高了约65.2%。综上所述, PECS-YOLO模型适合于UAV航拍下的小目标检测任务。

  • 人工智能与模式识别
    彭菊红, 张弛, 高谦, 张光明, 谈栋华, 赵明俊
    计算机工程. 2025, 51(7): 152-160. https://doi.org/10.19678/j.issn.1000-3428.0069283
    摘要 (945) PDF全文 (491) HTML (100)   可视化   收藏

    在工业场景下钢材表面缺陷检测技术存在检测精度低、收敛速度慢等问题。为此, 提出一种改进的YOLOv8算法YOLOv8n-MDC。首先, 在骨干网络中加入多尺度交叉融合网络(MCN), 通过在特征层之间建立更紧密的连接, 促进信息的均匀传递, 减少跨层特征融合时的语义信息损失, 从而增强模型对钢材缺陷的感知能力; 其次, 在模块中引入可变形卷积, 自适应地改变卷积核的形状与位置, 从而更灵活地捕捉不规则缺陷的边缘特征, 减少信息丢失, 提升检测的准确性; 最后, 加入坐标注意力(CA)机制, 将位置信息嵌入到通道中, 解决了位置信息丢失的问题, 使模型能够更精确地感知缺陷的位置及其形态特征, 从而提升检测的精度和稳定性。在NEU-DET数据集上的实验结果表明, YOLOv8n-MDC算法的mAP@0.5达到了81.0%, 相比原基准网络提升了4.2百分点, 该算法收敛速度较快、精度较高, 更能满足实际工业生产的要求。

  • 计算机视觉与图形图像处理
    唐克, 魏飞鸣, 李东瀛, 郁文贤
    计算机工程. 2026, 52(3): 97-106. https://doi.org/10.19678/j.issn.1000-3428.0070085
    摘要 (803) PDF全文 (190) HTML (20)   可视化   收藏

    针对无人机图像中小目标实例多、目标间存在遮挡所导致的漏检和误检等现象, 提出一种基于改进YOLOv8的轻量化无人机图像小目标检测算法。首先, 在颈部引入三特征编码器(TFE)、尺度序列特征融合(SSFF)模块, 增强了网络对不同尺度特征的提取能力。接着, 设计小目标检测层(SMOH), 并将其与改进的颈部特征提取网络进行融合, 在头部引入一个额外的检测头, 减小小目标特征的损失, 增强网络对小目标的识别能力。然后, 针对完整交并比(CIoU)的缺陷, 结合适应交并比(Wise-IoU)、内部交并比(Inner-IoU)和最小点距离交并比(MPDIoU), 提出了一种回归损失函数Wise-Inner-MPDIoU。最后, 为了实现算法在移动端和嵌入式场景下的轻量化应用需求, 进行了基于幅度的层自适应稀疏化剪枝, 在保证模型精度的同时进一步压缩了模型大小。实验结果表明, 相比于原YOLOv8s算法模型, 改进后的模型在mAP@0.5提高6.8百分点的同时参数量、计算量、模型大小分别降低76.4%、17.1%、73.5%, 在检测精度与轻量化方面均取得了显著提升, 具有很强的实用价值。

  • 多模态与信息融合
    李健浪, 吴新电, 陈灵, 阳波, 唐文胜
    计算机工程. 2026, 52(2): 299-310. https://doi.org/10.19678/j.issn.1000-3428.0070113
    摘要 (795) PDF全文 (226) HTML (26)   可视化   收藏

    针对自动驾驶场景中行人和车辆的目标识别与定位问题, 提出一种四维(4D)毫米波雷达与视觉融合的CDCAM-BEV算法, 以提高目标检测的精度。首先, 设计雷达柱体网络, 将4D雷达点云编码为伪图像, 并通过正交特征变换(OFT)将单目图像转换为鸟瞰图(BEV)特征; 其次, 基于交叉注意力机制, 设计共同信息提取模块(CICAM)和差异信息提取模块(DICAM), 充分挖掘雷达和图像的公共信息和差异信息; 最后, 基于CICAM和DICAM设计BEV特征融合模块, 实现图像信息和雷达信息在BEV空间的特征级融合。在VOD数据集上进行实验, 将CDCAM-BEV算法与其他5种三维(3D)目标检测算法进行对比。实验结果表明, CDCAM-BEV在多个模式下检测性能均优于其他算法。在3D模式下, CDCAM-BEV的平均检测精度比排名第二的Part-A2高出3.65百分点; 在BEV模式下, 比排名第二的PointPillars高出5.04百分点; 在平均方向相似度(AOS)模式下, 比排名第二的Part-A2高出2.62百分点。结果显示, CDCAM-BEV在各模式下均表现出卓越性能, 能够有效融合图像和4D雷达点云特征, 显著提高目标检测的精度和可靠性。

  • 图形图像处理
    王国明, 贾代旺
    计算机工程. 2025, 51(12): 294-303. https://doi.org/10.19678/j.issn.1000-3428.0070027
    摘要 (764) PDF全文 (337) HTML (56)   可视化   收藏

    深度学习在目标检测领域的广泛应用显著提升了对大中目标的检测能力。然而, 针对小目标检测, 由于其固有的尺度小、背景复杂等挑战, 传统的目标检测算法常常会出现漏检、误检。为了提高小目标检测的精度, 对YOLOv8模型进行研究。首先, 将主干部分的卷积模块替换为RFAConv模块, 增强了模型对于复杂图像的处理能力; 其次, 在Neck部分引入混合局部通道注意力(MLCA)机制, 能够在保持计算效率的同时, 帮助模型更高效地融合不同层次的特征; 再次, 将YOLOv8的Detect头替换为Detect_FASFF头, 以解决不同特征尺度间的一致性问题, 并增强模型对小目标的检测能力; 最后, 将完全交并比(CIoU)损失函数替换为Focaler-IoU损失函数, 使模型更关注难以精确定位的小目标。实验结果显示: 改进后的模型在小目标稀疏的FloW-Img数据集上mAP@0.5提高了4.8百分点, mAP@0.5:0.95提高了3.0百分点; 在小目标密度高的VisDrone2019数据集上, mAP@0.5提升了5.9百分点, mAP@0.5:0.95提高了4.0百分点。同时还在低空数据集AU-AIR以及行人密集检测数据集WiderPerson上做了泛化对比实验。结果表明, 优化后的模型相比较原模型在小目标检测精度上有显著提升, 且适用范围更广。

  • 热点与综述
    孙丽郡, 孟繁军, 徐行健
    计算机工程. 2025, 51(11): 1-21. https://doi.org/10.19678/j.issn.1000-3428.0069543
    摘要 (626) PDF全文 (4528) HTML (55)   可视化   收藏

    在教育信息化持续推进的背景下, 构建精准且高效的课程知识图谱已成为推动教育个性化发展的关键任务之一。课程知识图谱作为一种结构化的知识表示模型, 旨在揭示课程内容与学习目标之间的复杂关联关系, 以优化教育资源配置, 并为学习者定制个性化的学习路径。围绕课程知识图谱的构建技术进行探讨, 首先阐述知识图谱、教育知识图谱、课程知识图谱的基本概念及其之间的内在联系与显著差异; 其次深入剖析课程知识图谱构建的关键技术, 涵盖课程本体设计、实体抽取、关系抽取等方面, 并对其发展历程、特点及局限性展开详细分析与总结; 再次, 探讨课程知识图谱在学习资源推荐、学习者画像建模和多模态课程知识图谱构建等场景中的应用价值; 最后, 聚焦于课程知识图谱在构建过程中所面临的难题, 如数据多样性和异构性、知识图谱质量难以评估以及多课程交叉融合不足等, 从深度学习、大语言模型(LLM)等前沿技术的角度出发, 对未来的发展趋势进行展望。

  • 大模型与生成式人工智能
    王合庆, 魏杰, 景红雨, 宋晖, 徐波
    计算机工程. 2026, 52(2): 383-392. https://doi.org/10.19678/j.issn.1000-3428.0070415
    摘要 (611) PDF全文 (1191) HTML (18)   可视化   收藏

    大语言模型(LLM)在对话、推理和知识保留能力方面展现了显著优势, 但在处理电力领域知识密集型任务时仍面临事实准确性不足、知识更新难以及高质量领域数据集匮乏的问题。针对这些挑战, 引入一种改进的检索增强生成(RAG)策略, 该策略融合了混合检索策略和经过微调的生成模型, 提供了更高效的知识捕获和更新能力。基于对现有方法的深入分析, 针对电力领域的知识问答(QA)任务, 提出了元数据驱动的RAG框架Meta-RAG, 该框架包含数据准备、模型微调和检索推理3个阶段。数据准备阶段包括文档转换、元信息抽取与增强及文档解析模块, 在此阶段, 借助元信息的提取与增强确保了电力规范文档的高效索引和结构化处理, 并且构建了电力领域的EleQA(Electricity Question Answering)数据集, 这是一个包含19 560个问答对的电力规范问答数据集。在模型微调阶段, 通过多问题生成、思维链提示生成和监督指令微调数据集构建模块, 优化了模型在特定电力问答任务上的推理能力。在检索推理阶段则采用混合编码和重排序策略, 结合检索和生成模块, 进一步提高了答案的准确性和合理性。通过一系列实验, Meta-RAG的有效性得到验证。与Self-RAG、Corrective-RAG、Adaptive-RAG、RA-ISF等基线模型相比, Meta-RAG具有更高的回答准确率和检索命中率, 其中, 基于Qwen1.5-14B-Chat模型的Meta-RAG达到了整体准确率0.804 3, 高于其他方法。消融实验和文档召回实验结果表明文档检索对框架性能影响最大, 失去检索能力整体准确率下降了0.292 8。

  • 前沿观点与综述
    秦颖鑫, 张可佳, 潘海为, 巨亚昊
    计算机工程. 2026, 52(2): 46-68. https://doi.org/10.19678/j.issn.1000-3428.0069826
    摘要 (606) PDF全文 (268) HTML (32)   可视化   收藏

    深度学习引领人工智能蓬勃发展, 被广泛用于计算机视觉, 在图像识别、目标检测、目标跟踪、人脸识别等复杂任务上取得了突破性进展和显著的成果, 展现出其卓越的识别和预测能力。但深度学习模型的脆弱性和漏洞也逐渐暴露, 以卷积神经网络为代表的深度学习技术对精心设计的对抗样本极为敏感, 容易对模型的安全性和隐私性造成影响。首先, 总结对抗攻击的概念、对抗样本产生的原因以及相关术语, 概述数字域和物理域中几类经典的对抗攻击策略, 对其优缺点进行分析; 其次, 专注计算机视觉, 从数字域和物理域两个方面分别总结目标检测、人脸识别、目标跟踪、单目深度估计、光流估计中对抗攻击的最新研究进展以及常用于研究的各种数据集, 简单介绍现阶段对抗样本的防御和检测方法, 归纳对抗样本防御和检测方法的优缺点, 阐述不同视觉任务对抗样本防御的应用实例; 最后, 基于对抗攻击方法的总结, 探索并分析现有计算机视觉对抗攻击的不足和挑战。

  • 热点与综述
    路悦, 周翔宇, 张世周, 梁国强, 邢颖慧, 程德, 张艳宁
    计算机工程. 2025, 51(10): 1-17. https://doi.org/10.19678/j.issn.1000-3428.0070575
    摘要 (573) PDF全文 (537) HTML (60)   可视化   收藏

    传统机器学习算法只有当测试集和训练集同分布时才能取得较好的性能, 无法增量地学习原训练集中没有的新类别或任务。持续学习使模型得以具备自适应学习能力, 在持续学习新任务的同时能够防止对旧任务的遗忘。当前持续学习仍面临计算开销大、存储成本高以及性能不稳定等挑战。近年来, 预训练模型的发展为持续学习提供了新的研究方向, 有望进一步提高性能表现。首先, 分析了现有基于预训练的持续学习方法, 按照防止遗忘的机制将其归纳为基于提示池、缓慢更新参数、基于扩展主干网络分支、基于参数正则化、基于分类器设计5类方法, 进一步按照阶段数、微调方式和是否利用语言模态对其进行归类并总结了各类方法的主要特点和各自优势。然后, 分析了持续学习方法存在的主要挑战, 归纳了各类持续学习方法的适用场景和局限性, 在多个评测基准上对各类方法进行实验比较并讨论各方法的性能差异。最后, 对基于预训练的持续学习方法的研究趋势进行展望。

  • 人工智能与模式识别
    黄昆, 齐肇建, 王娟敏, 胡倩, 胡伟超, 皮建勇
    计算机工程. 2025, 51(5): 133-142. https://doi.org/10.19678/j.issn.1000-3428.0069026
    摘要 (560) PDF全文 (342) HTML (52)   可视化   收藏

    密集行人检测是公共智能监控的关键技术, 其采用目标检测方法对视频中的行人位置和数量进行检测, 进而实现对视频中人群的智能监控。在人员密集场景下因遮挡和行人的目标太小造成漏检。为此, 提出一种改进YOLOv8检测模型Crowd-YOLOv8。首先, 在主干网络使用nostride-Conv-SPD模块, 增强对图像小目标特征等细粒度信息的提取能力; 其次, 在YOLOv8网络的颈部引入小目标检测头和CARAFE上采样算子对各尺度特征进行融合, 以提高在小目标情况下的检测效果。实验结果表明, 所提模型在CrowdHuman数据集上mAP@0.5和mAP@0.5∶0.95分别取得了84.3%和58.2%的检测效果, 与原YOLOv8n相比分别提高了3.7和5.2百分点; 在WiderPerson数据集上取得了88.4%和67.4%, 与原YOLOv8n相比提高了1.1和1.5百分点。

  • 网络空间安全
    姚玉鹏, 魏立斐, 张蕾
    计算机工程. 2025, 51(6): 223-235. https://doi.org/10.19678/j.issn.1000-3428.0069133
    摘要 (542) PDF全文 (139) HTML (36)   可视化   收藏

    联邦学习实现了各参与方在不泄露原始数据的前提下联合建模,有效解决了分布式数据隐私的问题,但随着研究的深入,联邦学习还存在隐私推断攻击或恶意客户端投毒攻击等安全问题。现有联邦学习改进方案大多仅从隐私保护或抗投毒攻击方面进行改进,不能兼顾两种攻击。为了同时解决联邦学习中的推断攻击和投毒攻击,提出一个隐私保护的抗投毒攻击联邦学习(APFL)方案。设计一个模型检测算法,使用差分隐私(DP)技术,根据模型间余弦相似度赋予各客户端相应聚合权重,使用同态加密技术将本地模型加权聚合。在MNIST和CIFAR10数据集上的实验结果表明,APFL在保证数据隐私的同时能有效筛选恶意模型,抵御投毒攻击,当投毒比例不超过50%时,APFL模型性能与无投毒攻击环境下联邦平均(FedAvg)方案一致,模型测试错误率较Krum方案平均降低19%,较FLTrust方案平均降低9%。

  • 热点与综述
    邸钦渤, 陈劭力, 时良仁
    计算机工程. 2025, 51(11): 35-44. https://doi.org/10.19678/j.issn.1000-3428.0069780
    摘要 (503) PDF全文 (610) HTML (35)   可视化   收藏

    随着多变量时序数据在各行业中的广泛应用, 开发有效的异常检测方法对于保障系统的稳定运行和安全性变得极为关键, 由于多变量时序数据内在的复杂性和动态变化特性, 对异常检测算法提出了更高的要求。针对现有异常检测方法在处理含有复杂变量关系的高维数据时存在效率不足的问题, 提出一种基于图神经网络(GNN)与扩散模型的多变量时序数据异常检测算法GRD。通过节点嵌入和图结构学习, GRD算法能有效地捕捉和表示变量间的复杂关系, 并通过门控循环单元(GRU)和去噪扩散概率模型(DDPM)进一步提取特征, 实现了对异常数据的高精度检测。在以往的实验评估中, 大多数算法在评分前会采用点调整(PA)评估协议, 该协议会严重高估算法的检测能力。为了更准确地评估算法性能, 采用新的评估协议和评价指标。实验结果表明, GRD算法在3个公开数据集上的F1@k指标分别是0.741 4、0.801 7、0.767 1, 性能优于现有方法。特别是在高维数据处理方面, GRD算法展现出显著优势, 证明了其在现实场景的异常检测应用中的实用性和鲁棒性。

  • 热点与综述
    赵楷, 胡煜环, 闫俊桥, 毕雪华, 张琳琳
    计算机工程. 2025, 51(8): 1-15. https://doi.org/10.19678/j.issn.1000-3428.0069147
    摘要 (498) PDF全文 (282) HTML (74)   可视化   收藏

    区块链作为一种分布式可信数据库,在数字版权保护领域得到有效应用,引起学术界和工业界的广泛关注。传统数字版权保护技术存在侵权追踪难、版权交易复杂、合法权益保护不足等问题,严重制约数字版权保护研究的发展。区块链的防篡改、可追溯和去中心化等特性为解决数字版权侵权风险提供了可信、透明和安全的解决思路。首先介绍了区块链技术的基本原理;然后针对传统版权保护方案存在的问题,介绍了区块链结合传统版权保护技术的最新研究成果;接着评估了区块链在实际应用中的效果和潜力,强调其对版权保护体系的积极影响;最后探讨了区块链版权保护面临的挑战和未来发展趋势,以实现更加完善和可持续的区块链版权保护体系。

  • 人工智能与模式识别
    王帅, 史艳翠
    计算机工程. 2025, 51(8): 190-202. https://doi.org/10.19678/j.issn.1000-3428.0069636
    摘要 (485) PDF全文 (259) HTML (62)   可视化   收藏

    序列推荐算法通过对用户的历史行为进行动态建模, 以预测其可能感兴趣的内容。聚焦对比式自监督学习(SSL)在序列推荐中的应用, 通过设计有效的自监督信号, 增强模型在稀疏数据场景下的表征能力。首先, 针对随机数据增强易引入数据噪声的问题, 提出融合用户偏好的个性化数据增强方法, 通过用户评分引导增强过程, 同时对长、短序列使用不同的增强方法组合, 生成符合用户偏好的增强序列; 其次, 为了缓解训练中出现的数据特征学习不平衡问题, 设计一种混合增强训练法, 在训练前期, 通过随机选择增强方法生成增强序列, 提高模型的性能和泛化能力, 在训练后期, 选择与原始序列相似度较高的增强序列, 使模型全面学习用户的实际偏好和行为模式; 最后, 将传统的序列预测目标与SSL目标相结合, 推断出用户的表示。在数据集Beauty、Toys和Sports上进行实验验证, 结果表明, 相较于基线模型中的最优结果, 所提方法的HR@5指标分别提升了6.61%、3.11%和3.76%, NDCG@5指标分别提升了11.40%、3.50%和2.16%, 上述实验结果验证了该方法的合理性和有效性。

  • 多模态与信息融合
    苏建华, 池云仙, 许云峰, 高凯
    计算机工程. 2026, 52(3): 234-242. https://doi.org/10.19678/j.issn.1000-3428.0069955
    摘要 (480) PDF全文 (131) HTML (12)   可视化   收藏

    意图识别是自然语言理解的一项重要任务, 传统的意图识别研究主要关注于特定任务的单模态意图识别。然而, 在现实世界的场景中, 人类的意图是复杂的, 需要通过整合诸如语言、语调、表情和动作等信息来判断。提出以注意力为主的多模态融合的意图识别方法, 用于在真实世界的多模态场景中进行意图识别。为了能够捕捉和融合不同模态之间的长距离依赖关系, 自适应地调整各模态信息的重要性和提供更丰富的表示, 对每个模态特征分别使用自注意力机制。通过在每个模态的特征中添加明确的模态标识, 使模型能够区分并有效融合不同模态的信息, 提升整体理解和决策能力。考虑到在跨模态交互时文本模态信息的重要性, 使用以跨注意力机制为核心、以文本为主导其他模态辅助交互引导的多模态融合, 旨在促进文本与视觉、听觉模态之间的交互。最后对多模态意图识别的MIntRec和MIntRec2.0基准数据集进行了实验评估。结果显示, 该方法在准确性、精确度、召回率和F1值等指标上均优于现有的多模态学习方法, 比目前最好的基线方法提升0.1~0.5百分点。

  • 前沿观点与综述
    廖勇, 韩小金, 刘金林, 汪浩
    计算机工程. 2026, 52(3): 41-61. https://doi.org/10.19678/j.issn.1000-3428.0069925
    摘要 (479) PDF全文 (191) HTML (18)   可视化   收藏

    人工智能在诸多领域的应用取得了突破性的进展, 引起了全球各国对其研发的高度重视。然而, 人工智能的快速发展也带来了一系列的问题, 过度依赖和盲目信任人工智能模型可能导致严重的风险。因此, 可解释人工智能成为构建可信、透明的智能系统的关键要素, 其研发变得尤为迫切。为此, 本文综述可解释人工智能的国内外研究进展, 从多维度、多层次进行全面梳理与归纳。首先, 基于当前行业内的研究成果, 将可解释人工智能的关键技术细分为解释模型、解释方法、安全测试及实验验证4类, 旨在明确各领域的技术焦点与发展方向。然后, 探讨可解释人工智能在多个关键行业领域的具体应用实例, 包括但不限于教育、医疗、金融、自动驾驶及司法等, 展示其在提升决策透明度等方面的重要作用。最后, 深入剖析可解释人工智能当前面临的主要技术挑战, 并展望其未来的发展趋势, 尤其针对当前备受瞩目的大模型可解释性问题, 进行了专项调研与探讨分析。

  • AI算力赋能的车载边缘计算
    崔萌萌, 施静燕, 项昊龙
    计算机工程. 2025, 51(9): 25-37. https://doi.org/10.19678/j.issn.1000-3428.0069836
    摘要 (458) PDF全文 (204) HTML (40)   可视化   收藏

    为了进一步优化车载服务的服务质量(QoS),移动边缘计算(MEC)被深度整合于车联网(IoV)中,旨在为车辆提供地理位置较近的计算资源,降低任务处理延迟和能耗。然而,传统的MEC服务器部署主要依赖于地面基站(BS),这不仅导致高昂的部署成本,而且限制其覆盖范围,难以确保为所有车辆提供无间断服务。为了应对上述挑战,空地协同IoV作为一种新兴的技术方案应运而生。无人机(UAV)能够借助其视距链路的灵活性动态地协助路边单元(RSU),为车辆用户提供更为灵活的计算资源,进而保障车载服务的连续性和高效性。提出一种基于空地协同的动态车载边缘任务卸载方法(DVETOM)。该方法采用车-路-空架构,构建了车辆到RSU(V2R)链路和车辆到UAV(V2U)链路。针对车辆任务的本地执行、卸载至RSU执行和卸载至UAV执行3种模式分别构建传输模型和计算模型,并以最小化系统时延和能耗作为联合优化目标构建目标函数。DVETOM将任务卸载问题转化为马尔可夫决策过程(MDP),基于深度强化学习(DRL)的分布式深度确定性策略梯度(D4PG)算法优化任务卸载策略。与5种基准方法进行对比,实验结果表明,DVETOM在提升车辆用户QoS的同时,在降低系统时延方面优于现有方法3.45%~23.7%,在降低系统能耗方面优于现有方法5.8%~23.47%。综上所述,DVETOM有效地优化了IoV中的车载边缘任务卸载,为IoV用户提供了更高效、更节能的服务解决方案,展现了其在智能交通系统领域的广泛应用潜力。

  • 开发研究与工程应用
    周思瑜, 徐慧英, 朱信忠, 黄晓, 盛轲, 曹雨淇, 陈晨
    计算机工程. 2025, 51(5): 326-339. https://doi.org/10.19678/j.issn.1000-3428.0069259
    摘要 (451) PDF全文 (148) HTML (22)   可视化   收藏

    手机屏幕作为人机交互的主窗口, 已成为影响用户体验和终端整体性能的重要因素。因此, 市场对解决手机屏幕瑕疵的需求日益增长。为满足这一需求, 针对在手机屏幕瑕疵检测过程中存在检测精度低、小目标瑕疵漏检率高与检测速度慢的情况, 提出一种以YOLOv8n作为基准模型的PGS-YOLO算法。PGS-YOLO通过增加一个专门的微小目标检测头, 并结合SeaAttention注意力模块, 有效提升对小目标的探测能力; 将骨干网络和特征融合网络分别融入PConv与GhostNetV2轻量化模块, 在保证精度的同时降低模型的参数量, 提高瑕疵检测的速度与效率。实验结果表明, 在北京大学手机屏幕表面瑕疵数据集中, 相较于YOLOv8n, PGS-YOLO算法的mAP@0.5提升了2.5百分点, mAP@0.5∶0.95提升了2.2百分点, 在手机屏幕瑕疵检测过程中不仅能对大片的瑕疵做到精准检测, 还能对小瑕疵保持一定的准确度。此外, 检测性能优于YOLOv5n、YOLOv8s等大部分YOLO系列算法。同时, 参数量仅为2.0×106, 小于YOLOv8n, 满足工业场景对手机屏幕瑕疵检测的需求。

  • 热点与综述
    张锦, 陈铸, 陈照云, 时洋, 陈冠军
    计算机工程. 2025, 51(7): 1-11. https://doi.org/10.19678/j.issn.1000-3428.0068870
    摘要 (441) PDF全文 (715) HTML (52)   可视化   收藏

    在众多科学领域的研究与开发中,模拟器都扮演着不可替代的角色。在体系结构领域尤其如此,模拟器提供了一个安全、成本低廉的虚拟环境,使研究人员能够快速开展实验分析和评测。同时,模拟器还可以加速芯片设计和验证的过程,从而节省时间和资源成本。然而,随着处理器体系结构的演化进步,尤其是专用处理器发展呈现多元化特点,为了能够对体系结构设计探索提供重要的反馈,模拟器的重要作用日益凸显。综述了体系结构模拟器目前的发展与应用现状,重点介绍了几种目前较为典型的体系结构模拟器。通过对专用于不同处理器的模拟器技术手段的分析,深入了解不同架构下模拟器的侧重点及技术难点。此外,还对体系结构模拟器未来发展的关键点进行了思考与评述,以展望其在处理器设计研究领域的前景。

  • 热点与综述
    廖牛语, 田沄, 李岩松, 薛海峰, 杜长坤, 张国华
    计算机工程. 2025, 51(12): 1-17. https://doi.org/10.19678/j.issn.1000-3428.0253230
    摘要 (429) PDF全文 (321) HTML (51)   可视化   收藏

    近年来, 以GPT、LLaMA、Qwen、DeepSeek等为代表的大模型在自然语言处理、计算机视觉及多模态等领域取得了突破性进展。然而, 受限于其推理机制、参数规模和固有的训练数据知识等因素, 这些模型在处理复杂任务、解答专业领域问题及生成时效性内容时, 常出现答案不准确乃至事实性偏差幻觉等问题, 严重制约了其在高可靠性场景中的应用。为突破上述能力瓶颈, 工具学习范式应运而生并迅速成为研究热点, 其核心旨在使大模型理解并使用外部工具以完成特定任务。通过调用数据库、搜索引擎、数学工具等外部工具, 大模型能够超越自身参数化知识, 提升其推理、决策和执行能力, 缓解幻觉问题。本文系统综述了大模型工具学习的发展脉络与技术进展, 剖析了工具对大模型能力的扩展, 梳理了从上下文学习到微调训练的工具调用机制, 进而探讨了工具调用性能优化、自适应工具生成等关键问题, 分析了大模型工具调用的测评方法, 最后总结了当前工具学习面临的挑战并对大模型工具学习未来发展方向进行展望。

  • 图形图像处理
    刘春霞, 孟吉星, 潘理虎, 龚大立
    计算机工程. 2025, 51(7): 326-338. https://doi.org/10.19678/j.issn.1000-3428.0069510
    摘要 (428) PDF全文 (125) HTML (32)   可视化   收藏

    针对现有的目标检测方法在处理背景复杂、有效信息量少的遥感图像时存在的误检、漏检等问题,提出了一种多模态遥感小目标检测方法——BFMYOLO。设计了像素级的红-绿-蓝(RGB)和红外(IR)图像的融合模块, 即多模态融合模块(BFM),充分利用不同模态的互补性,实现两种模态信息的有效融合;设计了全尺度自适应更新模块(AA),解决特征融合过程中的多目标信息冲突问题,通过结合CARAFE上采样算子并进一步融入浅层特征,在加强非相邻层间融合的同时增强小目标的空间信息;设计了改进的任务解耦检测头(IDHead),将分类和回归任务分开处理,以降低不同任务的相互干扰,融合深层语义特征,进一步提升模型的检测性能。采用归一化Wasserstein距离(NWD)损失函数作为定位回归损失函数,降低位置偏差的敏感性。实验结果表明,该方法在VEDAI、NWPU VHR-10和DIOR数据集上的阈值设定为0.5时的均值平均精度(mAP@0.5)分别达到78.6%、95.5%和73.3%,优于其他先进模型, 在遥感小目标检测中表现出良好的性能。

  • 开发研究与工程应用
    陈梓延, 王晓龙, 何迪, 安国成
    计算机工程. 2025, 51(5): 314-325. https://doi.org/10.19678/j.issn.1000-3428.0069122
    摘要 (426) PDF全文 (135) HTML (29)   可视化   收藏

    现有的高精度车辆检测模型参数与计算量过高, 无法在交通智能设备上良好运行, 而轻量化的车辆检测模型精度普遍较低, 不适用于实际任务。为此, 提出一种改进YOLOv8的轻量化车辆检测网络, 将主干网络替换为计算量和内存访问更小的FasterNet网络, 并且将颈部的双向特征金字塔网络替换为加权双向特征金字塔网络(BiFPN), 简化特征融合过程。同时, 引入一种融合注意力机制的动态检测头, 实现检测头和注意力的无冗余结合; 此外, 针对完全交并比(CIoU)在检测精度和收敛速度上的缺陷, 提出一种尺度不变交并比(SIoU)结合归一化高斯Wasserstein距离(NWD)的回归损失算法。最后, 为尽量减小模型对边缘设备的算力需求, 进行基于幅值的层自适应稀疏化剪枝, 进一步压缩模型大小。实验结果表明, 提出的改进模型相较于原模型YOLOv8s, 在精度上升1.5百分点的情况下, 参数量降低78.9%, 计算量下降67.4%, 模型尺寸降低77.8%, 达到了比较优秀的轻量化效果, 具有很强的实用性。

  • 网络空间安全
    曹蓓, 赵奎
    计算机工程. 2025, 51(6): 193-203. https://doi.org/10.19678/j.issn.1000-3428.0070158
    摘要 (411) PDF全文 (147) HTML (20)   可视化   收藏

    在信息爆炸且真伪难辨的网络环境中,精准识别虚假新闻成为一项重要的研究课题。现有研究多采用多种深度学习模型提取多元语义特征,以捕捉文本中不同层次的语义信息,但简单拼接这些特征会导致信息冗余和噪声,限制检测的准确性和泛化性,目前缺乏有效的深度融合方法。此外,现有研究往往忽视了新闻内容与其对应评论共同构建的双重情感对揭示新闻真实性的影响。针对上述问题,提出一种基于双重情感和多特征融合的虚假新闻检测(DEMF-FND)模型。首先,通过情感分析提取新闻和评论的情感特征,并利用相似度计算引入反映两者关联性的情感差异特征,构建双重情感特征集。然后,采用基于多头注意力的融合机制,将双向长短期记忆网络(BiLSTM)与设计的集成静态-动态嵌入的卷积神经网络(ISDE-CNN)所捕捉的新闻文本全局与局部语义特征进行深度融合。最终,将双重情感特征集与经深度融合得到的语义特征拼接融合,输入由全连接层构成的分类层,以判断新闻的真假。实验结果显示,该方法在Weibo20、Twitter15和Twitter16 3个真实数据集上的基准指标均优于基线方法,在准确率上分别实现了2.5、2.3和5.5百分点的提升,凸显了双重情感和深度融合语义特征在提升虚假新闻检测性能方面的重要性。

  • 热点与综述
    庞鑫, 葛凤培, 李艳玲
    计算机工程. 2025, 51(6): 1-19. https://doi.org/10.19678/j.issn.1000-3428.0069005
    摘要 (410) PDF全文 (264) HTML (47)   可视化   收藏

    声学场景分类(ASC)旨在让计算机模拟人类听觉识别不同的声学环境,是计算机听觉领域中具有挑战性的任务之一。随着智能音频处理技术以及神经网络学习算法的快速进步,近年来ASC任务也涌现出一系列新算法和新技术。为了全面展示该领域的技术发展脉络和演进过程,梳理了该领域的早期工作和近期发展,全面介绍了ASC任务。首先描述了ASC的应用场景和面临的挑战;其次详细介绍了ASC的主流框架,重点阐述了应用于此领域的深度学习算法;然后系统性地总结了ASC的前沿探索与延伸任务以及公开数据集;最后对ASC的发展趋势进行探讨与展望。

  • 开发研究与工程应用
    朱亚州, 杜平川, 柴志雷
    计算机工程. 2025, 51(12): 337-345. https://doi.org/10.19678/j.issn.1000-3428.0069437
    摘要 (397) PDF全文 (178) HTML (12)   可视化   收藏

    Kubernetes作为容器编排的主流工具, 可支持自动部署、服务发现以及负载均衡, 且具有高可用性、高效能的特点。然而, Kubernetes采用的最佳适应算法或最小负载法等调度策略忽略了节点的异构性和性能的差异性。此外, Kubernetes工具仅考虑CPU资源和内存资源且预先设置统一权重机制, 容易导致负载不均衡、性能下降以及无法满足精细化调度等问题。针对这些问题, 提出了一种基于多维度资源的异构任务调度(A-KCSS)算法, 该算法基于集群的异构计算资源, 增加磁盘输入/输出(I/O)、网络I/O负载以及GPU资源作为评价指标进行过滤和筛选, 更全面地考虑了node的异构性。此外, 引入一种基于多维度资源因素的权重计算模型, 依据待调度任务的资源需求, 计算待调度任务各维度资源因素的权重值, 结合集群node的实时资源利用率计算出每一个node的评分, 依据评分进行优先级排序, 并选择优先级最高的node进行调度。通过实验在Kubernetes集群上测试了A-KCSS算法的性能, 该算法与Kubernetes默认的调度算法以及Kubernetes容器调度(KCSS)算法相比, 平均响应时间分别减少10%和4%, 吞吐量分别提高30%和15%, 可用性分别提高40%和30%, 负载均衡性分别提高23%和18%, 集群的整体性能得到提高。

  • 人工智能与模式识别
    宋杰, 徐慧英, 朱信忠, 黄晓, 陈晨, 王泽宇
    计算机工程. 2025, 51(7): 127-139. https://doi.org/10.19678/j.issn.1000-3428.0069257
    摘要 (395) PDF全文 (173) HTML (36)   可视化   收藏

    在室内场景下, 受角度、光线变化等因素的影响, 导致现有目标检测算法检测跌倒事件时检测精度降低、实时性变差。为此, 提出一种基于YOLOv8改进的跌倒检测算法OEF-YOLO。采用全维动态卷积(ODConv)模块改进YOLOv8中的C2f模块, 优化了核空间的4个维度以增强特征提取能力, 而且有效减少了计算负担。同时, 为了捕获更细粒度的特征, 在颈部网络中引入高效多尺度注意力(EMA)模块, 进一步聚合像素级特征, 提高网络在跌倒场景中的处理能力。在CIoU损失函数中融入Focal Loss思想, 使模型对难分类样本给予更多关注, 优化模型整体性能。实验结果表明, 相比YOLOv8n, OEF-YOLO跌倒检测算法在mAP@0.5指标上提升了1.5百分点, mAP@0.5∶0.95提升1.4百分点, 参数量和计算量分别为3.1×106和6.5 GFLOPs, 在图形处理器(GPU)上FPS提高了44, 在提高精度检测跌倒事件的同时, 兼顾了低算力场景下的部署要求。

  • 热点与综述
    田青, 王斌, 周子枭
    计算机工程. 2025, 51(7): 12-30. https://doi.org/10.19678/j.issn.1000-3428.0069698
    摘要 (364) PDF全文 (146) HTML (17)   可视化   收藏

    从多个不同的摄像机中检索出一个特定的行人是行人重识别(ReID)的主要任务。随着深度神经网络的发展和智能视频监控需求的增加,行人ReID逐渐受到研究人员的关注。现有的行人ReID方法大多利用带有标签的数据集进行有监督训练,但该方式的数据标注成本高昂,使得有监督行人ReID难以扩展到大型的未标记数据集场景。无监督行人ReID可以有效地改善行人ReID模型的扩展问题,更符合现实场景的应用,并逐渐成为研究热点。尽管已有行人ReID的相关综述,但它们主要聚焦于有监督学习领域的方法和应用。为此,对现有无监督行人ReID研究工作进行系统归纳、分析和总结,以便为该领域研究人员提供参考。首先,全面回顾无监督场景的行人ReID方法,根据模型训练是否使用源域监督信息,将无监督行人ReID研究划分为无监督域适应方法和完全无监督方法,并对这2类方法进行分析和总结。然后,介绍和归纳总结行人ReID研究相关的经典数据集,并展示和讨论不同行人ReID方法在这些数据集上的性能和优劣。最后,指出当前无监督行人ReID研究所面临的问题,并提出未来发展方向。

  • 开发研究与工程应用
    郑洁云, 张章煌, 宣菊琴, 魏鑫, 薛静玮
    计算机工程. 2025, 51(11): 392-402. https://doi.org/10.19678/j.issn.1000-3428.0069531
    摘要 (357) PDF全文 (100) HTML (8)   可视化   收藏

    配电网规划在电力系统中非常重要, 因为它直接影响到电力供应的可靠性、效率和经济性。良好的规划可以确保电力资源得到高效分配, 同时降低运营成本和减少电力损耗。然而, 随着电力需求的增加和系统复杂性的提升, 传统的决策方法不再适用。为提升设备选型、连接配置和电网布局的效率和可靠性, 提出一种基于知识图谱(KG)和图卷积神经网络(GCNN)的配电网智能规划方法KG-GCNN。该方法综合利用KG、图神经网络(GNN)和卷积神经网络(CNN)技术的优势, 为电力系统规划者提供一种智能化的配电网规划方法, 以更好地理解、分析和优化电力系统的设备配置、连接以及物理布局。首先, 建立电力网络的KG, 该KG包含电网的设备、属性及其相互关系, 为后续的分析和优化提供基础; 然后, 利用GNN对电力网络的结构数据进行分析, 以捕捉设备之间的关系和影响, 为设备配置和连接决策提供重要信息; 最后, 引入CNN改善电网的物理布局, 以确定电网中设备的最佳位置和连接方式, 从而提高电网的性能和可靠性。实验结果表明, 通过与决策树、支持向量机(SVM)、循环神经网络(RNN)相比, 该方法能够有效匹配电网中的复杂拓扑结构, 优化电网的物理布局。

  • 开发研究与工程应用
    许德刚, 王双臣, 尹柯栋, 王再庆
    计算机工程. 2025, 51(11): 377-391. https://doi.org/10.19678/j.issn.1000-3428.0069125
    摘要 (357) PDF全文 (76) HTML (5)   可视化   收藏

    为了解决城市车辆目标检测算法中存在检测效果差、误检漏检率高、泛化能力弱的问题, 提出一种改进YOLOv8的城市车辆目标检测算法。首先, 在主干网络尾部融入高效多尺度注意力(EMA)机制, 有助于模型更好地捕捉目标车辆的细节特征, 结合160×160像素尺寸的小目标检测层来加强对小目标的检测能力, 通过维度交互进一步聚合像素级特征, 增强对目标车辆的挖掘能力。其次, 为轻量化网络设计了一种多尺度轻量化卷积(MLConv)模块, 并基于MLConv重构了C2f模块, 提高模型的特征提取能力。最后, 为抑制低质量图像产生的有害梯度, 采用WIoU损失函数替代完全交并比(CIoU)损失函数, 优化网络的边界框损失, 提升模型的收敛速度和回归精度。在Streets车辆数据集上进行验证, 结果表明, 改进算法的mAP@0.5、mAP@0.5∶0.95和召回率相较于基准模型YOLOv8n分别提升了1.9、1.4和2.4百分点。在国内车辆数据集和VisDrone2019小目标数据集上进行验证, 改进算法的各项性能指标都有不同程度的提升, 充分证明了改进算法具有良好的泛化性和鲁棒性。与其他主流算法相比, 改进算法同样表现出了更高的准确率和召回率, 表明该算法对于城市车辆目标检测具有更好的性能。

  • 人工智能与模式识别
    袁英华, 金英然, 高赟
    计算机工程. 2025, 51(12): 96-108. https://doi.org/10.19678/j.issn.1000-3428.0069871
    摘要 (353) PDF全文 (546) HTML (51)   可视化   收藏

    孪生跟踪网络是主流的目标跟踪框架之一,其包括骨干网络、融合网络和定位网络3个模块。对于融合网络模块,Transformer是较新且有效的融合网络实现方法。Transformer的编码器和解码器中使用自注意力机制对卷积神经网络(CNN)特征进行增强。然而,自注意力机制仅能从空间维度进行特征增强,未考虑从通道维度进行特征增强。为了使得Transformer的自注意力网络同时对特征的空间维度和通道维度进行增强,为目标定位网络提供准确的相关性信息,提出一种基于双维度特征增强的Transformer跟踪器,对Transformer融合网络进行改进。首先,采取骨干网络的第三和第四阶段特征作为输入;然后,在Transformer编码器与解码器的自注意力模块中,通过CAE-Net网络进行通道维度的特征增强,用于增强通道上的重要性,通过SAE-Net网络实现两阶段特征的加权融合与线性变换,获取自注意力因子QKV;最后,通过自注意力运算实现空间维度特征增强。在5个主流的公开基准数据集上进行实验,结果表明,改进后的Transformer特征融合模块可以用极小的速度代价提升跟踪器的跟踪性能。

  • AI算力赋能的车载边缘计算
    秦敏浩, 孙未未
    计算机工程. 2025, 51(9): 1-13. https://doi.org/10.19678/j.issn.1000-3428.0069416
    摘要 (352) PDF全文 (750) HTML (57)   可视化   收藏

    交通信号灯控制对缓解交通拥堵、提升城市通勤效率有着重要作用。近年来,以实时交通数据为输入的基于深度强化学习的信号灯控制算法已取得突破性进展。然而,现实场景中的交通数据通常伴随着数据失真。传统方法在修复失真数据后使用强化学习算法控制信号灯,但一方面信号灯相位的动态性给失真修复引入了额外不确定性,另一方面失真修复难以与深度强化学习框架相结合来提升性能。为此,提出基于隐状态预测的失真交通信号灯路口控制模型HCRL。HCRL模型由编码子模型、控制子模型和编码预测子模型组成,通过引入信号灯路口的隐状态表示机制,更好地适应深度强化学习框架,有效表达信号灯路口的控制状态,并使用特殊的迁移训练方法避免数据失真对控制子模型的干扰。使用两个真实数据集验证了数据失真对智能信号灯控制算法的影响。实验结果表明,HCRL模型在所有失真场景和失真率下均优于基于失真修复的信号灯控制模型,并在与其他基线模型的对比中表现出了对数据失真更强的鲁棒性。

  • 图形图像处理
    沙宇洋, 陆京涛, 杜浩凡, 翟小兵, 孟维宇, 廉旭, 罗刚, 李克峰
    计算机工程. 2025, 51(7): 314-325. https://doi.org/10.19678/j.issn.1000-3428.0068674
    摘要 (348) PDF全文 (221) HTML (33)   可视化   收藏

    图像分割是环境感知中的一项关键技术,被广泛应用于无人驾驶、虚拟现实等实际任务中。随着技术的不断发展,基于计算机视觉技术的导盲系统日趋成熟,并且在精度、稳定性等方面优于传统的解决方案。在视觉导盲系统中,道路图像的语义分割是非常重要的一部分,系统通过分析算法的输出结果可以获取目前所处的环境状态,从而指导用户躲避前方障碍物,获取最优的移动路径。视觉导盲系统的使用环境复杂,对模型的运行效率和分割精度具有极高的要求。然而,常用的高精度语义分割算法参数量大、运行速度慢,因此无法直接应用于导盲系统。针对这一问题,提出了一种基于多尺度特征的轻量化道路图像分割算法。模型含有两个特征提取分支,即Detail Branch和Semantic Branch,其中Detail Branch用来提取图像的低层细节信息,Semantic Branch用来提取图像的高层语义信息,并且两个分支中的多尺度特征也会被所设计的特征映射模块处理和使用,进而提升模型对于特征的建模能力。此外,设计了一种简单且高效的特征融合模块,通过融合不同尺度的特征,增强模型对于上下文信息的编码能力。采集和标注了适用于导盲场景的大量道路分割数据,并制作成了相应的数据集。基于该数据集对所提出的算法进行训练和测试,实验结果显示: 所提出的道路分割算法的平均交并比(mIoU)为96.5%,优于现有的图像分割模型;以1 024×1 024像素的图像作为输入,所提算法的轻量化版本在NVIDIA GTX 3090Ti平台的运行速度为201帧/s,优于现有轻量化图像分割模型;将模型部署到NVIDIA AGX Xavier设备中,其在实际场景中的测试速度为53帧/s,满足实际需求。

  • 人工智能与模式识别
    翟志鹏, 曹阳, 沈琴琴, 施佺
    计算机工程. 2025, 51(9): 139-148. https://doi.org/10.19678/j.issn.1000-3428.0069439
    摘要 (336) PDF全文 (129) HTML (26)   可视化   收藏

    精准的交通流预测是实现智能交通系统的关键前提,对加强系统的仿真和控制、提高管理者的决策等方面具有重要意义。针对大多数现有的图卷积网络(GCN)模型忽略交通流数据的动态时空变化、对节点信息使用不足导致时空相关性提取不充分的问题,提出一种基于多时空图融合与动态注意力的交通流预测模型。首先,以不同的卷积单元提取交通流数据中多时域状态下的时间特征;然后,构建多时空图体现节点在空间分布中的动态变化趋势和异质性,并结合GCN提取空间特征;最后,利用多头自注意力机制分别对时空特征进行分析与融合,输出预测结果。在两个实际的公共数据集PeMS04和PeMS08上进行实验分析,并与基于注意力的时空图卷积网络(ASTGCN)、多视角的时空Transformer网络(MVSTT)和动态时空感知图神经网络(DSTAGNN)等基于时空图卷积网络的基准模型对比,结果表明所提模型在平均绝对误差(MAE)、平均绝对百分比误差(MAPE)和均方根误差(RMSE)指标上分别平均降低了7.10%、7.22%和6.47%,具有较强的适应性和鲁棒性。

  • 前沿观点与综述
    方仪豪, 邹丹平
    计算机工程. 2026, 52(2): 13-23. https://doi.org/10.19678/j.issn.1000-3428.0070059
    摘要 (322) PDF全文 (143) HTML (23)   可视化   收藏

    随着人工智能与机器人技术的深度融合, 多旋翼无人机在多个领域中得到了广泛应用, 展现了其灵活性和高效性。然而, 在开发和验证多旋翼无人机的飞行控制算法或解决方案时, 研究人员面临着高成本和高风险的挑战。为了降低这些风险并提高算法测试和优化的效率, 多旋翼无人机仿真平台提供了一个安全、可控的环境。首先, 介绍了多旋翼无人机的常规机型, 选取了常用的四旋翼无人机作为多旋翼无人机的代表机型, 根据不同仿真程度阐述了其动力学模型。接着, 对多旋翼无人机仿真平台的常规系统结构框架进行概述, 并探讨了其评价方式和分类方法。从功能和性能两个方面出发, 进一步细化了仿真平台的评价方式。多旋翼无人机仿真平台的分类一方面根据其是否支持交互学习环境进行划分, 另一方面依据不同侧重点, 从动力学、传感器和多机集群3个方面进行分类。然后, 回顾了现有无人机飞行任务的主要解决方案, 在传统解决方案和基于学习方式的解决方案背景下, 分析了现有的典型多旋翼无人机仿真平台。最后, 对多旋翼无人机仿真平台未来发展进行了展望。

  • 计算机视觉与图形图像处理
    张信佳, 王芳
    计算机工程. 2026, 52(2): 148-157. https://doi.org/10.19678/j.issn.1000-3428.0069729
    摘要 (319) PDF全文 (163) HTML (6)   可视化   收藏

    无人机(UAV)航拍图像中的目标通常具有尺度密集、易被遮挡且多为小目标等特点, 这导致检测过程中容易出现漏检和误检。为应对上述挑战, 基于YOLOv5s提出了针对小目标检测的SNA-YOLOv5s算法。首先, 引入空间深度转换卷积(SPD-Conv)模块替换原模型的跨步卷积层, 避免细节信息丢失, 增强小目标特征提取能力; 其次, 设计新型平均快速空间金字塔池化(AGSPPF)模块, 引入平均池化操作缓解池化层在提取特征信息的同时会导致部分信息丢失的问题, 提升模型的特征提取能力; 再次, 新增针对小目标的大尺度检测分支, 捕捉浅层特征中丰富的细节信息, 提升模型对小目标的检测能力; 最后, 将归一化注意力机制(NAM)嵌入骨干网络, 对特征信息进行加权处理, 抑制无效的特征信息。在VisDrone2019数据集和NWPU VHR-10数据集上的训练测试结果表明, 该算法的均值平均精度(mAP)分别达到了42.3%和96.5%, 与基线模型YOLOv5s相比分别提高了8.4和2.6百分点。通过与其他基于深度学习的主流模型对比实验, 进一步验证了该模型的鲁棒性和精确性。

  • 移动互联与通信技术
    王华华, 黄烨霞, 李玲, 王嘉程
    计算机工程. 2025, 51(12): 255-267. https://doi.org/10.19678/j.issn.1000-3428.0069877
    摘要 (315) PDF全文 (856) HTML (16)   可视化   收藏

    在无蜂窝网络环境下实施联邦学习(FL)时, 用户调度和资源分配策略对优化系统时间开销、提升用户可达速率以及加速FL收敛速率至关重要。为解决资源分配不均的问题, 设计一种联合用户调度、CPU处理频率和功率分配的优化方案。通过最大化系统的最小用户速率来实现资源的公平分配, 并提升FL性能。联合优化问题被分解为用户调度和功率分配两个子问题。在用户调度方面, 设计基于k-means聚类的贪婪调度算法, 以综合评估用户的信道状态和数据"价值", 并将用户划分为不同的群组。随后, 针对每个群组的资源占用情况, 为组内用户制定个性化的CPU处理频率分配方案。最后, 通过在各群组中独立执行用户调度, 实现高效且精准的用户选择, 并通过提前分组有效降低用户选择的复杂度。在功率分配方面, 引入基于二分法的功率分配算法(BM-PA)。该算法不仅考虑了用户间的公平性, 还针对资源受限用户进行了优先处理, 以确保其能够获得更优质的资源分配。BM-PA算法通过低复杂度的迭代优化过程, 实现了功率分配的快速收敛, 并在保证系统性能的同时, 显著提升了资源的利用效率。合理的用户调度策略是功率分配子问题获得最优解的基础, 采用交替迭代的方法允许在每个子问题中独立进行优化, 同时考虑到另一个子问题的解。这种相互依赖的关系通过多轮迭代优化过程, 确保功率资源被合理地分配给那些最需要或最有可能有效利用它们的用户, 从而使系统整体性能得到提升, 实现联合优化求解, 显著提升系统整体性能。仿真实验结果表明, 与基准算法相比, 所提算法在下行可达速率方面, 最佳平均提升幅度高达103.34%, 在上行可达速率方面, 最佳提升幅度达到102.78%。此外, 相较于基准算法还能平均节省67.44%的FL任务训练时间, 特别是在FL学习模型精度达到90%时, 所提算法的时间开销最小。

  • 图形图像处理
    郝宏达, 罗健旭
    计算机工程. 2025, 51(8): 270-280. https://doi.org/10.19678/j.issn.1000-3428.0069269
    摘要 (314) PDF全文 (115) HTML (29)   可视化   收藏

    深度学习逐渐被广泛应用于医学图像分割领域,基于注意力机制的分割算法是目前研究的主要方法。现有大多数基于注意力机制的2D图像分割模型在多器官分割任务中往往关注切片的整体分割效果,而忽略了切片中小目标特征信息的丢失或欠分割问题,使模型分割性能受到限制。针对这一问题,提出一种基于多尺度特征融合和改进注意力机制的多器官语义分割模型DASC-Net。DASC-Net的整体框架基于编码器-解码器架构,编码器采用ResNet 50,与解码器之间设置跳跃连接。注意力机制由1个双重注意力模块(DAM)和1个小目标提取(SOC)模块的并联结构实现,从而进行多尺度区域特征融合。DASC-Net不仅可以感知到较大目标的特征信息,还可以通过注意力权重重建的方式保留小目标的特征信息,提高了模型的分割性能。在CHAOS数据集上的实验结果表明,DASC-Net在灵敏度、Jaccard相似系数、正类预测值(PPV)、Dice相似系数和平均交并比(mIoU)上分别可以达到83.72%、75.79%、87.75%、85.63%和77.60%,在Synapse数据集上的Dice相似系数和95%豪斯多夫距离(HD95)指标数值分别为82.44%和21.25 mm。DASC-Net在2个数据集上的表现均优于其他分割网络,具有可靠、准确的分割性能。

  • 人工智能与模式识别
    李博文, 丁牧恒, 方美华, 朱桂平, 魏志勇, 成巍, 李亚云, 卞双双
    计算机工程. 2025, 51(10): 87-96. https://doi.org/10.19678/j.issn.1000-3428.0069857
    摘要 (313) PDF全文 (222) HTML (19)   可视化   收藏

    疲劳驾驶是导致交通事故的主要因素之一。在人工智能领域, 基于脑电图(EEG)的驾驶疲劳状态分类已成为重要研究方向。近年来, 融合注意力机制的深度学习模型在EEG疲劳识别中得到了广泛应用。以SEED-VIG数据集作为研究对象, 采用ReliefF特征选择算法, 构建基于自注意力、多头注意力、通道注意力、空间注意力机制的卷积神经网络(CNN)、长短期记忆(LSTM)网络和支持向量机(SVM)优化模型。在SEED-VIG数据集提供的EEG数据上的实验结果表明, 基于多模注意力机制的多种神经网络优化模型的准确率、召回率、F1值等指标均得到了有效提升, 其中以平均准确率和标准偏差作为对比参数, 可增强空间与通道信息的卷积块注意力模块(CBAM)-CNN模型的性能最佳, 分别为84.7%和0.66。

  • 多模态与信息融合
    张志, 尹昱凯, 孙奕灵, 孟雯锦, 彭畅
    计算机工程. 2026, 52(3): 243-254. https://doi.org/10.19678/j.issn.1000-3428.0070175
    摘要 (311) PDF全文 (75) HTML (3)   可视化   收藏

    针对Android恶意软件种类和结构繁杂不一、单一静态特征难以区分良性和恶意软件的问题, 在深入研究Android软件的权限、API、字节码、操作码等特征的基础上, 提出一种基于多模态特征融合的构建方法。将字节码转换为RGB图像, 通过预训练模型EfficientNetV2B3提取字节码图像特征, 以表征Android应用的整体特性。利用局部敏感哈希(LSH)算法提取操作码序列特征, 以表征Android应用的细节特性。采用多模态分解双线性池化(MFB)融合算法对字节码图像特征和操作码序列特征进行融合, 实现2种特征数据的异质互补, 以得到更具区分度的静态特征。在此基础上, 提出一种基于Transformer的Android恶意软件检测模型(TEAAD)。实验结果表明, 基于融合特征的TEAAD模型优于其他深度模型, 检测准确率达到96.87%, MFB特征融合方法相较于其他方法具有更高的恶意软件识别能力。

  • 先进计算与数据处理
    孙雯倩, 徐天辰, 余佩厚, 陈云芳, 张伟
    计算机工程. 2025, 51(12): 189-201. https://doi.org/10.19678/j.issn.1000-3428.0069804
    摘要 (310) PDF全文 (52) HTML (2)   可视化   收藏

    数据隐私保护已成为社会关注的焦点,各国和地区正在陆续制定相关的法律法规,但是由于App产品发布的隐私政策存在篇幅长、专业性强等问题,利用自动化手段检测隐私政策的合规性成为亟待解决的技术难题。作为主流解决方法的机器学习模型需要标签注释的数据集进行支撑,而国内目前缺少这样的App隐私政策数据集。在分析欧盟《通用数据保护条例》(GDPR)合规性分析相关工作的基础上,设计适合我国《个人信息保护法》的标签方案,具体包括15个要求标签,然后使用网络爬虫获取10个类别、363个App的中文隐私政策,并对这些隐私政策进行语句级划分和标注,构建包括104 134个隐私政策语句及标签组成的中文隐私政策语料库。采用百度最新开源的预训练语言模型ERNIE对语料库进行训练与测试,实验结果表明,该方案检测准确率达到85.75%。

  • 热点与综述
    刘洋宏, 付杨悠然, 董性平
    计算机工程. 2025, 51(10): 18-26. https://doi.org/10.19678/j.issn.1000-3428.0070569
    摘要 (307) PDF全文 (406) HTML (24)   可视化   收藏

    高清环境语义地图的生成是自动驾驶系统实现环境感知与决策规划不可或缺的关键技术。针对当前自动驾驶领域相机与激光雷达在感知任务中存在的模态差异问题, 提出一种创新的多模态融合范式HDMapFusion, 通过特征级融合策略显著提升了语义地图的生成精度。与传统直接融合原始传感器数据的方法不同, HDMapFusion创新性地将相机图像特征和激光雷达点云特征统一转换为鸟瞰视图(BEV)空间表示, 在统一的几何坐标系下实现了多模态信息的物理可解释性融合。具体而言: HDMapFusion首先通过深度学习网络分别提取相机图像的视觉特征和激光雷达的三维(3D)结构特征; 然后利用可微分的视角变换模块将前视图像特征转换为BEV空间表示, 同时将激光雷达点云特征通过体素化处理投影到相同的BEV空间, 在此基础上设计一个基于注意力机制的特征融合模块, 自适应地加权整合两种模态; 最后通过语义解码器生成包含车道线、人行横道、道路边界线等要素的高精度语义地图。在nuScenes自动驾驶数据集上的实验结果表明, HDMapFusion在高清地图生成精度方面显著优于现有基准方法。这些实验结果验证了HDMapFusion的有效性和优越性, 为自动驾驶环境感知中的多模态融合问题提供了新的解决思路。

  • 空天地一体化算力网络
    王克文, 张维庭, 孙童
    计算机工程. 2025, 51(5): 52-61. https://doi.org/10.19678/j.issn.1000-3428.0069471
    摘要 (306) PDF全文 (216) HTML (15)   可视化   收藏

    为满足卫星数据处理、车辆远程控制等快速响应和大范围覆盖的应用场景需求, 聚焦于采用分层控制和人工智能技术的方法, 设计一种空天地一体化算力网络资源调度机制。将空天地网络划分为3个域, 分别部署域控制器, 负责本地域的资源管理, 同时通过卫星和无人机的覆盖范围进行地面区域划分, 确保地面区域能够得到有效的服务保障, 以实现高效的数据传输和任务处理。为了优化空天地算力网络资源利用率, 引入多智能体强化学习算法, 对不同场景下产生的计算任务进行实时处理, 将每个域控制器视为具备任务调度和资源分配能力的智能体, 在满足时延和能耗的约束下, 通过协同学习和分布式决策实现计算任务智能调度和高效分配。实验结果表明, 该机制能够有效提高资源利用率和缩短任务响应时间。

  • AI算力赋能的车载边缘计算
    朱思远, 李佳圣, 邹丹平, 何迪, 郁文贤
    计算机工程. 2025, 51(9): 14-24. https://doi.org/10.19678/j.issn.1000-3428.0069534
    摘要 (306) PDF全文 (217) HTML (52)   可视化   收藏

    非结构化道路的缺陷目标检测任务对道路交通安全具有重要意义,但检测所需的标注数据集相对有限。为了解决非结构化道路标注数据集缺乏以及现有模型对无标注数据学习能力不足的问题,提出一种MAM(Multi-Augmentation with Memory)半监督目标检测算法。首先,引入缓存机制存储无标注图像和带有伪标注图像的框回归位置信息,避免了后续匹配造成的计算资源浪费。其次,设计混合数据增强策略,将缓存的伪标签图像与无标签图像混合输入学生模型,以增强模型对新数据的泛化能力,并使图像的尺度分布更加均衡。MAM算法不受目标检测模型的限制,并且更好地保持了目标框的一致性,避免了计算一致性损失。实验结果表明,MAM算法相比其他全监督学习和半监督学习算法更具优越性,在自建的非结构化道路缺陷数据集Defect上,在标注比例为10%、20%和30%的场景下,MAM算法的均值平均精度(mAP)相比于Soft Teacher算法分别提升了6.8、11.1和6.0百分点,在自建的非结构化道路坑洼数据集Pothole上,在标注比例为15%和30%的场景下,MAM算法的mAP相比于Soft Teacher算法分别提升了5.8和4.3百分点。

  • 网络空间安全
    吴杰辉, 柳毅
    计算机工程. 2025, 51(9): 166-176. https://doi.org/10.19678/j.issn.1000-3428.0069162
    摘要 (301) PDF全文 (71) HTML (8)   可视化   收藏

    多元时间序列异常检测方法常被用于及时发现和识别系统中的异常模式和行为,以提高系统的安全性和稳定性。为了解决多元时间序列内部复杂依赖关系导致的异常检测精度降低的问题,提出一种多元时间序列异常检测模型HGAT,它基于图注意力网络并联合使用预测与重构方法进行优化。首先使用图注意力网络捕获多元时间序列在时间和空间维度上的依赖性;其次采用融合变分自编码器(VAE)的Transformer作为重构模块,并使用时间卷积网络(TCN)作为预测模块,联合实现对异常序列的检测,Transformer的自注意力机制允许重构模块在整个时间序列上建模,从而直接考虑序列中任意2个位置之间的关系,以捕捉序列的全局依赖关系,TCN通过堆叠卷积层并且增大感受野,可以有效地提取时间序列的局部特征;最后通过异常分数综合考虑重构模块和预测模块,在进行时空联合表征的基础上以全局和局部角度分析序列的整体分布。在SMAP、MSL和SMD数据集上进行实验,结果表明,HGAT的F1值分别为96.20%、97.50%和92.85%,均优于基线方法。

  • 空天地一体化算力网络
    李斌, 山慧敏
    计算机工程. 2025, 51(5): 1-8. https://doi.org/10.19678/j.issn.1000-3428.0069423
    摘要 (298) PDF全文 (274) HTML (31)   可视化   收藏

    针对算力网络中终端用户计算能力不足及边缘节点算力分配不均的问题, 提出一种以激励机制为基础的无人机(UAV)协同终端直连(D2D)边缘计算方案。首先, 在满足计算资源、发射功率、计算资源单价等限制条件下, 通过联合优化任务卸载比例、计算资源限制量、UAV飞行轨迹、UAV和用户的发射功率以及计算资源出售单价, 提出一个系统收益最大化问题。其次, 利用近端策略优化(PPO)确定用户卸载和购买策略, 通过在多个时间步骤上迭代优化策略最大化累积奖励, 并引入剪切项以限制策略更新的幅度, 以确保求解算法的稳定性。仿真结果显示, 基于PPO的系统收益最大化算法相比基线算法具有更好的收敛性, 并能够有效提升系统总收益。

  • 图形图像处理
    苗茹, 李祎, 周珂, 张俨娜, 常然然, 孟更
    计算机工程. 2025, 51(8): 292-304. https://doi.org/10.19678/j.issn.1000-3428.0068856
    摘要 (290) PDF全文 (176) HTML (34)   可视化   收藏

    针对遥感图像背景复杂、目标种类多和尺度差异大所造成的目标漏检和误检问题,提出一种改进Faster R-CNN多目标检测模型。首先,采用Swin Transformer来替代ResNet 50骨干网络,增强模型特征提取能力;其次,添加平衡特征金字塔(BFP)模块融合浅层和高层语义信息,进一步加强特征融合效果;最后,在分类和回归分支中,添加动态权重机制,促进网络在训练过程中更关注高质量候选框,提高目标定位和分类的精确度。在RSOD数据集上的实验结果表明,所提模型相较于Faster R-CNN模型每秒浮点运算次数(FLOPs)大幅度减少,并且模型的mAP@0.5 ∶0.95提高了10.7百分点,平均召回率提高10.6百分点。相较于其他主流检测模型,所提模型在降低漏检率的同时,取得了更高的精度,能显著提高复杂背景下遥感图像的检测精度。

  • 热点与综述
    马依拉木·木斯得克, 高雨欣, 张思拓, 冯珂, 阿布都克力木·阿布力孜, 哈里旦木·阿布都克里木
    计算机工程. 2025, 51(8): 16-38. https://doi.org/10.19678/j.issn.1000-3428.0070619
    摘要 (290) PDF全文 (218) HTML (47)   可视化   收藏

    随着通用人工智能技术的快速发展,基础模型在多个领域的应用日益受到广泛关注。在图像分割领域,分割一切模型(SAM)作为一种核心基础模型,在提升图像理解和处理效率方面展现出了显著优势。尽管SAM在图像分割任务中表现出色,但在功耗、计算效率以及在不同应用场景中的适应性等方面,仍然存在一定的优化空间。为此,从多个维度对SAM的改进方向进行了深入探索,包括提升速度与计算效率、增强模型的精度与鲁棒性、提高模型的适应性与通用性、优化提示工程设计,以及提升数据利用效率与强化迁移学习能力等方面。通过这些改进,SAM不仅能够在更复杂的任务中保持高效性能,还能更好地适应各领域和应用场景的需求。在此基础上,总结SAM在医学、遥感、机械等领域中的实际应用,展示了其在不同场景下的适用性与挑战。此外,详细介绍了图像分割领域常用的数据集和评价指标,通过实验对比分析,进一步评估了视觉Transformer(ViT)变体对SAM性能的影响,以及EfficientSAM、EfficientViT-SAM、MobileSAM和RobustSAM等改进模型的性能表现。最后,总结了SAM及其改进模型在实际应用中面临的挑战,并展望了未来的发展方向,旨在帮助科研工作者更全面地了解SAM及其变体的改进与应用,为新模型的提出提供启发。

  • 人工智能与模式识别
    栾孟娜, 郑秋梅, 王风华
    计算机工程. 2025, 51(7): 90-99. https://doi.org/10.19678/j.issn.1000-3428.0069409
    摘要 (289) PDF全文 (112) HTML (21)   可视化   收藏

    在交通标志检测中,由于外界环境的干扰以及驾驶场景中交通标志目标较小的特点,导致提升交通标志检测性能一直是一项具有挑战性的任务。提出一种新的交通标志检测算法,其能够在保证实时检测的情况下显著提高模型的检测精度。首先设计一种新的多尺度特征提取网络,引入大尺度特征来增加小目标定位信息,同时设计多尺度特征注意增强模块进一步获得目标的上下文信息。其次,为了降低模型的计算量和复杂度,对原始模型的多尺度检测头进行改进,选取2个大尺度检测头对小目标进行检测。最后,对完全交并比(CIoU)损失函数进行改进,增强算法对小目标的感知能力,同时提高网络的训练效率。将改进后的模型在2个开源的公共数据集上进行实验。实验结果表明,该算法在TT100K和CCTSDB 2021交通标志数据集上对交通标志小目标的检测精度均有提高,在2个数据集的测试集上均值平均精度(mAP)分别达到84.8%和83.6%,较基准模型分别提升了3.0和3.6百分点,具有更高的检测性能和特征提取能力,且满足实时检测的需求。

  • 开发研究与工程应用
    张佳承, 韦锦, 陈义时
    计算机工程. 2025, 51(7): 362-374. https://doi.org/10.19678/j.issn.1000-3428.0069524
    摘要 (288) PDF全文 (60) HTML (19)   可视化   收藏

    针对道路两侧绿篱修剪的目标检测过程中对算法实时性、轻量化的要求以及算法在实际检测中的精度和光照鲁棒性问题,提出一种基于YOLOv8n的算法MGW-YOLO,并给出一种新的C2f_ModuGhost+模块来替换主干网络中的C2f模块,其中设计的调制可变形卷积增加了偏移量特征通道数,以加速模型的推理,增强算法实时性。在颈部网络中引入分组空间卷积(GSConv)轻量级卷积技术和slim-neck设计范式,并通过融合标准卷积、深度可分离卷积和Shuffle模块的思想,降低模型的参数量,实现模型的轻量化。设计一种具有双重加权机制的Focal-WIoU损失函数,WIoU中的双层交叉注意力机制可有效降低多个绿篱相连和遮挡时的误检率,并且利用Focal Loss权重因子提升对特殊形状绿篱等难分类样本的检测精度。另外采用TRADES方法的对抗训练策略,在分类问题鲁棒性与精度之间进行有效权衡。实验结果表明,相比基线算法YOLOv8n,MGW-YOLO的mAP@0.5和mAP@0.5 ∶0.95分别提高了3.29和2.87百分点,在无人驾驶底盘上的实验结果表明,MGW-YOLO相较于原始算法的预处理时间、每帧平均推理时间和每帧后处理时间分别降低了0.7 ms、10.7 ms和0.7 ms,检测速度提升了15.7帧/s,适用于绿篱修剪机在道路两侧实时性作业的需求。

  • 热点与综述
    彭龙, 高元钧, 刘晓东, 余杰
    计算机工程. 2025, 51(10): 37-52. https://doi.org/10.19678/j.issn.1000-3428.0069708
    摘要 (287) PDF全文 (622) HTML (37)   可视化   收藏

    算力和网络技术的发展使得机器人逐渐向小型化、群体化、智能化方向发展,部署在硬件设备上的机器人软件需要集成从底层设备驱动和控制到上层运动规划和推理等多种软件模块,软件架构日益复杂。群体机器人通信编程框架从机器人软件标准化、模块化、平台化等目标出发,减轻了机器人通信编程的复杂度。分析总结机器人软硬件架构发展趋势,得出群体机器人系统是由各类计算节点、执行器、传感器等硬件设备通过有线或无线网络互联构成的多域异构分布式系统。这种硬件设备的异构性使得软件模块难以通过单一框架集成。归纳分析现有群体机器人系统通信编程框架在易用性、可移植性等方面的特点,从编程模型、异构硬件平台支持、组件间通信机制、编程语言等核心能力方面对通信编程框架进行对比,并在实时性、虚拟化、组件编排和容错支持等扩展能力方面展望通信编程框架的发展趋势,聚焦于以元操作系统(OS)为底座的下一代编程框架,以期构建人机物泛在融合的群体机器人软件架构。