计算机工程

Select

图形图像处理

基于改进YOLOv8n的航拍轻量化小目标检测算法: PECS-YOLO

王舒梦, 徐慧英, 朱信忠, 黄晓, 宋杰, 李毅

计算机工程. 2025, 51(9): 280-293. https://doi.org/10.19678/j.issn.1000-3428.0069353

摘要 (1291) PDF全文 (556) HTML (164)

可视化

在无人机(UAV)航拍中, 目标通常是密集分布、特征不明显的小目标, 且物体尺度变化较大。因此, 目标检测容易出现漏检和误检的问题。为了解决这些问题, 提出了一种基于改进YOLOv8n的航拍轻量化小目标检测算法: PECS-YOLO。该算法通过在Neck部分增加P2小目标检测层, 将浅层和深层的特征图进行拼接, 以更好地捕捉小目标的细节信息; 将轻量化卷积PartialConv引入全新的结构CSPPC(Cross Stage Partial PartialConv), 替换Neck网络中的C2f(Concatenation with Fusion), 实现模型轻量化; 引入SPPELAN(Spatial Pyramid Pooling with Efficient Layer Aggregation Network), 以有效地捕捉小目标特征; 通过在Neck部分每个检测头前加入压缩和激励(SE)注意力机制, 使网络更好地关注有用的通道, 减少复杂环境中背景噪声对小目标检测任务的干扰; 最后使用EfficiCIoU作为边界框损失函数, 将边界框的形状差异也考虑在内, 以增强模型对小目标的检测能力。实验结果表明: 相比YOLOv8n, PECS-YOLO目标检测算法在VisDrone2019-DET数据集上交并比为0.5的平均精度(mAP@0.5)提高了3.5%, 交并比为0.5∶0.95的平均精度(mAP@0.5∶0.95)提高了3.7%, 模型参数量减少了约25.7%, 检测速度提高了约65.2%。综上所述, PECS-YOLO模型适合于UAV航拍下的小目标检测任务。

Select

计算机视觉与图形图像处理

基于改进YOLOv8的轻量化无人机图像目标检测算法

唐克, 魏飞鸣, 李东瀛, 郁文贤

计算机工程. 2026, 52(3): 97-106. https://doi.org/10.19678/j.issn.1000-3428.0070085

摘要 (952) PDF全文 (246) HTML (101)

可视化

针对无人机图像中小目标实例多、目标间存在遮挡所导致的漏检和误检等现象, 提出一种基于改进YOLOv8的轻量化无人机图像小目标检测算法。首先, 在颈部引入三特征编码器(TFE)、尺度序列特征融合(SSFF)模块, 增强了网络对不同尺度特征的提取能力。接着, 设计小目标检测层(SMOH), 并将其与改进的颈部特征提取网络进行融合, 在头部引入一个额外的检测头, 减小小目标特征的损失, 增强网络对小目标的识别能力。然后, 针对完整交并比(CIoU)的缺陷, 结合适应交并比(Wise-IoU)、内部交并比(Inner-IoU)和最小点距离交并比(MPDIoU), 提出了一种回归损失函数Wise-Inner-MPDIoU。最后, 为了实现算法在移动端和嵌入式场景下的轻量化应用需求, 进行了基于幅度的层自适应稀疏化剪枝, 在保证模型精度的同时进一步压缩了模型大小。实验结果表明, 相比于原YOLOv8s算法模型, 改进后的模型在mAP@0.5提高6.8百分点的同时参数量、计算量、模型大小分别降低76.4%、17.1%、73.5%, 在检测精度与轻量化方面均取得了显著提升, 具有很强的实用价值。

Select

图形图像处理

基于YOLOv8的小目标检测模型的优化

王国明, 贾代旺

计算机工程. 2025, 51(12): 294-303. https://doi.org/10.19678/j.issn.1000-3428.0070027

摘要 (942) PDF全文 (409) HTML (125)

可视化

深度学习在目标检测领域的广泛应用显著提升了对大中目标的检测能力。然而, 针对小目标检测, 由于其固有的尺度小、背景复杂等挑战, 传统的目标检测算法常常会出现漏检、误检。为了提高小目标检测的精度, 对YOLOv8模型进行研究。首先, 将主干部分的卷积模块替换为RFAConv模块, 增强了模型对于复杂图像的处理能力; 其次, 在Neck部分引入混合局部通道注意力(MLCA)机制, 能够在保持计算效率的同时, 帮助模型更高效地融合不同层次的特征; 再次, 将YOLOv8的Detect头替换为Detect_FASFF头, 以解决不同特征尺度间的一致性问题, 并增强模型对小目标的检测能力; 最后, 将完全交并比(CIoU)损失函数替换为Focaler-IoU损失函数, 使模型更关注难以精确定位的小目标。实验结果显示: 改进后的模型在小目标稀疏的FloW-Img数据集上mAP@0.5提高了4.8百分点, mAP@0.5:0.95提高了3.0百分点; 在小目标密度高的VisDrone2019数据集上, mAP@0.5提升了5.9百分点, mAP@0.5:0.95提高了4.0百分点。同时还在低空数据集AU-AIR以及行人密集检测数据集WiderPerson上做了泛化对比实验。结果表明, 优化后的模型相比较原模型在小目标检测精度上有显著提升, 且适用范围更广。

Select

多模态与信息融合

基于4D毫米波雷达与视觉融合的三维目标检测算法

李健浪, 吴新电, 陈灵, 阳波, 唐文胜

计算机工程. 2026, 52(2): 299-310. https://doi.org/10.19678/j.issn.1000-3428.0070113

摘要 (939) PDF全文 (255) HTML (91)

可视化

针对自动驾驶场景中行人和车辆的目标识别与定位问题, 提出一种四维(4D)毫米波雷达与视觉融合的CDCAM-BEV算法, 以提高目标检测的精度。首先, 设计雷达柱体网络, 将4D雷达点云编码为伪图像, 并通过正交特征变换(OFT)将单目图像转换为鸟瞰图(BEV)特征; 其次, 基于交叉注意力机制, 设计共同信息提取模块(CICAM)和差异信息提取模块(DICAM), 充分挖掘雷达和图像的公共信息和差异信息; 最后, 基于CICAM和DICAM设计BEV特征融合模块, 实现图像信息和雷达信息在BEV空间的特征级融合。在VOD数据集上进行实验, 将CDCAM-BEV算法与其他5种三维(3D)目标检测算法进行对比。实验结果表明, CDCAM-BEV在多个模式下检测性能均优于其他算法。在3D模式下, CDCAM-BEV的平均检测精度比排名第二的Part-A²高出3.65百分点; 在BEV模式下, 比排名第二的PointPillars高出5.04百分点; 在平均方向相似度(AOS)模式下, 比排名第二的Part-A²高出2.62百分点。结果显示, CDCAM-BEV在各模式下均表现出卓越性能, 能够有效融合图像和4D雷达点云特征, 显著提高目标检测的精度和可靠性。

Select

热点与综述

课程知识图谱构建技术研究综述

孙丽郡, 孟繁军, 徐行健

计算机工程. 2025, 51(11): 1-21. https://doi.org/10.19678/j.issn.1000-3428.0069543

摘要 (790) PDF全文 (4606) HTML (99)

可视化

在教育信息化持续推进的背景下, 构建精准且高效的课程知识图谱已成为推动教育个性化发展的关键任务之一。课程知识图谱作为一种结构化的知识表示模型, 旨在揭示课程内容与学习目标之间的复杂关联关系, 以优化教育资源配置, 并为学习者定制个性化的学习路径。围绕课程知识图谱的构建技术进行探讨, 首先阐述知识图谱、教育知识图谱、课程知识图谱的基本概念及其之间的内在联系与显著差异; 其次深入剖析课程知识图谱构建的关键技术, 涵盖课程本体设计、实体抽取、关系抽取等方面, 并对其发展历程、特点及局限性展开详细分析与总结; 再次, 探讨课程知识图谱在学习资源推荐、学习者画像建模和多模态课程知识图谱构建等场景中的应用价值; 最后, 聚焦于课程知识图谱在构建过程中所面临的难题, 如数据多样性和异构性、知识图谱质量难以评估以及多课程交叉融合不足等, 从深度学习、大语言模型(LLM)等前沿技术的角度出发, 对未来的发展趋势进行展望。

Select

大模型与生成式人工智能

Meta-RAG: 基于元数据驱动的电力领域检索增强生成框架

王合庆, 魏杰, 景红雨, 宋晖, 徐波

计算机工程. 2026, 52(2): 383-392. https://doi.org/10.19678/j.issn.1000-3428.0070415

摘要 (781) PDF全文 (1236) HTML (59)

可视化

大语言模型(LLM)在对话、推理和知识保留能力方面展现了显著优势, 但在处理电力领域知识密集型任务时仍面临事实准确性不足、知识更新难以及高质量领域数据集匮乏的问题。针对这些挑战, 引入一种改进的检索增强生成(RAG)策略, 该策略融合了混合检索策略和经过微调的生成模型, 提供了更高效的知识捕获和更新能力。基于对现有方法的深入分析, 针对电力领域的知识问答(QA)任务, 提出了元数据驱动的RAG框架Meta-RAG, 该框架包含数据准备、模型微调和检索推理3个阶段。数据准备阶段包括文档转换、元信息抽取与增强及文档解析模块, 在此阶段, 借助元信息的提取与增强确保了电力规范文档的高效索引和结构化处理, 并且构建了电力领域的EleQA(Electricity Question Answering)数据集, 这是一个包含19 560个问答对的电力规范问答数据集。在模型微调阶段, 通过多问题生成、思维链提示生成和监督指令微调数据集构建模块, 优化了模型在特定电力问答任务上的推理能力。在检索推理阶段则采用混合编码和重排序策略, 结合检索和生成模块, 进一步提高了答案的准确性和合理性。通过一系列实验, Meta-RAG的有效性得到验证。与Self-RAG、Corrective-RAG、Adaptive-RAG、RA-ISF等基线模型相比, Meta-RAG具有更高的回答准确率和检索命中率, 其中, 基于Qwen1.5-14B-Chat模型的Meta-RAG达到了整体准确率0.804 3, 高于其他方法。消融实验和文档召回实验结果表明文档检索对框架性能影响最大, 失去检索能力整体准确率下降了0.292 8。

Select

大模型与生成式人工智能

多智能体博弈环境下的大语言模型协同决策研究

余滔, 董军

计算机工程. 2026, 52(5): 336-348. https://doi.org/10.19678/j.issn.1000-3428.0070301

摘要 (724) PDF全文 (305) HTML (30)

可视化

在多智能体博弈仿真中, 大语言模型(LLM)的性能已经被广泛研究, 但其在模糊任务目标或不确定性环境中引导多智能体合作的决策能力往往出现"失灵"现象。针对这一问题, 提出一种基于分布式贝叶斯推断的多层级协同决策框架。该框架集成了决策、互评、监管三大功能模块, 利用多个LLM进行协同决策, 并在空间囚徒困境博弈中进行了实验验证。实验结果表明, 该框架有效克服了LLM在模糊任务环境下的决策瓶颈, 成功促进了多智能体合作行为的涌现。此外, 通过对不同实验场景下模型决策能力的量化评估, 发现模型的决策误差与模型规模不呈线性关系。在模糊任务指令下, LLaMA3(70×10⁹)模型的决策误差较LLaMA3(8×10⁹)模型高出16.6%, 较LLaMA2(7×10⁹)模型高出7.2%, 表明在更复杂的环境中, 单纯依赖模型规模的扩大未能显著提升决策性能。相反, LLM协同决策在提升决策一致性和有效性方面显示出显著优势。这些结果揭示了多模型协同在复杂决策环境中的关键作用, 并为未来在不确定性任务下的智能体系统设计提供了重要参考。

Select

前沿观点与综述

社交媒体虚假信息检测技术研究综述

许旻辰, 屈丹, 司念文, 彭思思, 陈雅淇

计算机工程. 2026, 52(5): 60-80. https://doi.org/10.19678/j.issn.1000-3428.0070287

摘要 (712) PDF全文 (365) HTML (35)

可视化

实现及时有效的虚假信息检测有助于遏止虚假信息传播, 降低社会危害。目前已有大量深度学习方法被用于虚假信息检测, 总结现有研究的检测原理和检测范式对于明确技术优化方向至关重要。因此, 结合虚假信息检测的原理和实现路径对现有研究进行全面综述, 并首次对大语言模型在该领域的应用进行总结对比。首先, 介绍虚假信息检测任务的相关概念, 并汇总分析常用虚假信息检测数据集的数据结构; 然后, 根据检测原理和实现方式, 分别介绍如何通过语义特征表示、辅助任务设计、内部知识推断和事实核查来检测文本和多模态虚假信息, 将其细化为10个子类别, 并总结分析各个子类别检测方法的潜在特性; 最后, 对基于深度神经网络和大语言模型的虚假信息检测范式进行总结, 对比两种检测范式的代表性方法在7个虚假信息检测数据集中的检测性能, 并归纳大语言模型检测虚假信息的优势和局限性, 展望大语言模型给虚假信息检测领域带来的机遇与挑战, 为后续研究提供参考。

Select

前沿观点与综述

计算机视觉对抗攻击研究综述

秦颖鑫, 张可佳, 潘海为, 巨亚昊

计算机工程. 2026, 52(2): 46-68. https://doi.org/10.19678/j.issn.1000-3428.0069826

摘要 (705) PDF全文 (308) HTML (74)

可视化

深度学习引领人工智能蓬勃发展, 被广泛用于计算机视觉, 在图像识别、目标检测、目标跟踪、人脸识别等复杂任务上取得了突破性进展和显著的成果, 展现出其卓越的识别和预测能力。但深度学习模型的脆弱性和漏洞也逐渐暴露, 以卷积神经网络为代表的深度学习技术对精心设计的对抗样本极为敏感, 容易对模型的安全性和隐私性造成影响。首先, 总结对抗攻击的概念、对抗样本产生的原因以及相关术语, 概述数字域和物理域中几类经典的对抗攻击策略, 对其优缺点进行分析; 其次, 专注计算机视觉, 从数字域和物理域两个方面分别总结目标检测、人脸识别、目标跟踪、单目深度估计、光流估计中对抗攻击的最新研究进展以及常用于研究的各种数据集, 简单介绍现阶段对抗样本的防御和检测方法, 归纳对抗样本防御和检测方法的优缺点, 阐述不同视觉任务对抗样本防御的应用实例; 最后, 基于对抗攻击方法的总结, 探索并分析现有计算机视觉对抗攻击的不足和挑战。

Select

前沿观点与综述

可解释人工智能研究进展

廖勇, 韩小金, 刘金林, 汪浩

计算机工程. 2026, 52(3): 41-61. https://doi.org/10.19678/j.issn.1000-3428.0069925

摘要 (694) PDF全文 (312) HTML (76)

可视化

人工智能在诸多领域的应用取得了突破性的进展, 引起了全球各国对其研发的高度重视。然而, 人工智能的快速发展也带来了一系列的问题, 过度依赖和盲目信任人工智能模型可能导致严重的风险。因此, 可解释人工智能成为构建可信、透明的智能系统的关键要素, 其研发变得尤为迫切。为此, 本文综述可解释人工智能的国内外研究进展, 从多维度、多层次进行全面梳理与归纳。首先, 基于当前行业内的研究成果, 将可解释人工智能的关键技术细分为解释模型、解释方法、安全测试及实验验证4类, 旨在明确各领域的技术焦点与发展方向。然后, 探讨可解释人工智能在多个关键行业领域的具体应用实例, 包括但不限于教育、医疗、金融、自动驾驶及司法等, 展示其在提升决策透明度等方面的重要作用。最后, 深入剖析可解释人工智能当前面临的主要技术挑战, 并展望其未来的发展趋势, 尤其针对当前备受瞩目的大模型可解释性问题, 进行了专项调研与探讨分析。

Select

前沿观点与综述

基于Transformer的DETR目标检测算法综述

李沂杨, 陆声链, 王继杰, 陈明

计算机工程. 2026, 52(4): 62-81. https://doi.org/10.19678/j.issn.1000-3428.0069312

摘要 (682) PDF全文 (380) HTML (56)

可视化

在目标检测领域, 卷积神经网络(CNN)凭借其优异的准确性和可扩展性, 长期主导着相关研究, 并获得了学术界的广泛认可。在此框架下, 先后涌现出基于区域的卷积神经网络(R-CNN)系列(如Fast R-CNN、Faster R-CNN)与YOLO(You Only Look Once)系列等多个代表性模型。随着Transformer在自然语言处理领域的成功, 研究者开始探索将其用于计算机视觉领域, 由此产生了视觉Transformer(ViT)和Swin Transformer等视觉骨干网络。Facebook团队为减少目标检测任务中的先验知识和后处理, 在2020年推出了一种端到端目标检测算法——基于Transformer的DETR(DEtection TRansformer)。尽管DETR在目标检测领域展现出潜力, 但也存在收敛速度慢、准确性较差、目标查询的物理意义不明确等缺点。这促使研究者对该算法开展了进一步的研究和改进。本研究旨在归纳总结针对DETR的改进探索, 并分析它们的优势与不足, 同时对利用DETR开展的前沿研究和细分应用领域进行概括, 最后给出DETR在计算机视觉领域的未来展望。

Select

热点与综述

基于预训练的持续学习方法综述(特邀)

路悦, 周翔宇, 张世周, 梁国强, 邢颖慧, 程德, 张艳宁

计算机工程. 2025, 51(10): 1-17. https://doi.org/10.19678/j.issn.1000-3428.0070575

摘要 (669) PDF全文 (557) HTML (94)

可视化

传统机器学习算法只有当测试集和训练集同分布时才能取得较好的性能, 无法增量地学习原训练集中没有的新类别或任务。持续学习使模型得以具备自适应学习能力, 在持续学习新任务的同时能够防止对旧任务的遗忘。当前持续学习仍面临计算开销大、存储成本高以及性能不稳定等挑战。近年来, 预训练模型的发展为持续学习提供了新的研究方向, 有望进一步提高性能表现。首先, 分析了现有基于预训练的持续学习方法, 按照防止遗忘的机制将其归纳为基于提示池、缓慢更新参数、基于扩展主干网络分支、基于参数正则化、基于分类器设计5类方法, 进一步按照阶段数、微调方式和是否利用语言模态对其进行归类并总结了各类方法的主要特点和各自优势。然后, 分析了持续学习方法存在的主要挑战, 归纳了各类持续学习方法的适用场景和局限性, 在多个评测基准上对各类方法进行实验比较并讨论各方法的性能差异。最后, 对基于预训练的持续学习方法的研究趋势进行展望。

Select

多模态与信息融合

基于跨模态增强与时间步门控的多模态情感识别

王永旗, 王雷

计算机工程. 2026, 52(6): 258-267. https://doi.org/10.19678/j.issn.1000-3428.0070508

摘要 (636) PDF全文 (83) HTML (16)

可视化

多模态情感识别旨在通过融合不同模态(如文本、音频、视频)的信息, 提高情感识别的准确性和鲁棒性。然而, 现有方法在处理模态间的差异性和互补性、时间序列信息的动态特征捕捉方面仍存在不足, 导致情感识别效果不佳。为了解决这些问题, 提出一种基于跨模态增强与时间步门控机制的多模态情感识别模型。首先, 该模型通过跨模态交叉注意力机制学习不同模态之间的关联性, 增强各模态特征的互补性。通过跨模态的相互作用, 模型能够更好地整合来自文本、音频和视频模态的信息, 并减少单一模态在情感表达中的不足。随后, 利用时间步门控机制对每个时间步的特征权重进行动态调整, 从而聚焦于情感信息较为关键的时间步, 提升模型的时间序列建模能力。最后, 融合后的特征被输入分类器进行情感预测。在公开的CMU-MOSEI和CMU-MOSI多模态情感识别数据集上进行实验评估, 实验结果表明, 所提模型的情感识别准确率分别达到82.41%和82.60%, 相较于ALMT和TETFN等当前主流模型, 均有显著提升。这证明了跨模态增强与时间步门控机制有效提高了模型的多模态特征融合和时间序列处理能力, 验证了该方法在多模态情感识别任务中的有效性与鲁棒性。

Select

热点与综述

GRD: 基于GNN和扩散模型的多变量时序数据异常检测算法

邸钦渤, 陈劭力, 时良仁

计算机工程. 2025, 51(11): 35-44. https://doi.org/10.19678/j.issn.1000-3428.0069780

摘要 (571) PDF全文 (624) HTML (69)

可视化

随着多变量时序数据在各行业中的广泛应用, 开发有效的异常检测方法对于保障系统的稳定运行和安全性变得极为关键, 由于多变量时序数据内在的复杂性和动态变化特性, 对异常检测算法提出了更高的要求。针对现有异常检测方法在处理含有复杂变量关系的高维数据时存在效率不足的问题, 提出一种基于图神经网络(GNN)与扩散模型的多变量时序数据异常检测算法GRD。通过节点嵌入和图结构学习, GRD算法能有效地捕捉和表示变量间的复杂关系, 并通过门控循环单元(GRU)和去噪扩散概率模型(DDPM)进一步提取特征, 实现了对异常数据的高精度检测。在以往的实验评估中, 大多数算法在评分前会采用点调整(PA)评估协议, 该协议会严重高估算法的检测能力。为了更准确地评估算法性能, 采用新的评估协议和评价指标。实验结果表明, GRD算法在3个公开数据集上的F1@k指标分别是0.741 4、0.801 7、0.767 1, 性能优于现有方法。特别是在高维数据处理方面, GRD算法展现出显著优势, 证明了其在现实场景的异常检测应用中的实用性和鲁棒性。

Select

热点与综述

基于区块链的版权保护研究综述

赵楷, 胡煜环, 闫俊桥, 毕雪华, 张琳琳

计算机工程. 2025, 51(8): 1-15. https://doi.org/10.19678/j.issn.1000-3428.0069147

摘要 (563) PDF全文 (295) HTML (103)

可视化

区块链作为一种分布式可信数据库，在数字版权保护领域得到有效应用，引起学术界和工业界的广泛关注。传统数字版权保护技术存在侵权追踪难、版权交易复杂、合法权益保护不足等问题，严重制约数字版权保护研究的发展。区块链的防篡改、可追溯和去中心化等特性为解决数字版权侵权风险提供了可信、透明和安全的解决思路。首先介绍了区块链技术的基本原理；然后针对传统版权保护方案存在的问题，介绍了区块链结合传统版权保护技术的最新研究成果；接着评估了区块链在实际应用中的效果和潜力，强调其对版权保护体系的积极影响；最后探讨了区块链版权保护面临的挑战和未来发展趋势，以实现更加完善和可持续的区块链版权保护体系。

Select

多模态与信息融合

基于注意力模态融合的多模态意图识别

苏建华, 池云仙, 许云峰, 高凯

计算机工程. 2026, 52(3): 234-242. https://doi.org/10.19678/j.issn.1000-3428.0069955

摘要 (563) PDF全文 (149) HTML (19)

可视化

意图识别是自然语言理解的一项重要任务, 传统的意图识别研究主要关注于特定任务的单模态意图识别。然而, 在现实世界的场景中, 人类的意图是复杂的, 需要通过整合诸如语言、语调、表情和动作等信息来判断。提出以注意力为主的多模态融合的意图识别方法, 用于在真实世界的多模态场景中进行意图识别。为了能够捕捉和融合不同模态之间的长距离依赖关系, 自适应地调整各模态信息的重要性和提供更丰富的表示, 对每个模态特征分别使用自注意力机制。通过在每个模态的特征中添加明确的模态标识, 使模型能够区分并有效融合不同模态的信息, 提升整体理解和决策能力。考虑到在跨模态交互时文本模态信息的重要性, 使用以跨注意力机制为核心、以文本为主导其他模态辅助交互引导的多模态融合, 旨在促进文本与视觉、听觉模态之间的交互。最后对多模态意图识别的MIntRec和MIntRec2.0基准数据集进行了实验评估。结果显示, 该方法在准确性、精确度、召回率和F1值等指标上均优于现有的多模态学习方法, 比目前最好的基线方法提升0.1~0.5百分点。

Select

计算机视觉与图形图像处理

基于RSD-YOLO的无人机航拍图像小目标检测

汤伟博, 方强, 李沛根, 艾龙金, 熊金红, 夏海廷

计算机工程. 2026, 52(4): 214-228. https://doi.org/10.19678/j.issn.1000-3428.0070151

摘要 (537) PDF全文 (128) HTML (34)

可视化

针对无人机(UAV)航拍图像存在的检测性能低、遮挡严重、小目标特征提取难度大及模型参数量大的问题, 提出了基于YOLOv8s的RSD-YOLO算法。首先, 设计了感受野注意力(RFA)模块CSP-RFA替代C2f模块, 以提升小目标特征提取能力, 有效应对传统卷积操作对位置变化不敏感的问题。其次, 对主干网络和特征融合网络进行了轻量化处理, 新增了大尺寸特征图检测分支, 并提出了感受野金字塔网络(RFPN), 优化特征流动方向, 增强特征表达能力。再次, 检测头模块经过优化, 将多尺度特征集成至具有多级注意力机制的检测头中, 并替换了损失函数, 提升了模型对小目标的检测性能。最后, 在模型压缩方面, 采用层自适应幅度剪枝(LAMP)算法, 进一步减少了模型的参数量和大小。实验结果表明, 轻量化后的RSD-YOLO在公开数据集VisDrone2019上较基线模型有显著提升, 精度提高了10.0百分点, mAP@0.5提升9.5百分点(增幅24.1%), mAP@0.5∶0.95提高6.9百分点(增幅29.4%)。模型参数量从11.12×10⁶减少至4.05×10⁶(减少63.6%), 计算量从42.7 GFLOPs降至25.5 GFLOPs(减少40%)。此外, 在仅检测遮挡小目标的新数据集上, RSD-YOLO在精度、mAP@0.5、mAP@0.5∶0.95上分别提升了9.1、16.1和10.7百分点。

Select

热点与综述

大模型工具学习: 方法、作用与机制

廖牛语, 田沄, 李岩松, 薛海峰, 杜长坤, 张国华

计算机工程. 2025, 51(12): 1-17. https://doi.org/10.19678/j.issn.1000-3428.0253230

摘要 (520) PDF全文 (346) HTML (90)

可视化

近年来, 以GPT、LLaMA、Qwen、DeepSeek等为代表的大模型在自然语言处理、计算机视觉及多模态等领域取得了突破性进展。然而, 受限于其推理机制、参数规模和固有的训练数据知识等因素, 这些模型在处理复杂任务、解答专业领域问题及生成时效性内容时, 常出现答案不准确乃至事实性偏差幻觉等问题, 严重制约了其在高可靠性场景中的应用。为突破上述能力瓶颈, 工具学习范式应运而生并迅速成为研究热点, 其核心旨在使大模型理解并使用外部工具以完成特定任务。通过调用数据库、搜索引擎、数学工具等外部工具, 大模型能够超越自身参数化知识, 提升其推理、决策和执行能力, 缓解幻觉问题。本文系统综述了大模型工具学习的发展脉络与技术进展, 剖析了工具对大模型能力的扩展, 梳理了从上下文学习到微调训练的工具调用机制, 进而探讨了工具调用性能优化、自适应工具生成等关键问题, 分析了大模型工具调用的测评方法, 最后总结了当前工具学习面临的挑战并对大模型工具学习未来发展方向进行展望。

Select

人工智能与模式识别

基于个性化数据增强的自监督序列推荐算法

王帅, 史艳翠

计算机工程. 2025, 51(8): 190-202. https://doi.org/10.19678/j.issn.1000-3428.0069636

摘要 (518) PDF全文 (267) HTML (91)

可视化

序列推荐算法通过对用户的历史行为进行动态建模, 以预测其可能感兴趣的内容。聚焦对比式自监督学习(SSL)在序列推荐中的应用, 通过设计有效的自监督信号, 增强模型在稀疏数据场景下的表征能力。首先, 针对随机数据增强易引入数据噪声的问题, 提出融合用户偏好的个性化数据增强方法, 通过用户评分引导增强过程, 同时对长、短序列使用不同的增强方法组合, 生成符合用户偏好的增强序列; 其次, 为了缓解训练中出现的数据特征学习不平衡问题, 设计一种混合增强训练法, 在训练前期, 通过随机选择增强方法生成增强序列, 提高模型的性能和泛化能力, 在训练后期, 选择与原始序列相似度较高的增强序列, 使模型全面学习用户的实际偏好和行为模式; 最后, 将传统的序列预测目标与SSL目标相结合, 推断出用户的表示。在数据集Beauty、Toys和Sports上进行实验验证, 结果表明, 相较于基线模型中的最优结果, 所提方法的HR@5指标分别提升了6.61%、3.11%和3.76%, NDCG@5指标分别提升了11.40%、3.50%和2.16%, 上述实验结果验证了该方法的合理性和有效性。

Select

AI算力赋能的车载边缘计算

基于空地协同的动态车载边缘任务卸载方法

崔萌萌, 施静燕, 项昊龙

计算机工程. 2025, 51(9): 25-37. https://doi.org/10.19678/j.issn.1000-3428.0069836

摘要 (509) PDF全文 (223) HTML (73)

可视化

为了进一步优化车载服务的服务质量(QoS)，移动边缘计算(MEC)被深度整合于车联网(IoV)中，旨在为车辆提供地理位置较近的计算资源，降低任务处理延迟和能耗。然而，传统的MEC服务器部署主要依赖于地面基站(BS)，这不仅导致高昂的部署成本，而且限制其覆盖范围，难以确保为所有车辆提供无间断服务。为了应对上述挑战，空地协同IoV作为一种新兴的技术方案应运而生。无人机(UAV)能够借助其视距链路的灵活性动态地协助路边单元(RSU)，为车辆用户提供更为灵活的计算资源，进而保障车载服务的连续性和高效性。提出一种基于空地协同的动态车载边缘任务卸载方法(DVETOM)。该方法采用车-路-空架构，构建了车辆到RSU(V2R)链路和车辆到UAV(V2U)链路。针对车辆任务的本地执行、卸载至RSU执行和卸载至UAV执行3种模式分别构建传输模型和计算模型，并以最小化系统时延和能耗作为联合优化目标构建目标函数。DVETOM将任务卸载问题转化为马尔可夫决策过程(MDP)，基于深度强化学习(DRL)的分布式深度确定性策略梯度(D4PG)算法优化任务卸载策略。与5种基准方法进行对比，实验结果表明，DVETOM在提升车辆用户QoS的同时，在降低系统时延方面优于现有方法3.45%~23.7%，在降低系统能耗方面优于现有方法5.8%~23.47%。综上所述，DVETOM有效地优化了IoV中的车载边缘任务卸载，为IoV用户提供了更高效、更节能的服务解决方案，展现了其在智能交通系统领域的广泛应用潜力。

Select

开发研究与工程应用

基于Kubernetes的异构任务调度方法

朱亚州, 杜平川, 柴志雷

计算机工程. 2025, 51(12): 337-345. https://doi.org/10.19678/j.issn.1000-3428.0069437

摘要 (458) PDF全文 (187) HTML (46)

可视化

Kubernetes作为容器编排的主流工具, 可支持自动部署、服务发现以及负载均衡, 且具有高可用性、高效能的特点。然而, Kubernetes采用的最佳适应算法或最小负载法等调度策略忽略了节点的异构性和性能的差异性。此外, Kubernetes工具仅考虑CPU资源和内存资源且预先设置统一权重机制, 容易导致负载不均衡、性能下降以及无法满足精细化调度等问题。针对这些问题, 提出了一种基于多维度资源的异构任务调度(A-KCSS)算法, 该算法基于集群的异构计算资源, 增加磁盘输入/输出(I/O)、网络I/O负载以及GPU资源作为评价指标进行过滤和筛选, 更全面地考虑了node的异构性。此外, 引入一种基于多维度资源因素的权重计算模型, 依据待调度任务的资源需求, 计算待调度任务各维度资源因素的权重值, 结合集群node的实时资源利用率计算出每一个node的评分, 依据评分进行优先级排序, 并选择优先级最高的node进行调度。通过实验在Kubernetes集群上测试了A-KCSS算法的性能, 该算法与Kubernetes默认的调度算法以及Kubernetes容器调度(KCSS)算法相比, 平均响应时间分别减少10%和4%, 吞吐量分别提高30%和15%, 可用性分别提高40%和30%, 负载均衡性分别提高23%和18%, 集群的整体性能得到提高。

Select

交叉融合与工程应用

基于ACNN-LFSwin Transformer的双通道滚动轴承故障诊断方法

火久元, 李昕, 常琛, 张耀南

计算机工程. 2026, 52(5): 430-444. https://doi.org/10.19678/j.issn.1000-3428.0070297

摘要 (432) PDF全文 (161) HTML (11)

可视化

滚动轴承是机械设备中的常用部件, 传统方法难以对多噪声环境下具有众多复杂特征的信号进行分类, 并且常在一维数据上通过经典深度学习模型进行故障诊断, 无法对复杂特征进行充分提取。因此, 提出一种基于ACNN-LFSwin Transformer的双通道故障诊断方法, 分别在一维数据和二维图像上进行故障诊断。首先, 对原始信号分别进行基于完全自适应指数模型分解(CEEMDAN)与短时傅里叶变换(STFT)处理, 获取模态分量(IMF)与二维图像; 然后, 在通道1中将CEEMDAN分解后的IMF送入基于注意力机制的卷积神经网络(ACNN)中进行特征提取, 在通道2中将轴承数据构成的二维图像作为局部特征提取的Swin Transformer网络(LFSwin Transformer)的输入, 进行图像特征提取; 最后, 将两通道特征进行串联融合, 以进行故障诊断, 其中, ACNN运用注意力机制对信号特征进行自动权重分配, 以强调关键特征, LFSwin Transformer模型在传统Swin Transformer的基础上进行向量转换, 将输入向量转换为图像并对其进行卷积操作, 使模型在故障局部特征提取方面更具优势。分别采用CWRU数据集和帕德博恩数据集进行实验验证, 结果表明, 该方法的故障诊断准确率达97%以上, 说明所提方法不仅能对多种故障进行精确诊断, 还能有效避免复杂噪声的干扰。

Select

开发研究与工程应用

改进YOLOv8的城市车辆目标检测算法

许德刚, 王双臣, 尹柯栋, 王再庆

计算机工程. 2025, 51(11): 377-391. https://doi.org/10.19678/j.issn.1000-3428.0069125

摘要 (422) PDF全文 (93) HTML (10)

可视化

为了解决城市车辆目标检测算法中存在检测效果差、误检漏检率高、泛化能力弱的问题, 提出一种改进YOLOv8的城市车辆目标检测算法。首先, 在主干网络尾部融入高效多尺度注意力(EMA)机制, 有助于模型更好地捕捉目标车辆的细节特征, 结合160×160像素尺寸的小目标检测层来加强对小目标的检测能力, 通过维度交互进一步聚合像素级特征, 增强对目标车辆的挖掘能力。其次, 为轻量化网络设计了一种多尺度轻量化卷积(MLConv)模块, 并基于MLConv重构了C2f模块, 提高模型的特征提取能力。最后, 为抑制低质量图像产生的有害梯度, 采用WIoU损失函数替代完全交并比(CIoU)损失函数, 优化网络的边界框损失, 提升模型的收敛速度和回归精度。在Streets车辆数据集上进行验证, 结果表明, 改进算法的mAP@0.5、mAP@0.5∶0.95和召回率相较于基准模型YOLOv8n分别提升了1.9、1.4和2.4百分点。在国内车辆数据集和VisDrone2019小目标数据集上进行验证, 改进算法的各项性能指标都有不同程度的提升, 充分证明了改进算法具有良好的泛化性和鲁棒性。与其他主流算法相比, 改进算法同样表现出了更高的准确率和召回率, 表明该算法对于城市车辆目标检测具有更好的性能。

Select

开发研究与工程应用

基于知识图谱和图卷积神经网络的配电网智能规划方法

郑洁云, 张章煌, 宣菊琴, 魏鑫, 薛静玮

计算机工程. 2025, 51(11): 392-402. https://doi.org/10.19678/j.issn.1000-3428.0069531

摘要 (416) PDF全文 (121) HTML (13)

可视化

配电网规划在电力系统中非常重要, 因为它直接影响到电力供应的可靠性、效率和经济性。良好的规划可以确保电力资源得到高效分配, 同时降低运营成本和减少电力损耗。然而, 随着电力需求的增加和系统复杂性的提升, 传统的决策方法不再适用。为提升设备选型、连接配置和电网布局的效率和可靠性, 提出一种基于知识图谱(KG)和图卷积神经网络(GCNN)的配电网智能规划方法KG-GCNN。该方法综合利用KG、图神经网络(GNN)和卷积神经网络(CNN)技术的优势, 为电力系统规划者提供一种智能化的配电网规划方法, 以更好地理解、分析和优化电力系统的设备配置、连接以及物理布局。首先, 建立电力网络的KG, 该KG包含电网的设备、属性及其相互关系, 为后续的分析和优化提供基础; 然后, 利用GNN对电力网络的结构数据进行分析, 以捕捉设备之间的关系和影响, 为设备配置和连接决策提供重要信息; 最后, 引入CNN改善电网的物理布局, 以确定电网中设备的最佳位置和连接方式, 从而提高电网的性能和可靠性。实验结果表明, 通过与决策树、支持向量机(SVM)、循环神经网络(RNN)相比, 该方法能够有效匹配电网中的复杂拓扑结构, 优化电网的物理布局。

Select

新一代网络与边缘计算

基于ResNet-Transformer的通信信号自动调制识别

沈丹阳, 麦文

计算机工程. 2026, 52(5): 383-395. https://doi.org/10.19678/j.issn.1000-3428.0069677

摘要 (412) PDF全文 (112) HTML (10)

可视化

自动调制识别(AMR)是通信识别、态势感知和电子侦察等领域的重要环节。由于深度神经网络具有很强的特征提取和分类能力, 使得与传统检测方法相比有着更高的识别精度, 但目前常用的神经网络在提取信号时序信息时存在局限性, 包括高复杂度和低信噪比下识别精度差等问题。针对以上问题, 构建一种基于残差神经网络(ResNet)和Transformer网络(ResNet-Transformer)的决策融合识别方案, 旨在处理更复杂的信噪比情况, 并提高整体的识别准确率。该方案首先通过ResNet的时序记忆特性深度挖掘通信信号的时域特征, 然后结合Transformer网络突出的长距离依赖关系提取能力进一步提升抗噪性能, 最后使用决策融合策略根据每条支路输出得到最终判决结果。实验结果表明, 在开源数据集RML2018.01A上, 该方案在信噪比为10 dB以上时平均识别精度大于93%, 在信噪比为0时仍能保持56%的识别精度, 相比传统网络模型能取得更高的调制识别准确率并且具有良好的抗噪能力。

Select

前沿观点与综述

多旋翼无人机仿真平台综述

方仪豪, 邹丹平

计算机工程. 2026, 52(2): 13-23. https://doi.org/10.19678/j.issn.1000-3428.0070059

摘要 (409) PDF全文 (166) HTML (60)

可视化

随着人工智能与机器人技术的深度融合, 多旋翼无人机在多个领域中得到了广泛应用, 展现了其灵活性和高效性。然而, 在开发和验证多旋翼无人机的飞行控制算法或解决方案时, 研究人员面临着高成本和高风险的挑战。为了降低这些风险并提高算法测试和优化的效率, 多旋翼无人机仿真平台提供了一个安全、可控的环境。首先, 介绍了多旋翼无人机的常规机型, 选取了常用的四旋翼无人机作为多旋翼无人机的代表机型, 根据不同仿真程度阐述了其动力学模型。接着, 对多旋翼无人机仿真平台的常规系统结构框架进行概述, 并探讨了其评价方式和分类方法。从功能和性能两个方面出发, 进一步细化了仿真平台的评价方式。多旋翼无人机仿真平台的分类一方面根据其是否支持交互学习环境进行划分, 另一方面依据不同侧重点, 从动力学、传感器和多机集群3个方面进行分类。然后, 回顾了现有无人机飞行任务的主要解决方案, 在传统解决方案和基于学习方式的解决方案背景下, 分析了现有的典型多旋翼无人机仿真平台。最后, 对多旋翼无人机仿真平台未来发展进行了展望。

Select

多模态与信息融合

基于多模态可见光和红外图像融合的船舶检测方法

于梦源, 刘向阳

计算机工程. 2026, 52(6): 278-287. https://doi.org/10.19678/j.issn.1000-3428.0070436

摘要 (408) PDF全文 (251) HTML (5)

可视化

单一模态图像在全天候的船舶检测中易受光照、天气等环境影响, 导致船舶检测精度低、漏检率高。为此, 提出了一种融合可见光与红外图像信息的船舶检测方法VIF-RTDETR。该方法根据可见光图像丰富的细节和颜色信息以及红外图像在低光照环境下的稳定表现, 构建了四通道输入模型; 设计可见光与红外图像信息的融合模块VIF, 实现了不同模态信息的互补融合, 使得在检测网络中更加合理利用两种模态的信息; 在主干Backbone特征提取网络中结合通道注意力, 为通道动态分配不同的权重, 以增强通道的特征表达能力来进一步优化特征提取能力。此外, 为进一步提升船舶检测中船舶小目标的检测性能, 设计了一种加权的边界框损失函数, 使模型能够有效地关注不同尺寸目标的特征表达, 提高模型在不同目标尺寸下的检测精度。实验结果表明, 在船舶可见光和红外数据集上, 该模型的检测精度AP_0.5∶0.95、AP_0.5分别达到了78.3%、98.5%, 相对于单一模态的可见光和红外模型的AP_0.5∶0.95分别提升了4.7、9.2百分点; 召回率AR_0.5∶0.95达到了85.2%, 相对于单一模态模型分别提升了3.1、7.3百分点, 显著提高船舶的检测精度且降低漏检情况。

Select

多模态与信息融合

基于多模态特征融合的Android恶意软件检测模型研究

张志, 尹昱凯, 孙奕灵, 孟雯锦, 彭畅

计算机工程. 2026, 52(3): 243-254. https://doi.org/10.19678/j.issn.1000-3428.0070175

摘要 (393) PDF全文 (104) HTML (40)

可视化

针对Android恶意软件种类和结构繁杂不一、单一静态特征难以区分良性和恶意软件的问题, 在深入研究Android软件的权限、API、字节码、操作码等特征的基础上, 提出一种基于多模态特征融合的构建方法。将字节码转换为RGB图像, 通过预训练模型EfficientNetV2B3提取字节码图像特征, 以表征Android应用的整体特性。利用局部敏感哈希(LSH)算法提取操作码序列特征, 以表征Android应用的细节特性。采用多模态分解双线性池化(MFB)融合算法对字节码图像特征和操作码序列特征进行融合, 实现2种特征数据的异质互补, 以得到更具区分度的静态特征。在此基础上, 提出一种基于Transformer的Android恶意软件检测模型(TEAAD)。实验结果表明, 基于融合特征的TEAAD模型优于其他深度模型, 检测准确率达到96.87%, MFB特征融合方法相较于其他方法具有更高的恶意软件识别能力。

Select

人工智能与模式识别

基于双维度特征增强的Transformer跟踪器

袁英华, 金英然, 高赟

计算机工程. 2025, 51(12): 96-108. https://doi.org/10.19678/j.issn.1000-3428.0069871

摘要 (393) PDF全文 (565) HTML (86)

可视化

孪生跟踪网络是主流的目标跟踪框架之一，其包括骨干网络、融合网络和定位网络3个模块。对于融合网络模块，Transformer是较新且有效的融合网络实现方法。Transformer的编码器和解码器中使用自注意力机制对卷积神经网络(CNN)特征进行增强。然而，自注意力机制仅能从空间维度进行特征增强，未考虑从通道维度进行特征增强。为了使得Transformer的自注意力网络同时对特征的空间维度和通道维度进行增强，为目标定位网络提供准确的相关性信息，提出一种基于双维度特征增强的Transformer跟踪器，对Transformer融合网络进行改进。首先，采取骨干网络的第三和第四阶段特征作为输入；然后，在Transformer编码器与解码器的自注意力模块中，通过CAE-Net网络进行通道维度的特征增强，用于增强通道上的重要性，通过SAE-Net网络实现两阶段特征的加权融合与线性变换，获取自注意力因子Q、K和V；最后，通过自注意力运算实现空间维度特征增强。在5个主流的公开基准数据集上进行实验，结果表明，改进后的Transformer特征融合模块可以用极小的速度代价提升跟踪器的跟踪性能。

Select

人工智能与模式识别

基于注意力机制的神经网络优化模型的行驶疲劳度研究

李博文, 丁牧恒, 方美华, 朱桂平, 魏志勇, 成巍, 李亚云, 卞双双

计算机工程. 2025, 51(10): 87-96. https://doi.org/10.19678/j.issn.1000-3428.0069857

摘要 (384) PDF全文 (236) HTML (23)

可视化

疲劳驾驶是导致交通事故的主要因素之一。在人工智能领域, 基于脑电图(EEG)的驾驶疲劳状态分类已成为重要研究方向。近年来, 融合注意力机制的深度学习模型在EEG疲劳识别中得到了广泛应用。以SEED-VIG数据集作为研究对象, 采用ReliefF特征选择算法, 构建基于自注意力、多头注意力、通道注意力、空间注意力机制的卷积神经网络(CNN)、长短期记忆(LSTM)网络和支持向量机(SVM)优化模型。在SEED-VIG数据集提供的EEG数据上的实验结果表明, 基于多模注意力机制的多种神经网络优化模型的准确率、召回率、F1值等指标均得到了有效提升, 其中以平均准确率和标准偏差作为对比参数, 可增强空间与通道信息的卷积块注意力模块(CBAM)-CNN模型的性能最佳, 分别为84.7%和0.66。

Select

人工智能与模式识别

基于多时空图融合与动态注意力的交通流预测

翟志鹏, 曹阳, 沈琴琴, 施佺

计算机工程. 2025, 51(9): 139-148. https://doi.org/10.19678/j.issn.1000-3428.0069439

摘要 (384) PDF全文 (151) HTML (54)

可视化

精准的交通流预测是实现智能交通系统的关键前提，对加强系统的仿真和控制、提高管理者的决策等方面具有重要意义。针对大多数现有的图卷积网络(GCN)模型忽略交通流数据的动态时空变化、对节点信息使用不足导致时空相关性提取不充分的问题，提出一种基于多时空图融合与动态注意力的交通流预测模型。首先，以不同的卷积单元提取交通流数据中多时域状态下的时间特征；然后，构建多时空图体现节点在空间分布中的动态变化趋势和异质性，并结合GCN提取空间特征；最后，利用多头自注意力机制分别对时空特征进行分析与融合，输出预测结果。在两个实际的公共数据集PeMS04和PeMS08上进行实验分析，并与基于注意力的时空图卷积网络(ASTGCN)、多视角的时空Transformer网络(MVSTT)和动态时空感知图神经网络(DSTAGNN)等基于时空图卷积网络的基准模型对比，结果表明所提模型在平均绝对误差(MAE)、平均绝对百分比误差(MAPE)和均方根误差(RMSE)指标上分别平均降低了7.10%、7.22%和6.47%，具有较强的适应性和鲁棒性。

Select

AI算力赋能的车载边缘计算

基于隐状态预测的失真交通信号灯路口控制策略

秦敏浩, 孙未未

计算机工程. 2025, 51(9): 1-13. https://doi.org/10.19678/j.issn.1000-3428.0069416

摘要 (381) PDF全文 (771) HTML (91)

可视化

交通信号灯控制对缓解交通拥堵、提升城市通勤效率有着重要作用。近年来，以实时交通数据为输入的基于深度强化学习的信号灯控制算法已取得突破性进展。然而，现实场景中的交通数据通常伴随着数据失真。传统方法在修复失真数据后使用强化学习算法控制信号灯，但一方面信号灯相位的动态性给失真修复引入了额外不确定性，另一方面失真修复难以与深度强化学习框架相结合来提升性能。为此，提出基于隐状态预测的失真交通信号灯路口控制模型HCRL。HCRL模型由编码子模型、控制子模型和编码预测子模型组成，通过引入信号灯路口的隐状态表示机制，更好地适应深度强化学习框架，有效表达信号灯路口的控制状态，并使用特殊的迁移训练方法避免数据失真对控制子模型的干扰。使用两个真实数据集验证了数据失真对智能信号灯控制算法的影响。实验结果表明，HCRL模型在所有失真场景和失真率下均优于基于失真修复的信号灯控制模型，并在与其他基线模型的对比中表现出了对数据失真更强的鲁棒性。

Select

热点与综述

HDMapFusion: 用于自动驾驶的多模态融合高清地图生成(特邀)

刘洋宏, 付杨悠然, 董性平

计算机工程. 2025, 51(10): 18-26. https://doi.org/10.19678/j.issn.1000-3428.0070569

摘要 (379) PDF全文 (413) HTML (30)

可视化

高清环境语义地图的生成是自动驾驶系统实现环境感知与决策规划不可或缺的关键技术。针对当前自动驾驶领域相机与激光雷达在感知任务中存在的模态差异问题, 提出一种创新的多模态融合范式HDMapFusion, 通过特征级融合策略显著提升了语义地图的生成精度。与传统直接融合原始传感器数据的方法不同, HDMapFusion创新性地将相机图像特征和激光雷达点云特征统一转换为鸟瞰视图(BEV)空间表示, 在统一的几何坐标系下实现了多模态信息的物理可解释性融合。具体而言: HDMapFusion首先通过深度学习网络分别提取相机图像的视觉特征和激光雷达的三维(3D)结构特征; 然后利用可微分的视角变换模块将前视图像特征转换为BEV空间表示, 同时将激光雷达点云特征通过体素化处理投影到相同的BEV空间, 在此基础上设计一个基于注意力机制的特征融合模块, 自适应地加权整合两种模态; 最后通过语义解码器生成包含车道线、人行横道、道路边界线等要素的高精度语义地图。在nuScenes自动驾驶数据集上的实验结果表明, HDMapFusion在高清地图生成精度方面显著优于现有基准方法。这些实验结果验证了HDMapFusion的有效性和优越性, 为自动驾驶环境感知中的多模态融合问题提供了新的解决思路。

Select

先进计算与数据处理

基于《个人信息保护法》的App隐私政策合规性检测

孙雯倩, 徐天辰, 余佩厚, 陈云芳, 张伟

计算机工程. 2025, 51(12): 189-201. https://doi.org/10.19678/j.issn.1000-3428.0069804

摘要 (374) PDF全文 (59) HTML (8)

可视化

数据隐私保护已成为社会关注的焦点，各国和地区正在陆续制定相关的法律法规，但是由于App产品发布的隐私政策存在篇幅长、专业性强等问题，利用自动化手段检测隐私政策的合规性成为亟待解决的技术难题。作为主流解决方法的机器学习模型需要标签注释的数据集进行支撑，而国内目前缺少这样的App隐私政策数据集。在分析欧盟《通用数据保护条例》(GDPR)合规性分析相关工作的基础上，设计适合我国《个人信息保护法》的标签方案，具体包括15个要求标签，然后使用网络爬虫获取10个类别、363个App的中文隐私政策，并对这些隐私政策进行语句级划分和标注，构建包括104 134个隐私政策语句及标签组成的中文隐私政策语料库。采用百度最新开源的预训练语言模型ERNIE对语料库进行训练与测试，实验结果表明，该方案检测准确率达到85.75%。

Select

计算机视觉与图形图像处理

基于多层次特征融合和注意力机制的无人机图像小目标检测算法

张信佳, 王芳

计算机工程. 2026, 52(2): 148-157. https://doi.org/10.19678/j.issn.1000-3428.0069729

摘要 (371) PDF全文 (179) HTML (10)

可视化

无人机(UAV)航拍图像中的目标通常具有尺度密集、易被遮挡且多为小目标等特点, 这导致检测过程中容易出现漏检和误检。为应对上述挑战, 基于YOLOv5s提出了针对小目标检测的SNA-YOLOv5s算法。首先, 引入空间深度转换卷积(SPD-Conv)模块替换原模型的跨步卷积层, 避免细节信息丢失, 增强小目标特征提取能力; 其次, 设计新型平均快速空间金字塔池化(AGSPPF)模块, 引入平均池化操作缓解池化层在提取特征信息的同时会导致部分信息丢失的问题, 提升模型的特征提取能力; 再次, 新增针对小目标的大尺度检测分支, 捕捉浅层特征中丰富的细节信息, 提升模型对小目标的检测能力; 最后, 将归一化注意力机制(NAM)嵌入骨干网络, 对特征信息进行加权处理, 抑制无效的特征信息。在VisDrone2019数据集和NWPU VHR-10数据集上的训练测试结果表明, 该算法的均值平均精度(mAP)分别达到了42.3%和96.5%, 与基线模型YOLOv5s相比分别提高了8.4和2.6百分点。通过与其他基于深度学习的主流模型对比实验, 进一步验证了该模型的鲁棒性和精确性。

Select

计算机视觉与图形图像处理

基于多时相ChangeFormer的遥感图像建筑物变化检测方法

姜有泽, 刘向阳

计算机工程. 2026, 52(6): 160-169. https://doi.org/10.19678/j.issn.1000-3428.0070443

摘要 (370) PDF全文 (191) HTML (11)

可视化

针对相同地理空间、不同时相的高分辨率遥感图像之间受季节性变化、气候、光照等干扰因素影响的问题, 提出一种基于多时相ChangeFormer的遥感图像建筑物变化检测(CD)方法。该方法使用多个不同时相的遥感图像, 将最新时相遥感图像与变化前的多个遥感图像在特征差异提取上进行不同尺度下的融合, 分别关注图像的综合语义特征以及图像之间语义信息的细节。该方法有助于减少季节、光照等因素发生变化时引起的误检。同时, 考虑变化前多个不同时相的遥感图像, 将其特征差异进行融合并引入正则化项作为损失函数, 进一步消除非建筑物变化以及建筑物非变化区域光照阴影带来的干扰, 提高模型的泛化能力。构建从农业土地耕地到建筑用地变化的三时相遥感图像数据集, 实验结果表明, 相较于目前最优的BIT方法, 多时相ChangeFormer方法在F1值、交并比(IoU)、精确率和召回率指标上分别提升了9.04%、9.87%、15.27%和3.4%, 显著提高了检测精度, 且在细节信息处理方面明显优于经典的CD方法。

Select

大模型时代的服务计算

基于大语言模型的多智能体系统异常综述(特邀)

张珑耀, 温东新, 马庄宇, 舒燕君, 李庆, 刘明义, 左德承

计算机工程. 2026, 52(1): 22-32. https://doi.org/10.19678/j.issn.1000-3428.0252754

摘要 (367) PDF全文 (144) HTML (53)

可视化

基于大语言模型(LLM)的多智能体系统(MAS)虽在处理复杂任务方面展现出巨大潜力, 但其分布式特性与交互不确定性易引发多样化异常, 威胁系统可靠性。为系统化识别并分类此种异常, 进行全面综述。研究选取7个代表性MAS及相应数据集, 收集13 418段运行轨迹, 采用LLM初步分析与专家人工校验相结合的方法进行数据分析。构建一个涵盖模型理解感知异常、智能体交互异常、任务执行异常和外部环境异常4个层级的细粒度异常分类框架, 并结合典型案例揭示各类异常产生的内在逻辑与外部诱因。统计分析显示: 模型理解感知异常占比最高, 其中"上下文幻觉"和"任务指令误解"是主要问题; 智能体交互异常占16.8%, "信息隐瞒"是主因; 任务执行异常占27.1%, 主要表现为"决策重复出错"; 外部环境异常占18.3%, 以"记忆冲突"为主。此外, 模型理解感知异常作为根源性诱因, 引发其他层级的异常, 凸显了提升模型基础能力的重要性。此分类和根源分析旨在为构建高可靠的基于LLM的MAS提供理论支撑与实践参考。

Select

图形图像处理

基于多尺度区域特征融合的多器官语义分割模型

郝宏达, 罗健旭

计算机工程. 2025, 51(8): 270-280. https://doi.org/10.19678/j.issn.1000-3428.0069269

摘要 (365) PDF全文 (130) HTML (59)

可视化

深度学习逐渐被广泛应用于医学图像分割领域，基于注意力机制的分割算法是目前研究的主要方法。现有大多数基于注意力机制的2D图像分割模型在多器官分割任务中往往关注切片的整体分割效果，而忽略了切片中小目标特征信息的丢失或欠分割问题，使模型分割性能受到限制。针对这一问题，提出一种基于多尺度特征融合和改进注意力机制的多器官语义分割模型DASC-Net。DASC-Net的整体框架基于编码器-解码器架构，编码器采用ResNet 50，与解码器之间设置跳跃连接。注意力机制由1个双重注意力模块(DAM)和1个小目标提取(SOC)模块的并联结构实现，从而进行多尺度区域特征融合。DASC-Net不仅可以感知到较大目标的特征信息，还可以通过注意力权重重建的方式保留小目标的特征信息，提高了模型的分割性能。在CHAOS数据集上的实验结果表明，DASC-Net在灵敏度、Jaccard相似系数、正类预测值(PPV)、Dice相似系数和平均交并比(mIoU)上分别可以达到83.72%、75.79%、87.75%、85.63%和77.60%，在Synapse数据集上的Dice相似系数和95%豪斯多夫距离(HD95)指标数值分别为82.44%和21.25 mm。DASC-Net在2个数据集上的表现均优于其他分割网络，具有可靠、准确的分割性能。

Select

交叉融合与工程应用

基于改进YOLOv8s轻量化网络的PCBA缺陷检测算法

沈明辉, 刘宇杰, 陈婧, 叶康祈, 高赫远, 刘建, 姜烨, 殷文斐, 王恺豪, 刘振宇

计算机工程. 2026, 52(6): 326-338. https://doi.org/10.19678/j.issn.1000-3428.0070196

摘要 (364) PDF全文 (321) HTML (9)

可视化

印刷电路板组件(PCBA)的缺陷检测对于提高流水线生产效率具有重要影响, 而在PCBA之后的检查通常由人工完成, 容易造成人力与时间的浪费和出现漏检与误检的情况。为此, 提出一种轻量化的YOLOv8s改进算法, 该算法在有效降低模型复杂度的同时可以提高PCBA缺陷的检测精度。首先, 由于没有公开的PCBA相关数据集, 因此构建一个名为PCBA-DET的组装后PCBA缺陷检测数据集, 并对PCBA-DET进行多种方式的数据增强以模拟实际生产场景和改善数据集的平衡性。其次, 将YOLOv8s的骨干网络最后一个C2f模块替换成重参数化大核卷积网络(RepLKNet)以减少计算开销和提高模型的有效感受野, YOLOv8s的颈部网络引入P2小目标检测层和幽灵卷积以捕捉更多的细节信息, 有效降低模型参数量。实验结果表明, 在数据增强后的PCBA-DET数据集上进行评估, 均值平均精度(mAP)@0.5∶0.95和mAP@0.5与基准模型相比分别上升了2.6和0.1百分点, 但参数量和基线模型相比下降了36.8%。

Select

新一代网络与边缘计算

SAG-MEC网络下支持WPT的无人机动态任务卸载与资源分配

王怡, 覃团发, 韦睿, 黄金宝

计算机工程. 2026, 52(5): 371-382. https://doi.org/10.19678/j.issn.1000-3428.0070030

摘要 (362) PDF全文 (44) HTML (5)

可视化

针对偏远地区蜂窝网络覆盖不足且物联网(IoT)设备能量和计算能力低而无法满足大量延迟敏感型任务卸载和计算需求的问题, 考虑将空天地一体化网络(SAGIN)和移动边缘计算(MEC)相结合, 提出一种支持无线电力传输(WPT)技术的无人机辅助IoT设备的动态任务卸载和资源分配方案, 其中无人机负责收集IoT设备产生的计算密集型任务, 采用部分卸载模式将这些任务根据当前状态进行本地计算或动态卸载给基站和低地球轨道(LEO)卫星进一步处理。由于动态的异构网络和长期排队延迟与短期决策的耦合性, 因此在排队延迟的约束下提出一种基于Lyapunov优化的双延迟深度确定性策略梯度(TD3PG)算法, 该算法通过优化无人机动态关联、任务分配、计算资源分配和带宽分配来协调无人机学习最优卸载策略和资源分配。仿真结果表明, 所提出的动态方案与其他对比方案相比能够有效降低无人机网络的能耗、网络积压总和及平均排队延迟, 在2种学习率组合下TD3PG算法相对于深度确定性策略梯度(DDPG)算法和双重深度Q网络(DDQN)算法的奖励分别提高了13.6%、24.0%和20.4%、17.9%。

Select

移动互联与通信技术

无蜂窝网络中的联邦学习用户调度与资源优化

王华华, 黄烨霞, 李玲, 王嘉程

计算机工程. 2025, 51(12): 255-267. https://doi.org/10.19678/j.issn.1000-3428.0069877

摘要 (352) PDF全文 (864) HTML (49)

可视化

在无蜂窝网络环境下实施联邦学习(FL)时, 用户调度和资源分配策略对优化系统时间开销、提升用户可达速率以及加速FL收敛速率至关重要。为解决资源分配不均的问题, 设计一种联合用户调度、CPU处理频率和功率分配的优化方案。通过最大化系统的最小用户速率来实现资源的公平分配, 并提升FL性能。联合优化问题被分解为用户调度和功率分配两个子问题。在用户调度方面, 设计基于k-means聚类的贪婪调度算法, 以综合评估用户的信道状态和数据"价值", 并将用户划分为不同的群组。随后, 针对每个群组的资源占用情况, 为组内用户制定个性化的CPU处理频率分配方案。最后, 通过在各群组中独立执行用户调度, 实现高效且精准的用户选择, 并通过提前分组有效降低用户选择的复杂度。在功率分配方面, 引入基于二分法的功率分配算法(BM-PA)。该算法不仅考虑了用户间的公平性, 还针对资源受限用户进行了优先处理, 以确保其能够获得更优质的资源分配。BM-PA算法通过低复杂度的迭代优化过程, 实现了功率分配的快速收敛, 并在保证系统性能的同时, 显著提升了资源的利用效率。合理的用户调度策略是功率分配子问题获得最优解的基础, 采用交替迭代的方法允许在每个子问题中独立进行优化, 同时考虑到另一个子问题的解。这种相互依赖的关系通过多轮迭代优化过程, 确保功率资源被合理地分配给那些最需要或最有可能有效利用它们的用户, 从而使系统整体性能得到提升, 实现联合优化求解, 显著提升系统整体性能。仿真实验结果表明, 与基准算法相比, 所提算法在下行可达速率方面, 最佳平均提升幅度高达103.34%, 在上行可达速率方面, 最佳提升幅度达到102.78%。此外, 相较于基准算法还能平均节省67.44%的FL任务训练时间, 特别是在FL学习模型精度达到90%时, 所提算法的时间开销最小。

Select

网络空间安全

智慧医疗中基于秘密共享和同态加密的安全联邦学习方案

牛淑芬, 王宁, 周旭升, 孔维滢, 陈丽华

计算机工程. 2026, 52(4): 302-312. https://doi.org/10.19678/j.issn.1000-3428.0070132

摘要 (349) PDF全文 (62) HTML (20)

可视化

联邦学习促进了不同医疗机构之间的数据共享和合作, 提高了医疗诊断、治疗和预测的准确性和效率。然而在医疗场景中, 现有联邦学习方案仍然存在安全和效率上的问题。在训练过程中, 模型参数的更新可能会间接地泄露有关本地训练数据集的信息。为了保证模型参数的机密性, 研究人员提出了各种解决方案, 例如掩码协议和差分隐私。使用掩码协议的解决方案通常不具有较高的安全性, 而使用差分隐私的解决方案则需要在准确性和隐私性之间进行权衡。为了解决上述挑战, 提出一种智慧医疗中基于秘密共享和同态加密的安全联邦学习方案。在模型训练过程中, 该方案能够有效抵御医疗云和医疗客户端对模型参数的窃取, 同时可以抵抗多个参与方的共谋攻击。最后, 通过密文验证算法, 确保模型参数在训练过程中的可验证性。安全性和性能分析结果表明, 该方案在智慧医疗场景中可以满足模型参数的机密性和完整性要求, 与现有方案相比, 在计算效率和传输效率上也有显著提升。

Select

网络空间安全

面向多元时间序列的联合优化异常检测模型

吴杰辉, 柳毅

计算机工程. 2025, 51(9): 166-176. https://doi.org/10.19678/j.issn.1000-3428.0069162

摘要 (347) PDF全文 (88) HTML (15)

可视化

多元时间序列异常检测方法常被用于及时发现和识别系统中的异常模式和行为，以提高系统的安全性和稳定性。为了解决多元时间序列内部复杂依赖关系导致的异常检测精度降低的问题，提出一种多元时间序列异常检测模型HGAT，它基于图注意力网络并联合使用预测与重构方法进行优化。首先使用图注意力网络捕获多元时间序列在时间和空间维度上的依赖性；其次采用融合变分自编码器(VAE)的Transformer作为重构模块，并使用时间卷积网络(TCN)作为预测模块，联合实现对异常序列的检测，Transformer的自注意力机制允许重构模块在整个时间序列上建模，从而直接考虑序列中任意2个位置之间的关系，以捕捉序列的全局依赖关系，TCN通过堆叠卷积层并且增大感受野，可以有效地提取时间序列的局部特征；最后通过异常分数综合考虑重构模块和预测模块，在进行时空联合表征的基础上以全局和局部角度分析序列的整体分布。在SMAP、MSL和SMD数据集上进行实验，结果表明，HGAT的F1值分别为96.20%、97.50%和92.85%，均优于基线方法。

Select

热点与综述

SAM及其改进模型在图像分割中的应用综述

马依拉木·木斯得克, 高雨欣, 张思拓, 冯珂, 阿布都克力木·阿布力孜, 哈里旦木·阿布都克里木

计算机工程. 2025, 51(8): 16-38. https://doi.org/10.19678/j.issn.1000-3428.0070619

摘要 (343) PDF全文 (261) HTML (51)

可视化

随着通用人工智能技术的快速发展，基础模型在多个领域的应用日益受到广泛关注。在图像分割领域，分割一切模型(SAM)作为一种核心基础模型，在提升图像理解和处理效率方面展现出了显著优势。尽管SAM在图像分割任务中表现出色，但在功耗、计算效率以及在不同应用场景中的适应性等方面，仍然存在一定的优化空间。为此，从多个维度对SAM的改进方向进行了深入探索，包括提升速度与计算效率、增强模型的精度与鲁棒性、提高模型的适应性与通用性、优化提示工程设计，以及提升数据利用效率与强化迁移学习能力等方面。通过这些改进，SAM不仅能够在更复杂的任务中保持高效性能，还能更好地适应各领域和应用场景的需求。在此基础上，总结SAM在医学、遥感、机械等领域中的实际应用，展示了其在不同场景下的适用性与挑战。此外，详细介绍了图像分割领域常用的数据集和评价指标，通过实验对比分析，进一步评估了视觉Transformer(ViT)变体对SAM性能的影响，以及EfficientSAM、EfficientViT-SAM、MobileSAM和RobustSAM等改进模型的性能表现。最后，总结了SAM及其改进模型在实际应用中面临的挑战，并展望了未来的发展方向，旨在帮助科研工作者更全面地了解SAM及其变体的改进与应用，为新模型的提出提供启发。

Select

大模型时代的服务计算

后训练量化方法综述(特邀)

张俊娜, 王泓尊, 丁春涛

计算机工程. 2026, 52(1): 33-60. https://doi.org/10.19678/j.issn.1000-3428.0252721

摘要 (341) PDF全文 (653) HTML (43)

可视化

后训练量化(PTQ)是一种高效的模型压缩方法, 它无需重新训练模型, 只需少量(或无需)无标签校准数据即可将高精度浮点模型的参数转换为低比特整数表示。该方法在显著降低存储与计算开销的同时能够最大限度地保留原始模型的推理精度, 因而受到学术界与工业界的广泛关注。从PTQ的量化步骤、方法分类、工具生态、应用进展4个维度, 系统总结PTQ的研究进展。首先, 构建了量化流程框架, 涵盖动态范围统计、量化参数计算、权重与激活量化、误差优化和模型生成等步骤; 其次, 提出一个完整的量化方法分类体系, 从量化粒度、位宽、校准方法到结构导向量化; 再次, 分析了支持PTQ规模化应用的工具生态, 探讨了其在硬件适配和工程部署中的应用价值; 最后, 总结了PTQ方法的融合与应用进展, 并指出PTQ方法在实践中面临的挑战, 尤其是跨模态一致性、极低比特语义崩塌与硬件适配等难题。这些实践挑战的总结不仅揭示了当前技术的局限性, 也为未来研究提供了重要方向。本综述为学术界与工业界提供了PTQ方法的参考框架, 助力推动人工智能在资源受限场景中的广泛应用。

Select

热点与综述

群体机器人系统通信编程框架综述

彭龙, 高元钧, 刘晓东, 余杰

计算机工程. 2025, 51(10): 37-52. https://doi.org/10.19678/j.issn.1000-3428.0069708

摘要 (340) PDF全文 (648) HTML (68)

可视化

算力和网络技术的发展使得机器人逐渐向小型化、群体化、智能化方向发展，部署在硬件设备上的机器人软件需要集成从底层设备驱动和控制到上层运动规划和推理等多种软件模块，软件架构日益复杂。群体机器人通信编程框架从机器人软件标准化、模块化、平台化等目标出发，减轻了机器人通信编程的复杂度。分析总结机器人软硬件架构发展趋势，得出群体机器人系统是由各类计算节点、执行器、传感器等硬件设备通过有线或无线网络互联构成的多域异构分布式系统。这种硬件设备的异构性使得软件模块难以通过单一框架集成。归纳分析现有群体机器人系统通信编程框架在易用性、可移植性等方面的特点，从编程模型、异构硬件平台支持、组件间通信机制、编程语言等核心能力方面对通信编程框架进行对比，并在实时性、虚拟化、组件编排和容错支持等扩展能力方面展望通信编程框架的发展趋势，聚焦于以元操作系统(OS)为底座的下一代编程框架，以期构建人机物泛在融合的群体机器人软件架构。

Select

人工智能与模式识别

基于EWBiLSTM-ATT的数据手套手语识别

武东辉, 王金凤, 仇森, 刘国志

计算机工程. 2025, 51(8): 107-119. https://doi.org/10.19678/j.issn.1000-3428.0070202

摘要 (338) PDF全文 (299)

可视化

手语识别近年来受到广泛关注,但现有手语识别模型存在训练时间长和计算成本高的问题。为此,基于穿戴式数据手套提出一种融合注意力机制的首层宽卷积核扩展深度卷积神经网络(EWDCNN)和双向长短期记忆网络(BiLSTM)的混合深度学习方法——EWBiLSTM-ATT模型。首先通过加宽首层卷积层来减少模型参数量,提升计算速度,通过扩展WDCNN卷积层深度来提高模型自动提取手语特征的能力;其次引入BiLSTM作为时间建模器捕捉手语序列数据的时间动态信息,有效处理传感器数据中的时序关系;最后利用注意力机制通过映射加权和学习参数矩阵赋予BiLSTM隐含状态不同权重,通过计算每个时间段的注意力权重,模型自动选择与手势动作相关的关键时间段。以STM32F103为主控模块,以MPU6050与Flex Sensor 4.5传感器为核心搭建数据手套手语采集平台。选取16种动态手语动作用于构建GR-Dataset数据训练模型。同一实验条件下,EWBiLSTM-ATT准确率为99.40%,相对于CLT-net、CNN-GRU、CLA-net、CNN-GRU-ATT模型分别提升10.36、8.41、3.87、3.05百分点,训练总时间分别缩减至这4种对比模型的57%、61%、55%、56%。

Select

开发研究与工程应用

基于深度强化学习的无人机空战机动决策方法

张祥瑞, 谭泰, 李辉, 张建伟, 黎博文

计算机工程. 2025, 51(12): 324-336. https://doi.org/10.19678/j.issn.1000-3428.0069621

摘要 (336) PDF全文 (95) HTML (3)

可视化

无人机(UAV)近距空战环境复杂, 敌机机动高速变化, 针对该环境下六自由度无人机空战自主机动决策困难的问题, 提出一种分层框架下基于双重奖励的近端策略优化(DR-PPO)无人机自主引导算法。传统深度强化学习方法在解决六自由度无人机空战任务时, 因动作空间维度高、探索空间大, 导致算法收敛速度慢甚至难以学习到决策的问题, 设计无人机空战机动决策分层框架, 将空战任务分为决策与控制两个子问题, DR-PPO算法作为决策层生成高层决策, 通过双重奖励引导无人机更好地理解正确的空战行为, 解决空战任务中奖励稀疏难以收敛的问题; 比例积分微分(PID)算法作为控制层, 生成无人机基本控制律, 将高层决策转换并输出原始控制指令, 使DR-PPO算法更专注于无人机机动决策层面, 缩短飞行控制的探索时间, 加快算法的收敛速度。仿真结果表明, 在典型的空战实验场景中, 分层框架下的DR-PPO算法能够缩短探索时间, 避免陷入局部最优, 有效引导无人机在不同态势下自主学习机动决策并快速到达优势位置, 完成空战任务, 其收敛效果与机动决策表现均显著优于传统深度强化学习方法下的DR-PPO算法及PPO算法, 有效提高了无人机作战能力, 并通过复杂多场景测试验证该算法具有良好的泛化性。

Select

AI算力赋能的车载边缘计算

基于半监督学习的非结构化道路缺陷检测算法

朱思远, 李佳圣, 邹丹平, 何迪, 郁文贤

计算机工程. 2025, 51(9): 14-24. https://doi.org/10.19678/j.issn.1000-3428.0069534

摘要 (334) PDF全文 (227) HTML (84)

可视化

非结构化道路的缺陷目标检测任务对道路交通安全具有重要意义，但检测所需的标注数据集相对有限。为了解决非结构化道路标注数据集缺乏以及现有模型对无标注数据学习能力不足的问题，提出一种MAM(Multi-Augmentation with Memory)半监督目标检测算法。首先，引入缓存机制存储无标注图像和带有伪标注图像的框回归位置信息，避免了后续匹配造成的计算资源浪费。其次，设计混合数据增强策略，将缓存的伪标签图像与无标签图像混合输入学生模型，以增强模型对新数据的泛化能力，并使图像的尺度分布更加均衡。MAM算法不受目标检测模型的限制，并且更好地保持了目标框的一致性，避免了计算一致性损失。实验结果表明，MAM算法相比其他全监督学习和半监督学习算法更具优越性，在自建的非结构化道路缺陷数据集Defect上，在标注比例为10%、20%和30%的场景下，MAM算法的均值平均精度(mAP)相比于Soft Teacher算法分别提升了6.8、11.1和6.0百分点，在自建的非结构化道路坑洼数据集Pothole上，在标注比例为15%和30%的场景下，MAM算法的mAP相比于Soft Teacher算法分别提升了5.8和4.3百分点。

Select

大模型时代的服务计算

大语言模型赋能区块链服务安全研究综述: 现状、挑战与机遇(特邀)

林丹, 卢顺峰, 刘姿妍, 张博昭, 何龙, 蒋子规, 吴嘉婧, 郑子彬

计算机工程. 2026, 52(1): 1-21. https://doi.org/10.19678/j.issn.1000-3428.0253233

摘要 (331) PDF全文 (156) HTML (43)

可视化

区块链已逐渐发展成支撑数字经济的重要基础设施, 但其匿名性、跨链互操作性、多方参与等特征, 导致诈骗、洗钱与攻击等安全事件频发, 严重威胁生态系统的稳定与合规。尽管现有分析工具与方法在区块链服务安全领域取得了一定进展, 但仍普遍存在泛化能力不足、推理能力有限、难以适应复杂业务逻辑演化等问题。与此同时, 生成式大语言模型(LLM)的快速发展正在深刻重塑服务计算范式, 其在自然语言理解、知识推理与多模态融合等方面的优势, 为区块链服务安全研究提供了新的思路与技术路径。系统梳理LLM在事前智能合约审计、事中异常行为检测、事后多链行为关联任务中的应用进展, 归纳其优势与局限, 总结LLM赋能区块链服务安全的典型实践。最后, 展望LLM赋能区块链服务安全面临的开放科学问题与未来研究方向, 为构建可信、可解释、高效的区块链服务计算与治理体系提供参考。

阅读排行

选择文件类型/文献管理软件名称

选择包含的内容

模态框（Modal）标题

阅读排行

选择文件类型/文献管理软件名称

选择包含的内容