计算机工程

Select

空天地一体化算力网络

空地算力网络中的异构资源协同优化

李斌, 山慧敏

计算机工程. 2025, 51(5): 1-8. https://doi.org/10.19678/j.issn.1000-3428.0069423

摘要 (156) PDF全文 (231) HTML (23)

可视化

针对算力网络中终端用户计算能力不足及边缘节点算力分配不均的问题, 提出一种以激励机制为基础的无人机(UAV)协同终端直连(D2D)边缘计算方案。首先, 在满足计算资源、发射功率、计算资源单价等限制条件下, 通过联合优化任务卸载比例、计算资源限制量、UAV飞行轨迹、UAV和用户的发射功率以及计算资源出售单价, 提出一个系统收益最大化问题。其次, 利用近端策略优化(PPO)确定用户卸载和购买策略, 通过在多个时间步骤上迭代优化策略最大化累积奖励, 并引入剪切项以限制策略更新的幅度, 以确保求解算法的稳定性。仿真结果显示, 基于PPO的系统收益最大化算法相比基线算法具有更好的收敛性, 并能够有效提升系统总收益。

Select

人工智能与模式识别

基于改进YOLOv8的密集行人检测模型

黄昆, 齐肇建, 王娟敏, 胡倩, 胡伟超, 皮建勇

计算机工程. 2025, 51(5): 133-142. https://doi.org/10.19678/j.issn.1000-3428.0069026

摘要 (342) PDF全文 (267) HTML (29)

可视化

密集行人检测是公共智能监控的关键技术, 其采用目标检测方法对视频中的行人位置和数量进行检测, 进而实现对视频中人群的智能监控。在人员密集场景下因遮挡和行人的目标太小造成漏检。为此, 提出一种改进YOLOv8检测模型Crowd-YOLOv8。首先, 在主干网络使用nostride-Conv-SPD模块, 增强对图像小目标特征等细粒度信息的提取能力; 其次, 在YOLOv8网络的颈部引入小目标检测头和CARAFE上采样算子对各尺度特征进行融合, 以提高在小目标情况下的检测效果。实验结果表明, 所提模型在CrowdHuman数据集上mAP@0.5和mAP@0.5∶0.95分别取得了84.3%和58.2%的检测效果, 与原YOLOv8n相比分别提高了3.7和5.2百分点; 在WiderPerson数据集上取得了88.4%和67.4%, 与原YOLOv8n相比提高了1.1和1.5百分点。

Select

开发研究与工程应用

基于改进YOLOv8n的手机屏幕瑕疵检测算法: PGS-YOLO

周思瑜, 徐慧英, 朱信忠, 黄晓, 盛轲, 曹雨淇, 陈晨

计算机工程. 2025, 51(5): 326-339. https://doi.org/10.19678/j.issn.1000-3428.0069259

摘要 (248) PDF全文 (110) HTML (11)

可视化

手机屏幕作为人机交互的主窗口, 已成为影响用户体验和终端整体性能的重要因素。因此, 市场对解决手机屏幕瑕疵的需求日益增长。为满足这一需求, 针对在手机屏幕瑕疵检测过程中存在检测精度低、小目标瑕疵漏检率高与检测速度慢的情况, 提出一种以YOLOv8n作为基准模型的PGS-YOLO算法。PGS-YOLO通过增加一个专门的微小目标检测头, 并结合SeaAttention注意力模块, 有效提升对小目标的探测能力; 将骨干网络和特征融合网络分别融入PConv与GhostNetV2轻量化模块, 在保证精度的同时降低模型的参数量, 提高瑕疵检测的速度与效率。实验结果表明, 在北京大学手机屏幕表面瑕疵数据集中, 相较于YOLOv8n, PGS-YOLO算法的mAP@0.5提升了2.5百分点, mAP@0.5∶0.95提升了2.2百分点, 在手机屏幕瑕疵检测过程中不仅能对大片的瑕疵做到精准检测, 还能对小瑕疵保持一定的准确度。此外, 检测性能优于YOLOv5n、YOLOv8s等大部分YOLO系列算法。同时, 参数量仅为2.0×10⁶, 小于YOLOv8n, 满足工业场景对手机屏幕瑕疵检测的需求。

Select

开发研究与工程应用

基于改进YOLOv8的轻量化车辆检测网络

陈梓延, 王晓龙, 何迪, 安国成

计算机工程. 2025, 51(5): 314-325. https://doi.org/10.19678/j.issn.1000-3428.0069122

摘要 (227) PDF全文 (101) HTML (13)

可视化

现有的高精度车辆检测模型参数与计算量过高, 无法在交通智能设备上良好运行, 而轻量化的车辆检测模型精度普遍较低, 不适用于实际任务。为此, 提出一种改进YOLOv8的轻量化车辆检测网络, 将主干网络替换为计算量和内存访问更小的FasterNet网络, 并且将颈部的双向特征金字塔网络替换为加权双向特征金字塔网络(BiFPN), 简化特征融合过程。同时, 引入一种融合注意力机制的动态检测头, 实现检测头和注意力的无冗余结合; 此外, 针对完全交并比(CIoU)在检测精度和收敛速度上的缺陷, 提出一种尺度不变交并比(SIoU)结合归一化高斯Wasserstein距离(NWD)的回归损失算法。最后, 为尽量减小模型对边缘设备的算力需求, 进行基于幅值的层自适应稀疏化剪枝, 进一步压缩模型大小。实验结果表明, 提出的改进模型相较于原模型YOLOv8s, 在精度上升1.5百分点的情况下, 参数量降低78.9%, 计算量下降67.4%, 模型尺寸降低77.8%, 达到了比较优秀的轻量化效果, 具有很强的实用性。

Select

空天地一体化算力网络

空天地一体化算力网络资源调度机制

王克文, 张维庭, 孙童

计算机工程. 2025, 51(5): 52-61. https://doi.org/10.19678/j.issn.1000-3428.0069471

摘要 (150) PDF全文 (147) HTML (6)

可视化

为满足卫星数据处理、车辆远程控制等快速响应和大范围覆盖的应用场景需求, 聚焦于采用分层控制和人工智能技术的方法, 设计一种空天地一体化算力网络资源调度机制。将空天地网络划分为3个域, 分别部署域控制器, 负责本地域的资源管理, 同时通过卫星和无人机的覆盖范围进行地面区域划分, 确保地面区域能够得到有效的服务保障, 以实现高效的数据传输和任务处理。为了优化空天地算力网络资源利用率, 引入多智能体强化学习算法, 对不同场景下产生的计算任务进行实时处理, 将每个域控制器视为具备任务调度和资源分配能力的智能体, 在满足时延和能耗的约束下, 通过协同学习和分布式决策实现计算任务智能调度和高效分配。实验结果表明, 该机制能够有效提高资源利用率和缩短任务响应时间。

Select

上海市计算机学会40周年庆

人工智能在高校信息化中的应用研究综述

齐凤林, 沈佳杰, 王茂异, 张凯, 王新

计算机工程. 2025, 51(4): 1-14. https://doi.org/10.19678/j.issn.1000-3428.0070222

摘要 (374) PDF全文 (813) HTML (53)

可视化

人工智能(AI)的快速发展已为众多领域赋能, 对社会带来了深远的影响, 其出色的处理效果、广泛的适用性以及强大的扩展能力, 为高校信息化服务提供了坚实的技术基础。从AI和高校信息化的发展史出发, 探讨了两者的发展历程及其关联, 在国内外高校信息化建设中, 尽管各自对AI的关注点有所不同, 但均展现了其在提升教育质量、优化管理流程等方面的巨大潜力。从聚焦高校信息化建设者的角度, 在教师教学、学生学习、学校管理、教学评估、智能考试等五大核心领域, 详尽归纳并分析了AI赋能高校信息化中的典型应用案例, 展现了其如何有效提升教育质量与管理效率, 同时指出了AI在高校信息化应用过程中可能面临的数据隐私保护、算法偏见、技术依赖风险等问题, 列举了常见的应对策略, 如加强数据安全防护、优化算法透明度与公平性、培养师生信息素养等。基于这些分析, 进一步展望了AI在高校信息化中的未来优化方向, 强调技术创新与伦理规范并重, 倡导建立跨学科合作机制, 共同推动AI技术在高校信息化领域的健康、可持续发展。

Select

人工智能与模式识别

基于深度学习的多无人机多目标跟踪

周翰祺, 方东旭, 张宁波, 孙文生

计算机工程. 2025, 51(4): 57-65. https://doi.org/10.19678/j.issn.1000-3428.0069100

摘要 (335) PDF全文 (650) HTML (61)

可视化

无人机(UAV)多目标跟踪技术在交通运营、安全监测、水域巡检等领域受到广泛关注。然而, 目前已有的多目标跟踪算法多用于单无人机多目标跟踪, 而单无人机的视角通常具有一定的局限性, 当目标被遮挡时目标发生ID切换会导致跟踪失败。为了解决该问题, 提出一种多无人机多目标跟踪(MUMTTrack)算法。采用基于检测的跟踪(TBD)范式, 利用多架无人机同时跟踪目标, 弥补单无人机视角的局限性。为了有效融合多架无人机的跟踪结果, 为MUMTTrack设计一种基于加速鲁棒特征(SURF)算法的图像匹配策略和ID分配策略。将MUMTTrack算法的性能与当前主流的单无人机多目标跟踪算法在MDMT数据集上进行实验比较。实验结果表明, MUMTTrack算法在识别F1(IDF1)值和多目标跟踪精度(MOTA)这两个多目标跟踪性能指标上均表现出明显的优势。

Select

开发研究与工程应用

远距离情形下的改进YOLOv8行人检测算法

汤静雯, 赖惠成, 王同官

计算机工程. 2025, 51(4): 303-313. https://doi.org/10.19678/j.issn.1000-3428.0068897

摘要 (279) PDF全文 (183) HTML (16)

可视化

智慧社区场景下的行人检测需要精准识别行人以应对各类情况的发生, 然而面对遮挡和远距离行人的情景, 现有检测器会出现漏检、误检以及模型过大不易部署的问题。针对以上问题, 提出基于YOLOv8的行人检测算法ME-YOLO。设计一种高效特征提取模块(EM), 使得网络更好地学习行人特征和捕捉行人特点, 在减少网络参数量的同时提高检测精度。设计一个重构的检测头模块, 重新整合后的检测层增强了网络对小目标的识别能力, 有效检测小目标行人。引入双向特征金字塔网络来设计新的颈部网络, 即双向扩张残差-特征金字塔网络(BDR-FPN), 利用扩张残差模块和附权注意力机制来扩展感受野及有所侧重地学习行人特征, 缓解网络对遮挡行人不敏感问题。实验结果表明, 在CityPersons数据集上进行训练和验证, 相比原算法YOLOv8, ME-YOLO算法的AP₅₀提高了5.6百分点, 模型参数量减少了41%, 模型大小压缩了40%, 在TinyPerson数据集上验证算法的有效性和泛化性, AP₅₀提高了4.1百分点, AP_50∶95提高了1.7百分点。该算法在大幅度减少模型参数和大小的同时, 有效提高了检测精度, 在智慧社区场景中有较好的应用价值。

Select

开发研究与工程应用

基于混合A^*和修正RS曲线融合的路径规划

张博强, 陈新明, 冯天培, 吴兰, 刘宁宁, 孙朋

计算机工程. 2025, 51(4): 373-382. https://doi.org/10.19678/j.issn.1000-3428.0068338

摘要 (295) PDF全文 (275) HTML (5)

可视化

在限定场景内, 无人转运车辆在路径规划过程中不能与周围障碍物保持安全距离, 导致发生车辆与障碍物发生剐蹭的问题, 提出基于混合A^*算法和修正RS曲线融合的路径规划。首先, 将提出的基于KD-Tree算法的距离代价函数加入到混合A^*算法的代价函数中。其次, 改变混合A^*算法的扩展策略, 根据车辆周围环境动态改变节点扩展距离, 实现节点的动态扩展, 提高算法的节点搜索效率。最后, 改进混合A^*算法的RS曲线生成机制, 使生成的RS曲线直线部分与周围障碍物边界保持平行, 从而符合厂区内道路行驶要求, 通过对局部路径进行平滑处理, 在保证路径符合车辆运动学约束的条件下满足路径曲率变化的连续性, 从而提高生成路径的质量。实验结果表明, 与传统算法相比, 提出算法的搜索时间缩短了38.06%, 最大曲率减少了25.2%, 路径到障碍物的最近距离增加了51.3%, 有效提高了混合A^*算法生成路径的质量, 并能较好地在限定场景中运行。

Select

人工智能与模式识别

基于实时动态模板更新的Transformer目标跟踪方法

孙子文, 钱立志, 袁广林, 杨传栋, 凌冲

计算机工程. 2025, 51(4): 158-168. https://doi.org/10.19678/j.issn.1000-3428.0068892

摘要 (165) PDF全文 (135) HTML (9)

可视化

基于Transformer的目标跟踪方法广泛应用在计算机视觉领域, 并取得了优异的效果。但是, 由于在实际跟踪任务中受目标变换、目标遮挡、光照变化以及目标快速运动等因素的影响, 导致目标信息发生变化, 现有方法对目标模板变化信息利用不足, 限制了跟踪性能的提高。为此, 通过附加一条动态模板更新分支反映目标最新的外观和运动状态, 提出一种基于实时动态模板更新的Transformer目标跟踪方法TransTRDT。该分支通过模板质量评分头对模板是否更新进行判断, 当判定可以进行更新时, 随后将初始模板、前一帧动态模板以及裁剪后的最新预测结果传入动态模板更新网络中更新动态模板, 通过获取更可靠的模板从而实现更准确的目标跟踪。在公共数据集上的实验结果表明, TransTRDT在GOT-10k、LaSOT以及TrackingNet上的跟踪性能优于SwinTrack和StarK等算法, 在OTB100中的跟踪成功率为71.9%, 跟踪速度为36.82帧/s, 达到目前行业的领先水平。

Select

热点与综述

安卓智能手机存储系统优化方法综述

次天钊, 杨昊, 周游, 谢长生, 吴非

计算机工程. 2025, 51(3): 1-23. https://doi.org/10.19678/j.issn.1000-3428.0068673

摘要 (351) PDF全文 (762) HTML (46)

可视化

智能手机已成为人们日常生活中不可或缺的一部分。安卓系统以其开源、生态完备等优点成为目前市场份额占比最大的移动操作系统。在安卓手机中, 存储子系统是关键的组成部分, 对用户体验有重要影响。不同于服务器场景, 安卓手机存储系统的设计需要考虑诸多独特因素, 如资源受限、成本敏感、前台应用优先等, 学术界对此已经展开大量研究。针对该方向研究现状进行总结分析, 首先将安卓手机存储系统用户体验保障面临的问题凝练为主机端写放大、内存交换、文件系统碎片化、闪存设备性能以及I/O优先级反转5类; 然后围绕如何解决这5类问题, 对现有工作进行分类介绍, 并总结常用的手机存储系统测试与分析工具; 最后对安卓手机存储系统用户体验保障技术的研究现状进行总结, 并讨论了未来潜在的研究方向。

Select

热点与综述

基于区块链的可问责可验证外包分层属性加密方案

蒋淇淇, 张亮, 彭凌祺, 阚海斌

计算机工程. 2025, 51(3): 24-33. https://doi.org/10.19678/j.issn.1000-3428.0069378

摘要 (220) PDF全文 (342) HTML (33)

可视化

大数据时代的到来与信息种类的丰富对数据的受控共享提出了更加细粒度的要求, 基于属性的分布式加密(DABE)可以支持多个参与方之间的数据细粒度访问控制。时兴的物联网数据共享场景对于数据的跨域访问、透明可信度与可控性都有着更高需求, 传统的基于属性的加密(ABE)方案的计算开销对于资源有限的小型设备造成了一定的负担。为了解决上述问题, 提出一种基于区块链的可问责可验证外包分层属性加密方案。该方案支持数据跨域流通, 通过区块链技术保障数据流通的透明度与可信性, 引入可验证凭证(VC)概念解决用户身份认证问题, 借助外包思想将复杂的加解密过程造成的负担分散给外包计算节点, 最终利用分层思想实现更加细粒度的数据访问控制。安全性分析表明, 该方案可以抵抗选择明文攻击。通过使用Docker模拟算力有限的小型设备进行实验, 结果表明该方案相较现有方案具有更低的计算开销, 在属性个数为30时各个算法的计算开销不超过2.5 s, 平均开销为1 s, 适用于资源受限的应用场景。

Select

人工智能与模式识别

YGL-SLAM: 动态场景下基于点和线的语义SLAM系统

戴康佳, 徐慧英, 朱信忠, 李悉钰, 黄晓, 陈国强, 张志雄

计算机工程. 2025, 51(3): 95-104. https://doi.org/10.19678/j.issn.1000-3428.0068950

摘要 (237) PDF全文 (263) HTML (19)

可视化

传统的视觉同步定位与建图(SLAM)系统是基于静态环境这一假设的, 然而在现实场景中往往存在动态物体, 这可能导致SLAM位姿估计和地图构建的精度下降、鲁棒性变差, 甚至出现跟踪丢失的情况。针对上述问题, 基于ORB-SLAM2提出新的语义SLAM系统(YGL-SLAM)。该系统首先使用轻量级目标检测算法YOLOv8n追踪动态对象, 获得动态对象的语义信息。然后在跟踪线程的同时提取点特征和线特征, 根据获取的语义信息利用Z-score和对极几何算法剔除动态特征, 以改进SLAM在动态场景中的表现。此外, 鉴于轻量级目标检测算法在追踪动态对象时存在连续帧的漏检测问题, 设计了基于相邻帧的检测补偿方法。在公开数据集TUM和Bonn上的测试结果表明, 相比ORB-SLAM2, YGL-SLAM系统准确率提升超过90%, 对比其他动态SLAM, YGL-SLAM也具有较高的准确度和鲁棒性。

Select

图形图像处理

基于SE-AdvGAN的图像对抗样本生成方法研究

赵宏, 宋馥荣, 李文改

计算机工程. 2025, 51(2): 300-311. https://doi.org/10.19678/j.issn.1000-3428.0068481

摘要 (307) PDF全文 (370) HTML (12)

可视化

对抗样本是评估深度神经网络(DNN)鲁棒性和揭示其潜在安全隐患的重要手段。基于生成对抗网络(GAN)的对抗样本生成方法(AdvGAN)在生成图像对抗样本方面取得显著进展, 但该方法生成的扰动稀疏性不足且幅度较大, 导致对抗样本的真实性较低。为解决这一问题, 基于AdvGAN提出一种改进的图像对抗样本生成方法(SE-AdvGAN)。SE-AdvGAN通过构造SE注意力生成器和SE残差判别器来提高扰动的稀疏性。SE注意力生成器用于提取图像关键特征, 限制扰动生成位置, SE残差判别器指导生成器避免生成无关扰动。同时, 在SE注意力生成器的损失函数中加入以l₂范数为基准的边界损失以限制扰动的幅度, 从而提高对抗样本的真实性。实验结果表明, 在白盒攻击场景下, SE-AdvGAN相较于现有方法生成的对抗样本扰动稀疏性更高、幅度更小, 并且在不同目标模型上均取得了更好的攻击效果, 说明SE-AdvGAN生成的高质量对抗样本可以更有效地评估DNN模型的鲁棒性。

Select

体系结构与软件技术

面向大规模动态图的异构图计算系统设计

张明, 郭文康, 王海峰

计算机工程. 2025, 51(3): 197-207. https://doi.org/10.19678/j.issn.1000-3428.0068477

摘要 (161) PDF全文 (210) HTML (12)

可视化

图形处理器(GPU)异构集群中处理大规模动态图时GPU计算资源未被充分利用, 并且面向GPU的图划分方法存在局限性导致出现性能瓶颈。为提高图计算系统性能, 提出一种中央处理器(CPU)/GPU分布式异构图计算系统引擎(DH-Engine), 用于提升异构处理器的计算性能。首先提出新的异构图分割算法, 该分割算法以流式图划分为核心, 通过贪心策略调整顶点位置, 进而实现计算节点之间、CPU/GPU之间的动态负载均衡。在初始图划分时基于最多邻居顶点分配图顶点, 在迭代时基于最少连接边动态调整顶点位置。其次, 设计GPU异构计算模型, 通过CPU/GPU功能并行的方式实现协同计算。CPU与GPU并行执行图算法, 提高CPU核心的利用率, 进而提升图计算效率。实验以图算法PageRank、CC(Connected Components)、SSSP(Single-Source Shortest Path)与k-core为例, 将DH-Engine与其他图计算系统展开对比。与未考虑异构计算的图引擎相比, DH-Engine能更好地平衡各节点计算负载以及计算节点内部的异构处理器之间的负载, 通过缩短局部时延来提高整体的计算速度。实验结果表明DH-Engine的CPU/GPU协同度趋于1。相较于其他图计算系统, DH-Engine异构计算的加速比达到5倍, 可以提供更好的图异构计算方案。

Select

图形图像处理

基于轻量级高分辨率网络的人体姿态估计算法

刘圣杰, 何宁, 王鑫, 于海港, 韩文静

计算机工程. 2025, 51(2): 278-288. https://doi.org/10.19678/j.issn.1000-3428.0068375

摘要 (230) PDF全文 (290) HTML (11)

可视化

人体姿态估计被广泛应用于运动健身、手势控制、无人超市、娱乐游戏等诸多领域, 但姿态估计任务仍面临着诸多挑战。针对目前主流的人体姿态估计网络参数量大、计算复杂度高的问题, 提出一种基于高分辨率网络的轻量级姿态估计网络(LitePose)。首先, 采用Ghost卷积降低特征提取网络的参数; 其次, 通过采用解耦的全连接(DFC)注意力模块, 更好地捕获远距离空间位置像素间的依赖关系, 减少由于参数量下降而导致的提取特征缺失, 提高人体关键点回归的准确率; 然后, 设计一个特征增强模块, 对骨干网络提取的特征进行进一步增强; 最后, 设计一个新的坐标解码方法, 降低热图解码过程中的误差, 提高关键点回归的准确率。在人体关键点检测数据集COCO和MPII上对LitePose进行验证, 并与当前的主流方法进行对比。实验结果表明, LitePose相比基线网络HRNet精度损失0.2%, 但参数量不及基线网络的1/3, LitePose在保证少量精度损失的同时能够大幅降低网络模型的参数量。

Select

人工智能与模式识别

AI-Curling: 一种冰壶现场分析与决策方法

孙浩淼, 李宗民, 肖倩, 孙文洁, 张雯欣

计算机工程. 2025, 51(2): 102-110. https://doi.org/10.19678/j.issn.1000-3428.0069106

摘要 (188) PDF全文 (153) HTML (6)

可视化

为满足冰壶智能训练的需求, 结合计算机视觉与深度强化学习(RL)技术, 提出一种新的现场冰壶决策方法AI-Curling。AI-Curling包含冰壶检测(SR-Yolo)以及策略生成(GSP-MCTS) 2个部分。SR-Yolo模块负责感知关键时刻冰壶状态, 提取实景冰壶的位置与种类信息。为提高大场景下的小目标检测精度, 防止不恰当下采样造成的特征损失, 引入浅层细化骨干网络(SRNet), 通过在网络初级阶段增加层级, 捕获更丰富的特征信息。此外, 在多尺度融合网络中, 引入自适应特征优化融合(AFOF)模块, 以增加各层网络有效样本, 避免小尺度目标淹没在复杂背景和噪声中。GSP-MCTS模块通过蒙特卡洛树搜索(MCTS)算法结合策略价值网络的方式, 实现冰壶比赛决策分析。该模块通过引入核函数处理动作空间连续性和执行不确定性, 并在策略价值网络中嵌入全局策略感知模块(GSP), 增强了网络空间感知能力。在实验中, SR-Yolo在常规冰壶数据集Curling上平均精度均值(mAP@0.5)为0.974, 在遮挡较多的复杂冰壶数据集Curling_hard上mAP@0.5为0.723。同时, GSP-MCTS与最新实景冰壶模型Curling MCTS对战获得62%的胜率。实验结果表明, GSP-MCTS具有更好的性能。

Select

热点与综述

一种增强前景的轻量级交通标志检测模型

袁亚剑, 毛力

计算机工程. 2025, 51(3): 54-63. https://doi.org/10.19678/j.issn.1000-3428.0069042

摘要 (170) PDF全文 (203) HTML (15)

可视化

交通标志检测在辅助驾驶中扮演着不可或缺的角色, 为安全驾驶提供了至关重要的支持。在实际交通环境中, 在黑夜或雨天产生的背景噪声会加大交通标志检测的难度。现有模型往往难以有效检出远处的小目标交通标志, 此外, 在设计交通标志检测模型时应当考虑到实际部署对模型体积的要求。为此, 在YOLOv8的基础上提出一种增强前景的轻量级交通标志目标检测模型。首先, 设计了1个轻量级的PC2f模块替换掉原本Backbone中的部分C2f模块, 该模块降低了模型的参数量和计算量, 在保留更多浅层信息的同时进一步丰富了梯度流信息, 同时实现了模型轻量化和提升检测性能; 其次, 设计了前景增强模块(FEM)并将其引入Neck位置, 该模块能够有效放大前景信息并减弱背景噪声; 最后, 增加了一层小目标检测层, 用于在高分辨率的图像上提取浅层特征, 加强模型对小目标交通标志的检测性能。实验结果表明, 优化后的模型在数据集CCTSDB 2021和GTSDB上的mAP₅₀分别达到了82.5%和95.3%, 相较于原模型分别提升了3.6和1百分点, 并且模型权重大小减小了0.22×10⁶。这些结果验证了所提模型在实际应用中的有效性。

Select

热点与综述

数字孪生在工控安全中的应用进展综述

毛竞争, 胡潇锐, 徐庚辰, 吴国栋, 孙彦斌, 田志宏

计算机工程. 2025, 51(2): 1-17. https://doi.org/10.19678/j.issn.1000-3428.0068374

摘要 (209) PDF全文 (208) HTML (10)

可视化

基于数字孪生(DT)的工业控制系统(ICS)在提升系统安全性、保障稳定运行及优化生产效率方面具有重要作用, 其在工控安全领域的应用主要涵盖两方面: 安全态势感知和工业网络靶场。基于DT的安全态势感知通过实时监测、异常检测、漏洞分析和威胁识别, 实现系统安全的可视化管理。基于DT的工业网络靶场作为策略验证平台, 支持工控系统的攻防模拟, 评估安全策略有效性, 强化关键设施防护, 并提供人员培训支持。首先, 分析了ICS的安全现状, 并阐述了DT技术在ICS安全态势中的应用进展及其对风险评估的提升作用; 然后, 介绍了基于DT的工控网络靶场在工控安全中的优化作用; 最后, 通过智能电网典型案例验证了DT技术在工控安全中的重要作用, 并进一步探讨了DT技术在工控安全领域的未来发展方向。

Select

热点与综述

知识图谱嵌入研究进展综述

马恒志, 钱育蓉, 冷洪勇, 吴海鹏, 陶文彬, 张依杨

计算机工程. 2025, 51(2): 18-34. https://doi.org/10.19678/j.issn.1000-3428.0068386

摘要 (358) PDF全文 (361) HTML (22)

可视化

随着大数据和人工智能技术的不断发展, 知识图谱应用越来越广泛, 知识图谱嵌入技术也得到了飞速发展。知识图谱嵌入通过在低维矢量空间中实现结构化知识表示来提高知识表示和推理效率。对知识图谱嵌入技术进行全面概述, 包括其基本概念、模型类别、评价指标以及应用前景。首先介绍了知识图谱嵌入的基本概念及背景, 将知识图谱嵌入分为基于翻译机制的嵌入模型、基于语义匹配机制的嵌入模型、基于神经网络的嵌入模型和基于附加信息的嵌入模型4个主要类别, 并对相关模型的核心思想、评分函数、优缺点、应用场景进行细致梳理; 然后总结了知识图谱嵌入的常见数据集和评价指标, 以及链接预测和三元组分类等相关应用与实验结果, 同时介绍了问答系统、推荐系统等下游任务; 最后对知识图谱嵌入技术进行回顾总结, 概述了当前知识图谱嵌入技术存在的局限性和主要问题, 探讨了未来知识图谱嵌入领域存在的机遇和挑战以及具有潜力的研究方向, 并对研究前景进行展望。

Select

人工智能与模式识别

基于改进人工势场法的机器人局部路径规划

张国胜, 李彩虹, 张耀玉, 周瑞红, 梁振英

计算机工程. 2025, 51(1): 88-97. https://doi.org/10.19678/j.issn.1000-3428.0068738

摘要 (433) PDF全文 (1009) HTML (47)

可视化

针对人工势场(APF)法在机器人局部路径规划中存在的局部极小值陷阱和路径冗余等问题, 提出一种基于模糊控制(FC)和虚拟目标点改进人工势场的FC-V-APF算法。首先设计虚拟目标点避障策略, 并加入障碍物跨越机制和目标点更新阈值, 构建V-APF算法引导机器人摆脱陷阱区域; 其次提出基于累计转角和的控制策略, 帮助机器人走出多U型复杂陷阱; 然后针对路径冗余问题, 将V-APF算法与模糊控制算法相结合, 提出FC-V-APF算法, 通过激光雷达传感器的实时数据和权重函数对当前环境进行评估, 选取模糊控制器输出辅助力, 提前规避障碍物。最后在机器人操作系统(ROS)平台上搭建仿真环境对FC-V-APF算法进行路径规划性能的对比实验, 并对路径长度、运行时间和速度曲线等进行比较。实验结果表明, 所设计的FC-V-APF算法能够快速摆脱陷阱, 减少冗余路径, 提高路径平滑度并减少规划时间。

Select

图形图像处理

基于改进YOLOv8的交通场景实例分割算法

赵南南, 高翡晨

计算机工程. 2025, 51(1): 198-207. https://doi.org/10.19678/j.issn.1000-3428.0068677

摘要 (604) PDF全文 (645) HTML (64)

可视化

提出一种基于改进型YOLOv8的实例分割算法(DE-YOLO)。为减少图像中复杂背景的干扰, 引入高效多尺度注意力机制, 跨维交互使各特征组内空间语义特征平均分布。在主干网络部分, 使用可变形卷积DCNv2结合C2f卷积层, 突破原始卷积限制, 提升可变性。为减小有害梯度并提升检测器精度, 采用动态非单调聚焦机制Wise-交并比(WIoU)替代联合完全交并(CIoU)损失函数进行质量评估, 优化检测框定位, 提升分割精度。同时, 通过开启Mixup数据增强处理, 充实数据集, 丰富训练特征, 提升模型学习能力。实验结果表明, DE-YOLO在城市景观数据集Cityscapes中的掩模平均精度均值(mAP_mask)较基准模型YOLOv8n-seg提高了2.0百分点, IoU阈值为0.5时的平均精度提升了3.2百分点, 所提算法在提升精度的同时, 保持了优良的检测速度和较少的参数量, 模型参数量较同类模型低2.2~31.3百分点。

Select

人工智能与模式识别

基于SARIMA-SVM模型的季节性PM_2.5浓度预测

宋英华, 徐亚安, 张远进

计算机工程. 2025, 51(1): 51-59. https://doi.org/10.19678/j.issn.1000-3428.0068372

摘要 (319) PDF全文 (387) HTML (9)

可视化

空气污染是城市环境治理的主要问题之一, 而PM_2.5是影响空气质量的重要因素。针对传统时间序列预测模型对PM_2.5浓度预测缺少季节性因素分析, 预测精度不够高的问题, 提出一种基于机器学习的季节性差分自回归滑动平均-支持向量机(SARIMA-SVM)融合模型。该融合模型为串联型融合模型, 将数据拆分为线性部分与非线性部分。SARIMA模型在差分自回归滑动平均(ARIMA)模型的基础上增加了季节性因素提取参数, 能有效分析PM_2.5浓度数据的季节性规律变化趋势, 较好地预测数据未来的线性变化趋势。结合SVM模型对预测数据的残差序列进行优化, 利用滑动步长预测法确定残差序列的最优预测步长, 通过网格搜索确定最优模型参数, 实现对PM_2.5浓度数据的长期预测, 同时提高整体预测精度。通过对武汉市近5年的PM_2.5浓度监测数据进行分析, 结果表明该融合模型的预测准确率相较于单一模型有很大提升, 在相同的实验环境下比单一的ARIMA、Auto ARIMA、SARIMA模型分别提升了99%、99%、98%, 稳定性也更好, 为PM_2.5浓度预测研究提供了新的思路。

Select

开发研究与工程应用

基于改进YOLOv8算法的在线听课行为识别模型研究

李猛坤, 袁晨, 王琪, 赵冲, 陈景轩, 刘立峰

计算机工程. 2025, 51(1): 287-294. https://doi.org/10.19678/j.issn.1000-3428.0068656

摘要 (327) PDF全文 (449) HTML (21)

可视化

目前目标检测技术日趋成熟, 但是针对在线听课行为的识别仍存在挑战。针对在线课堂人为监管力度不足、目标检测模型复杂度较高所导致的在线课堂行为识别不精准、模型计算量较高等问题, 提出一种基于改进的YOLOv8在线听课行为检测与识别方法。首先在YOLOv8n的基础上添加BiFPN双向特征金字塔网络来进行特征融合, 以增加特征提取的能力, 提高模型识别准确度; 其次在Head端采用C3Ghost模块替代C2f模块, 以大幅减少模型计算量。实验结果表明, 提出的YOLOv8n-BiFPN-C3Ghost模型在线上听课行为数据集上的mAP@0.5和mAP@0.5∶0.95指标分别为98.6%和92.6%, 相比其他课堂行为识别模型在精度上最高提升了4.2%和5.7%, 计算量为6.6 GFLOPS, 比原模型降低了19.5%。YOLOv8n-BiFPN-C3Ghost模型能以更低的运算成本精确地实现在线听课行为的检测和识别, 可以实现对学生在线课堂学习情况的动态、科学识别。

Select

基于感知信息的图像处理

基于三元自注意力的视频快照压缩成像重建

周宇, 谢威, 邝得互, 江健民

计算机工程. 2025, 51(1): 20-30. https://doi.org/10.19678/j.issn.1000-3428.0069369

摘要 (219) PDF全文 (413) HTML (23)

可视化

视频快照压缩成像(SCI)是一种基于计算的成像技术, 通过在时间域和空间域上的混合压缩来实现高效成像。在视频SCI中, 利用信号的稀疏性以及它在时间域和空间域中的相关性并采用合适的视频SCI算法, 有效地重建原始视频信号。虽然基于深度学习的重建算法在多数任务中取得了良好的效果, 但是还存在过高的模型复杂度和较慢的重建速度。为解决这些问题, 提出一个基于三元自注意力的视频快照压缩成像重建网络模型SCT-SCI, 利用多分支分组自注意力机制来利用时间域和空间域的相关性。SCT-SCI模型由一个特征提取模块、一个视频重建模块和多个三元自注意力模块SCT-Block组成。每个SCT-Block由一个窗口自注意力分支、一个通道自注意力分支和一个时序自注意力分支组成, 同时引入空间聚合模块SC-2DFusion和全局聚合模块SCT-3DFusion加强特征融合。实验结果显示, 在模拟视频数据集上, 该模型具有低复杂度的优势, 在保证接近的重建质量的前提下相比EfficientSCI模型节省了31.58%的重建时间, 提升了实时性能。

Select

热点与综述

目标检测中注意力机制综述

任书玉, 汪晓丁, 林晖

计算机工程. 2024, 50(12): 16-32. https://doi.org/10.19678/j.issn.1000-3428.0068553

摘要 (708) PDF全文 (1113) HTML (72)

可视化

Transformer在自然语言处理中表现出优越的性能激励了研究人员开始探索其在计算机视觉任务中的应用。基于Transformer的目标检测模型DETR将目标检测视为一个集合预测问题, 引入Transformer模型来解决目标检测任务, 从而避免了传统方法中的提案生成和后处理步骤。最初的DETR在训练收敛和小物体检测方面存在速度慢、效率低的问题。为了解决这些问题, 研究人员进行了多方面改进, 提升了DETR的性能。对DETR的基本模块和增强模块进行深入研究, 包括对主干结构的修改、查询设计策略和注意力机制的改进, 同时对各种检测器进行比较分析, 评估它们的性能和网络架构, 探讨了DETR在计算机视觉任务中的潜力和应用前景以及目前存在的局限性和面临的挑战, 并对相关模型进行分析与总结。根据目标检测发展的现状, 分析注意力模型的优势与局限性, 并对注意力模型在目标检测领域的研究方向加以展望。

Select

热点与综述

深度学习技术在指纹识别中的应用

李硕, 赵朝阳, 屈音璇, 罗亚平

计算机工程. 2024, 50(12): 33-47. https://doi.org/10.19678/j.issn.1000-3428.0068276

摘要 (504) PDF全文 (997) HTML (55)

可视化

指纹识别是应用最早、使用最成熟的一项生物特征识别技术, 在民用领域的门禁考勤、移动支付以及刑侦领域检视嫌疑人线索等方面均有着广泛的应用。近年来, 深度学习技术给计算机视觉以及生物特征领域带来了深刻变革, 也给指纹研究人员提供了一种自动处理以及应用融合特征有效表示指纹的新方法, 在指纹识别的各个阶段均有着优异的效果。概述指纹识别的发展历史与应用背景, 阐述指纹识别图像预处理、特征提取以及指纹匹配3个阶段的主要处理流程, 分别对深度学习技术在不同阶段的应用现状进行归纳和总结, 比较不同深度神经网络在图像分割、图像增强、方向场估计、细节特征提取以及指纹匹配等具体环节的应用效果。最后, 分析当前指纹识别领域存在的一些问题与挑战, 并对构建公开指纹数据集、进行多尺度指纹特征提取以及训练端到端指纹识别模型等未来的发展方向进行展望。

Select

图形图像处理

基于改进YOLOv7的PCB缺陷检测算法

张旭, 陈慈发, 董方敏

计算机工程. 2024, 50(12): 318-328. https://doi.org/10.19678/j.issn.1000-3428.0068588

摘要 (442) PDF全文 (469) HTML (21)

可视化

在PCB缺陷检测领域中检测精度的提高一直是1个具有挑战性的任务。为了解决这个问题, 提出一系列基于PCB缺陷检测的改进方法。首先, 引入一种新的注意力机制, 即BiFormer注意力机制, 这种机制利用双层路由实现动态的稀疏注意力, 从而减少计算量; 其次, 采用一种创新的上采样算子CARAFE, 能够结合语义信息与内容信息进行上采样, 使得上采样过程更加全面且高效; 最后, 基于MPDIoU度量采用一种新的损失函数, 即LMPDIoU损失函数, 能够有效地处理不平衡类别、小目标和密集性问题, 从而进一步提高图像检测的性能。实验结果表明, 所提改进后的模型在平均精度均值(mAP)方面取得了显著提高, 达到了93.91%, 与原YOLOv5模型相比提高了13.12个百分点, 同时, 在识别精度方面, 所提改进后的模型表现也非常出色, 达到了90.55%, 与原YOLOv5模型相比提高了8.74个百分点。引入BiFormer注意力机制、CARAFE上采样算子以及LMPDIoU损失函数, 对于提高PCB缺陷检测的精度和效率具有非常积极的作用, 为工业检测领域的研究提供了有价值的参考。

Select

热点与综述

GPGPU和CUDA统一内存研究现状综述

庞文豪, 王嘉伦, 翁楚良

计算机工程. 2024, 50(12): 1-15. https://doi.org/10.19678/j.issn.1000-3428.0068694

摘要 (452) PDF全文 (610) HTML (41)

可视化

在大数据背景下, 随着科学计算、人工智能等领域的快速发展, 各领域对硬件的算力要求越来越高。图形处理器(GPU)特殊的硬件架构, 使其适合进行高并行度的计算, 并且近年来GPU与人工智能、科学计算等领域互相发展促进, 使GPU功能细化, 逐渐发展出了成熟的通用图形处理器(GPGPU), 目前GPGPU已成为中央处理器(CPU)最重要的协处理器之一。然而, GPU硬件配置在出厂后不容易更改且显存容量有限, 在处理大数据集时显存容量不足的缺点对计算性能造成较大的影响。统一计算设备架构(CUDA)6.0推出了统一内存, 使GPGPU和CPU可以共享虚拟内存空间, 以此来简化异构编程和扩展GPGPU可访问的内存空间。统一内存为GPGPU处理大数据集提供了一项可行的解决方案, 在一定程度上缓解了GPU显存容量较小的问题, 但是统一内存的使用也带来了一些性能问题, 如何在统一内存中做好内存管理成为性能提升的关键。本研究对CUDA统一内存的发展和应用进行综述, 包括CUDA统一内存的特性、发展、优势和局限性以及在人工智能、大数据处理系统等领域的应用和未来的发展前景, 为未来使用和优化CUDA统一内存的研究工作提供有价值的参考。

Select

图形图像处理

基于条件扩散模型的图像分类对抗样本防御方法

陈子民, 关志涛

计算机工程. 2024, 50(12): 296-305. https://doi.org/10.19678/j.issn.1000-3428.0068512

摘要 (306) PDF全文 (356) HTML (17)

可视化

深度学习模型在图像分类等领域取得了较好的结果, 但是深度学习模型容易受到对抗样本的干扰威胁, 攻击者通过对抗样本制作算法, 精心设计微小扰动, 构造肉眼难以分辨却能引发模型误分类的对抗样本, 给图像分类等深度学习应用带来严重的安全隐患。为提升图像分类模型的鲁棒性, 利用条件扩散模型, 提出一种综合对抗样本检测和对抗样本净化的对抗样本防御方法。在不修改目标模型的基础上, 检测并净化对抗样本, 提升目标模型鲁棒性。所提方法包括对抗样本检测和对抗样本净化2个模块。对于对抗样本检测, 采用不一致性增强, 通过训练一个融入目标模型高维特征和图片基本特征的图像修复模型, 比较初始输入和修复结果的不一致性, 检测对抗样本; 对于对抗样本净化, 采用端到端的对抗样本净化方式, 在去噪模型执行过程中加入图片伪影, 实现对抗样本净化。在保证目标模型精度的前提下, 在目标模型前增加对抗样本检测和净化模块, 根据检测结果, 选取相应的净化策略, 从而消除对抗样本, 提升目标模型的鲁棒性。在CIFAR10数据集和CIFAR100数据集上与5种现有方法进行对比实验, 实验结果表明: 对于扰动较小的对抗样本, 所提方法的检测精度较Argos方法提升了5~9个百分点; 相比于ADP方法, 所提方法在面对不同种类对抗样本时防御效果更稳定, 且在BPDA攻击下, 其对抗样本净化效果较ADP方法提升了1.3个百分点。

Select

智能态势感知与计算

基于融合模型的网络安全态势感知方法

郭尚伟, 刘树峰, 李子铭, 欧阳德强, 王宁, 向涛

计算机工程. 2024, 50(11): 1-9. https://doi.org/10.19678/j.issn.1000-3428.0069758

摘要 (389) PDF全文 (586) HTML (52)

可视化

伴随着网络技术的飞速发展, 网络安全面临的风险也日益增加, 网络攻击呈现复杂化、多样化的特征, 给现有网络攻击应对措施带来了巨大挑战。态势感知技术作为一种新兴概念, 为网络安全领域带来了新的思路。针对现有网络安全态势感知方法存在数据特征提取及较长时间序列数据处理能力不足的问题, 提出一种融合堆栈稀疏自编码器(SSAE)、卷积神经网络(CNN)、双向门控循环单元(BiGRU)和注意力机制(AM)的模型。通过SSAE和CNN提取数据特征, 利用AM强化BiGRU对关键信息的关注度, 实现对异常流量的攻击类别判定, 并结合网络安全态势量化指标, 对网络安全态势进行量化评分并划分等级。实验结果表明, 融合模型在各项指标上均优于传统深度学习模型, 能够准确感知网络态势。

Select

开发研究与工程应用

改进YOLOv8s的交通标志检测算法

谢竞, 邓月明, 王润民

计算机工程. 2024, 50(11): 338-349. https://doi.org/10.19678/j.issn.1000-3428.0068742

摘要 (398) PDF全文 (1047) HTML (28)

可视化

针对当前主流的交通标志目标检测算法在复杂环境中对小目标检测精度低、存在误检和漏检的问题, 提出一种改进的基于YOLOv8s的交通标志检测算法。该算法在主干网络中使用Pconv卷积并设计C2faster模块, 以实现轻量化网络结构同时维持网络精度。为更好地利用底层和高层特征之间的信息, 并增强区域上下文关联能力, 根据SPPF的思想设计SPPFCSPC模块作为空间金字塔池化模块。通过添加GAM注意力机制进一步增强网络的特征提取能力, 有效提高检测精度。为改善对微小目标的检测能力, 在网络颈部添加四倍下采样分支, 优化目标定位。此外, 使用Focal-EIoU损失函数替换原CIoU损失函数, 对预测框的宽高比进行准确定义, 缓解正负样本不平衡的问题。实验结果表明, 在CCTSDB-2021交通标志数据集上, 改进算法的精确率、召回率和mAP@0.5分别达到86.1%、73.0%和81.2%, 相比原始的YOLOv8s算法分别提高了0.8%、6.3%和6.9%。此外, 该算法在复杂天气和恶劣环境下的误检和漏检问题得到明显改善, 综合检测性能明显优于对比算法, 具有较大的实用价值。

Select

智能态势感知与计算

基于深度强化学习的多智能体角度跟踪方法设计

毕千, 钱程, 张可, 王成

计算机工程. 2024, 50(11): 10-17. https://doi.org/10.19678/j.issn.1000-3428.0069710

摘要 (241) PDF全文 (438) HTML (33)

可视化

在智能态势感知应用场景中, 多智能体角度跟踪问题常出现在需要对移动目标进行监测和控制的场景。与传统的目标跟踪方法不同, 角度跟踪任务不仅需要追踪目标的空间坐标, 还需确定目标间的相对角度。现有控制方法在处理这类规模较大且易受环境变化影响的问题时往往效果不稳定或性能降低。为此, 提出一种基于多智能体强化学习(MARL)的解决方案, 首先建立多智能体角度跟踪问题的基础模型, 然后设计1个多层次的仿真决策框架并提出针对此问题适应性更强的多智能体强化学习算法AR-MAPPO, 通过动态调整数据复用轮数以提升学习效率和模型稳定性。实验结果表明, 该方法在多智能体角度跟踪任务中相比传统方法和其他强化学习方法具有更高的收敛效率和更优的角度跟踪性能。

Select

人工智能与模式识别

基于Wobert与对抗学习的中文命名实体识别

倪渊, 廖世豪, 张健

计算机工程. 2024, 50(11): 119-129. https://doi.org/10.19678/j.issn.1000-3428.0068258

摘要 (216) PDF全文 (270) HTML (9)

可视化

由于自然语言处理(NLP)将中文命名实体识别(NER)任务建模为序列标注任务, 将文本中每个字符映射至一个标签, 每个字符相对独立且信息有限, 因此在NER领域词汇信息的加入能够解决字符间缺乏联系的问题。针对现有中文NER模型多需要额外构建词汇表、提取词汇信息方式繁琐、词级嵌入与字级嵌入因来源不同导致信息难以融合的问题, 提出一种基于Wobert与对抗学习的中文NER模型ALWAE-BiLSTM-CRF。与传统预训练模型相比, Wobert预训练模型在预训练阶段就已将文本分词, 充分学习了词与字两个层次的信息, 因此ALWAE-BiLSTM-CRF通过Wobert预训练模型获取字符词向量, 再使用Wobert分词器获取预训练模型中已存在的词汇向量, 接着使用BiLSTM模型获取两者的时序信息, 随后通过多头注意力机制将词汇级别的信息要素融入字符词向量, 同时通过对抗学习攻击生成对抗样本以增强模型泛化性, 最后使用条件随机场(CRF)层对结果进行约束, 获得最佳的预测序列。在Resume数据集与瓷器领域的自建数据集Porcelain上进行对比实验与消融实验, 结果表明, ALWAE-BiLSTM-CRF模型的F1值分别达到97.21%与85.7%, 证明了其在中文NER任务中的有效性。

Select

开发研究与工程应用

基于噪声鲁棒学习的胸部X射线尘肺鉴别方法

崔锦莹, 梁立河, 任雪婷, 强彦, 赵涓涓, 孔晓梅, 尉骁, 张华

计算机工程. 2024, 50(11): 350-359. https://doi.org/10.19678/j.issn.1000-3428.0068379

摘要 (175) PDF全文 (351) HTML (6)

可视化

在医学图像噪声标注数据的训练中, 目前常用的方法是根据训练损失对噪声标签数据集进行划分, 以过滤掉噪声标签样本。然而, 这种方法面临两个需要解决的问题, 即如何在筛选出噪声样本的同时尽可能地保留与其损失分布相似的困难样本, 以及如何提高样本利用率, 挖掘隐藏在噪声样本中的有用信息以减轻模型过拟合的问题。为了解决上述问题, 提出一种由样本分布引导的噪声鲁棒学习策略(SGRL), 包括样本划分与半监督对比分类。为了更可靠地区分信息量大的困难样本与有害噪声样本, 介绍一种噪声滤波器样本选择方法。此外, 提出了一种增强匹配对比网络, 使用所有样本进行训练, 从而得到一个具有噪声鲁棒性的分类模型。在此基础上, 利用对比学习作为补充, 进一步对抗对噪声标签的记忆, 提高筛查准确率。实验结果表明, 该方法在5%、10%、20%和40%噪声比的尘肺胸片数据集上均取得了显著的性能提升。与现有的先进方法相比, 该方法的筛查准确率分别平均提升了5.88、7.05、7.59和6.19个百分点, 验证了改进方法的有效性。

Select

热点与综述

基于深度学习特征的二维图像匹配算法综述

黄开基, 杨华

计算机工程. 2024, 50(10): 16-34. https://doi.org/10.19678/j.issn.1000-3428.0068580

摘要 (557) PDF全文 (2190) HTML (51)

可视化

图像匹配的目标是从两个或多个图像中找到相似结构之间的对应关系, 是计算机视觉技术的重要基础, 在机器人、遥感、自动驾驶等领域具有广泛应用。近年来随着深度学习技术的发展, 基于深度学习的二维(2D)图像匹配算法在特征提取、特征描述、特征匹配3个方面不断进行改进, 其性能在匹配精度、鲁棒性等方面远超传统算法, 取得了重大突破。首先, 总结近10年基于深度学习特征的2D图像匹配算法, 将其分为基于局部特征的双阶段图像匹配、联合特征检测和描述的图像匹配、无特征检测的图像匹配3类算法, 阐述这3类算法的发展过程、分类方法、性能评价指标并归纳其优点及局限性。然后, 介绍2D图像匹配算法的典型应用场景, 分析2D图像匹配算法的研究进展对其应用领域的影响。最后, 总结并展望2D图像匹配算法的发展趋势。

Select

热点与综述

基于视觉-语言预训练模型的零样本迁移学习方法综述

孙仁科, 许靖昊, 皇甫志宇, 李仲年, 许新征

计算机工程. 2024, 50(10): 1-15. https://doi.org/10.19678/j.issn.1000-3428.0070036

摘要 (402) PDF全文 (662) HTML (27)

可视化

近年来随着人工智能(AI)技术在计算机视觉与自然语言处理等单模态领域表现出愈发优异的性能, 多模态学习的重要性和必要性逐渐展现出来, 其中基于视觉-语言预训练模型的零样本迁移(ZST)方法得到了国内外研究者的广泛关注。得益于预训练模型强大的泛化性能, 使用视觉-语言预训练模型不仅能提高零样本识别任务的准确率, 而且能够解决部分传统方法无法解决的零样本下游任务问题。对基于视觉-语言预训练模型的ZST方法进行概述, 首先介绍了零样本学习(FSL)的传统方法, 并对其主要形式加以总结; 然后阐述了基于视觉-语言预训练模型的ZST和FSL的区别及其可以解决的新任务; 其次介绍了基于视觉-语言预训练模型的ZST方法在样本识别、目标检测、语义分割、跨模态生成等下游任务中的应用情况; 最后对现有的基于视觉-语言预训练模型的ZST方法存在的问题进行分析并对未来的研究方向进行展望。

Select

图形图像处理

基于图像自适应增强的低照度目标检测算法

王非凡, 陈希爱, 任卫红, 管宇, 韩志, 唐延东

计算机工程. 2024, 50(10): 352-361. https://doi.org/10.19678/j.issn.1000-3428.0068407

摘要 (310) PDF全文 (414) HTML (10)

可视化

在低光环境下的检测任务中, 由于低亮度、低对比度以及噪声等不利因素影响, 会存在对目标的漏检、错检等现象。针对此问题, 提出基于图像自适应增强的低照度目标检测算法。将传统图像处理方法与深度学习相结合, 设计图像自适应增强网络, 使用多个可调滤波器通过级联的方式进行结合, 对输入的低光图像进行逐步增强, 各滤波器的调节参数由卷积神经网络根据输入图像的全局信息进行预测。将图像自适应增强网络与YOLOv5目标检测网络相结合进行端到端的联合训练, 使图像增强效果更有利于目标检测。由于在低光目标检测过程中易出现漏检现象, 对通道注意力机制SE-Net进行改进, 设计特征增强网络, 并嵌入到YOLOv5网络中Neck部分的末端, 以减少网络特征融合过程中造成潜在目标特征的信息损失。实验结果表明, 所提算法在真实低光数据集ExDark上的检测精度达到了77.3%, 相较于原始YOLOv5目标检测网络提高了2.1个百分点, 检测速度达到79帧/s, 能够实现实时检测的效果。

Select

热点与综述

阿尔茨海默病的图神经网络分类方法研究进展

顾宇衡, 潘嘉诚, 钱江波, 董一鸿

计算机工程. 2024, 50(10): 35-50. https://doi.org/10.19678/j.issn.1000-3428.0068719

摘要 (235) PDF全文 (416) HTML (11)

可视化

阿尔茨海默病(AD)是一种不可逆的神经退行性疾病, 会导致认知能力的逐渐下降。AD症状的演变过程可能很长, 在不同的神经成像模式中可检测到脑区生物标志物的细微变化, 但其早期检测具有挑战性。由于神经成像数据的高度复杂性和大脑网络的不规则性, 传统的机器学习和深度神经网络模型存在许多不足, 开发基于图神经网络(GNN)的计算机辅助诊断(CAD)模型可以为分析非欧几里得空间的神经影像模式以及探究生物标志物提供极大帮助。首先, 对基于GNN分类方法的AD预测进行详细的调研和概述。然后, 从基于单模态数据和基于多模态数据两个视角进行梳理, 重点介绍和分析这些方法在单模态和多模态数据应用场景中的数据提取、脑网络建模、特征学习、信息融合等过程, 并评述部分方法的性能。最后, 针对GNN应用于AD诊断的主要挑战和未来研究方向进行了展望, 为AD辅助诊断的进一步研究提供有益的建议。

Select

人工智能与模式识别

多策略改进的蜣螂优化算法

匡鑫, 阳波, 马华, 唐文胜, 肖宏峰, 陈灵

计算机工程. 2024, 50(10): 119-136. https://doi.org/10.19678/j.issn.1000-3428.0068502

摘要 (316) PDF全文 (376) HTML (10)

可视化

针对蜣螂优化算法(DBO)搜索精度较差、全局搜索能力不足、容易陷入局部最优等问题, 提出一种多策略改进的蜣螂优化算法。选用混沌反向学习策略初始化蜣螂种群, 使得蜣螂个体在解空间内分布均匀, 提升种群多样性; 引入带非线性权重的黄金正弦策略改进滚球行为, 协调算法的全局搜索与局部挖掘能力; 借鉴麻雀搜索算法的加入者位置更新策略改进觅食行为, 促使种群向最优位置靠近, 提高算法收敛速度与收敛精度; 以分段函数形式改进偷窃行为, 利于种群在迭代前期对全局充分探索, 避免算法过早收敛; 采用非线性权重的柯西-高斯变异策略对当前最优位置进行随机扰动, 引导算法跳出局部最优位置。将所提算法与5种优化算法在23个基准函数、12个CEC2022测试函数及2个工程优化问题上进行实验对比, 结果表明, 所提算法至少在21个基准函数、10个CEC2022测试函数及2个工程优化问题上的性能指标优于其他算法, 且排名第1, 相比于原始蜣螂优化算法, 在收敛精度、收敛速度、全局搜索能力以及稳定性上都有较大提升。

Select

热点与综述

文本相似度计算方法综述

魏嵬, 丁香香, 郭梦星, 杨钊, 刘辉

计算机工程. 2024, 50(9): 18-32. https://doi.org/10.19678/j.issn.1000-3428.0068086

摘要 (873) PDF全文 (1182) HTML (74)

可视化

文本相似度计算是自然语言处理的一部分, 用来计算两个词、句子及文本之间的相似程度, 具有多种应用场景, 文本相似度计算的研究对于人工智能的发展有着重要作用。文本相似度计算起初基于字符串表面, 随着词向量的提出, 文本相似度计算可进行基于统计以及深度学习的建模与计算, 也可与预训练模型相结合。首先, 将文本相似度计算方法分为基于字符串、基于词向量、基于预训练模型、基于深度学习、其他方法5类, 并对这些方法进行简要介绍。然后, 根据不同文本相似度计算方法的原理, 具体介绍了编辑距离、汉明距离、词袋模型、向量空间模型(VSM)、深度结构语义模型(DSSM)、句子嵌入的简单对比学习(SimCSE)等常见方法。最后, 对文本相似度计算常用的数据集以及评价标准进行整理和分析, 并对文本相似度计算的未来发展进行展望。

Select

人工智能与模式识别

基于大语言模型的中文科技文献标注方法

杨冬菊, 黄俊涛

计算机工程. 2024, 50(9): 113-120. https://doi.org/10.19678/j.issn.1000-3428.0068400

摘要 (456) PDF全文 (1090) HTML (35)

可视化

高质量的标注数据是中文科技文献领域自然语言处理任务的重要基石。针对目前缺乏中文科技文献的高质量标注语料以及人工标注质量参差不齐且效率低下的问题, 提出一种基于大语言模型的中文科技文献标注方法。首先, 制定适用于多领域中文科技文献的细粒度标注规范, 明确标注实体类型以及标注粒度; 其次, 设计结构化文本标注提示模板和生成解析器, 将中文科技文献标注任务设置成单阶段单轮问答过程, 将标注规范和带标注文本填充至提示模板中相应的槽位以构建任务提示词; 然后, 将提示词注入到大语言模型中生成包含标注信息的输出文本, 经由解析器解析得到结构化的标注数据; 最后, 利用基于大语言模型的提示学习生成中文科技文献实体标注数据集ACSL, 其中包含分布在48个学科的10 000篇标注文档以及72 536个标注实体, 并在ACSL上提出基于RoBERTa-wwm-ext的3个基准模型。实验结果表明, BERT+Span模型在长跨度的中文科技文献实体识别任务中表现最佳, F1值为0.335。上述结果可作为后续研究的测试基准。

Select

体系结构与软件技术

基于UVM的SoC环境中PCIe验证平台设计

高秋辰, 胡勇华

计算机工程. 2024, 50(9): 189-196. https://doi.org/10.19678/j.issn.1000-3428.0068240

摘要 (416) PDF全文 (840) HTML (17)

可视化

系统级芯片(SoC)集成多种外设接口, 其外设接口的验证工作已经成为芯片开发最耗时的环节之一。PCIe协议为系统内部提供了高速的点对点串行互联服务, 同时还支持热插拔和热交换, 逐渐成为一种通用的总线协议。使用传统硬件描述语言(HDL)对PCIe接口设计进行验证时, 存在短时间内难以覆盖多种设计场景和边界条件, 以及验证不完备等问题。为了解决上述问题, 利用统一验证方法学(UVM)搭建1个PCIe接口的验证平台。该平台采用UVM定义的框架和测试类, 实现了顶层环境集成和测试约束的设计, 具有可重用性强和验证全面的特点。实现的内容包括SoC系统级环境集成、待测模块设计与连接、验证平台中sequencer类和monitor类的实现, 以及部分接口设计。为了确保测试用例覆盖尽可能多地设计状态和路径, 针对性地划分不同功能点, 并设计约束条件。通过多种覆盖率指标对测试用例的有效性和覆盖程度进行评估。实验结果表明, 该验证平台能缩短验证周期, 使综合覆盖率提高30%以上。

Select

热点与综述

基于Swin Transformer的双流遥感图像时空融合超分辨率重建

王志浩, 钱沄涛

计算机工程. 2024, 50(9): 33-45. https://doi.org/10.19678/j.issn.1000-3428.0068296

摘要 (372) PDF全文 (1108) HTML (33)

可视化

遥感图像时空融合超分辨重建从高时序密度的低分辨率图像和低时序密度的高分辨率图像中提取信息, 生成同时具有高时序密度的高分辨率遥感图像, 它直接关系到后续的解译、检测、跟踪等任务的实施。随着卷积神经网络(CNN)的快速发展, 研究者们提出了一系列基于CNN的时空融合方法, 然而由于卷积的局限性, 这些方法在全局信息提取方面仍然存在不足。受Swin Transformer全局能力的启发, 提出一种基于Swin Transformer的超分辨重建模型。在特征提取阶段, 引入双流结构, 将特征提取网络分为两个部分, 分别提取时间信息与空间信息, 并通过Swin Transformer的全局能力提升模型性能。在特征融合阶段, 引入结合通道注意力与空间注意力的卷积块注意力模块(CBAM), 用于增强重要特征, 提升图像重建精度。在Coleambally灌溉区(CIA)与Gwydir下游流域(LGC)数据集上将该模型与多种时空融合超分辨率重建模型进行对比实验, 结果表明该模型在各项评价指标上均取得了最优的结果, 具有更出色的性能和更强的泛化能力。

Select

图形图像处理

基于多任务学习的超分辨率辅助小目标检测

张天鹏, 韩晶, 吕学强

计算机工程. 2024, 50(9): 304-312. https://doi.org/10.19678/j.issn.1000-3428.0069039

摘要 (309) PDF全文 (432) HTML (29)

可视化

小目标通常具有低分辨率和模糊不清的特点, 并容易受到遮挡和背景的影响, 导致难以实现准确且实时的小目标检测。为提升检测效果, 提出一种基于多任务学习的超分辨率辅助小目标检测算法Multi-YOLO。首先, 引入一个超分辨率辅助分支引导主干网络提取有效特征, 减少小目标信息丢失; 其次, 采用Anchor based协同监督Anchor free的双检测头训练方法来辅助提升检测准确性, 另外, 在骨干网络尾部使用CTR3模块加强目标信息与位置感知的关联性; 最后, 在推理阶段仅使用检测分支进行推理以保证推理速度。实验结果表明, Multi-YOLO相对于基准网络在VEDAI、COCO MiniTrain和SPCD数据集上均取得了一定的性能提升, 其中在VEDAI数据集上, Multi-YOLO实现了10.9%的平均精度均值(mAP)提升, 且与基准模型大小相近。同时, 与主流的单阶段目标检测网络相比, Multi-YOLO在小目标检测方面表现出色, 并在精度和速度之间取得了平衡。

Select

人工智能与模式识别

改进A^*算法融合改进动态窗口法的移动机器人路径规划

王志特, 罗丽平, 廖义奎

计算机工程. 2024, 50(8): 86-101. https://doi.org/10.19678/j.issn.1000-3428.0068483

摘要 (633) PDF全文 (2241) HTML (34)

可视化

针对机器人路径规划对于路径最短、搜索效率以及平滑度的性能要求, 提出一种改进A^*算法与改进动态窗口法(DWA)相融合的算法。针对传统A^*算法在复杂场景下输出非最优路径、寻路效率低等问题, 结合曼哈顿距离和对角线距离设计新的启发函数, 并对其动态分配权重, 实现全局路径最短, 减少寻路时间。针对传统8邻域8方向搜索方式搜索效率低、耗时长等问题, 提出一种基于8邻域改进的搜索策略, 对当前节点实时动态分配最优的搜索方向。针对路径存在多余无用节点的问题, 使用Floyd算法去除冗余节点, 减少转向次数, 缩短路径长度。针对传统动态窗口法规划的路径非全局最优、目标点附近存在障碍物时规划的路径长度增加或者规划失败的问题, 加入全局关键节点信息和引入目标点距离评估子函数。针对关键节点距离较长导致融合算法规划的路径偏离全局最优路径的问题, 提出关键点密集化策略。最后, 将提出的改进A^*算法、融合算法和已有的其他改进算法进行比较, 仿真结果表明: 改进的A^*算法能够在复杂环境中生成最短全局路径, 平均转向次数减少16.3%, 平均寻路时间缩短55.66%;融合算法在临时障碍物环境下, 平均路径长度和平均运行时间分别缩短6.1%和14.7%, 在移动障碍物环境下, 平均路径长度和平均运行时间分别缩短1.6%和39.8%。

Select

人工智能与模式识别

基于知识图谱增强的领域多模态实体识别

李华昱, 张智康, 闫阳, 岳阳

计算机工程. 2024, 50(8): 31-39. https://doi.org/10.19678/j.issn.1000-3428.0068225

摘要 (449) PDF全文 (924) HTML (40)

可视化

针对特定领域中文命名实体识别存在的局限性, 提出一种利用学科图谱和图像提高实体识别准确率的模型, 旨在利用领域图谱和图像提高计算机学科领域短文本中实体识别的准确率。使用基于BERT-BiLSTM-Attention的模型提取文本特征, 使用ResNet152提取图像特征, 并使用分词工具获得句子中的名词实体。通过BERT将名词实体与图谱节点进行特征嵌入, 利用余弦相似度查找句子中的分词在学科图谱中最相似的节点, 保留到该节点距离为1的邻居节点, 生成最佳匹配子图, 作为句子的语义补充。使用多层感知机(MLP)将文本、图像和子图3种特征映射到同一空间, 并通过独特的门控机制实现文本和图像的细粒度跨模态特征融合。最后, 通过交叉注意力机制将多模态特征与子图特征进行融合, 输入解码器进行实体标记。在Twitter2015、Twitter2017和自建计算机学科数据集上同基线模型进行实验比较, 结果显示, 所提方法在领域数据集上的精确率、召回率和F1值分别可达88.56%、87.47%和88.01%, 与最优基线模型相比, F1值提高了1.36个百分点, 表明利用领域知识图谱能有效提升实体识别效果。

Select

人工智能与模式识别

面向边缘智能的神经网络模型生成与部署研究

谭郁松, 李恬, 张钰森

计算机工程. 2024, 50(8): 1-12. https://doi.org/10.19678/j.issn.1000-3428.0068554

摘要 (343) PDF全文 (491) HTML (29)

可视化

随着移动计算、第五代移动通信技术(5G)以及物联网(IoT)技术的不断演进, 各类终端设备的数量呈现指数级增长。这种激增的终端设备连接到网络产生了巨大的数据流, 对于需要实时处理和快速响应用户任务的需求提出了新的挑战。尤其是在这些海量数据中, 半结构化和非结构化数据所占比例较大, 这使得神经网络因其独特的优势而得到了广泛应用。为了提高数据处理能力和推理精度, 神经网络模型会被设计得非常复杂, 其存储和运行均需要消耗大量的计算资源。然而, 边缘设备通常只配置有限的计算资源, 无法满足存储和运行复杂神经网络模型的需求, 需要借助云计算中心来完成这些任务。这种云协同会引发响应延时和增加网络带宽消耗, 并带来用户隐私数据泄露等潜在风险。为了解决这些问题, 提出一种面向边缘智能的神经网络模型快速生成与自动化部署(NGD)方法, 根据边缘设备的硬件配置和承载的具体计算任务需求, 生成与其匹配的神经网络模型, 并将其快速部署在目标设备上, 实现设备本地推理。在3种典型的硬件平台上的神经网络模型生成与部署实验结果表明, NGD方法能够高效地为资源受限的边缘设备生成匹配的神经网络模型, 并快速地将其部署在设备上进行推理任务。

Select

人工智能与模式识别

基于上下文知识增强型Transformer网络的抑郁检测

张亚洲, 和玉, 戎璐, 王祥凯

计算机工程. 2024, 50(8): 75-85. https://doi.org/10.19678/j.issn.1000-3428.0067936

摘要 (324) PDF全文 (463) HTML (15)

可视化

抑郁症作为一种常见的心理健康问题，严重影响人们的日常生活甚至是生命安全。鉴于目前的抑郁症检测存在主观性和人工干预等缺点，基于深度学习的自动检测方式成为热门研究方向。对于最易获取的文本模态而言，主要的挑战在于如何建模抑郁文本中的长距离依赖与序列依赖。为解决该问题，提出一种基于上下文知识的增强型Transformer网络模型RoBERTa-BiLSTM，旨在从抑郁文本序列中充分提取和利用上下文特征。结合序列模型与Transformer模型优点，建模单词间上下文交互，为抑郁类别揭示与信息表征提供参考。首先，利用RoBERTa方法将词汇嵌入到语义向量空间；其次，利用双向长短期记忆网络(BiLSTM)模型有效捕获长距离上下文语义；最后，在DAIC-WOZ和EATD-Corpus 2个大规模数据集上进行实证研究。实验结果显示，RoBERTa-BiLSTM模型的准确率分别达到0.74和0.93以上，召回率分别达到0.66和0.56以上，能够准确地检测抑郁症。

Select

图形图像处理

基于可见光与红外图像的弱光条件下目标检测

王昱婷, 刘志明, 万亚平, 朱涛

计算机工程. 2024, 50(8): 270-281. https://doi.org/10.19678/j.issn.1000-3428.0068186

摘要 (323) PDF全文 (668) HTML (23)

可视化

图像融合是将多个输入图像合并成一个单一图像的技术。可见光红外图像融合能提高目标检测的准确性, 但在低光照场景下往往效果不佳。基于此, 提出一种新的融合模型DAPR-Net。该模型具有跨层残差连接的编解码结构, 将编码器的输出与解码器的对应层的输入相连接, 加强各层卷积层间的信息传递。在编码器中设计了双注意力特征提取模块AFEM, 使得网络能够更好地区分融合图像与输入的可见光和红外图像之间的差异, 同时保留两者的关键信息。在多个公开数据集上与6种先进方法进行对比, 实验结果表明, 与基准PIAFusion模型相比, 该模型在LLVIP和MSRS数据集上的信息熵、空间频率、平均梯度、标准差、视觉保真度指标分别提高了0.849、3.252、7.634、10.38、0.293和2.105、2.23、4.099、27.938、0.343;在YOLOV5目标检测网络上, LLVIP和MSRS数据集的平均精度均值、召回率、精确率、F1值指标分别提高了8.8、1.4、1.9、1.5个百分点和7.5、1.4、8.8、1.2个百分点, 相较于其他融合方法表现出更显著的优势。

热点文章

选择文件类型/文献管理软件名称

选择包含的内容

模态框（Modal）标题

热点文章

选择文件类型/文献管理软件名称

选择包含的内容