作者投稿和查稿 主编审稿 专家审稿 编委审稿 远程编辑

热点文章

Please wait a minute...
  • 全选
    |
  • 热点与综述
    赵楷, 胡煜环, 闫俊桥, 毕雪华, 张琳琳
    计算机工程. 2025, 51(8): 1-15. https://doi.org/10.19678/j.issn.1000-3428.0069147
    摘要 (237) PDF全文 (113) HTML (10)   可视化   收藏

    区块链作为一种分布式可信数据库,在数字版权保护领域得到有效应用,引起学术界和工业界的广泛关注。传统数字版权保护技术存在侵权追踪难、版权交易复杂、合法权益保护不足等问题,严重制约数字版权保护研究的发展。区块链的防篡改、可追溯和去中心化等特性为解决数字版权侵权风险提供了可信、透明和安全的解决思路。首先介绍了区块链技术的基本原理;然后针对传统版权保护方案存在的问题,介绍了区块链结合传统版权保护技术的最新研究成果;接着评估了区块链在实际应用中的效果和潜力,强调其对版权保护体系的积极影响;最后探讨了区块链版权保护面临的挑战和未来发展趋势,以实现更加完善和可持续的区块链版权保护体系。

  • 人工智能与模式识别
    王帅, 史艳翠
    计算机工程. 2025, 51(8): 190-202. https://doi.org/10.19678/j.issn.1000-3428.0069636
    摘要 (226) PDF全文 (73) HTML (7)   可视化   收藏

    序列推荐算法通过对用户的历史行为进行动态建模, 以预测其可能感兴趣的内容。聚焦对比式自监督学习(SSL)在序列推荐中的应用, 通过设计有效的自监督信号, 增强模型在稀疏数据场景下的表征能力。首先, 针对随机数据增强易引入数据噪声的问题, 提出融合用户偏好的个性化数据增强方法, 通过用户评分引导增强过程, 同时对长、短序列使用不同的增强方法组合, 生成符合用户偏好的增强序列; 其次, 为了缓解训练中出现的数据特征学习不平衡问题, 设计一种混合增强训练法, 在训练前期, 通过随机选择增强方法生成增强序列, 提高模型的性能和泛化能力, 在训练后期, 选择与原始序列相似度较高的增强序列, 使模型全面学习用户的实际偏好和行为模式; 最后, 将传统的序列预测目标与SSL目标相结合, 推断出用户的表示。在数据集Beauty、Toys和Sports上进行实验验证, 结果表明, 相较于基线模型中的最优结果, 所提方法的HR@5指标分别提升了6.61%、3.11%和3.76%, NDCG@5指标分别提升了11.40%、3.50%和2.16%, 上述实验结果验证了该方法的合理性和有效性。

  • 开发研究与工程应用
    高庆鑫, 刘聪, 张在贵, 郭娜, 苏轩, 曾庆田
    计算机工程. 2025, 51(8): 396-405. https://doi.org/10.19678/j.issn.1000-3428.0069301
    摘要 (127) PDF全文 (19) HTML (2)   可视化   收藏

    作为组织数字化转型的关键技术,机器人流程自动化(RPA)近年来得到了学术界和产业界的广泛关注。成功部署RPA的关键是确定哪些活动应该自动化。然而,现有的部署策略缺乏对流程的分析,导致RPA机器人的部署错误,造成资源的浪费。此外,已有的基于流程挖掘的RPA机器人部署方法过度依赖于专家的领域知识,缺乏通用性。针对上述问题,将流程挖掘与RPA相结合,提出一种基于流程挖掘的RPA机器人优化部署方法。首先提出从事件日志中挖掘全局流程模型的方法,挖掘得到含有时间信息的时间Petri网模型;其次通过关键流程路径识别方法得到关键流程路径;最后提出RPA机器人优化部署策略,结合时间和成本约束确定RPA机器人的最佳部署结点集合。该方法已在开源流程挖掘工具平台ProM中实现,并将其与已有的4种部署方法进行时间效率提升实验比较。实验结果表明,与其他部署方法相比,该方法在不依赖于专家领域知识的前提下,流程的性能提升率为22%~41%,RPA机器人的部署正确率达到1,验证了该方法的通用性和准确性。

  • 图形图像处理
    郝宏达, 罗健旭
    计算机工程. 2025, 51(8): 270-280. https://doi.org/10.19678/j.issn.1000-3428.0069269
    摘要 (113) PDF全文 (40) HTML (1)   可视化   收藏

    深度学习逐渐被广泛应用于医学图像分割领域,基于注意力机制的分割算法是目前研究的主要方法。现有大多数基于注意力机制的2D图像分割模型在多器官分割任务中往往关注切片的整体分割效果,而忽略了切片中小目标特征信息的丢失或欠分割问题,使模型分割性能受到限制。针对这一问题,提出一种基于多尺度特征融合和改进注意力机制的多器官语义分割模型DASC-Net。DASC-Net的整体框架基于编码器-解码器架构,编码器采用ResNet 50,与解码器之间设置跳跃连接。注意力机制由1个双重注意力模块(DAM)和1个小目标提取(SOC)模块的并联结构实现,从而进行多尺度区域特征融合。DASC-Net不仅可以感知到较大目标的特征信息,还可以通过注意力权重重建的方式保留小目标的特征信息,提高了模型的分割性能。在CHAOS数据集上的实验结果表明,DASC-Net在灵敏度、Jaccard相似系数、正类预测值(PPV)、Dice相似系数和平均交并比(mIoU)上分别可以达到83.72%、75.79%、87.75%、85.63%和77.60%,在Synapse数据集上的Dice相似系数和95%豪斯多夫距离(HD95)指标数值分别为82.44%和21.25 mm。DASC-Net在2个数据集上的表现均优于其他分割网络,具有可靠、准确的分割性能。

  • 图形图像处理
    苗茹, 李祎, 周珂, 张俨娜, 常然然, 孟更
    计算机工程. 2025, 51(8): 292-304. https://doi.org/10.19678/j.issn.1000-3428.0068856
    摘要 (116) PDF全文 (114) HTML (3)   可视化   收藏

    针对遥感图像背景复杂、目标种类多和尺度差异大所造成的目标漏检和误检问题,提出一种改进Faster R-CNN多目标检测模型。首先,采用Swin Transformer来替代ResNet 50骨干网络,增强模型特征提取能力;其次,添加平衡特征金字塔(BFP)模块融合浅层和高层语义信息,进一步加强特征融合效果;最后,在分类和回归分支中,添加动态权重机制,促进网络在训练过程中更关注高质量候选框,提高目标定位和分类的精确度。在RSOD数据集上的实验结果表明,所提模型相较于Faster R-CNN模型每秒浮点运算次数(FLOPs)大幅度减少,并且模型的mAP@0.5 ∶0.95提高了10.7百分点,平均召回率提高10.6百分点。相较于其他主流检测模型,所提模型在降低漏检率的同时,取得了更高的精度,能显著提高复杂背景下遥感图像的检测精度。

  • 热点与综述
    张锦, 陈铸, 陈照云, 时洋, 陈冠军
    计算机工程. 2025, 51(7): 1-11. https://doi.org/10.19678/j.issn.1000-3428.0068870
    摘要 (307) PDF全文 (648) HTML (21)   可视化   收藏

    在众多科学领域的研究与开发中,模拟器都扮演着不可替代的角色。在体系结构领域尤其如此,模拟器提供了一个安全、成本低廉的虚拟环境,使研究人员能够快速开展实验分析和评测。同时,模拟器还可以加速芯片设计和验证的过程,从而节省时间和资源成本。然而,随着处理器体系结构的演化进步,尤其是专用处理器发展呈现多元化特点,为了能够对体系结构设计探索提供重要的反馈,模拟器的重要作用日益凸显。综述了体系结构模拟器目前的发展与应用现状,重点介绍了几种目前较为典型的体系结构模拟器。通过对专用于不同处理器的模拟器技术手段的分析,深入了解不同架构下模拟器的侧重点及技术难点。此外,还对体系结构模拟器未来发展的关键点进行了思考与评述,以展望其在处理器设计研究领域的前景。

  • 人工智能与模式识别
    彭菊红, 张弛, 高谦, 张光明, 谈栋华, 赵明俊
    计算机工程. 2025, 51(7): 152-160. https://doi.org/10.19678/j.issn.1000-3428.0069283
    摘要 (537) PDF全文 (364) HTML (36)   可视化   收藏

    在工业场景下钢材表面缺陷检测技术存在检测精度低、收敛速度慢等问题。为此, 提出一种改进的YOLOv8算法YOLOv8n-MDC。首先, 在骨干网络中加入多尺度交叉融合网络(MCN), 通过在特征层之间建立更紧密的连接, 促进信息的均匀传递, 减少跨层特征融合时的语义信息损失, 从而增强模型对钢材缺陷的感知能力; 其次, 在模块中引入可变形卷积, 自适应地改变卷积核的形状与位置, 从而更灵活地捕捉不规则缺陷的边缘特征, 减少信息丢失, 提升检测的准确性; 最后, 加入坐标注意力(CA)机制, 将位置信息嵌入到通道中, 解决了位置信息丢失的问题, 使模型能够更精确地感知缺陷的位置及其形态特征, 从而提升检测的精度和稳定性。在NEU-DET数据集上的实验结果表明, YOLOv8n-MDC算法的mAP@0.5达到了81.0%, 相比原基准网络提升了4.2百分点, 该算法收敛速度较快、精度较高, 更能满足实际工业生产的要求。

  • 图形图像处理
    刘春霞, 孟吉星, 潘理虎, 龚大立
    计算机工程. 2025, 51(7): 326-338. https://doi.org/10.19678/j.issn.1000-3428.0069510
    摘要 (239) PDF全文 (78) HTML (8)   可视化   收藏

    针对现有的目标检测方法在处理背景复杂、有效信息量少的遥感图像时存在的误检、漏检等问题,提出了一种多模态遥感小目标检测方法——BFMYOLO。设计了像素级的红-绿-蓝(RGB)和红外(IR)图像的融合模块, 即多模态融合模块(BFM),充分利用不同模态的互补性,实现两种模态信息的有效融合;设计了全尺度自适应更新模块(AA),解决特征融合过程中的多目标信息冲突问题,通过结合CARAFE上采样算子并进一步融入浅层特征,在加强非相邻层间融合的同时增强小目标的空间信息;设计了改进的任务解耦检测头(IDHead),将分类和回归任务分开处理,以降低不同任务的相互干扰,融合深层语义特征,进一步提升模型的检测性能。采用归一化Wasserstein距离(NWD)损失函数作为定位回归损失函数,降低位置偏差的敏感性。实验结果表明,该方法在VEDAI、NWPU VHR-10和DIOR数据集上的阈值设定为0.5时的均值平均精度(mAP@0.5)分别达到78.6%、95.5%和73.3%,优于其他先进模型, 在遥感小目标检测中表现出良好的性能。

  • 图形图像处理
    沙宇洋, 陆京涛, 杜浩凡, 翟小兵, 孟维宇, 廉旭, 罗刚, 李克峰
    计算机工程. 2025, 51(7): 314-325. https://doi.org/10.19678/j.issn.1000-3428.0068674
    摘要 (258) PDF全文 (187) HTML (9)   可视化   收藏

    图像分割是环境感知中的一项关键技术,被广泛应用于无人驾驶、虚拟现实等实际任务中。随着技术的不断发展,基于计算机视觉技术的导盲系统日趋成熟,并且在精度、稳定性等方面优于传统的解决方案。在视觉导盲系统中,道路图像的语义分割是非常重要的一部分,系统通过分析算法的输出结果可以获取目前所处的环境状态,从而指导用户躲避前方障碍物,获取最优的移动路径。视觉导盲系统的使用环境复杂,对模型的运行效率和分割精度具有极高的要求。然而,常用的高精度语义分割算法参数量大、运行速度慢,因此无法直接应用于导盲系统。针对这一问题,提出了一种基于多尺度特征的轻量化道路图像分割算法。模型含有两个特征提取分支,即Detail Branch和Semantic Branch,其中Detail Branch用来提取图像的低层细节信息,Semantic Branch用来提取图像的高层语义信息,并且两个分支中的多尺度特征也会被所设计的特征映射模块处理和使用,进而提升模型对于特征的建模能力。此外,设计了一种简单且高效的特征融合模块,通过融合不同尺度的特征,增强模型对于上下文信息的编码能力。采集和标注了适用于导盲场景的大量道路分割数据,并制作成了相应的数据集。基于该数据集对所提出的算法进行训练和测试,实验结果显示: 所提出的道路分割算法的平均交并比(mIoU)为96.5%,优于现有的图像分割模型;以1 024×1 024像素的图像作为输入,所提算法的轻量化版本在NVIDIA GTX 3090Ti平台的运行速度为201帧/s,优于现有轻量化图像分割模型;将模型部署到NVIDIA AGX Xavier设备中,其在实际场景中的测试速度为53帧/s,满足实际需求。

  • 人工智能与模式识别
    宋杰, 徐慧英, 朱信忠, 黄晓, 陈晨, 王泽宇
    计算机工程. 2025, 51(7): 127-139. https://doi.org/10.19678/j.issn.1000-3428.0069257
    摘要 (219) PDF全文 (123) HTML (13)   可视化   收藏

    在室内场景下, 受角度、光线变化等因素的影响, 导致现有目标检测算法检测跌倒事件时检测精度降低、实时性变差。为此, 提出一种基于YOLOv8改进的跌倒检测算法OEF-YOLO。采用全维动态卷积(ODConv)模块改进YOLOv8中的C2f模块, 优化了核空间的4个维度以增强特征提取能力, 而且有效减少了计算负担。同时, 为了捕获更细粒度的特征, 在颈部网络中引入高效多尺度注意力(EMA)模块, 进一步聚合像素级特征, 提高网络在跌倒场景中的处理能力。在CIoU损失函数中融入Focal Loss思想, 使模型对难分类样本给予更多关注, 优化模型整体性能。实验结果表明, 相比YOLOv8n, OEF-YOLO跌倒检测算法在mAP@0.5指标上提升了1.5百分点, mAP@0.5∶0.95提升1.4百分点, 参数量和计算量分别为3.1×106和6.5 GFLOPs, 在图形处理器(GPU)上FPS提高了44, 在提高精度检测跌倒事件的同时, 兼顾了低算力场景下的部署要求。

  • 热点与综述
    庞鑫, 葛凤培, 李艳玲
    计算机工程. 2025, 51(6): 1-19. https://doi.org/10.19678/j.issn.1000-3428.0069005
    摘要 (284) PDF全文 (224) HTML (28)   可视化   收藏

    声学场景分类(ASC)旨在让计算机模拟人类听觉识别不同的声学环境,是计算机听觉领域中具有挑战性的任务之一。随着智能音频处理技术以及神经网络学习算法的快速进步,近年来ASC任务也涌现出一系列新算法和新技术。为了全面展示该领域的技术发展脉络和演进过程,梳理了该领域的早期工作和近期发展,全面介绍了ASC任务。首先描述了ASC的应用场景和面临的挑战;其次详细介绍了ASC的主流框架,重点阐述了应用于此领域的深度学习算法;然后系统性地总结了ASC的前沿探索与延伸任务以及公开数据集;最后对ASC的发展趋势进行探讨与展望。

  • 网络空间安全
    姚玉鹏, 魏立斐, 张蕾
    计算机工程. 2025, 51(6): 223-235. https://doi.org/10.19678/j.issn.1000-3428.0069133
    摘要 (340) PDF全文 (78) HTML (11)   可视化   收藏

    联邦学习实现了各参与方在不泄露原始数据的前提下联合建模,有效解决了分布式数据隐私的问题,但随着研究的深入,联邦学习还存在隐私推断攻击或恶意客户端投毒攻击等安全问题。现有联邦学习改进方案大多仅从隐私保护或抗投毒攻击方面进行改进,不能兼顾两种攻击。为了同时解决联邦学习中的推断攻击和投毒攻击,提出一个隐私保护的抗投毒攻击联邦学习(APFL)方案。设计一个模型检测算法,使用差分隐私(DP)技术,根据模型间余弦相似度赋予各客户端相应聚合权重,使用同态加密技术将本地模型加权聚合。在MNIST和CIFAR10数据集上的实验结果表明,APFL在保证数据隐私的同时能有效筛选恶意模型,抵御投毒攻击,当投毒比例不超过50%时,APFL模型性能与无投毒攻击环境下联邦平均(FedAvg)方案一致,模型测试错误率较Krum方案平均降低19%,较FLTrust方案平均降低9%。

  • 热点与综述
    秦永旺, 张洋, 胡星, 刘胜, 李少青
    计算机工程. 2025, 51(6): 29-37. https://doi.org/10.19678/j.issn.1000-3428.0068882
    摘要 (179) PDF全文 (134) HTML (17)   可视化   收藏

    随着集成电路设计复杂度的急剧攀升,其呈现出全球化和分工化的发展趋势,需要越来越多的第三方知识产权(IP)核提供者的参与。第三方IP核的广泛使用会引入硬件木马,为了检测和评估第三方IP核是否存在硬件木马以及硬件木马的功能,迫切需要探索出一种可行的IP核硬件安全评估方法,数字电路模块的功能识别作为硬件木马分析的基础研究引起了人们的广泛关注。将电路功能检测任务转换为多分类任务,结合电路结构和图数据结构的特点,提出一种基于图注意力网络(GAT)的门级电路功能分类和检测方法。首先,针对门级网表缺乏功能识别数据集的问题,通过搜集具有代表性的寄存器传输级(RTL)代码并综合生成门级网表,构建一个规模适当、种类多样的门级电路数据集。然后,为了提取和处理电路特征信息,开发了一种基于文本识别的软件工具,将复杂的电路互连结构映射为结构简单的JSON(JavaScript Object Notation)格式,便于神经网络处理。最后,采用图注意力神经网络,利用构建的门级网表数据集对多分类器进行训练,经过训练后的多分类器能够对未知门级电路进行分类和识别。实验结果表明,该多分类器通过对自建数据集中6类共计3 000多条网表数据进行学习后,最终对6类645个网表能够达到90%的分类正确率。

  • 网络空间安全
    曹蓓, 赵奎
    计算机工程. 2025, 51(6): 193-203. https://doi.org/10.19678/j.issn.1000-3428.0070158
    摘要 (160) PDF全文 (91) HTML (6)   可视化   收藏

    在信息爆炸且真伪难辨的网络环境中,精准识别虚假新闻成为一项重要的研究课题。现有研究多采用多种深度学习模型提取多元语义特征,以捕捉文本中不同层次的语义信息,但简单拼接这些特征会导致信息冗余和噪声,限制检测的准确性和泛化性,目前缺乏有效的深度融合方法。此外,现有研究往往忽视了新闻内容与其对应评论共同构建的双重情感对揭示新闻真实性的影响。针对上述问题,提出一种基于双重情感和多特征融合的虚假新闻检测(DEMF-FND)模型。首先,通过情感分析提取新闻和评论的情感特征,并利用相似度计算引入反映两者关联性的情感差异特征,构建双重情感特征集。然后,采用基于多头注意力的融合机制,将双向长短期记忆网络(BiLSTM)与设计的集成静态-动态嵌入的卷积神经网络(ISDE-CNN)所捕捉的新闻文本全局与局部语义特征进行深度融合。最终,将双重情感特征集与经深度融合得到的语义特征拼接融合,输入由全连接层构成的分类层,以判断新闻的真假。实验结果显示,该方法在Weibo20、Twitter15和Twitter16 3个真实数据集上的基准指标均优于基线方法,在准确率上分别实现了2.5、2.3和5.5百分点的提升,凸显了双重情感和深度融合语义特征在提升虚假新闻检测性能方面的重要性。

  • 热点与综述
    刘凯, 任洪逸, 李蓥, 季怡, 刘纯平
    计算机工程. 2025, 51(6): 49-56. https://doi.org/10.19678/j.issn.1000-3428.0068910
    摘要 (145) PDF全文 (94) HTML (9)   可视化   收藏

    医学视觉问答(Med-VQA)需要对医学图像内容与问题文本内容进行理解与结合,因此设计有效的模态表征及跨模态的融合方法对Med-VQA任务的表现至关重要。目前,Med-VQA方法通常只关注医学图像的全局特征以及单一模态内注意力分布,忽略了图像的局部特征所包含的医学信息与跨模态间的交互作用,从而限制了图像内容理解。针对以上问题,提出一种交叉模态注意力特征增强的Med-VQA模型(CMAG-MVQA)。基于U-Net编码有效增强图像局部特征,从交叉模态协同角度提出选择引导注意力方法,为单模态表征引入其他模态的交互信息,同时利用自注意力机制进一步增强选择引导注意力的图像表征。在VQA-RAD医学问答数据集上的消融与对比实验表明,所提方法在Med-VQA任务上有良好的表现,相比于现有同类方法,其在特征表征上性能得到较好改善。

  • 空天地一体化算力网络
    李斌, 山慧敏
    计算机工程. 2025, 51(5): 1-8. https://doi.org/10.19678/j.issn.1000-3428.0069423
    摘要 (159) PDF全文 (237) HTML (23)   可视化   收藏

    针对算力网络中终端用户计算能力不足及边缘节点算力分配不均的问题, 提出一种以激励机制为基础的无人机(UAV)协同终端直连(D2D)边缘计算方案。首先, 在满足计算资源、发射功率、计算资源单价等限制条件下, 通过联合优化任务卸载比例、计算资源限制量、UAV飞行轨迹、UAV和用户的发射功率以及计算资源出售单价, 提出一个系统收益最大化问题。其次, 利用近端策略优化(PPO)确定用户卸载和购买策略, 通过在多个时间步骤上迭代优化策略最大化累积奖励, 并引入剪切项以限制策略更新的幅度, 以确保求解算法的稳定性。仿真结果显示, 基于PPO的系统收益最大化算法相比基线算法具有更好的收敛性, 并能够有效提升系统总收益。

  • 人工智能与模式识别
    黄昆, 齐肇建, 王娟敏, 胡倩, 胡伟超, 皮建勇
    计算机工程. 2025, 51(5): 133-142. https://doi.org/10.19678/j.issn.1000-3428.0069026
    摘要 (376) PDF全文 (289) HTML (31)   可视化   收藏

    密集行人检测是公共智能监控的关键技术, 其采用目标检测方法对视频中的行人位置和数量进行检测, 进而实现对视频中人群的智能监控。在人员密集场景下因遮挡和行人的目标太小造成漏检。为此, 提出一种改进YOLOv8检测模型Crowd-YOLOv8。首先, 在主干网络使用nostride-Conv-SPD模块, 增强对图像小目标特征等细粒度信息的提取能力; 其次, 在YOLOv8网络的颈部引入小目标检测头和CARAFE上采样算子对各尺度特征进行融合, 以提高在小目标情况下的检测效果。实验结果表明, 所提模型在CrowdHuman数据集上mAP@0.5和mAP@0.5∶0.95分别取得了84.3%和58.2%的检测效果, 与原YOLOv8n相比分别提高了3.7和5.2百分点; 在WiderPerson数据集上取得了88.4%和67.4%, 与原YOLOv8n相比提高了1.1和1.5百分点。

  • 开发研究与工程应用
    周思瑜, 徐慧英, 朱信忠, 黄晓, 盛轲, 曹雨淇, 陈晨
    计算机工程. 2025, 51(5): 326-339. https://doi.org/10.19678/j.issn.1000-3428.0069259
    摘要 (266) PDF全文 (117) HTML (12)   可视化   收藏

    手机屏幕作为人机交互的主窗口, 已成为影响用户体验和终端整体性能的重要因素。因此, 市场对解决手机屏幕瑕疵的需求日益增长。为满足这一需求, 针对在手机屏幕瑕疵检测过程中存在检测精度低、小目标瑕疵漏检率高与检测速度慢的情况, 提出一种以YOLOv8n作为基准模型的PGS-YOLO算法。PGS-YOLO通过增加一个专门的微小目标检测头, 并结合SeaAttention注意力模块, 有效提升对小目标的探测能力; 将骨干网络和特征融合网络分别融入PConv与GhostNetV2轻量化模块, 在保证精度的同时降低模型的参数量, 提高瑕疵检测的速度与效率。实验结果表明, 在北京大学手机屏幕表面瑕疵数据集中, 相较于YOLOv8n, PGS-YOLO算法的mAP@0.5提升了2.5百分点, mAP@0.5∶0.95提升了2.2百分点, 在手机屏幕瑕疵检测过程中不仅能对大片的瑕疵做到精准检测, 还能对小瑕疵保持一定的准确度。此外, 检测性能优于YOLOv5n、YOLOv8s等大部分YOLO系列算法。同时, 参数量仅为2.0×106, 小于YOLOv8n, 满足工业场景对手机屏幕瑕疵检测的需求。

  • 开发研究与工程应用
    陈梓延, 王晓龙, 何迪, 安国成
    计算机工程. 2025, 51(5): 314-325. https://doi.org/10.19678/j.issn.1000-3428.0069122
    摘要 (257) PDF全文 (110) HTML (16)   可视化   收藏

    现有的高精度车辆检测模型参数与计算量过高, 无法在交通智能设备上良好运行, 而轻量化的车辆检测模型精度普遍较低, 不适用于实际任务。为此, 提出一种改进YOLOv8的轻量化车辆检测网络, 将主干网络替换为计算量和内存访问更小的FasterNet网络, 并且将颈部的双向特征金字塔网络替换为加权双向特征金字塔网络(BiFPN), 简化特征融合过程。同时, 引入一种融合注意力机制的动态检测头, 实现检测头和注意力的无冗余结合; 此外, 针对完全交并比(CIoU)在检测精度和收敛速度上的缺陷, 提出一种尺度不变交并比(SIoU)结合归一化高斯Wasserstein距离(NWD)的回归损失算法。最后, 为尽量减小模型对边缘设备的算力需求, 进行基于幅值的层自适应稀疏化剪枝, 进一步压缩模型大小。实验结果表明, 提出的改进模型相较于原模型YOLOv8s, 在精度上升1.5百分点的情况下, 参数量降低78.9%, 计算量下降67.4%, 模型尺寸降低77.8%, 达到了比较优秀的轻量化效果, 具有很强的实用性。

  • 空天地一体化算力网络
    王克文, 张维庭, 孙童
    计算机工程. 2025, 51(5): 52-61. https://doi.org/10.19678/j.issn.1000-3428.0069471
    摘要 (173) PDF全文 (155) HTML (7)   可视化   收藏

    为满足卫星数据处理、车辆远程控制等快速响应和大范围覆盖的应用场景需求, 聚焦于采用分层控制和人工智能技术的方法, 设计一种空天地一体化算力网络资源调度机制。将空天地网络划分为3个域, 分别部署域控制器, 负责本地域的资源管理, 同时通过卫星和无人机的覆盖范围进行地面区域划分, 确保地面区域能够得到有效的服务保障, 以实现高效的数据传输和任务处理。为了优化空天地算力网络资源利用率, 引入多智能体强化学习算法, 对不同场景下产生的计算任务进行实时处理, 将每个域控制器视为具备任务调度和资源分配能力的智能体, 在满足时延和能耗的约束下, 通过协同学习和分布式决策实现计算任务智能调度和高效分配。实验结果表明, 该机制能够有效提高资源利用率和缩短任务响应时间。

  • 上海市计算机学会40周年庆
    齐凤林, 沈佳杰, 王茂异, 张凯, 王新
    计算机工程. 2025, 51(4): 1-14. https://doi.org/10.19678/j.issn.1000-3428.0070222
    摘要 (554) PDF全文 (836) HTML (55)   可视化   收藏

    人工智能(AI)的快速发展已为众多领域赋能, 对社会带来了深远的影响, 其出色的处理效果、广泛的适用性以及强大的扩展能力, 为高校信息化服务提供了坚实的技术基础。从AI和高校信息化的发展史出发, 探讨了两者的发展历程及其关联, 在国内外高校信息化建设中, 尽管各自对AI的关注点有所不同, 但均展现了其在提升教育质量、优化管理流程等方面的巨大潜力。从聚焦高校信息化建设者的角度, 在教师教学、学生学习、学校管理、教学评估、智能考试等五大核心领域, 详尽归纳并分析了AI赋能高校信息化中的典型应用案例, 展现了其如何有效提升教育质量与管理效率, 同时指出了AI在高校信息化应用过程中可能面临的数据隐私保护、算法偏见、技术依赖风险等问题, 列举了常见的应对策略, 如加强数据安全防护、优化算法透明度与公平性、培养师生信息素养等。基于这些分析, 进一步展望了AI在高校信息化中的未来优化方向, 强调技术创新与伦理规范并重, 倡导建立跨学科合作机制, 共同推动AI技术在高校信息化领域的健康、可持续发展。

  • 人工智能与模式识别
    周翰祺, 方东旭, 张宁波, 孙文生
    计算机工程. 2025, 51(4): 57-65. https://doi.org/10.19678/j.issn.1000-3428.0069100
    摘要 (376) PDF全文 (665) HTML (61)   可视化   收藏

    无人机(UAV)多目标跟踪技术在交通运营、安全监测、水域巡检等领域受到广泛关注。然而, 目前已有的多目标跟踪算法多用于单无人机多目标跟踪, 而单无人机的视角通常具有一定的局限性, 当目标被遮挡时目标发生ID切换会导致跟踪失败。为了解决该问题, 提出一种多无人机多目标跟踪(MUMTTrack)算法。采用基于检测的跟踪(TBD)范式, 利用多架无人机同时跟踪目标, 弥补单无人机视角的局限性。为了有效融合多架无人机的跟踪结果, 为MUMTTrack设计一种基于加速鲁棒特征(SURF)算法的图像匹配策略和ID分配策略。将MUMTTrack算法的性能与当前主流的单无人机多目标跟踪算法在MDMT数据集上进行实验比较。实验结果表明, MUMTTrack算法在识别F1(IDF1)值和多目标跟踪精度(MOTA)这两个多目标跟踪性能指标上均表现出明显的优势。

  • 开发研究与工程应用
    汤静雯, 赖惠成, 王同官
    计算机工程. 2025, 51(4): 303-313. https://doi.org/10.19678/j.issn.1000-3428.0068897
    摘要 (300) PDF全文 (196) HTML (16)   可视化   收藏

    智慧社区场景下的行人检测需要精准识别行人以应对各类情况的发生, 然而面对遮挡和远距离行人的情景, 现有检测器会出现漏检、误检以及模型过大不易部署的问题。针对以上问题, 提出基于YOLOv8的行人检测算法ME-YOLO。设计一种高效特征提取模块(EM), 使得网络更好地学习行人特征和捕捉行人特点, 在减少网络参数量的同时提高检测精度。设计一个重构的检测头模块, 重新整合后的检测层增强了网络对小目标的识别能力, 有效检测小目标行人。引入双向特征金字塔网络来设计新的颈部网络, 即双向扩张残差-特征金字塔网络(BDR-FPN), 利用扩张残差模块和附权注意力机制来扩展感受野及有所侧重地学习行人特征, 缓解网络对遮挡行人不敏感问题。实验结果表明, 在CityPersons数据集上进行训练和验证, 相比原算法YOLOv8, ME-YOLO算法的AP50提高了5.6百分点, 模型参数量减少了41%, 模型大小压缩了40%, 在TinyPerson数据集上验证算法的有效性和泛化性, AP50提高了4.1百分点, AP50∶95提高了1.7百分点。该算法在大幅度减少模型参数和大小的同时, 有效提高了检测精度, 在智慧社区场景中有较好的应用价值。

  • 开发研究与工程应用
    张博强, 陈新明, 冯天培, 吴兰, 刘宁宁, 孙朋
    计算机工程. 2025, 51(4): 373-382. https://doi.org/10.19678/j.issn.1000-3428.0068338
    摘要 (328) PDF全文 (288) HTML (7)   可视化   收藏

    在限定场景内, 无人转运车辆在路径规划过程中不能与周围障碍物保持安全距离, 导致发生车辆与障碍物发生剐蹭的问题, 提出基于混合A*算法和修正RS曲线融合的路径规划。首先, 将提出的基于KD-Tree算法的距离代价函数加入到混合A*算法的代价函数中。其次, 改变混合A*算法的扩展策略, 根据车辆周围环境动态改变节点扩展距离, 实现节点的动态扩展, 提高算法的节点搜索效率。最后, 改进混合A*算法的RS曲线生成机制, 使生成的RS曲线直线部分与周围障碍物边界保持平行, 从而符合厂区内道路行驶要求, 通过对局部路径进行平滑处理, 在保证路径符合车辆运动学约束的条件下满足路径曲率变化的连续性, 从而提高生成路径的质量。实验结果表明, 与传统算法相比, 提出算法的搜索时间缩短了38.06%, 最大曲率减少了25.2%, 路径到障碍物的最近距离增加了51.3%, 有效提高了混合A*算法生成路径的质量, 并能较好地在限定场景中运行。

  • 人工智能与模式识别
    孙子文, 钱立志, 袁广林, 杨传栋, 凌冲
    计算机工程. 2025, 51(4): 158-168. https://doi.org/10.19678/j.issn.1000-3428.0068892
    摘要 (187) PDF全文 (143) HTML (9)   可视化   收藏

    基于Transformer的目标跟踪方法广泛应用在计算机视觉领域, 并取得了优异的效果。但是, 由于在实际跟踪任务中受目标变换、目标遮挡、光照变化以及目标快速运动等因素的影响, 导致目标信息发生变化, 现有方法对目标模板变化信息利用不足, 限制了跟踪性能的提高。为此, 通过附加一条动态模板更新分支反映目标最新的外观和运动状态, 提出一种基于实时动态模板更新的Transformer目标跟踪方法TransTRDT。该分支通过模板质量评分头对模板是否更新进行判断, 当判定可以进行更新时, 随后将初始模板、前一帧动态模板以及裁剪后的最新预测结果传入动态模板更新网络中更新动态模板, 通过获取更可靠的模板从而实现更准确的目标跟踪。在公共数据集上的实验结果表明, TransTRDT在GOT-10k、LaSOT以及TrackingNet上的跟踪性能优于SwinTrack和StarK等算法, 在OTB100中的跟踪成功率为71.9%, 跟踪速度为36.82帧/s, 达到目前行业的领先水平。

  • 热点与综述
    次天钊, 杨昊, 周游, 谢长生, 吴非
    计算机工程. 2025, 51(3): 1-23. https://doi.org/10.19678/j.issn.1000-3428.0068673
    摘要 (359) PDF全文 (766) HTML (48)   可视化   收藏

    智能手机已成为人们日常生活中不可或缺的一部分。安卓系统以其开源、生态完备等优点成为目前市场份额占比最大的移动操作系统。在安卓手机中, 存储子系统是关键的组成部分, 对用户体验有重要影响。不同于服务器场景, 安卓手机存储系统的设计需要考虑诸多独特因素, 如资源受限、成本敏感、前台应用优先等, 学术界对此已经展开大量研究。针对该方向研究现状进行总结分析, 首先将安卓手机存储系统用户体验保障面临的问题凝练为主机端写放大、内存交换、文件系统碎片化、闪存设备性能以及I/O优先级反转5类; 然后围绕如何解决这5类问题, 对现有工作进行分类介绍, 并总结常用的手机存储系统测试与分析工具; 最后对安卓手机存储系统用户体验保障技术的研究现状进行总结, 并讨论了未来潜在的研究方向。

  • 热点与综述
    蒋淇淇, 张亮, 彭凌祺, 阚海斌
    计算机工程. 2025, 51(3): 24-33. https://doi.org/10.19678/j.issn.1000-3428.0069378
    摘要 (227) PDF全文 (346) HTML (34)   可视化   收藏

    大数据时代的到来与信息种类的丰富对数据的受控共享提出了更加细粒度的要求, 基于属性的分布式加密(DABE)可以支持多个参与方之间的数据细粒度访问控制。时兴的物联网数据共享场景对于数据的跨域访问、透明可信度与可控性都有着更高需求, 传统的基于属性的加密(ABE)方案的计算开销对于资源有限的小型设备造成了一定的负担。为了解决上述问题, 提出一种基于区块链的可问责可验证外包分层属性加密方案。该方案支持数据跨域流通, 通过区块链技术保障数据流通的透明度与可信性, 引入可验证凭证(VC)概念解决用户身份认证问题, 借助外包思想将复杂的加解密过程造成的负担分散给外包计算节点, 最终利用分层思想实现更加细粒度的数据访问控制。安全性分析表明, 该方案可以抵抗选择明文攻击。通过使用Docker模拟算力有限的小型设备进行实验, 结果表明该方案相较现有方案具有更低的计算开销, 在属性个数为30时各个算法的计算开销不超过2.5 s, 平均开销为1 s, 适用于资源受限的应用场景。

  • 人工智能与模式识别
    戴康佳, 徐慧英, 朱信忠, 李悉钰, 黄晓, 陈国强, 张志雄
    计算机工程. 2025, 51(3): 95-104. https://doi.org/10.19678/j.issn.1000-3428.0068950
    摘要 (263) PDF全文 (272) HTML (23)   可视化   收藏

    传统的视觉同步定位与建图(SLAM)系统是基于静态环境这一假设的, 然而在现实场景中往往存在动态物体, 这可能导致SLAM位姿估计和地图构建的精度下降、鲁棒性变差, 甚至出现跟踪丢失的情况。针对上述问题, 基于ORB-SLAM2提出新的语义SLAM系统(YGL-SLAM)。该系统首先使用轻量级目标检测算法YOLOv8n追踪动态对象, 获得动态对象的语义信息。然后在跟踪线程的同时提取点特征和线特征, 根据获取的语义信息利用Z-score和对极几何算法剔除动态特征, 以改进SLAM在动态场景中的表现。此外, 鉴于轻量级目标检测算法在追踪动态对象时存在连续帧的漏检测问题, 设计了基于相邻帧的检测补偿方法。在公开数据集TUM和Bonn上的测试结果表明, 相比ORB-SLAM2, YGL-SLAM系统准确率提升超过90%, 对比其他动态SLAM, YGL-SLAM也具有较高的准确度和鲁棒性。

  • 图形图像处理
    赵宏, 宋馥荣, 李文改
    计算机工程. 2025, 51(2): 300-311. https://doi.org/10.19678/j.issn.1000-3428.0068481
    摘要 (325) PDF全文 (373) HTML (15)   可视化   收藏

    对抗样本是评估深度神经网络(DNN)鲁棒性和揭示其潜在安全隐患的重要手段。基于生成对抗网络(GAN)的对抗样本生成方法(AdvGAN)在生成图像对抗样本方面取得显著进展, 但该方法生成的扰动稀疏性不足且幅度较大, 导致对抗样本的真实性较低。为解决这一问题, 基于AdvGAN提出一种改进的图像对抗样本生成方法(SE-AdvGAN)。SE-AdvGAN通过构造SE注意力生成器和SE残差判别器来提高扰动的稀疏性。SE注意力生成器用于提取图像关键特征, 限制扰动生成位置, SE残差判别器指导生成器避免生成无关扰动。同时, 在SE注意力生成器的损失函数中加入以l2范数为基准的边界损失以限制扰动的幅度, 从而提高对抗样本的真实性。实验结果表明, 在白盒攻击场景下, SE-AdvGAN相较于现有方法生成的对抗样本扰动稀疏性更高、幅度更小, 并且在不同目标模型上均取得了更好的攻击效果, 说明SE-AdvGAN生成的高质量对抗样本可以更有效地评估DNN模型的鲁棒性。

  • 体系结构与软件技术
    张明, 郭文康, 王海峰
    计算机工程. 2025, 51(3): 197-207. https://doi.org/10.19678/j.issn.1000-3428.0068477
    摘要 (168) PDF全文 (212) HTML (14)   可视化   收藏

    图形处理器(GPU)异构集群中处理大规模动态图时GPU计算资源未被充分利用, 并且面向GPU的图划分方法存在局限性导致出现性能瓶颈。为提高图计算系统性能, 提出一种中央处理器(CPU)/GPU分布式异构图计算系统引擎(DH-Engine), 用于提升异构处理器的计算性能。首先提出新的异构图分割算法, 该分割算法以流式图划分为核心, 通过贪心策略调整顶点位置, 进而实现计算节点之间、CPU/GPU之间的动态负载均衡。在初始图划分时基于最多邻居顶点分配图顶点, 在迭代时基于最少连接边动态调整顶点位置。其次, 设计GPU异构计算模型, 通过CPU/GPU功能并行的方式实现协同计算。CPU与GPU并行执行图算法, 提高CPU核心的利用率, 进而提升图计算效率。实验以图算法PageRank、CC(Connected Components)、SSSP(Single-Source Shortest Path)与k-core为例, 将DH-Engine与其他图计算系统展开对比。与未考虑异构计算的图引擎相比, DH-Engine能更好地平衡各节点计算负载以及计算节点内部的异构处理器之间的负载, 通过缩短局部时延来提高整体的计算速度。实验结果表明DH-Engine的CPU/GPU协同度趋于1。相较于其他图计算系统, DH-Engine异构计算的加速比达到5倍, 可以提供更好的图异构计算方案。

  • 图形图像处理
    刘圣杰, 何宁, 王鑫, 于海港, 韩文静
    计算机工程. 2025, 51(2): 278-288. https://doi.org/10.19678/j.issn.1000-3428.0068375
    摘要 (246) PDF全文 (300) HTML (12)   可视化   收藏

    人体姿态估计被广泛应用于运动健身、手势控制、无人超市、娱乐游戏等诸多领域, 但姿态估计任务仍面临着诸多挑战。针对目前主流的人体姿态估计网络参数量大、计算复杂度高的问题, 提出一种基于高分辨率网络的轻量级姿态估计网络(LitePose)。首先, 采用Ghost卷积降低特征提取网络的参数; 其次, 通过采用解耦的全连接(DFC)注意力模块, 更好地捕获远距离空间位置像素间的依赖关系, 减少由于参数量下降而导致的提取特征缺失, 提高人体关键点回归的准确率; 然后, 设计一个特征增强模块, 对骨干网络提取的特征进行进一步增强; 最后, 设计一个新的坐标解码方法, 降低热图解码过程中的误差, 提高关键点回归的准确率。在人体关键点检测数据集COCO和MPII上对LitePose进行验证, 并与当前的主流方法进行对比。实验结果表明, LitePose相比基线网络HRNet精度损失0.2%, 但参数量不及基线网络的1/3, LitePose在保证少量精度损失的同时能够大幅降低网络模型的参数量。

  • 人工智能与模式识别
    孙浩淼, 李宗民, 肖倩, 孙文洁, 张雯欣
    计算机工程. 2025, 51(2): 102-110. https://doi.org/10.19678/j.issn.1000-3428.0069106
    摘要 (214) PDF全文 (156) HTML (6)   可视化   收藏

    为满足冰壶智能训练的需求, 结合计算机视觉与深度强化学习(RL)技术, 提出一种新的现场冰壶决策方法AI-Curling。AI-Curling包含冰壶检测(SR-Yolo)以及策略生成(GSP-MCTS) 2个部分。SR-Yolo模块负责感知关键时刻冰壶状态, 提取实景冰壶的位置与种类信息。为提高大场景下的小目标检测精度, 防止不恰当下采样造成的特征损失, 引入浅层细化骨干网络(SRNet), 通过在网络初级阶段增加层级, 捕获更丰富的特征信息。此外, 在多尺度融合网络中, 引入自适应特征优化融合(AFOF)模块, 以增加各层网络有效样本, 避免小尺度目标淹没在复杂背景和噪声中。GSP-MCTS模块通过蒙特卡洛树搜索(MCTS)算法结合策略价值网络的方式, 实现冰壶比赛决策分析。该模块通过引入核函数处理动作空间连续性和执行不确定性, 并在策略价值网络中嵌入全局策略感知模块(GSP), 增强了网络空间感知能力。在实验中, SR-Yolo在常规冰壶数据集Curling上平均精度均值(mAP@0.5)为0.974, 在遮挡较多的复杂冰壶数据集Curling_hard上mAP@0.5为0.723。同时, GSP-MCTS与最新实景冰壶模型Curling MCTS对战获得62%的胜率。实验结果表明, GSP-MCTS具有更好的性能。

  • 热点与综述
    袁亚剑, 毛力
    计算机工程. 2025, 51(3): 54-63. https://doi.org/10.19678/j.issn.1000-3428.0069042
    摘要 (179) PDF全文 (204) HTML (15)   可视化   收藏

    交通标志检测在辅助驾驶中扮演着不可或缺的角色, 为安全驾驶提供了至关重要的支持。在实际交通环境中, 在黑夜或雨天产生的背景噪声会加大交通标志检测的难度。现有模型往往难以有效检出远处的小目标交通标志, 此外, 在设计交通标志检测模型时应当考虑到实际部署对模型体积的要求。为此, 在YOLOv8的基础上提出一种增强前景的轻量级交通标志目标检测模型。首先, 设计了1个轻量级的PC2f模块替换掉原本Backbone中的部分C2f模块, 该模块降低了模型的参数量和计算量, 在保留更多浅层信息的同时进一步丰富了梯度流信息, 同时实现了模型轻量化和提升检测性能; 其次, 设计了前景增强模块(FEM)并将其引入Neck位置, 该模块能够有效放大前景信息并减弱背景噪声; 最后, 增加了一层小目标检测层, 用于在高分辨率的图像上提取浅层特征, 加强模型对小目标交通标志的检测性能。实验结果表明, 优化后的模型在数据集CCTSDB 2021和GTSDB上的mAP50分别达到了82.5%和95.3%, 相较于原模型分别提升了3.6和1百分点, 并且模型权重大小减小了0.22×106。这些结果验证了所提模型在实际应用中的有效性。

  • 热点与综述
    毛竞争, 胡潇锐, 徐庚辰, 吴国栋, 孙彦斌, 田志宏
    计算机工程. 2025, 51(2): 1-17. https://doi.org/10.19678/j.issn.1000-3428.0068374
    摘要 (235) PDF全文 (211) HTML (12)   可视化   收藏

    基于数字孪生(DT)的工业控制系统(ICS)在提升系统安全性、保障稳定运行及优化生产效率方面具有重要作用, 其在工控安全领域的应用主要涵盖两方面: 安全态势感知和工业网络靶场。基于DT的安全态势感知通过实时监测、异常检测、漏洞分析和威胁识别, 实现系统安全的可视化管理。基于DT的工业网络靶场作为策略验证平台, 支持工控系统的攻防模拟, 评估安全策略有效性, 强化关键设施防护, 并提供人员培训支持。首先, 分析了ICS的安全现状, 并阐述了DT技术在ICS安全态势中的应用进展及其对风险评估的提升作用; 然后, 介绍了基于DT的工控网络靶场在工控安全中的优化作用; 最后, 通过智能电网典型案例验证了DT技术在工控安全中的重要作用, 并进一步探讨了DT技术在工控安全领域的未来发展方向。

  • 热点与综述
    马恒志, 钱育蓉, 冷洪勇, 吴海鹏, 陶文彬, 张依杨
    计算机工程. 2025, 51(2): 18-34. https://doi.org/10.19678/j.issn.1000-3428.0068386
    摘要 (402) PDF全文 (385) HTML (25)   可视化   收藏

    随着大数据和人工智能技术的不断发展, 知识图谱应用越来越广泛, 知识图谱嵌入技术也得到了飞速发展。知识图谱嵌入通过在低维矢量空间中实现结构化知识表示来提高知识表示和推理效率。对知识图谱嵌入技术进行全面概述, 包括其基本概念、模型类别、评价指标以及应用前景。首先介绍了知识图谱嵌入的基本概念及背景, 将知识图谱嵌入分为基于翻译机制的嵌入模型、基于语义匹配机制的嵌入模型、基于神经网络的嵌入模型和基于附加信息的嵌入模型4个主要类别, 并对相关模型的核心思想、评分函数、优缺点、应用场景进行细致梳理; 然后总结了知识图谱嵌入的常见数据集和评价指标, 以及链接预测和三元组分类等相关应用与实验结果, 同时介绍了问答系统、推荐系统等下游任务; 最后对知识图谱嵌入技术进行回顾总结, 概述了当前知识图谱嵌入技术存在的局限性和主要问题, 探讨了未来知识图谱嵌入领域存在的机遇和挑战以及具有潜力的研究方向, 并对研究前景进行展望。

  • 人工智能与模式识别
    张国胜, 李彩虹, 张耀玉, 周瑞红, 梁振英
    计算机工程. 2025, 51(1): 88-97. https://doi.org/10.19678/j.issn.1000-3428.0068738
    摘要 (453) PDF全文 (1016) HTML (47)   可视化   收藏

    针对人工势场(APF)法在机器人局部路径规划中存在的局部极小值陷阱和路径冗余等问题, 提出一种基于模糊控制(FC)和虚拟目标点改进人工势场的FC-V-APF算法。首先设计虚拟目标点避障策略, 并加入障碍物跨越机制和目标点更新阈值, 构建V-APF算法引导机器人摆脱陷阱区域; 其次提出基于累计转角和的控制策略, 帮助机器人走出多U型复杂陷阱; 然后针对路径冗余问题, 将V-APF算法与模糊控制算法相结合, 提出FC-V-APF算法, 通过激光雷达传感器的实时数据和权重函数对当前环境进行评估, 选取模糊控制器输出辅助力, 提前规避障碍物。最后在机器人操作系统(ROS)平台上搭建仿真环境对FC-V-APF算法进行路径规划性能的对比实验, 并对路径长度、运行时间和速度曲线等进行比较。实验结果表明, 所设计的FC-V-APF算法能够快速摆脱陷阱, 减少冗余路径, 提高路径平滑度并减少规划时间。

  • 图形图像处理
    赵南南, 高翡晨
    计算机工程. 2025, 51(1): 198-207. https://doi.org/10.19678/j.issn.1000-3428.0068677
    摘要 (646) PDF全文 (660) HTML (68)   可视化   收藏

    提出一种基于改进型YOLOv8的实例分割算法(DE-YOLO)。为减少图像中复杂背景的干扰, 引入高效多尺度注意力机制, 跨维交互使各特征组内空间语义特征平均分布。在主干网络部分, 使用可变形卷积DCNv2结合C2f卷积层, 突破原始卷积限制, 提升可变性。为减小有害梯度并提升检测器精度, 采用动态非单调聚焦机制Wise-交并比(WIoU)替代联合完全交并(CIoU)损失函数进行质量评估, 优化检测框定位, 提升分割精度。同时, 通过开启Mixup数据增强处理, 充实数据集, 丰富训练特征, 提升模型学习能力。实验结果表明, DE-YOLO在城市景观数据集Cityscapes中的掩模平均精度均值(mAPmask)较基准模型YOLOv8n-seg提高了2.0百分点, IoU阈值为0.5时的平均精度提升了3.2百分点, 所提算法在提升精度的同时, 保持了优良的检测速度和较少的参数量, 模型参数量较同类模型低2.2~31.3百分点。

  • 人工智能与模式识别
    宋英华, 徐亚安, 张远进
    计算机工程. 2025, 51(1): 51-59. https://doi.org/10.19678/j.issn.1000-3428.0068372
    摘要 (333) PDF全文 (392) HTML (9)   可视化   收藏

    空气污染是城市环境治理的主要问题之一, 而PM2.5是影响空气质量的重要因素。针对传统时间序列预测模型对PM2.5浓度预测缺少季节性因素分析, 预测精度不够高的问题, 提出一种基于机器学习的季节性差分自回归滑动平均-支持向量机(SARIMA-SVM)融合模型。该融合模型为串联型融合模型, 将数据拆分为线性部分与非线性部分。SARIMA模型在差分自回归滑动平均(ARIMA)模型的基础上增加了季节性因素提取参数, 能有效分析PM2.5浓度数据的季节性规律变化趋势, 较好地预测数据未来的线性变化趋势。结合SVM模型对预测数据的残差序列进行优化, 利用滑动步长预测法确定残差序列的最优预测步长, 通过网格搜索确定最优模型参数, 实现对PM2.5浓度数据的长期预测, 同时提高整体预测精度。通过对武汉市近5年的PM2.5浓度监测数据进行分析, 结果表明该融合模型的预测准确率相较于单一模型有很大提升, 在相同的实验环境下比单一的ARIMA、Auto ARIMA、SARIMA模型分别提升了99%、99%、98%, 稳定性也更好, 为PM2.5浓度预测研究提供了新的思路。

  • 开发研究与工程应用
    李猛坤, 袁晨, 王琪, 赵冲, 陈景轩, 刘立峰
    计算机工程. 2025, 51(1): 287-294. https://doi.org/10.19678/j.issn.1000-3428.0068656
    摘要 (338) PDF全文 (451) HTML (21)   可视化   收藏

    目前目标检测技术日趋成熟, 但是针对在线听课行为的识别仍存在挑战。针对在线课堂人为监管力度不足、目标检测模型复杂度较高所导致的在线课堂行为识别不精准、模型计算量较高等问题, 提出一种基于改进的YOLOv8在线听课行为检测与识别方法。首先在YOLOv8n的基础上添加BiFPN双向特征金字塔网络来进行特征融合, 以增加特征提取的能力, 提高模型识别准确度; 其次在Head端采用C3Ghost模块替代C2f模块, 以大幅减少模型计算量。实验结果表明, 提出的YOLOv8n-BiFPN-C3Ghost模型在线上听课行为数据集上的mAP@0.5和mAP@0.5∶0.95指标分别为98.6%和92.6%, 相比其他课堂行为识别模型在精度上最高提升了4.2%和5.7%, 计算量为6.6 GFLOPS, 比原模型降低了19.5%。YOLOv8n-BiFPN-C3Ghost模型能以更低的运算成本精确地实现在线听课行为的检测和识别, 可以实现对学生在线课堂学习情况的动态、科学识别。

  • 基于感知信息的图像处理
    周宇, 谢威, 邝得互, 江健民
    计算机工程. 2025, 51(1): 20-30. https://doi.org/10.19678/j.issn.1000-3428.0069369
    摘要 (228) PDF全文 (416) HTML (25)   可视化   收藏

    视频快照压缩成像(SCI)是一种基于计算的成像技术, 通过在时间域和空间域上的混合压缩来实现高效成像。在视频SCI中, 利用信号的稀疏性以及它在时间域和空间域中的相关性并采用合适的视频SCI算法, 有效地重建原始视频信号。虽然基于深度学习的重建算法在多数任务中取得了良好的效果, 但是还存在过高的模型复杂度和较慢的重建速度。为解决这些问题, 提出一个基于三元自注意力的视频快照压缩成像重建网络模型SCT-SCI, 利用多分支分组自注意力机制来利用时间域和空间域的相关性。SCT-SCI模型由一个特征提取模块、一个视频重建模块和多个三元自注意力模块SCT-Block组成。每个SCT-Block由一个窗口自注意力分支、一个通道自注意力分支和一个时序自注意力分支组成, 同时引入空间聚合模块SC-2DFusion和全局聚合模块SCT-3DFusion加强特征融合。实验结果显示, 在模拟视频数据集上, 该模型具有低复杂度的优势, 在保证接近的重建质量的前提下相比EfficientSCI模型节省了31.58%的重建时间, 提升了实时性能。

  • 热点与综述
    任书玉, 汪晓丁, 林晖
    计算机工程. 2024, 50(12): 16-32. https://doi.org/10.19678/j.issn.1000-3428.0068553
    摘要 (729) PDF全文 (1125) HTML (72)   可视化   收藏

    Transformer在自然语言处理中表现出优越的性能激励了研究人员开始探索其在计算机视觉任务中的应用。基于Transformer的目标检测模型DETR将目标检测视为一个集合预测问题, 引入Transformer模型来解决目标检测任务, 从而避免了传统方法中的提案生成和后处理步骤。最初的DETR在训练收敛和小物体检测方面存在速度慢、效率低的问题。为了解决这些问题, 研究人员进行了多方面改进, 提升了DETR的性能。对DETR的基本模块和增强模块进行深入研究, 包括对主干结构的修改、查询设计策略和注意力机制的改进, 同时对各种检测器进行比较分析, 评估它们的性能和网络架构, 探讨了DETR在计算机视觉任务中的潜力和应用前景以及目前存在的局限性和面临的挑战, 并对相关模型进行分析与总结。根据目标检测发展的现状, 分析注意力模型的优势与局限性, 并对注意力模型在目标检测领域的研究方向加以展望。

  • 热点与综述
    李硕, 赵朝阳, 屈音璇, 罗亚平
    计算机工程. 2024, 50(12): 33-47. https://doi.org/10.19678/j.issn.1000-3428.0068276
    摘要 (518) PDF全文 (1007) HTML (57)   可视化   收藏

    指纹识别是应用最早、使用最成熟的一项生物特征识别技术, 在民用领域的门禁考勤、移动支付以及刑侦领域检视嫌疑人线索等方面均有着广泛的应用。近年来, 深度学习技术给计算机视觉以及生物特征领域带来了深刻变革, 也给指纹研究人员提供了一种自动处理以及应用融合特征有效表示指纹的新方法, 在指纹识别的各个阶段均有着优异的效果。概述指纹识别的发展历史与应用背景, 阐述指纹识别图像预处理、特征提取以及指纹匹配3个阶段的主要处理流程, 分别对深度学习技术在不同阶段的应用现状进行归纳和总结, 比较不同深度神经网络在图像分割、图像增强、方向场估计、细节特征提取以及指纹匹配等具体环节的应用效果。最后, 分析当前指纹识别领域存在的一些问题与挑战, 并对构建公开指纹数据集、进行多尺度指纹特征提取以及训练端到端指纹识别模型等未来的发展方向进行展望。

  • 图形图像处理
    张旭, 陈慈发, 董方敏
    计算机工程. 2024, 50(12): 318-328. https://doi.org/10.19678/j.issn.1000-3428.0068588
    摘要 (462) PDF全文 (494) HTML (22)   可视化   收藏

    在PCB缺陷检测领域中检测精度的提高一直是1个具有挑战性的任务。为了解决这个问题, 提出一系列基于PCB缺陷检测的改进方法。首先, 引入一种新的注意力机制, 即BiFormer注意力机制, 这种机制利用双层路由实现动态的稀疏注意力, 从而减少计算量; 其次, 采用一种创新的上采样算子CARAFE, 能够结合语义信息与内容信息进行上采样, 使得上采样过程更加全面且高效; 最后, 基于MPDIoU度量采用一种新的损失函数, 即LMPDIoU损失函数, 能够有效地处理不平衡类别、小目标和密集性问题, 从而进一步提高图像检测的性能。实验结果表明, 所提改进后的模型在平均精度均值(mAP)方面取得了显著提高, 达到了93.91%, 与原YOLOv5模型相比提高了13.12个百分点, 同时, 在识别精度方面, 所提改进后的模型表现也非常出色, 达到了90.55%, 与原YOLOv5模型相比提高了8.74个百分点。引入BiFormer注意力机制、CARAFE上采样算子以及LMPDIoU损失函数, 对于提高PCB缺陷检测的精度和效率具有非常积极的作用, 为工业检测领域的研究提供了有价值的参考。

  • 热点与综述
    庞文豪, 王嘉伦, 翁楚良
    计算机工程. 2024, 50(12): 1-15. https://doi.org/10.19678/j.issn.1000-3428.0068694
    摘要 (472) PDF全文 (623) HTML (41)   可视化   收藏

    在大数据背景下, 随着科学计算、人工智能等领域的快速发展, 各领域对硬件的算力要求越来越高。图形处理器(GPU)特殊的硬件架构, 使其适合进行高并行度的计算, 并且近年来GPU与人工智能、科学计算等领域互相发展促进, 使GPU功能细化, 逐渐发展出了成熟的通用图形处理器(GPGPU), 目前GPGPU已成为中央处理器(CPU)最重要的协处理器之一。然而, GPU硬件配置在出厂后不容易更改且显存容量有限, 在处理大数据集时显存容量不足的缺点对计算性能造成较大的影响。统一计算设备架构(CUDA)6.0推出了统一内存, 使GPGPU和CPU可以共享虚拟内存空间, 以此来简化异构编程和扩展GPGPU可访问的内存空间。统一内存为GPGPU处理大数据集提供了一项可行的解决方案, 在一定程度上缓解了GPU显存容量较小的问题, 但是统一内存的使用也带来了一些性能问题, 如何在统一内存中做好内存管理成为性能提升的关键。本研究对CUDA统一内存的发展和应用进行综述, 包括CUDA统一内存的特性、发展、优势和局限性以及在人工智能、大数据处理系统等领域的应用和未来的发展前景, 为未来使用和优化CUDA统一内存的研究工作提供有价值的参考。

  • 图形图像处理
    陈子民, 关志涛
    计算机工程. 2024, 50(12): 296-305. https://doi.org/10.19678/j.issn.1000-3428.0068512
    摘要 (320) PDF全文 (357) HTML (17)   可视化   收藏

    深度学习模型在图像分类等领域取得了较好的结果, 但是深度学习模型容易受到对抗样本的干扰威胁, 攻击者通过对抗样本制作算法, 精心设计微小扰动, 构造肉眼难以分辨却能引发模型误分类的对抗样本, 给图像分类等深度学习应用带来严重的安全隐患。为提升图像分类模型的鲁棒性, 利用条件扩散模型, 提出一种综合对抗样本检测和对抗样本净化的对抗样本防御方法。在不修改目标模型的基础上, 检测并净化对抗样本, 提升目标模型鲁棒性。所提方法包括对抗样本检测和对抗样本净化2个模块。对于对抗样本检测, 采用不一致性增强, 通过训练一个融入目标模型高维特征和图片基本特征的图像修复模型, 比较初始输入和修复结果的不一致性, 检测对抗样本; 对于对抗样本净化, 采用端到端的对抗样本净化方式, 在去噪模型执行过程中加入图片伪影, 实现对抗样本净化。在保证目标模型精度的前提下, 在目标模型前增加对抗样本检测和净化模块, 根据检测结果, 选取相应的净化策略, 从而消除对抗样本, 提升目标模型的鲁棒性。在CIFAR10数据集和CIFAR100数据集上与5种现有方法进行对比实验, 实验结果表明: 对于扰动较小的对抗样本, 所提方法的检测精度较Argos方法提升了5~9个百分点; 相比于ADP方法, 所提方法在面对不同种类对抗样本时防御效果更稳定, 且在BPDA攻击下, 其对抗样本净化效果较ADP方法提升了1.3个百分点。

  • 智能态势感知与计算
    郭尚伟, 刘树峰, 李子铭, 欧阳德强, 王宁, 向涛
    计算机工程. 2024, 50(11): 1-9. https://doi.org/10.19678/j.issn.1000-3428.0069758
    摘要 (405) PDF全文 (592) HTML (52)   可视化   收藏

    伴随着网络技术的飞速发展, 网络安全面临的风险也日益增加, 网络攻击呈现复杂化、多样化的特征, 给现有网络攻击应对措施带来了巨大挑战。态势感知技术作为一种新兴概念, 为网络安全领域带来了新的思路。针对现有网络安全态势感知方法存在数据特征提取及较长时间序列数据处理能力不足的问题, 提出一种融合堆栈稀疏自编码器(SSAE)、卷积神经网络(CNN)、双向门控循环单元(BiGRU)和注意力机制(AM)的模型。通过SSAE和CNN提取数据特征, 利用AM强化BiGRU对关键信息的关注度, 实现对异常流量的攻击类别判定, 并结合网络安全态势量化指标, 对网络安全态势进行量化评分并划分等级。实验结果表明, 融合模型在各项指标上均优于传统深度学习模型, 能够准确感知网络态势。

  • 开发研究与工程应用
    谢竞, 邓月明, 王润民
    计算机工程. 2024, 50(11): 338-349. https://doi.org/10.19678/j.issn.1000-3428.0068742
    摘要 (416) PDF全文 (1054) HTML (29)   可视化   收藏

    针对当前主流的交通标志目标检测算法在复杂环境中对小目标检测精度低、存在误检和漏检的问题, 提出一种改进的基于YOLOv8s的交通标志检测算法。该算法在主干网络中使用Pconv卷积并设计C2faster模块, 以实现轻量化网络结构同时维持网络精度。为更好地利用底层和高层特征之间的信息, 并增强区域上下文关联能力, 根据SPPF的思想设计SPPFCSPC模块作为空间金字塔池化模块。通过添加GAM注意力机制进一步增强网络的特征提取能力, 有效提高检测精度。为改善对微小目标的检测能力, 在网络颈部添加四倍下采样分支, 优化目标定位。此外, 使用Focal-EIoU损失函数替换原CIoU损失函数, 对预测框的宽高比进行准确定义, 缓解正负样本不平衡的问题。实验结果表明, 在CCTSDB-2021交通标志数据集上, 改进算法的精确率、召回率和mAP@0.5分别达到86.1%、73.0%和81.2%, 相比原始的YOLOv8s算法分别提高了0.8%、6.3%和6.9%。此外, 该算法在复杂天气和恶劣环境下的误检和漏检问题得到明显改善, 综合检测性能明显优于对比算法, 具有较大的实用价值。

  • 智能态势感知与计算
    毕千, 钱程, 张可, 王成
    计算机工程. 2024, 50(11): 10-17. https://doi.org/10.19678/j.issn.1000-3428.0069710
    摘要 (247) PDF全文 (440) HTML (33)   可视化   收藏

    在智能态势感知应用场景中, 多智能体角度跟踪问题常出现在需要对移动目标进行监测和控制的场景。与传统的目标跟踪方法不同, 角度跟踪任务不仅需要追踪目标的空间坐标, 还需确定目标间的相对角度。现有控制方法在处理这类规模较大且易受环境变化影响的问题时往往效果不稳定或性能降低。为此, 提出一种基于多智能体强化学习(MARL)的解决方案, 首先建立多智能体角度跟踪问题的基础模型, 然后设计1个多层次的仿真决策框架并提出针对此问题适应性更强的多智能体强化学习算法AR-MAPPO, 通过动态调整数据复用轮数以提升学习效率和模型稳定性。实验结果表明, 该方法在多智能体角度跟踪任务中相比传统方法和其他强化学习方法具有更高的收敛效率和更优的角度跟踪性能。

  • 人工智能与模式识别
    倪渊, 廖世豪, 张健
    计算机工程. 2024, 50(11): 119-129. https://doi.org/10.19678/j.issn.1000-3428.0068258
    摘要 (233) PDF全文 (275) HTML (9)   可视化   收藏

    由于自然语言处理(NLP)将中文命名实体识别(NER)任务建模为序列标注任务, 将文本中每个字符映射至一个标签, 每个字符相对独立且信息有限, 因此在NER领域词汇信息的加入能够解决字符间缺乏联系的问题。针对现有中文NER模型多需要额外构建词汇表、提取词汇信息方式繁琐、词级嵌入与字级嵌入因来源不同导致信息难以融合的问题, 提出一种基于Wobert与对抗学习的中文NER模型ALWAE-BiLSTM-CRF。与传统预训练模型相比, Wobert预训练模型在预训练阶段就已将文本分词, 充分学习了词与字两个层次的信息, 因此ALWAE-BiLSTM-CRF通过Wobert预训练模型获取字符词向量, 再使用Wobert分词器获取预训练模型中已存在的词汇向量, 接着使用BiLSTM模型获取两者的时序信息, 随后通过多头注意力机制将词汇级别的信息要素融入字符词向量, 同时通过对抗学习攻击生成对抗样本以增强模型泛化性, 最后使用条件随机场(CRF)层对结果进行约束, 获得最佳的预测序列。在Resume数据集与瓷器领域的自建数据集Porcelain上进行对比实验与消融实验, 结果表明, ALWAE-BiLSTM-CRF模型的F1值分别达到97.21%与85.7%, 证明了其在中文NER任务中的有效性。

  • 开发研究与工程应用
    崔锦莹, 梁立河, 任雪婷, 强彦, 赵涓涓, 孔晓梅, 尉骁, 张华
    计算机工程. 2024, 50(11): 350-359. https://doi.org/10.19678/j.issn.1000-3428.0068379
    摘要 (187) PDF全文 (355) HTML (6)   可视化   收藏

    在医学图像噪声标注数据的训练中, 目前常用的方法是根据训练损失对噪声标签数据集进行划分, 以过滤掉噪声标签样本。然而, 这种方法面临两个需要解决的问题, 即如何在筛选出噪声样本的同时尽可能地保留与其损失分布相似的困难样本, 以及如何提高样本利用率, 挖掘隐藏在噪声样本中的有用信息以减轻模型过拟合的问题。为了解决上述问题, 提出一种由样本分布引导的噪声鲁棒学习策略(SGRL), 包括样本划分与半监督对比分类。为了更可靠地区分信息量大的困难样本与有害噪声样本, 介绍一种噪声滤波器样本选择方法。此外, 提出了一种增强匹配对比网络, 使用所有样本进行训练, 从而得到一个具有噪声鲁棒性的分类模型。在此基础上, 利用对比学习作为补充, 进一步对抗对噪声标签的记忆, 提高筛查准确率。实验结果表明, 该方法在5%、10%、20%和40%噪声比的尘肺胸片数据集上均取得了显著的性能提升。与现有的先进方法相比, 该方法的筛查准确率分别平均提升了5.88、7.05、7.59和6.19个百分点, 验证了改进方法的有效性。