作者投稿和查稿 主编审稿 专家审稿 编委审稿 远程编辑

阅读排行

  • 一年内发表的文章
  • 两年内
  • 三年内
  • 全部
Please wait a minute...
  • 全选
    |
  • 图形图像处理
    刘洋, 陈俊, 胡诗佳, 赖佳华
    计算机工程. 2023, 49(10): 247-254. https://doi.org/10.19678/j.issn.1000-3428.0065825
    摘要 (1597) PDF全文 (1042) HTML (81)   可视化   收藏

    对于同步定位与建图(SLAM)中主流的特征点法,特征匹配是估计相机运动的关键,然而在特征匹配过程中存在图像特征的局部特性、误匹配等问题,成为视觉SLAM的瓶颈。此外,特征点法生成的稀疏地图只能用于定位,无法满足更高层次的需求。针对ORB-SLAM3中ORB特征点匹配效率低且未能生成稠密地图的问题,提出一种改进的ORB-GMS匹配策略并在ORB-SLAM3系统中加入稠密点云构建线程来实现稠密建图。将运动平滑性约束作为特征点运动统计的方法,通过比较特征点邻域内的匹配数量和阈值快速判断当前匹配是否正确,将图片网格化并快速计算网格内特征点的匹配数量,进行相机的位姿估计。根据关键帧与相应位姿构建稠密点云地图,采用外点去除滤波和体素网格滤波减小点云规模。在TUM的RGB-D数据集上的实验结果表明,与ORB-SLAM3相比,该算法可以减少约50%的匹配耗时,同时在匹配数量上平均提升60%,定位平均误差降低32%。此外,与稀疏地图相比,该方法生成易于2次加工的稠密点云地图,扩大算法的应用场景。

  • 人工智能与模式识别
    吴志强, 解庆, 李琳, 刘永坚
    计算机工程. 2024, 50(1): 91-100. https://doi.org/10.19678/j.issn.1000-3428.0066929
    摘要 (1061) PDF全文 (1161) HTML (108)   可视化   收藏

    已有的图神经网络(GNN)推荐算法大多利用用户-项目交互图的节点编号信息进行训练,学习用户-项目节点的高阶联系去丰富节点表示,但忽略了用户对不同模态信息的偏好,没有利用项目的图片、文本等模态信息,或对于不同模态特征的融合简单相加,不能区分用户对不同模态信息的偏好。针对上述问题,提出多模态融合的GNN推荐模型。首先针对单个模态,结合用户-项目交互二部图构建单模态图网络,在单模态图中学习用户对此模态信息的偏好;然后利用GAT聚合邻居信息,丰富本节点表示,同时根据门控循环单元决定是否聚合邻居信息,达到去噪效果;最后将各个模态图学习到的用户、项目表示通过注意力机制融合得到最终表示并送入预测模块。在MovieLens-20M、H&M两个数据集上的实验结果表明:多模态信息、注意力融合机制能有效提升推荐的准确度,算法模型在Precision@K、Recall@K和NDCG@K 3个指标上相较于基线最优算法均有显著提升;当评估指标K值选取10时,Precision@10、Recall@10和NDCG@10在两个数据集上分别提升了4.67%、2.42%、2.03%和2.49%、5.24%、2.05%。

  • 人工智能与模式识别
    李奇儒, 耿霞
    计算机工程. 2023, 49(12): 111-120. https://doi.org/10.19678/j.issn.1000-3428.0066348
    摘要 (860) PDF全文 (991) HTML (63)   可视化   收藏

    传统深度Q网络(DQN)算法通过融合深度神经网络和强化学习方法,解决了Q-learning算法在应对复杂环境时出现的维数灾难问题,被广泛应用于移动机器人的路径规划,但传统DQN算法的网络收敛速度较慢,路径规划效果较差,难以在较少的训练回合内获取最优路径。为了解决上述问题,提出一种改进的ERDQN算法。通过记录重复状态出现的频率,利用该频率重新计算Q值,使得在网络训练的过程中一种状态重复出现的次数越多,下一次出现该状态的概率越低,从而提高机器人对环境的探索能力,在一定程度上降低了网络收敛于局部最优的风险,减少了网络收敛的训练回合。根据机器人移动方向和机器人与目标点的距离,重新设计奖励函数。机器人在靠近目标点时能够获得正奖励,远离目标点时能够获得负奖励,并通过当前机器人的移动方向和机器人与目标点的距离调整奖励的绝对值,从而使机器人能够在避开障碍物的前提下规划出更优路径。实验结果表明,与DQN算法相比,ERDQN算法的平均得分提高了18.9%,规划出的路径长度和回合数减少了约20.1%和500。上述结果证明了ERDQN算法能够有效提高网络收敛速度及路径规划性能。

  • 图形图像处理
    祝冰艳, 陈志华, 盛斌
    计算机工程. 2024, 50(1): 216-223. https://doi.org/10.19678/j.issn.1000-3428.0066941
    摘要 (786) PDF全文 (1056) HTML (63)   可视化   收藏

    随着遥感技术的快速发展,遥感图像检测被广泛应用于农业、军事、国防安全等众多领域。遥感图像相较于传统图像检测存在诸多难点,如何实现高效精准的遥感图像检测成为该领域的研究热点。针对遥感图像检测中存在的计算复杂度高、正负样本不平衡、目标尺度小等问题,提出一种基于感知增强Swin Transformer的遥感图像检测网络,以提升遥感图像检测性能。在主干网络设计过程中,利用Swin Transformer分层设计和移动窗口的优点有效减小计算复杂度,同时插入空间局部感知块,加强网络对局部相关性和结构信息的提取能力。设计区域分布回归损失为小目标分配更大的权重,解决了正负样本不平衡的问题,同时结合改进的IoU-aware分类损失消除不同分支之间的差距,降低分类和回归损失。在公共遥感数据集DOTA上的多组实验结果表明,该网络获得了78.47%的平均精度均值和10.8帧/s的检测速度,检测性能优于经典的目标检测网络Faster R-CNN、Mask R-CNN以及现有优秀的遥感图像检测网络,并且在各类不同尺度的目标上均具有较好的性能表现。

  • 网络空间安全
    刘帅威, 李智, 王国美, 张丽
    计算机工程. 2024, 50(2): 180-187. https://doi.org/10.19678/j.issn.1000-3428.0067077
    摘要 (773) PDF全文 (755) HTML (43)   可视化   收藏

    对抗攻击与防御是计算机安全领域的一个热门研究方向。针对现有基于梯度的对抗样本生成方法可视质量差、基于优化的方法生成效率低的问题,提出基于Transformer和生成对抗网络(GAN)的对抗样本生成算法Trans-GAN。首先利用Transformer强大的视觉表征能力,将其作为重构网络,用于接收干净图像并生成攻击噪声;其次将Transformer重构网络作为生成器,与基于深度卷积网络的鉴别器相结合组成GAN网络架构,提高生成图像的真实性并保证训练的稳定性,同时提出改进的注意力机制Targeted Self-Attention,在训练网络时引入目标标签作为先验知识,指导网络模型学习生成具有特定攻击目标的对抗扰动;最后利用跳转连接将对抗噪声施加在干净样本上,形成对抗样本,攻击目标分类网络。实验结果表明:Trans-GAN算法针对MNIST数据集中2种模型的攻击成功率都达到99.9%以上,针对CIFAR10数据集中2种模型的攻击成功率分别达到96.36%和98.47%,优于目前先进的基于生成式的对抗样本生成方法;相比快速梯度符号法和投影梯度下降法,Trans-GAN算法生成的对抗噪声扰动量更小,形成的对抗样本更加自然,满足人类视觉不易分辨的要求。

  • 热点与综述
    熊世强, 何道敬, 王振东, 杜润萌
    计算机工程. 2024, 50(5): 1-15. https://doi.org/10.19678/j.issn.1000-3428.0067782
    摘要 (733) PDF全文 (581) HTML (60)   可视化   收藏
    联邦学习(FL)是一种新兴的分布式机器学习技术,只需将数据留在本地即可通过各方协作训练一个共有模型,解决了传统机器学习中数据难以采集和隐私安全的问题。随着联邦学习技术的应用和发展,相关研究发现联邦学习仍可能受到各类攻击。为了确保联邦学习的安全性,研究联邦学习中的攻击方式及相应的隐私保护技术显得尤为重要。首先介绍了联邦学习的背景知识及相关定义,总结概括了联邦学习的发展历程及分类;接着阐述了联邦学习的安全三要素,从基于安全来源和基于安全三要素2个角度分类概述了联邦学习中的安全问题及研究进展;然后对隐私保护技术进行分类,结合相关研究应用综述了联邦学习中安全多方计算(SMC)、同态加密(HE)、差分隐私(DP)、可信执行环境(TEE)4种常用隐私保护技术;最后对联邦学习的未来研究方向进行展望。
  • 开发研究与工程应用
    詹健浩, 甘利鹏, 毕永辉, 曾鹏, 李晓潮
    计算机工程. 2023, 49(10): 280-288, 297. https://doi.org/10.19678/j.issn.1000-3428.0065152
    摘要 (722) PDF全文 (1020) HTML (77)   可视化   收藏

    有效利用多模态数据的不同特征能够提高行为识别性能, 其核心问题在于多模态融合, 主要包括在数据层面、特征层面和预测分数层面融合不同模态数据的特征信息。研究在特征和预测分数2个层面通过多教师知识蒸馏的多模态融合方法, 将多模态数据的互补特征迁移到RGB网络, 以及采用不同知识蒸馏损失函数和模态组合的行为识别效果。提出一种基于知识蒸馏的多模态行为识别方法, 通过在特征上采用MSE损失函数、在预测分数上采用KL散度进行知识蒸馏, 并采用原始的骨骼模态和光流模态的教师网络的组合进行多模态融合, 使RGB学生网络同时学习到光流和骨骼教师网络的特征语义信息和预测分布信息, 从而提高识别准确率。实验结果表明, 该方法在常用的多模态数据集NTU RGB+D 60、UTD-MHAD和N-UCLA以及单模态数据集HMDB51上分别达到90.09%、95.12%、97.82%和81.26%的准确率, 在UTD-MHAD数据集上的识别准确率相比于单模态RGB数据分别提升3.49、2.54、3.21和7.34个百分点。

  • 热点与综述
    王畅, 李雷孝, 杨艳艳
    计算机工程. 2023, 49(11): 1-12. https://doi.org/10.19678/j.issn.1000-3428.0066661
    摘要 (623) PDF全文 (1153) HTML (106)   可视化   收藏

    基于计算机视觉的疲劳驾驶检测方法具有非侵入性等优点,不会对驾驶行为产生影响,在实际场景中便于应用。随着计算机技术的发展,越来越多的学者研究基于计算机视觉的疲劳驾驶检测方法。疲劳驾驶行为主要体现在面部和肢体上,在计算机视觉领域,面部行为较肢体行为更易获取,因此,基于面部特征的疲劳驾驶检测方法成为疲劳驾驶检测领域的重要研究方向。综合分析多种基于驾驶员面部多特征的疲劳驾驶检测方法,对国内外最新研究成果进行总结。介绍驾驶员面部不同特征在疲劳状态下的具体行为体现,阐述基于面部多特征的疲劳驾驶检测流程。根据面部不同特征对国内外的研究成果进行分类,并整理不同的特征提取方法和状态判别方法。通过不同特征在疲劳状态下产生的各种行为归纳不同方法判别驾驶员疲劳状态时使用的参数。同时,总结当前研究成果中使用面部多特征综合判别疲劳驾驶的方法,分析不同方法间的相同点和差异性。在此基础上,讨论当前基于面部多特征融合的疲劳驾驶检测领域存在的不足,并对该领域的未来研究方向进行展望。

  • 网络空间安全
    宋华伟, 李升起, 万方杰, 卫玉萍
    计算机工程. 2024, 50(3): 166-172. https://doi.org/10.19678/j.issn.1000-3428.0067791
    摘要 (595) PDF全文 (634) HTML (45)   可视化   收藏

    联邦学习能够在不泄露数据隐私的情况下合作训练全局模型,但这种协作式的训练方式在现实环境下面临参与方数据非独立同分布(Non-IID)的挑战:模型收敛慢、精度降低的问题。许多现有的联邦学习方法仅从全局模型聚合和本地客户端更新中的一个角度进行改进,难免会引发另一角度带来的影响,降低全局模型的质量。提出一种分层持续学习的联邦学习优化方法(FedMas)。FedMas基于分层融合的思想,首先,采用客户端分层策略,利用DBSCAN算法将相似数据分布的客户端划分到不同的层中,每次仅挑选某个层的部分客户端进行训练,避免服务器端全局模型聚合时因数据分布不同产生的权重分歧现象;进一步,由于每个层的数据分布不同,客户端在局部更新时结合持续学习灾难性遗忘的解决方案,有效地融合不同层客户端数据间的差异性,从而保证全局模型的性能。在MNIST和CIFAR-10标准数据集上的实验结果表明,FedMas与FedProx、Scaffold和FedCurv联邦学习算法相比,全局模型测试准确率平均提高0.3~2.2个百分点。

  • 热点与综述
    连哲, 殷雁君, 云飞, 智敏
    计算机工程. 2024, 50(3): 16-27. https://doi.org/10.19678/j.issn.1000-3428.0067427
    摘要 (585) PDF全文 (1245) HTML (82)   可视化   收藏

    基于深度学习的自然场景文本检测技术已成为计算机视觉和自然语言处理领域的重要研究方向,不仅具有广泛的应用前景,而且也为研究人员提供了一个探索神经网络模型和算法的新平台。首先,介绍自然场景文本检测技术的相关概念、研究背景和发展现状。接着,分析近年来基于深度学习的文本检测方法并将其分为基于检测框、基于分割、基于两者混合、其他4类,阐述4类经典和主流方法的基本思路和主要算法流程,归纳总结不同方法的使用机制、适用场景、优劣点及仿真实验结果和环境设置,明确不同方法之间的关联关系。然后,介绍自然场景文本检测的常用公共数据集和文本检测性能评估方法。最后,指出基于深度学习的自然场景文本检测技术目前所面临的主要挑战并对其未来发展方向进行展望。

  • 热点与综述
    李浩阳, 贺小伟, 王宾, 吴昊, 尤琪
    计算机工程. 2024, 50(2): 43-50. https://doi.org/10.19678/j.issn.1000-3428.0066399
    摘要 (513) PDF全文 (481) HTML (34)   可视化   收藏

    负载预测是云计算资源管理中的重要组成部分,准确预测云资源的使用情况可提高云平台性能及防止资源浪费,然而云计算资源使用的动态性和不确定性使得负载预测较为困难,尽管Informer在时序预测领域取得了较好的效果,但未对时间的因果依赖关系加以限制造成未来信息泄露,也未考虑网络深度的增加导致模型性能下降的问题。为解决上述问题,提出一种基于改进Informer的多步负载预测模型(Informer-DCR)。将编码器中各注意力块之间的正则卷积替换为扩张因果卷积,使深层网络中的高层能够接收更大范围的输入信息来提高模型预测精度,并保证时序预测过程的因果性。在编码器中添加残差连接,使网络中低层的输入信息直接传到后续的高层,解决了深层网络退化问题。实验结果表明,Informer-DCR模型在不同预测步长下的平均绝对误差比Informer、时间卷积网络等主流预测模型降低了8.4%~40.0%,并且在训练过程中表现出比Informer更好的收敛性。

  • 图形图像处理
    蒋心璐, 陈天恩, 王聪, 赵春江
    计算机工程. 2024, 50(1): 232-241. https://doi.org/10.19678/j.issn.1000-3428.0067030
    摘要 (467) PDF全文 (827) HTML (34)   可视化   收藏

    智能化害虫检测是目标检测技术在农业领域的重要应用,可以有效提高害虫测报工作效率和可靠性,保障农作物产量和质量。在诱虫灯、粘虫板等固定式诱捕装置下,图像背景简单、光照条件稳定、害虫特征显著易于提取,害虫检测可以达到较高的准确率,但其应用场景固定,检测范围局限于设备周围,无法适应复杂的田间环境。针对田间环境下图像背景复杂和害虫尺寸小带来的难检和漏检问题,提出一种改进YOLOv5的小目标害虫检测算法Pest-YOLOv5,以提高害虫测报的灵活性。在特征提取网络中增加坐标注意力机制,通过结合空间和通道信息,增强对小目标害虫特征的提取能力,在颈部连接部分使用双向特征金字塔网络结构,通过融合多尺度特征,缓解多次卷积带来的小目标信息丢失问题。在此基础上,使用SIoU和变焦损失函数计算损失值,同时通过实验得到最优分类损失权重系数,使模型更关注分类困难的目标样本。在公开数据集AgriPest上的实验结果表明,Pest-YOLOv5模型mAP0.5和召回率分别为70.4%和67.8%,优于原YOLOv5s模型、SSD和Faster R-CNN等经典目标检测模型。与YOLOv5s模型相比,Pest-YOLOv5模型将mAP0.5、mAP0.50:0.95和召回率分别提高8.1%、7.9%和12.8%,改善了难检和漏检情况。

  • 人工智能与模式识别
    王欢, 宋丽娟, 杜方
    计算机工程. 2023, 49(12): 88-95. https://doi.org/10.19678/j.issn.1000-3428.0066938
    摘要 (454) PDF全文 (296) HTML (23)   可视化   收藏

    多模态数据间交互式任务的出现对综合利用不同模态的知识提出了较高的要求,因此多模态知识图谱应运而生。在多模态知识图谱的构建过程中图像与文本实体是否指代同一对象尤为重要,这要求对中文跨模态实体进行实体对齐。针对该问题,提出一种基于多模态知识图谱的中文跨模态实体对齐方法。将图像信息引入实体对齐任务,面向领域细粒度图像和中文文本,设计单双流交互预训练语言模型(CCMEA)。基于自监督学习方法,利用视觉和文本编码器提取视觉和文本特征,并通过交叉编码器进行精细建模,最终采用对比学习方法计算图像和文本实体的匹配度。实验结果表明,在MUGE和Flickr30k-CN数据集上,CCMEA模型的平均召回率(MR)相比于WukongViT-B基线模型分别提升了3.20和11.96个百分点,并在自建的TEXTILE数据集上MR达到94.3%。上述实验结果证明了该方法可以有效对齐中文跨模态实体,并且具有较高的准确性和实用性。

  • 热点与综述
    曹健, 陈怡梅, 李海生, 蔡强
    计算机工程. 2023, 49(10): 1-12. https://doi.org/10.19678/j.issn.1000-3428.0065984
    摘要 (447) PDF全文 (777) HTML (78)   可视化   收藏

    复杂道路场景下的小目标检测能够提高车辆对于周边环境的感知能力,是计算机视觉和智慧交通领域的重要研究方向。随着深度学习技术的发展,将深度学习方法与道路小目标检测相结合能够有效提高检测精度,使车辆快速对周边环境做出反应。从经典及最新的道路小目标检测的研究成果出发,给出小目标的两种定义方式,分析造成道路小目标检测困难的原因,阐述数据增强、多尺度策略、生成超分辨率细节信息、加强上下文信息联系、改进损失函数等5类基于深度学习的提高道路小目标检测精度的优化方法,总结归纳各类方法的核心思想及目前国内外最新的研究进展。介绍常用于道路小目标检测的大型和公共数据集,提供相应的用于评估小目标检测性能的指标,对比分析各类方法在不同数据集上的性能检测结果,指出道路小目标检测研究目前仍存在的问题,并结合这些问题从多个角度对其未来研究方向进行展望。

  • 热点与综述
    魏嵬, 丁香香, 郭梦星, 杨钊, 刘辉
    计算机工程. 2024, 50(9): 18-32. https://doi.org/10.19678/j.issn.1000-3428.0068086
    摘要 (433) PDF全文 (221) HTML (1)   可视化   收藏

    文本相似度计算是自然语言处理的一部分, 用来计算两个词、句子及文本之间的相似程度, 具有多种应用场景, 文本相似度计算的研究对于人工智能的发展有着重要作用。文本相似度计算起初基于字符串表面, 随着词向量的提出, 文本相似度计算可进行基于统计以及深度学习的建模与计算, 也可与预训练模型相结合。首先, 将文本相似度计算方法分为基于字符串、基于词向量、基于预训练模型、基于深度学习、其他方法5类, 并对这些方法进行简要介绍。然后, 根据不同文本相似度计算方法的原理, 具体介绍了编辑距离、汉明距离、词袋模型、向量空间模型(VSM)、深度结构语义模型(DSSM)、句子嵌入的简单对比学习(SimCSE)等常见方法。最后, 对文本相似度计算常用的数据集以及评价标准进行整理和分析, 并对文本相似度计算的未来发展进行展望。

  • 人工智能与模式识别
    王志特, 罗丽平, 廖义奎
    计算机工程. 2024, 50(8): 86-101. https://doi.org/10.19678/j.issn.1000-3428.0068483
    摘要 (420) PDF全文 (300) HTML (11)   可视化   收藏

    针对机器人路径规划对于路径最短、搜索效率以及平滑度的性能要求, 提出一种改进A*算法与改进动态窗口法(DWA)相融合的算法。针对传统A*算法在复杂场景下输出非最优路径、寻路效率低等问题, 结合曼哈顿距离和对角线距离设计新的启发函数, 并对其动态分配权重, 实现全局路径最短, 减少寻路时间。针对传统8邻域8方向搜索方式搜索效率低、耗时长等问题, 提出一种基于8邻域改进的搜索策略, 对当前节点实时动态分配最优的搜索方向。针对路径存在多余无用节点的问题, 使用Floyd算法去除冗余节点, 减少转向次数, 缩短路径长度。针对传统动态窗口法规划的路径非全局最优、目标点附近存在障碍物时规划的路径长度增加或者规划失败的问题, 加入全局关键节点信息和引入目标点距离评估子函数。针对关键节点距离较长导致融合算法规划的路径偏离全局最优路径的问题, 提出关键点密集化策略。最后, 将提出的改进A*算法、融合算法和已有的其他改进算法进行比较, 仿真结果表明: 改进的A*算法能够在复杂环境中生成最短全局路径, 平均转向次数减少16.3%, 平均寻路时间缩短55.66%;融合算法在临时障碍物环境下, 平均路径长度和平均运行时间分别缩短6.1%和14.7%, 在移动障碍物环境下, 平均路径长度和平均运行时间分别缩短1.6%和39.8%。

  • 热点与综述
    姜百浩, 刘静, 仇大伟, 姜良
    计算机工程. 2024, 50(3): 1-15. https://doi.org/10.19678/j.issn.1000-3428.0067502
    摘要 (395) PDF全文 (401) HTML (40)   可视化   收藏

    深度学习算法在脊柱图像分割中具有学习和自适应能力强、对图像有非线性映射能力等优点,相较于传统分割方法,能更好地提取脊柱图像中的关键信息,并且抑制不相关信息,辅助医生准确定位病灶区域,实现精准、高效分割。从深度学习算法、脊柱疾病类型、图像类型、实验分割结果、性能评估指标等方面,对深度学习在脊柱图像分割中的应用现状进行归纳、总结并加以分析。介绍深度学习模型和脊柱图像分割的背景,从而引出深度学习在脊柱图像分割中的应用;介绍常见的几种脊柱疾病类型,阐述其在图像分割中的难点,并介绍脊柱图像分割中常用的公开数据集、图像分割的方法流程以及图像分割评价指标等要素;结合具体实验总结分析基于卷积神经网络模型、U型网络模型及其改进的模型在椎骨、椎间盘以及脊柱肿瘤图像分割中的应用进展;结合以往的实验结果和当前深度学习模型的研究进展,总结目前临床研究的局限性以及分割效果不足的原因,针对所存在的问题提出相应的解决方法,并对未来的研究和发展进行展望。

  • 人工智能与模式识别
    钱来, 赵卫伟
    计算机工程. 2024, 50(7): 104-111. https://doi.org/10.19678/j.issn.1000-3428.0068132
    摘要 (376) PDF全文 (337) HTML (18)   可视化   收藏

    文本分类作为自然语言处理领域的基本任务, 在信息检索、机器翻译和情感分析等应用中发挥着重要作用。然而大多数深度模型在预测时未充分考虑训练实例的丰富信息, 导致学到的文本特征不够全面。为了充分利用训练实例信息, 提出一种基于对比学习和注意力机制的文本分类方法。首先, 设计一种有监督对比学习训练策略, 旨在优化模型对文本向量表征的检索, 提高模型在推理过程中检索到的训练实例的质量; 然后, 构建注意力机制, 对获取的训练文本特征进行注意力分布学习, 聚焦关联性更强的相邻实例信息, 获得更多隐含的相似特征; 最后, 将注意力机制与模型网络相结合, 融合相邻的训练实例信息, 增强模型提取多样性特征的能力, 实现全局特征和局部特征的提取。实验结果表明, 所提方法在卷积神经网络(CNN)、双向长短期记忆网络(BiLSTM)、图卷积网络(GCN)、BERT和RoBERTa等多个模型上都取得了显著的性能提升。以CNN模型为例, 其在THUCNews数据集、今日头条数据集和搜狗数据集上宏F1值分别提高了4.15、6.2和1.92个百分点。因此, 该方法也为文本分类任务提供了一种有效的解决方案。

  • 计算机系统前沿技术
    方燕飞, 刘齐, 董恩铭, 李雁冰, 过锋, 王谛, 何王全, 漆锋滨
    计算机工程. 2023, 49(12): 10-24. https://doi.org/10.19678/j.issn.1000-3428.0066548
    摘要 (355) PDF全文 (682) HTML (58)   可视化   收藏

    当前众核已成为构建高性能计算(HPC)超级计算机的主流微处理器架构,为HPC领域E级超算提供强大的算力。随着众核处理器片上集成的运算核心数量不断增加,众多核心对存储资源竞争愈加激烈,“访存墙”问题越来越突出。众核片上存储层次是缓解“访存墙”问题并帮助HPC应用更好地发挥众核处理器的计算优势以提升实际应用性能的重要结构。众核片上存储层次的设计对众核片上系统性能、功耗和面积具有重要影响,是众核结构设计中的重要环节,也是业界的研究热点。由于众核芯片发展历史和片上微体系结构设计技术的不同,以及所面向的应用领域需求不同等原因,目前的HPC主流众核片上存储层次结构并不单一,但从横向比较和各处理器自身纵向发展趋势,以及从HPC与数据科学、机器学习不断融合发展带来的应用需求变化来看,SPM+Cache的混合结构最可能成为今后HPC E级超算系统众核处理器片上存储层次设计的主流选择。在面向E级计算的软件和算法层面,开展针对众核存储层次特点的设计与优化,可以帮助HPC应用更好地发挥众核处理器的计算优势,从而有效提升实际应用性能,因此面向众核片上存储层次特点的软件及算法设计与优化技术也是业界的研究热点之一。首先按照不同的组织方式将片上存储层次分为多级Cache结构、SPM结构和SPM+Cache混合结构,并总结分析3种结构的优缺点。然后分析国际主流GPU、同构众核、国产众核等面向主流E级超算系统的众核处理器片上存储层次设计现状与发展趋势。最后从众核LLC管理与缓存一致性协议、SPM空间管理与数据移动优化、SPM+Cache混合结构的全局视角优化等角度综述国际上的存储层次设计与优化相关软硬件技术的研究现状。在此基础上,从软硬件及算法设计等不同角度展望了片上存储层次的未来研究方向。

  • 图形图像处理
    赵宏, 冯宇博
    计算机工程. 2023, 49(12): 194-204. https://doi.org/10.19678/j.issn.1000-3428.0066520
    摘要 (351) PDF全文 (449) HTML (27)   可视化   收藏

    在交通标志检测任务中,YOLOv5检测算法在复杂的环境和路况下存在漏检、错检及模型参数量过大等问题。为此,提出一种改进的CGS-Ghost YOLO检测模型。YOLOv5在图片输入后使用Focus模块进行下采样,增加较多参数,CGS-Ghost YOLO模型使用StemBlock模块替换Focus模块进行采样,能够在维持精度的同时减少参数,并通过引入坐标注意力机制,强化特征中的语义信息和位置信息,提高模型的特征提取能力。设计SMU激活函数与组归一化相结合的CGS卷积模块,避免训练过程中Batch Size大小对模型所造成的影响,在使用GhostConv减少模型参数的同时,提升模型的检测精度。在此基础上,通过$ \alpha $-CIoU Loss+VFocal Loss损失函数,改善交通标志检测任务中正负样本不平衡的问题,提升模型整体性能,Neck部分使用Bi-FPN双向特征金字塔网络,实现检测目标多尺度特征的有效融合。实验结果表明,改进的CGS-Ghost YOLO模型在交通标志检测数据集TT100K中的平均精度均值达到93.1%,相较于原始模型提高了11.3个百分点,模型参数量相较于原始模型降低了21.2个百分点。此外,该网络模型优化了卷积层及下采样部分,在大幅减少模型参数的同时提高了模型检测精度。

  • 图形图像处理
    李建威, 吕晓琪, 谷宇
    计算机工程. 2023, 49(10): 239-246, 254. https://doi.org/10.19678/j.issn.1000-3428.0066050
    摘要 (350) PDF全文 (278) HTML (22)   可视化   收藏

    皮肤癌是最致命的癌症之一,对皮肤镜图像进行精确分类尤为关键,然而现有的皮肤镜图像存在形态复杂、样本数量较少的问题,导致现有的自动分类方法难以提取图像特征信息,误判率较高。提出一种改进ConvNeXt的方法,并构建SE-SimAM-ConvNeXt模型。以ConvNeXt为基础网络,加入SimAM无参注意力模块,提升网络的特征提取能力,并在基础网络中引入通道注意力机制,增强ConvNeXt对潜在关键特征的挖掘能力。在训练初始时加入预热机制Cosine Warmup,在该过程中使用余弦函数值进行学习率的衰减,进一步加速ConvNeXt的收敛,提高ConvNeXt模型的分类能力。在HAM10000皮肤数据集上的实验结果表明,该模型的分类准确率、精确度、召回率、特异性分别为92.9%、85.3%、78.0%、97.5%,具有较好的皮肤镜图像分类能力,对皮肤癌病变的辅助诊断有一定程度的应用价值,可帮助皮肤科医生对皮肤癌做进一步的诊断。

  • 人工智能与模式识别
    孙文洁, 李宗民, 孙浩淼
    计算机工程. 2024, 50(5): 62-70. https://doi.org/10.19678/j.issn.1000-3428.0067919
    摘要 (340) PDF全文 (510) HTML (23)   可视化   收藏
    如何在部分可观测的情况下实现智能体之间的协同配合是多智能体强化学习(MARL)中的一个重要问题。值函数分解方法解决了信用分配问题,是一种实现多智能体之间协同配合的有效方法,然而在现有的值函数分解方法中,智能体个体动作值函数仅取决于局部信息,不允许智能体之间进行显式的信息交换,阻碍了这一系列算法的性能,使其无法适用于复杂场景。为了解决这一问题,在值函数分解方法中引入智能体间的通信,为智能体提供有效的非局部信息以帮助其理解复杂环境。在此基础上,提出一个基于图神经网络的分层通信模型,通过图神经网络提取相邻智能体之间需要交换的有用信息,同时模型能够实现从非通信向充分通信过渡,在通信范围有限的情况下实现全局合作,适用于现实世界中通信范围受约束的情况。在星际争霸Ⅱ多智能体挑战赛(SMAC)环境和捕食者-猎物(PP)环境下进行实验,结果表明,在SMAC的4个不同场景下,该方法与QMIX、VBC等基线算法相比平均胜率提升2~40个百分点,并且能够有效解决非单调环境下的捕食者-猎物问题。
  • 图形图像处理
    徐芳芯, 樊嵘, 马小陆
    计算机工程. 2024, 50(3): 250-258. https://doi.org/10.19678/j.issn.1000-3428.0067741
    摘要 (336) PDF全文 (535) HTML (47)   可视化   收藏

    针对拥挤行人检测场景下检测算法容易产生漏检与误检的问题,提出一种改进的YOLOv7拥挤行人检测算法。在骨干网络中引入BiFormer视觉变换器和改进的高效层聚合网络(RC-ELAN)模块,通过自注意力机制与注意力模块使骨干网络更多聚焦于被遮挡行人的重要特征,有效缓解了目标特征缺失对检测造成的负面影响。采用基于双向特征金字塔网络思想的改进颈部网络,通过转置卷积和改进的Rep-ELAN-W模块使模型可以高效利用中低维特征图中的小目标特征信息,有效提升了模型的小目标行人检测性能。引入高效的完全交并比损失函数,使模型可以进一步收敛至更高精度。在含有大量小目标遮挡行人的WiderPerson数据集上的实验结果表明,与YOLOv7、YOLOv5、YOLOX算法相比,改进的YOLOv7算法的交并比阈值分别取0.5和0.5~0.95时的平均精准度提升了2.5和2.8、9.9和7.1、12.3和10.7个百分点,可较好地应用于拥挤行人检测场景。

  • 智慧教育
    李惠乾, 钟柏昌
    计算机工程. 2024, 50(7): 1-12. https://doi.org/10.19678/j.issn.1000-3428.0069539
    摘要 (323) PDF全文 (155) HTML (40)   可视化   收藏

    知识图谱与教育教学的深度融合推动了智慧教育的发展。目前有关教育知识图谱的文献综述较为缺乏, 有必要从研究规范性及内容视角方面进行补充完善。利用系统性文献综述法对近10年发表的55篇中文核心期刊文献进行统计分析后发现: 在关键技术方面, 教育知识图谱构建主要包含本体构建、知识抽取、知识表示、知识融合和知识推理5项技术, 深度学习方法逐渐成为研究热点; 在应用场景方面, 教育知识图谱覆盖个性化学习推荐、智能问答(Q&A)、教学资源管理、智能搜索、智能学情诊断和课堂教学分析6类场景, 应用的广度和深度不断拓展; 在应用效果方面, 教育知识图谱促进了学习者个性化学习和碎片化泛在学习, 提升了学习者的学习绩效和教师的专业素养; 在问题与挑战方面, 教育知识图谱存在数据模态单一与缺乏优质数据集、自动化程度低与技术存在边界性、知识建模难度高与能力关照不足、缺乏互操作标准与教育应用率低等问题。后续研究将从完善理论与建立标准、优化技术与精准建模、强化应用与提升效果等方面进行深化。

  • 开发研究与工程应用
    贵向泉, 刘世清, 李立, 秦庆松, 李唐艳
    计算机工程. 2024, 50(7): 342-351. https://doi.org/10.19678/j.issn.1000-3428.0068125
    摘要 (318) PDF全文 (168) HTML (11)   可视化   收藏

    针对当前景区行人检测具有检测精度低、算法参数量大和现有公开数据集在小目标检测上存在限制等问题, 创建TAPDataset行人检测数据集, 弥补现有数据集在小目标检测方面的不足, 并基于YOLOv8算法, 构建一种检测精度高、硬件要求低的新模型YOLOv8-L。首先引入DepthSepConv轻量化卷积模块, 降低模型的参数量和计算量。其次采用BiFormer注意力机制和上采样算子CARAFE, 加强模型对图像的语义理解和信息融合能力, 提升模型的检测精度。最后增加一层小目标检测层来提取更多的浅层特征, 从而有效地改善模型对小目标的检测性能。在TAPDataset、VOC 2007及TAP+VOC数据集上的实验结果表明, 与YOLOv8相比, 在FPS基本不变的情况下, 在TAPDataset数据集上, 模型的参数量减少了18.06%, mAP@0.5提高了5.51%, mAP@0.5∶0.95提高了6.03%;在VOC 2007数据集上, 模型的参数量减少了13.6%, mAP@0.5提高了3.96%, mAP@0.5∶0.95提高了6.39%;在TAP+VOC数据集上, 模型的参数量减少了14.02%, mAP@0.5提高了4.49%, mAP@0.5∶0.95提高了5.68%。改进算法具有更强的泛化性能, 能够更好地适用于景区行人检测任务。

  • 热点与综述
    陈锦生, 马文臻, 方少峰, 邹自明
    计算机工程. 2023, 49(11): 13-23. https://doi.org/10.19678/j.issn.1000-3428.0066521
    摘要 (317) PDF全文 (652) HTML (59)   可视化   收藏

    子午工程全天空气辉成像仪观测网的逐步完善,积累了海量的气辉图像原始观测数据,但是基于地基气辉观测的大气重力波研究极度依赖人工识别,十分耗时且识别质量难以得到保证,亟需发展一种快速有效的自动识别方法。针对大气重力波标注样本稀缺的问题,在改进Cycle GAN模型的基础上提出一种大气重力波气辉观测数据集扩充算法,仅需标注少量样本即可大幅提升检测算法对大气重力波的识别精度;进一步,利用地基气辉图像识别目标与背景低信噪比的特点,通过对深度学习模型YOLOv5s骨干网络以及边界框预测加以改进,提出一种新的大气重力波智能识别算法。实验结果表明,使用扩增的数据集以及改进的YOLOv5s目标检测算法,在交并比阈值为0.5的情况下平均识别精度达到75.8%,较原始模型提升9.7个百分点,检测速度和平均识别精度均优于对比的主流目标检测算法。

  • 图形图像处理
    杨谢柳, 门国文, 梁文峰, 王丹, 谢正义, 范慧杰
    计算机工程. 2023, 49(11): 247-256. https://doi.org/10.19678/j.issn.1000-3428.0066610
    摘要 (311) PDF全文 (120) HTML (11)   可视化   收藏

    因水下环境的特殊性,水下光学图像往往存在色偏、模糊、对比度低等退化现象。为恢复颜色正常、清晰的水下图像,大量的水下图像增强复原方法已被提出,但是现有的水下图像增强复原方法主要以提高水下图像的视觉效果为直接目标,对基于深度学习的水下目标检测精度的影响尚不明确。因此,使用14种典型的水下图像增强复原方法和3种典型的基于深度学习的目标检测模型,在URPC2018和URPC2019数据集上从训练集与测试集的域差异、训练集的域数量、训练集的图像数量等方面,详细深入地探讨图像增强复原方法对基于深度学习的目标检测模型精度的影响,并自建数据集进行跨数据集测试。实验结果表明,在训练集和测试集均属同一数据集时,水下图像增强复原方法无论作为图像预处理方法还是数据增强方法,对深度学习目标检测精度的提升都无明显效果,但是在跨数据集检测时,借助水下图像增强复原方法能够大幅提升深度学习目标检测精度,mAP最高可提高13.6个百分点。

  • 热点与综述
    杨彬, 王轶彤
    计算机工程. 2023, 49(10): 13-21. https://doi.org/10.19678/j.issn.1000-3428.0065807
    摘要 (299) PDF全文 (384) HTML (36)   可视化   收藏

    异质信息网络往往包含不同类型的节点和关系,丰富的语义信息和复杂的关系对目前异质信息网络的表征学习提出了巨大的挑战。现有多数方法通常使用预定义的元路径来捕获异质的语义信息和结构信息,但成本高、覆盖率低,且不能准确有效地捕获和学习有影响力的高阶邻居节点。提出HIN-HG模型来解决以上问题。HIN-HG通过生成异质信息网络的超邻接图来准确有效地捕获对目标节点有影响力的邻居节点,并使用带有多通道机制的卷积神经网络聚合在不同关系下的不同类型的邻居节点。HIN-HG可以自动地学习不同邻居节点和元路径的权重而无须进行手动指定,同时可以捕获全图范围内和目标节点相似的节点作为高阶邻居,并通过信息传播有效地更新目标节点的表征。在DBLP、ACM和IMDB真实数据集上的实验结果表明,在节点分类任务中,HIN-HG较HAN、GTN、HGSL等前沿的异质信息网络表征学习方法性能更优,Macro-F1和Micro-F1多分类评估指标平均提高5.6和5.7个百分点,提高了节点分类的准确性和有效性。

  • 热点与综述
    王恩旭, 王晓红, 张坤, 张冬雯
    计算机工程. 2023, 49(11): 40-48, 69. https://doi.org/10.19678/j.issn.1000-3428.0066255
    摘要 (291) PDF全文 (379) HTML (26)   可视化   收藏

    针对目前负载预测模型不容易捕获数据时序信息和特征信息的问题,提出一种双重注意力机制的负载预测模型。该模型融合特征注意力机制和时序注意力机制,自适应地挖掘服务器负载的特征信息和时序信息,有效增强网络对特征数据和时序数据的关键信息表达。基于CRITIC方法对服务器各项特征进行加权,计算服务器负载值,从而更加全面和准确地评估服务器下一时刻的负载状态。双重注意力机制网络在长短期记忆网络(LSTM)的基础上引入特征注意力机制和时序注意力机制,以负载值的历史数据为输入对未来时刻服务器的负载值进行预测,有效提高网络对单步预测和多步预测的准确性。在阿里巴巴Cluster-trace-v2018公开数据集上的实验结果表明,双重注意力机制网络相对于LSTM基础的负载预测网络,平均绝对误差和均方误差分别下降了9.2%和16.8%,具有较好的稳定性和准确性。

  • 智慧交通
    陈伟, 王晓龙, 张晏玮, 安国成, 江波
    计算机工程. 2024, 50(4): 11-19. https://doi.org/10.19678/j.issn.1000-3428.0068901
    摘要 (289) PDF全文 (390) HTML (44)   可视化   收藏

    在高速公路服务区违停检测过程中光照、天气变化等复杂环境会使车辆检测精度急剧下降, 同时摄像机拍摄角度、车体高度等因素会增加车辆违停检测的误报率和漏报率。为此, 提出一种基于改进YOLOv8的高速公路服务区违停检测算法。在YOLOv8网络模型的特征金字塔池化层中, 构建膨胀空间金字塔池化(DSPP)模块和基于分支注意力机制的膨胀空间金字塔池化(DSPPA)模块, 减少特征提取网络中深层语义信息的丢失, 同时利用DSPPA中的分支注意力(BA)机制为不同感受野分支特征赋予不同的权重, 使模型更关注与目标尺寸相适应的特征。设计基于全局匹配的停车位分配策略, 有效降低了视角倾斜、车辆重叠遮挡等情况下违规占用停车位的误报率与漏报率。实验结果表明, 改进算法的违停检测误报率从15%下降至8%, 违停检测漏报率从7.5%下降至6.1%, 具有较好的车辆违停检测效果。

  • 热点与综述
    孙毅, 王会梅, 鲜明, 向航
    计算机工程. 2024, 50(2): 25-32. https://doi.org/10.19678/j.issn.1000-3428.0067396
    摘要 (287) PDF全文 (424) HTML (16)   可视化   收藏

    Kubeflow将机器学习和云计算技术两个技术领域相结合,集成了大量的机器学习工具,为生产级的机器学习平台落地提供了可行方案。机器学习通常依托图形处理器(GPU)等专用处理器来提高训练和推理速度,随着云计算集群规模的动态调整,不同计算架构的云计算节点可以灵活地加入/退出集群,传统的轮询调度策略已无法满足动态调整下的异构算力资源调度。为解决Kubeflow平台异构算力的分配优化问题,提高平台资源利用率,实现负载均衡,提出一种基于云的图形处理器-中央处理器(CPU-GPU)异构算力调度策略,采用量化后的负载均衡度和优先级两个判断指标,细颗粒度化显存分配,将计算资源挂载给对应的Pod以实现算力资源的细颗粒度调度。根据集群各节点算力资源设计资源权重矩阵,利用改进的遗传算法获取Pod的最优部署方案,保证多个任务的执行。实验结果表明,该调度策略对并行任务支持效果较好,且在资源请求溢出的情况下,能够按照优先级调度执行并实现最优的负载,与平台原生策略相比,资源细化程度提升了一个数量级,集群负载均衡也有较为显著的提升。

  • 热点与综述
    刘颖, 马玉鹏, 赵凡, 王轶, 蒋同海
    计算机工程. 2024, 50(1): 39-49. https://doi.org/10.19678/j.issn.1000-3428.0067004
    摘要 (278) PDF全文 (421) HTML (24)   可视化   收藏

    Hyperledger Fabric是一种国内外广泛使用的联盟链框架,在基于Fabric技术的一些业务中具有协同组织众多、交易操作频繁、事务冲突增加等特点。Fabric采用的多版本并发控制技术能够在一定程度上解决部分交易冲突,提升系统并发性,但其机制不完善,会出现部分交易数据无法正常上链存储的问题。为了实现海量交易数据完整、高效、可信的上链存储,提出一种基于Fabric预言机的数据上链预处理机制。设计海量数据冲突预处理(MCPP)方法,通过检测、监听、延时提交、事务加锁、重排序缓存等方式实现主键冲突交易数据的完整上链。引入数据传输保障措施,在传输过程中利用非对称加密技术防止恶意节点伪造认证信息,确保交易数据链外处理前后的一致性。通过理论分析和实验结果表明,该机制可有效解决联盟链平台中海量交易数据上链时的并发冲突问题,当交易数据规模达到1 000和10 000时,MCPP的时效性比LMLS提高了38%和21.4%,且成功率接近100%,具有高效性和安全性,同时在无并发冲突情况下不影响Fabric系统性能。

  • 热点与综述
    哈里旦木·阿布都克里木, 侯钰涛, 姚登峰, 阿布都克力木·阿布力孜, 陈吉尚
    计算机工程. 2024, 50(1): 1-16. https://doi.org/10.19678/j.issn.1000-3428.0068124
    摘要 (278) PDF全文 (160) HTML (31)   可视化   收藏

    维吾尔语机器翻译作为我国低资源机器翻译研究的重要任务之一,其发展与应用可以更好地促进不同地区和民族之间的文化交流与贸易往来。然而,维吾尔语作为一种黏着性语言,在机器翻译领域存在形态复杂、语料稀缺等问题。近年来,在维吾尔语机器翻译发展的不同阶段,研究人员针对其特点在算法和模型上不断优化与创新,取得了一定的研究成果,但缺乏系统性的综述。全面回顾维吾尔语机器翻译的相关研究,并根据方法的不同将其分为基于规则和实例的维吾尔语机器翻译、基于统计的维吾尔语机器翻译以及基于神经网络的维吾尔语机器翻译3种类型,同时对相关学术活动和语料库资源进行汇总。为进一步探索维吾尔语机器翻译的潜力,采用ChatGPT模型对维吾尔语-汉语机器翻译任务进行初步研究,实验结果表明,在Few-shot情景下,随着示例数的增加,翻译性能先升后降,在10-shot时表现最佳。此外,思维链方法在维吾尔语机器翻译任务中并未展示出更优的翻译能力。最后对维吾尔语机器翻译未来的研究方向进行了展望。

  • 图形图像处理
    圣文顺, 余熊峰, 林佳燕, 陈欣
    计算机工程. 2024, 50(1): 242-250. https://doi.org/10.19678/j.issn.1000-3428.0066724
    摘要 (273) PDF全文 (180) HTML (19)   可视化   收藏

    针对Faster R-CNN算法对于小尺寸目标以及遮挡或截断物体检测能力不足的问题,提出一种融合CBAM注意力机制和特征金字塔结构的改进Faster R-CNN算法。为重点聚焦特征图像局部高效信息,在特征提取网络中融入CBAM机制,减少无效目标的干扰,提升面对遮挡或截断物体的检测能力。引入特征金字塔网络结构,联结高层与底层特征数据,获得高分辨率、强语义数据,从而增强小目标物体的检测效果。为缓解梯度消失现象以及减少超参数规模,使用表达能力较强的倒残差VS-ResNet网络替换VGG16网络,VS-ResNet网络在原有ResNet 50基础上修改了部分层次结构,加入辅助分类器,设计倒残差和组卷积方式,使激活函数信息在高维环境中完整保留,提高检测准确率。采用重置候选框分值计算方法弥补非极大值抑制算法误消除重叠检测框的缺陷。实验结果表明,相比VGG16,VS-ResNet在CIFAR-10数据集上的正确率提高2.97个百分点,该算法在Pascal VOC 2012数据集上的目标检测mAP值为76.2%,比原始Faster R-CNN算法的mAP值提高了13.9个百分点。

  • 人工智能与模式识别
    李华昱, 张智康, 闫阳, 岳阳
    计算机工程. 2024, 50(8): 31-39. https://doi.org/10.19678/j.issn.1000-3428.0068225
    摘要 (272) PDF全文 (173) HTML (24)   可视化   收藏

    针对特定领域中文命名实体识别存在的局限性, 提出一种利用学科图谱和图像提高实体识别准确率的模型, 旨在利用领域图谱和图像提高计算机学科领域短文本中实体识别的准确率。使用基于BERT-BiLSTM-Attention的模型提取文本特征, 使用ResNet152提取图像特征, 并使用分词工具获得句子中的名词实体。通过BERT将名词实体与图谱节点进行特征嵌入, 利用余弦相似度查找句子中的分词在学科图谱中最相似的节点, 保留到该节点距离为1的邻居节点, 生成最佳匹配子图, 作为句子的语义补充。使用多层感知机(MLP)将文本、图像和子图3种特征映射到同一空间, 并通过独特的门控机制实现文本和图像的细粒度跨模态特征融合。最后, 通过交叉注意力机制将多模态特征与子图特征进行融合, 输入解码器进行实体标记。在Twitter2015、Twitter2017和自建计算机学科数据集上同基线模型进行实验比较, 结果显示, 所提方法在领域数据集上的精确率、召回率和F1值分别可达88.56%、87.47%和88.01%, 与最优基线模型相比, F1值提高了1.36个百分点, 表明利用领域知识图谱能有效提升实体识别效果。

  • 计算机系统前沿技术
    陈逸, 刘博生, 徐永祺, 武继刚
    计算机工程. 2023, 49(12): 1-9. https://doi.org/10.19678/j.issn.1000-3428.0066701
    摘要 (263) PDF全文 (428) HTML (56)   可视化   收藏

    深度卷积神经网络具有模型大、计算复杂度高的特点,难以部署到硬件资源有限的现场可编程门阵列(FPGA)中。混合精度卷积神经网络可在模型大小和准确率之间做出权衡,从而为降低模型内存占用提供有效方案。快速傅里叶变换作为一种快速算法,可将传统空间域卷积神经网络变换至频域,从而有效降低模型计算复杂度。提出一个基于FPGA的8 bit和16 bit混合精度频域卷积神经网络加速器设计。该加速器支持8 bit和16 bit频域卷积的动态配置,并可将8 bit频域乘法运算打包以复用DSP,用来提升计算性能。首先设计一个基于DSP的频域计算单元,支持8 bit和16 bit频域卷积运算,通过打包一对8 bit频域乘法以复用DSP,从而提升吞吐率。然后提出一个映射数据流,该数据流支持8 bit和16 bit计算两种形式,通过数据重用方式最大化减少冗余数据处理和数据搬运操作。最后使用ImageNet数据集,基于ResNet-18与VGG16模型对所设计的加速器进行评估。实验结果表明,该加速器的能效比(GOP与能耗的比值)在ResNet-18和VGG16模型上分别达到29.74和56.73,较频域FPGA加速器提升1.2~6.0倍。

  • 人工智能与模式识别
    向海昀, 李鸿鑫, 符晓, 苏小平
    计算机工程. 2023, 49(12): 78-87. https://doi.org/10.19678/j.issn.1000-3428.0066465
    摘要 (259) PDF全文 (107) HTML (27)   可视化   收藏

    蜜獾算法(HBA)是一种新型智能优化算法,通过模拟蜜獾觅食行为进行寻优,具有结构简单且收敛速度快等特点。针对HBA在解决高维复杂问题时收敛精度低、收敛速度慢以及全局寻优能力不足等问题,提出一种多策略改进的蜜獾算法(MSHBA)。设计一种限制反向学习机制,随着算法迭代生成限制反向解更新种群,提高种群质量,加快算法收敛速度,引入自适应权重因子,随着迭代次数的变化调节不同寻优路径上的寻优步长,协调算法不同探索阶段,提升算法稳定性,加快收敛速度,构建一种新的饥饿搜索策略,根据种群能量以及全局最差位置改变寻优路径上的寻优步长,避免算法陷入早熟。基于9个标准测试函数对MSHBA、HBA、鲸鱼优化、哈里斯鹰、单一策略等算法在不同维度上进行仿真实验,结果表明,MSHBA具有更优的稳定性和收敛精度,将算法应用于机械设计优化问题并进行结果比较,MSHBA对比原HBA性能优化了88%,适用于求解高维复杂问题。

  • 热点与综述
    吴奇林, 党亚固, 熊山威, 吉旭, 毕可鑫
    计算机工程. 2023, 49(11): 24-29, 39. https://doi.org/10.19678/j.issn.1000-3428.0066181
    摘要 (253) PDF全文 (413) HTML (35)   可视化   收藏

    以学生评教文本情感分析任务作为切入点,针对传统基础深度学习模型特征提取能力不足、循环神经网络训练效率较低以及词向量语义表示不准确等问题,提出基于混合特征网络的学生评教文本情感分类算法。采用轻量级ALBERT预训练模型提取符合当前上下文语境的每个词的动态向量表示,解决传统词向量模型存在的一词多义问题,增强向量语义表示的准确性;混合特征网络通过结合简单循环单元和多尺度局部卷积学习模块以及自注意力层,全面捕捉评教文本全局上下文序列特征和不同尺度下的局部语义信息,提升模型的深层次特征表示能力,自注意力机制通过计算每个分类特征对分类结果的重要程度,识别出对情感识别结果影响较大的关键特征,避免无关特征对结果造成干扰,影响分类性能,将分类向量拼接后由线性层输出评教文本情感分类结果。在真实学生评教文本数据集上的实验结果表明,该模型F1值达到97.8%,高于对比的BERT-BiLSTM、BERT-GRU-ATT等深度学习模型。此外,消融实验结果也证明了各模块的有效性。

  • 计算机系统前沿技术
    叶钧超, 徐聪, 黄尧, 柴志雷
    计算机工程. 2023, 49(12): 35-45. https://doi.org/10.19678/j.issn.1000-3428.0066260
    摘要 (251) PDF全文 (462) HTML (21)   可视化   收藏

    脉冲神经网络作为第三代神经网络,其工作机理与生物大脑更接近,层内连接与反向连接的复杂拓扑结构具有解决复杂问题的潜力。神经元和突触是脉冲神经网络中最基本的计算单元,相比于带泄露积分触发神经元模型,Izhikevich神经元模型能通过模拟出更多的生物脉冲现象来支持更广泛的类脑仿真计算,但Izhikevich神经元模型的计算复杂度更高,基于其搭建的脉冲神经网络存在低性能、高功耗的问题。提出一种基于FPGA的Izhikevich神经元定制计算方法。首先,通过研究脉冲神经网络中Izhikevich神经元各参数的取值范围以及平衡膜电位的相对误差与资源消耗,设计一套混合精度的定点化方案;其次,针对单个神经元,通过平衡神经元更新计算方程的数据路径实现最小化流水;再次,针对整体脉冲神经网络,设计并行度可扩展的计算架构以适应不同规模的FPGA平台;最后,把该定制计算方法用于经典的NEST仿真器加速。实验结果表明,相比于i7-10700 CPU,经典的丘脑外侧膝状核网络模型和液体状态机模型在ZCU102上的性能平均提升2.26和3.02倍,能效比平均提升8.06和10.8倍。

  • 开发研究与工程应用
    曹发鑫, 孙媛媛, 王治政, 潘丁豪, 林鸿飞
    计算机工程. 2024, 50(1): 306-312. https://doi.org/10.19678/j.issn.1000-3428.0066055
    摘要 (248) PDF全文 (86) HTML (11)   可视化   收藏

    相似案例匹配任务是文本匹配在司法领域的具体应用之一,目的在于区分法律文书是否相似,对类案检索具有重要意义。与传统文本匹配任务相比,法律文本通常篇幅较长,同时相似案例匹配是针对相同案由案件的匹配,案情文本之间的差异较小,以往的文本匹配方法很难计算文本相似度。针对借贷案件文本匹配存在的问题,建立一种融合借贷案件关键要素的相似案例匹配模型。为了获取文本中更丰富的语义特征,构建正则表达式获得借贷案件的特定案件要素,如借款交付形式、借款人基本属性等,并与原有的案情文本相结合,联合学习法律文本与案件关键要素的语义特征。同时,利用共享权重的预训练模型分别对不同的文书进行编码,并且对预训练模型特定编码层的输出进行融合,得到更加丰富的语义信息。引入有监督对比学习框架,更好地利用样本信息,进一步提高相似案例匹配的性能。在CAIL2019-SCM数据集上的实验结果表明,与LFESM模型相比,该模型在测试集上的准确率提高了1.05个百分点。

  • 网络空间安全
    邓昕, 刘朝晖, 欧阳燕, 陈建华
    计算机工程. 2023, 49(11): 178-186. https://doi.org/10.19678/j.issn.1000-3428.0066558
    摘要 (245) PDF全文 (131) HTML (9)   可视化   收藏

    对网络流量进行加密有助于保护数据安全和用户隐私,但是加密也隐藏了数据的特征,提高了恶意流量识别的难度。针对传统机器学习方法依赖专家经验、现有深度学习方法对加密流量特征表征能力不足等问题,提出一种在不解密的前提下自动提取空间特征和时序特征以进行加密恶意流量识别的CNN CBAM-BiGRU Attention模型。该模型分为空间特征提取与时序特征提取两部分:空间特征提取选用不同大小的一维卷积核,为了防止空间特征丢失,修改卷积层参数代替池化层进行特征压缩和去除冗余,再利用CBAM块对提取到的不同尺寸的空间特征进行加权,使得模型能够关注到区分度高的空间特征;时序特征提取部分利用双向门控循环单元来表征数据包之间的时序依赖关系,然后利用Attention来突出会话中重要的数据包。在此基础上,将两部分特征向量进行融合,利用Softmax分类器进行二分类和多分类。在公开数据集上进行实验,结果表明,该模型在二分类任务中的加密恶意流量识别准确率达到99.95%,在多分类任务中整体准确率达到99.39%,在Dridex与Zbot类别的加密恶意流量识别中F1值相比1D_CNN、BiGRU等模型有显著提高。

  • 人工智能与模式识别
    谭郁松, 李恬, 张钰森
    计算机工程. 2024, 50(8): 1-12. https://doi.org/10.19678/j.issn.1000-3428.0068554
    摘要 (243) PDF全文 (204) HTML (22)   可视化   收藏

    随着移动计算、第五代移动通信技术(5G)以及物联网(IoT)技术的不断演进, 各类终端设备的数量呈现指数级增长。这种激增的终端设备连接到网络产生了巨大的数据流, 对于需要实时处理和快速响应用户任务的需求提出了新的挑战。尤其是在这些海量数据中, 半结构化和非结构化数据所占比例较大, 这使得神经网络因其独特的优势而得到了广泛应用。为了提高数据处理能力和推理精度, 神经网络模型会被设计得非常复杂, 其存储和运行均需要消耗大量的计算资源。然而, 边缘设备通常只配置有限的计算资源, 无法满足存储和运行复杂神经网络模型的需求, 需要借助云计算中心来完成这些任务。这种云协同会引发响应延时和增加网络带宽消耗, 并带来用户隐私数据泄露等潜在风险。为了解决这些问题, 提出一种面向边缘智能的神经网络模型快速生成与自动化部署(NGD)方法, 根据边缘设备的硬件配置和承载的具体计算任务需求, 生成与其匹配的神经网络模型, 并将其快速部署在目标设备上, 实现设备本地推理。在3种典型的硬件平台上的神经网络模型生成与部署实验结果表明, NGD方法能够高效地为资源受限的边缘设备生成匹配的神经网络模型, 并快速地将其部署在设备上进行推理任务。

  • 开发研究与工程应用
    张子珺, 陈劲松, 钱夕元
    计算机工程. 2023, 49(10): 272-279. https://doi.org/10.19678/j.issn.1000-3428.0066030
    摘要 (236) PDF全文 (139) HTML (7)   可视化   收藏

    书法字骨架保留书法字的结构、形态以及笔画细节,对于评价书法字笔画结构极为重要。为解决现有的骨架提取算法无法获取离线书法图像的动态信息,提出改进条件生成对抗网络的书法字骨架提取算法。为获取长距离上下文信息,将残差结构与分层空洞卷积模块引入条件生成对抗网络,并融合交叉注意力模块,以保证生成骨架的平滑性。使用谱归一化和Leaky ReLU激活函数稳定模型训练,提升书法字骨架提取的完整性,并基于在线手写字数据集,构建伪书法字图像数据集。实验结果表明,该算法在测试数据集中的F1值、联合交并比(IoU)和最小平均距离(AMD)分别为0.678 2、0.515 8和1.450 0,相较于现有骨架提取算法的最优结果,F1值、IoU分别提高了8.2%和8.8%, AMD降低了约0.42,可有效捕获到书法离线图像的动态信息,使骨架特征更具有代表性,在书法字帖图片上表现出较优的泛化能力。同时,消融实验结果验证了分层空洞卷积模块和交叉注意力模块的有效性,可以获得更完整、光滑的字符骨架。

  • 封面和目录
    计算机工程. 2023, 49(10): 0-0.
  • 人工智能与模式识别
    刘昀抒, 申彦明, 齐恒, 尹宝才
    计算机工程. 2024, 50(1): 101-109. https://doi.org/10.19678/j.issn.1000-3428.0066637
    摘要 (232) PDF全文 (110) HTML (20)   可视化   收藏

    知识图谱问答(KBQA)旨在理解用户的自然语言问句,在结构化的知识图谱中通过检索、推理等手段来获取答案实体。近年来,多跳KBQA备受关注,然而,复杂问句中通常存在多个关系意图,已有KBQA方法大多忽视了推理关系链的关系顺序问题。为此,提出一种基于层次结构图的多跳知识图谱问答模型(HSG-KBQA),建模自然语言问句的关系层次顺序,指导模型在每个推理步选择合理的关系意图。设计一种层次结构图,显式地体现问句中关系的层次距离,利用LSTM-BiGCN编码层将词语间的依存信息编码到问句中;提出虚拟节点的概念,利用图池化技术过滤不重要的节点,学习推理过程中知识图谱的状态;设计基于注意力机制和层次权重的解码器来优化指令生成,使推理指令更匹配问句中的关系链顺序。实验结果表明,HSG-KBQA在WebQuestionsSP数据集上取得了71.3%的Hits@1分数,在PathQuestions数据集上取得了97.3%(PQ-2H)和89.7%(PQ-3H)的Hits@1分数,均优于对照基准模型,表明HSG-KBQA模型在KBQA任务中具有更好的性能。

  • 人工智能与模式识别
    罗俊, 高清维, 檀怡, 赵大卫, 卢一相, 孙冬
    计算机工程. 2023, 49(11): 49-60. https://doi.org/10.19678/j.issn.1000-3428.0065787
    摘要 (229) PDF全文 (496) HTML (13)   可视化   收藏

    标签特定特征是多标签学习的研究热点,利用标签特征提取解决单个例子存在多个类标签的问题。现有多标签分类研究通常只是简单考虑标签之间的相关性,忽略原始数据之间的局部流形结构,可能会造成分类精度下降。此外,在标签相关性中,特征和标签的结构关系以及标签之间的内在因果关系也往往被忽视。提出一种基于双拉普拉斯正则化与因果推断的多标签学习算法。利用线性回归模型建立多标签分类的基本框架,结合因果学习探索标签之间的内在因果关系,以达到挖掘标签之间本质联系的目的。在此基础上,为充分利用特征与标签之间的结构关系,加入双拉普拉斯正则化以挖掘局部标签关联信息以及有效保持原始数据的局部流形结构。在公共多标签数据集上验证该算法的有效性,实验结果表明,相比LLSF、ML-KNN、LIFT等算法,该算法的汉明损失、平均精度、1次错误率、排序损失、覆盖率、AUC平均提升8.82%、4.98%、9.43%、16.27%、12.19%、3.35%。

  • 人工智能与模式识别
    杨冬菊, 黄俊涛
    计算机工程. 2024, 50(9): 113-120. https://doi.org/10.19678/j.issn.1000-3428.0068400
    摘要 (228) PDF全文 (304) HTML (0)   可视化   收藏

    高质量的标注数据是中文科技文献领域自然语言处理任务的重要基石。针对目前缺乏中文科技文献的高质量标注语料以及人工标注质量参差不齐且效率低下的问题, 提出一种基于大语言模型的中文科技文献标注方法。首先, 制定适用于多领域中文科技文献的细粒度标注规范, 明确标注实体类型以及标注粒度; 其次, 设计结构化文本标注提示模板和生成解析器, 将中文科技文献标注任务设置成单阶段单轮问答过程, 将标注规范和带标注文本填充至提示模板中相应的槽位以构建任务提示词; 然后, 将提示词注入到大语言模型中生成包含标注信息的输出文本, 经由解析器解析得到结构化的标注数据; 最后, 利用基于大语言模型的提示学习生成中文科技文献实体标注数据集ACSL, 其中包含分布在48个学科的10 000篇标注文档以及72 536个标注实体, 并在ACSL上提出基于RoBERTa-wwm-ext的3个基准模型。实验结果表明, BERT+Span模型在长跨度的中文科技文献实体识别任务中表现最佳, F1值为0.335。上述结果可作为后续研究的测试基准。

  • 图形图像处理
    胡清翔, 饶文碧, 熊盛武
    计算机工程. 2023, 49(12): 169-177. https://doi.org/10.19678/j.issn.1000-3428.0066677
    摘要 (227) PDF全文 (137) HTML (18)   可视化   收藏

    在基于深度学习的目标检测算法中,YOLO算法因兼具速度与精度的优势而备受关注,但是将其应用于无人机遥感领域时存在检测速度较慢、计算资源要求较高、小目标检测精度不佳等问题。为此,提出基于YOLO的轻量级小目标检测算法SS-YOLO。使用轻量的主干网络提升算法的推理速度,根据特征金字塔网络分治思想,加入下采样倍数为4的高分辨特征图P2用于检测微小目标。为解决高分辨率特征图(P2、P3)中语义信息不足的问题,构建结合自适应融合因子的语义增强上采样模块。针对定位损失函数中IoU度量方法对目标尺寸敏感所带来的影响小目标定位精确性的问题,设计结合归一化Wasserstein距离度量方法与中心点距离惩罚项的LCNWD定位回归损失函数。实验结果表明,与YOLOv5s以及最新的YOLOv7-tiny相比,改进后的SS-YOLO模型参数量分别减少了31.3%和20.6%,与YOLOv7-tiny相比,mAP在VisDrone与AI-TOD数据集上分别提升了7.5和7.0个百分点;与YOLOv5s相比,mAP分别提升了2.3和3.6个百分点。当输入图片尺寸为800×800像素时,SS-YOLO的FPS为110帧/s,能够在满足无人机等边缘设备实时检测的同时,显著提升小目标的检测结果。

  • 封面和目录
    计算机工程. 2023, 49(11): 0-0.
  • 计算机系统前沿技术
    王一泠, 吴琦, 安军社
    计算机工程. 2023, 49(12): 25-34, 45. https://doi.org/10.19678/j.issn.1000-3428.0067108
    摘要 (223) PDF全文 (218) HTML (22)   可视化   收藏

    空间数据系统咨询委员会高级在轨系统标准定义的空间数据系统分布式架构是提高星载系统整体可靠性的一种有效方案。国内通常采用基于MIPS架构的龙芯系列处理器作为该架构典型应用节点的航天器控制终端,但由于缺失自主可控的轻量型操作系统,限制了该架构在航天领域的部署与应用。为了构建自主可控的航天信息系统技术体系,实现在龙芯控制终端上移植适配国产轻量型开源鸿蒙操作系统的目标,通过分析开源鸿蒙操作系统LiteOS-M轻量实时内核与MIPS架构,聚焦硬件抽象层(HAL)和内核硬件相关部分,设计并实现一种包括引导系统启动加载、HAL架构适配、串口驱动、内核裁剪、工具链搭建的移植方案。为了验证移植后系统的基础功能与实时性能指标,在基于MIPS架构的龙芯星载控制终端LS1J与LS1C硬件平台上设计测试用例并开展实验。实验结果表明,轻量型开源鸿蒙操作系统成功适配MIPS架构,能够稳定可靠地运行在龙芯控制终端上,系统任务上下文切换时延为0.229 μs,中断响应时延为4.73 μs,满足实时性系统指标。