作者投稿和查稿 主编审稿 专家审稿 编委审稿 远程编辑

全文下载排行

  • 一年内发表的文章
  • 两年内
  • 三年内
  • 全部
  • 最近1个月下载排行
  • 最近1年下载排行

Please wait a minute...
  • 全选
    |
  • 开发研究与工程应用
    胡新荣, 龚闯, 张自力, 朱强, 彭涛, 何儒汉
    计算机工程. 2022, 48(7): 284-291. https://doi.org/10.19678/j.issn.1000-3428.0062392
    摘要 (347) PDF全文 (1582) HTML (31)   可视化   收藏
    在服装图像分割领域,现有算法存在服装边缘分割粗糙、分割精度差和服装深层语义特征提取不够充分等问题。将Coordinate Attention机制和语义特征增强模块(SFEM)嵌入到语义分割性能较好的Deeplab v3+网络,设计一种用于服装图像分割领域的CA_SFEM_Deeplab v3+网络。为了加强服装图像有效特征的学习,在Deeplab v3+网络的主干网络resnet101中嵌入Coordinate Attention机制,并将经过带空洞卷积池化金字塔网络的特征图输入到语义特征增强模块中进行特征增强处理,从而提高分割的准确率。实验结果表明,CA_SFEM_Deeplab v3+网络在DeepFashion2数据集上的平均交并比与平均像素准确率分别为0.557、0.671,相较于Deeplab v3+网络分别提高2.1%、2.3%,其所得分割服装轮廓更为精细,具有较好的分割性能。
  • 封面和目录
    计算机工程. 2024, 50(2): 0-0.
  • 热点与综述
    王畅, 李雷孝, 杨艳艳
    计算机工程. 2023, 49(11): 1-12. https://doi.org/10.19678/j.issn.1000-3428.0066661
    摘要 (486) PDF全文 (868) HTML (95)   可视化   收藏

    基于计算机视觉的疲劳驾驶检测方法具有非侵入性等优点,不会对驾驶行为产生影响,在实际场景中便于应用。随着计算机技术的发展,越来越多的学者研究基于计算机视觉的疲劳驾驶检测方法。疲劳驾驶行为主要体现在面部和肢体上,在计算机视觉领域,面部行为较肢体行为更易获取,因此,基于面部特征的疲劳驾驶检测方法成为疲劳驾驶检测领域的重要研究方向。综合分析多种基于驾驶员面部多特征的疲劳驾驶检测方法,对国内外最新研究成果进行总结。介绍驾驶员面部不同特征在疲劳状态下的具体行为体现,阐述基于面部多特征的疲劳驾驶检测流程。根据面部不同特征对国内外的研究成果进行分类,并整理不同的特征提取方法和状态判别方法。通过不同特征在疲劳状态下产生的各种行为归纳不同方法判别驾驶员疲劳状态时使用的参数。同时,总结当前研究成果中使用面部多特征综合判别疲劳驾驶的方法,分析不同方法间的相同点和差异性。在此基础上,讨论当前基于面部多特征融合的疲劳驾驶检测领域存在的不足,并对该领域的未来研究方向进行展望。

  • 进化和群体智能算法与应用
    梅晶, 戴龙宝, 童钊, 邓昕, 王嘉珂
    计算机工程. 2023, 49(7): 34-46. https://doi.org/10.19678/j.issn.1000-3428.0067064
    摘要 (134) PDF全文 (843) HTML (16)   可视化   收藏

    移动边缘计算(MEC)将计算、存储、网络资源和服务向网络边缘下沉,并允许用户在边缘服务器上处理任务。然而,在实际应用中,用户请求的任务卸载量和无线信道状态随时间不断变化,同时计算和通信资源受限也对任务卸载和资源分配任务带来了挑战。针对该问题,构建一种资源约束下面向动态环境的系统效用优化模型。该模型中各个终端设备均配备能量收集装置,充分利用外界可再生能源来支持系统处理任务。运用Lyapunov优化理论消除优化模型对不确定信息的依赖,将原依赖未知信息的目标优化问题转化为只依赖当前时间片系统信息的优化问题,使用归约法证明该优化问题为一个NP-hard问题。结合深度强化学习方法设计一种资源约束下的自适应卸载算法LyUO,该算法在系统动态信息未知的情况下实时确定近优任务卸载决策及MEC服务器通信/计算资源分配策略。仿真结果表明,LyUO算法在任务到达率和无线信道状态变化时可使系统中所有设备的任务队列保持稳定,在满足队列长期约束的同时使系统效用较基准算法提升约15%。

  • 人工智能与模式识别
    吴志强, 解庆, 李琳, 刘永坚
    计算机工程. 2024, 50(1): 91-100. https://doi.org/10.19678/j.issn.1000-3428.0066929
    摘要 (752) PDF全文 (827) HTML (64)   可视化   收藏

    已有的图神经网络(GNN)推荐算法大多利用用户-项目交互图的节点编号信息进行训练,学习用户-项目节点的高阶联系去丰富节点表示,但忽略了用户对不同模态信息的偏好,没有利用项目的图片、文本等模态信息,或对于不同模态特征的融合简单相加,不能区分用户对不同模态信息的偏好。针对上述问题,提出多模态融合的GNN推荐模型。首先针对单个模态,结合用户-项目交互二部图构建单模态图网络,在单模态图中学习用户对此模态信息的偏好;然后利用GAT聚合邻居信息,丰富本节点表示,同时根据门控循环单元决定是否聚合邻居信息,达到去噪效果;最后将各个模态图学习到的用户、项目表示通过注意力机制融合得到最终表示并送入预测模块。在MovieLens-20M、H&M两个数据集上的实验结果表明:多模态信息、注意力融合机制能有效提升推荐的准确度,算法模型在Precision@K、Recall@K和NDCG@K 3个指标上相较于基线最优算法均有显著提升;当评估指标K值选取10时,Precision@10、Recall@10和NDCG@10在两个数据集上分别提升了4.67%、2.42%、2.03%和2.49%、5.24%、2.05%。

  • 图形图像处理
    刘洋, 陈俊, 胡诗佳, 赖佳华
    计算机工程. 2023, 49(10): 247-254. https://doi.org/10.19678/j.issn.1000-3428.0065825
    摘要 (1197) PDF全文 (809) HTML (55)   可视化   收藏

    对于同步定位与建图(SLAM)中主流的特征点法,特征匹配是估计相机运动的关键,然而在特征匹配过程中存在图像特征的局部特性、误匹配等问题,成为视觉SLAM的瓶颈。此外,特征点法生成的稀疏地图只能用于定位,无法满足更高层次的需求。针对ORB-SLAM3中ORB特征点匹配效率低且未能生成稠密地图的问题,提出一种改进的ORB-GMS匹配策略并在ORB-SLAM3系统中加入稠密点云构建线程来实现稠密建图。将运动平滑性约束作为特征点运动统计的方法,通过比较特征点邻域内的匹配数量和阈值快速判断当前匹配是否正确,将图片网格化并快速计算网格内特征点的匹配数量,进行相机的位姿估计。根据关键帧与相应位姿构建稠密点云地图,采用外点去除滤波和体素网格滤波减小点云规模。在TUM的RGB-D数据集上的实验结果表明,与ORB-SLAM3相比,该算法可以减少约50%的匹配耗时,同时在匹配数量上平均提升60%,定位平均误差降低32%。此外,与稀疏地图相比,该方法生成易于2次加工的稠密点云地图,扩大算法的应用场景。

  • 图形图像处理
    李嘉新, 侯进, 盛博莹, 周宇航
    计算机工程. 2023, 49(9): 256-264. https://doi.org/10.19678/j.issn.1000-3428.0065935
    摘要 (882) PDF全文 (794) HTML (75)   可视化   收藏

    受遥感图像背景复杂、分辨率高、有效信息量少等因素影响,现有目标检测算法在检测小目标过程中存在错检、漏检等问题。提出基于YOLOv5的遥感小目标检测算法YOLOv5-RS。为有效减少图像中复杂背景和负样本的干扰,构建并行混合注意力模块,采用卷积替换全连接层和移除池化层的操作来优化注意力模块生成权重特征图的过程。为获取和传递更丰富且更具判别性的小目标特征,调整下采样倍数并在模型训练过程中增加小目标信息丰富的浅层特征,同时设计卷积与多头自注意力相结合的特征提取模块,通过对局部和全局信息进行联合表征以突破普通卷积提取的局限性,从而获得更大的感受野。采用EIoU损失函数优化预测框与检测框的回归过程,增强小目标的定位能力。在遥感小目标数据集上进行实验以验证该算法的有效性。实验结果表明,与YOLOv5s相比,该算法在参数量减少20%的情况下平均检测精度提升1.5个百分点,其中,小车类目标的平均检测精度提升3.2个百分点;与EfficientDet、YOLOx、YOLOv7相比,该算法能有效兼顾检测精度和实时性。

  • 图形图像处理
    范文卓, 吴涛, 许俊平, 李庆庆, 张建林, 李美惠, 魏宇星
    计算机工程. 2023, 49(9): 217-225. https://doi.org/10.19678/j.issn.1000-3428.0065689
    摘要 (465) PDF全文 (788) HTML (43)   可视化   收藏

    传统深度学习的图像超分辨率重建网络仅在固定分辨率上提取特征,存在无法综合高级语义信息、只能以特定尺度因子重建图像、泛化能力较弱、网络参数量较大等问题。提出一种基于多分辨率特征融合的任意尺度图像超分辨率重建算法MFSR。在多分辨率特征融合编码阶段设计多分辨率特征提取模块以提取不同分辨率特征, 通过构建双重注意力模块增强网络特征提取能力,使不同分辨率特征之间进行充分交互, 以获取信息丰富的融合特征图。在图像重建阶段利用多层感知机对融合特征图进行解码,实现任意尺度的图像超分辨率重建。实验结果表明,在Set5数据集上分别以尺度因子2、3、4、6、8进行测试,所提算法的峰值信噪比分别为38.62、34.70、32.41、28.96、26.62 dB,模型参数量为0.72×106,在大幅减少参数量的同时能保持重建质量,可以实现任意尺度的图像超分辨率重建,性能优于SRCNN、VDSR、EDSR等主流算法。

  • 开发研究与工程应用
    詹健浩, 甘利鹏, 毕永辉, 曾鹏, 李晓潮
    计算机工程. 2023, 49(10): 280-288, 297. https://doi.org/10.19678/j.issn.1000-3428.0065152
    摘要 (610) PDF全文 (762) HTML (64)   可视化   收藏

    有效利用多模态数据的不同特征能够提高行为识别性能, 其核心问题在于多模态融合, 主要包括在数据层面、特征层面和预测分数层面融合不同模态数据的特征信息。研究在特征和预测分数2个层面通过多教师知识蒸馏的多模态融合方法, 将多模态数据的互补特征迁移到RGB网络, 以及采用不同知识蒸馏损失函数和模态组合的行为识别效果。提出一种基于知识蒸馏的多模态行为识别方法, 通过在特征上采用MSE损失函数、在预测分数上采用KL散度进行知识蒸馏, 并采用原始的骨骼模态和光流模态的教师网络的组合进行多模态融合, 使RGB学生网络同时学习到光流和骨骼教师网络的特征语义信息和预测分布信息, 从而提高识别准确率。实验结果表明, 该方法在常用的多模态数据集NTU RGB+D 60、UTD-MHAD和N-UCLA以及单模态数据集HMDB51上分别达到90.09%、95.12%、97.82%和81.26%的准确率, 在UTD-MHAD数据集上的识别准确率相比于单模态RGB数据分别提升3.49、2.54、3.21和7.34个百分点。

  • 图形图像处理
    祝冰艳, 陈志华, 盛斌
    计算机工程. 2024, 50(1): 216-223. https://doi.org/10.19678/j.issn.1000-3428.0066941
    摘要 (591) PDF全文 (733) HTML (47)   可视化   收藏

    随着遥感技术的快速发展,遥感图像检测被广泛应用于农业、军事、国防安全等众多领域。遥感图像相较于传统图像检测存在诸多难点,如何实现高效精准的遥感图像检测成为该领域的研究热点。针对遥感图像检测中存在的计算复杂度高、正负样本不平衡、目标尺度小等问题,提出一种基于感知增强Swin Transformer的遥感图像检测网络,以提升遥感图像检测性能。在主干网络设计过程中,利用Swin Transformer分层设计和移动窗口的优点有效减小计算复杂度,同时插入空间局部感知块,加强网络对局部相关性和结构信息的提取能力。设计区域分布回归损失为小目标分配更大的权重,解决了正负样本不平衡的问题,同时结合改进的IoU-aware分类损失消除不同分支之间的差距,降低分类和回归损失。在公共遥感数据集DOTA上的多组实验结果表明,该网络获得了78.47%的平均精度均值和10.8帧/s的检测速度,检测性能优于经典的目标检测网络Faster R-CNN、Mask R-CNN以及现有优秀的遥感图像检测网络,并且在各类不同尺度的目标上均具有较好的性能表现。

  • 封面和目录
    计算机工程. 2023, 49(10): 0-0.
  • 人工智能与模式识别
    李奇儒, 耿霞
    计算机工程. 2023, 49(12): 111-120. https://doi.org/10.19678/j.issn.1000-3428.0066348
    摘要 (628) PDF全文 (702) HTML (45)   可视化   收藏

    传统深度Q网络(DQN)算法通过融合深度神经网络和强化学习方法,解决了Q-learning算法在应对复杂环境时出现的维数灾难问题,被广泛应用于移动机器人的路径规划,但传统DQN算法的网络收敛速度较慢,路径规划效果较差,难以在较少的训练回合内获取最优路径。为了解决上述问题,提出一种改进的ERDQN算法。通过记录重复状态出现的频率,利用该频率重新计算Q值,使得在网络训练的过程中一种状态重复出现的次数越多,下一次出现该状态的概率越低,从而提高机器人对环境的探索能力,在一定程度上降低了网络收敛于局部最优的风险,减少了网络收敛的训练回合。根据机器人移动方向和机器人与目标点的距离,重新设计奖励函数。机器人在靠近目标点时能够获得正奖励,远离目标点时能够获得负奖励,并通过当前机器人的移动方向和机器人与目标点的距离调整奖励的绝对值,从而使机器人能够在避开障碍物的前提下规划出更优路径。实验结果表明,与DQN算法相比,ERDQN算法的平均得分提高了18.9%,规划出的路径长度和回合数减少了约20.1%和500。上述结果证明了ERDQN算法能够有效提高网络收敛速度及路径规划性能。

  • 热点与综述
    曹健, 陈怡梅, 李海生, 蔡强
    计算机工程. 2023, 49(10): 1-12. https://doi.org/10.19678/j.issn.1000-3428.0065984
    摘要 (352) PDF全文 (649) HTML (71)   可视化   收藏

    复杂道路场景下的小目标检测能够提高车辆对于周边环境的感知能力,是计算机视觉和智慧交通领域的重要研究方向。随着深度学习技术的发展,将深度学习方法与道路小目标检测相结合能够有效提高检测精度,使车辆快速对周边环境做出反应。从经典及最新的道路小目标检测的研究成果出发,给出小目标的两种定义方式,分析造成道路小目标检测困难的原因,阐述数据增强、多尺度策略、生成超分辨率细节信息、加强上下文信息联系、改进损失函数等5类基于深度学习的提高道路小目标检测精度的优化方法,总结归纳各类方法的核心思想及目前国内外最新的研究进展。介绍常用于道路小目标检测的大型和公共数据集,提供相应的用于评估小目标检测性能的指标,对比分析各类方法在不同数据集上的性能检测结果,指出道路小目标检测研究目前仍存在的问题,并结合这些问题从多个角度对其未来研究方向进行展望。

  • 图形图像处理
    徐春波, 闫娟, 杨慧斌, 王博, 吴晗
    计算机工程. 2023, 49(8): 199-206, 214. https://doi.org/10.19678/j.issn.1000-3428.0065522
    摘要 (550) PDF全文 (642) HTML (70)   可视化   收藏

    目前多数视觉同步定位与建图(VSLAM)算法基于静态场景设计且未考虑场景中的动态物体,然而现实场景中存在的动态物体会造成视觉里程计的特征点误匹配,影响VSLAM系统定位与建图精度,降低其在实际应用中鲁棒性。针对室内动态环境,提出一种基于ORB-SLAM3主体框架的VSLAM算法(RDTS-SLAM)。利用改进的YOLOv5目标检测与语义分割网络对环境中的物体进行精准快速分割,同时将目标检测结果与局部光流法相结合准确识别动态物体,并对动态物体区域内的特征点进行剔除,仅使用静态特征点进行特征点匹配以及后续的定位与建图。在TUM RGB数据集和真实环境数据上的实验结果表明,相较于ORB-SLAM3和RDS-SLAM算法,RDTS-SLAM算法对于walking_rpy序列的轨迹估计均方根误差分别降低了95.38%和86.20%,可以显著提高VSLAM系统在动态环境中的鲁棒性和准确性。

  • 封面和目录
    计算机工程. 2024, 50(1): 0-0.
  • 热点与综述
    陈锦生, 马文臻, 方少峰, 邹自明
    计算机工程. 2023, 49(11): 13-23. https://doi.org/10.19678/j.issn.1000-3428.0066521
    摘要 (275) PDF全文 (626) HTML (53)   可视化   收藏

    子午工程全天空气辉成像仪观测网的逐步完善,积累了海量的气辉图像原始观测数据,但是基于地基气辉观测的大气重力波研究极度依赖人工识别,十分耗时且识别质量难以得到保证,亟需发展一种快速有效的自动识别方法。针对大气重力波标注样本稀缺的问题,在改进Cycle GAN模型的基础上提出一种大气重力波气辉观测数据集扩充算法,仅需标注少量样本即可大幅提升检测算法对大气重力波的识别精度;进一步,利用地基气辉图像识别目标与背景低信噪比的特点,通过对深度学习模型YOLOv5s骨干网络以及边界框预测加以改进,提出一种新的大气重力波智能识别算法。实验结果表明,使用扩增的数据集以及改进的YOLOv5s目标检测算法,在交并比阈值为0.5的情况下平均识别精度达到75.8%,较原始模型提升9.7个百分点,检测速度和平均识别精度均优于对比的主流目标检测算法。

  • 封面和目录
    计算机工程. 2024, 50(3): 0-0.
  • 热点与综述
    李柯泉, 陈燕, 刘佳晨, 牟向伟
    计算机工程. 2022, 48(7): 1-12. https://doi.org/10.19678/j.issn.1000-3428.0062725
    摘要 (849) PDF全文 (594) HTML (354)   可视化   收藏
    CSCD(4)
    传统目标检测算法大多基于滑动窗口和人工特征提取,存在计算复杂度高和在复杂场景下鲁棒性差的缺点。近年来,研究人员将深度学习技术应用于目标检测领域,显著提高了算法性能。相比传统算法,基于深度学习的目标检测算法具有速度快、准确性高和在复杂条件下鲁棒性强的优点。从评价指标、公开数据集、传统算法框架等方面对目标检测任务进行阐述,按照是否存在显式的区域建议和是否定义先验锚框两种分类标准,对现有基于深度学习的目标检测算法进行分类,分别介绍算法的演进路线并总结算法机制、优势、局限性及适用场景。在此基础上,分析对比代表性算法在公开数据集中的表现,并对基于深度学习的目标检测的未来研究方向进行展望。
  • 热点与综述
    杨文忠, 丁甜甜, 康鹏, 卜文秀
    计算机工程. 2023, 49(3): 1-17. https://doi.org/10.19678/j.issn.1000-3428.0064374
    摘要 (753) PDF全文 (594) HTML (97)   可视化   收藏
    基于舆情事件的关键词抽取算法作为舆情监测的基础技术之一,其目的是在不同的舆情事件中抽取出人们关注的核心词汇,从而快速了解新闻内容。随着深度学习的发展,传统的无监督关键词抽取技术和有监督算法中的分类模型已经逐渐被基于深度学习的序列标注模型所替代。梳理无监督关键词抽取的限制性、分类模型在关键词抽取中的优势与不足、以及现有的深度学习对关键词抽取技术发展的帮助,重点分析整体关键词抽取技术的发展中卷积神经网络、循环神经网络等深度学习的关键词抽取方法,并归纳现有方法的优缺点与发展趋势。此外,深度学习虽然在关键词抽取领域发挥了重要的作用,但其自身也存在着依赖大规模带标签样本、训练时间长与复杂度高等缺陷,需要在未来发展中进行解决。为确保分析过程的真实性,利用6个舆情新闻数据集和2个小型数据集进行实验复现,实验结果与文中理论分析一致。在此基础上,对关键词抽取技术及其所面临的困难和挑战进行梳理和分析,并针对现存问题对该领域的发展前景加以展望。
  • 图形图像处理
    蒋心璐, 陈天恩, 王聪, 赵春江
    计算机工程. 2024, 50(1): 232-241. https://doi.org/10.19678/j.issn.1000-3428.0067030
    摘要 (356) PDF全文 (591) HTML (25)   可视化   收藏

    智能化害虫检测是目标检测技术在农业领域的重要应用,可以有效提高害虫测报工作效率和可靠性,保障农作物产量和质量。在诱虫灯、粘虫板等固定式诱捕装置下,图像背景简单、光照条件稳定、害虫特征显著易于提取,害虫检测可以达到较高的准确率,但其应用场景固定,检测范围局限于设备周围,无法适应复杂的田间环境。针对田间环境下图像背景复杂和害虫尺寸小带来的难检和漏检问题,提出一种改进YOLOv5的小目标害虫检测算法Pest-YOLOv5,以提高害虫测报的灵活性。在特征提取网络中增加坐标注意力机制,通过结合空间和通道信息,增强对小目标害虫特征的提取能力,在颈部连接部分使用双向特征金字塔网络结构,通过融合多尺度特征,缓解多次卷积带来的小目标信息丢失问题。在此基础上,使用SIoU和变焦损失函数计算损失值,同时通过实验得到最优分类损失权重系数,使模型更关注分类困难的目标样本。在公开数据集AgriPest上的实验结果表明,Pest-YOLOv5模型mAP0.5和召回率分别为70.4%和67.8%,优于原YOLOv5s模型、SSD和Faster R-CNN等经典目标检测模型。与YOLOv5s模型相比,Pest-YOLOv5模型将mAP0.5、mAP0.50:0.95和召回率分别提高8.1%、7.9%和12.8%,改善了难检和漏检情况。

  • 王一泠, 吴琦, 安军社
    录用日期: 2023-07-05
    CCSDS 高级在轨系统标准定义的空间数据系统分布式架构是提高星载系统整体可靠性的一种有效方案。在我国,作 为该架构典型应用节点的航天器控制终端,通常采用基于 MIPS 架构的龙芯系列处理器。但由于缺失自主可控的轻量化操作 系统,限制了该架构在我国航天领域的部署与应用。轻量型鸿蒙操作系统具有自主可控性、高实时性和低功耗等优点,但其 目前尚未支持国产龙芯处理器的 MIPS 架构。为构建自主可控的航天信息系统技术体系,实现在龙芯控制终端上移植适配国 产鸿蒙轻量型操作系统的目标,通过分析 OpenHarmony 系统 LiteOS-M 轻量实时内核与 MIPS 架构,聚焦硬件抽象层(HAL)、 内核硬件相关部分,设计并实现了一种包括引导系统启动加载、HAL 架构适配、串口驱动、内核裁剪、工具链搭建的移植方 案。为验证移植后系统的基础功能与实时性能指标,基于 MIPS 架构龙芯星载控制终端 LS1J 及 LS1C 硬件平台设计测试用例 并开展实验。实验结果表明:鸿蒙轻量实时系统成功适配 MIPS 架构,能够稳定可靠地运行在龙芯控制终端;系统任务上下 文切换时延为 0.229μs,中断响应时延为 4.73μs,满足实时性系统指标。为我国航空航天瘦终端星载计算机分布式架构的部署 与应用提供了一种解决方案,对构建可靠、安全、自主可控的信息技术体系具有一定参考意义。
  • 图形图像处理
    丰芳宇, 罗晓曙, 蒙志明, 王广宇
    计算机工程. 2023, 49(8): 190-198. https://doi.org/10.19678/j.issn.1000-3428.0065224
    摘要 (297) PDF全文 (564) HTML (70)   可视化   收藏

    针对人脸表情识别中难以提取有效特征,以及类别之间相似性高、易混淆导致人脸表情识别准确率下降的问题,提出一种基于抗混叠残差注意力网络的人脸表情识别方法。针对传统降采样方法易造成表情判别性特征丢失的不足,构建抗混叠残差网络来改善对表情图像的特征提取能力,加强表情特征的表征,从而提取更加有效的人脸表情全局信息。同时,利用改进的通道注意力机制和标签平滑的正则化策略来加强对人脸局部关键表情区域的关注,其中改进的通道注意力专注于区分性较高的表情特征,抑制非表情区域的权重,从而在网络提取的全局信息中定位更加细节的局部表情区域,标签平滑技术则通过增加决策表情类别的信息量对预测概率进行修正,避免过于绝对的预测结果,从而减少相似表情之间的误判。实验结果表明,该方法在人脸表情数据集RAF-DB和FERPlus上的识别准确率分别达到88.14%和89.31%,与DACL、VTFF等其他先进方法相比识别性能更优,相较于原始残差网络有效提升了人脸表情识别准确率和鲁棒性。

  • 计算机系统前沿技术
    方燕飞, 刘齐, 董恩铭, 李雁冰, 过锋, 王谛, 何王全, 漆锋滨
    计算机工程. 2023, 49(12): 10-24. https://doi.org/10.19678/j.issn.1000-3428.0066548
    摘要 (306) PDF全文 (564) HTML (49)   可视化   收藏

    当前众核已成为构建高性能计算(HPC)超级计算机的主流微处理器架构,为HPC领域E级超算提供强大的算力。随着众核处理器片上集成的运算核心数量不断增加,众多核心对存储资源竞争愈加激烈,“访存墙”问题越来越突出。众核片上存储层次是缓解“访存墙”问题并帮助HPC应用更好地发挥众核处理器的计算优势以提升实际应用性能的重要结构。众核片上存储层次的设计对众核片上系统性能、功耗和面积具有重要影响,是众核结构设计中的重要环节,也是业界的研究热点。由于众核芯片发展历史和片上微体系结构设计技术的不同,以及所面向的应用领域需求不同等原因,目前的HPC主流众核片上存储层次结构并不单一,但从横向比较和各处理器自身纵向发展趋势,以及从HPC与数据科学、机器学习不断融合发展带来的应用需求变化来看,SPM+Cache的混合结构最可能成为今后HPC E级超算系统众核处理器片上存储层次设计的主流选择。在面向E级计算的软件和算法层面,开展针对众核存储层次特点的设计与优化,可以帮助HPC应用更好地发挥众核处理器的计算优势,从而有效提升实际应用性能,因此面向众核片上存储层次特点的软件及算法设计与优化技术也是业界的研究热点之一。首先按照不同的组织方式将片上存储层次分为多级Cache结构、SPM结构和SPM+Cache混合结构,并总结分析3种结构的优缺点。然后分析国际主流GPU、同构众核、国产众核等面向主流E级超算系统的众核处理器片上存储层次设计现状与发展趋势。最后从众核LLC管理与缓存一致性协议、SPM空间管理与数据移动优化、SPM+Cache混合结构的全局视角优化等角度综述国际上的存储层次设计与优化相关软硬件技术的研究现状。在此基础上,从软硬件及算法设计等不同角度展望了片上存储层次的未来研究方向。

  • 热点与综述
    董星星, 高继勋, 王晓桐, 李松
    计算机工程. 2023, 49(9): 1-15. https://doi.org/10.19678/j.issn.1000-3428.0064822
    摘要 (281) PDF全文 (511) HTML (66)   可视化   收藏

    空间方向关系作为空间关系不可缺少的组成部分,广泛应用于城市智能交通管控、环境资源检测、防灾减灾等诸多任务,日益成为地理信息系统、空间数据库、人工智能、模式识别等领域研究的热点。综合分析和梳理现有空间方向关系表达与推理模型,针对二维空间对象,从单目标对象、群组目标对象等方面详细介绍目前二维空间方向关系表达与推理模型的研究进展,依据描述对象的不同进行分类,对每类模型的特性及适用范围进行定性分析比较。针对三维空间对象,从点到区域依次分析当前三维空间方向关系表达与推理模型的特点、优势和不足。针对不确定性对象,从确定性空间方向关系模型的扩展模型、基于不确定性集合理论模型2个方面阐述不确定性方向关系模型的研究现状,并对每类模型的优缺点、适用范围等进行分析总结。最后阐明当前工作存在的不足,并从自动推理技术、空间关系的联合表达以及群组目标对象等方面对空间方向关系的未来研究方向进行展望。

  • 人工智能与模式识别
    罗俊, 高清维, 檀怡, 赵大卫, 卢一相, 孙冬
    计算机工程. 2023, 49(11): 49-60. https://doi.org/10.19678/j.issn.1000-3428.0065787
    摘要 (178) PDF全文 (483) HTML (11)   可视化   收藏

    标签特定特征是多标签学习的研究热点,利用标签特征提取解决单个例子存在多个类标签的问题。现有多标签分类研究通常只是简单考虑标签之间的相关性,忽略原始数据之间的局部流形结构,可能会造成分类精度下降。此外,在标签相关性中,特征和标签的结构关系以及标签之间的内在因果关系也往往被忽视。提出一种基于双拉普拉斯正则化与因果推断的多标签学习算法。利用线性回归模型建立多标签分类的基本框架,结合因果学习探索标签之间的内在因果关系,以达到挖掘标签之间本质联系的目的。在此基础上,为充分利用特征与标签之间的结构关系,加入双拉普拉斯正则化以挖掘局部标签关联信息以及有效保持原始数据的局部流形结构。在公共多标签数据集上验证该算法的有效性,实验结果表明,相比LLSF、ML-KNN、LIFT等算法,该算法的汉明损失、平均精度、1次错误率、排序损失、覆盖率、AUC平均提升8.82%、4.98%、9.43%、16.27%、12.19%、3.35%。

  • 热点与综述
    连哲, 殷雁君, 云飞, 智敏
    计算机工程. 2024, 50(3): 16-27. https://doi.org/10.19678/j.issn.1000-3428.0067427
    摘要 (360) PDF全文 (480) HTML (47)   可视化   收藏

    基于深度学习的自然场景文本检测技术已成为计算机视觉和自然语言处理领域的重要研究方向,不仅具有广泛的应用前景,而且也为研究人员提供了一个探索神经网络模型和算法的新平台。首先,介绍自然场景文本检测技术的相关概念、研究背景和发展现状。接着,分析近年来基于深度学习的文本检测方法并将其分为基于检测框、基于分割、基于两者混合、其他4类,阐述4类经典和主流方法的基本思路和主要算法流程,归纳总结不同方法的使用机制、适用场景、优劣点及仿真实验结果和环境设置,明确不同方法之间的关联关系。然后,介绍自然场景文本检测的常用公共数据集和文本检测性能评估方法。最后,指出基于深度学习的自然场景文本检测技术目前所面临的主要挑战并对其未来发展方向进行展望。

  • 开发研究与工程应用
    张欣怡, 张飞, 郝斌, 高鹭, 任晓颖
    计算机工程. 2023, 49(8): 265-274. https://doi.org/10.19678/j.issn.1000-3428.0065701
    摘要 (328) PDF全文 (444) HTML (18)   可视化   收藏

    在公共场合密集人群场景下,由于目标遮挡导致的信息缺失及检测目标较小、分辨率低问题,使得人脸佩戴口罩检测算法的检测效果较差。为提高模型的检测精度和速度,减少硬件占用资源,提出一种基于改进YOLOv5s的口罩佩戴检测算法。将标准卷积和深度可分离卷积相结合替换传统卷积,并进行通道混洗的鬼影混洗卷积,以在保证精度的前提下提升网络速度。将最近邻法上采样替换为轻量级通用上采样算子,充分利用特征语义信息,在改进的YOLOv5s模型Neck层末端添加自适应空间特征融合,可以对不同尺度的特征进行更好的融合,提高网络检测精度,并通过自适应图片采样,缓解数据不均衡的问题,运用马赛克数据增强对小目标进行充分利用。实验结果表明,该算法在AIZOO数据集上的mAP值达到了93%,比YOLOv5原始模型提升了2个百分点,对于佩戴口罩的人脸检测精度达到了97.7%,优于同等情况下YOLO系列、SSD、RetinaFace的检测效果,同时在GPU上的运行推理速度提升了16.7个百分点,且模型权重文件的内存仅为23.5 MB,适用于实时口罩佩戴检测。

  • 图形图像处理
    崔云轩, 刘桂华, 余东应, 郭中远, 张文凯
    计算机工程. 2022, 48(7): 254-263. https://doi.org/10.19678/j.issn.1000-3428.0062245
    摘要 (336) PDF全文 (443) HTML (47)   可视化   收藏
    多传感器融合的SLAM系统定位精度相比单一传感器的SLAM系统更高,但在低纹理场景或退化场景下的定位精度有待提高。提出一种点线特征融合的激光雷达视觉单目惯导紧耦合SLAM系统(PL2VI-SLAM),其由点线特征融合的视觉惯导系统(PLVIS)和激光雷达惯导系统(LIS)两个子系统组成。通过PLVIS系统实现点线特征的提取与匹配,使用滑动窗口选择性地引入关键帧,并将惯性导航器件与相机紧耦合以解算位姿。LIS系统将多个约束集成到因子图中进行联合优化,其初始化状态可以作为PLVIS的初始猜测,通过扫描匹配实现激光雷达里程计,并将点云深度分别与PLVIS系统的特征点以及特征线进行关联,为视觉特征提供精确的深度值,提升定位精度。此外,两个子系统将联合进行回环检测,并对位姿进行矫正。在jackal、handled以及自制的长走廊数据集上的实验结果表明,与LVI-SAM、VINS-MDNO及LIO-SAM系统相比,该系统的定位精度更高,适用于低纹理场景及退化场景,并能满足实时性要求。
  • 网络空间安全
    刘帅威, 李智, 王国美, 张丽
    计算机工程. 2024, 50(2): 180-187. https://doi.org/10.19678/j.issn.1000-3428.0067077
    摘要 (505) PDF全文 (437) HTML (22)   可视化   收藏

    对抗攻击与防御是计算机安全领域的一个热门研究方向。针对现有基于梯度的对抗样本生成方法可视质量差、基于优化的方法生成效率低的问题,提出基于Transformer和生成对抗网络(GAN)的对抗样本生成算法Trans-GAN。首先利用Transformer强大的视觉表征能力,将其作为重构网络,用于接收干净图像并生成攻击噪声;其次将Transformer重构网络作为生成器,与基于深度卷积网络的鉴别器相结合组成GAN网络架构,提高生成图像的真实性并保证训练的稳定性,同时提出改进的注意力机制Targeted Self-Attention,在训练网络时引入目标标签作为先验知识,指导网络模型学习生成具有特定攻击目标的对抗扰动;最后利用跳转连接将对抗噪声施加在干净样本上,形成对抗样本,攻击目标分类网络。实验结果表明:Trans-GAN算法针对MNIST数据集中2种模型的攻击成功率都达到99.9%以上,针对CIFAR10数据集中2种模型的攻击成功率分别达到96.36%和98.47%,优于目前先进的基于生成式的对抗样本生成方法;相比快速梯度符号法和投影梯度下降法,Trans-GAN算法生成的对抗噪声扰动量更小,形成的对抗样本更加自然,满足人类视觉不易分辨的要求。

  • 计算机系统前沿技术
    叶钧超, 徐聪, 黄尧, 柴志雷
    计算机工程. 2023, 49(12): 35-45. https://doi.org/10.19678/j.issn.1000-3428.0066260
    摘要 (196) PDF全文 (434) HTML (18)   可视化   收藏

    脉冲神经网络作为第三代神经网络,其工作机理与生物大脑更接近,层内连接与反向连接的复杂拓扑结构具有解决复杂问题的潜力。神经元和突触是脉冲神经网络中最基本的计算单元,相比于带泄露积分触发神经元模型,Izhikevich神经元模型能通过模拟出更多的生物脉冲现象来支持更广泛的类脑仿真计算,但Izhikevich神经元模型的计算复杂度更高,基于其搭建的脉冲神经网络存在低性能、高功耗的问题。提出一种基于FPGA的Izhikevich神经元定制计算方法。首先,通过研究脉冲神经网络中Izhikevich神经元各参数的取值范围以及平衡膜电位的相对误差与资源消耗,设计一套混合精度的定点化方案;其次,针对单个神经元,通过平衡神经元更新计算方程的数据路径实现最小化流水;再次,针对整体脉冲神经网络,设计并行度可扩展的计算架构以适应不同规模的FPGA平台;最后,把该定制计算方法用于经典的NEST仿真器加速。实验结果表明,相比于i7-10700 CPU,经典的丘脑外侧膝状核网络模型和液体状态机模型在ZCU102上的性能平均提升2.26和3.02倍,能效比平均提升8.06和10.8倍。

  • 开发研究与工程应用
    孙龙, 张荣芬, 刘宇红, 饶庭漓
    计算机工程. 2023, 49(9): 313-320. https://doi.org/10.19678/j.issn.1000-3428.0065697
    摘要 (338) PDF全文 (432) HTML (17)   可视化   收藏

    针对密集人群场景的口罩佩戴检测面临着监控视角下目标密集、互相遮挡、目标小、人脸透视畸变等难题, 同时,涵盖不规范佩戴口罩场景的公开数据集也较为缺乏。提出一种基于YOLO-v5改进的监控视角下密集人群口罩佩戴检测算法MDDC-YOLO。利用空洞卷积构造多分支感受野模块MRF-C3替换YOLO-v5中常规C3模块,解决密集人群中小目标占比大的问题。使用Repulsion Loss基于样本边界框排斥吸引的原则提高模型抗遮挡能力,并充分利用训练过程中的遮挡正样本。在此基础上, 引入ECA注意力机制进行特征通道最优化选择,并提出基于透视变换的离线数据增强方法, 结合使用更适用于生成更多小目标样本的Mosaic-9数据增强方法,解决监控视角下密集人群口罩佩戴数据集缺乏的问题。实验结果表明,MDDC-YOLO算法相较于YOLO-v5算法mAP提升6.5个百分点,并达到32帧/s的检测速度,满足密集人群口罩佩戴检测的应用需求。

  • 体系结构与软件技术
    杨思驰, 赵荣彩, 韩林, 王洪生
    计算机工程. 2024, 50(2): 206-213. https://doi.org/10.19678/j.issn.1000-3428.0067210
    摘要 (64) PDF全文 (428) HTML (5)   可视化   收藏

    在深度计算器(DCU)中,本地数据共享(LDS)是相较于全局内存延迟更低、带宽更高的关键存储部件。随着异构程序对LDS的使用越来越频繁,LDS访存效率低下成为限制异构程序性能的重要因素。此外,LDS访问过程中存在bank冲突的特性,使LDS的访问应遵循一定原则才能高效利用,当线程间的数据访问呈现重叠的访存特征时,访问向量化指令会因此产生延迟。针对此问题,提出面向DCU的LDS访存向量化优化方法。通过实现连续数据访问的向量化,减少LDS的访问次数,降低访存耗时,由此提高程序访存效率。在此基础上,通过设计访存特征的判断方法,提出能够有效解决数据重叠的LDS访存向量化方法,实现一种面向国产通用加速器的LDS高效访存技术,确保向量化方法对访存效率的有效提升。实验结果表明:在使用LDS的异构程序中,LDS访存向量化实现后程序性能平均提升了22.6%,验证了所提方法的有效性;同时,向量化方法能够实现LDS线程间访存数据重叠问题的优化,使异构程序得到平均30%的性能提升。

  • 热点与综述
    于立, 韩林, 罗有才, 商建东
    计算机工程. 2024, 50(2): 51-58. https://doi.org/10.19678/j.issn.1000-3428.0067536
    摘要 (110) PDF全文 (417) HTML (7)   可视化   收藏

    目前国产自主可控FT-M6678平台上没有对称矩阵特征值求解相关的实现,且平台上现有数学计算库不能很好地满足类似问题求解的需求。面向国产FT-M6678处理器,对对称矩阵特征值求解(SYEV)算法进行实现与优化,完善FT-M6678平台的线性代数计算库。通过对SYEV算法的实现过程以及运行热点的分析,基于FT-M6678平台进行编译优化、访存优化以及向量并行化优化,其中:编译优化是根据不同的编译选项指导编译器对程序优化以达到加速效果;访存优化包括缓存优化以及数据段与程序段的分配优化,用于提高矩阵数据的访存效率;向量并行化优化包括循环展开以及适配FT-M6678平台的单指令多数据流(SIMD)指令并行优化,用于提升程序的计算效率。在FT-M6678平台上对所实现并优化的算法进行正确性验证与优化性能分析,结果表明,算法能够正确通过LAPACK官方测试集测试,并且在FT-M6678平台上的加速效果可达到58.346倍,对比TMS320C6678平台速度可提升2.053倍。

  • 热点与综述
    杜清华, 张凯
    计算机工程. 2022, 48(7): 13-21,28. https://doi.org/10.19678/j.issn.1000-3428.0064163
    摘要 (517) PDF全文 (392) HTML (64)   可视化   收藏
    为了应对复杂的数据分析任务,研究人员设计开发出结合多个平台的跨平台数据处理系统。系统跨平台工作流中算子的平台选择对于系统性能至关重要,因为算子在不同平台上的实现会产生性能间的显著差异。目前多使用基于成本的优化方法来实现跨平台工作流的平台选择,但现有的成本模型由于无法挖掘跨平台工作流的潜在信息而导致成本估计不准确。提出一种高效的跨平台工作流优化方法,采用GGFN模型作为成本模型,以算子特征和工作流特征作为模型输入,利用图注意力机制捕捉有向无环图型跨平台工作流的结构信息和算子邻居节点信息,同时结合门控循环单元记忆算子的运行时序信息,从而实现准确的成本估计。在此基础上,根据跨平台工作流的特点设计算子实现平台的枚举算法,利用基于GGFN的成本模型和延迟贪婪剪枝方法进行枚举操作,为每个算子选择合适的实现平台。实验结果表明,该方法可以将跨平台工作流的执行性能提升3倍,运行时间缩短60%以上。
  • 热点与综述
    吴奇林, 党亚固, 熊山威, 吉旭, 毕可鑫
    计算机工程. 2023, 49(11): 24-29, 39. https://doi.org/10.19678/j.issn.1000-3428.0066181
    摘要 (209) PDF全文 (384) HTML (33)   可视化   收藏

    以学生评教文本情感分析任务作为切入点,针对传统基础深度学习模型特征提取能力不足、循环神经网络训练效率较低以及词向量语义表示不准确等问题,提出基于混合特征网络的学生评教文本情感分类算法。采用轻量级ALBERT预训练模型提取符合当前上下文语境的每个词的动态向量表示,解决传统词向量模型存在的一词多义问题,增强向量语义表示的准确性;混合特征网络通过结合简单循环单元和多尺度局部卷积学习模块以及自注意力层,全面捕捉评教文本全局上下文序列特征和不同尺度下的局部语义信息,提升模型的深层次特征表示能力,自注意力机制通过计算每个分类特征对分类结果的重要程度,识别出对情感识别结果影响较大的关键特征,避免无关特征对结果造成干扰,影响分类性能,将分类向量拼接后由线性层输出评教文本情感分类结果。在真实学生评教文本数据集上的实验结果表明,该模型F1值达到97.8%,高于对比的BERT-BiLSTM、BERT-GRU-ATT等深度学习模型。此外,消融实验结果也证明了各模块的有效性。

  • 图形图像处理
    赵宏, 冯宇博
    计算机工程. 2023, 49(12): 194-204. https://doi.org/10.19678/j.issn.1000-3428.0066520
    摘要 (245) PDF全文 (384) HTML (19)   可视化   收藏

    在交通标志检测任务中,YOLOv5检测算法在复杂的环境和路况下存在漏检、错检及模型参数量过大等问题。为此,提出一种改进的CGS-Ghost YOLO检测模型。YOLOv5在图片输入后使用Focus模块进行下采样,增加较多参数,CGS-Ghost YOLO模型使用StemBlock模块替换Focus模块进行采样,能够在维持精度的同时减少参数,并通过引入坐标注意力机制,强化特征中的语义信息和位置信息,提高模型的特征提取能力。设计SMU激活函数与组归一化相结合的CGS卷积模块,避免训练过程中Batch Size大小对模型所造成的影响,在使用GhostConv减少模型参数的同时,提升模型的检测精度。在此基础上,通过$ \alpha $-CIoU Loss+VFocal Loss损失函数,改善交通标志检测任务中正负样本不平衡的问题,提升模型整体性能,Neck部分使用Bi-FPN双向特征金字塔网络,实现检测目标多尺度特征的有效融合。实验结果表明,改进的CGS-Ghost YOLO模型在交通标志检测数据集TT100K中的平均精度均值达到93.1%,相较于原始模型提高了11.3个百分点,模型参数量相较于原始模型降低了21.2个百分点。此外,该网络模型优化了卷积层及下采样部分,在大幅减少模型参数的同时提高了模型检测精度。

  • 计算机系统前沿技术
    陈逸, 刘博生, 徐永祺, 武继刚
    计算机工程. 2023, 49(12): 1-9. https://doi.org/10.19678/j.issn.1000-3428.0066701
    摘要 (197) PDF全文 (381) HTML (49)   可视化   收藏

    深度卷积神经网络具有模型大、计算复杂度高的特点,难以部署到硬件资源有限的现场可编程门阵列(FPGA)中。混合精度卷积神经网络可在模型大小和准确率之间做出权衡,从而为降低模型内存占用提供有效方案。快速傅里叶变换作为一种快速算法,可将传统空间域卷积神经网络变换至频域,从而有效降低模型计算复杂度。提出一个基于FPGA的8 bit和16 bit混合精度频域卷积神经网络加速器设计。该加速器支持8 bit和16 bit频域卷积的动态配置,并可将8 bit频域乘法运算打包以复用DSP,用来提升计算性能。首先设计一个基于DSP的频域计算单元,支持8 bit和16 bit频域卷积运算,通过打包一对8 bit频域乘法以复用DSP,从而提升吞吐率。然后提出一个映射数据流,该数据流支持8 bit和16 bit计算两种形式,通过数据重用方式最大化减少冗余数据处理和数据搬运操作。最后使用ImageNet数据集,基于ResNet-18与VGG16模型对所设计的加速器进行评估。实验结果表明,该加速器的能效比(GOP与能耗的比值)在ResNet-18和VGG16模型上分别达到29.74和56.73,较频域FPGA加速器提升1.2~6.0倍。

  • 图形图像处理
    李现国, 李滨
    计算机工程. 2023, 49(9): 226-233, 245. https://doi.org/10.19678/j.issn.1000-3428.0065513
    摘要 (230) PDF全文 (368) HTML (35)   可视化   收藏

    卷积神经网络(CNN)单独应用于图像去模糊时感受野受限,Transformer能有效缓解这一问题但计算复杂度随输入图像空间分辨率的增加呈2次方增长。为此,提出一种基于Transformer和多尺度CNN的图像去模糊网络(T-MIMO-UNet)。利用多尺度CNN提取空间特征,并嵌入Transformer全局特性捕获远程像素信息。设计局部增强Transformer模块、局部多头自注意力计算网络和增强前馈网络,采用窗口的方式进行局部逐块多头自注意力计算,通过增加深度可分离卷积层,加强不同窗口之间的信息交互。在GoPro测试数据集上的实验结果表明,T-MIMO-UNet的峰值信噪比相比于MIMO-UNet、DeepDeblur、DeblurGAN、SRN网络分别提升了0.39 dB、2.89 dB、3.42 dB、1.86 dB,参数量相比于MPRNet减少了1/2,能有效解决动态场景下的图像模糊问题。

  • 热点与综述
    杨彬, 王轶彤
    计算机工程. 2023, 49(10): 13-21. https://doi.org/10.19678/j.issn.1000-3428.0065807
    摘要 (226) PDF全文 (361) HTML (34)   可视化   收藏

    异质信息网络往往包含不同类型的节点和关系,丰富的语义信息和复杂的关系对目前异质信息网络的表征学习提出了巨大的挑战。现有多数方法通常使用预定义的元路径来捕获异质的语义信息和结构信息,但成本高、覆盖率低,且不能准确有效地捕获和学习有影响力的高阶邻居节点。提出HIN-HG模型来解决以上问题。HIN-HG通过生成异质信息网络的超邻接图来准确有效地捕获对目标节点有影响力的邻居节点,并使用带有多通道机制的卷积神经网络聚合在不同关系下的不同类型的邻居节点。HIN-HG可以自动地学习不同邻居节点和元路径的权重而无须进行手动指定,同时可以捕获全图范围内和目标节点相似的节点作为高阶邻居,并通过信息传播有效地更新目标节点的表征。在DBLP、ACM和IMDB真实数据集上的实验结果表明,在节点分类任务中,HIN-HG较HAN、GTN、HGSL等前沿的异质信息网络表征学习方法性能更优,Macro-F1和Micro-F1多分类评估指标平均提高5.6和5.7个百分点,提高了节点分类的准确性和有效性。

  • 图形图像处理
    王正家, 胡飞飞, 张成娟, 雷卓, 何涛
    计算机工程. 2024, 50(2): 256-265. https://doi.org/10.19678/j.issn.1000-3428.0067177
    摘要 (105) PDF全文 (354) HTML (7)   可视化   收藏

    现有端到端的立体匹配算法为了减轻显存消耗和计算量而预设固定视差范围,在匹配精度和运行效率上难以平衡。提出一种基于轻量化Transformer的自适应窗口立体匹配算法。利用具有线性复杂度的坐标注意力层对低分辨率特征图进行位置编码,减轻计算量并增强相似特征的辨别力;设计轻量化Transformer特征描述模块,转换上下文相关的特征,并引入可分离多头自注意力层对Transformer进行轻量化改进,降低Transformer的延迟性;用可微匹配层对特征进行匹配,设计自适应窗口匹配细化模块进行亚像素级的匹配细化,在提高匹配精度的同时减少显存消耗;经视差回归后生成无视差范围的视差图。在KITTI2015、KITTI2012和SceneFlow数据集上的对比实验表明,该算法比基于标准Transformer的STTR在匹配效率上快了近4.7倍,具有更快的运行速度和更友好的存储性能;比基于3D卷积的PSMNet误匹配率降低了18%,运行时间快了5倍,实现了更好的速度和精度的平衡。

  • 热点与综述
    王恩旭, 王晓红, 张坤, 张冬雯
    计算机工程. 2023, 49(11): 40-48, 69. https://doi.org/10.19678/j.issn.1000-3428.0066255
    摘要 (205) PDF全文 (343) HTML (23)   可视化   收藏

    针对目前负载预测模型不容易捕获数据时序信息和特征信息的问题,提出一种双重注意力机制的负载预测模型。该模型融合特征注意力机制和时序注意力机制,自适应地挖掘服务器负载的特征信息和时序信息,有效增强网络对特征数据和时序数据的关键信息表达。基于CRITIC方法对服务器各项特征进行加权,计算服务器负载值,从而更加全面和准确地评估服务器下一时刻的负载状态。双重注意力机制网络在长短期记忆网络(LSTM)的基础上引入特征注意力机制和时序注意力机制,以负载值的历史数据为输入对未来时刻服务器的负载值进行预测,有效提高网络对单步预测和多步预测的准确性。在阿里巴巴Cluster-trace-v2018公开数据集上的实验结果表明,双重注意力机制网络相对于LSTM基础的负载预测网络,平均绝对误差和均方误差分别下降了9.2%和16.8%,具有较好的稳定性和准确性。

  • 热点与综述
    李浩阳, 贺小伟, 王宾, 吴昊, 尤琪
    计算机工程. 2024, 50(2): 43-50. https://doi.org/10.19678/j.issn.1000-3428.0066399
    摘要 (373) PDF全文 (341) HTML (17)   可视化   收藏

    负载预测是云计算资源管理中的重要组成部分,准确预测云资源的使用情况可提高云平台性能及防止资源浪费,然而云计算资源使用的动态性和不确定性使得负载预测较为困难,尽管Informer在时序预测领域取得了较好的效果,但未对时间的因果依赖关系加以限制造成未来信息泄露,也未考虑网络深度的增加导致模型性能下降的问题。为解决上述问题,提出一种基于改进Informer的多步负载预测模型(Informer-DCR)。将编码器中各注意力块之间的正则卷积替换为扩张因果卷积,使深层网络中的高层能够接收更大范围的输入信息来提高模型预测精度,并保证时序预测过程的因果性。在编码器中添加残差连接,使网络中低层的输入信息直接传到后续的高层,解决了深层网络退化问题。实验结果表明,Informer-DCR模型在不同预测步长下的平均绝对误差比Informer、时间卷积网络等主流预测模型降低了8.4%~40.0%,并且在训练过程中表现出比Informer更好的收敛性。

  • 热点与综述
    高御尧, 石明全, 秦渝, 陈建平, 周喜, 张鹏
    计算机工程. 2023, 49(9): 43-51. https://doi.org/10.19678/j.issn.1000-3428.0066234
    摘要 (151) PDF全文 (332) HTML (13)   可视化   收藏

    在地面公交运输中,站点客流量数据是公交线网规划最重要的基础数据之一。站点周边兴趣点(POI)的类型、数量以及距离会导致站点客流量出现不同的趋势。神经网络是研究客流预测的常用方案,然而由于POI对客流的影响存在相互独立性,这一重要特征并未在传统全连接神经网络的结构中得以体现,易使预测效果不尽人意。基于POI与客流量关系的特殊性,改进全连接神经网络的基本结构,构建一种特定的非全连接神经网络,利用所有公交站点客流量的历史数据及各类POI分布,实现对站点各时间段的客流量的模拟及预测。模型设定一种连接矩阵实现特定的连接方式,并根据客流量的性质额外赋予部分隐藏层实际意义,构造组合误差传递函数,增强神经网络的可解释性。该模型可以快速收敛至全局最优解,改进传统全连接神经网络的收敛速度慢、拟合效果差、易陷入局部最优解等问题。实验结果表明,该模型单位时间内的客流量预测偏差在50人以内的概率达到88%以上,对比其他常见预测模型均有优质表现,并且能准确模拟每日客流的变化趋势。

  • 封面和目录
    计算机工程. 2021, 47(11): 0-0.
  • 热点与综述
    乔艺萌, 荆一楠, 张寒冰
    计算机工程. 2024, 50(1): 30-38. https://doi.org/10.19678/j.issn.1000-3428.0066743
    摘要 (163) PDF全文 (324) HTML (13)   可视化   收藏

    由于在大规模数据集上执行精确查询耗时较长,因此近似查询处理(AQP)技术常被用于在线分析处理,目的是以较短的交互延迟返回查询结果,并尽可能地降低查询误差。现有的学习型AQP方法与底层数据解耦,将I/O密集型计算转化为CPU密集型计算,但是由于计算资源的限制,该类方法通常基于随机的数据样本进行模型训练,此类训练数据会引起稀有群组缺失问题,导致模型预测准确性不高。针对上述问题,提出一种基于分层样本学习的混合型和积网络模型,并基于该模型设计一种AQP框架。分层样本能够有效避免稀有群组缺失现象,基于该样本训练的模型预测准确性大幅提升。此外,针对数据动态更新的情况,提出一种模型自适应更新策略,使得模型能够及时检测数据偏移现象并自适应地执行更新。实验结果表明,与基于抽样和基于机器学习的AQP方法相比,该模型在真实数据集和合成数据集上的平均相对误差分别约降低18.3%和2.2%,在数据动态更新的场景下,其准确性和查询时延均呈现出良好的稳定性。

  • 开发研究与工程应用
    刘威, 马磊, 李凯, 李蓉
    计算机工程. 2024, 50(2): 337-344. https://doi.org/10.19678/j.issn.1000-3428.0067285
    摘要 (77) PDF全文 (322) HTML (7)   可视化   收藏

    中文医学命名实体识别(CMNER)旨在从中文非结构化医学文本中提取实体。现有的基于字符的CMNER模型没有从不同角度全面考虑汉字的特点,限制了其应用于CMNER的性能。基于此,提出基于多粒度字形增强的中文医学命名实体识别模型。对于输入的句子,结合汉字的字形空间结构和偏旁部首的表示,同时根据相应的领域词典来匹配字符的领域词信息,增强字符的语义和潜在边界信息,使模型获得更好的实体识别能力;通过门控机制整合领域词和汉字的字形多粒度特征,综合考虑汉字的领域信息和汉字底层信息,从而具有更好的感知医学实体的能力。在此基础上,将多粒度字形增强的字符表示输入到双向长短记忆和条件随机场层,分别进行上下文编码和标签解码。实验结果表明,本文模型较于最佳基线模型在IMCS21和CMeEE数据集上的F1值分别提升了1.04%和0.62%。此外,通过消融实验验证了该模型的每个组成部分的有效性,在识别中文医学命名实体时具有较好的识别性能。

  • 热点与综述
    姜百浩, 刘静, 仇大伟, 姜良
    计算机工程. 2024, 50(3): 1-15. https://doi.org/10.19678/j.issn.1000-3428.0067502
    摘要 (192) PDF全文 (318) HTML (23)   可视化   收藏

    深度学习算法在脊柱图像分割中具有学习和自适应能力强、对图像有非线性映射能力等优点,相较于传统分割方法,能更好地提取脊柱图像中的关键信息,并且抑制不相关信息,辅助医生准确定位病灶区域,实现精准、高效分割。从深度学习算法、脊柱疾病类型、图像类型、实验分割结果、性能评估指标等方面,对深度学习在脊柱图像分割中的应用现状进行归纳、总结并加以分析。介绍深度学习模型和脊柱图像分割的背景,从而引出深度学习在脊柱图像分割中的应用;介绍常见的几种脊柱疾病类型,阐述其在图像分割中的难点,并介绍脊柱图像分割中常用的公开数据集、图像分割的方法流程以及图像分割评价指标等要素;结合具体实验总结分析基于卷积神经网络模型、U型网络模型及其改进的模型在椎骨、椎间盘以及脊柱肿瘤图像分割中的应用进展;结合以往的实验结果和当前深度学习模型的研究进展,总结目前临床研究的局限性以及分割效果不足的原因,针对所存在的问题提出相应的解决方法,并对未来的研究和发展进行展望。

  • 图形图像处理
    李晨, 侯进, 李金彪, 陈子锐
    计算机工程. 2022, 48(7): 234-240. https://doi.org/10.19678/j.issn.1000-3428.0061890
    摘要 (201) PDF全文 (317) HTML (39)   可视化   收藏
    红外与可见光图像融合是在复杂环境中获得高质量目标图像的一种有效手段,广泛应用于目标检测、人脸识别等领域。传统的红外与可见光图像融合方法未充分利用图像的关键信息,导致融合图像的视觉效果不佳、背景细节信息丢失。针对该问题,提出基于注意力与残差级联的端到端融合方法。将源图像输入到生成器中,通过层次特征提取模块提取源图像的层次特征,基于U-net连接的解码器融合层次特征并生成初始融合图像。将生成器与输入预融合图像的判别器进行对抗训练,同时利用细节损失函数优化生成器,补充融合图像缺失的信息。此外,在判别器中,采用谱归一化技术提高生成对抗网络训练的稳定性。实验结果表明,该方法的信息熵、标准差、互信息、空间频率分别为7.118 2、46.629 2、14.236 3和20.321,相比FusionGAN、LP、STDFusionNet等融合方法,能够充分提取源图像的信息,所得图像具有较优的视觉效果和图像质量。
  • 封面和目录
    计算机工程. 2021, 47(5): 0-0.
  • 热点与综述
    吴冠荣, 李元祥, 王艺霖, 陆雨寒, 陈秀华
    计算机工程. 2024, 50(3): 36-43. https://doi.org/10.19678/j.issn.1000-3428.0067599
    摘要 (163) PDF全文 (306) HTML (18)   可视化   收藏

    现有小样本分类方法局限于从每轮支持信息中归纳出类内共性,忽略了在迭代过程中类间关联性以及样本本身携带的类别信息。由于金属损伤纹理细微、多变,因此所形成的特征分布类间距离小、类内距离大。因特征分布聚合性差导致小样本分类性能降低且新类泛化性变差,提出一种基于内外双层训练模型架构的小样本金属表面损伤分类方法。内模型在利用度量手段完成元分类任务的同时,引入双模态特征作为外模型特征空间的信号,即在新映射空间下利用类别标签信息有监督地对比不同类别的图像特征、优化特征分布,使类间区分度更大、类内聚合度更高。在训练阶段中外模型反传对比损失,间接加强原有特征空间的表征能力,从而提高内模型的度量水平,提升分类精度。同时,利用类别嵌入作为动态类别中心,可以有效减少小样本问题中的噪声干扰,加强模型泛化性能。在GC10、NEU及APSD 3个常用的金属损伤数据集上的实验结果表明,相比ProtoNet、MatchingNet、RelationNet等主流方法,该方法具有较优的分类精度, 特别是新类别的泛化能力得到大幅提升, 5-way 5-shot设定下分类精度至少提高了5.24、1.39和6.37个百分点,分类错误下降率分别为36.00%、17.94%和66.15%;此外,新类分类精度分别从36.53%、82.43%、31.89%提升至69.12%、91.57%、48.23%。5-way 1-shot设定下分类精度分别至少提高8.34、3.01和4.61个百分点,分类错误下降率分别为28.32%、23.37%和46.57%。