作者投稿和查稿 主编审稿 专家审稿 编委审稿 远程编辑

阅读排行

  • 一年内发表的文章
  • 两年内
  • 三年内
  • 全部
Please wait a minute...
  • 全选
    |
  • 图形图像处理
    刘洋, 陈俊, 胡诗佳, 赖佳华
    计算机工程. 2023, 49(10): 247-254. https://doi.org/10.19678/j.issn.1000-3428.0065825
    摘要 (811) PDF全文 (307) HTML (37)   可视化   收藏

    对于同步定位与建图(SLAM)中主流的特征点法,特征匹配是估计相机运动的关键,然而在特征匹配过程中存在图像特征的局部特性、误匹配等问题,成为视觉SLAM的瓶颈。此外,特征点法生成的稀疏地图只能用于定位,无法满足更高层次的需求。针对ORB-SLAM3中ORB特征点匹配效率低且未能生成稠密地图的问题,提出一种改进的ORB-GMS匹配策略并在ORB-SLAM3系统中加入稠密点云构建线程来实现稠密建图。将运动平滑性约束作为特征点运动统计的方法,通过比较特征点邻域内的匹配数量和阈值快速判断当前匹配是否正确,将图片网格化并快速计算网格内特征点的匹配数量,进行相机的位姿估计。根据关键帧与相应位姿构建稠密点云地图,采用外点去除滤波和体素网格滤波减小点云规模。在TUM的RGB-D数据集上的实验结果表明,与ORB-SLAM3相比,该算法可以减少约50%的匹配耗时,同时在匹配数量上平均提升60%,定位平均误差降低32%。此外,与稀疏地图相比,该方法生成易于2次加工的稠密点云地图,扩大算法的应用场景。

  • 热点与综述
    杨文忠, 丁甜甜, 康鹏, 卜文秀
    计算机工程. 2023, 49(3): 1-17. https://doi.org/10.19678/j.issn.1000-3428.0064374
    摘要 (704) PDF全文 (468) HTML (90)   可视化   收藏
    基于舆情事件的关键词抽取算法作为舆情监测的基础技术之一,其目的是在不同的舆情事件中抽取出人们关注的核心词汇,从而快速了解新闻内容。随着深度学习的发展,传统的无监督关键词抽取技术和有监督算法中的分类模型已经逐渐被基于深度学习的序列标注模型所替代。梳理无监督关键词抽取的限制性、分类模型在关键词抽取中的优势与不足、以及现有的深度学习对关键词抽取技术发展的帮助,重点分析整体关键词抽取技术的发展中卷积神经网络、循环神经网络等深度学习的关键词抽取方法,并归纳现有方法的优缺点与发展趋势。此外,深度学习虽然在关键词抽取领域发挥了重要的作用,但其自身也存在着依赖大规模带标签样本、训练时间长与复杂度高等缺陷,需要在未来发展中进行解决。为确保分析过程的真实性,利用6个舆情新闻数据集和2个小型数据集进行实验复现,实验结果与文中理论分析一致。在此基础上,对关键词抽取技术及其所面临的困难和挑战进行梳理和分析,并针对现存问题对该领域的发展前景加以展望。
  • 图形图像处理
    李嘉新, 侯进, 盛博莹, 周宇航
    计算机工程. 2023, 49(9): 256-264. https://doi.org/10.19678/j.issn.1000-3428.0065935
    摘要 (555) PDF全文 (257) HTML (30)   可视化   收藏

    受遥感图像背景复杂、分辨率高、有效信息量少等因素影响,现有目标检测算法在检测小目标过程中存在错检、漏检等问题。提出基于YOLOv5的遥感小目标检测算法YOLOv5-RS。为有效减少图像中复杂背景和负样本的干扰,构建并行混合注意力模块,采用卷积替换全连接层和移除池化层的操作来优化注意力模块生成权重特征图的过程。为获取和传递更丰富且更具判别性的小目标特征,调整下采样倍数并在模型训练过程中增加小目标信息丰富的浅层特征,同时设计卷积与多头自注意力相结合的特征提取模块,通过对局部和全局信息进行联合表征以突破普通卷积提取的局限性,从而获得更大的感受野。采用EIoU损失函数优化预测框与检测框的回归过程,增强小目标的定位能力。在遥感小目标数据集上进行实验以验证该算法的有效性。实验结果表明,与YOLOv5s相比,该算法在参数量减少20%的情况下平均检测精度提升1.5个百分点,其中,小车类目标的平均检测精度提升3.2个百分点;与EfficientDet、YOLOx、YOLOv7相比,该算法能有效兼顾检测精度和实时性。

  • 开发研究与工程应用
    詹健浩, 甘利鹏, 毕永辉, 曾鹏, 李晓潮
    计算机工程. 2023, 49(10): 280-288, 297. https://doi.org/10.19678/j.issn.1000-3428.0065152
    摘要 (501) PDF全文 (390) HTML (46)   可视化   收藏

    有效利用多模态数据的不同特征能够提高行为识别性能, 其核心问题在于多模态融合, 主要包括在数据层面、特征层面和预测分数层面融合不同模态数据的特征信息。研究在特征和预测分数2个层面通过多教师知识蒸馏的多模态融合方法, 将多模态数据的互补特征迁移到RGB网络, 以及采用不同知识蒸馏损失函数和模态组合的行为识别效果。提出一种基于知识蒸馏的多模态行为识别方法, 通过在特征上采用MSE损失函数、在预测分数上采用KL散度进行知识蒸馏, 并采用原始的骨骼模态和光流模态的教师网络的组合进行多模态融合, 使RGB学生网络同时学习到光流和骨骼教师网络的特征语义信息和预测分布信息, 从而提高识别准确率。实验结果表明, 该方法在常用的多模态数据集NTU RGB+D 60、UTD-MHAD和N-UCLA以及单模态数据集HMDB51上分别达到90.09%、95.12%、97.82%和81.26%的准确率, 在UTD-MHAD数据集上的识别准确率相比于单模态RGB数据分别提升3.49、2.54、3.21和7.34个百分点。

  • 图形图像处理
    徐春波, 闫娟, 杨慧斌, 王博, 吴晗
    计算机工程. 2023, 49(8): 199-206, 214. https://doi.org/10.19678/j.issn.1000-3428.0065522
    摘要 (417) PDF全文 (303) HTML (52)   可视化   收藏

    目前多数视觉同步定位与建图(VSLAM)算法基于静态场景设计且未考虑场景中的动态物体,然而现实场景中存在的动态物体会造成视觉里程计的特征点误匹配,影响VSLAM系统定位与建图精度,降低其在实际应用中鲁棒性。针对室内动态环境,提出一种基于ORB-SLAM3主体框架的VSLAM算法(RDTS-SLAM)。利用改进的YOLOv5目标检测与语义分割网络对环境中的物体进行精准快速分割,同时将目标检测结果与局部光流法相结合准确识别动态物体,并对动态物体区域内的特征点进行剔除,仅使用静态特征点进行特征点匹配以及后续的定位与建图。在TUM RGB数据集和真实环境数据上的实验结果表明,相较于ORB-SLAM3和RDS-SLAM算法,RDTS-SLAM算法对于walking_rpy序列的轨迹估计均方根误差分别降低了95.38%和86.20%,可以显著提高VSLAM系统在动态环境中的鲁棒性和准确性。

  • 图形图像处理
    范文卓, 吴涛, 许俊平, 李庆庆, 张建林, 李美惠, 魏宇星
    计算机工程. 2023, 49(9): 217-225. https://doi.org/10.19678/j.issn.1000-3428.0065689
    摘要 (398) PDF全文 (271) HTML (31)   可视化   收藏

    传统深度学习的图像超分辨率重建网络仅在固定分辨率上提取特征,存在无法综合高级语义信息、只能以特定尺度因子重建图像、泛化能力较弱、网络参数量较大等问题。提出一种基于多分辨率特征融合的任意尺度图像超分辨率重建算法MFSR。在多分辨率特征融合编码阶段设计多分辨率特征提取模块以提取不同分辨率特征, 通过构建双重注意力模块增强网络特征提取能力,使不同分辨率特征之间进行充分交互, 以获取信息丰富的融合特征图。在图像重建阶段利用多层感知机对融合特征图进行解码,实现任意尺度的图像超分辨率重建。实验结果表明,在Set5数据集上分别以尺度因子2、3、4、6、8进行测试,所提算法的峰值信噪比分别为38.62、34.70、32.41、28.96、26.62 dB,模型参数量为0.72×106,在大幅减少参数量的同时能保持重建质量,可以实现任意尺度的图像超分辨率重建,性能优于SRCNN、VDSR、EDSR等主流算法。

  • 李奇儒, 耿霞
    录用日期: 2023-03-10
    DQN算法通过融合深度神经网络和强化学习方法,解决了Q-learning算法在应对复杂环境时出现的“维数灾难”问题,因此被广泛应用于移动机器人的路径规划中。但传统DQN算法的网络收敛速度较慢,路径规划的效果较差,往往难以在较短的训练回合内获取最优路径。为了解决上述问题,本文提出了一种改进的ERDQN算法。首先,通过记录重复状态出现的频率,利用该频率重新计算Q值,使得在网络训练的过程中一种状态重复出现的次数越多,下次出现该状态的概率就越低,从而提高机器人对环境的探索能力,在一定程度上降低了网络收敛于局部最优的风险,减少网络收敛的训练回合。其次,根据机器人移动方向和与目标点的距离,重新设计了奖励函数。机器人在靠近目标点时能够获得正奖励,远离目标点时能够获得负奖励,并通过当前机器人的移动方向和机器人与目标点的距离调整奖励的绝对值大小。从而使机器人能够在避开障碍物的前提下规划出更优的路径。实验结果显示,ERDQN相较于DQN算法,平均得分提高了18.9%,规划出的路径长度减少了20.1%,收敛回合减少了约500回合。由此证明,相比于传统DQN算法,该算法不仅能够有效提高网络收敛的速度,而且在路径规划的性能上也有一定提升。
  • 热点与综述
    曹健, 陈怡梅, 李海生, 蔡强
    计算机工程. 2023, 49(10): 1-12. https://doi.org/10.19678/j.issn.1000-3428.0065984
    摘要 (272) PDF全文 (311) HTML (50)   可视化   收藏

    复杂道路场景下的小目标检测能够提高车辆对于周边环境的感知能力,是计算机视觉和智慧交通领域的重要研究方向。随着深度学习技术的发展,将深度学习方法与道路小目标检测相结合能够有效提高检测精度,使车辆快速对周边环境做出反应。从经典及最新的道路小目标检测的研究成果出发,给出小目标的两种定义方式,分析造成道路小目标检测困难的原因,阐述数据增强、多尺度策略、生成超分辨率细节信息、加强上下文信息联系、改进损失函数等5类基于深度学习的提高道路小目标检测精度的优化方法,总结归纳各类方法的核心思想及目前国内外最新的研究进展。介绍常用于道路小目标检测的大型和公共数据集,提供相应的用于评估小目标检测性能的指标,对比分析各类方法在不同数据集上的性能检测结果,指出道路小目标检测研究目前仍存在的问题,并结合这些问题从多个角度对其未来研究方向进行展望。

  • 图形图像处理
    丰芳宇, 罗晓曙, 蒙志明, 王广宇
    计算机工程. 2023, 49(8): 190-198. https://doi.org/10.19678/j.issn.1000-3428.0065224
    摘要 (266) PDF全文 (274) HTML (61)   可视化   收藏

    针对人脸表情识别中难以提取有效特征,以及类别之间相似性高、易混淆导致人脸表情识别准确率下降的问题,提出一种基于抗混叠残差注意力网络的人脸表情识别方法。针对传统降采样方法易造成表情判别性特征丢失的不足,构建抗混叠残差网络来改善对表情图像的特征提取能力,加强表情特征的表征,从而提取更加有效的人脸表情全局信息。同时,利用改进的通道注意力机制和标签平滑的正则化策略来加强对人脸局部关键表情区域的关注,其中改进的通道注意力专注于区分性较高的表情特征,抑制非表情区域的权重,从而在网络提取的全局信息中定位更加细节的局部表情区域,标签平滑技术则通过增加决策表情类别的信息量对预测概率进行修正,避免过于绝对的预测结果,从而减少相似表情之间的误判。实验结果表明,该方法在人脸表情数据集RAF-DB和FERPlus上的识别准确率分别达到88.14%和89.31%,与DACL、VTFF等其他先进方法相比识别性能更优,相较于原始残差网络有效提升了人脸表情识别准确率和鲁棒性。

  • 开发研究与工程应用
    张欣怡, 张飞, 郝斌, 高鹭, 任晓颖
    计算机工程. 2023, 49(8): 265-274. https://doi.org/10.19678/j.issn.1000-3428.0065701
    摘要 (260) PDF全文 (165) HTML (8)   可视化   收藏

    在公共场合密集人群场景下,由于目标遮挡导致的信息缺失及检测目标较小、分辨率低问题,使得人脸佩戴口罩检测算法的检测效果较差。为提高模型的检测精度和速度,减少硬件占用资源,提出一种基于改进YOLOv5s的口罩佩戴检测算法。将标准卷积和深度可分离卷积相结合替换传统卷积,并进行通道混洗的鬼影混洗卷积,以在保证精度的前提下提升网络速度。将最近邻法上采样替换为轻量级通用上采样算子,充分利用特征语义信息,在改进的YOLOv5s模型Neck层末端添加自适应空间特征融合,可以对不同尺度的特征进行更好的融合,提高网络检测精度,并通过自适应图片采样,缓解数据不均衡的问题,运用马赛克数据增强对小目标进行充分利用。实验结果表明,该算法在AIZOO数据集上的mAP值达到了93%,比YOLOv5原始模型提升了2个百分点,对于佩戴口罩的人脸检测精度达到了97.7%,优于同等情况下YOLO系列、SSD、RetinaFace的检测效果,同时在GPU上的运行推理速度提升了16.7个百分点,且模型权重文件的内存仅为23.5 MB,适用于实时口罩佩戴检测。

  • 图形图像处理
    李建威, 吕晓琪, 谷宇
    计算机工程. 2023, 49(10): 239-246, 254. https://doi.org/10.19678/j.issn.1000-3428.0066050
    摘要 (232) PDF全文 (112) HTML (6)   可视化   收藏

    皮肤癌是最致命的癌症之一,对皮肤镜图像进行精确分类尤为关键,然而现有的皮肤镜图像存在形态复杂、样本数量较少的问题,导致现有的自动分类方法难以提取图像特征信息,误判率较高。提出一种改进ConvNeXt的方法,并构建SE-SimAM-ConvNeXt模型。以ConvNeXt为基础网络,加入SimAM无参注意力模块,提升网络的特征提取能力,并在基础网络中引入通道注意力机制,增强ConvNeXt对潜在关键特征的挖掘能力。在训练初始时加入预热机制Cosine Warmup,在该过程中使用余弦函数值进行学习率的衰减,进一步加速ConvNeXt的收敛,提高ConvNeXt模型的分类能力。在HAM10000皮肤数据集上的实验结果表明,该模型的分类准确率、精确度、召回率、特异性分别为92.9%、85.3%、78.0%、97.5%,具有较好的皮肤镜图像分类能力,对皮肤癌病变的辅助诊断有一定程度的应用价值,可帮助皮肤科医生对皮肤癌做进一步的诊断。

  • 热点与综述
    董星星, 高继勋, 王晓桐, 李松
    计算机工程. 2023, 49(9): 1-15. https://doi.org/10.19678/j.issn.1000-3428.0064822
    摘要 (229) PDF全文 (312) HTML (49)   可视化   收藏

    空间方向关系作为空间关系不可缺少的组成部分,广泛应用于城市智能交通管控、环境资源检测、防灾减灾等诸多任务,日益成为地理信息系统、空间数据库、人工智能、模式识别等领域研究的热点。综合分析和梳理现有空间方向关系表达与推理模型,针对二维空间对象,从单目标对象、群组目标对象等方面详细介绍目前二维空间方向关系表达与推理模型的研究进展,依据描述对象的不同进行分类,对每类模型的特性及适用范围进行定性分析比较。针对三维空间对象,从点到区域依次分析当前三维空间方向关系表达与推理模型的特点、优势和不足。针对不确定性对象,从确定性空间方向关系模型的扩展模型、基于不确定性集合理论模型2个方面阐述不确定性方向关系模型的研究现状,并对每类模型的优缺点、适用范围等进行分析总结。最后阐明当前工作存在的不足,并从自动推理技术、空间关系的联合表达以及群组目标对象等方面对空间方向关系的未来研究方向进行展望。

  • 人工智能与模式识别
    冉丈杰, 孙林夫, 邹益胜, 马玉麟
    计算机工程. 2023, 49(9): 52-59. https://doi.org/10.19678/j.issn.1000-3428.0065745
    摘要 (219) PDF全文 (108) HTML (13)   可视化   收藏

    现实世界中的知识图谱由大量事实三元组构成,其中通常包含许多出现次数很少的小样本关系,面向这些小样本关系补全知识图谱中缺失的三元组是一项具有挑战性的工作。针对现有小样本知识图谱补全模型中普遍存在的小样本关系表示无法有效提取问题,提出一种基于关系学习网络的小样本知识图谱补全模型。考虑关系的相关性,对参考和查询三元组进行邻域聚合编码,获得增强的实体嵌入表示。基于融合Transformer编码器与长短期记忆神经网络的结构,将三元组的关系表示进行编码输出。利用注意力机制得出查询关系与动态参考关系的语义相似性,并结合平移模型的假设对查询三元组成立的可能性进行综合打分。实验结果表明,该模型通过融合路径发现与上下文语义有效提取了小样本关系的细粒度语义,在小样本链接预测任务中,相较于基线模型中评价指标的最优值平均提升了9.5个百分点。

  • 热点与综述
    刘金硕, 王代辰, 邓娟, 王丽娜
    计算机工程. 2023, 49(8): 13-19, 28. https://doi.org/10.19678/j.issn.1000-3428.0067003
    摘要 (216) PDF全文 (130) HTML (26)   可视化   收藏

    目前已有的网络不良信息分类方法大多忽略了数据不平衡、数据存在长尾分布的情况,使得模型在分类时偏向于数据量多的样本,无法很好地识别数据量少的样本,从而导致整体识别精度下降。针对该问题,提出一种用于长尾不良信息数据集的分类方法LTIC。将小样本学习与知识转移策略相结合,使用BERT模型学习头部类的权重,通过专门为小样本学习而提出的Prototyper网络得到头部类的原型,将头尾数据分开处理,从而避免一起训练而导致的数据不平衡问题。学习从原型到权重的映射关系,利用学到的知识将尾部类的原型转换为权重,然后连接头部类权重和尾部类权重得到最终的分类结果。实验结果表明:LTIC方法在Twitter和THUCNews数据集上分别达到82.7%和83.5%的分类准确率,且F1值相较非长尾模型有显著提升,有效提高了模型分类精度;与目前较新的长尾数据集分类方法BNN、OLTR等相比,该方法具有更好的分类效果,平均准确率提升了3%;当新的不良信息类别出现时,LTIC方法只需少量计算就可对其进行预测,准确率达到70%,具有良好的扩展性。

  • 热点与综述
    王畅, 李雷孝, 杨艳艳
    计算机工程. 2023, 49(11): 1-12. https://doi.org/10.19678/j.issn.1000-3428.0066661
    摘要 (204) PDF全文 (236) HTML (36)   可视化   收藏

    基于计算机视觉的疲劳驾驶检测方法具有非侵入性等优点,不会对驾驶行为产生影响,在实际场景中便于应用。随着计算机技术的发展,越来越多的学者研究基于计算机视觉的疲劳驾驶检测方法。疲劳驾驶行为主要体现在面部和肢体上,在计算机视觉领域,面部行为较肢体行为更易获取,因此,基于面部特征的疲劳驾驶检测方法成为疲劳驾驶检测领域的重要研究方向。综合分析多种基于驾驶员面部多特征的疲劳驾驶检测方法,对国内外最新研究成果进行总结。介绍驾驶员面部不同特征在疲劳状态下的具体行为体现,阐述基于面部多特征的疲劳驾驶检测流程。根据面部不同特征对国内外的研究成果进行分类,并整理不同的特征提取方法和状态判别方法。通过不同特征在疲劳状态下产生的各种行为归纳不同方法判别驾驶员疲劳状态时使用的参数。同时,总结当前研究成果中使用面部多特征综合判别疲劳驾驶的方法,分析不同方法间的相同点和差异性。在此基础上,讨论当前基于面部多特征融合的疲劳驾驶检测领域存在的不足,并对该领域的未来研究方向进行展望。

  • 热点与综述
    李鸿鹏, 马博, 杨雅婷, 王磊, 王震, 李晓
    计算机工程. 2023, 49(9): 23-31. https://doi.org/10.19678/j.issn.1000-3428.0066170
    摘要 (203) PDF全文 (111) HTML (12)   可视化   收藏

    事件抽取旨在将非结构化自然语言文本中的事件信息以结构化形式进行识别提取。传统事件抽取方法抽取范围局限于单个句子,且依赖较大规模的标注数据,在篇章级抽取任务与低资源目标领域中表现不佳。现有研究利用提示学习方法,以模板槽位填空方式实现篇章级事件抽取,其缺点在于传统提示模板槽位对论元角色分类准确度不高,容易造成论元角色抽取错误。针对上述问题,提出一种基于槽位语义增强提示学习的篇章级事件抽取方法,在提示学习方法的基础上,将传统事件抽取范式中的论元角色语义信息融入提示模板槽位中,为模型的槽位预测生成环节提供论元类型约束,提高篇章级事件抽取的准确率。通过使预训练语言模型上下游任务保持一致,提高模型的泛化能力,同时以较低成本实现知识迁移,在低资源事件抽取场景下提升模型性能。实验结果表明,相较于表现次优的传统基线方法,在包含59种论元类型的英文事件抽取数据集、包含92种论元类型的中文数据集以及低资源数据规模下,该方法的F1值分别取得了2.6、2.9和4.0个百分点的提升。

  • 封面和目录
    计算机工程. 2023, 49(10): 0-0.
  • 封面和目录
    计算机工程. 2023, 49(4): 0-0.
  • 热点与综述
    杨彬, 王轶彤
    计算机工程. 2023, 49(10): 13-21. https://doi.org/10.19678/j.issn.1000-3428.0065807
    摘要 (178) PDF全文 (170) HTML (26)   可视化   收藏

    异质信息网络往往包含不同类型的节点和关系,丰富的语义信息和复杂的关系对目前异质信息网络的表征学习提出了巨大的挑战。现有多数方法通常使用预定义的元路径来捕获异质的语义信息和结构信息,但成本高、覆盖率低,且不能准确有效地捕获和学习有影响力的高阶邻居节点。提出HIN-HG模型来解决以上问题。HIN-HG通过生成异质信息网络的超邻接图来准确有效地捕获对目标节点有影响力的邻居节点,并使用带有多通道机制的卷积神经网络聚合在不同关系下的不同类型的邻居节点。HIN-HG可以自动地学习不同邻居节点和元路径的权重而无须进行手动指定,同时可以捕获全图范围内和目标节点相似的节点作为高阶邻居,并通过信息传播有效地更新目标节点的表征。在DBLP、ACM和IMDB真实数据集上的实验结果表明,在节点分类任务中,HIN-HG较HAN、GTN、HGSL等前沿的异质信息网络表征学习方法性能更优,Macro-F1和Micro-F1多分类评估指标平均提高5.6和5.7个百分点,提高了节点分类的准确性和有效性。

  • 图形图像处理
    杨谢柳, 门国文, 梁文峰, 王丹, 谢正义, 范慧杰
    计算机工程. 2023, 49(11): 247-256. https://doi.org/10.19678/j.issn.1000-3428.0066610
    摘要 (176) PDF全文 (64) HTML (2)   可视化   收藏

    因水下环境的特殊性,水下光学图像往往存在色偏、模糊、对比度低等退化现象。为恢复颜色正常、清晰的水下图像,大量的水下图像增强复原方法已被提出,但是现有的水下图像增强复原方法主要以提高水下图像的视觉效果为直接目标,对基于深度学习的水下目标检测精度的影响尚不明确。因此,使用14种典型的水下图像增强复原方法和3种典型的基于深度学习的目标检测模型,在URPC2018和URPC2019数据集上从训练集与测试集的域差异、训练集的域数量、训练集的图像数量等方面,详细深入地探讨图像增强复原方法对基于深度学习的目标检测模型精度的影响,并自建数据集进行跨数据集测试。实验结果表明,在训练集和测试集均属同一数据集时,水下图像增强复原方法无论作为图像预处理方法还是数据增强方法,对深度学习目标检测精度的提升都无明显效果,但是在跨数据集检测时,借助水下图像增强复原方法能够大幅提升深度学习目标检测精度,mAP最高可提高13.6个百分点。

  • 图形图像处理
    李现国, 李滨
    计算机工程. 2023, 49(9): 226-233, 245. https://doi.org/10.19678/j.issn.1000-3428.0065513
    摘要 (170) PDF全文 (152) HTML (27)   可视化   收藏

    卷积神经网络(CNN)单独应用于图像去模糊时感受野受限,Transformer能有效缓解这一问题但计算复杂度随输入图像空间分辨率的增加呈2次方增长。为此,提出一种基于Transformer和多尺度CNN的图像去模糊网络(T-MIMO-UNet)。利用多尺度CNN提取空间特征,并嵌入Transformer全局特性捕获远程像素信息。设计局部增强Transformer模块、局部多头自注意力计算网络和增强前馈网络,采用窗口的方式进行局部逐块多头自注意力计算,通过增加深度可分离卷积层,加强不同窗口之间的信息交互。在GoPro测试数据集上的实验结果表明,T-MIMO-UNet的峰值信噪比相比于MIMO-UNet、DeepDeblur、DeblurGAN、SRN网络分别提升了0.39 dB、2.89 dB、3.42 dB、1.86 dB,参数量相比于MPRNet减少了1/2,能有效解决动态场景下的图像模糊问题。

  • 封面和目录
    计算机工程. 2023, 49(3): 0-0.
  • 图形图像处理
    王书朋, 何引弟
    计算机工程. 2023, 49(8): 232-239. https://doi.org/10.19678/j.issn.1000-3428.0065889
    摘要 (166) PDF全文 (104) HTML (11)   可视化   收藏

    在非均匀光照环境下用户获取到的图像往往呈现亮度分布不均、细节丢失等特点。针对现有图像增强算法在处理非均匀光照图像时容易造成局部过度增强或增强不足等问题,提出一种融合特征注意力机制的非均匀光照图像增强算法(ULIEN)。通过学习非线性Gamma函数将非均匀光照图像映射为增强图像,引入亮度注意力图和通道注意力机制分别为图像不同的亮度区域和特征通道分配不同的学习权值,实现不同区域的图像增强。在训练过程中,ULIEN增强网络无需任何参考图像,通过一组无参考损失函数的设计驱动增强网络训练。实验结果表明,经所提算法增强后的图像在主观视觉方面能有效避免细节丢失、伪影、局部过增强或增强不足等问题,在BTMQI、ENIQA、TMQI、UNIQUE客观评价指标上分别可达3.727 0、1.109 6、0.903 0、0.755 7,相较于对照增强算法具有明显优势。

  • 开发研究与工程应用
    胡水
    计算机工程. 2023, 49(9): 303-312. https://doi.org/10.19678/j.issn.1000-3428.0067067
    摘要 (163) PDF全文 (107) HTML (9)   可视化   收藏

    兵棋推演是培养现代军事指挥员的重要方法,将人工智能技术引入到兵棋推演中可简化组织流程,提升推演效益。基于机器学习的智能兵棋常因态势信息过于复杂以及推演本身信息不完整,导致自主决策模型的样本决策效率降低。提出一种基于深度强化学习的智能兵棋推演决策方法。针对智能兵棋推演作战决策的效率问题,在策略网络中引入基准线,并加快策略网络训练,随后进行推导证明,提出加入基准线后策略网络参数的更新方法,分析将兵棋推演环境中的状态-价值函数引入到模型的过程。构建低优势策略-价值网络模型及其训练框架,在传统策略-价值网络下用于兵棋推演,结合战场态势感知方法对模型进行构建。实验结果表明,在近似符合军事作战规则的兵棋作战实验环境中,将传统策略-价值网络和低优势策略-价值网络进行对比训练,在400次的自博弈训练中,低优势策略-价值网络模型的损失值从5.3下降到2.3,且收敛速度优于传统策略-价值网络,低优势策略-价值网络模型的KL散度在训练过程中趋近于0。

  • 热点与综述
    陈锦生, 马文臻, 方少峰, 邹自明
    计算机工程. 2023, 49(11): 13-23. https://doi.org/10.19678/j.issn.1000-3428.0066521
    摘要 (161) PDF全文 (128) HTML (19)   可视化   收藏

    子午工程全天空气辉成像仪观测网的逐步完善,积累了海量的气辉图像原始观测数据,但是基于地基气辉观测的大气重力波研究极度依赖人工识别,十分耗时且识别质量难以得到保证,亟需发展一种快速有效的自动识别方法。针对大气重力波标注样本稀缺的问题,在改进Cycle GAN模型的基础上提出一种大气重力波气辉观测数据集扩充算法,仅需标注少量样本即可大幅提升检测算法对大气重力波的识别精度;进一步,利用地基气辉图像识别目标与背景低信噪比的特点,通过对深度学习模型YOLOv5s骨干网络以及边界框预测加以改进,提出一种新的大气重力波智能识别算法。实验结果表明,使用扩增的数据集以及改进的YOLOv5s目标检测算法,在交并比阈值为0.5的情况下平均识别精度达到75.8%,较原始模型提升9.7个百分点,检测速度和平均识别精度均优于对比的主流目标检测算法。

  • 开发研究与工程应用
    闫兴亚, 匡娅茜, 白光睿, 李月
    计算机工程. 2023, 49(7): 251-258. https://doi.org/10.19678/j.issn.1000-3428.0065369
    摘要 (160) PDF全文 (103) HTML (25)   可视化   收藏

    学生课堂行为动作能够直接反映课堂质量,通过人工智能和大数据对课堂行为进行分析和评估,有助于提高教学质量。传统的学生课堂行为识别方法通过老师直接观察学生状态,或者是课后通过监控视频进行分析,该课堂行为识别方法耗时耗力且识别率较低,难以实时反映课堂以及考试中存在的问题。提出基于深度学习的姿态识别方法BetaPose。采用数据增强技术提高后续检测模型的鲁棒性,通过改进的YOLOv5目标检测算法得到人体检测框,并基于MobileNetV3模型设计轻量级姿态识别模型,提高在拥挤场景下的姿态识别准确率,将得到的人体关键点图输入到线性分类器中,获得最终行为结果,有效提高模型的建模和表达能力。实验结果表明,所提轻量级姿态识别方法BetaPose对人体各个部位的平均识别准确率最高可达82.6%,在简易和拥挤场景下对各种行为的识别率分别达到91%和85%以上,能够有效识别课堂的多种行为。

  • 热点与综述
    王群, 李馥娟, 倪雪莉, 夏玲玲, 梁广俊
    计算机工程. 2023, 49(8): 1-12. https://doi.org/10.19678/j.issn.1000-3428.0065926
    摘要 (160) PDF全文 (117) HTML (27)   可视化   收藏

    区块链借助于密码学、共识算法、激励机制、点对点网络、分布式账本、智能合约等关键技术,在没有第三方权威机构参与的互不信任网络环境中,实现了对事务记录的分布式一致性、不可篡改性、可溯源性等功能特性,构成了一种崭新的可信、安全、可编程的网络生态。与此同时,支撑区块链自身功能实现的相关技术及机制也带来了隐私安全问题。将隐私作为个人数据的一个子集进行研究,从而将区块链数据划分为事务数据和区块数据等2种类型,并通过对区块链数据的解构以及对所得信息的关联,分析隐藏在数据中的隐私信息。从数据传输方式和数据结构方面介绍区块链数据构成;在分析区块链数据特点的基础上,综合对隐私的理解、度量、泄露途径等因素,给出区块链隐私的定义,并从身份隐私、数据隐私、网络隐私等方面进行分析;通过对网络安全、密码学安全、跨链操作、共识算法等方面带来的隐私泄露风险的分析,指出区块链隐私威胁存在的挑战和未来研究方向。

  • 热点与综述
    吴奇林, 党亚固, 熊山威, 吉旭, 毕可鑫
    计算机工程. 2023, 49(11): 24-29, 39. https://doi.org/10.19678/j.issn.1000-3428.0066181
    摘要 (158) PDF全文 (157) HTML (20)   可视化   收藏

    以学生评教文本情感分析任务作为切入点,针对传统基础深度学习模型特征提取能力不足、循环神经网络训练效率较低以及词向量语义表示不准确等问题,提出基于混合特征网络的学生评教文本情感分类算法。采用轻量级ALBERT预训练模型提取符合当前上下文语境的每个词的动态向量表示,解决传统词向量模型存在的一词多义问题,增强向量语义表示的准确性;混合特征网络通过结合简单循环单元和多尺度局部卷积学习模块以及自注意力层,全面捕捉评教文本全局上下文序列特征和不同尺度下的局部语义信息,提升模型的深层次特征表示能力,自注意力机制通过计算每个分类特征对分类结果的重要程度,识别出对情感识别结果影响较大的关键特征,避免无关特征对结果造成干扰,影响分类性能,将分类向量拼接后由线性层输出评教文本情感分类结果。在真实学生评教文本数据集上的实验结果表明,该模型F1值达到97.8%,高于对比的BERT-BiLSTM、BERT-GRU-ATT等深度学习模型。此外,消融实验结果也证明了各模块的有效性。

  • 人工智能与模式识别
    邱天晨, 郑小盈, 祝永新, 封松林
    计算机工程. 2023, 49(7): 110-117. https://doi.org/10.19678/j.issn.1000-3428.0064016
    摘要 (157) PDF全文 (101) HTML (7)   可视化   收藏

    在超大规模边缘设备参与的联邦学习场景中,参与方本地数据为非独立同分布,导致总体训练数据不均衡且毒药攻击防御困难。有监督学习中增强数据均衡的多数方法所要求的先验知识与联邦学习的隐私保护原则发生冲突,而针对非独立同分布场景中的毒药攻击,现有的防御算法则过于复杂或侵害数据隐私。提出一种多服务器架构FedFog,其能在不泄露参与方本地数据分布的前提下,对数据分布相似的参与方进行聚类,将非独立同分布的训练数据转换成多个独立同分布的数据子集。基于各聚类中心,全局服务器计算出从各类别数据中提取的特征在全局模型更新时的权重,从而缓解总体训练数据不均衡的负面影响。同时,将毒药攻击防御任务从参与方全集分配至每个聚类内部,从而解决毒药攻击防御问题。实验结果表明:在总体训练数据不均衡的场景中,FedFog的全局模型精度相较FedSGD最多获得了4.2个百分点的提升;在总体数据均衡但1/3的参与方为毒药攻击者的场景中,FedFog的收敛性接近于无毒药攻击场景中的FedSGD。

  • 王欢, 宋丽娟 †, 杜方
    录用日期: 2023-05-25
    多模态数据间交互式任务的涌现对综合利用不同模态的知识提出了高要求, 多模态知识图谱应运而生, 其通过融合不同模态的知识来满足这类任务的需求。然而, 在多模态知识图谱构建过程中,图像实体与文本实体是否指代同一对象尤为重要,这要求对跨模态实体进行实体对齐,如何对中文跨模态实体进行对齐成为关键问题。为了解决这个问题,本文在传统知识图谱的基础上,添加多模态实体,考虑到单双流预训练语言模型各自的局限性,提出了一种基于多模态知识图谱的中文跨模态实体对齐预训练语言模型CCMEA。该模型基于自监督学习方法利用视觉编码器和文本编码器提取视觉特征和文本特征,并通过交叉编码器进行精细建模,最后采用对比学习方法计算图像实体和文本实体的匹配度。实验结果表明,在MUGE和Flickr30k-CN数据集上,CCMEA相较于基线模型Wukong分别提升了3.2%和11.96%,并在自建的TEXTILE数据集上同样实现了具有竞争力的性能,MR达到94.3%。因此,本文提出的方法可以有效对齐中文跨模态实体,并具有较高的准确性和实用性。
  • 封面和目录
    计算机工程. 2023, 49(5): 0-0.
  • 进化和群体智能算法与应用
    费蓉, 马梦阳, 张晓, 黑新宏, 徐庆征, 邱原
    计算机工程. 2023, 49(7): 10-20. https://doi.org/10.19678/j.issn.1000-3428.0066975
    摘要 (149) PDF全文 (123) HTML (34)   可视化   收藏

    轨迹预测和碰撞检测是自动驾驶的关键技术,可以提高自动驾驶系统对周围环境的感知能力,保障自动驾驶系统的安全性。Conv-LSTM模型能够有效处理具有时空相关性的轨迹数据,具有良好的轨迹预测能力,但该模型在交通拥堵、复杂道路等复杂情形下预测性能较差。提出一种基于行驶意图识别的轨迹预测模型。通过基于长短期记忆(LSTM)网络的行驶意图识别模块对车辆的行驶意图进行预测,基于Conv-LSTM构建轨迹预测模块,结合识别的行驶意图信息预测未来轨迹,从而提高轨迹预测的精度和可解释性。引入2种注意力机制对目标对象及其周围车辆的历史轨迹信息进行重要性分析,使模型关注最具有代表性的邻居车辆,并且更好地捕捉不同时间步之间的关系,从而提高模型的预测准确度和稳定性。针对有向包围盒碰撞检测算法执行效率低的问题,提出一种基于混合包围盒的碰撞检测算法,通过最小安全距离和最大冲突距离进行碰撞预判断,避免非冲突情况下有向包围盒的创建和基于分离轴定理的碰撞检测过程,从而提高碰撞检测的效率。在NGSIM数据集上进行实验,结果表明:该模型的均方根误差优于Conv-LSTM、sys-Conv等对比模型,轨迹预测的精度更高;与有向包围盒(OBB)算法、轴对齐包围盒(AABB)算法和AABB-OBB算法相比,基于混合包围盒的碰撞检测算法平均碰撞检测时间分别缩短了64.47%、53.88%和55.47%。

  • 封面和目录
    计算机工程. 2023, 49(8): 0-0.
  • 进化和群体智能算法与应用
    蔡星娟, 郭彦亨, 赵天浩, 张文生
    计算机工程. 2023, 49(7): 1-9. https://doi.org/10.19678/j.issn.1000-3428.0066105
    摘要 (146) PDF全文 (154) HTML (37)   可视化   收藏

    服务部署和任务卸载是边缘计算面临的两大挑战,但目前在边缘环境下都是对任务卸载这一单一问题的求解,较少考虑服务部署问题。由于服务部署与任务卸载是高度耦合的,只考虑其中一个问题具有局限性,会造成资源的浪费及较大的时延,从而影响用户的体验感。此外,传统的进化算法不能同时处理多个单目标或多目标优化任务。为解决上述问题,构建一个多任务多目标模型,将每个优化问题视作一个任务,并针对该模型提出一种改进的基于多因子优化的进化多任务算法,通过引入位置更新策略来增加搜索种群的多样性,并在此基础上设计改进选型交配方法,提高后代个体的质量。仿真实验结果表明,与多目标算法对比,该算法在SP、Span、PD等多个指标上均有较好的表现,明显提高了算法收敛性能,大幅加快了求解速度,整体系统性能提高了11.4%。

  • 热点与综述
    黄保华, 郑慧颖, 屈锡, 陈宁江
    计算机工程. 2023, 49(8): 37-45. https://doi.org/10.19678/j.issn.1000-3428.0064936
    摘要 (143) PDF全文 (96) HTML (7)   可视化   收藏

    联盟链平台上的超级账本Hyperledger Fabric提供了通道机制对数据进行隔离保护,但通道内部节点可随意获取链上数据且存在管理中心化的问题,使得联盟链面临数据泄露、访问权限无法更新等安全问题。为了解决以上问题,提出基于密文-策略属性基加密算法的联盟链高效存储访问控制方案。针对访问策略及节点权限更新问题,创建数据链和属性集链,实现数据链上所有节点的属性更新,利用数据库进行访问策略更新并存储访问策略的历史修改记录。修改Hyperledger Fabric提供的Fabric-CA组件,提高节点属性私钥生成与分发过程中的安全性。设计星际文件系统的存储数据分块优化和数据请求协商机制,并使用SM4算法加密数据,实现数据的高效安全存储。测试结果表明,与TABE-DAC方案相比,该方案的访问控制和数据存储时间分别降低了100~200 ms和1~2 s,在保证较高安全性的同时具有更高的运行效率。

  • 封面和目录
    计算机工程. 2023, 49(11): 0-0.
  • 开发研究与工程应用
    李亚国, 李冠良, 张凯, 晋涛
    计算机工程. 2023, 49(10): 313-320. https://doi.org/10.19678/j.issn.1000-3428.0065868
    摘要 (140) PDF全文 (87) HTML (13)   可视化   收藏

    随着物联网和人工智能(AI)的技术发展及产品在各业务领域的推广,将边缘计算与AI模型集成融合,实现物联网智能化与计算前置化能满足更多的应用场景,但边缘代理设备通常受到硬件资源能力、性能及安全隐私等问题限制,将AI和边缘计算有效融合集成存在较大挑战。在物联网系统中,基于AI对边缘架构进行优化调整,构建具备边缘计算及AI能力的物联网新型智能框架,有效实现将边缘计算和AI集成到物联网系统中。在边端侧AI模型引导阶段,设计私有数据和公共数据的存储策略,有效提高数据安全性;在模型部署阶段,设计可配置压缩比的云端压缩、边端解压缩的部署模式,减少模型大小和传输所需数据流量,实现模型在边端侧的轻量级部署;在模型学习阶段,设计迁移学习和增量学习互补的学习方式,增加边端侧的模型训练及实用能力,提高云-边协作水平。实验结果表明,集成在边端的AI模型在资源占用率不足云模型50%情况下,准确率达到88%,同时训练时间比云模型快5倍以上。

  • 封面和目录
    计算机工程. 2023, 49(1): 0-0.
  • 开发研究与工程应用
    包善书, 车波, 邓林红
    计算机工程. 2023, 49(9): 295-302, 312. https://doi.org/10.19678/j.issn.1000-3428.0065690
    摘要 (135) PDF全文 (54) HTML (2)   可视化   收藏

    针对目前肺音识别中因肺音数据集规模较小所致模型过拟合分类精度低的问题,提出一种基于双源域迁移学习的肺音识别方法。一方面,将音频数据集Audio Set上的预训练模型VGGish网络迁移至肺音识别中,融合高效通道注意力ECA-Net以增强识别能力,然后提取肺音的对数梅尔频率谱特征,使用VGGish网络按照时序学习谱图中的信息,并对VGGish网络输出的特征向量经不同大小和扩张率的一维卷积核进行特征增强,将增强后的特征图输入双向门控循环单元以捕获肺音的时序信息;另一方面,将图像数据集ImageNet上的预训练模型VGG19迁移至肺音识别中,将肺音波形数据转换为谱图的形式输入并训练。将两方面的模型训练后作为特征提取器,融合具有高层语义的特征向量融合并输入集成学习算法CatBoost,实现最终的分类。实验结果表明,该方法对Coswara新冠数据集中肺音识别的特异性、敏感性指标和准确率分别达到80.66%、77.69%和79.18%,对ICBHI-2017数据集中肺音识别的特异性、敏感性指标和ICHBI-score分别达到88.75%、72.04%和80.39%,均优于对比的常见识别方法。

  • 热点与综述
    王恩旭, 王晓红, 张坤, 张冬雯
    计算机工程. 2023, 49(11): 40-48, 69. https://doi.org/10.19678/j.issn.1000-3428.0066255
    摘要 (132) PDF全文 (105) HTML (9)   可视化   收藏

    针对目前负载预测模型不容易捕获数据时序信息和特征信息的问题,提出一种双重注意力机制的负载预测模型。该模型融合特征注意力机制和时序注意力机制,自适应地挖掘服务器负载的特征信息和时序信息,有效增强网络对特征数据和时序数据的关键信息表达。基于CRITIC方法对服务器各项特征进行加权,计算服务器负载值,从而更加全面和准确地评估服务器下一时刻的负载状态。双重注意力机制网络在长短期记忆网络(LSTM)的基础上引入特征注意力机制和时序注意力机制,以负载值的历史数据为输入对未来时刻服务器的负载值进行预测,有效提高网络对单步预测和多步预测的准确性。在阿里巴巴Cluster-trace-v2018公开数据集上的实验结果表明,双重注意力机制网络相对于LSTM基础的负载预测网络,平均绝对误差和均方误差分别下降了9.2%和16.8%,具有较好的稳定性和准确性。

  • 人工智能与模式识别
    张文豪, 廖列法, 王茹霞
    计算机工程. 2023, 49(10): 72-79. https://doi.org/10.19678/j.issn.1000-3428.0066266
    摘要 (131) PDF全文 (73) HTML (10)   可视化   收藏

    近年来的方面级情感分析基本都是单一地进行语义信息或语法信息的挖掘,未建立语义信息和语法信息之间的关联,且已有模型大多都是单一地将词的相对距离或语法距离嵌入模型中,忽略了相对距离和语法距离对方面词的联合影响, 同时未充分考虑单词在依存句法树中的位置关系。建立一种融合句法树多信息学习的方面级情感分析模型MILFST,有针对性地利用不同神经网络的优点进行模型构建,以获得更为丰富的信息。通过双向长短时记忆网络捕捉文本序列的信息,根据依存句法树的树形结构更新序列信息,将相对距离和语法距离位置信息嵌入文本序列中,分别通过卷积神经网络和图卷积网络学习语义信息和语法信息。通过注意力机制实现语义信息和语法信息的优化融合,并将融合后的信息输入Softmax分类器中进行情感极性分类。实验结果表明,在Twitter、Lap14、Res14、Res15、Res16数据集上,MILFST模型的准确率和F1值分别为74.27%和73.14%、77.74%和74.27%、82.50%和74.54%、81.73%和66.15%、89.61%和71.57%,模型中的树形结构有助于对信息的捕获,同时兼顾语法信息与语义信息的学习有利于方面词情感极性判断。

  • 封面和目录
    计算机工程. 2023, 49(7): 0-0.
  • 开发研究与工程应用
    陈露萌, 曹彦彦, 黄民, 谢鑫钢
    计算机工程. 2023, 49(8): 291-301, 309. https://doi.org/10.19678/j.issn.1000-3428.0065025
    摘要 (124) PDF全文 (139) HTML (19)   可视化   收藏

    现有基于图像的火焰检测方法难以兼顾实时性和准确性,且缺乏对小火焰目标精准识别的能力,无法有效应对小火点灭火等应用场景。YOLOv5算法与传统主流算法相比在检测的实时性上有很大优势,为提升火焰检测精度,提出一种基于改进YOLOv5的火焰实时检测方法。针对YOLOv5模型进行改进:在特征提取部分嵌入协同注意力机制模块,在不损失特征信息的情况下减少特征冗余,以帮助模型更精确地定位火焰特征;在特征融合部分增加一个专门针对小火焰目标的检测层,并添加对应的特征提取及特征融合模块,以帮助模型有效获取感受野小于8×8像素的火焰特征;在损失函数的计算部分使用α-CIoU作为新的边界框损失函数,以提升模型的收敛速度和对小数据集的鲁棒性。此外,通过模型预训练和迁移学习的方法对火焰检测模型各层结构的权重参数进行初始化,防止梯度消失,提升训练效果。实验结果表明,改进后的火焰检测模型检测精度为96.6%,较YOLOv5原始模型提升7.4个百分点,并且检测速度达到68帧/s,模型大小仅15.4 MB,在大幅提升精度的基础上能够同时满足消防灭火机器人对火焰检测实时性和轻量化的要求。

  • 热点与综述
    高御尧, 石明全, 秦渝, 陈建平, 周喜, 张鹏
    计算机工程. 2023, 49(9): 43-51. https://doi.org/10.19678/j.issn.1000-3428.0066234
    摘要 (123) PDF全文 (146) HTML (8)   可视化   收藏

    在地面公交运输中,站点客流量数据是公交线网规划最重要的基础数据之一。站点周边兴趣点(POI)的类型、数量以及距离会导致站点客流量出现不同的趋势。神经网络是研究客流预测的常用方案,然而由于POI对客流的影响存在相互独立性,这一重要特征并未在传统全连接神经网络的结构中得以体现,易使预测效果不尽人意。基于POI与客流量关系的特殊性,改进全连接神经网络的基本结构,构建一种特定的非全连接神经网络,利用所有公交站点客流量的历史数据及各类POI分布,实现对站点各时间段的客流量的模拟及预测。模型设定一种连接矩阵实现特定的连接方式,并根据客流量的性质额外赋予部分隐藏层实际意义,构造组合误差传递函数,增强神经网络的可解释性。该模型可以快速收敛至全局最优解,改进传统全连接神经网络的收敛速度慢、拟合效果差、易陷入局部最优解等问题。实验结果表明,该模型单位时间内的客流量预测偏差在50人以内的概率达到88%以上,对比其他常见预测模型均有优质表现,并且能准确模拟每日客流的变化趋势。

  • 开发研究与工程应用
    孙龙, 张荣芬, 刘宇红, 饶庭漓
    计算机工程. 2023, 49(9): 313-320. https://doi.org/10.19678/j.issn.1000-3428.0065697
    摘要 (121) PDF全文 (86) HTML (6)   可视化   收藏

    针对密集人群场景的口罩佩戴检测面临着监控视角下目标密集、互相遮挡、目标小、人脸透视畸变等难题, 同时,涵盖不规范佩戴口罩场景的公开数据集也较为缺乏。提出一种基于YOLO-v5改进的监控视角下密集人群口罩佩戴检测算法MDDC-YOLO。利用空洞卷积构造多分支感受野模块MRF-C3替换YOLO-v5中常规C3模块,解决密集人群中小目标占比大的问题。使用Repulsion Loss基于样本边界框排斥吸引的原则提高模型抗遮挡能力,并充分利用训练过程中的遮挡正样本。在此基础上, 引入ECA注意力机制进行特征通道最优化选择,并提出基于透视变换的离线数据增强方法, 结合使用更适用于生成更多小目标样本的Mosaic-9数据增强方法,解决监控视角下密集人群口罩佩戴数据集缺乏的问题。实验结果表明,MDDC-YOLO算法相较于YOLO-v5算法mAP提升6.5个百分点,并达到32帧/s的检测速度,满足密集人群口罩佩戴检测的应用需求。

  • 开发研究与工程应用
    李嘉豪, 闵卫东, 陈炯缙, 朱梦, 展国伟
    计算机工程. 2023, 49(11): 311-320. https://doi.org/10.19678/j.issn.1000-3428.0066372
    摘要 (121) PDF全文 (64) HTML (7)   可视化   收藏

    交通标志检测在智能交通领域的安全保障上具有重要作用。对于部分外观相似的交通标志在尺度变化下,现有模型难以提取它们之间的细微差异,导致标志被错误分类。此外,在复杂场景下,其他相似物体容易被误检为交通标志。为此,提出一种逐层特征细化检测模型。根据交通标志特点提出分层聚类锚框和分组损失,分层聚类锚框根据目标尺度对数据集分层并通过K-means聚类算法获取各层锚框,更好地适应交通标志灵活的尺度变化,分组损失对外观相似的类别分组并设计损失函数,指导模型学习相似交通标志间的细微差距,从而降低错误分类。在Neck层加入弱语义分割模块和特征细化模块,通过弱语义分割模块学习浅层特征上下文信息,从而分割出可信区域和非可信区域,利用特征细化模块挖掘非可信区域的上下文信息,主动学习并消除造成误检的干扰,从而降低对其他相似物体的误检。弱语义分割模块和特征细化模块结合通道注意力构建逐层细化特征金字塔,实现对多尺度特征的整体优化并提高模型精确率。实验结果表明,该方法在TT100K和GTSDB交通标志数据集上的$ \mathrm{A}{\mathrm{P}}_{50} $指标分别达到97.0%和98.6%。

  • 封面和目录
    计算机工程. 2023, 49(9): 0-0.
  • 人工智能与模式识别
    罗俊, 高清维, 檀怡, 赵大卫, 卢一相, 孙冬
    计算机工程. 2023, 49(11): 49-60. https://doi.org/10.19678/j.issn.1000-3428.0065787
    摘要 (117) PDF全文 (66) HTML (3)   可视化   收藏

    标签特定特征是多标签学习的研究热点,利用标签特征提取解决单个例子存在多个类标签的问题。现有多标签分类研究通常只是简单考虑标签之间的相关性,忽略原始数据之间的局部流形结构,可能会造成分类精度下降。此外,在标签相关性中,特征和标签的结构关系以及标签之间的内在因果关系也往往被忽视。提出一种基于双拉普拉斯正则化与因果推断的多标签学习算法。利用线性回归模型建立多标签分类的基本框架,结合因果学习探索标签之间的内在因果关系,以达到挖掘标签之间本质联系的目的。在此基础上,为充分利用特征与标签之间的结构关系,加入双拉普拉斯正则化以挖掘局部标签关联信息以及有效保持原始数据的局部流形结构。在公共多标签数据集上验证该算法的有效性,实验结果表明,相比LLSF、ML-KNN、LIFT等算法,该算法的汉明损失、平均精度、1次错误率、排序损失、覆盖率、AUC平均提升8.82%、4.98%、9.43%、16.27%、12.19%、3.35%。

  • 开发研究与工程应用
    张子珺, 陈劲松, 钱夕元
    计算机工程. 2023, 49(10): 272-279. https://doi.org/10.19678/j.issn.1000-3428.0066030
    摘要 (116) PDF全文 (58) HTML (0)   可视化   收藏

    书法字骨架保留书法字的结构、形态以及笔画细节,对于评价书法字笔画结构极为重要。为解决现有的骨架提取算法无法获取离线书法图像的动态信息,提出改进条件生成对抗网络的书法字骨架提取算法。为获取长距离上下文信息,将残差结构与分层空洞卷积模块引入条件生成对抗网络,并融合交叉注意力模块,以保证生成骨架的平滑性。使用谱归一化和Leaky ReLU激活函数稳定模型训练,提升书法字骨架提取的完整性,并基于在线手写字数据集,构建伪书法字图像数据集。实验结果表明,该算法在测试数据集中的F1值、联合交并比(IoU)和最小平均距离(AMD)分别为0.678 2、0.515 8和1.450 0,相较于现有骨架提取算法的最优结果,F1值、IoU分别提高了8.2%和8.8%, AMD降低了约0.42,可有效捕获到书法离线图像的动态信息,使骨架特征更具有代表性,在书法字帖图片上表现出较优的泛化能力。同时,消融实验结果验证了分层空洞卷积模块和交叉注意力模块的有效性,可以获得更完整、光滑的字符骨架。

  • 图形图像处理
    苏晓东, 李世洲, 赵佳圆, 亮洪宇, 张玉荣, 徐红岩
    计算机工程. 2023, 49(9): 265-271, 278. https://doi.org/10.19678/j.issn.1000-3428.0065940
    摘要 (115) PDF全文 (106) HTML (20)   可视化   收藏

    针对目标空间复杂度高容易造成小尺度目标丢失和边界分割不连续等问题,借鉴DeepLabv3+网络结构,建立基于多级叠加和注意力机制的图像语义分割模型。在编码器阶段,采用不同尺度的平均池化操作构建多尺度平均池化模块,使用不同扩张率的空洞卷积组成多尺度叠加模块扩大卷积运算的感受野,增强对局部特征的获取能力,并利用由通道和空间组成的注意力机制模块抑制无意义的特征,增强有意义的特征,提高对小尺度目标及局部边界的分割精度。在解码器阶段,通过双线性插值法对特征图进行分辨率恢复,并结合通道维度信息进行像素填充补充特征信息,并使用Softmax激活函数进行语义分割的输出预测。实验结果表明,该模型在PASCAL VOC2012和SUIM公开数据集上的平均交并比分别达到85.6%和60.8%,在整体分割精度和小尺度图像的分割效果上明显优于多数图像语义分割模型。