作者投稿和查稿 主编审稿 专家审稿 编委审稿 远程编辑

计算机工程 ›› 2021, Vol. 47 ›› Issue (3): 256-260,268. doi: 10.19678/j.issn.1000-3428.0056469

• 图形图像处理 • 上一篇    下一篇

Mask R-CNN中特征不平衡问题的全局信息融合方法

文韬, 周稻祥, 李明   

  1. 太原理工大学 大数据学院, 山西 晋中 030600
  • 收稿日期:2019-11-01 修回日期:2020-01-14 发布日期:2020-02-26
  • 作者简介:文韬(1993-),男,硕士研究生,主研方向为深度学习、机器视觉;周稻祥,讲师、博士;李明,教授、博士。
  • 基金资助:
    国家自然科学基金(11771321);山西省科技厅社会发展科技攻关计划(201703D321032)。

Global Information Fusion Method for Feature Imbalance Problem in Mask R-CNN

WEN Tao, ZHOU Daoxiang, LI Ming   

  1. Collage of Data Science, Taiyuan University of Technology, Jinzhong, Shanxi 030600, China
  • Received:2019-11-01 Revised:2020-01-14 Published:2020-02-26

摘要: 特征不平衡问题是影响神经网络检测效率的关键因素。针对Mask R-CNN中的特征不平衡问题,提出一种基于全局特征金字塔网络(GFPN)的信息融合方法。通过将GFPN产生的不同大小特征相融合,生成包含全局语义信息的特征网络,并采用反向过程对原始特征层进行重新标度,从而使得每个特征层均含有全局语义信息。实验结果表明,与原始基于Mask R-CNN的方法相比,该方法的检测精度提升4~6个百分点,而检测时间仅增加0.112 s。

关键词: 特征不平衡, 全局特征金字塔网络, 语义信息, Mask R-CNN方法, 深度学习

Abstract: The feature imbalance is a key factor affecting detection efficiency of neural networks.To address the feature imbalance in Mask R-CNN,this paper proposes an information fusion method based on Global Feature Pyramid Network(GFPN).By fusing the different features generated by GFPN,the feature network that contains global semantic information is generated.Then the original feature layer is re-scaled by using the reverse process to make each feature layer contained global semantic information.Experimental results show that compared with the original method based on Mask R-CNN,the proposed method improves the detection accuracy by 4 percentage points to 6 percentage points, while the detection time only increases by 0.112 s.

Key words: feature imbalance, Global Feature Pyramid Network(GFPN), semantic information, Mask R-CNN method, deep learning

中图分类号: