刘洲峰, 李冰芮, 杨瑞敏, 李春雷, 何媛, 丁淑敏
录用日期: 2024-04-26
基于图像级标签的弱监督语义分割方法可利用少量带有图像级标签的注释对网络进行训练从而减轻注释负担。然而,现有基于类激活映射的方法存在分割区域不完整的问题。为使得最终分割预测结果包含更多前景目标,提出一种基于调制-全局推理的弱监督语义分割方法。在分类网络中首先通过设计空间-通道激活调制模块以提取更完整的目标对象特征,从而避免类激活图过度关注显著性区域;其次,提出全局推理单元模块,可利用该模块捕获特征图中不相交区域和较远区域之间的全局关系以便选出包含更完整的目标对象,从而进一步增强非显著区域的特征;最后,通过设计潜在目标挖掘模块以降低伪标签中的假阴性率,进而提取其中的丢失信息,从而有效缓解初始伪标签中目标区域不完整的问题。在分割网络中通过将分类网络生成的初始预测和伪标签结合并通过非显著区域挖掘模块进一步生成掩蔽伪标签从而提升分割效果。该方法在仅使用图像级标签的情况下,在Pascal VOC 2012 验证集和测试集上的精度分别为69.5%和69.8%,在 MS COCO 2014验证集上的精度为32.8%,同时可有效解决分割区域不完整的问题,且优于已有方法。