计算机视觉与图形图像处理
汤伟博, 方强, 李沛根, 艾龙金, 熊金红, 夏海廷
针对无人机(UAV)航拍图像存在的检测性能低、遮挡严重、小目标特征提取难度大及模型参数量大的问题, 提出了基于YOLOv8s的RSD-YOLO算法。首先, 设计了感受野注意力(RFA)模块CSP-RFA替代C2f模块, 以提升小目标特征提取能力, 有效应对传统卷积操作对位置变化不敏感的问题。其次, 对主干网络和特征融合网络进行了轻量化处理, 新增了大尺寸特征图检测分支, 并提出了感受野金字塔网络(RFPN), 优化特征流动方向, 增强特征表达能力。再次, 检测头模块经过优化, 将多尺度特征集成至具有多级注意力机制的检测头中, 并替换了损失函数, 提升了模型对小目标的检测性能。最后, 在模型压缩方面, 采用层自适应幅度剪枝(LAMP)算法, 进一步减少了模型的参数量和大小。实验结果表明, 轻量化后的RSD-YOLO在公开数据集VisDrone2019上较基线模型有显著提升, 精度提高了10.0百分点, mAP@0.5提升9.5百分点(增幅24.1%), mAP@0.5∶0.95提高6.9百分点(增幅29.4%)。模型参数量从11.12×106减少至4.05×106(减少63.6%), 计算量从42.7 GFLOPs降至25.5 GFLOPs(减少40%)。此外, 在仅检测遮挡小目标的新数据集上, RSD-YOLO在精度、mAP@0.5、mAP@0.5∶0.95上分别提升了9.1、16.1和10.7百分点。