王红雨, 崔明珠, 成莉, 罗威丽, 党 正, 石涵琦, 叶鸿源, 赵锦涛
录用日期: 2026-03-03
针对无人机小目标检测任务中小目标像素少、目标尺度差异大、易受背景干扰等问题,现有方法在特征表达和融合能力上存在不足,难以有效处理复杂背景和小尺度目标。为此,本文提出了一种改进的无人机小目标检测算法——VD-YOLOv11。首先,设计了多尺度特征增强模块(MSFE,Multi-Scale Feature Enhancement),通过引入多尺度上下文信息与边缘细节强化机制,有效增强了模型对微小目标特征的感知能力。其次,提出了多尺度特征融合模块(MSFF,Multi-Scale Feature Fusion),通过整合不同层级的语义与空间信息,有效增强了小目标的特征表示能力,提升了模型在复杂背景与尺度变化场景下的检测精度。同时,构建了感受野注意力检测头(RFAHead,Receptive-Field Attention Head),实现了多层特征之间的动态交互与感受野权重的自适应分配,引入了有效的注意力引导机制,使网络更精准地聚焦于细粒度的小目标检测区域。最后,设计了小目标检测层,并与改进的颈部网络进行融合,在头部引入一个额外的检测头,减小小目标特征的损失,增强网络对小目标的识别能力。实验结果表明,VD-YOLOv11在VisDrone2019数据集上mAP50为42.1%,较基线算法YOLOv11n提升了7.4%,在PDT数据集上mAP50为94.8%,浮点计算量为19.1GFLOPs,模型参数量为3.3M;在检测精度、计算复杂度和模型规模等方面取得了有效平衡,展现出VD-YOLOv11在无人机视角小目标检测任务中的有效性和实用性。