316.
针对三维点云目标检测中传统的卷积神经网络在特征提取阶段因下采样导致分辨率降低,影响小目标的识别准确性问题,本文提出一种基于Transformer的三维目标检测模型:PillarTNet.该模型首先使用双重注意力融合模块强化特征编码,然后通过区域扩张注意力模块提取特征,保持整个过程伪图像分辨率不变,更有利于小目标的检测,同时引入区域移位机制促进不同区域的信息交流.但是注意力操作会存在大量空体素,可能增加大目标的漏检与误检风险,为此,对检测头采用空体素关注模块以缓解这一问题.在KITTI数据集上的实验结果显示:PillarTNet在确保Car和Cyclist检测精度的同时,Pedestrian的检测在3个难度等级的AP
3D分别达到了62.48%、53.21%和49.57%,且本模型在推理速度和内存需求方面均表现出色,充分验证了PillarTNet的优越性和适应性.… …
相似文献