一种基于Transformer的路侧LiDAR-相机外参标定方法及系统

    技术2025-01-10  54


    本发明涉及一种用于路侧监控系统中lidar和相机的外参标定方法及系统,特别是利用transformer网络实现的自动化外参标定技术。


    背景技术:

    1、在智能交通系统中,lidar和相机的数据融合在增强交通环境的感知与理解方面发挥着关键作用。特别是在自动驾驶及路侧交通监控系统中,精确的lidar-相机标定成为实现高效数据融合的前提条件。标定主要涉及确定lidar与相机之间的外参,即两者的相对位置与姿态,这对于精确重建三维场景及进行后续的数据处理至关重要。

    2、传统的lidar与相机标定技术主要针对车载系统设计,这类系统中的传感器通常安装在车辆上,面临的挑战主要源于动态环境中的振动与移动。然而,这些传统方法往往不适用于路侧监控场景。在路侧应用中,传感器通常安装在较高的位置,如路灯或交通信号灯上,覆盖面积广泛且观察角度不同,这使得车载系统的标定算法在路侧场景中应用时效果较差,存在以下几方面的具体问题:1)观察视角与距离的差异。路侧传感器的部署位置较高,观测角度较广,与车载系统中传感器的视角和距离有显著差异。这种差异导致在使用传统车载标定方法时,无法准确捕捉到路侧环境的特定特征,从而影响标定的精度和效果。2)环境动态变化的应对。路侧监控系统需面对更为复杂的环境条件,如不同的天气情况、光照变化及日夜交替等。这些因素可能影响传感器数据的质量和一致性,使得基于传统方法的标定结果不够稳定,难以适应快速变化的外部环境。3)大范围监控的挑战。路侧系统需要监控较大范围的交通状况,包括多车道的车流和不同类型的道路用户。这要求标定算法能够在较宽的区域内保持高精度,而传统方法在处理大范围数据时往往会遇到性能瓶颈。4)实时性要求:与车载系统相比,路侧监控系统更加依赖实时数据处理,以便于及时响应各种交通事件和状况。因此,需要标定方法不仅要精确,还要足够快,以支持实时的数据分析和处理。

    3、针对以上问题,现有技术的不足主要表现在以下几个方面:1)算法的适用性。多数现有的标定算法专为车载系统设计,难以直接迁移到具有不同安装高度和观察角度的路侧系统。2)精度与稳定性。传统的标定方法依赖于环境中的特定标志或人工放置的标定板,这在多变的路侧环境中难以实现,且容易受到外界因素的干扰。3)自动化水平。许多标定过程需要人工干预,如特征点的选择和匹配,这限制了标定过程的自动化和效率。

    4、基于上述背景,本发明提出了一种基于transformer的路侧lidar-相机外参标定方法及系统,旨在克服现有技术的限制,提供一种更为精确、稳定且全自动的路侧传感器标定解决方案,特别适用于动态且多变的路侧监控环境。


    技术实现思路

    1、为解决上述技术问题,本发明提供了一种用于路侧监控的lidar和相机外参标定的系统及方法,该系统特别适用于动态和多变的路侧监控环境。

    2、本系统包括lidar和相机两类硬件,系统在路侧计算单元上运行。本系统由特征提取、特征匹配和参数预测模块组成。特征提取模块由lidar和相机两个分支组成。特征提取模块将lidar采集到的点云数据和相机拍摄的图像数据作为输入,输出lidar特征和图像特征。特征匹配模块由相关层和transformer架构组成,将lidar特征和图像特征作为输入,对lidar和图像特征进行细粒度的匹配。最后,参数预测模块将匹配的lidar和相机细粒度特征进行参数回归,对参数进行预测,将输出的参数进行三次迭代细化,最终输出预测的外部参数。

    3、本发明通过以下详细步骤实现高精度的传感器外参标定,所述传感器为lidar和相机,其布设位置如图2所示;

    4、步骤1)数据采集与预处理:11)首先在道路两侧的高点安装lidar和高清相机,以持续收集路侧的交通情况。lidar用于生成环境的三维点云数据,捕捉车辆、行人及其他障碍物的空间位置和形状。相机提供环境的高分辨率图像,捕获道路标志、交通信号及车辆颜色等详细视觉信息。12)收集到的三维点云数据与视觉信息数据通过初步的滤波和噪声去除处理,保证数据质量,为特征提取提供准备。

    5、步骤2)特征提取:使用深度学习模型分别从lidar获取的三维点云数据和高清相机的视觉信息图像中提取特征。21)对于lidar获取的三维点云数据,首先,将lidar点云进行投影得到未校准的lidar投影稀疏深度图。然后,采用点云处理专用的深度网络提取关键的几何特征,如边缘、角点和平面。具体使用预训练并不包含全连接层的resnet18来进行特征提取,将relu切换为leakyrelu作为激活函数。22)对于相机图像,利用预训练的卷积神经网络从图像中提取多层次的视觉特征,包括颜色、纹理和形状信息。这些视觉特征包括但不限于车辆的轮廓、道路标线的位置以及交通信号的状态。首先使用预训练并不包含全连接层的resnet18来进行编码,生成1/2、1/4和1/8输入分辨率的多尺度特征图。这些特征图被统一为相同的尺寸,并依次馈送到参数共享深度解码器以迭代更新逆深度。深度解码器在固定的1/8输入分辨率下工作,通过五个连续的卷积层输出逆深度图。最后,得到具有多尺度深度信息的rgb图像特征。

    6、步骤3)特征融合与匹配:采用相关层和transformer模型来处理步骤2)中提取的lidar和高清相机的特征。该transformer模型通过其自注意力机制,能够识别和强化来自不同传感器数据源的相关特征,并压制不相关或噪声特征。transformer模型在特征融合阶段,不仅比较和对齐单一特征,而且通过深度学习算法学习不同数据源之间的复杂关联,将lidar的空间信息与相机的视觉信息结合,以形成统一的、信息丰富的特征表示。31)使用采用rgb引导的查询初始化模块来从rgb图像中提取特征fquery。该模块由resnet-18和自适应池化层组成,用于生成初始姿态查询。查询q来自初始姿态查询fquery。32)对于步骤2)中的lidar和相机图像特征,采用相关层来计算将相机图像特征图中的像素与其相应的lidar特征图相关联的匹配成本,它被展平并用作transformer编码器的输入键k和值v。33)使用多层感知器(mlp)将位置嵌入为位置编码,并按元素添加到关键特征。

    7、步骤4)外参计算与优化:在特征成功融合后,通过一个前馈神经网络进行外参的计算。前馈神经网络结构专门设计来预测lidar和相机之间的平移向量和旋转矩阵。训练过程中,使用已知外参的大量标定数据对模型进行监督学习,确保其预测精度。此外,引入迭代优化机制,根据初步预测的外参结果进行模拟重投影,然后分析重投影误差,自动调整模型参数,通过多次迭代优化外参的精度。41)利用前馈网络(ffn)对位姿信息进行回归,然后分别获得平移参数和旋转参数。该网络由一个包含512个神经元的全连接层和两个具有堆叠全连接层(代表旋转和平移)的分支组成。平移参数由1×3向量tpred表示,旋转参数由1×4四元数qpred表示。42)将当前预测出的参数进行三次迭代细化,得到最终的外部参数。

    8、步骤5)实地验证与系统调整:完成初步的外参标定后,在实际路侧环境中进行系统验证。通过持续监测外参标定的效果,并对比实际观察到的交通情况,评估标定精度。根据实际应用反馈调整算法参数和模型结构,不断提升适应性和鲁棒性,以适应不同的环境条件和交通场景。

    9、与现有技术相比较,本发明针对路侧场景的lidar和相机进行自动外部校准,提高了路侧标定的准确性和稳定性。本发明是一种无目标自动的标定方法,不需要棋盘格等标定物。与其他最先进的方法比较,本发明更轻量级,需要的迭代和训练次数更少。它运行速度更快,推理结果的准确性更高,整体表现出色。


    技术特征:

    1.一种基于transformer的路侧lidar-相机外参标定系统,其特征在于,包括lidar、相机、特征提取、特征匹配和参数预测模块;特征提取模块由lidar和相机两个分支组成;特征提取模块将lidar采集到的点云数据和相机拍摄的图像数据作为输入,输出lidar特征和图像特征;特征匹配模块由相关层和transformer架构组成,将lidar特征和图像特征作为输入,对lidar和图像特征进行细粒度的匹配;最后,参数预测模块将匹配的lidar和相机细粒度特征进行参数回归,对参数进行预测,将输出的参数进行三次迭代细化,最终输出预测的外部参数。

    2.利用权利要求1所述系统的一种基于transformer的路侧lidar-相机外参标定方法,其特征在于,包括如下步骤,

    3.根据权利要求2所述的一种基于transformer的路侧lidar-相机外参标定方法,其特征在于,

    4.根据权利要求3所述的一种基于transformer的路侧lidar-相机外参标定方法,其特征在于,

    5.根据权利要求4所述的一种基于transformer的路侧lidar-相机外参标定方法,其特征在于,

    6.根据权利要求5所述的一种基于transformer的路侧lidar-相机外参标定方法,其特征在于,

    7.根据权利要求6所述的一种基于transformer的路侧lidar-相机外参标定方法,其特征在于,


    技术总结
    本发明公开了一种基于Transformer的路侧LiDAR‑相机外参标定方法及系统,包括LiDAR和相机两类硬件,系统在路侧计算单元上运行。本系统由特征提取、特征匹配和参数预测模块组成。特征提取模块由LiDAR和相机两个分支组成。特征提取模块将LiDAR采集到的点云数据和相机拍摄的图像数据作为输入,输出LiDAR特征和图像特征。特征匹配模块由相关层和Transformer架构组成,将LiDAR特征和图像特征作为输入,对LiDAR和图像特征进行细粒度的匹配。最后,参数预测模块将匹配的LiDAR和相机细粒度特征进行参数回归,对参数进行预测,将输出的参数进行三次迭代细化,最终输出预测的外部参数。本发明针对路侧场景的LiDAR和相机进行自动外部校准,提高了路侧标定的准确性和稳定性,不需要标定物。

    技术研发人员:包雪峰,田锐,谌云莉,刘峰,甄艺强,李永,余舜京
    受保护的技术使用者:北京工业大学
    技术研发日:
    技术公布日:2024/10/24
    转载请注明原文地址:https://symbian.8miu.com/read-24885.html

    最新回复(0)