基于预标注数据的模型训练方法、装置、电子设备及介质与流程

    技术2025-02-13  58


    本发明涉及人工智能,具体涉及一种基于预标注数据的模型训练方法、一种基于预标注数据的模型训练装置、一种计算机可读存储介质和一种电子设备。


    背景技术:

    1、自动驾驶技术在缓解交通问题上显得尤为重要,是当前各大汽车厂商角逐的焦点。然而基于深度学习的自动驾驶方案对数据的需求量是巨大的,标注准确及大量的数据需要耗费较多的成本。同时,数据采集流程注定了采集的数据分布为长尾分布,更多的数据是车辆、行人等目标,而尾部类目标如锥形桶、异型车、三轮车等即使通过定制化采集,其数据量占比也不会很高。为缓解这种数据需求问题,大多数解决方法是将尾部类数据进行复制,但整个复制过程不可避免的引入头部类数据,整体效果并不明显。另一种较为常见的方法是训练比车端模型参数量,深度更深的模型对未能人工标注的数据进行预测,得到其坐标、尺寸、置信度等属性信息,被称为预标注框,并以这种预标注数据设计一种训练策略,该训练策略主要包括将低置信度的预测框进行标注,不参与损失计算,但这种训练策略不可避免的带来多种问题。问题一为大模型中存在严重的误检,包括将噪声的误检和类别间的误检,如将行人与锥形桶、警示桩之间误检,提高置信度虽能降低误检,但并不能完全的避免;问题二为大模型预标注的数据存在严重的漏检,即背景中存在真值目标,在计算损失值时,模型会将目标信息判别为背景信息,错误引导模型梯度的计算;问题三为大模型预标注的数据与人工标注的数据是同分布的,预标注框依然存在严重的长尾分布现象。

    2、相关技术中,申请号为cn202010450890.1,名称为目标检测模型训练方法、目标检测方法及装置的专利文献公开了,使用间隔值和距离两个因素的损失函数,确定预测框对应的损失值,但是并未考虑到目标间的误检对损失值造成的影响。申请号为cn202311708714.3,名称为目标检测模型的训练方法、检测方法及相关装置的专利文献公开了,使用长尾物体弱标注数据的标注真值和全标注数据,对目标检测模型进行训练,但是并未考虑到将预标注框添加至人中标注数据帧时的概率问题。


    技术实现思路

    1、本发明的目的之一在于提供一种基于预标注数据的模型训练方法,以提高车端模型提取通用特征的性能,同时缓解了人工标注数据严重的长尾分布现象,降低了大模型不可避免存在的误检和漏检对训练带来的影响;目的之二在于提供一种基于预标注数据的模型训练装置;目的之三在于提供一种计算机可读存储介质;目的之四在于提供一种电子设备。

    2、为了实现上述目的,本发明采用的技术方案如下:

    3、一种基于预标注数据的模型训练方法,方法包括:将预标注数据框添加至人工标注训练数据帧情况下,对添加后的人工标注训练数据帧进行训练,其中,基于预标注数据的添加概率和预标注数据框添加至人工标注训练数据帧中的位置信息将预标注数据框添加至人工标注训练数据帧;在训练过程中,获取不同类预标注数据框之间的混淆矩阵;根据混淆矩阵确定其他类预标注数据框识别为当前类预标注数据框的误检数量;根据误检数量、当前类预标注数据框的预设召回目标数和不同类预标注数据框之间的误检数量确定混淆矩阵误差率,并根据不同类预标注数据框和当前类预标注数据框的预设召回目标数确定整体误差率;根据混淆矩阵误差率和整体误差率对目标属性回归损失权重系数进行调整,以便根据调整后的权重系数计算标注数据框的损失值,并基于预标注数据框的损失值在目标检测模型中进行反向传播,以及在反向传播的过程中,更新目标检测模型的权重参数。

    4、根据本发明的一个实施例,获取预标注数据的添加概率,包括:获取人工标注训练数据帧数与预标注数据框的数量之间的比值;在比值小于预设阈值的情况下,将比值作为预标注数据的添加概率;在比值大于预设阈值的情况下,根据人工标注训练数据帧数、比值和预标注数据框的数量确定预标注数据的添加概率。

    5、根据本发明的一个实施例,根据人工标注训练数据帧数、比值和预标注数据框的数量确定预标注数据的添加概率,包括:获取第i类预标注数据框的数量与比值之间的乘积;获取人工标注训练数据帧数与乘积之间的差值确定人工标注训练数据帧数与i类预标注数据框的数量比值的余数;根据余数与第i类预标注数据框的数量之间的比值确定预标注数据的添加概率。

    6、根据本发明的一个实施例,获取预标注数据框添加至人工标注训练数据帧中的位置信息,包括:根据预标注数据框的位置信息与人工标注数据框的属性信息确定预标注数据框被人工标注数据框遮挡;在根据预标注数据框的属性信息确定存在被遮挡的情况下,保持预标注数据框的中心点位置信息不变;在根据预标注数据框的属性信息确定不存在被遮挡的情况下,对预标注数据框进行移动。

    7、根据本发明的一个实施例,获取预标注数据框添加至人工标注训练数据帧中的位置信息,包括:根据预标注数据框的位置信息与人工标注目标框的属性信息确定当前预标注框未被人工标注框遮挡;在根据前预标注数据框的属性信息确定不存在被遮挡的情况下,保持预标注数据框的位置信息不变;在根据预标注数据框的属性信息确定存在被遮挡的情况下,对预标注数据框进行移动。

    8、根据本发明的一个实施例,对预标注数据框进行移动,包括:根据每个人工标注数据框的位置信息和尺寸信息确定最小位置信息和最大位置信息,其中,最小位置信息和最大位置信息包括xyz三个方向的值;获取预标注数据框的位置信息与最小位置信息之间的第一差值绝对值和预标注数据框的位置信息与最大位置信息之间的第二差值绝对值;根据第一差值绝对值和第二差值绝对值对预标注数据框进行移动,其中,第一差值绝对值和第二差值绝对值包括xyz三个方向的值。

    9、根据本发明的一个实施例,根据第一差值绝对值和第二差值绝对值对预标注数据框进行移动,包括:在第一差值绝对值大于第二差值绝对值的情况下,将预标注数据框的位置信息移动至最大位置信息;在第一差值绝对值小于等于第二差值绝对值的情况下,将预标注数据框的位置信息移动至最小位置信息。

    10、根据本发明的一个实施例,根据每个人工标注数据框的位置信息和尺寸信息确定最小位置信息和最大位置信息,包括:获取所有人工标注数据框的x方向坐标与对应的人工标注数据框的长度的一半之间的差值,构成所有人工标注数据框的第一x方向位置集合,将第一x方向位置集合中的最小值作为x方向的最小位置;获取所有人工标注数据框的y方向坐标与对应的人工标注数据框的宽度的一半之间的差值,构成所有人工标注数据框的第一y方向位置集合,将第一y方向位置集合中的最小值作为y方向的最小位置;获取所有人工标注数据框的z方向坐标与对应的人工标注数据框的高度的一半之间的差值,构成所有人工标注数据框的第一z方向位置集合,将第一z方向位置集合中的最小值作为z方向的最小位置;获取所有人工标注数据框的x方向坐标与对应的人工标注数据框的长度的一半之间的和值,构成所有人工标注数据框的第二x方向位置集合,将第二x方向位置集合中的最大值作为x方向的最大位置;获取所有人工标注数据框的y方向坐标与对应的人工标注数据框的宽度的一半之间的和值,构成所有人工标注数据框的第二y方向位置集合,将第二y方向位置集合中的最大值作为y方向的最大位置;获取所有人工标注数据框的z方向坐标与对应的人工标注数据框的高度的一半之间的和值,构成所有人工标注数据框的第二z方向位置集合,将第二z方向位置集合中的最大值作为z方向的最大位置;根据x方向的最小位置、y方向的最小位置和z方向的最小位置确定最小位置信息,并根据x方向的最大位置、y方向的最大位置和z方向的最大位置确定最大位置信息。

    11、根据本发明的一个实施例,根据误检数量、当前类预标注数据框的预设召回目标数和不同类预标注数据框之间的误检数量确定混淆矩阵误差率,包括:根据误检数量和噪声误检数量之和确定不同类预标注数据框之间的误检数量;根据误检数量与不同类预标注数据框之间的误检数量和当前类预标注数据框的预设召回目标数的和值之间的比值,确定混淆矩阵误差率。

    12、根据本发明的一个实施例,根据不同类预标注数据框和当前类预标注数据框的预设召回目标数确定整体误差率,包括:获取不同类预标注数据框之间的误检数量和当前类预标注数据框的预设召回目标数的和值;根据不同类预标注数据框之间的误检数量与和值之间的比值,确定整体误差率。

    13、根据本发明的一个实施例,目标属性回归损失权重系数包括:当前预标注数据框的分类损失的权重系数、当前预标注数据框中心点的回归损失的权重系数、当前预标注数据框中心点的回归损失的权重系数和当前预标注数据框尺寸的回归损失的权重系数,其中,根据混淆矩阵误差率和整体误差率对目标属性回归损失权重系数进行调整,包括:获取预设值与混淆矩阵误差率之间的差值作为第一概率,获取预设值与整体误差率之间的差值作为第二概率;将当前预标注数据框的分类损失的权重系数乘以第一概率,作为其调整后的权重系数;将当前预标注数据框中心点的回归损失的权重系数乘以第一概率,作为其调整后的权重系数;将当前预标注数据框高度的损失值的权重系数乘以第一概率后再乘以第二概率,作为其调整后的权重系数;将当前预标注数据框尺寸的回归损失的权重系数乘以第一概率后再乘以第二概率,作为其调整后的权重系数;据当前预标注数据框的分类损失乘以其调整后的权重系数、当前预标注数据框中心点的回归损失乘以其调整后的权重系数、当前预标注数据框高度的损失值乘以其调整后的权重系数、当前预标注数据框尺寸的回归损失乘以其调整后的权重系数四者之间的和作为标注数据框的损失值。

    14、一种基于预标注数据的模型训练装置,装置包括:添加模块,用于将预标注数据框添加至人工标注训练数据帧情况下,对添加后的人工标注训练数据帧进行训练,其中,基于预标注数据的添加概率和预标注数据框添加至人工标注训练数据帧中的位置信息将预标注数据框添加至人工标注训练数据帧;获取模块,用于在训练过程中,获取不同类预标注数据框之间的混淆矩阵;第一确定模块,用于根据混淆矩阵确定其他类预标注数据框识别为当前类预标注数据框的误检数量;第二确定模块,用于根据误检数量、当前类预标注数据框的预设召回目标数和不同类预标注数据框之间的误检数量确定混淆矩阵误差率,并根据不同类预标注数据框和当前类预标注数据框的预设召回目标数确定整体误差率;调整模块,用于根据混淆矩阵误差率和整体误差率对目标属性回归损失权重系数进行调整,以便根据调整后的权重系数计算标注数据框的损失值,并基于预标注数据框的损失值在目标检测模型中进行反向传播,以及在反向传播的过程中,更新目标检测模型的权重参数。

    15、一种计算机可读存储介质,其上存储有基于预标注数据的模型训练程序,该基于预标注数据的模型训练程序被处理器执行时实现前述的基于预标注数据的模型训练方法。

    16、一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的基于预标注数据的模型训练程序,处理器执行基于预标注数据的模型训练程序时,实现前述的基于预标注数据的模型训练方法。

    17、本发明的有益效果:

    18、(1)模型预标注数据不可避免的存在漏检,训练过程中若不考虑这类漏检,模型将漏检目标点云训练为背景点云,将导致错误引导模型的梯度信息,因此本发明在训练过程中,将模型预标注数据添加在人工标注数据中,以降低大模型漏检对训练带来的影响。

    19、(2)模型标注数据与人工标注数据是同分布的,因此大模型预标注数据中同样存在严重的长尾分布现象,为缓解预标注数据的长尾分布现象,本发明对预标注数据设计不同的添加概率,可在一定程度确保预标注数据的均匀分布。

    20、(3)模型预标注数据还存在比较严重的误检现象,因此本发明基于误检类型重新设计目标属性间的损失权重,能较大程度的降低模型预标注数据误检带来的影响。


    技术特征:

    1.一种基于预标注数据的模型训练方法,其特征在于,所述方法包括:

    2.根据权利要求1所述的基于预标注数据的模型训练方法,其特征在于,获取所述预标注数据的添加概率,包括:

    3.根据权利要求2所述的基于预标注数据的模型训练方法,其特征在于,根据所述人工标注训练数据帧数、所述比值和所述预标注数据框的数量确定所述预标注数据的添加概率,包括:

    4.根据权利要求1所述的基于预标注数据的模型训练方法,其特征在于,获取所述预标注数据框添加至所述人工标注训练数据帧中的位置信息,包括:

    5.根据权利要求1所述的基于预标注数据的模型训练方法,其特征在于,获取所述预标注数据框添加至所述人工标注训练数据帧中的位置信息,包括:

    6.根据权利要求4或5所述的基于预标注数据的模型训练方法,其特征在于,对所述预标注数据框进行移动,包括:

    7.根据权利要求6所述的基于预标注数据的模型训练方法,其特征在于,所述根据所述第一差值绝对值和所述第二差值绝对值对所述预标注数据框进行移动,包括:

    8.根据权利要求6所述的基于预标注数据的模型训练方法,其特征在于,根据每个所述人工标注数据框的位置信息和尺寸信息确定最小位置信息和最大位置信息,包括:

    9.根据权利要求1所述的基于预标注数据的模型训练方法,其特征在于,根据所述误检数量、所述当前类预标注数据框的预设召回目标数和所述不同类预标注数据框之间的误检数量确定所述混淆矩阵误差率,包括:

    10.根据权利要求9所述的基于预标注数据的模型训练方法,其特征在于,根据所述不同类预标注数据框和所述当前类预标注数据框的预设召回目标数确定所述整体误差率,包括:

    11.根据权利要求9所述的基于预标注数据的模型训练方法,其特征在于,所述目标属性回归损失权重系数包括:所述当前预标注数据框的分类损失的权重系数、所述当前预标注数据框中心点的回归损失的权重系数、所述当前预标注数据框中心点的回归损失的权重系数和所述当前预标注数据框尺寸的回归损失的权重系数,其中,根据所述混淆矩阵误差率和所述整体误差率对目标属性回归损失权重系数进行调整,包括:

    12.一种基于预标注数据的模型训练装置,其特征在于,所述装置包括:

    13.一种计算机可读存储介质,其特征在于,其上存储有基于预标注数据的模型训练程序,该基于预标注数据的模型训练程序被处理器执行时实现根据权利要求1-11中任一项所述的基于预标注数据的模型训练方法。

    14.一种电子设备,其特征在于,包括存储器、处理器及存储在存储器上并可在处理器上运行的基于预标注数据的模型训练程序,所述处理器执行所述基于预标注数据的模型训练程序时,实现根据权利要求1-11中任一项所述的基于预标注数据的模型训练方法。


    技术总结
    本发明公开了一种基于预标注数据的模型训练方法、装置、电子设备及介质。其中,方法包括:将预标注数据框添加至人工标注训练数据帧,对添加后的人工标注训练数据帧进行训练;在训练过程中,根据误检数量、当前类预标注数据框的预设召回目标数和不同类预标注数据框之间的误检数量确定混淆矩阵误差率,并根据不同类预标注数据框和当前类预标注数据框的预设召回目标数确定整体误差率;根据混淆矩阵误差率和整体误差率对目标属性回归损失权重系数进行调整,以便根据调整后的权重系数计算标注数据框的损失值。如此,降低了漏检对模型训练带来的影响,缓解了预标注数据的长尾效应,还可降低模型预标注数据误检带来的影响。

    技术研发人员:杨政华,姜铭山,邓皓匀,钱少华
    受保护的技术使用者:重庆长安汽车股份有限公司
    技术研发日:
    技术公布日:2024/10/24
    转载请注明原文地址:https://symbian.8miu.com/read-26425.html

    最新回复(0)