本发明实施例涉及物联网及人工智能,尤其涉及一种标识体系识别模型的训练方法、标识体系识别方法及装置。
背景技术:
1、物联网标识是用于识别不同物联网对象的名称标记。商品编码、设备序列号、设备网络地址、页面uri(uniform resource identifier,统一资源标识符)等均为物联网标识。随着物联网的飞速发展,不同国家不同领域不断推出物联网标识体系,带来了多种异构物联网标识共存的局面。由于编码方式各不相同,对于一个系统或场景中使用不同编码方式的情况(如产品追溯的各阶段),均需要预先识别编码的方式,然后由对应的解析系统完成解析。现有方案中通常将异构标识的识别问题转换为机器学习分类问题,输入数据为标识编码,分类结果为标识所属的标识体系。如图1所示,基于标识数据集以及标签信息(标识体系),训练有监督的机器学习分类模型(标识体系识别模型)。对于一个新标识,根据标识体系识别模型的预测结果,判断该标识的标识体系,解析系统通过标识体系对应的标识实现标识的解析,进而支持产品追溯、供应链管理等标识解析应用。
2、现有方案中,在训练标识体系识别模型时,需要提前准备大量的带标识系统标签的标识数据,否则无法保证模型具有足够的泛化能力和分类准确性,这要求耗费大量人力做离线数据标注工作。另外,当应用场景变化时,例如需要识别标识的标识体系发生变化,或者标识体系的数量增加,现有方案均需要完全重新训练模型,灵活性差、资源开销大。
技术实现思路
1、本发明实施例提供一种标识体系识别模型的训练方法、标识体系识别方法及装置,用于解决现有的标识体系识别模型训练成本高的问题。
2、为了解决上述技术问题,本发明是这样实现的:
3、第一方面,本发明实施例提供了一种标识体系识别模型的训练方法,包括:
4、获取第一无标签数据集,所述第一无标签数据集包括多个无标识体系标签的第一物联网标识;
5、采用两种标识-图像转换策略,将同一个所述第一物联网标识转换成第一图像和第二图像;
6、采用所述第一图像和所述第二图像对预训练模型进行预训练,所述预训练模型包括特征提取器;
7、获取有标签数据集和第二无标签数据集,所述有标签数据集包括多个有标识体系标签的第二物联网标识,所述第二无标签数据集包括多个无标识体系标签的第三物联网标识;
8、根据所述有标签数据集和所述第二无标签数据集对标识体系识别模型进行训练,所述标识体系识别模型包括预训练后的特征提取器、第一分类器和第二分类器。
9、可选地,采用所述第一图像和所述第二图像对预训练模型进行预训练,包括:
10、将所述第一图像和所述第二图像分别输入至预训练模型的特征提取器进行特征提取,得到第一特征和第二特征;
11、将所述第一特征和所述第二特征分别输入至所述预训练模型的投影器,得到第三特征和第四特征;
12、根据所述第一特征和第四特征的相似性,以及,所述第二特征和所述第三特征的相似性,确定第一损失函数;
13、根据所述第一损失函数对所述特征提取器和所述投影器的参数进行优化,得到训练后的特征提取器。
14、可选地,根据所述第一特征和第四特征的相似性,以及,所述第二特征和所述第三特征的相似性,确定第一损失函数,包括:
15、在确定所述第一损失函数时,使得所述第一特征和所述第二特征的梯度截断。
16、可选地,所述第一损失函数采用如下公式表示:
17、
18、其中,l为所述第一损失函数,z1为所述第一特征,z2为所述第二特征,p1为所述第三特征,p2为所述第四特征,d为余弦距离。
19、可选地,根据所述有标签数据集和所述第二无标签数据集对标识体系识别模型进行训练,包括:
20、采用两种标识-图像转换策略,将同一个所述第二物联网标识转换成第三图像和第四图像;
21、将所述第三图像和所述第四图像分别输入至训练后的特征提取器进行特征提取,得到第五特征和第六特征;
22、将所述第五特征和所述第六特征分别输入至第一分类器和第二分类器,得到所述第一分类器输出的两个标识体系预测结果,以及,所述第二分类器输出的两个标识体系预测结果;
23、根据所述第一分类器输出的两个标识体系预测结果,所述第二分类器输出的两个标识体系预测结果和所述第二物联网标识的真实标识体系,确定第二损失函数;
24、根据所述第二损失函数对所述训练后的特征提取器、所述第一分类器和第二分类器的参数进行优化。
25、可选地,所述第二损失函数采用如下公式表示:
26、argminll=ce(f1(g(img1)),y)+ce(f1(g(img2)),y)+ce(f2(g(img1)),y)+ce(f2(g(img2)),y)
27、其中,argminl1为所述第二损失函数,img1为所述第三图像,img2为所述第四图像,g(img1)为所述第五特征,g(img2)为所述第六特征,f1(g(img1))和,f1(g(img2))为所述第一分类器输出的两个标识体系预测结果,f2(g(img1))和f2(g(img2))为所述第二分类器输出的两个标识体系预测结果,y为所述第二物联网标识的真实标识体系,ce为交叉熵损失函数。
28、可选地,根据所述有标签数据集和所述第二无标签数据集对标识体系识别模型进行训练,还包括:
29、固定所述第一分类器和所述第二分类器的参数;
30、采用两种标识-图像转换策略,将同一个所述第三物联网标识转换成第五图像和第六图像;
31、将所述第五图像和所述第六图像分别输入至当前训练的特征提取器进行特征提取,得到第七特征和第八特征;
32、将所述第七特征和所述第八特征分别输入至第一分类器和第二分类器,得到所述第一分类器输出的两个标识体系预测结果,以及,所述第二分类器输出的两个标识体系预测结果;
33、根据所述第一分类器当前输出的两个标识体系预测结果,以及,所述第二分类器当前输出的两个标识体系预测结果,确定第三损失函数;
34、根据所述第三损失函数对所述当前训练的特征提取器的参数进行优化。
35、可选地,所述第三损失函数采用如下公式表示:
36、argminla=wa(|f1(g(img1))-f2(g(img1))|+|f1(g(img2))-f2(g(img2))|)
37、其中,argminla为所述第三损失函数,img1为所述第五图像,img2为所述第六图像,g(img1)为所述第七特征,g(img2)为所述第八特征,f1(g(img1))和f1(g(img2))为所述第一分类器输出的两个标识体系预测结果,f2(g(img1))和f2(g(img2))为所述第二分类器输出的两个标识体系预测结果,wa为所述第一分类器输出的两个标识体系预测结果和第二分类器输出的两个标识体系预测结果的熵的平均值。
38、可选地,根据所述有标签数据集和所述第二无标签数据集对标识体系识别模型进行训练,还包括:
39、固定当前训练得到的特征提取器的参数;
40、采用两种标识-图像转换策略,将同一个所述第三物联网标识转换成第七图像和第八图像;
41、将所述第七图像和所述第八图像分别输入至当前训练得到的特征提取器进行特征提取,得到第九特征和第十特征;
42、将所述第九特征和第十特征分别输入至当前训练得到的第一分类器和第二分类器,得到所述第一分类器输出的两个标识体系预测结果,以及,所述第二分类器输出的两个标识体系预测结果;
43、根据所述第一分类器输出的两个标识体系预测结果以及所述第二分类器输出的两个标识体系预测结果,确定第四损失函数;
44、根据所述第四损失函数对所述第一分类器和第二分类器的参数进行优化。可选地,所述第四损失函数采用如下公式表示:
45、argminld=wd(2-|f1(g(img1))-f2(g(img1))|-|f1(g(img2))-f2(g(img2))|)
46、其中,argminld为所述第四损失函数,img1为所述第七图像,img2为所述第八图像,g(img1)为所述第九特征,g(img2)为所述第十特征,f1(g(img1))和f1(g(img2))为所述第一分类器输出的两个标识体系预测结果,f2(g(img1))和f2(g(img2))为所述第二分类器输出的两个标识体系预测结果,wa为所述第一分类器输出的两个标识体系预测结果和所述第二分类器输出的两个标识体系预测结果的熵的平均值。
47、可选地,根据所述有标签数据集和所述第二无标签数据集对标识体系识别模型进行训练,还包括:
48、采用当前训练得到的标识体系识别模型计算所述第二无标签数据集中各第三物联网标识的熵;
49、基于所述第三物联网标识的熵,确定所述第三物联网标识是否为目标物联网标识;
50、对所述目标物联网标识添加标识体系标签;
51、将所述目标物联网标识添加到所述有标签数据集中,得到更新的有标签数据集;
52、将所述目标物联网标识从所述第二无标签数据集中删除,得到更新的第二无标签数据集;
53、根据所述更新的有标签数据集和所述更新的第二无标签数据集对当前训练得到的标识体系识别模型进行训练。
54、可选地,所述两种标识-图像转换策略为以下标识-图像转换策略中的任意两种:顺序转换策略、逆序转换策略、顺序差分转换策略和逆序差分转换策略。
55、第二方面,本发明实施例提供了一种标识体系识别方法,包括:
56、获取待识别物联网标识;
57、采用两种标识-图像转换策略,将所述待识别物联网标识转换成第九图像和第十图像;
58、将所述第九图像和所述第十图像输入至标识体系识别模型的特征提取器,得到第十一特征和第十二特征;
59、将所述第十一特征和第十二特征分别输入至所述标识体系识别模型的第一分类器和第二分类器,得到所述第一分类器输出的两个标识体系预测结果和所述第二分类器输出的两个标识体系预测结果;
60、根据所述第一分类器输出的两个标识体系预测结果和所述第二分类器输出的两个标识体系预测结果,得到最终的标识体系预测结果。
61、第三方面,本发明实施例提供了一种标识体系识别模型的训练装置,包括:
62、第一获取模块,用于获取第一无标签数据集,所述第一无标签数据集包括多个无标识体系标签的第一物联网标识;
63、转换模块,用于采用两种标识-图像转换策略,将同一个所述第一物联网标识转换成第一图像和第二图像;
64、第一训练模块,用于采用所述第一图像和所述第二图像对预训练模型进行预训练,所述预训练模型包括特征提取器;
65、第二获取模块,用于获取有标签数据集和第二无标签数据集,所述有标签数据集包括多个有标识体系标签的第二物联网标识,所述第二无标签数据集包括多个无标识体系标签的第三物联网标识;
66、第二训练模块,用于根据所述有标签数据集和所述第二无标签数据集对标识体系识别模型进行训练,所述标识体系识别模型包括预训练后的特征提取器、第一分类器和第二分类器。
67、第四方面,本发明实施例提供了一种标识体系识别装置,包括:
68、获取模块,用于获取待识别物联网标识;
69、转换模块,用于采用两种标识-图像转换策略,将所述待识别物联网标识转换成第九图像和第十图像;
70、特征提取模块,用于将所述第九图像和所述第十图像输入至标识体系识别模型的特征提取器,得到第十一特征和第十二特征;
71、第一分类模块,用于将所述第十一特征和第十二特征分别输入至所述标识体系识别模型的第一分类器和第二分类器,得到所述第一分类器输出的两个标识体系预测结果和所述第二分类器输出的两个标识体系预测结果;
72、第二分类模块,用于根据所述标识体系识别模型的第一分类器输出的两个标识体系预测结果和所述标识体系识别模型的第二分类器输出的两个标识体系预测结果,得到最终的标识体系预测结果。
73、第五方面,本发明实施例提供了一种电子设备,包括:处理器、存储器及存储在所述存储器上并可在所述处理器上运行的程序,所述程序被所述处理器执行时实现如上述第一方面所述的标识体系识别模型的训练方法的步骤,或者,所述程序被所述处理器执行时实现如上述第二方面所述的标识体系识别方法的步骤。
74、第六方面,本发明实施例提供了一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如上述第一方面所述的标识体系识别模型的训练方法的步骤;或者,所述计算机程序被处理器执行时实现如上述第二方面所述的标识体系识别方法的步骤。
75、本发明实施例提出了一种基于自监督和主动学习的标识体系识别模型的训练方法,与现有方案不同,本发明实施例中,在预训练阶段,参考自监督学习训练方式,从大量的无标识数据中自动构造监督信息,既不需要标签信息,也不需要负样本信息,仅仅利用预训练模型挖掘同一个标识两种转换图像的自身的监督信息,通过构造的监督信息(同一标识在两种转换策略下的相似性)对网络进行训练,有效节省人力标注成本和构造负样本的成本,并且其与下游分类任务相似性高,迁移后效果更好,可以灵活支撑不同应用场景。针对下游具体物联网标识识别任务,在预训练模型后面增加两个分类器用于主动学习和标识分类。基于新场景的少量打标的标识数据集和大量无打标的数据集,对标识体系识别模型进行训练,从而无需提前准备大量的带标签的标识数据,节省了离线数据标注成本,同时仍能够保证模型具有足够的泛化能力和分类准确性。
1.一种标识体系识别模型的训练方法,其特征在于,包括:
2.如权利要求1所述的标识体系识别模型的训练方法,其特征在于,采用所述第一图像和所述第二图像对预训练模型进行预训练,包括:
3.如权利要求2所述的标识体系识别模型的训练方法,其特征在于,根据所述第一特征和第四特征的相似性,以及,所述第二特征和所述第三特征的相似性,确定第一损失函数,包括:
4.如权利要求3所述的标识体系识别模型的训练方法,其特征在于,所述第一损失函数采用如下公式表示:
5.如权利要求1所述的标识体系识别模型的训练方法,其特征在于,根据所述有标签数据集和所述第二无标签数据集对标识体系识别模型进行训练,包括:
6.如权利要求5所述的标识体系识别模型的训练方法,其特征在于,所述第二损失函数采用如下公式表示:
7.如权利要求5所述的标识体系识别模型的训练方法,其特征在于,根据所述有标签数据集和所述第二无标签数据集对标识体系识别模型进行训练,还包括:
8.如权利要求7所述的标识体系识别模型的训练方法,其特征在于,所述第三损失函数采用如下公式表示:
9.如权利要求7所述的标识体系识别模型的训练方法,其特征在于,根据所述有标签数据集和所述第二无标签数据集对标识体系识别模型进行训练,还包括:
10.如权利要求9所述的标识体系识别模型的训练方法,其特征在于,所述第四损失函数采用如下公式表示:
11.如权利要求9所述的标识体系识别模型的训练方法,其特征在于,根据所述有标签数据集和所述第二无标签数据集对标识体系识别模型进行训练,还包括:
12.如权利要求1或5或7或9所述的标识体系识别模型的训练方法,其特征在于,所述两种标识-图像转换策略为以下标识-图像转换策略中的任意两种:顺序转换策略、逆序转换策略、顺序差分转换策略和逆序差分转换策略。
13.一种标识体系识别方法,其特征在于,包括:
14.一种标识体系识别模型的训练装置,其特征在于,包括:
15.一种标识体系识别装置,其特征在于,包括:
16.一种电子设备,其特征在于,包括:处理器、存储器及存储在所述存储器上并可在所述处理器上运行的程序,所述程序被所述处理器执行时实现如权利要求1至12中任一项所述的标识体系识别模型的训练方法的步骤,或者,所述程序被所述处理器执行时实现如权利要求13所述的标识体系识别方法的步骤。
17.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如权利要求1至12中任一项所述的标识体系识别模型的训练方法的步骤;或者,所述计算机程序被处理器执行时实现如权利要求13所述的标识体系识别方法的步骤。