本发明涉及通信,尤其涉及一种基于通信网络的模型训练方法、装置、设备及介质。
背景技术:
1、相关技术中,消费者可向网络数据分析功能(network data analyticsfunction,nwdaf)请求模型训练服务。nwdaf作为一个独立的实体和大数据/人工智能(artificial intelligence,ai)分析引擎,可根据具体应用类型,采集相应数据,并训练得到ai模型。模型训练完成后可为后续推理执行、网络智能化应用提供支撑。
2、然而,相关技术中,nwdaf训练是完全黑盒化的,消费者对模型训练过程不可感知,消费者对模型训练的可控性较差。
技术实现思路
1、本发明实施例提供一种基于通信网络的模型训练方法、装置、设备及介质,以解决消费者对模型训练的可控性较差的问题。
2、为解决上述技术问题,本发明是这样实现的:
3、第一方面,本发明实施例提供了一种基于通信网络的模型训练方法,应用于第一网元设备,所述方法包括:
4、接收第二网元设备发送的模型训练请求,所述模型训练请求中携带目标信息,所述目标信息包括如下至少一项:预期模型性能指标、状态上报时间,其中,所述状态上报时间是指所述第一网元设备在模型训练过程中向所述第二网元设备反馈训练状态的时间;
5、基于所述模型训练请求对目标模型进行模型训练;
6、基于所述目标信息向所述第二网元设备发送所述目标模型的训练状态信息。
7、可选地,在所述目标信息包括所述预期模型性能指标的情况下,所述基于所述目标信息向所述第二网元设备发送所述目标模型的训练状态信息,包括:
8、在基于所述预期模型性能指标确定训练完成的情况下,向所述第二网元设备发送所述目标模型的训练状态信息;
9、其中,所述训练状态信息包括所述训练完成的目标模型的模型性能指标。
10、可选地,所述基于所述目标信息向所述第二网元设备发送所述目标模型的训练状态信息之后,所述方法还包括:
11、接收所述第二网元设备发送的重训练请求;
12、基于所述重训练请求对训练完成的目标模型进行模型重训练。
13、可选地,在所述目标信息包括所述状态上报时间的情况下,所述基于所述目标信息向所述第二网元设备发送所述目标模型的训练状态信息,包括:
14、获取所述目标模型在所述状态上报时间对应的训练状态信息;
15、基于所述状态上报时间向所述第二网元设备发送所述训练状态信息;
16、其中,所述训练状态信息包括所述目标模型的模型性能指标。
17、可选地,所述基于所述状态上报时间向所述第二网元设备发送所述训练状态信息之后,所述方法还包括:
18、接收所述第二网元设备发送的训练终止请求;
19、基于所述训练终止请求结束对所述目标模型的模型训练。
20、可选地,所述训练终止请求携带模型训练的目标迭代轮次;所述基于所述训练终止请求结束对所述目标模型的模型训练之后,所述方法还包括:
21、向所述第二网元设备发送通知消息,所述通知消息用于通知模型训练完成,所述通知消息携带所述目标迭代轮次对应的目标模型的模型信息。
22、可选地,所述模型训练请求还包括分析应用标识,所述基于所述模型训练请求对目标模型进行模型训练,包括:
23、采集用于训练所述分析应用标识对应的目标模型的数据,基于采集的数据生成用于模型训练的数据集;
24、基于所述数据集对所述分析应用标识对应的目标模型进行模型训练。
25、可选地,所述数据集包括训练集和验证集,所述训练状态信息包括所述目标模型的模型性能指标,所述训练状态信息中的模型性能指标包括如下至少一项:所述目标模型在所述训练集上的模型性能指标、所述目标模型在所述验证集上的模型性能指标。
26、可选地,所述训练状态信息还包括如下至少一项:
27、迭代轮次;训练时长。
28、第二方面,本发明实施例提供了一种基于通信网络的模型训练方法,应用于第二网元设备,所述方法包括:
29、向第一网元设备发送模型训练请求,所述模型训练请求中携带目标信息,所述目标信息包括如下至少一项:预期模型性能指标、状态上报时间,其中,所述状态上报时间是指所述第一网元设备在模型训练过程中向所述第二网元设备反馈训练状态的时间;
30、接收所述第一网元设备基于所述目标信息发送的目标模型的训练状态信息。
31、可选地,在所述目标信息包括所述预期模型性能指标的情况下,所述训练状态信息包括训练完成的目标模型的模型性能指标。
32、可选地,所述接收所述第一网元设备基于所述目标信息发送的目标模型的训练状态信息之后,所述方法还包括:
33、根据所述目标模型的训练状态信息确定是否触发重训练;
34、在确定触发重训练的情况下,向所述第一网元设备发送重训练请求,所述重训练请求用于请求对所述训练完成的目标模型进行模型重训练。
35、可选地,在所述目标信息包括所述状态上报时间的情况下,所述接收所述第一网元设备基于所述目标信息发送的目标模型的训练状态信息,包括:
36、接收所述第一网元设备基于所述状态上报时间发送的目标模型的训练状态信息;
37、其中,所述训练状态信息包括所述目标模型的模型性能指标。
38、可选地,所述接收所述第一网元设备基于所述状态上报时间发送的目标模型的训练状态信息之后,所述方法还包括:
39、根据所述训练状态信息,确定是否终止模型训练;
40、在确定终止模型训练的情况下,向所述第一网元设备发送训练终止请求,所述训练终止请求用于请求结束对所述目标模型的模型训练。
41、可选地,所述训练终止请求携带目标迭代轮次;所述向所述第一网元设备发送训练终止请求之后,所述方法还包括:
42、接收所述第一网元设备发送的通知消息,所述通知消息用于通知模型训练完成,所述通知消息携带所述目标迭代轮次对应的目标模型的模型信息。
43、可选地,所述模型训练请求还包括分析应用标识,所述分析应用标识用于生成模型训练的数据集,所述数据集包括训练集和验证集;
44、所述训练状态信息包括所述目标模型的模型性能指标,所述训练状态信息中的模型性能指标包括如下至少一项:所述目标模型在所述训练集上的模型性能指标、所述目标模型在所述验证集上的模型性能指标。
45、可选地,所述训练状态信息还包括如下至少一项:
46、迭代轮次;训练时长。
47、第三方面,本发明实施例提供了一种基于通信网络的模型训练装置,应用于第一网元设备,所述装置包括:
48、第一接收模块,用于接收第二网元设备发送的模型训练请求,所述模型训练请求中携带目标信息,所述目标信息包括如下至少一项:预期模型性能指标、状态上报时间,其中,所述状态上报时间是指所述第一网元设备在模型训练过程中向所述第二网元设备反馈训练状态的时间;
49、第一训练模块,用于基于所述模型训练请求对目标模型进行模型训练;
50、第一发送模块,用于基于所述目标信息向所述第二网元设备发送所述目标模型的训练状态信息。
51、可选地,在所述目标信息包括所述预期模型性能指标的情况下,所述发送模块具体用于:
52、在基于所述预期模型性能指标确定训练完成的情况下,向所述第二网元设备发送所述目标模型的训练状态信息;
53、其中,所述训练状态信息包括所述训练完成的目标模型的模型性能指标。
54、可选地,所述装置还包括:
55、第二接收模块,用于接收所述第二网元设备发送的重训练请求;
56、第二训练模块,用于基于所述重训练请求对训练完成的目标模型进行模型重训练。
57、可选地,在所述目标信息包括所述状态上报时间的情况下,所述发送模块具体用于:
58、获取所述目标模型在所述状态上报时间对应的训练状态信息;
59、基于所述状态上报时间向所述第二网元设备发送所述训练状态信息;
60、其中,所述训练状态信息包括所述目标模型的模型性能指标。
61、可选地,所述装置还包括:
62、第三接收模块,用于接收所述第二网元设备发送的训练终止请求;
63、第三训练模块,用于基于所述训练终止请求结束对所述目标模型的模型训练。
64、可选地,所述训练终止请求携带模型训练的目标迭代轮次;所述装置还包括:
65、第二发送模块,用于向所述第二网元设备发送通知消息,所述通知消息用于通知模型训练完成,所述通知消息携带所述目标迭代轮次对应的目标模型的模型信息。
66、可选地,所述模型训练请求还包括分析应用标识,所述第一训练模块具体用于:
67、采集用于训练所述分析应用标识对应的目标模型的数据,基于采集的数据生成用于模型训练的数据集;
68、基于所述数据集对所述分析应用标识对应的目标模型进行模型训练。
69、可选地,所述数据集包括训练集和验证集,所述训练状态信息包括所述目标模型的模型性能指标,所述训练状态信息中的模型性能指标包括如下至少一项:所述目标模型在所述训练集上的模型性能指标、所述目标模型在所述验证集上的模型性能指标。
70、可选地,所述训练状态信息还包括如下至少一项:
71、迭代轮次;训练时长。
72、第四方面,本发明实施例提供了一种基于通信网络的模型训练装置,应用于第二网元设备,所述装置包括:
73、第一发送模块,用于向第一网元设备发送模型训练请求,所述模型训练请求中携带目标信息,所述目标信息包括如下至少一项:预期模型性能指标、状态上报时间,其中,所述状态上报时间是指所述第一网元设备在模型训练过程中向所述第二网元设备反馈训练状态的时间;
74、第一接收模块,用于接收所述第一网元设备基于所述目标信息发送的目标模型的训练状态信息。
75、可选地,在所述目标信息包括所述预期模型性能指标的情况下,所述训练状态信息包括训练完成的目标模型的模型性能指标。
76、可选地,所述装置还包括:
77、第一确定模块,用于根据所述目标模型的训练状态信息确定是否触发重训练;
78、第二发送模块,用于在确定触发重训练的情况下,向所述第一网元设备发送重训练请求,所述重训练请求用于请求对所述训练完成的目标模型进行模型重训练。
79、可选地,在所述目标信息包括所述状态上报时间的情况下,所述接收模块具体用于:
80、接收所述第一网元设备基于所述状态上报时间发送的目标模型的训练状态信息;
81、其中,所述训练状态信息包括所述目标模型的模型性能指标。
82、可选地,所述装置还包括:
83、第二确定模块,用于根据所述训练状态信息,确定是否终止模型训练;
84、第三发送模块,用于在确定终止模型训练的情况下,向所述第一网元设备发送训练终止请求,所述训练终止请求用于请求结束对所述目标模型的模型训练。
85、可选地,所述训练终止请求携带目标迭代轮次;所述装置还包括:
86、第二接收模块,用于接收所述第一网元设备发送的通知消息,所述通知消息用于通知模型训练完成,所述通知消息携带所述目标迭代轮次对应的目标模型的模型信息。
87、可选地,所述模型训练请求还包括分析应用标识,所述分析应用标识用于生成模型训练的数据集,所述数据集包括训练集和验证集;
88、所述训练状态信息包括所述目标模型的模型性能指标,所述训练状态信息中的模型性能指标包括如下至少一项:所述目标模型在所述训练集上的模型性能指标、所述目标模型在所述验证集上的模型性能指标。
89、可选地,所述训练状态信息还包括如下至少一项:
90、迭代轮次;训练时长。
91、第五方面,本发明实施例提供了一种网元设备,所述网元设备为第一网元设备,包括收发机和处理器,
92、所述收发机用于:接收第二网元设备发送的模型训练请求,所述模型训练请求中携带目标信息,所述目标信息包括如下至少一项:预期模型性能指标、状态上报时间,其中,所述状态上报时间是指所述第一网元设备在模型训练过程中向所述第二网元设备反馈训练状态的时间;
93、所述处理器用于:基于所述模型训练请求对目标模型进行模型训练;
94、所述收发机还用于:基于所述目标信息向所述第二网元设备发送所述目标模型的训练状态信息。
95、可选地,在所述目标信息包括所述预期模型性能指标的情况下,所述收发机具体用于:
96、在基于所述预期模型性能指标确定训练完成的情况下,向所述第二网元设备发送所述目标模型的训练状态信息;
97、其中,所述训练状态信息包括所述训练完成的目标模型的模型性能指标。
98、可选地,所述收发机还用于:接收所述第二网元设备发送的重训练请求;
99、所述处理器还用于:基于所述重训练请求对训练完成的目标模型进行模型重训练。
100、可选地,在所述目标信息包括所述状态上报时间的情况下,所述处理器还用于:
101、获取所述目标模型在所述状态上报时间对应的训练状态信息;
102、所述收发机还用于:基于所述状态上报时间向所述第二网元设备发送所述训练状态信息;
103、其中,所述训练状态信息包括所述目标模型的模型性能指标。
104、可选地,所述收发机还用于:接收所述第二网元设备发送的训练终止请求;
105、所述处理器还用于:基于所述训练终止请求结束对所述目标模型的模型训练。
106、可选地,所述训练终止请求携带模型训练的目标迭代轮次;所述收发机还用于:向所述第二网元设备发送通知消息,所述通知消息用于通知模型训练完成,所述通知消息携带所述目标迭代轮次对应的目标模型的模型信息。
107、可选地,所述模型训练请求还包括分析应用标识,所述处理器还用于:
108、采集用于训练所述分析应用标识对应的目标模型的数据,基于采集的数据生成用于模型训练的数据集;
109、基于所述数据集对所述分析应用标识对应的目标模型进行模型训练。
110、可选地,所述数据集包括训练集和验证集,所述训练状态信息包括所述目标模型的模型性能指标,所述训练状态信息中的模型性能指标包括如下至少一项:所述目标模型在所述训练集上的模型性能指标、所述目标模型在所述验证集上的模型性能指标。
111、可选地,所述训练状态信息还包括如下至少一项:
112、迭代轮次;训练时长。
113、第六方面,本发明实施例提供了一种网元设备,所述网元设备为第二网元设备,包括收发机和处理器,
114、所述收发机用于:向第一网元设备发送模型训练请求,所述模型训练请求中携带目标信息,所述目标信息包括如下至少一项:预期模型性能指标、状态上报时间,其中,所述状态上报时间是指所述第一网元设备在模型训练过程中向所述第二网元设备反馈训练状态的时间;
115、所述收发机还用于:接收所述第一网元设备基于所述目标信息发送的目标模型的训练状态信息。
116、可选地,在所述目标信息包括所述预期模型性能指标的情况下,所述训练状态信息包括训练完成的目标模型的模型性能指标。
117、可选地,所述处理器用于:根据所述目标模型的训练状态信息确定是否触发重训练;
118、所述收发机用于:在确定触发重训练的情况下,向所述第一网元设备发送重训练请求,所述重训练请求用于请求对所述训练完成的目标模型进行模型重训练。
119、可选地,在所述目标信息包括所述状态上报时间的情况下,所述收发机用于:接收所述第一网元设备基于所述状态上报时间发送的目标模型的训练状态信息;
120、其中,所述训练状态信息包括所述目标模型的模型性能指标。
121、可选地,所述收发机用于:根据所述训练状态信息,确定是否终止模型训练;
122、所述收发机用于:在确定终止模型训练的情况下,向所述第一网元设备发送训练终止请求,所述训练终止请求用于请求结束对所述目标模型的模型训练。
123、可选地,所述训练终止请求携带目标迭代轮次;所述收发机用于:接收所述第一网元设备发送的通知消息,所述通知消息用于通知模型训练完成,所述通知消息携带所述目标迭代轮次对应的目标模型的模型信息。
124、可选地,所述模型训练请求还包括分析应用标识,所述分析应用标识用于生成模型训练的数据集,所述数据集包括训练集和验证集;
125、所述训练状态信息包括所述目标模型的模型性能指标,所述训练状态信息中的模型性能指标包括如下至少一项:所述目标模型在所述训练集上的模型性能指标、所述目标模型在所述验证集上的模型性能指标。
126、可选地,所述训练状态信息还包括如下至少一项:
127、迭代轮次;训练时长。
128、第七方面,本发明实施例提供一种网元设备,包括:处理器、存储器及存储在所述存储器上并可在所述处理器上运行的程序,所述程序被所述处理器执行时实现上述第一方面或第二方面所述的基于通信网络的模型训练方法的步骤。
129、第八方面,本发明实施例提供一种基于通信网络的模型训练系统,所述系统包括第一网元设备和第二网元设备,所述第一网元设备用于执行上述第一方面所述的基于通信网络的模型训练方法的步骤,所述第二网元设备用于执行上述第二方面所述的基于通信网络的模型训练方法的步骤。
130、第九方面,本发明实施例提供一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现上述第一方面所述的基于通信网络的模型训练方法的步骤;或者所述计算机程序被处理器执行时实现上述第二方面所述的基于通信网络的模型训练方法的步骤。
131、在本技术实施例中,接收第二网元设备发送的模型训练请求,所述模型训练请求中携带目标信息,所述目标信息包括如下至少一项:预期模型性能指标、状态上报时间,其中,所述状态上报时间是指所述第一网元设备在模型训练过程中向所述第二网元设备反馈训练状态的时间;基于所述模型训练请求对目标模型进行模型训练;基于所述目标信息向所述第二网元设备发送所述目标模型的训练状态信息。这样,第一网元设备能够基于预期模型性能指标及状态上报时间中的至少一项向所述第二网元设备反馈训练状态信息,避免训练过程完全黑盒化,能够提高消费者对模型训练的可控性,进一步的,能够提高训练的模型满足第二网元设备(如消费者)的实际应用要求的概率。
1.一种基于通信网络的模型训练方法,应用于第一网元设备,其特征在于,所述方法包括:
2.根据权利要求1所述的方法,其特征在于,在所述目标信息包括所述预期模型性能指标的情况下,所述基于所述目标信息向所述第二网元设备发送所述目标模型的训练状态信息,包括:
3.根据权利要求1或2所述的方法,其特征在于,所述基于所述目标信息向所述第二网元设备发送所述目标模型的训练状态信息之后,所述方法还包括:
4.根据权利要求1所述的方法,其特征在于,在所述目标信息包括所述状态上报时间的情况下,所述基于所述目标信息向所述第二网元设备发送所述目标模型的训练状态信息,包括:
5.根据权利要求4所述的方法,其特征在于,所述基于所述状态上报时间向所述第二网元设备发送所述训练状态信息之后,所述方法还包括:
6.根据权利要求5所述的方法,其特征在于,所述训练终止请求携带模型训练的目标迭代轮次;所述基于所述训练终止请求结束对所述目标模型的模型训练之后,所述方法还包括:
7.根据权利要求1所述的方法,其特征在于,所述模型训练请求还包括分析应用标识,所述基于所述模型训练请求对目标模型进行模型训练,包括:
8.根据权利要求7所述的方法,其特征在于,所述数据集包括训练集和验证集,所述训练状态信息包括所述目标模型的模型性能指标,所述训练状态信息中的模型性能指标包括如下至少一项:所述目标模型在所述训练集上的模型性能指标、所述目标模型在所述验证集上的模型性能指标。
9.根据权利要求8所述的方法,其特征在于,所述训练状态信息还包括如下至少一项:
10.一种基于通信网络的模型训练方法,应用于第二网元设备,其特征在于,所述方法包括:
11.根据权利要求10所述的方法,其特征在于,在所述目标信息包括所述预期模型性能指标的情况下,所述训练状态信息包括训练完成的目标模型的模型性能指标。
12.根据权利要求11所述的方法,其特征在于,所述接收所述第一网元设备基于所述目标信息发送的目标模型的训练状态信息之后,所述方法还包括:
13.根据权利要求10所述的方法,其特征在于,在所述目标信息包括所述状态上报时间的情况下,所述接收所述第一网元设备基于所述目标信息发送的目标模型的训练状态信息,包括:
14.根据权利要求13所述的方法,其特征在于,所述接收所述第一网元设备基于所述状态上报时间发送的目标模型的训练状态信息之后,所述方法还包括:
15.根据权利要求14所述的方法,其特征在于,所述训练终止请求携带目标迭代轮次;所述向所述第一网元设备发送训练终止请求之后,所述方法还包括:
16.根据权利要求10所述的方法,其特征在于,所述模型训练请求还包括分析应用标识,所述分析应用标识用于生成模型训练的数据集,所述数据集包括训练集和验证集;
17.根据权利要求16所述的方法,其特征在于,所述训练状态信息还包括如下至少一项:
18.一种基于通信网络的模型训练装置,应用于第一网元设备,其特征在于,所述装置包括:
19.一种基于通信网络的模型训练装置,应用于第二网元设备,其特征在于,所述装置包括:
20.一种网元设备,所述网元设备为第一网元设备,其特征在于,包括收发机和处理器,
21.一种网元设备,所述网元设备为第二网元设备,其特征在于,包括收发机和处理器,
22.一种网元设备,其特征在于,包括:处理器、存储器及存储在所述存储器上并可在所述处理器上运行的程序,所述程序被所述处理器执行时实现如权利要求1至9中任一项所述的基于通信网络的模型训练方法的步骤;或者实现如权利要求10至17中任一项所述的基于通信网络的模型训练方法的步骤。
23.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如权利要求1至9中任一项所述的基于通信网络的模型训练方法的步骤;或者所述计算机程序被处理器执行时实现如权利要求10至17中任一项所述的基于通信网络的模型训练方法的步骤。