本发明涉及人工智能领域,具体涉及一种基于通信运维大模型的处理方法、装置、设备和存储介质。
背景技术:
1、近来,大语言模型在许多应用领域都取得了进展,并在通信领域智能运维对话系统方面具有广泛的应用前景。通信领域的智能运维对话系统通常需要处理海量的运维数据和故障信息,帮助维护人员快速定位和解决问题。而传统的基于规则和关键字匹配的运维对话系统无法满足这些需求,因为它们很难覆盖所有可能的情况。
技术实现思路
1、为解决现有存在的技术问题,本发明实施例提供一种基于通信运维大模型的处理方法、装置、设备和存储介质。
2、为达到上述目的,本发明实施例的技术方案是这样实现的:
3、本发明实施例公开了一种基于通信运维大模型的处理方法,所述方法包括:
4、获得问题描述文本以及从数据平台获得与所述问题描述文本关联的多模态数据,所述多模态数据至少包括基站工参数据和基站业务量数据;
5、基于多模态模型对所述问题描述文本和所述多模态数据进行处理,获得所述问题描述文本对应的数据状态,所述数据状态表示网络指标异常状态;
6、基于大语言模型对所述数据状态进行处理,获得所述问题描述文本对应的定界原因和解决方案。
7、上述方案中,所述基于大语言模型对所述数据状态进行处理,获得所述问题描述文本对应的定界原因和解决方案,包括:
8、基于所述大语言模型对所述数据状态进行处理获得所述问题描述文本对应的定界原因;
9、基于所述大语言模型对所述定界原因和所述多模态数据进行处理,获得所述问题描述文本对应的解决方案。
10、上述方案中,所述多模态模型中包括时域模型和空间域模型;所述基于多模态模型对所述问题描述文本和所述多模态数据进行处理,获得所述问题描述文本对应的数据状态,包括:
11、基于所述时域模型提取所述多模态数据中各基站对应的数据的时域关联信息,基于所述时域关联信息获得第一推理结果;
12、基于所述空间域模型提取所述多模态数据中各基站之间的空间关联信息,基于所述空间关联信息获得第二推理结果;
13、对所述第一推理结果和所述第二推理结果进行融合,获得所述问题描述文本对应的数据状态。
14、上述方案中,所述基于所述时域模型提取所述多模态数据中各基站对应的数据的时域关联信息,基于所述时域关联信息获得第一推理结果,包括:
15、提取所述多模态数据的周期项信息,基于所述周期项信息采用注意力机制对所述多模态数据进行处理,获得各基站对应的数据的时域关联信息,基于所述时域关联信息获得第一推理结果;其中,所述周期项信息表征所述多模态数据的周期信息。
16、上述方案中,所述基于所述空间域模型提取所述多模态数据中各基站之间的空间关联信息,基于所述空间关联信息获得第二推理结果,包括:
17、对所述多模态数据进行特征提取,获得邻接矩阵,所述邻接矩阵表示各基站之间的欧式距离信息、各基站的区域类型信息以及各基站之间的业务量的相似度信息;
18、基于所述邻接矩阵采用图卷积神经网络对所述多模态数据进行处理,获得第二推理结果。
19、上述方案中,所述基于大语言模型对所述数据状态进行处理之前,所述方法还包括:
20、采用模型量化处理将所述大语言模型中的模型参数由全精度浮点数转换为定点数。
21、上述方案中,所述基于大语言模型对所述数据状态进行处理,包括:
22、在基于大语言模型对所述数据状态进行处理的过程中,对每个量化后的模型参数进行反量化计算,按照反量化后的模型参数对所述数据状态进行处理。
23、上述方案中,所述方法还包括:
24、基于模型参数中的数据点的分布情况确定第一阈值和第二阈值,所述第一阈值和所述第二阈值形成阈值范围;
25、若模型参数中的第一数据点在所述阈值范围内,则保留所述第一数据点;
26、若模型参数中的第二数据点不在所述阈值范围内,则将所述第二数据点标识为离群点;删除所述第二数据点,并使用位于所述阈值范围内的数值替代所述第二数据点;
27、其中,所述第一数据点和所述第二数据点均为模型参数中的任一数据点。
28、上述方案中,所述模型参数表示为模型权重矩阵;所述基于模型参数中的数据点的分布情况确定第一阈值和第二阈值,包括:
29、对所述模型权重矩阵按行进行分组,利用每组的数据点的数值确定分布信息,基于所述分布信息确定所述第一阈值和所述第二阈值。
30、上述方案中,所述使用位于所述阈值范围内的数值替代所述第二数据点,包括:使用位于所述阈值范围内、且距离所述第二数据点最近的数据点的数值替代所述第二数据点;或者,
31、使用位于所述阈值范围内的指定数据点的数值替代所述第二数据点。
32、上述方案中,所述基于多模态模型对所述问题描述文本和所述多模态数据进行处理之前,所述方法还包括:
33、获得训练数据,所述训练数据包括样本问题描述文本、样本多模态数据和样本数据状态;
34、基于待训练的多模态模型对样本问题描述文本和样本多模态数据进行处理,获得所述样本问题描述文本对应的预测数据状态;
35、基于所述预测数据状态和所述样本数据状态计算损失函数,通过所述损失函数对所述多模态模型的模型参数进行调整,以对所述多模态模型进行训练,直至达到训练截止条件。
36、上述方案中,所述基站工参数据包括以下一项或多项:基站所属区域类型、基站范围标识、基站位置的纬度、基站位置的经度;
37、所述基站业务量数据包括以下一项或多项:无线链路控制(rlc)层上行业务量、rlc层下行业务量、上行物理资源块(prb)平均利用率、下行prb平均利用率、上行用户平均速率、下行用户平均速率、接通率、无线资源控制(rrc)平均连接数、rrc最大连接数。
38、本发明实施例还提供了一种基于通信运维大模型的处理装置,所述装置包括:数据获取单元、第一处理单元和第二处理单元;其中,
39、所述数据获取单元,用于获得问题描述文本以及从数据平台获得与所述问题描述文本关联的多模态数据,所述多模态数据包括基站工参数据和基站业务量数据;
40、所述第一处理单元,用于基于多模态模型对所述问题描述文本和所述多模态数据进行处理,获得所述问题描述文本对应的数据状态,所述数据状态表示网络指标异常状态;
41、所述第二处理单元,用于基于大预言模型对所述数据状态进行处理,获得所述问题描述文本对应的定界原因和解决方案。
42、本发明实施例还提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现本发明实施例所述基于通信运维大模型的处理方法的步骤。
43、本发明实施例还提供了一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现本发明实施例所述基于通信运维大模型的处理方法的步骤。
44、本发明实施例还提供了一种计算机程序产品,包括计算机程序指令,该计算机程序指令使得计算机执行本发明实施例所述基于通信运维大模型的处理方法的步骤。
45、本发明实施例提供的基于通信运维大模型的处理方法、装置、设备和存储介质,所述方法包括:获得问题描述文本以及从数据平台获得与所述问题描述文本关联的多模态数据,所述多模态数据至少包括基站工参数据和基站业务量数据;基于多模态模型对所述问题描述文本和所述多模态数据进行处理,获得所述问题描述文本对应的数据状态;基于大语言模型对所述数据状态进行处理,获得所述问题描述文本对应的定界原因和解决方案。针对输入数据,采用多模态数据的方式,至少将基站业务量数据与基站工参数据相结合,增加了大模型的处理能力;通过大语言模型对数据进行处理,自动提取通信运维知识和模式,能够生成自然流畅的回答和建议。
1.一种基于通信运维大模型的处理方法,其特征在于,所述方法包括:
2.根据权利要求1所述的方法,其特征在于,所述基于大语言模型对所述数据状态进行处理,获得所述问题描述文本对应的定界原因和解决方案,包括:
3.根据权利要求1所述的方法,其特征在于,所述多模态模型中包括时域模型和空间域模型;所述基于多模态模型对所述问题描述文本和所述多模态数据进行处理,获得所述问题描述文本对应的数据状态,包括:
4.根据权利要求3所述的方法,其特征在于,所述基于所述时域模型提取所述多模态数据中各基站对应的数据的时域关联信息,基于所述时域关联信息获得第一推理结果,包括:
5.根据权利要求3所述的方法,其特征在于,所述基于所述空间域模型提取所述多模态数据中各基站之间的空间关联信息,基于所述空间关联信息获得第二推理结果,包括:
6.根据权利要求1所述的方法,其特征在于,所述基于大语言模型对所述数据状态进行处理之前,所述方法还包括:
7.根据权利要求6所述的方法,其特征在于,所述基于大语言模型对所述数据状态进行处理,包括:
8.根据权利要求6所述的方法,其特征在于,所述方法还包括:
9.根据权利要求8所述的方法,其特征在于,所述模型参数表示为模型权重矩阵;所述基于模型参数中的数据点的分布情况确定第一阈值和第二阈值,包括:
10.根据权利要求8所述的方法,其特征在于,所述使用位于所述阈值范围内的数值替代所述第二数据点,包括:
11.根据权利要求1所述的方法,其特征在于,所述基于多模态模型对所述问题描述文本和所述多模态数据进行处理之前,所述方法还包括:
12.根据权利要求1所述的方法,其特征在于,所述基站工参数据包括以下一项或多项:基站所属区域类型、基站范围标识、基站位置的纬度、基站位置的经度;
13.一种基于通信运维大模型的处理装置,其特征在于,所述装置包括:数据获取单元、第一处理单元和第二处理单元;其中,
14.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现权利要求1至12任一项所述方法的步骤。
15.一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现权利要求1至12任一项所述方法的步骤。
16.一种计算机程序产品,其特征在于,包括计算机程序指令,该计算机程序指令使得计算机执行权利要求1至12任一项所述方法的步骤。