本发明涉及人工智能领域,尤其涉及一种告警消息处理方法、装置、设备、介质和程序产品。
背景技术:
1、在运维领域,监控告警及由此产生的工单的处理是运维工程师最重要的工作内容之一,通过多层次的运维监控告警可以快速定位系统存在的问题,提升系统的可用性。
2、目前监控告警消息仍以人工处理流转工单为主,个别领域具备基于模型和算法来处理告警消息的方式,但无论在算力上还是数据模型规模上都不是特别完善,分析和解决问题的能力有限,同时存在反馈不足的问题,没有对原先的算法和模型进行优化。
技术实现思路
1、本发明实施例的目的是提供一种告警消息处理方法、装置、设备、介质和程序产品,引入了ai大模型来实现对告警消息进行处理和对知识库进行更新,提高了对告警消息的处理能力。
2、为实现上述目的,本发明实施例提供了一种告警消息处理方法,包括:
3、接收各个边缘集群监测到的告警消息;
4、判断所述告警消息是否记录在预设的知识库中;其中,所述知识库中记录有若干告警消息和告警处理措施的对应关系;
5、当所述告警消息未记录在所述知识库中时,调用预先训练的ai大模型进行分析,得到所述告警消息的预测处理措施;
6、根据所述告警消息和所述预测处理措施,对所述知识库进行更新。
7、作为上述方案的改进,所述当所述告警消息未记录在所述知识库中时,调用预先训练的ai大模型进行分析,得到所述告警消息的预测处理措施,包括:
8、当所述告警消息未记录在所述知识库中时,根据所述告警消息生成提问语句;
9、调用预先训练的ai大模型,将所述提问语句输入至所述ai大模型进行分析;
10、当接收到所述ai大模型的返回结果时,提取所述返回结果中的处理语句,得到所述告警消息的预测处理措施。
11、作为上述方案的改进,所述根据所述告警消息和所述预测处理措施,对所述知识库进行更新,包括:
12、将所述告警消息和所述预测处理措施生成绑定关系并输入至待人工标记知识库进行校核;
13、当校核通过时,将所述预测处理措施作为所述告警消息的告警处理措施,生成所述告警消息和告警处理措施的对应关系并存入所述知识库。
14、作为上述方案的改进,所述方法还包括:
15、当未接收到所述ai大模型的返回结果时,将所述告警消息标记为人工处理消息。
16、作为上述方案的改进,在所述判断所述告警消息是否记录在预设的知识库中之前,所述方法还包括:
17、对所述告警消息进行解析,确定告警相关字段;
18、根据所述告警相关字段,判断所述告警消息是否记录在预设的元数据库中;
19、若是,按照预设的消息体结构对所述告警消息进行封装,得到封装后的告警消息;其中,所述消息体结构由所述告警消息的相关属性组成;
20、若否,将所述告警消息丢弃。
21、作为上述方案的改进,所述判断所述告警消息是否记录在预设的知识库中,包括:
22、获取所述封装后的告警消息的消息体结构;
23、当所述知识库中记录有所述消息体结构时,判定所述告警信息记录在所述预设的知识库中;
24、当所述知识库中未记录有所述消息体结构时,判定所述告警信息未记录在所述预设的知识库中。
25、作为上述方案的改进,在所述判断在所述预设的知识库中是否记录有所述告警消息之后,所述方法还包括:
26、当所述告警消息记录在所述知识库中时,根据所述知识库查询所述告警消息对应的告警处理措施;
27、执行所述告警处理措施。
28、作为上述方案的改进,在所述接收各个边缘集群监测到的告警消息之后,所述方法还包括:
29、将所述告警消息记录到工单库;
30、获取对所述告警消息的处理结果;其中,所述处理结果包括人工处理、自动处理成功或自动处理失败;
31、根据所述处理结果更新所述工单库中所述告警消息的工单状态。
32、本发明实施例还提供了一种告警消息处理装置,包括:
33、消息接收模块,用于接收各个边缘集群监测到的告警消息;
34、消息判断模块,用于判断所述告警消息是否记录在预设的知识库中;其中,所述知识库中记录有若干告警消息和告警处理措施的对应关系;
35、消息分析模块,用于当所述告警消息未记录在所述知识库中时,调用预先训练的ai大模型进行分析,得到所述告警消息的预测处理措施;
36、知识库更新模块,用于根据所述告警消息和所述预测处理措施,对所述知识库进行更新。
37、本发明实施例还提供了一种告警消息处理设备,包括处理器、存储器以及存储在所述存储器中且被配置为由所述处理器执行的计算机程序,所述处理器执行所述计算机程序时实现如上述任意一项所述的告警消息处理方法。
38、本发明实施例还提供了一种计算机可读存储介质,所述计算机可读存储介质包括存储的计算机程序,其中,在所述计算机程序运行时控制所述计算机可读存储介质所在设备执行如上述任意一项所述的告警消息处理方法。
39、本发明实施例还提供了一种计算机程序产品,所述计算机程序产品包括计算机程序或计算机指令,所述计算机程序或所述计算机指令被处理器执行时实现如上述任意一项所述的告警消息处理方法。
40、与现有技术相比,本发明公开的告警消息处理方法、装置、设备、介质和程序产品,通过搜集各个边缘集群监控的告警消息,根据知识库匹配和ai回答的结果,进行自动处理或转人工,并且将ai回答的知识补充进知识库。本发明实施例完善了对告警消息进行处理的算力和数据模型规模,提高了对告警消息的处理能力,并且本发明实施例实现了完整的闭环反馈,接收到告警信息,到知识库匹配以及基于人工智能的扩充,实现调用相应的脚本自动操作实现故障的治愈,可以节省大量的运维监控人力,更进一步提高了对告警消息的处理能力。
1.一种告警消息处理方法,其特征在于,包括:
2.如权利要求1所述的告警消息处理方法,其特征在于,所述当所述告警消息未记录在所述知识库中时,调用预先训练的ai大模型进行分析,得到所述告警消息的预测处理措施,包括:
3.如权利要求2所述的告警消息处理方法,其特征在于,所述根据所述告警消息和所述预测处理措施,对所述知识库进行更新,包括:
4.如权利要求2所述的告警消息处理方法,其特征在于,所述方法还包括:
5.如权利要求1所述的告警消息处理方法,其特征在于,在所述判断所述告警消息是否记录在预设的知识库中之前,所述方法还包括:
6.如权利要求5所述的告警消息处理方法,其特征在于,所述判断所述告警消息是否记录在预设的知识库中,包括:
7.如权利要求1所述的告警消息处理方法,其特征在于,在所述判断在所述预设的知识库中是否记录有所述告警消息之后,所述方法还包括:
8.如权利要求4或7所述的告警消息处理方法,其特征在于,在所述接收各个边缘集群监测到的告警消息之后,所述方法还包括:
9.一种告警消息处理装置,其特征在于,包括:
10.一种告警消息处理设备,其特征在于,包括处理器、存储器以及存储在所述存储器中且被配置为由所述处理器执行的计算机程序,所述处理器执行所述计算机程序时实现如权利要求1至8中任意一项所述的告警消息处理方法。
11.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质包括存储的计算机程序,其中,在所述计算机程序运行时控制所述计算机可读存储介质所在设备执行如权利要求1至8中任意一项所述的告警消息处理方法。
12.一种计算机程序产品,其特征在于,所述计算机程序产品包括计算机程序或计算机指令,所述计算机程序或所述计算机指令被处理器执行时实现如权利要求1至8中任意一项所述的告警消息处理方法。