本发明涉及人工智能,尤其涉及一种互联网设备故障诊断方法及系统。
背景技术:
1、随着互联网规模的不断扩大,互联网应用及基础设施即服务(infrastructure asa service,简称iaas)设备不断增加,系统结构日趋复杂,故障率也随之增加,现有的设备故障诊断通常依赖于运维人员的人力和经验,需要花费大量时间和精力进行问题的分析和解决。
2、然而,随着互联网规模的不断扩大以及系统复杂性的增加,仅依靠人工进行故障诊断已经无法满足快速且精准地处理故障的需求。运维人员面临着大量的数据和信息,需要在短时间内对复杂的系统进行诊断和修复。这种过程中存在人为的主观判断、误判和延误处理的风险。
3、因此,现在亟需一种互联网设备故障诊断方法及系统来解决上述问题。
技术实现思路
1、针对现有技术存在的问题,本发明提供一种互联网设备故障诊断方法及系统。
2、本发明提供一种互联网设备故障诊断方法,包括:
3、在确定目标互联网设备发生故障后,在预设时长内获取所述目标互联网设备的实时业务状态数据;
4、将所述实时业务状态数据输入至互联网设备实时故障诊断模型中,得到由所述互联网设备实时故障诊断模型输出的故障诊断结果,其中,所述互联网设备实时故障诊断模型是基于标记有互联网设备故障类型标签以及故障指标标签的样本业务状态数据,对神经网络模型进行训练得到的。
5、根据本发明提供的一种互联网设备故障诊断方法,所述互联网设备实时故障诊断模型通过以下步骤训练得到:
6、获取多个样本互联网设备的历史业务状态数据;
7、根据各个所述样本互联网设备在历史时刻发生设备故障时生成的故障信息,确定所述历史业务状态数据对应的故障类型,并根据所述故障类型,获取样本故障指标数据,其中,所述样本故障指标数据为所述历史业务状态数据中引起设备故障的数据;
8、根据所述故障类型和所述样本故障指标数据,生成所述历史业务状态数据对应的故障标签,以得到所述样本业务状态数据;
9、通过所述样本业务状态数据,对所述神经网络模型进行训练,若满足训练条件,得到所述互联网设备实时故障诊断模型。
10、根据本发明提供的一种互联网设备故障诊断方法,所述神经网络模型为反向传播神经网络模型;
11、所述通过所述样本业务状态数据,对所述神经网络模型进行训练,若满足训练条件,得到所述互联网设备实时故障诊断模型,包括:
12、判断每一轮训练过程中的训练结果是否满足预设误差阈值,若不满足,则通过模型参数修正公式,对所述反向传播神经网络模型中的连接权值和阈值进行更新,直至当前训练轮次的训练结果满足所述预设误差阈值,得到所述互联网设备实时故障诊断模型,所述模型参数修正公式为:
13、
14、
15、
16、
17、
18、
19、其中,w表示连接权值,j表示第j个隐层节点,k表示第k个输出层节点,n0表示迭代次数,p表示样本个数,η表示步长,oj表示第j个隐层节点的输出,i表示第i个输入层节点,θ表示所述反向传播神经网络模型中的阈值,t表示期望输出值,y表示网络预测输出值。
20、根据本发明提供的一种互联网设备故障诊断方法,所述方法还包括:
21、在确定所述目标互联网设备发生故障后,若在所述预设时长内未获取到所述实时业务状态数据,接收第一输入,所述第一输入包括查询所述目标互联网设备前n个时刻的业务状态数据的操作;
22、响应于所述第一输入,将获取到的前n个时刻的业务状态数据与预设互联网设备故障诊断树进行匹配,得到所述目标互联网设备的故障诊断结果,其中,所述预设互联网设备故障诊断树是通过故障类型与故障特征之间的逻辑因果关系构建的。
23、根据本发明提供的一种互联网设备故障诊断方法,在所述将所述实时业务状态数据输入至互联网设备实时故障诊断模型中,得到由所述互联网设备实时故障诊断模型输出的故障诊断结果之后,所述方法还包括:
24、根据所述故障诊断结果,确定所述目标互联网设备的故障类型和故障指标数据;
25、将所述故障类型和所述故障指标数据,与预设故障处理方案库中的故障处理方案进行匹配,得到目标处理方案;
26、根据所述故障类型、所述故障指标数据和所述目标处理方案,生成对应的故障告警信息。
27、根据本发明提供的一种互联网设备故障诊断方法,所述在预设时长内获取所述目标互联网设备的实时业务状态数据,还包括:
28、对所述实时业务状态数据进行数据数据预处理,得到预处理后的实时业务状态数据,以通过所述预处理后的实时业务状态数据进行互联网设备故障诊断,其中,所述数据预处理至少包括去噪处理、缺失值处理和时间戳处理。
29、本发明还提供一种互联网设备故障诊断系统,包括:
30、实时数据采集模块,用于在确定目标互联网设备发生故障后,在预设时长内获取所述目标互联网设备的实时业务状态数据;
31、故障诊断模块,用于将所述实时业务状态数据输入至互联网设备实时故障诊断模型中,得到由所述互联网设备实时故障诊断模型输出的故障诊断结果,其中,所述互联网设备实时故障诊断模型是基于标记有互联网设备故障类型标签以及故障指标标签的样本业务状态数据,对神经网络模型进行训练得到的。
32、本发明还提供一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现如上述任一种所述互联网设备故障诊断方法。
33、本发明还提供一种非暂态计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现如上述任一种所述互联网设备故障诊断方法。
34、本发明还提供一种计算机程序产品,包括计算机程序,所述计算机程序被处理器执行时实现如上述任一种所述互联网设备故障诊断方法。
35、本发明提供的互联网设备故障诊断方法及系统,在确定目标互联网设备发生故障后,通过神经网络训练得到的互联网设备实时故障诊断模型,对预设时长内获取到的目标互联网设备的实时业务状态数据进行故障诊断,从而实现自动化的设备故障检测和定位,提高了互联网设备故障诊断的准确性和效率。
1.一种互联网设备故障诊断方法,其特征在于,包括:
2.根据权利要求1所述的互联网设备故障诊断方法,其特征在于,所述互联网设备实时故障诊断模型通过以下步骤训练得到:
3.根据权利要求2所述的互联网设备故障诊断方法,其特征在于,所述神经网络模型为反向传播神经网络模型;
4.根据权利要求1所述的互联网设备故障诊断方法,其特征在于,所述方法还包括:
5.根据权利要求1所述的互联网设备故障诊断方法,其特征在于,在所述将所述实时业务状态数据输入至互联网设备实时故障诊断模型中,得到由所述互联网设备实时故障诊断模型输出的故障诊断结果之后,所述方法还包括:
6.根据权利要求1所述的互联网设备故障诊断方法,其特征在于,所述在预设时长内获取所述目标互联网设备的实时业务状态数据,还包括:
7.一种互联网设备故障诊断系统,其特征在于,包括:
8.一种电子设备,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如权利要求1至6任一项所述互联网设备故障诊断方法。
9.一种非暂态计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至6任一项所述互联网设备故障诊断方法。
10.一种计算机程序产品,包括计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至6任一项所述互联网设备故障诊断方法。