故障根因分析方法、装置、设备及介质与流程

    技术2025-03-18  40


    本申请属于计算机,尤其涉及一种故障根因分析方法、装置、设备及介质。


    背景技术:

    1、随着互联网业务快速扩张以及业务的多样化发展,业务变得越来越复杂。通常采用领域驱动和微服务的方法,把复杂的业务按业务领域进行拆分并开发面向业务领域的独立简单的微服务,服务之间采用轻量级的通信协议进行通信,例如rpc(remote procedurecall,远程过程调用)协议。

    2、微服务降低了业务复杂度,但增加了it基础设施的复杂度,并且服务之间的调用关系复杂,难以追踪和排查各服务故障之间的关系。目前,主要采用全链路追踪的方式,由于需要侵入业务代码,导致会对业务产生一定程度的影响。


    技术实现思路

    1、本申请实施例提供一种故障根因分析方法、装置、设备及介质,能够在不影响业务的情况下,快速确定故障异常,实现根因分析。

    2、第一方面,本申请实施例提供一种故障根因分析方法,所述方法包括:

    3、在监控到发生故障事件的情况下,确定所述故障事件对应的运维实体实例;

    4、根据所述故障事件对应的运维实体实例,在预先构建的目标知识图谱中查询所述故障事件对应的因果关系;

    5、根据所述因果关系,通过预先构建的概念知识图谱范畴的拓扑分类器推断目标事件的发生情况以实现根因分析,所述目标事件与所述故障事件之间存在因果关系。

    6、第二方面,本申请实施例提供了一种故障根因分析装置,所述装置包括:

    7、确定模块,用于在监控到发生故障事件的情况下,确定所述故障事件对应的运维实体实例;

    8、查询模块,用于根据所述故障事件对应的运维实体实例,在预先构建的目标知识图谱中查询所述故障事件对应的因果关系;

    9、推断模块,用于根据所述因果关系,通过预先构建的概念知识图谱范畴的拓扑分类器推断目标事件的发生情况以实现根因分析,所述目标事件与所述故障事件之间存在因果关系。

    10、第三方面,本申请实施例提供了一种电子设备,该电子设备包括:处理器以及存储有计算机程序指令的存储器;处理器执行所述计算机程序指令时实现如第一方面的任一项实施例中所述的故障根因分析方法的步骤。

    11、第四方面,本申请实施例提供了一种计算机可读存储介质,计算机可读存储介质上存储有计算机程序指令,计算机程序指令被处理器执行时实现如第一方面的任一项实施例中所述的故障根因分析方法的步骤。

    12、本申请实施例的故障根因分析方法、装置、设备及介质,在监控到发生故障事件的情况下,根据故障事件对应的实体及其在知识图谱中对应的因果关系,利用预先构建的拓扑分类器,来推断与故障事件相关的目标事件的发生情况,无需侵入业务代码,能够在不影响业务的情况下,快速确定故障异常,实现根因分析,并且明确因果关系,能够提升推理准确度。



    技术特征:

    1.一种故障根因分析方法,其特征在于,包括:

    2.根据权利要求1所述的方法,其特征在于,在监控到发生故障事件的情况下,确定所述故障事件对应的运维实体实例之前,所述方法还包括:

    3.根据权利要求2所述的方法,其特征在于,所述根据所述概念知识图谱中各个运维实体对应的因果关系,构建概念知识图谱范畴的拓扑分类器,包括:

    4.根据权利要求2所述的方法,其特征在于,在所述根据系统指标和业务运行指标,构建应用于运维场景下的知识图谱之后,所述方法还包括:

    5.根据权利要求3所述的方法,其特征在于,所述态射函子包括协变态射函子和逆变态射函子;针对每个所述运维实体事件,所述协变态射函子的值域为自身运维实体事件,所述逆变态射函子的定义域为自身运维实体事件;

    6.根据权利要求5所述的方法,其特征在于,所述分别对所述拓扑集合中的各个元素赋值,得到概念知识图谱范畴的拓扑分类器,包括:

    7.根据权利要求6所述的方法,其特征在于,在所述分别对所述拓扑集合中的各个元素赋值,得到概念知识图谱范畴的拓扑分类器之后,所述方法还包括:

    8.一种故障根因分析装置,其特征在于,所述装置包括:

    9.一种电子设备,其特征在于,所述设备包括:处理器以及存储有计算机程序指令的存储器;所述处理器调用所述计算机程序指令时实现如权利要求1-7中任意一项所述的故障根因分析方法。

    10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有计算机程序指令,所述计算机程序指令被处理器调用时实现如权利要求1-7中任意一项所述的故障根因分析方法。


    技术总结
    本申请公开了一种故障根因分析方法、装置、设备及介质。所述方法包括:在监控到发生故障事件的情况下,确定所述故障事件对应的运维实体实例;根据所述故障事件对应的运维实体实例,在预先构建的目标知识图谱中查询所述故障事件对应的因果关系;根据所述因果关系,通过预先构建的概念知识图谱范畴的拓扑分类器推断目标事件的发生情况以实现根因分析,所述目标事件与所述故障事件之间存在因果关系。根据本申请实施例,能够在不影响业务的情况下,快速确定故障异常,实现根因分析,并且明确因果关系,能够提升推理准确度。

    技术研发人员:罗维,廖筱芮,左庆邻,刘昶
    受保护的技术使用者:中移物联网有限公司
    技术研发日:
    技术公布日:2024/10/24
    转载请注明原文地址:https://symbian.8miu.com/read-27702.html

    最新回复(0)