一种系统宕机时异常信息的捕获方法、设备及介质与流程

    技术2025-02-02  54


    本申请涉及计算机信息,具体涉及一种系统宕机时异常信息的捕获方法、设备及介质。


    背景技术:

    1、随着计算机应用的快速发展,linux作为一种开源的操作系统,其使用范围和应用场景不断扩大,深受开发者、企业以及个人用户的青睐。linux内核的稳定性和容错性使系统一般情况下不会出现无法挽回的故障,但是linux系统崩溃从而导致系统宕机的问题无法完全避免。

    2、基板管理控制器(bmc)是一种独立的处理器和软件组件,通常嵌入在服务器硬件中,独立于主处理器和操作系统,通过ipmi协议对操作系统的硬件状态(如温度、电压、风扇速度)进行监控,还能收集事件日志、执行远程重启、远程开关机等,但是当系统宕机时,bmc和服务器(os)便无法进行交互。

    3、当linux系统出现宕机时,通常会通过linux系统提供内核崩溃捕获机制(比如kdump机制),来发现和收集系统崩溃类问题工具,去捕获并转储内核崩溃信息,bmc可以根据内核崩溃捕获机制捕获到的信息,了解系统宕机原因,从而对linux系统采取针对性的恢复措施。然而,内核崩溃捕获机制在进行内核转储时需要足够的空闲内存来保存转储信息,如果系统内存不足,特别是当系统在高负载运行时,可能无法为内核崩溃捕获机制预留足够的内存空间,从而导致捕获失败,使系统宕机原因不明确。


    技术实现思路

    1、为了解决上述问题,本申请提出了一种系统宕机时异常信息的捕获方法,包括:

    2、确定系统宕机,触发内核崩溃捕获机制,通过所述内核崩溃捕获机制自动生成内核转储文件;

    3、获取所述内核转储文件,根据所述内核转储文件判断所述内核崩溃捕获机制是否捕获成功;

    4、若否,则执行预设抓取脚本,检索内核崩溃日志,在所述内核崩溃日志中检索内核堆栈信息,通过命令行接口,将检索到的所述内核堆栈信息发送给基板管理控制器;

    5、通过所述基板管理控制器,根据所述内核堆栈信息,将系统宕机事件记录在日志中,并通过基板管理控制器界面进行显示。

    6、另一方面,本申请还提出一种系统宕机时异常信息的捕获方法设备,包括:

    7、至少一个处理器;以及,

    8、与所述至少一个处理器通信连接的存储器;其中,

    9、所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行如:上述示例所述的一种系统宕机时异常信息的捕获方法。

    10、另一方面,本申请还提出了一种非易失性计算机存储介质,存储有计算机可执行指令,所述计算机可执行指令设置为:上述示例所述的一种系统宕机时异常信息的捕获方法。

    11、通过本申请提出一种系统宕机时异常信息的捕获方法能够带来如下有益效果:

    12、通过捕获异常信息,可以迅速定位到导致系统宕机的具体原因以及对应的错误代码,大大缩短问题解决的时间,快速响应并解决系统宕机问题,可以减少服务中断的时间,降低对用户的影响。

    13、当未捕获到内核堆栈时,执行预设的脚本,再次捕获,从而提高再次捕获内核堆栈的成功率,确保尽可能多的重要信息被保留下来,为后续的问题分析提供全面而准确的数据支持。



    技术特征:

    1.一种系统宕机时异常信息的捕获方法,其特征在于,包括:

    2.根据权利要求1所述的一种系统宕机时异常信息的捕获方法,其特征在于,所述通过所述内核崩溃捕获机制自动生成内核转储文件,具体包括:

    3.根据权利要求1所述的一种系统宕机时异常信息的捕获方法,其特征在于,所述根据所述内核转储文件判断所述内核崩溃捕获机制是否捕获成功,具体包括:

    4.根据权利要求1所述的一种系统宕机时异常信息的捕获方法,其特征在于,所述确定系统宕机,触发内核崩溃捕获机制之前,所述方法还包括:

    5.根据权利要求4所述的一种系统宕机时异常信息的捕获方法,其特征在于,所述执行预设抓取脚本,检索内核崩溃日志,在所述内核崩溃日志中检索内核堆栈信息,具体包括:

    6.根据权利要求5所述的一种系统宕机时异常信息的捕获方法,其特征在于,所述通过基板管理控制器界面进行显示,具体包括:

    7.根据权利要求6所述的一种系统宕机时异常信息的捕获方法,其特征在于,所述将接收到的所述内核堆栈信息、所述寄存器信息和所述告警信息进行显示,具体包括:

    8.根据权利要求1所述的一种系统宕机时异常信息的捕获方法,其特征在于,所述根据所述内核堆栈信息,将系统宕机事件记录在日志中,具体包括:

    9.一种系统宕机时异常信息的捕获方法设备,其特征在于,包括:

    10.一种非易失性计算机存储介质,存储有计算机可执行指令,其特征在于,所述计算机可执行指令设置为:


    技术总结
    本申请公开了一种系统宕机时异常信息的捕获方法、设备及介质,涉及计算机信息技术领域,方法包括:确定系统宕机,触发内核崩溃捕获机制,通过内核崩溃捕获机制自动生成内核转储文件,获取内核转储文件,根据内核转储文件判断内核崩溃捕获机制是否捕获成功,若否,则执行预设抓取脚本,检索内核崩溃日志,在内核崩溃日志中检索内核堆栈信息,通过命令行接口,将检索到的内核堆栈信息发送给基板管理控制器,通过基板管理控制器,根据内核堆栈信息,将系统宕机事件记录在日志中,并通过基板管理控制器界面进行显示。当未捕获到内核堆栈时,再次捕获,从而提高再次捕获内核堆栈的成功率,为后续的问题分析提供全面而准确的数据支持。

    技术研发人员:贾晓萌,薛兵,单震
    受保护的技术使用者:浪潮卓数大数据产业发展有限公司
    技术研发日:
    技术公布日:2024/10/24
    转载请注明原文地址:https://symbian.8miu.com/read-25767.html

    最新回复(0)