存储链路故障原因定位方法、存储子系统及计算机设备与流程

    技术2024-12-11  16


    本发明涉及服务器,具体涉及存储链路故障原因定位方法、存储子系统及计算机设备。


    背景技术:

    1、随着服务器产业的不断发展,用户对服务器安全性和可靠性要求越来越高。由磁盘阵列卡、硬盘、扩展背板、线缆等部件组成的存储子系统,为服务器整机的重要组成部分,因此,存储子系统的安全性和可靠性至关重要。

    2、相关技术中,在存储子系统的存储链路出现故障的情况下,可以通过存储链路上各个部件的日志文件来确定存储链路出现故障的原因。

    3、然而,在通过存储链路上各个部件的日志文件来确定存储链路出现故障的原因时,由于扩展背板的日志文件只能记录扩展背板的基本异常事件,无法记录命令执行相关的信息,导致确定出的存储链路出现故障的原因的准确性较低。


    技术实现思路

    1、有鉴于此,本发明提供了一种存储链路故障原因定位方法、存储子系统及计算机设备,以解决相关技术中由于扩展背板的日志文件只能记录扩展背板的基本异常事件,无法记录命令执行相关的信息,导致确定出的存储链路出现故障的原因的准确性较低的问题。

    2、第一方面,本发明提供了一种存储链路故障原因定位方法,所述方法包括:

    3、获取扩展背板的串行日志记录模块的开关状态;

    4、在所述扩展背板的串行日志记录模块的开关状态为开启状态的情况下,利用所述串行日志记录模块记录服务器下发的目标命令的命令执行信息;

    5、在所述存储链路出现故障的情况下,获取磁盘阵列卡对应的第一日志信息、硬盘对应的第二日志信息和所述串行日志记录模块记录的目标命令执行信息;

    6、将所述第一日志信息、第二日志信息和目标命令执行信息发送至服务器主机端,以使技术人员基于所述服务器主机端接收到的第一日志信息、第二日志信息和目标命令执行信息进行存储链路故障原因定位。

    7、本实施例提供的存储链路故障原因定位方法,通过在扩展背板的串行日志记录模块的开关状态为开启状态的情况下,利用串行日志记录模块记录服务器下发的目标命令的命令执行信息,在存储链路出现故障的情况下,将磁盘阵列卡对应的第一日志信息、硬盘对应的第二日志信息和串行日志记录模块记录的目标命令执行信息发送至服务器主机端,以使技术人员基于服务器主机端接收到的第一日志信息、第二日志信息和目标命令执行信息进行存储链路故障原因定位。通过利用串行日志记录模块记录服务器下发的目标命令的命令执行信息,使得基于第一日志信息、第二日志信息和目标命令执行信息确定出的存储链路故障原因更加准确,提高了存储链路故障原因定位的准确性。

    8、在一种可选的实施方式中,所述利用所述串行日志记录模块记录服务器下发的目标命令的命令执行信息,包括:

    9、接收服务器下发的命令;

    10、在所述命令的类型为目标命令类型的情况下,确定所述命令为目标命令,其中,所述目标命令类型为读写类命令、监控类命令、自我监控分析类命令、节能类命令和链路重置类命令;

    11、利用所述串行日志记录模块,采用覆盖写的方式记录服务器下发的目标命令的命令执行信息。

    12、本实施例提供的存储链路故障原因定位方法,通过串行日志记录模块记录服务器下发的目标命令的命令执行信息,提高了确定存储链路故障原因定位的效率。

    13、采用覆盖写的方式记录日志,可以有效利用有限的存储空间实现最大的性能,避免了日志无限累计导致的存储空间耗尽的问题,保证了日志记录的稳定运行。

    14、在一种可选的实施方式中,在所述存储链路出现故障的情况下,获取所述串行日志记录模块记录的目标命令执行信息,包括:

    15、在所述存储链路出现故障的情况下,判断所述串行日志记录模块是否设置有关键字触发条件;

    16、在所述串行日志记录模块设置有关键字触发条件的情况下,利用所述关键字触发条件中包含的关键字对所述串行日志记录模块记录的命令执行信息进行筛选,以获得目标命令执行信息。

    17、本实施例提供的存储链路故障原因定位方法,通过在存储链路出现故障的情况下,引入关键字触发条件,根据关键字触发条件从串行日志记录模块记录的命令执行信息中筛选出与故障原因定位关联度高的目标命令执行信息,不仅减少了后期对命令执行信息的分析负担,还提高了存储链路故障原因定位的效率和准确性。

    18、在一种可选的实施方式中,所述利用所述关键字触发条件中包含的关键字对所述串行日志记录模块记录的命令执行信息进行筛选,以获得目标命令执行信息,包括:

    19、针对任一命令执行信息,若所述命令执行信息中包括至少一个所述关键字,则确定所述命令执行信息为目标命令执行信息。

    20、本实施例提供的存储链路故障原因定位方法,通过关键字匹配,能够从大量日志数据中迅速识别出与故障原因定位相关的命令执行信息,提高了存储链路故障原因定位的效率和准确性。

    21、在一种可选的实施方式中,所述方法还包括:

    22、在所述串行日志记录模块未设置有关键字触发条件的情况下,将所述串行日志记录模块当前记录的命令执行信息作为目标命令执行信息。

    23、本实施例提供的存储链路故障原因定位方法,通过在串行日志记录模块未设置有关键字触发条件的情况下,将串行日志记录模块当前记录的命令执行信息作为目标命令执行信息,确保了进行存储链路故障原因定位的稳定性和业务连续性。

    24、在一种可选的实施方式中,所述方法还包括:

    25、在所述存储链路出现故障的情况下,暂停利用所述串行日志记录模块记录服务器下发的目标命令的命令执行信息。

    26、本实施例提供的存储链路故障原因定位方法,通过在存储链路出现故障的情况下,暂停利用串行日志记录模块记录服务器下发的目标命令的命令执行信息,防止关键日志被覆盖,提高了存储链路故障原因定位的准确性。

    27、在一种可选的实施方式中,所述方法还包括:

    28、在将所述第一日志信息、第二日志信息和目标命令执行信息发送至服务器主机端之后,继续利用所述串行日志记录模块记录服务器下发的目标命令的命令执行信息。

    29、本实施例提供的存储链路故障原因定位方法,在将第一日志信息、第二日志信息和目标命令执行信息发送至服务器主机端之后,继续利用串行日志记录模块记录服务器下发的目标命令的命令执行信息,确保了日志记录的连续性。

    30、在一种可选的实施方式中,所述方法还包括:

    31、在所述存储链路出现故障的情况下,获取扩展背板对应的基本日志信息;

    32、所述将所述第一日志信息、第二日志信息和目标命令执行信息发送至服务器主机端,以使技术人员基于所述服务器主机端接收到的第一日志信息、第二日志信息和目标命令执行信息进行存储链路故障原因定位,包括:

    33、将所述第一日志信息、第二日志信息、基本日志信息和目标命令执行信息发送至服务器主机端,以使技术人员基于所述服务器主机端接收到的第一日志信息、第二日志信息、基本日志信息和目标命令执行信息进行存储链路故障原因定位。

    34、本实施例提供的存储链路故障原因定位方法,通过基于第一日志信息、第二日志信息、基本日志信息和目标命令执行信息确定存储链路故障原因定位,使得确定出的存储链路故障原因更加准确,提高了存储链路故障原因定位的准确性。

    35、在一种可选的实施方式中,所述方法还包括:

    36、在所述扩展背板的串行日志记录模块的开关状态为关闭状态的情况下,利用扩展背板日志记录模块记录扩展背板对应的基本日志信息。

    37、本实施例提供的存储链路故障原因定位方法,通过在扩展背板的串行日志记录模块的开关状态为关闭状态的情况下,只利用扩展背板日志记录模块记录扩展背板对应的基本日志信息,提升了系统的稳定性,实现资源的高效利用。

    38、在一种可选的实施方式中,所述命令执行信息包括:命令响应时间、命令类型、命令模式、执行状态信息和错误状态信息。

    39、本实施例提供的存储链路故障原因定位方法,通过利用串行日志记录模块记录服务器下发的目标命令的命令执行信息,使得基于第一日志信息、第二日志信息和目标命令执行信息确定出的存储链路故障原因更加准确,提高了存储链路故障原因定位的准确性。

    40、第二方面,本发明提供了一种扩展背板,所述扩展背板包括:串行日志记录模块,其中,所述串行日志记录模块包括开关控制模块和串行日志记录子单元;

    41、所述开关控制模块用于响应于用户的操作,控制所述串行日志记录子单元的开关状态;

    42、所述串行日志记录子单元用于在开启状态下记录服务器主机下发的目标命令的命令执行信息。

    43、第三方面,本发明提供了一种存储子系统,所述存储子系统包括:磁盘阵列卡、扩展背板和硬盘,其中,所述存储子系统用于基于上述第一方面或其对应的任一实施方式的存储链路故障原因定位方法进行存储链路故障原因定位。

    44、第四方面,本发明提供了一种计算机设备,包括:存储器和处理器,存储器和处理器之间互相通信连接,存储器中存储有计算机指令,处理器通过执行计算机指令,从而执行上述第一方面或其对应的任一实施方式的存储链路故障原因定位方法。

    45、第五方面,本发明提供了一种计算机可读存储介质,该计算机可读存储介质上存储有计算机指令,计算机指令用于使计算机执行上述第一方面或其对应的任一实施方式的存储链路故障原因定位方法。

    46、第六方面,本发明提供了一种计算机程序产品,包括计算机指令,计算机指令用于使计算机执行上述第一方面或其对应的任一实施方式的存储链路故障原因定位方法。


    技术特征:

    1.一种存储链路故障原因定位方法,其特征在于,所述方法包括:

    2.根据权利要求1所述的方法,其特征在于,所述利用所述串行日志记录模块记录服务器下发的目标命令的命令执行信息,包括:

    3.根据权利要求1所述的方法,其特征在于,在所述存储链路出现故障的情况下,获取所述串行日志记录模块记录的目标命令执行信息,包括:

    4.根据权利要求3所述的方法,其特征在于,所述利用所述关键字触发条件中包含的关键字对所述串行日志记录模块记录的命令执行信息进行筛选,以获得目标命令执行信息,包括:

    5.根据权利要求3所述的方法,其特征在于,所述方法还包括:

    6.根据权利要求1所述的方法,其特征在于,所述方法还包括:

    7.根据权利要求6所述的方法,其特征在于,所述方法还包括:

    8.根据权利要求1所述的方法,其特征在于,所述方法还包括:

    9.根据权利要求1所述的方法,其特征在于,所述方法还包括:

    10.根据权利要求1所述的方法,其特征在于,所述命令执行信息包括:命令响应时间、命令类型、命令模式、执行状态信息和错误状态信息。

    11.一种扩展背板,其特征在于,所述扩展背板包括:串行日志记录模块,其中,所述串行日志记录模块包括开关控制模块和串行日志记录子单元;

    12.一种存储子系统,其特征在于,所述存储子系统包括:磁盘阵列卡、扩展背板和硬盘,其中,所述存储子系统用于基于权利要求1-10中任一项所述的存储链路故障原因定位方法进行存储链路故障原因定位。

    13.一种计算机设备,其特征在于,包括:

    14.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有计算机指令,所述计算机指令用于使计算机执行权利要求1至10中任一项所述的存储链路故障原因定位方法。

    15.一种计算机程序产品,其特征在于,包括计算机指令,所述计算机指令用于使计算机执行权利要求1至10中任一项所述的存储链路故障原因定位方法。


    技术总结
    本发明涉及服务器技术领域,公开了存储链路故障原因定位方法、存储子系统及计算机设备,方法包括:获取扩展背板的串行日志记录模块的开关状态,在扩展背板的串行日志记录模块的开关状态为开启状态的情况下,利用串行日志记录模块记录服务器下发的目标命令的命令执行信息;在存储链路出现故障的情况下,获取磁盘阵列卡对应的第一日志信息、硬盘对应的第二日志信息和串行日志记录模块记录的目标命令执行信息;将第一日志信息、第二日志信息和目标命令执行信息发送至服务器主机端,以使技术人员基于第一日志信息、第二日志信息和目标命令执行信息进行存储链路故障原因定位。本发明提高了存储链路故障原因定位的准确性。

    技术研发人员:刘凤刚,路明远,周春法,姜璐
    受保护的技术使用者:苏州元脑智能科技有限公司
    技术研发日:
    技术公布日:2024/10/24
    转载请注明原文地址:https://symbian.8miu.com/read-23436.html

    最新回复(0)