本发明属于机房设备监控,尤其涉及一种机房设备状态监控方法、系统及监控终端。
背景技术:
1、随着信息技术的快速发展,机房设备成为现代企业必不可少的设备,比如矿山、工厂、金融、医疗等领域都需要机房设备。目前,机房设备通常包括服务器、存储设备、网络设备、ups电源等基础设施,这些设备的稳定运行对于企业的业务运营至关重要,任何一项设备损坏或运行问题都可能导致企业的经济损失及工作效率降低。随着机房设备数量的不断增多和设备的复杂性不断提高,机房设备的管理和维护也变得越来越困难,企业往往需要大量的人力和物力进行管理和维护,成本很大。因此,对机房设备状态监控至关重要。
2、现有的机房设备健康管理方法,只针对单一设备进行健康管理,对于不同类型的设备需要定制不同的健康模型,整个过程需要消耗大量时间才能完成。在这个过程中,若发生设备故障或异常,不能及时处理,很容易造成设备进一步损坏或停机,从而影响工作效率和服务质量。尤其是在设备数据量大的情况下,可能需要更长的时间来进行故障排查和修复。
技术实现思路
1、本发明提供一种机房设备状态监控方法,方法可以解决现有的机房设备健康管理方法只针对单一设备,处理时间长,工作效率和服务质量低的问题。
2、方法包括:
3、s101:在机房监控区域部署分布式边缘监测网络,并在机房内设置多个边缘节点,在每个边缘节点安装监测设备,监测设备监测机房内设备的设备监测指标;
4、s102:构建数字孪生模型,云端服务器接收监测设备采集的设备监测指标,并通过关联成分筛选的方式对设备监测指标进行筛选,筛选出异常设备监测指标,还基于数字孪生模型将实时采集到的设备监测指标映射至数字孪生模型的虚拟空间内;
5、s103:在虚拟空间内采用改进式yolov5模型对机房内设备监测指标进行健康状态评估和风险预测;
6、s104:云端服务器利用自监督推理引擎对异常设备监测指标进行推理,并根据设备监测指标的异常状态触发异常恢复机制;
7、s105:基于数字孪生模型,对机房设备的设备监测指标进行模拟测试,评估当前监控方案的可行性。
8、进一步需要说明的是,步骤s101中,监测设备包括但不限于:温度传感器、湿度传感器、电力监测仪和网络分析仪;
9、监测的设备监测指标包括但不限于温度、湿度、电压、电流和负载。
10、进一步需要说明的是,方法中,分布式边缘监测网络通过微服务架构将监测任务拆分成多个独立服务,并采用轻量级通信机制进行服务间的通信;
11、所述微服务架构通过容器编排工具进行所述边缘节点中服务的自动部署、数量调整和健康检查。
12、进一步需要说明的是,步骤s102中的关联成分筛选方式包括如下步骤:
13、s1021:基于变分模态分解方式将采集到的设备监测指标分解成固有模态函数,并提取低频信息;
14、s1022:采用小波变换对第i个固有模态函数进行小波包分解,获得小波系数为,为小波系数的个数,并通过小波半软阈值对小波系数进行半软阈值去噪处理,去噪后的小波系数为;将去噪后的小波系数重新组合得到第i个固有模态函数;
15、去噪后的第i个固有模态函数表示为:
16、设备监测指标信号去噪后的第i个固有模态函数表示为:
17、);
18、其中,为小波变换的转置矩阵,用于将去噪后的小波系数转换为去噪后的局部模态;
19、s1023:计算分解和降噪后信号的相似度矩阵,以提取关联成分,计算公式为:
20、;
21、其中,和表示设备监测指标信号,表示设备监测指标信号和的相似度矩阵,表示自然数,表示设备监测指标信号去噪后的第i个固有模态函数。
22、进一步需要说明的是,步骤s1021中的所述变分模态分解方式通过交替方向乘子法自适应调整分解参数,设备监测指标信号的分解公式为;
23、;
24、为第i个局部模态的低频信号,为正则化系数,k为分解出的局部模态个数,,为拉格朗日算子,用于限制分解结果的平滑度,表示设备监测指标信号,t表示设备监测指标信号采集时间点。
25、进一步需要说明的是,步骤s103中,所述改进式yolov5模型包括输入层、数据特征提取层、多尺度特征融合层、多尺度预测层、损失函数层、非极大值抑制层、类别平衡采样层、自适应加权损失函数层、隐藏层和输出层;
26、所述改进式yolov5模型的工作方法包括以下步骤:
27、s1031、通过所述输入层将筛选后的设备指标输入至cspdarknet53轻量级卷积神经网络结构中,以提取筛选后设备指标的特征向量,所述cspdarknet53轻量级卷积神经网络结构采用跨层连接csp方式优化特征提取速度,并采用darknet53卷积神经网络提取设备指标特征;
28、s1032、多尺度特征融合层通过多尺度信道注意机制将所述cspdarknet53轻量级卷积神经网络结构提取的设备指标特征进行多尺度融合,所述多尺度信道注意机制通过全局池化操作感知全局特征,并采用空洞卷积操作感受局部特征,全局特征和局部特征通过特征金字塔网络进行不同层次特征融合,并通过通道注意力机制对特征通道进行加权;
29、s1033、通过所述多尺度预测层对融合后的设备监测指标特征进行健康检测和预测,所述多尺度预测层通过多尺度卷积核实现特征维度上的上采样和横向连接,并采用全卷积网络进行异常目标检测和识别,所述全卷积网络通过目标类别置信度估计量化衡量异常目标类别的捕获和识别效果,并采用非极大值抑制处理进行识别结果筛选和去重,以输出最终的异常情况和状态预测结果;
30、s1034、通过所述损失函数层消除异常目标检测和预测任务的误差,并通过非极大值抑制层消除冗余的预测结果,所述损失函数层通过反向传播算法对网络参数进行优化更新,所述非极大值抑制层基于预测框的置信度得分和重叠度进行预测结果筛选,保留置信度最高且重叠度较低的预测框作为最终的预测结果;
31、s1035、通过所述类别平衡采样层和自适应加权损失函数层对训练样本进行优化,实现对不同类别的设备指标进行平衡检测,并通过所述隐藏层进行并行计算;
32、s1036、通过所述输出层输出检测结果和预测结果。
33、进一步需要说明的是,步骤s104还包括:所述自监督推理引擎通过自监督学习对自注意力transformer神经网络进行训练,以建立设备状态正常和异常的表征;
34、所述自监督学习基于历史数据中学习设备的正常工作模式和异常模式,并建立设备状态的内在表示,所述自注意力transformer神经网络通过对设备状态内在表示的序列建模学习设备状态的特征和模式,并通过捕捉设备状态的动态变化和趋势实现对机房设备的异常原因、异常程度和影响范围进行自动推理。
35、进一步需要说明的是,步骤s105中的所述数字孪生模型包括实体建模单元、数据建模单元、规则一致化单元和模拟测试单元;
36、所述实体建模单元通过将机房设备的物理实体映射到虚拟空间中创建所述数字孪生模型;
37、机房设备的物理实体包括设备的几何结构、属性、行为及与其他设备的连接关系;
38、所述数据建模单元通过高速通信网络接受边缘节点采集到的指标数据,并将指标数据映射至虚拟实体,以完善所述数字孪生模型的构建;
39、所述规则一致化单元通过标准化协议将不同机房设备数据映射到统一的语义空间中;
40、所述模拟测试单元采用所述实体建模单元和数据建模单元构建的数字孪生模型对机房设备的运行状态及运维方案进行模拟测试;
41、所述数据建模单元和实体建模单元的输出端与所述模拟测试单元的输入端连接。
42、根据本技术的另一个实施例,提供了一种机房设备状态监控系统,系统包括:分布式边缘监测网络、监测设备以及云端服务器;
43、在机房监控区域部署分布式边缘监测网络,并在机房内设置多个边缘节点,在每个边缘节点安装监测设备,监测设备监测机房内设备的设备监测指标;
44、云端服务器通过分布式边缘监测网络与监测设备通信连接;云端服务器接收监测设备采集的设备监测指标,并通过关联成分筛选的方式对设备监测指标进行筛选,还基于数字孪生模型将实时采集到的设备监测指标映射至虚拟空间内;
45、云端服务器基于虚拟空间采用改进式yolov5模型对机房内设备监测指标进行健康状态评估和风险预测;
46、利用自监督推理引擎对异常设备监测指标进行推理,并根据设备监测指标的异常状态触发异常恢复机制;
47、基于数字孪生模型,对机房设备的设备监测指标进行模拟测试,评估当前监控方案的可行性。
48、根据本技术的又一个实施例,还提供了一种监控终端,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述程序时实现所述机房设备状态监控方法的步骤。
49、从以上技术方案可以看出,本发明具有以下优点:
50、本技术提供的机房设备状态监控方法通过分布式边缘监测网络,能够同时对多个不同类型的设备进行实时监测,而无需为每个设备单独定制健康模型,大大减少了健康管理的时间成本,提高了效率。
51、本发明基于边缘节点采集的指标构建的数字孪生模型,将实时采集到的指标映射至虚拟空间内,实现对不同设备监测指标的规则一致化表示,进一步减少了定制化健康模型的需求,并通过数字孪生模型对机房设备的运行状态及运维方案进行模拟测试,评估运维方案的可行性,提高了运维方案的针对性,降低了运维风险。
52、本技术提供的机房设备状态监控方法通过将筛选后的指标输入至改进式深度学习实时检测yolov5模型,实现对机房设备的实时健康评估和风险预测,并通过自监督推理引擎自动推理异常原因、异常程度和影响范围,采用自动触发异常恢复机制制定机房设备运维方案,确保在设备出现故障或异常时,系统能够迅速响应并采取相应的措施,从而保障了工作效率和服务质量。
1.一种机房设备状态监控方法,其特征在于,方法包括:
2.根据权利要求1所述的机房设备状态监控方法,其特征在于,
3.根据权利要求1所述的机房设备状态监控方法,其特征在于,
4.根据权利要求1或3所述的机房设备状态监控方法,其特征在于,
5.根据权利要求4所述的机房设备状态监控方法,其特征在于,
6.根据权利要求1或3所述的机房设备状态监控方法,其特征在于,
7.根据权利要求1或3所述的机房设备状态监控方法,其特征在于,
8.根据权利要求1或3所述的机房设备状态监控方法,其特征在于,
9.一种机房设备状态监控系统,其特征在于,系统用于实现如权利要求1至8任一项所述的机房设备状态监控方法;系统包括:分布式边缘监测网络、监测设备以及云端服务器;
10.一种监控终端,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现如权利要求1至8任一项所述机房设备状态监控方法的步骤。