本发明涉及风机故障预警,具体涉及一种基于xgboost和自适应阈值的风机故障预警方法。
背景技术:
1、电厂风机作为火电机组的重要组成部分,直接影响机组能否安全负荷运行,其主要作用是保障机组运行的空气循环。由于风机运行条件较恶劣,进气箱所输送的气体中常含有煤粉等杂质,容易造成风机故障。典型的故障包括转子不对中,失速,喘振,轴承裂纹等,其故障主要体现在温度、振动及风压信号上,如风机叶片遭到酸性物质腐蚀影响叶片质量,会导致轴承振动;轴承箱润滑油系统故障导致轴承超温;风机失速故障表现在风压信号中。因此,实现风机设备的早期故障预警对于火电安全生产具有重大意义。
2、目前,主要研究方法有基于故障机理的预警方法和基于历史数据的故障预警方法。徐小刚等针对离心风机失速故障,采用对称点模式分析和图像匹配相融合的方法,建立不同状态下的sdp模板图并提取特征,结果表明该方法可以快速发现失速故障起始点。杨婷婷等采用多元状态估计技术建立模型,通过相似度原理得到相似度曲线,利用滑动窗口法确定阈值。朱朋成等针对磨煤机故障预警,以热力学为基础进行机理分析,确定其特征参数,并通过数据挖掘建立预警模型,判断磨煤机的早期异常。基于故障机理分析的预警方法建立在故障案例上,故障实验成本高,机理研究较困难。胡杰等、赵劲松等、lv you等都是基于多元状态估计技术进行建模预测,主要将过程记忆矩阵用不同算法加以改进,提升模型的预测精度,通过绘制残差曲线和设定阈值来实现早期故障预警。宋莹等采用多元状态估计建模获得多维的残差向量,并利用超椭球分析模型对残差向量进行分析,相比于固定阈值分析能够更早的发现故障起始点。但由于多元状态估计技术是多输入多输出建模,无法准确判断故障的类型,并且采用传统的固定阈值方法在机组变负荷情况下易产生误报警。尹诗等将随机森林算法与bi-rnn算法结合建立预警模型,实现对风电机组主轴承的状态监测。李俊卿等采用栈式自动编码器的方式选取数据特征,结合误差反向传播算法建立预警模型。其主要通过用机器学习算法建立预测模型。
技术实现思路
1、针对风机数据的多变量、数据量大等特点,采用高效并行的xgboost算法,其适用于多数据类型的情况,能够有效利用大规模数据,并在保证效率的前提下提升预测精度。基于上述分析,本发明以风机轴承温度为切入点,利用xgboost算法进行风机轴承故障预警,通过相似度曲线和自适应阈值判断故障发生的起始点,提前发出预警信号。
2、本发明提供了一种基于xgboost和自适应阈值的风机故障预警方法,该方法包括:
3、数据采集与预处理:获取风机运行数据并进行预处理,包括数据清洗和特征提取;
4、特征工程与选择:选取与风机状态相关的有效特征,并进行特征工程处理,提高数据的表征能力;
5、xgboost模型训练:利用预处理后的数据训练xgboost模型,实现对风机运行状态的学习和预测;
6、自适应阈值确定:根据xgboost模型输出结果及实际风机运行数据,采用自适应算法确定风机状态异常的阈值;
7、故障预警与输出:监测风机运行状态,当检测到异常状态超过设定的自适应阈值时,及时发出故障预警信号。
8、优选地,xgboost算法模型由下式表示:
9、
10、优选地,所述xgboost算法模型通过定义损失函数,衡量真实值与预测值的偏差,其取值越小则偏差越小,损失函数如下式所示,
11、
12、优选地,模型预测值与真实值之间有着不同程度的偏差,需要定量地将偏差进行处理,通过构造相似度函数来表示预测值和实际值之间的偏差,相似度值越大则两变量越相似,反之相似度值越小则差异性越大,通常表示向量间的相对距离的方法有距离度量函数,相似系数度量法,选用距离度量函数中的欧式距离。
13、优选地,所述距离度量函数如下式所示,
14、
15、其中,将相似度映射到[0,1]之间,当sim(x,y)值越接近1则相似度越大,反之则越小。
16、优选地,预警阈值是衡量研究对象是否发生故障的标准,是故障预警研究中重要的一部分,采用固定阈值的方法,即通过滑动窗口法对残差进行处理,取残差均值的最大值作为固定阈值,但在设备实际运行过程中,由于机组负荷的快速变化,或者在变工况阶段时,设备的运行状态会有偏离正常状态的可能,此时相似度会出现不同程度的下降,并且由于信号干扰等外部不确定因素,也会导致相似度下降,若采用固定阈值的方法,则可能会导致系统误报警,影响设备故障预警的准确率。
17、优选地,通过绘制相似度曲线和自适应阈值的曲线来判断故障起始点,当相似度连续两个采样点低于阈值下限时,可判断为设备发生故障,且故障发生时的均值和方差保持不变。
18、优选地,故障预警算法主要使用部件的正常历史数据建立回归预测模型,其步骤为:
19、(1)将已完成数据预处理和特征工程的1500组数据按6:2:2划分成正常状态下的训练集,测试集,故障状态下的验证集;
20、(2)初始化xgboost模型,设置模型的一些基本参数;
21、(3)建立cart树并求出叶子结点的预测分值,累加叶子节点的分值,得到预测值;
22、(4)进行模型训练部分,使用网格搜索法对模型进行调参,找出最优的参数,最后进行预测。
23、按照本发明的技术方案,为了对电厂风机实现故障预警,提出了基于极端梯度提升(xgboost)算法的数据驱动的故障预警方法。首先,通过对电厂原始数据进行数据特征提取和box-cox变换,建立基于xgboost算法的风机轴承温度预测模型;其次,将模型预测值和真实值的偏差用相似度函数表示,并设计了基于区间估计思想的自适应阈值方法;最后利用某电厂送风机数据进行仿真,并将xgboost算法与支持向量机(svm)算法、梯度提升树(gbdt)算法进行对比。结果表明该方法能实现风机早期故障预警,验证了该故障预警模型的有效性。
1.一种基于xgboost和自适应阈值的风机故障预警方法,其特征在于,该方法包括:
2.根据权利要求1所述的基于xgboost和自适应阈值的风机故障预警方法,其特征在于,xgboost算法模型由下式表示:
3.根据权利要求2所述的基于xgboost和自适应阈值的风机故障预警方法,其特征在于,所述xgboost算法模型通过定义损失函数,衡量真实值与预测值的偏差,其取值越小则偏差越小,损失函数如下式所示,
4.根据权利要求1所述的基于xgboost和自适应阈值的风机故障预警方法,其特征在于,模型预测值与真实值之间有着不同程度的偏差,需要定量地将偏差进行处理,通过构造相似度函数来表示预测值和实际值之间的偏差,相似度值越大则两变量越相似,反之相似度值越小则差异性越大,通常表示向量间的相对距离的方法有距离度量函数,相似系数度量法,选用距离度量函数中的欧式距离。
5.根据权利要求4所述的基于xgboost和自适应阈值的风机故障预警方法,其特征在于,所述距离度量函数如下式所示,
6.根据权利要求1所述的基于xgboost和自适应阈值的风机故障预警方法,其特征在于,预警阈值是衡量研究对象是否发生故障的标准,是故障预警研究中重要的一部分,采用固定阈值的方法,即通过滑动窗口法对残差进行处理,取残差均值的最大值作为固定阈值,但在设备实际运行过程中,由于机组负荷的快速变化,或者在变工况阶段时,设备的运行状态会有偏离正常状态的可能,此时相似度会出现不同程度的下降,并且由于信号干扰等外部不确定因素,也会导致相似度下降,若采用固定阈值的方法,则可能会导致系统误报警,影响设备故障预警的准确率。
7.根据权利要求1所述的基于xgboost和自适应阈值的风机故障预警方法,其特征在于,通过绘制相似度曲线和自适应阈值的曲线来判断故障起始点,当相似度连续两个采样点低于阈值下限时,可判断为设备发生故障,且故障发生时的均值和方差保持不变。
8.根据权利要求1所述的基于xgboost和自适应阈值的风机故障预警方法,其特征在于,故障预警算法主要使用部件的正常历史数据建立回归预测模型,其步骤为: