本发明提供一种基于无标签自蒸馏和深度学习的电能质量扰动识别方法,涉及电能质量分析。
背景技术:
1、现有的电能质量扰动主要针对有标签数据,缺乏对无标签数据的研究,而实际电网中绝大部分都是无标签数据。
2、本发明涉及深度学习和无标签自蒸馏,是一种基于深度学习和无标签自蒸馏的电能质量扰动信号(power quality disturbances,pqds)识别方法。
3、深度学习一般指通过训练多层网络结构对未知数据进行分类或回归。基本思想是通过构建多层网络,对目标进行多层表示,从而通过多层的高层次特征来表示数据的抽象语义信息,获得更好的识别鲁棒性。
4、无标签自蒸馏(self-distillation with no labels,dino)参考了知识蒸馏(knowledge distillation,kd)的核心思想。kd是一种压缩模型从而使模型轻量化的学习方法,其核心是建立教师网络和学生网络两个网络模型,使用经过预训练的教师网络指导轻量化的学生网络,类似教师将知识提炼后传授给学生,最终使学生网络获得较强的泛化性能且保持较小体量。
技术实现思路
1、本发明的目的在于提供基于无标签自蒸馏和深度学习的电能质量扰动识别方法,以解决上面提出的技术问题。步骤如下:
2、s1:采集无标签电能质量扰动数据,通过马尔可夫转移场转换为二维图像,作为输入;
3、s2:将输入的二维图像进行裁切形成全局视图和局部视图;
4、s3:建立教师网络和学生网络共同训练。在适当的迭代次数后,得到训练好的教师网络和学生网络模型;
5、s4:将有标签的二维图像输入训练好的教师网络,用以构建特征对比库w。将待识别无标签电能质量扰动二维图像同样输入训练好的教师网络,并输出特征表示;
6、s5:使用加权k-nn将待识别扰动信号的特征表示与特征对比库相对比,寻找与待识别pqds特征最为相似的k个特征,并根据其所属类别的特征权重,最终输出待识别pqds对应的种类。
7、步骤s1和s2是数据预处理部分,首先把采集到的一维电能质量扰动信号通过马尔可夫转移场转换为二维图像,并对转换来的图像进行裁切等方式进行数据增强,以增加pqds数据集的差异化水平和丰富性,从而增强模型的泛化性能。
8、步骤s3是无标签自蒸馏的主要部分。dino的主要任务是使学生网络的输出不断地模仿和接近教师网络的输出,两个网络输出的相似程度可以用交叉熵损失来衡量。对于输入x,损失函数可以表示为:
9、
10、其中交叉熵损失函数h(a,b)=-alnb,通常在监督学习中,a是真实的标签分布,b是预测的标签分布,最小化损失可以使预测标签最大程度上接近真实标签。而在dino中,a是教师网络的输出,b是学生网络的输出,最小化损失loss是为了让学生网络的输出最大程度上接近教师网络的输出,并据此更新学生网络的可学习参数θs。与监督学习和知识蒸馏有所不同,dino中仅有学生网络根据最小化loss的目标,通过梯度反向传播更新参数θs,而教师网络的可学习参数θt则通过ema方式动态更新,具体表达为:
11、
12、其中权重参数λ从0.996到1动态更新,教师网络的θt由学生网络的θs和上一迭代周期的θt-1加权计算。在合适的迭代次数后,得到训练好的教师网络和学生网络。
13、步骤s3在完成上述操作的同时,也进行了中心化和尖锐化的处理,用来优化网络的特征输出。尖锐化的具体公式如下:
14、
15、其中k是输出特征的维度;t是蒸馏温度系数,用于调节尖锐程度;p(x)是输出的特征,分别用ps和pt表示学生网络和教师网络的输出特征。
16、中心化的具体操作是在教师网络的输出特征中添加一个变化的偏置c,具体表达式为:
17、
18、其中n代表当前迭代轮次。偏置c根据本轮次教师网络输出的批次数据平均值,以指数移动平均(exponential moving average,ema)的方式进行更新:
19、
20、其中m是权重参数,b是输入批次大小,xi是批次中的第i个输入。ema是一种赋予近期数据更高权重的平均方法,一般而言m∈[0.9,1]。尖锐化可以更加突出关键特征,有助于更好地指导学生网络,中心化可以使教师网络输出的特征权重更加平滑,因此同时使用两种方法可以有效避免因输出过于尖锐或者过于平均导致的模型坍塌问题。
21、步骤s4是主要为了后续识别pqds做准备。
22、步骤s5为识别电能质量扰动的种类。其中加权k-nn(weightedk-nearestneighbors)算法的主要流程为:对于一个未知的pqds信号x,经过训练好的模型输出为gθ(x),将其与w中的所有特征向量进行对比,计算余弦相似度:
23、si=cos(wi,gθ(x)) (6)
24、将相似度最高的k个特征向量的集合记为νk={y1,y2,…,yk},每个特征所属类别的集合记为ck={c1,c2,…,ck}。对于nk中某一特征向量所属类别c,其权重参数可以表示为:
25、
26、其中权重wc最大值所属特征向量的c即为模型识别的pqds信号类别。
27、本发明具有的技术效果:
28、(1)相对于一般的深度学习,本发明不需要大量有标签数据尽心训练,就可以达到较高的识别准确率。实验中,无噪声情况下,准确率达到了98.5%,30db时达到了98.07%,在噪声较大的情况下,准确率变换不大,具有良好的鲁棒性。而实际电网中往往没有大量有标签数据,故本发明相对于一般深度学习,更适合在实际电网中运行。
29、(2)相对于一般自蒸馏算法,本发明针对模型坍塌,进行了中心化和尖锐化处理,在防止坍塌的同时,优化了算法,让师网络的指导效果更为优异。
1.基于无标签自蒸馏和深度学习的电能质量扰动识别方法,其特征在于,包括以下步骤:
2.根据权利要求1所述的基于无标签自蒸馏和深度学习的电能质量扰动识别方法,其特征在于,步骤s3为无标签自蒸馏dino,任务是使学生网络的输出不断地模仿和接近教师网络的输出,两个网络输出的相似程度用交叉熵损失来衡量;对于输入x,损失函数表示为:
3.根据权利要求2所述的基于无标签自蒸馏和深度学习的电能质量扰动识别方法,其特征在于,步骤s3中还包括中心化和尖锐化的处理,用来优化网络的特征输出;尖锐化的具体公式如下:
4.根据权利要求1所述的基于无标签自蒸馏和深度学习的电能质量扰动识别方法,其特征在于,步骤s5为识别电能质量扰动的种类;其中加权k-nn算法的流程为:对于一个未知的pqds信号x,经过训练好的模型输出为gθ(x),将其与w中的所有特征向量进行对比,计算余弦相似度: