本发明提供一种基于自监督学习和深度学习的电能质量扰动视频识别方法,属于电能质量扰动。
背景技术:
1、深度学习一般指通过训练多层网络结构对未知数据进行分类或回归。基本思想是通过构建多层网络,对目标进行多层表示,从而通过多层的高层次特征来表示数据的抽象语义信息,获得更好的识别鲁棒性。
2、暹罗网络是一系列网络,它使用两个相同的子网进行一次性分类。子网共享相同的配置、参数和权重,但具有不同的输入。
3、视频识别不同于一般的图像识别,需要对视频中的图像块进行有效采集。且配合深度学习时,不需要将一维数据转换成二维图像,可以省去大量时间,利于扰动的实时识别。
技术实现思路
1、本发明所要解决的技术问题为:
2、1.现有的电能质量扰动主要针对有标签数据,缺乏对无标签数据的研究,而实际电网中绝大部分都是无标签数据。
3、2.现有大部分电能质量扰动识别方法,不论是一维数据识别还是二维图像识别,都需要先对数据进行收集,尤其图像识别方式,还要经过一轮图像转换,很难做到实时识别。
4、本发明的目的在于提供一种基于自监督学习和深度学习的视频识别方式,以解决上面提出的技术问题。为解决上述问题,本发明提供如下技术方案:
5、基于自监督学习和深度学习的电能质量扰动视频识别方法,包括以下步骤:
6、s1:通过单片机和摄像机获取1mb电能质量波形视频;
7、s2:从采集到的波形视频中获取sure兴趣点,并使用改进的idt来获得每个sure兴趣点的运动,其中轨迹移动<25%的兴趣点视为噪声,其他兴趣点视为第一个图像块;根据视频帧的大小选取合适的边界框,跟踪给定的边界框30帧,得到第二个图像块。重复上述步骤,生成数百万个这样的图像块对;这些图像块对再加上一个随机视频的图像块,组成暹罗三联体;
8、s3:以尺寸为224×224的图像作为输入,基于resnext网络,生成一个1024维的特征空间f,在这个特征空间上定义损失函数;
9、s4:在这个特征空间上,定义两个图像块x1、x2之间的距离为:
10、
11、其中f(xn)为输入图像xn后在最后一层输出的特征:
12、s5:需要查询块(第一个图像块)和跟踪块(第二个图像块)的距离比其他块的距离都要小,所以定义损失函数为:
13、
14、其中xi是查询块,是跟踪块,是来自不同视频的随机块,m是距离参数,最终的距离函数为:
15、
16、其中,w为网络的参数权重,n是三联体样本数,λ为衰减常数,这里取λ=0.0005;
17、s6:在学习过程中,执行小批量的随机梯度下降sgd;对于每个xi、都在同一个batch中抽取k个来匹配,有k个三联体的样本集,对于每个样本,都计算其梯度,并进行反向传递;每个epoch结束后,重新打乱所有图像,保证其随机性;
18、s7:把前面训练三联体所得网络中的卷积层参数作为后续训练网络的初始化;全连接层则采取随机初始化;同时,学习率ε从0.01开始,使其能够适应新的任务;
19、s8:通过加权k-nn算法进行分类。
20、进一步的:
21、s1中,视频中含有暂升、暂降、中断、缺口、尖峰、振荡、谐波七种单扰动的波形。
22、s2中,视频帧的大小选的边界框为224×224,帧的尺寸为448×60。
23、s8具体方法为:把所有的有标签数据输入训练好的cnn网络,将对应的输出特征向量整合为一个特征对比库w;对于一个未知的pqds信号x,经过训练好的模型输出为gθ(x),将其与w中的所有特征向量进行对比,计算余弦相似度:
24、
25、将相似度最高的k个特征向量的集合记为νk={y1,y2,…,yk},每个特征所属类别的集合记为ck={c1,c2,…,ck};对于nk中某一特征向量所属类别c,其权重参数表示为:
26、
27、其中权重wc最大值所属特征向量的c即为模型识别的pqds信号类别。
28、本发明具有的技术效果:
29、(1)可以实现对实际电网中大量无标签数据的有效识别。
30、(2)可以绕过图像转换这个一般深度学习进行图像识别时必不可少的步骤,减少识别所需的时间。
1.基于自监督学习和深度学习的电能质量扰动视频识别方法,其特征在于,包括以下步骤:
2.根据权利要求1所述的基于自监督学习和深度学习的电能质量扰动视频识别方法,其特征在于,s1中,视频中含有暂升、暂降、中断、缺口、尖峰、振荡、谐波七种单扰动的波形。
3.根据权利要求1所述的基于自监督学习和深度学习的电能质量扰动视频识别方法,其特征在于,s2中,视频帧的大小选的边界框为224×224,帧的尺寸为448×60。
4.根据权利要求1所述的基于自监督学习和深度学习的电能质量扰动视频识别方法,其特征在于,s8具体方法为:把所有的有标签数据输入训练好的cnn网络,将对应的输出特征向量整合为一个特征对比库w;对于一个未知的pqds信号x,经过训练好的模型输出为gθ(x),将其与w中的所有特征向量进行对比,计算余弦相似度: