本发明涉及电网输电线路缺陷检测,尤其涉及一种服务端自适应参数聚合方法及系统。
背景技术:
1、输电线路作为电力传输的关键环节,其安全稳定运行直接关系到电力供应的可靠性。输电线路遍布全国各地,覆盖广袤的地理区域,因此,对其缺陷进行高效准确的检测成为电力维护中的一个核心挑战。
2、传统输电线路缺陷检测主要依赖人工巡检和单一节点的计算机视觉技术,电路缺陷数据分散在不同地域的设备或系统中,导致传统输电线路缺陷检测模型训练中存在以下问题:(1)数据之间缺乏有效的共享和连接,形成一个个数据孤岛,使得不同环境下所采集的数据无法得到充分地整合与分析,从而影响了输电线路缺陷检测模型的数据多样性和泛化能力。(2)数据隐私和安全问题突出。(3)计算机硬件性能存在上限,导致单节点无法训练大规模数据。
3、虽然联合学习可以很好地解决以上问题,但现有联合学习算法仍存在一些问题:(1)不同训练节点或设备模型参数不同,单一参数聚合算法难以保证全局模型的收敛和稳定。(2)不同训练节点或设备的计算能力和数据质量不同,单一参数聚合算法难以保证所有节点或设备都能为全局模型做出贡献。(3)仅使用单一参数聚合算法进行参数聚合,难以充分利用不同算法的优势来提高模型的性能。
技术实现思路
1、针对现有技术中的上述不足,本发明提供的一种服务端自适应参数聚合方法及系统,解决了数据不均衡、训练效率和模型泛化能力的问题,特别是在输电线路缺陷检测应用中,显著提高了检测准确率和模型的稳定性。
2、为了达到以上目的,一方面,本发明提供了一种服务端自适应参数聚合方法,包括以下步骤:
3、s1、由服务端选择k个客户端进行联合训练,同时每个客户端加载本地数据集,并进入等待初始化全局模型状态;
4、s2、在开始阶段,由服务端初始化全局模型后,向每个客户端下发全局模型参数,由客户端加载初始化后的全局模型参数,并作为客户端的初始训练本地模型参数,在迭代阶段,随着联合学习的进行,由服务端在每次迭代后生成二阶段全局模型,并将该二阶全局模型下发至客户端进行训练;
5、s3、判断客户端是否达到预设的训练轮次,若是,则结束本次联合训练任务,结束流程,否则,每个客户端通过改进的联合均值算法,使用本地数据集对本地模型进行训练,并进入s4;
6、s4、判断k个客户端是否均训练完成,若是,则根据训练结果,由服务器使用改进的联合均值算法对客户端上传的本地模型参数进行聚合,得到一阶段全局模型,并进入s5,否则,返回s3,直至所有客户端训练完成;
7、s5、根据当前得到的一阶段全局模型与上一轮训练的全局模型,计算分层模型差异;
8、s6、将分层模型差异作为自适应聚合算法的伪梯度,计算自适应聚合算法涉及的一阶矩估计和二阶矩估计,并利用自适应聚合算法进行自适应聚合,生成二阶段全局模型,并存储本轮二阶段全局模型参数,以及通过一阶矩估计和二阶矩估计动态调整学习率,并将二阶段全局模型参数下发至客户端,并返回s2中的迭代阶段。
9、本发明的有益效果是:针对传统输电线路缺陷检测模型训练方式存在的问题,本发明旨在融合不同算法优势,利用不同算法的互补性,将改进后的联合均值算法与自适应聚合算法进行融合。在保证联合均值算法的普适性及良好效果的同时,结合自适应聚合算法的适应性及稳定性,进一步提高全局模型的性能和泛化能力,解决据孤岛、隐私安全和硬件性能上限等问题,提高全局模型训练效率和泛化能力,本发明充分利用不同算法互补优势,在保证稳定和收敛的前提下充分考虑不同节点或设备的贡献力度,有效地提高输电线路缺陷检测联合学习模型的性能和泛化能力。
10、进一步地,所述由服务端初始化全局模型后,向每个客户端下发全局模型参数,由客户端加载初始化后的全局模型参数,并作为客户端的初始训练本地模型参数,其具体为:
11、a1、在开始阶段,由服务端初始化全局模型后,向每个客户端下发全局模型参数;
12、a2、由客户端加载初始化后的全局模型参数,将其作为初始参数,并在本地数据集上使用全局模型参数进行本地模型训练,生成本地模型参数;
13、a3、针对本次训练结束后,由客户端将更新后的本地模型参数回传至服务端;
14、a4、由服务端收集所有客户端更新后的本地模型参数,并进行聚合处理,生成新的全局模型;
15、a5、由服务端将新的全局模型参数下发至向客户端,并由客户端将新的全局模型参数作为新的初始参数,对本地模型进行训练。
16、进一步地,所述本地模型参数的表达式如下:
17、
18、其中,表示第训练轮次,第 k个客户端的本地模型参数,表示第训练轮次,第 k个客户端的本地模型参数,表示学习率,表示第 k个客户端的本地模型在本地数据集上训练时计算出的梯度。
19、再进一步地,所述s4中一阶段全局模型的表达式如下:
20、
21、其中,表示第训练轮次聚合后得到的一阶段全局模型,表示客户端索引,表示客户端的总数,表示客户端样本总数,表示第个客户端的样本数量,表示第训练轮次,第 k个客户端的本地模型参数。
22、再进一步地,所述s5中分层模型差异的表达式如下:
23、
24、
25、
26、其中,表示分层模型差异,表示全局模型的层次,表示全局模型的第 i层参数使用联合均值算法聚合的全局模型,表示上一轮全局模型的第 i层参数,表示第一阶段使用联合均值算法聚合的全局模型,表示客户端索引,表示客户端的总数,表示调节客户端样本数量和损失之间的比例参数,表示客户端样本总数,表示第 k个客户端的样本数量,表示第个客户端在所有客户端上的损失占比,和均表示第 k个客户端在本地数据集上训练的本地模型损失值,表示第训练轮次,第 k个客户端的本地模型参数,表示客户端的索引号。
27、上述进一步方案的有益效果是:本发明提出了一种改进的模型分层差异计算方法,该方法不仅考虑了客户端数据样本数量,还考虑了客户端本地数据分布和质量等因素对聚合效果的影响。采用客户端训练过程中的损失作为间接指标,来衡量客户端本地数据分布和质量因素,通过这种方式,能够更准确地反映客户端对全局模型的贡献程度,从而提高了全局模型的性能和泛化能力,较于仅考虑客户端数据样本数量的传统方法,本发明能够更好地利用客户端数据的多样性和质量,从而减少了权重分配偏差,提高准确性。本发明通过引入参数,来调节客户端数据样本数量和训练损失之间的比例,使得全局模型能够更好地适应客户端数据的分布和质量差异,本发明能够更好地处理数据分布不均匀的问题,提高了全局模型的泛化能力,减少了因数据分布差异而导致的性能下降。
28、再进一步地,所述一阶矩估计的表达式如下:
29、
30、其中,表示第 t训练轮次的一阶矩估计,表示训练轮次,表示一阶矩估计的衰减率,表示第训练轮次的一阶矩估计,表示伪梯度。
31、再进一步地,所述二阶矩估计的表达式如下:
32、
33、其中,表示第 t训练轮次的二阶矩估计,表示二阶矩估计的衰减率,表示第训练轮次的二阶矩估计,表示伪梯度。
34、再进一步地,所述全局模型参数的更新公式如下:
35、
36、其中,表示第训练轮次使用自适应聚合算法更新后的全局模型,表示更新前的全局模型,表示学习率,表示第 t训练轮次的一阶矩估计,表示第 t训练轮次的二阶矩估计,表示常数,表示权重衰减项。
37、上述进一步方案的有益效果是:本发明引入了权重衰减项,以控制全局模型复杂度,提高全局模型的泛化性能,通过这种方式能够避免过拟合问题,提高模型的稳定性和泛化性能。
38、再进一步地,所述服务端的全局最优目标函数的表达式如下:
39、
40、
41、
42、
43、
44、
45、
46、
47、其中, min表示取小值, w表示全局模型参数,表示服务端的全局最优目标函数,表示客户端索引,表示客户端的总数,表示第 k个客户端的本地目标函数,表示第 k个客户端的数据量,表示第个样本,表示第 k个客户端的本地数据集,表示本地客户端缺陷检测模型ssd在样本上的损失值,表示匹配到的真实框对应的默认框的数量,表示分类损失,表示匹配指标变量,表示预测出的各类别的置信度得分,表示平衡分类损失和定位损失之间权重的超参数,表示定位损失,表示预测出的每个默认框相对于原始形状的偏移量,表示真实框的参数,表示正类标签的集合,表示第个默认框,表示第个默认框是否匹配到第个属于正类标签的集合的真实边界框,表示第个默认框属于正类标签的集合的概率,表示负类标签的集合,表示第个默认框属于负类标签的集合的概率,表示第个默认框属于正类标签的集合的置信度,表示不同的坐标类型,表示物体中心点的横坐标,表示物体中心点的纵坐标,表示高度,表示第个默认框是否匹配到第个真实边界框,表示平滑l1损失函数,表示预测的坐标,表示实际坐标。
48、另一方面,本发明提供了一种服务端自适应参数聚合系统,所述服务端自适应参数聚合系统应用于服务端自适应参数聚合方法中,包括:
49、第一处理模块,用于由服务端选择k个客户端进行联合训练,同时每个客户端加载本地数据集,并进入等待初始化全局模型状态;
50、第二处理模块,用于在开始阶段,由服务端初始化全局模型后,向每个客户端下发全局模型参数,由客户端加载初始化后的全局模型参数,并作为客户端的初始训练本地模型参数,在迭代阶段,随着联合学习的进行,由服务端在每次迭代后生成二阶段全局模型,并将该二阶全局模型下发至客户端进行训练;
51、第三处理模块,用于判断客户端是否达到预设的训练轮次,若是,则结束本次联合训练任务,结束流程,否则,每个客户端通过改进的联合均值算法,使用本地数据集对本地模型进行训练,并进入第四处理模块;
52、第四处理模块,判断k个客户端是否均训练完成,若是,则根据训练结果,由服务器使用改进的联合均值算法对客户端上传的本地模型参数进行聚合,得到一阶段全局模型,并进入第五处理模块,否则,返回第三处理模块,直至所有客户端训练完成;
53、第五处理模块,用于根据当前得到的一阶段全局模型与上一轮训练的全局模型,计算分层模型差异;
54、第六处理模块,用于将分层模型差异作为自适应聚合算法的伪梯度,计算自适应聚合算法涉及的一阶矩估计和二阶矩估计,并利用自适应聚合算法进行自适应聚合,生成二阶段全局模型,并存储本轮二阶段全局模型参数,以及通过一阶矩估计和二阶矩估计动态调整学习率,并将二阶段全局模型参数下发至客户端,并返回第二处理模块中的迭代阶段。
55、本发明的有益效果是:本发明以联合均值算法(fedavg)与自适应聚合算法(fedadam)算法为基础,将两种算法进行融合,实现优势互补,进一步提高联合学习的效果,能够更好地处理缺陷检测任务,减少误检和漏检的情况,有效解决了数据不均衡、训练效率和全局模型泛化能力的问题,特别是在输电线路缺陷检测应用中,显著提高了检测准确率和全局模型的稳定性。
1.一种服务端自适应参数聚合方法,其特征在于,包括以下步骤:
2.根据权利要求1所述的服务端自适应参数聚合方法,其特征在于,所述在开始阶段,由服务端初始化全局模型后,向每个客户端下发全局模型参数,由客户端加载初始化后的全局模型参数,并作为客户端的初始训练本地模型参数,其具体为:
3.根据权利要求2所述的服务端自适应参数聚合方法,其特征在于,所述本地模型参数的表达式如下:
4.根据权利要求1所述的服务端自适应参数聚合方法,其特征在于,所述s4中一阶段全局模型的表达式如下:
5.根据权利要求1所述的服务端自适应参数聚合方法,其特征在于,所述s5中分层模型差异的表达式如下:
6.根据权利要求1所述的服务端自适应参数聚合方法,其特征在于,所述一阶矩估计的表达式如下:
7.根据权利要求1所述的服务端自适应参数聚合方法,其特征在于,所述二阶矩估计的表达式如下:
8.根据权利要求1所述的服务端自适应参数聚合方法,其特征在于,所述全局模型参数的更新公式如下:
9.根据权利要求1所述的服务端自适应参数聚合方法,其特征在于,所述服务端的全局最优目标函数的表达式如下:
10.一种服务端自适应参数聚合系统,其特征在于,所述服务端自适应参数聚合系统应用于服务端自适应参数聚合方法中,包括: