本发明涉及智能电表数据处理技术,具体涉及一种智能电表消费端的电负荷数据加密方法,是一种能够处理具有相关性数据并平衡数据的隐私性和可用性的数据加密处理方法。
背景技术:
1、在目前计算机性能大幅提升,机器学习等数据挖掘算法不断精进的背景下,数据成为了越来越有价值的资源,但是与此同时数据隐私的泄露也极大地困扰着个人与社会。
2、与其他数据收集过程一样,智能电表收集细粒度的能耗数据会引起用户对隐私泄露的担忧。供电方可以从总消耗数据中分解出单个设备的能源使用情况,从而可以推断用户的生活方式、空置时间等。这种详细信息的泄露可能会侵犯用户的隐私权,并导致价格歧视。
3、为了解决这一问题,目前已经有了多种方法确保智能电表数据隐私,包括:数据匿名化、数据加密、基于电池的负载隐藏(blh)和噪声添加。其中:文献(de montjoye,yves-alexandre,cesar a.hidalgo,michel verleysen,vincent d.blondel.2013.unique inthe crowd:the privacy bounds of human mobility.scientific reports,3(1),1376-1376.)记载了一种数据匿名化方法,通过匿名化隐藏了数据所有者的原始身份,但是这种身份很容易通过链路攻击被泄露。文献(liang,xiaohui,xu li,rongxing lu,xiaodonglin,xuemin shen.2013.udp:usage-based dynamic pricing with privacypreservation for smart grid.ieee transactions on smart grid,4(1),141-150.)通过采用数据加密方法将智能电表中的数据转换成另一种形式,只有拥有解密密钥访问权限的人才能读取数据。虽然这样的方案在密码学意义上是强大的,但它们在计算上是昂贵的,并且很难实现(参见文献jia,weiwei,haojin zhu,zhenfu cao,xiaolei dong,chengxinxiao.2013.human-factor-aware privacy-preserving aggregation in smartgrid.ieee systems journal,8(2),598-607)。文献(mclaughlin,stephen,patrickmcdaniel,william aiello,acm.2011.protecting consumer privacy from electricload monitoring.acm,new york,87-98.以及文献wei,dong,yan lu,mohsen jafari,paulm skare,kenneth rohde.2011.protecting smart grid automation systems againstcyberattacks.ieee transactions on smart grid,2(4),782-795.)采用blh机制为每个家庭安装一个电池,并使用电池的充放电来模糊实际需求消费模式。虽然blh方法对数据保护是有效的,但电池安装的成本可能高达1000美元,而且使用时长有限。文献(dwork,cynthia,aaron roth,et al.2014.the algorithmic foundations of differentialprivacy.foundations andin theoretical computer science,9(3–4),211-407.)采用噪声添加法—dp(differential privacy,差分隐私),该方法提供了一种被证明的隐私特性,通过根据灵敏度添加噪声来确保数据集的统计属性几乎不变,无论个人是否在数据集中。但是,当数据相互关联时,dp的隐私保证可能会受到损害。
4、综上,现有的智能电表数据处理技术仍然难以有效地避免用户用电信息泄露。
技术实现思路
1、为了克服上述现有技术的不足,本发明提出了一种针对智能电表统计得到的用电数据的数据加密技术——cadp(correlation-aware differential privacy,关联感知差分隐私)技术。该技术可以利用较小的成本对智能电表消费端用户的用电信息进行加密,避免用户的用电信息泄露,并且对于整体的用电数据的影响较小,从而使供电方可以为用户提供满意的服务。对比目前已有的方案,本发明方法保密水平高,数据价值保存度高,且成本较低。
2、采用本发明方法,通过智能电表收集消费端用电数据,将用电数据汇总到中端数据处理设备,数据需求方向中端设备请求数据,中端设备通过下游任务情况选择合适的隐私预算参数,然后通过本发明的cadp方法对数据进行隐私处理,将处理后的数据传输给数据需求方。
3、本发明提供的技术方案如下:
4、一种智能电表消费端的电负荷数据加密方法(cadp方法),设计关联感知差分隐私方法,通过对智能电表搜集数据进行数据聚合、并计算数据相关系数和数据相关灵敏度;根据隐私和价值的权衡确定隐私预算参数,包括:量化数据价值、量化隐私保护程度,再确定隐私预算参数优化目标函数,计算优化结果;并基于隐私预算参数优化结果添加噪声,实现对智能电表消费端的电负荷数据加密;包括如下步骤:
5、1)通过智能电表搜集获取电负荷数据信号;
6、2)进行数据聚合:将数据库的用电量数据项,即同一个时间下各个用户子群体的用电量进行加和,得到总用电量;
7、3)基于电负荷(用电量)数据相关性计算得到用电量相关灵敏度,进一步得到用电量全局灵敏度;
8、用电量全局灵敏度为用电量相关灵敏度的最大值;用电量相关灵敏度指对于一条用电量数据以及与其存在相关性的用电量数据的改变对用电量加和函数(同一个时间下各个用户子群体的用电量加和)的输出带来的最大变化值;
9、4)根据隐私和价值的权衡确定隐私预算参数;
10、5)根据全局灵敏度和隐私预算参数,获取噪声方差;
11、进一步地,设计加噪算法,根据噪声方差生成对应的随机噪声,添加噪声,将加噪后的数据传回数据申请者;
12、通过上述步骤,实现智能电表消费端的电负荷数据加密。
13、本发明方法具体应用时,包括:
14、a.将用户按区域划分,区域的划分可以依据地理位置(比如按区划分),也可以依据类型(比如生活区,工业区),在每个区域中通过智能电表搜集数据。
15、b.划分后为每个区域配备一个中端数据处理设备,该设备可以接受智能电表传输的数据信号,对数据信号进行处理并将信号传输给供电方。
16、c.供电方根据自己的需求向终端设备提出需要数据的申请。
17、d.中端设备对数据进行聚合并通过本发明的智能电表消费端的电负荷数据加密方法(cadp方法)加入噪声,并将加密好的数据传输给供电方。
18、d1.数据聚合
19、d2.确定查询灵敏度
20、d21.计算数据相关系数
21、d22.计算数据相关灵敏度
22、d3.根据隐私和价值的权衡确定隐私预算参数
23、d31)量化数据价值,采用经验风险损失的差作为数据价值损失,得到数据价值损失的上界;
24、d32)采用添加噪声前后的差的范数量化隐私保护程度;
25、d33)将数据价值损失和隐私保护程度进行线性组合,确定数据价值损失和隐私保护程度优化平衡的目标函数;
26、d34)计算优化结果,通过最小化目标函数得到最佳的隐私预算参数;
27、d4.设计加噪算法添加噪声,并将结果返回查询方
28、e.供电公司可以对用电数据按照自己的需求进行后处理比如用线性回归预测用户之后的用电量,从而更好地为用户提供服务。
29、与现有技术相比,本发明的有益效果:
30、本发明方法设计关联感知差分隐私方法,通过对智能电表搜集数据,进行数据聚合得到总用电量,并计算数据相关系数和数据相关灵敏度,进一步得到全局灵敏度;根据隐私和价值的权衡确定隐私预算参数,包括:量化数据价值、量化隐私保护程度、确定隐私预算参数优化目标函数、计算优化结果;并对隐私预算参数优化结果添加噪声,实现对智能电表消费端的电负荷数据加密。利用本发明提供的智能电表消费端的电负荷数据加密技术方案,可以降低智能电表消费端用户受到通过相关性攻击带来的安全风险,同时可以针对不同风险级别的智能电表消费端数据进行不同级别的保护,权衡了智能电表消费端数据的隐私和价值。
1.一种智能电表消费端的电负荷数据加密方法,其特征在于,设计关联感知差分隐私方法,通过对智能电表搜集数据,进行数据聚合得到总用电量,计算数据相关灵敏度和全局灵敏度;根据隐私和价值的权衡确定隐私预算参数;并对隐私预算参数优化结果添加噪声,实现对智能电表消费端的电负荷数据加密;包括如下步骤:
2.如权利要求1所述智能电表消费端的电负荷数据加密方法,其特征在于,进行数据聚合得到总用电量,具体是通过用电量加和函数将同一个时间下各个用户子群体的用电量进行加和,表示为:
3.如权利要求2所述智能电表消费端的电负荷数据加密方法,其特征在于,根据相关矩阵计算得到相关灵敏度;所述相关矩阵具体通过计算数据相关系数形成;相关矩阵表示为δ:
4.如权利要求3所述智能电表消费端的电负荷数据加密方法,其特征在于,相关灵敏度表示为:
5.如权利要求4所述智能电表消费端的电负荷数据加密方法,其特征在于,步骤41)数据价值的量化方法中,具体是采用经验风险损失的差来量化数据价值;其中,和βin分别为损失优化函数的最优系数,表示使后面的式子取最小值的β;j(β,d)是最小化经验风险的损失函数;jin(β,d)是数据添加噪声u的干扰时的损失函数;
6.如权利要求5所述智能电表消费端的电负荷数据加密方法,其特征在于,步骤42)量化隐私保护程度,具体是采用添加噪声的frobenius范数作为隐私的度量,表示为:
7.如权利要求6所述智能电表消费端的电负荷数据加密方法,其特征在于,步骤43)中,数据价值损失和隐私保护程度优化平衡的目标函数l(σ,v)是关于噪声方差的二次函数,表示为:
8.如权利要求7所述智能电表消费端的电负荷数据加密方法,其特征在于,步骤44)计算数据价值损失和隐私保护程度优化平衡的结果,通过最小化目标函数得到最佳的隐私预算参数;包括: