本技术涉及农业数据隐私保护,特别涉及一种基于农业物联网的不完整数据查询方法及相关设备。
背景技术:
1、农业物联网通过集成各种传感器、控制器和执行器等设备,能够采集大量的生物体和环境数据,如地理位置、光照、湿度、温度、土壤成分、作物长势等,为农业生产提供了丰富的信息支持。由于各种原因(如传感器故障、网络中断等),农业物联网中的数据流可能会出现不完整的情况。这些不完整的数据流对于农业生产决策的制定可能会造成误导,因此需要一种有效的查询方法来处理这些不完整的数据。一般的数据查询方法需要预设每个属性的权值或者明确的规则进行检索和优化,但每种属性通常是表现出关联性,这些预设条件很难通用化。天际线查询是从给定数据集中筛选出不被任何其他数据点所支配的数据子集,即找到在多个关键属性上都表现优异的样本,为农业生产提供科学的决策支持,例如安全生产预警或种植产量推荐,即允许用户输入查询样本的属性数据和决策偏好,天际线检索出和查询样本在某些维度足够接近的优异数据,进而返回相关农业特征。
2、随着查询响应数量的增加,越来越多的数据所有者选择将数据外包给云服务器,以利用其广泛的计算和存储能力,使授权用户能够从这些外包的农业数据中检索天际线样本。然而,农业数据是农业生产者的重要资产,这些数据经过长时间的培育和研究,具有很高的价值。如果这些数据被泄露或滥用,将会对农业生产者造成巨大的损失,因此这些生物体的数据需要防止云服务器和其他未经授权的用户的非法获取。
3、目前安全的天际线查询方法主要在完整的数据集上执行,数据流的不完整性带来了新的挑战,其中缺失数据会妨碍数据项的支配比较,并破坏了天际线所蕴含的传递性特性,导致数据之间的循环支配。在明文环境中,可以简单地标记和跳过这些不完整的维度。然而,在外包场景下,这些中间操作和结果意味着即使确切的数据受到保护,也可以潜在地揭示关于数据的更多间接信息。同时,由于支配的传递性不适用于不完全数据,大多数基于传递性的天际线算法都无法应用。由此看见,现有的农业数据查询方法存在农业数据的查询准确性低的问题。
技术实现思路
1、本技术提供了一种基于农业物联网的不完整数据查询方法及相关设备,可以解决农业数据的查询准确性低的问题。
2、第一方面,本技术提供了一种基于农业物联网的不完整数据查询方法,该查询方法包括:
3、获取多个农业数据流,并对每个农业数据流进行特征提取,得到每个农业数据流的数据特征;农业数据流中包括多个维度,多个维度与多个农业数据一一对应,数据特征用于描述农业数据流中农业数据的缺失状况;
4、分别针对每个农业数据流,将农业数据流转换为第一数据流和第二数据流,并将农业数据流的数据特征转换为第一数据特征和第二数据特征;
5、获取目标用户的检索数据流,并对检索数据流进行特征提取,得到检索数据特征,并将检索数据流转换为第一检索数据流和第二检索数据流,将检索数据特征转换为第一检索数据特征和第二检索数据特征;检索数据流中包括多个维度,多个维度与多个检索数据一一对应;
6、基于所有第一数据流、所有第二数据流、第一检索数据流和第二检索数据流,计算得到每个农业数据流的第一映射数据和第二映射数据;第一映射数据用于描述第一数据流与第一检索数据流之间的相似程度,第二映射数据用于描述第二数据流与第二检索数据流之间的相似程度;
7、根据所有第一映射数据、所有第二映射数据、所有第一数据流、第二数据流,在所有农业数据流中进行查询,确定出多个目标农业数据流;
8、将所有目标农业数据流发送给目标用户。
9、可选的,对每个农业数据流进行特征提取,得到每个农业数据流的数据特征,包括:
10、分别针对每个农业数据流,进行以下步骤:
11、分别针对农业数据流中的每个维度,若维度存在对应的农业数据,则将维度的特征值设定为1,若维度不存在对应的农业数据,则将维度的特征值设定为0;
12、将所有维度的特征值进行整合,得到农业数据流的数据特征。
13、可选的,基于所有第一数据流、所有第二数据流、第一检索数据流和第二检索数据流,计算得到每个农业数据流的第一映射数据和第二映射数据,包括:
14、分别针对每个农业数据流,基于农业数据流的第一数据流、第二数据流、第一检索数据流和第二检索数据流,计算第一数据流与第一检索数据流之间的欧式距离和第二数据流与第二检索数据流之间的欧式距离,并基于第一数据流与第一检索数据流之间的欧式距离和第二数据流与第二检索数据流之间的欧式距离,计算农业数据流的第一映射数据和第二映射数据。
15、可选的,基于农业数据流的第一数据流、第二数据流、第一检索数据流和第二检索数据流,计算第一数据流与第一检索数据流之间的欧式距离和第二数据流与第二检索数据流之间的欧式距离,包括:
16、通过公式:
17、;
18、 ;
19、 ;
20、计算第个第一数据流与第一检索数据流之间的欧式距离和第个第二数据流与第二检索数据流之间的欧式距离;
21、其中,表示秘密共享的第一乘法算法,表示第个第一数据流的第个维度的农业数据与第一检索数据流的第个维度的检索数据之间的欧式距离,表示第个第二数据流的第个维度的农业数据与第二检索数据流的第个维度的检索数据之间的欧式距离,表示第个第一数据流的第个维度的值,表示第个第二数据流的第个维度的值,表示第一检索数据流的第个维度的值,表示第二检索数据流的第个维度的值,表示模数,表示农业数据流的数量,表示农业数据流和检索数据流的维度数量,表示第个第一数据流的第1个维度的值与第一检索数据流的第1个维度的值之间的欧式距离,表示第个第一数据流的第个维度的值与第一检索数据流的第个维度的值之间的欧式距离,表示第个第二数据流的第1个维度的值与所述第二检索数据流的第1个维度的值之间的欧式距离,表示第个第二数据流的第个维度的值与第二检索数据流的第个维度的值之间的欧式距离。
22、基于第一数据流与第一检索数据流之间的欧式距离和第二数据流与第二检索数据流之间的欧式距离,计算农业数据流的第一映射数据和第二映射数据,包括:
23、通过公式:
24、;
25、 ;
26、 ;
27、计算第个第一映射数据和第个第二映射数据;
28、其中,表示秘密共享的第二乘法算法,表示第个第一映射数据中第个维度的值,表示第个第二映射数据中第个维度的值,表示第一检索数据特征中第个维度的值,表示第二检索数据特征中第个维度的值,表示第个第一数据流的第一映射数据中第1个维度的值,表示第个第一数据流的第一映射数据中第个维度的值,表示第个第二映射数据中第1个维度的值,表示第个第二映射数据中第个维度的值。
29、可选的,根据所有第一映射数据、所有第二映射数据、所有第一数据流、第二数据流,在所有农业数据流中进行查询,确定出多个目标农业数据流,包括:
30、分别针对每个农业数据流,根据农业数据流对应的第一映射数据、第二映射数据、第一数据特征、第二数据特征,计算农业数据流的第一属性和以及第二属性和;
31、根据所有第一属性和以及所有第二属性和对所有农业数据流进行由小到大的排序,得到排序结果,并将排序结果中的前多个农业数据流作为过滤序列;
32、将过滤序列对应的所有第一数据流作为第一过滤序列,将过滤序列对应的所有第二数据流作为第二过滤序列;
33、基于第一过滤序列和第二过滤序列,计算第一过滤序列中每两个第一数据流之间的第一不完整型支配结果以及第二过滤序列中每两个第二数据流之间的第二不完整型支配结果;
34、分别针对过滤序列中的每个农业数据流,基于农业数据流对应的所有第一不完整型支配结果和所有第二不完整型支配结果,计算多个支配结果,若存在支配结果的值等于1,则将农业数据流移除,若不存在支配结果的值等于1,则将农业数据流作为一目标数据流。
35、可选的,根据农业数据流对应的第一映射数据、第二映射数据、第一数据特征、第二数据特征,计算农业数据流的第一属性和以及第二属性和,包括:
36、通过公式:
37、
38、计算第个农业数据流的第一属性和和第个农业数据流的第二属性和;
39、其中,表示秘密共享的第三乘法算法,表示第个第一数据特征中第个维度的值,表示第个第一映射数据中第个维度的值,表示第个第二数据特征中第个维度的值,表示第个第二映射数据中第个维度的值,表示农业数据流和检索数据流的维度数量,表示农业数据流的数量,表示模数。
40、可选的,基于第一过滤序列和第二过滤序列,计算第一过滤序列中每两个第一数据流之间的第一不完整型支配结果以及第二过滤序列中每两个第二数据流之间的第二不完整型支配结果,包括:
41、通过公式:
42、
43、
44、
45、
46、
47、
48、计算第个第一数据流与第个第一数据流之间的第一不完整型支配结果和第个第二数据流与第个第二数据流之间的第二不完整型支配结果;
49、其中,表示秘密共享的第四乘法算法,表示秘密共享的比较算法,表示秘密共享的第五乘法算法,表示第个第一数据流与第个第一数据流之间的严格支配结果,表示在公共完整维度下,在第维中第个第一数据流与第个第一数据流之间的松弛支配结果,表示第个第二数据流与第个第二数据流之间的严格支配结果,表示在公共完整维度下,在第维中第个第二数据流与第个第二数据流之间的松弛支配结果,表示模数,表示在第个第一数据流的影响下第个第一数据流的完整属性和,表示在第个第一数据流的影响下第个第一数据流的完整属性和,表示在第个第二数据流的影响下第个第二数据流的完整属性和,表示在第个第二数据流的影响下第个第二数据流的完整属性和,表示在第个第一数据流的影响下第个第一数据流的公共完整特征,表示在第个第二数据流的影响下第个第二数据流的公共完整特征,表示第个第一数据特征中第个维度的值,表示第个第二数据特征中第个维度的值,表示在第维中第个第一数据流与第个第一数据流之间的松弛支配结果,表示在第维中第个第二数据流与第个第二数据流之间的松弛支配结果,表示第个第一映射数据中第个维度的值,表示第个第一映射数据中第个维度的值,表示第个第二映射数据中第个维度的值,表示第个第二映射数据中第个维度的值,表示第个第一数据特征中第个维度的值,表示第个第二数据特征中第个维度的值,,,表示过滤序列中农业数据流的数量。
50、可选的,基于农业数据流对应的所有第一不完整型支配结果和所有第二不完整型支配结果,计算多个支配结果,包括:
51、通过公式:
52、
53、计算第个农业数据流在第个数据流影响下的支配结果;
54、其中,表示第个农业数据流的第一数据流与第个数据流之间的第一不完整型支配结果,表示第个农业数据流的第二数据流与第个第二数据流之间的第二不完整型支配结果。
55、第二方面,本技术实施例提供了一种基于农业物联网的不完整数据查询装置,包括:
56、特征提取模块,获取多个农业数据流,并对每个农业数据流进行特征提取,得到每个农业数据流的数据特征;农业数据流中包括多个维度,多个维度与多个农业数据一一对应,数据特征用于描述农业数据流中农业数据的缺失状况;
57、第一转换模块,分别针对每个农业数据流,将农业数据流转换为第一数据流和第二数据流,并将农业数据流的数据特征转换为第一数据特征和第二数据特征;
58、第二转换模块,获取目标用户的检索数据流,并对检索数据流进行特征提取,得到检索数据特征,并将检索数据流转换为第一检索数据流和第二检索数据流,将检索数据特征转换为第一检索数据特征和第二检索数据特征;检索数据流中包括多个维度,多个维度与多个检索数据一一对应;
59、计算模块,基于所有第一数据流、所有第二数据流、第一检索数据流和第二检索数据流,计算得到每个农业数据流的第一映射数据和第二映射数据;第一映射数据用于描述第一数据流与第一检索数据流之间的相似程度,第二映射数据用于描述第二数据流与第二检索数据流之间的相似程度;
60、查询模块,根据所有第一映射数据、所有第二映射数据、所有第一数据流、第二数据流,在所有农业数据流中进行查询,确定出多个目标农业数据流;
61、发送模块,将所有目标农业数据流发送给目标用户。
62、第三方面,本技术实施例提供了一种终端设备,包括存储器、处理器以及存储在存储器中并可在处理器上运行的计算机程序,该处理器执行上述计算机程序时实现上述的基于农业物联网的不完整数据查询方法。
63、第四方面,本技术实施例提供了一种计算机可读存储介质,该计算机可读存储介质存储有计算机程序,该计算机程序被处理器执行时实现上述的基于农业物联网的不完整数据查询方法。
64、本技术的上述方案有如下的有益效果:
65、在本技术的实施例中,通过获取多个农业数据流,并对每个农业数据流进行特征提取,得到每个农业数据流的数据特征,然后分别针对每个农业数据流,将农业数据流转换为第一数据流和第二数据流,并将农业数据流的数据特征转换为第一数据特征和第二数据特征,再获取目标用户的检索数据流,并对检索数据流进行特征提取,得到检索数据特征,并将检索数据流转换为第一检索数据流和第二检索数据流,将检索数据特征转换为第一检索数据特征和第二检索数据特征,然后基于所有第一数据流、所有第二数据流、第一检索数据流和第二检索数据流,计算得到每个农业数据流的第一映射数据和第二映射数据,再根据所有第一映射数据、所有第二映射数据、所有第一数据流、第二数据流,在所有农业数据流中进行查询,确定出多个目标农业数据流,最后将所有目标农业数据流发送给目标用户。其中,获取农业数据流的数据特征,能够对农业数据流的数据缺失状况进行描述,在考虑数据缺失状况下计算得到的映射数据的准确性和合理性提高,根据准确性和合理性高的映射数据对目标农业数据流进行确定,实现了对不完整数据流的查询,提高目标农业数据流的准确性,进而提高农业数据的查询准确性。
66、此外,将农业数据流和检索数据流转换为两个数据流,能够提高农业数据流和检索数据流的安全性,可以便于将两个数据流分别传输到两个设备进行处理,且单个设备仅具有数据流转换后的一部分数据,无法得知数据流的完整信息,实现对农业数据流和检索数据流的隐私保护。
67、本技术的其它有益效果将在随后的具体实施方式部分予以详细说明。
1.一种基于农业物联网的不完整数据查询方法,其特征在于,包括:
2.根据权利要求1所述的不完整数据查询方法,其特征在于,所述对每个所述农业数据流进行特征提取,得到每个所述农业数据流的数据特征,包括:
3.根据权利要求1所述的不完整数据查询方法,其特征在于,所述基于所有第一数据流、所有第二数据流、所述第一检索数据流和所述第二检索数据流,计算得到每个农业数据流的第一映射数据和第二映射数据,包括:
4.根据权利要求3所述的不完整数据查询方法,其特征在于,所述基于所述农业数据流的第一数据流、第二数据流、第一检索数据流和所述第二检索数据流,计算所述第一数据流与所述第一检索数据流之间的欧式距离和所述第二数据流与所述第二检索数据流之间的欧式距离,包括:
5.根据权利要求1所述的不完整数据查询方法,其特征在于,所述根据所有第一映射数据、所有第二映射数据、所有第一数据流、第二数据流,在所有农业数据流中进行查询,确定出多个目标农业数据流,包括:
6.根据权利要求5所述的不完整数据查询方法,其特征在于,所述根据所述农业数据流对应的第一映射数据、第二映射数据、第一数据特征、第二数据特征,计算所述农业数据流的第一属性和以及第二属性和,包括:
7.根据权利要求5所述的不完整数据查询方法,其特征在于,所述基于所述第一过滤序列和所述第二过滤序列,计算所述第一过滤序列中每两个第一数据流之间的第一不完整型支配结果以及所述第二过滤序列中每两个第二数据流之间的第二不完整型支配结果,包括:
8.根据权利要求7所述的不完整数据查询方法,其特征在于,所述基于所述农业数据流对应的所有第一不完整型支配结果和所有第二不完整型支配结果,计算多个支配结果,包括:
9.一种终端设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如权利要求1至8任一项所述的基于农业物联网的不完整数据查询方法。
10.一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至8任一项所述的基于农业物联网的不完整数据查询方法。