本申请涉及数据处理,具体涉及一种用户信息数据准确性的检测方法、装置及电子设备。
背景技术:
1、随着个人信息查询的门槛逐渐降低,用户可以随时获取自己的信息数据,包括话费、套餐余额和详单信息等,也使得用户对业务数据的准确性要求变高,一旦用户获得的业务数据不准确,就会引起敏感用户的投诉,甚至引发大规模的舆论影响。但是由于运营商的业务复杂,套餐、营销案和增值策划等活动五花八门,每个用户叠加的优惠方案都不一样,每个优惠的抵扣优先级也各有不同,使得两个用户即使花了同样时长消耗了同样大小的流量,其产生的计算费用也不同,因此,用户信息数据准确性的保障难度极大。
2、相关技术中,通常采用功能测试的方式,基于对业务需求的理解,针对不同的代码路径设计白盒测试用例进行不同场景下的业务准确性测试。而功能测试对测试场景的丰富性要求极高,需要测试用户在不同套餐、营销案和增值策划等活动优惠叠加场景下的信息数据。并且对测试人员的要求也高,对业务不熟悉的测试人员甚至无法判断测试结果是否正确。因此,该方式也无法保障用户信息数据准确性。
技术实现思路
1、本申请实施例提供一种用户信息数据准确性的检测方法、装置及电子设备,用以解决无法保障用户信息数据准确性的技术问题。
2、第一方面,本申请实施例提供一种用户信息数据准确性的检测方法,包括:
3、获取目标用户的待测信息数据;
4、将所述待测信息数据输入至所述目标用户对应的异常检测模型中,确定测试结果;
5、基于所述待测信息数据对应的概率分布函数和所述异常检测模型对应的概率阈值,判断测试结果为正常结果或异常结果;
6、其中,所述异常检测模型基于所述目标用户的历史信息数据集训练得到,所述目标用户是基于每个用户对信息查询接口的调用次数、所述信息查询接口对应的业务重要性以及在所述信息查询接口故障情况下所述每个用户的投诉行为筛选的,所述历史信息数据集基于在所述信息查询接口发生故障的情况下所述目标用户的投诉行为确定。
7、在一些实施例中,所述获取目标用户的待测信息数据之前,所述方法还包括:
8、基于所述每个用户对信息查询接口的调用次数和所述信息查询接口对应的权重,确定所述每个用户的信息数据关注度,所述信息查询接口对应的权重基于所述信息查询接口对应的业务重要性确定;
9、基于所述信息查询接口的故障次数和在所述信息查询接口故障情况下所述每个用户的投诉行为,确定所述每个用户的投诉意愿概率;
10、基于所述每个用户的信息数据关注度和所述每个用户的投诉意愿概率,在所有用户中筛选出所述目标用户。
11、在一些实施例中,所述历史信息数据集通过如下方式构建:
12、在预设时段内采用模拟报文探测所述信息查询接口,所述模拟报文用于获取所述信息查询接口的返回值,所述返回值用于指示所述目标用户的历史信息数据;
13、在所述信息查询接口没有故障的情况下,将所述信息查询接口的返回值标记为正常结果,得到正常结果数据集;
14、在所述信息查询接口故障或所述目标用户对所述信息查询接口存在投诉行为的情况下,将所述返回值标记为异常结果,得到异常结果数据集;
15、基于所述正常结果数据集和所述异常结果数据集,构建所述历史信息数据集。
16、在一些实施例中,所述异常检测模型通过如下方式训练:
17、将所述历史信息数据集划分为训练集和交叉验证集,所述训练集基于所述正常结果数据集构建,所述交叉验证集基于所述正常结果数据集和所述异常结果数据集构建;
18、基于所述训练集和所述交叉验证集,训练所述异常检测模型,得到训练完成的异常检测模型。
19、在一些实施例中,所述基于所述训练集和所述交叉验证集,训练所述异常检测模型,得到训练完成的异常检测模型之后,所述方法还包括:
20、基于所述目标用户的历史信息数据对应的概率分布函数和所述概率阈值,优化所述训练完成的异常检测模型。
21、在一些实施例中,所述基于所述待测信息数据对应的概率分布函数和概率阈值,判断测试结果为正常结果或异常结果之后,所述方法还包括:
22、在所述异常检测模型输出的测试结果与所述测试结果的判断结果不同的情况下,更新所述概率阈值。
23、在一些实施例中,所述基于所述待测信息数据对应的概率分布函数和所述异常检测模型对应的概率阈值,判断测试结果为正常结果或异常结果,包括:
24、基于所述待测信息数据对应的概率分布函数,确定所述待测信息数据为所述正常结果的概率;
25、在所述待测信息数据为所述正常结果的概率大于所述概率阈值的情况下,确定所述测试结果为正常结果;
26、在所述待测信息数据为所述正常结果的概率小于等于所述概率阈值的情况下,确定所述测试结果为异常结果。
27、第二方面,本申请实施例提供一种用户信息数据准确性的检测装置,包括:
28、获取模块,用于获取目标用户的待测信息数据;
29、第一确定模块,用于将所述待测信息数据输入至所述目标用户对应的异常检测模型中,确定测试结果;
30、判断模块,用于基于所述待测信息数据对应的概率分布函数和所述异常检测模型对应的概率阈值,判断测试结果为正常结果或异常结果;
31、其中,所述异常检测模型基于所述目标用户的历史信息数据集训练得到,所述目标用户是基于每个用户对信息查询接口的调用次数、所述信息查询接口对应的业务重要性以及在所述信息查询接口故障情况下所述每个用户的投诉行为筛选的,所述历史信息数据集基于在所述信息查询接口发生故障的情况下所述目标用户的投诉行为确定。
32、第三方面,本申请实施例提供一种电子设备,包括处理器和存储有计算机程序的存储器,所述处理器执行所述程序时实现第一方面所述的用户信息数据准确性的检测方法的步骤。
33、第四方面,本申请实施例提供一种计算机程序产品,包括计算机程序,所述计算机程序被处理器执行时实现第一方面所述的用户信息数据准确性的检测方法的步骤。
34、本申请实施例提供的用户信息数据准确性的检测方法、装置及电子设备,通过用户对自身信息数据敏感和易产生投诉的特性,筛选目标用户,以抽样统计的方式完成全量用户的信息准确性保障,以极小的投入完成了用户满意度的大幅提升;采用异常检测模型进行异常数据识别,不仅解除了判断用户信息数据准确性与业务需求理解的高耦合,而且极大提高了信息数据准确性的保障效率,也降低了人力成本。
1.一种用户信息数据准确性的检测方法,其特征在于,包括:
2.根据权利要求1所述的用户信息数据准确性的检测方法,其特征在于,所述获取目标用户的待测信息数据之前,所述方法还包括:
3.根据权利要求1所述的用户信息数据准确性的检测方法,其特征在于,所述历史信息数据集通过如下方式构建:
4.根据权利要求3所述的用户信息数据准确性的检测方法,其特征在于,所述异常检测模型通过如下方式训练:
5.根据权利要求4所述的用户信息数据准确性的检测方法,其特征在于,所述基于所述训练集和所述交叉验证集,训练所述异常检测模型,得到训练完成的异常检测模型之后,所述方法还包括:
6.根据权利要求4所述的用户信息数据准确性的检测方法,其特征在于,所述基于所述待测信息数据对应的概率分布函数和概率阈值,判断测试结果为正常结果或异常结果之后,所述方法还包括:
7.根据权利要求4所述的用户信息数据准确性的检测方法,其特征在于,所述基于所述待测信息数据对应的概率分布函数和所述异常检测模型对应的概率阈值,判断测试结果为正常结果或异常结果,包括:
8.一种用户信息数据准确性的检测装置,其特征在于,包括:
9.一种电子设备,包括处理器和存储有计算机程序的存储器,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至7任一项所述的用户信息数据准确性的检测方法的步骤。
10.一种计算机程序产品,包括计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至7任一项所述的用户信息数据准确性的检测方法的步骤。