本申请涉及人工智能,特别是涉及一种作业结果自动确定方法、装置、计算机设备和存储介质。
背景技术:
1、人工智能是指计算机系统通过模拟人类智能的方式来执行各种任务的科学和工程,它致力于开发和构建智能系统,使其能够感知环境、理解语言、学习知识、推理思考、解决问题、自主决策等,以实现人类智能水平或超越人类智能的能力。
2、传统技术中,基于数字化员工的自动作业操作方法存在数据质量问题较差的现象,导致操作结果不准确或错误,会对业务决策产生严重的负面影响,误导管理决策或导致错误的行动,同时错误的数据可能需要更多的时间和精力来进行纠正或修复,从而导致操作的延误和效率低下,此外,当数字化员工依赖于错误数据执行任务时,可能需要额外的校正和返工过程,进一步增加时间和资源成本。
3、因此,通过自动作业方法确定出的作业结果存在准确性较差的问题。
技术实现思路
1、基于此,有必要针对上述技术问题,提供一种能够提高作业结果准确性的作业结果自动确定方法、装置、计算机设备和存储介质。
2、第一方面,本申请提供了一种作业结果自动确定方法,包括:
3、获取待执行作业的原始作业数据集;
4、对原始作业数据集进行预处理,得到目标作业数据集;预处理包括重复数据剔除、缺失数据补充和异常数据剔除中的至少一种;
5、通过卡方检验,从目标作业数据集中选取出数据类别属于预设特征类别的目标作业数据,得到特征作业数据集;
6、将特征作业数据集输入至预先训练好的作业结果预测模型中,得到待执行作业的作业结果。
7、在其中一个实施例中,对原始作业数据集进行预处理,得到目标作业数据集,包括:
8、确定原始作业数据集中每一原始作业数据的哈希值;
9、针对哈希值相同的原始作业数据,对其中一个原始作业数据进行保留处理;
10、根据保留处理后的原始作业数据,生成目标作业数据集。
11、在其中一个实施例中,对原始作业数据集进行预处理,得到目标作业数据集,包括:
12、将原始作业数据集,输入至回归模型,得到预测作业数据;
13、根据预测作业数据,对原始作业数据集进行更新处理,得到目标作业数据集。
14、在其中一个实施例中,对原始作业数据集进行预处理,得到目标作业数据集,包括:
15、确定原始作业数据集的均值和标准差值;
16、针对原始作业数据集中每一原始作业数据,根据作业数据集、均值和标准差值,确定原始作业数据的得分值;
17、对得分值低于预设得分阈值的原始作业数据进行删除处理,得到目标作业数据集。
18、在其中一个实施例中,通过卡方检验,从目标作业数据集中选取出数据类别属于预设特征类别的目标作业数据,生成特征作业数据集,包括:
19、确定目标作业数据集中每一目标作业数据的数据类别;
20、确定各数据类别的目标作业数据与预设特征类别之间的观察频数和期望频数;
21、根据观察频数和期望频数,从目标作业数据集中选取目标作业数据,得到特征作业数据集。
22、在其中一个实施例中,根据观察频数和期望频数,从目标作业数据集中选取目标作业数据,得到特征作业数据集,包括:
23、根据观察频数和期望频数,确定各数据类别对应目标作业数据的卡方统计值;
24、根据卡方统计值满足预设统计阈值的目标作业数据,生成特征作业数据集。
25、第二方面,本申请还提供了一种作业结果自动确定装置,包括:
26、数据获取模块,用于获取待执行作业的原始作业数据集;
27、数据处理模块,用于对原始作业数据集进行预处理,得到目标作业数据集;预处理包括重复数据剔除、缺失数据补充和异常数据剔除中的至少一种;
28、特征提取模块,用于通过卡方检验,从目标作业数据集中选取出数据类别属于预设特征类别的目标作业数据,得到特征作业数据集;
29、作业执行模块,用于将特征作业数据集输入至预先训练好的作业结果预测模型中,得到待执行作业的作业结果。
30、第三方面,本申请还提供了一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现以下步骤:
31、获取待执行作业的原始作业数据集;
32、对原始作业数据集进行预处理,得到目标作业数据集;预处理包括重复数据剔除、缺失数据补充和异常数据剔除中的至少一种;
33、通过卡方检验,从目标作业数据集中选取出数据类别属于预设特征类别的目标作业数据,得到特征作业数据集;
34、将特征作业数据集输入至预先训练好的作业结果预测模型中,得到待执行作业的作业结果。
35、第四方面,本申请还提供了一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现以下步骤:
36、获取待执行作业的原始作业数据集;
37、对原始作业数据集进行预处理,得到目标作业数据集;预处理包括重复数据剔除、缺失数据补充和异常数据剔除中的至少一种;
38、通过卡方检验,从目标作业数据集中选取出数据类别属于预设特征类别的目标作业数据,得到特征作业数据集;
39、将特征作业数据集输入至预先训练好的作业结果预测模型中,得到待执行作业的作业结果。
40、第五方面,本申请还提供了一种计算机程序产品,包括计算机程序,该计算机程序被处理器执行时实现以下步骤:
41、获取待执行作业的原始作业数据集;
42、对原始作业数据集进行预处理,得到目标作业数据集;预处理包括重复数据剔除、缺失数据补充和异常数据剔除中的至少一种;
43、通过卡方检验,从目标作业数据集中选取出数据类别属于预设特征类别的目标作业数据,得到特征作业数据集;
44、将特征作业数据集输入至预先训练好的作业结果预测模型中,得到待执行作业的作业结果。
45、上述作业结果自动确定方法、装置、计算机设备和存储介质,获取待执行作业的原始作业数据集;对原始作业数据集进行预处理,得到目标作业数据集;预处理包括重复数据剔除、缺失数据补充和异常数据剔除中的至少一种;通过卡方检验,从目标作业数据集中选取出数据类别属于预设特征类别的目标作业数据,得到特征作业数据集;将特征作业数据集输入至预先训练好的作业结果预测模型中,得到待执行作业的作业结果。本申请通过预处理使得得到的目标作业数据集中的目标作业数据更具备完整性和准确性,通过卡方检验进行特征提取,进一步减少目标作业数据集的特征空间维度,从而提高数据特征确定的准确性,进而确定得到更为准确的作业结果。
1.一种作业结果自动确定方法,其特征在于,所述方法包括:
2.根据权利要求1所述的方法,其特征在于,所述对所述原始作业数据集进行预处理,得到目标作业数据集,包括:
3.根据权利要求1所述的方法,其特征在于,所述对所述原始作业数据集进行预处理,得到目标作业数据集,包括:
4.根据权利要求1所述的方法,其特征在于,所述对所述原始作业数据集进行预处理,得到目标作业数据集,包括:
5.根据权利要求1所述的方法,其特征在于,所述通过卡方检验,从目标作业数据集中选取出数据类别属于预设特征类别的目标作业数据,生成特征作业数据集,包括:
6.根据权利要求5所述的方法,其特征在于,所述根据所述观察频数和所述期望频数,从所述目标作业数据集中选取目标作业数据,得到特征作业数据集,包括:
7.一种作业结果自动确定装置,其特征在于,所述装置包括:
8.一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至6中任一项所述的方法的步骤。
9.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至6中任一项所述的方法的步骤。
10.一种计算机程序产品,包括计算机程序,其特征在于,该计算机程序被处理器执行时实现权利要求1至6中任一项所述的方法的步骤。