本技术涉及还款预测领域,特别是涉及一种个人还款风险预测方法、装置、设备、介质及产品。
背景技术:
1、个人客户还款能力模型(以下简称“模型”),是近年来兴起的为了保障银行和其他金融机构(以下简称“金融机构”)的金融安全而设立的一种关于人身金融权限的划定模型。
2、当前市场上,金融机构所使用的模型计算方法,根据客户的信用历史资料,利用逻辑回归等传统的机器学习算法模型,得到不同等级的信用评分分数。根据客户分数,来决定客户可以持有的金额权限,从而保证还款等业务的安全性。通常情况下,还款能力越高,违约率越低。
3、该技术的缺点,包括如下几个主要方面:
4、1、数据源和鲜活度的劣势。金融机构受限于可获取信息的范围,判断客户还款能力主要依赖银行流水、个税、公积金、不动产、或历史信贷情况等数据。由于各数据源侧重点不一样,数据壁垒教高,加之用到都是客户的历史信息,数据不够鲜活,计算结果准确度必然收到影响。
5、2、算法精读低。现有的还款能力模型应用,多使用传统逻辑回归模型,该模型参数量较少、精度不够,而且对数据质量要求严格,特征数据繁琐。
6、3、对外依赖度大。金融机构对于自有数据无法覆盖的客户群体,经常需要借助采购外部评级机构的评分,在多个维度上进行加权。
7、综上所述,目前缺乏精准度高、高覆盖面的单一数据源客户还款能力计算模型。
技术实现思路
1、本技术的目的是提供一种个人还款风险预测方法、装置、设备、介质及产品,可提高个人还款风险预测的准确性。
2、为实现上述目的,本技术提供了如下方案:
3、第一方面,本技术提供了一种个人还款风险预测方法,所述个人还款风险预测方法包括:
4、获取数据源信息数据;所述数据源信息数据包括指标和所述指标对应的数据;所述指标包括:实缴金额、应缴金额、账户累计本息、职工工资总额、单位实缴金额、建户年限、缴费基数和缴费月数;
5、对所述数据源信息数据进行处理,得到处理数据源信息数据;
6、将所述处理数据源信息数据输入至还款风险预测模型,得到预测值;所述预测值用以表征个人还款存在的风险等级;所述还款风险预测模型是基于神经网络进行训练得到的;所述神经网络包括相互连接的第一隐层、第二隐层和第三隐层;
7、根据所述预测值按照设定方式进行映射处理,得到个人还款金额。
8、可选地,对所述数据源信息数据进行处理,得到处理数据源信息数据,具体包括:
9、对所述数据源信息数据进行清洗处理,得到清理后的数据源信息数据;
10、对清理后的数据源信息数据进行相关性分析,得到分析后的数据源信息数据;
11、对分析后的数据源信息数据进行归一化以及映射处理,得到处理数据源信息数据。
12、可选地,对所述数据源信息数据进行清洗处理,得到清理后的数据源信息数据,具体包括:
13、对所述数据源信息数据进行统计分析,得到统计数据;
14、根据所述数据源信息数据确定字段指标数据;所述字段指标数据包括:众数、连续增长值和同字段值;
15、根据所述字段指标数据,对所述统计数据中存在的空值和异常值,进行填充处理,得到清理后的数据源信息数据;所述异常值为超过设定阈值的数值。
16、可选地,对清理后的数据源信息数据进行相关性分析,得到分析后的数据源信息数据,具体包括:
17、采用前向逐步回归方法和后向逐步回归方法对清理后的数据源信息数据,基于贡献度进行筛选,得到筛选数据;所述贡献度是基于共线性分析的回归系数确定的;所述贡献度包括:权重;
18、将所述筛选数据按照所述贡献度的值进行排序,得到排序数据;
19、将所述排序数据确定为分析后的数据源信息数据。
20、可选地,所述还款风险预测模型的确定方法,包括:
21、获取训练数据;所述训练数据包括:训练的处理数据源信息数据和训练的处理数据源信息数据对应的真实值;
22、构建神经网络;所述神经网络包括相互连接的第一隐层、第二隐层和第三隐层;
23、将所述训练数据输入至所述神经网络中,以损失函数的值处于设定范围内为目标,对所述神经网络的参数进行迭代更新训练,得到训练后的神经网络;所述损失函数是基于所述神经网络的输出值,与训练的处理数据源信息数据对应的真实值确定的;所述参数包括:加权权重和偏置;
24、将训练后的神经网络确定为所述还款风险预测模型。
25、可选地,将所述训练数据输入至所述神经网络中,以损失函数的值处于设定范围内为目标,对所述神经网络的参数进行迭代更新训练,得到训练后的神经网络,具体包括:
26、对任一迭代次数下:
27、将所述训练数据输入至所述第一隐层中,并根据第一隐层的参数进行加权和非线性化处理,得到第一处理数据;
28、将所述第一处理数据输入至所述第二隐层中,并根据第二隐层的参数进行加权和非线性化处理,得到第二处理数据;
29、将所述第二处理数据输入至所述第三隐层中,并根据第三隐层的参数进行加权和非线性化处理,得到所述神经网络的输出值;
30、根据训练的处理数据源信息数据对应的真实值与所述神经网络的输出值,确定所述损失函数;
31、根据所述损失函数,对第三隐层的参数进行偏导处理,得到第三偏导参数;
32、根据所述第三偏导参数和所述损失函数,对第二隐层的参数进行偏导处理,得到第二偏导参数;
33、根据所述第二偏导参数和所述损失函数,对第一隐层的参数进行偏导处理,得到第一偏导参数;
34、将所述第一偏导参数作为下一迭代次数下的第一隐层的参数,并返回“将所述训练数据输入至所述第一隐层中,并根据第一隐层的参数进行加权和非线性化处理,得到第一处理数据”,直至所述损失函数的值处于设定范围内或者迭代次数达到设定阈值,停止迭代;
35、将停止迭代时的参数对应的神经网络,确定为训练后的神经网络。
36、第二方面,本技术提供了一种个人还款风险预测装置,所述个人还款风险预测装置包括:
37、数据获取模块,用于获取数据源信息数据;所述数据源信息数据包括指标和所述指标对应的数据;所述指标包括:实缴金额、应缴金额、账户累计本息、职工工资总额、单位实缴金额、建户年限、缴费基数和缴费月数;
38、数据处理模块,用于对所述数据源信息数据进行处理,得到处理数据源信息数据;
39、预测模块,用于将所述处理数据源信息数据输入至还款风险预测模型,得到预测值;所述预测值用以表征个人还款存在的风险等级;所述还款风险预测模型是基于神经网络进行训练得到的;所述神经网络包括相互连接的第一隐层、第二隐层和第三隐层;
40、映射模块,用于根据所述预测值按照设定方式进行映射处理,得到个人还款金额。
41、第三方面,本技术提供了一种计算机设备,包括:存储器、处理器以存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述计算机程序以实现上述所述的个人还款风险预测方法。
42、第四方面,本技术提供了一种计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现上述所述的个人还款风险预测方法。
43、第五方面,本技术提供了一种计算机程序产品,包括计算机程序,该计算机程序被处理器执行时实现上述所述的个人还款风险预测方法。
44、根据本技术提供的具体实施例,本技术公开了以下技术效果:
45、本技术提供了一种个人还款风险预测方法,通过获取数据源信息数据,然后对数据源信息数据进行处理,得到处理数据源信息数据;将处理数据源信息数据输入至还款风险预测模型,得到预测值;该预测值用以表征个人还款存在的风险等级;根据预测值按照设定方式进行映射处理,得到个人还款金额。由于本技术的数据源信息数据不再受限于可获取的有限范围,并且还款风险预测模型是基于神经网络进行训练得到的,克服了现有技术中模型参数量有限,导致精度不高的问题。所以,在此基础上,本技术能够提高个人还款风险预测的准确性。
1.一种个人还款风险预测方法,其特征在于,所述个人还款风险预测方法包括:
2.根据权利要求1所述的个人还款风险预测方法,其特征在于,对所述数据源信息数据进行处理,得到处理数据源信息数据,具体包括:
3.根据权利要求2所述的个人还款风险预测方法,其特征在于,对所述数据源信息数据进行清洗处理,得到清理后的数据源信息数据,具体包括:
4.根据权利要求2所述的个人还款风险预测方法,其特征在于,对清理后的数据源信息数据进行相关性分析,得到分析后的数据源信息数据,具体包括:
5.根据权利要求1所述的个人还款风险预测方法,其特征在于,所述还款风险预测模型的确定方法,包括:
6.根据权利要求5所述的个人还款风险预测方法,其特征在于,将所述训练数据输入至所述神经网络中,以损失函数的值处于设定范围内为目标,对所述神经网络的参数进行迭代更新训练,得到训练后的神经网络,具体包括:
7.一种个人还款风险预测装置,其特征在于,所述个人还款风险预测装置包括:
8.一种计算机设备,包括:存储器、处理器以存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序以实现权利要求1-6中任一项所述的个人还款风险预测方法。
9.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该计算机程序被处理器执行时实现权利要求1-6中任一项所述的个人还款风险预测方法。
10.一种计算机程序产品,包括计算机程序,其特征在于,该计算机程序被处理器执行时实现权利要求1-6中任一项所述的个人还款风险预测方法。