本说明书一个或多个实施例涉及计算机领域,尤其涉及用于多机构的风险预测模型的训练、预测方法和装置。
背景技术:
1、信用风险,是指交易对方不履行到期债务的风险。信用风险又称违约风险,是指借款人、证券发行人或交易对方因种种原因,不愿或无力履行合同条件而构成违约,致使银行、投资者或交易对方遭受损失的可能性。
2、信用风险预测在数字微贷中扮演着至关重要的角色,常常会涉及用户的隐私数据。在数字金融平台上,数百万用户来自数十家金融机构,而这些机构的数量经常发生变化。与传统的单一机构信用违约预测问题不同,现代数字金融平台中的多机构信用违约预测面临三个挑战:不同机构间数据分布的变化,尾部或冷启动机构中的数据稀疏,以及大规模样本。
3、因此,需要提供用于多机构的风险预测模型的训练、预测方案,能够针对不同机构的用户进行准确的风险预测,能够针对尾部或冷启动机构的用户进行准确的风险预测,以及能够针对大规模样本实现高效的训练。
技术实现思路
1、本说明书一个或多个实施例描述了一种用于多机构的风险预测模型的训练、预测方法和装置,能够针对不同机构的用户进行准确的风险预测,能够针对尾部或冷启动机构的用户进行准确的风险预测,以及能够针对大规模样本实现高效的训练。
2、第一方面,提供了一种用于多机构的风险预测模型的训练方法,该方法由分布式系统内多个工作节点中的任一工作节点执行,包括:
3、获取多个机构中目标机构对应的一批样本构成的目标样本集,其中样本包括目标机构的样本用户的用户特征和所述样本用户的风险标签;
4、在第一阶段,根据所述目标样本集,与其他工作节点联合确定所述多个机构对应的多个风险预测模型的元基础参数;其中,所述多个风险预测模型具有共享的特征表示网络,任一所述风险预测模型具有对应机构专用的预测网络;
5、在第二阶段,根据所述目标样本集,在所述元基础参数的基础上,调整所述目标机构的目标风险预测模型中预测网络的专属参数。
6、在一种可能的实施方式中,所述多个工作节点针对不同机构并行执行所述训练。
7、在一种可能的实施方式中,所述多个机构分别对应的目标样本集采用并行处理的方式生成。
8、在一种可能的实施方式中,所述获取多个机构中目标机构对应的一批样本构成的目标样本集,包括:
9、从数据库的目标分区中读取所述目标样本集,其中,在所述数据库中,对应于同一机构的样本存储于一个数据库分区中。
10、在一种可能的实施方式中,所述目标样本集包括支持集和查询集,所述第一阶段包括多轮迭代,任意一轮迭代包括:
11、获取所述多个风险预测模型的当前元基础参数;
12、针对目标机构对应的目标风险预测模型,基于所述支持集更新所述预测网络的当前元基础参数,得到所述目标机构的当前专属模型;
13、确定所述目标机构的当前专属模型针对所述查询集的单项预测损失;
14、基于该单项预测损失,与其他工作节点联合确定各机构分别对应的单项预测损失的综合损失,根据综合损失对所述特征表示网络和所述预测网络的当前元基础参数进行更新。
15、在一种可能的实施方式中,所述第二阶段包括:
16、针对目标机构对应的目标风险预测模型,利用所述目标样本集中的多个样本更新所述预测网络的当前元基础参数,得到所述目标机构的专属参数。
17、第二方面,提供了一种用于多机构的用户风险预测方法,该方法由分布式系统内多个工作节点中的任一工作节点执行,包括:
18、获取多个机构中目标机构的目标用户的用户特征;
19、从预先采用第一方面所述的方法得到的针对多个机构训练的多个风险预测模型中,选择所述目标机构对应的目标风险预测模型;其中,所述多个风险预测模型具有共享的特征表示网络,任一所述风险预测模型具有专用的预测网络;
20、将所述用户特征输入所述目标风险预测模型,依次通过所述特征表示网络和所述预测网络进行处理,得到所述目标用户的风险预测结果。
21、在一种可能的实施方式中,所述选择所述目标机构对应的目标风险预测模型,包括:
22、从所述多个工作节点均能够访问的目标存储空间,获取机构标识与预测网络的专属参数的对应关系表;
23、从所述对应关系表中,查找所述目标机构的机构标识对应的专属参数,以得到所述目标风险预测模型。
24、第三方面,提供了一种用于多机构的风险预测模型的训练装置,该装置设置于分布式系统内多个工作节点中的任一工作节点,包括:
25、获取单元,用于获取多个机构中目标机构对应的一批样本构成的目标样本集,其中样本包括目标机构的样本用户的用户特征和所述样本用户的风险标签;
26、第一训练单元,用于在第一阶段,根据所述获取单元获取的目标样本集,与其他工作节点联合确定所述多个机构对应的多个风险预测模型的元基础参数;其中,所述多个风险预测模型具有共享的特征表示网络,任一所述风险预测模型具有对应机构专用的预测网络;
27、第二训练单元,用于在第二阶段,根据所述获取单元获取的目标样本集,在所述第一训练单元得到的元基础参数的基础上,调整所述目标机构的目标风险预测模型中预测网络的专属参数。
28、第四方面,提供了一种用于多机构的用户风险预测装置,该装置设置于分布式系统内多个工作节点中的任一工作节点,包括:
29、获取单元,用于获取多个机构中目标机构的目标用户的用户特征;
30、选择单元,用于从预先采用第三方面所述的装置得到的针对多个机构训练的多个风险预测模型中,选择所述目标机构对应的目标风险预测模型;其中,所述多个风险预测模型具有共享的特征表示网络,任一所述风险预测模型具有专用的预测网络;
31、预测单元,用于将所述获取单元获取的用户特征输入所述选择单元选择的目标风险预测模型,依次通过所述特征表示网络和所述预测网络进行处理,得到所述目标用户的风险预测结果。
32、第五方面,提供了一种计算机可读存储介质,其上存储有计算机程序,当所述计算机程序在计算机中执行时,令计算机执行第一方面或第二方面的方法。
33、第六方面,提供了一种计算设备,包括存储器和处理器,所述存储器中存储有可执行代码,所述处理器执行所述可执行代码时,实现第一方面或第二方面的方法。
34、通过本说明书实施例提供的方法和装置,提出了一种新颖的分布式元学习算法框架,用于大规模数据量的工业场景下进行复杂的多场景多任务建模,通过机构划分元任务;优化了传统模型的参数结构,多个风险预测模型具有共享的特征表示网络,任一所述风险预测模型具有对应机构专用的预测网络,也就是说,采用通用共享参数和个性化参数的划分;设计了对应的两阶段优化算法,在第一阶段,生成一个与机构无关的通用模型,在第二阶段,使用与机构相关的样本更新通用模型参数,生成不同机构的个性化参数。经过实验验证,能够针对不同机构的用户进行准确的风险预测,能够针对尾部或冷启动机构的用户进行准确的风险预测,以及能够针对大规模样本实现高效的训练。
1.一种用于多机构的风险预测模型的训练方法,所述方法由分布式系统内多个工作节点中的任一工作节点执行,包括:
2.如权利要求1所述的方法,其中,所述多个工作节点针对不同机构并行执行所述训练。
3.如权利要求1所述的方法,其中,所述多个机构分别对应的目标样本集采用并行处理的方式生成。
4.如权利要求1所述的方法,其中,所述获取多个机构中目标机构对应的一批样本构成的目标样本集,包括:
5.如权利要求1所述的方法,其中,所述目标样本集包括支持集和查询集,所述第一阶段包括多轮迭代,任意一轮迭代包括:
6.如权利要求1所述的方法,其中,所述第二阶段包括:
7.一种用于多机构的用户风险预测方法,所述方法由分布式系统内多个工作节点中的任一工作节点执行,包括:
8.如权利要求7所述的方法,其中,所述选择所述目标机构对应的目标风险预测模型,包括:
9.一种用于多机构的风险预测模型的训练装置,所述装置设置于分布式系统内多个工作节点中的任一工作节点,包括:
10.一种用于多机构的用户风险预测装置,所述装置设置于分布式系统内多个工作节点中的任一工作节点,包括:
11.一种计算机可读存储介质,其上存储有计算机程序,当所述计算机程序在计算机中执行时,令计算机执行权利要求1-8中任一项的所述的方法。
12.一种计算设备,包括存储器和处理器,所述存储器中存储有可执行代码,所述处理器执行所述可执行代码时,实现权利要求1-8中任一项的所述的方法。