企业状态数据的确定方法、装置、设备、介质及程序产品与流程

    技术2025-01-14  40


    本申请属于大数据领域,尤其涉及一种企业状态数据的确定方法、装置、设备、介质及程序产品。


    背景技术:

    1、为了便于对企业的管理,需要企业上报企业状态数据,例如,企业每年可上报企业中的从业人数、经营现况等数据。但由于一些企业内部成员变动较大使得企业状态数据时效性不足,或者,部分上报的企业状态数据缺乏真实性,导致上报的企业状态数据的准确度较低,并不能体现企业的真实状况。在一些需要企业的真实状况的场景中,如企业稽核、市场调查等场景,现阶段提供的企业状态数据难以起到有效作用。


    技术实现思路

    1、本申请实施例提供一种企业状态数据的确定方法、装置、设备、介质及程序产品,能够提高得到的企业状态数据的准确性。

    2、第一方面,本申请实施例提供一种企业状态数据的确定方法,包括:获取待测企业的原始数据,原始数据包括通信关联数据;对待测企业的通信关联数据进行拓展处理,得到待测企业的拓展数据;基于待测企业的原始数据和拓展数据,得到待测企业的特征数据;利用预先训练的企业状态预测模型对待测企业的特征数据进行处理,输出待测企业的企业状态数据,待测企业的企业状态数据包括待测企业对应的预测成员数量,企业状态预测模型为最小绝对收缩与选择算子lasso模型,企业状态预测模型利用已知状态企业的特征数据和企业状态数据训练得到。

    3、第二方面,本申请实施例提供一种企业状态数据的确定装置,包括:数据获取模块,用于获取待测企业的原始数据,原始数据包括通信关联数据;数据拓展模块,用于对待测企业的通信关联数据进行拓展处理,得到待测企业的拓展数据;特征生成模块,用于基于待测企业的原始数据和拓展数据,得到待测企业的特征数据;确定模块,用于利用预先训练的企业状态预测模型对待测企业的特征数据进行处理,输出待测企业的企业状态数据,待测企业的企业状态数据包括待测企业对应的预测成员数量,企业状态预测模型为最小绝对收缩与选择算子lasso模型,企业状态预测模型利用已知状态企业的特征数据和企业状态数据训练得到。

    4、第三方面,本申请实施例提供一种企业状态数据的确定设备,包括:处理器以及存储有计算机程序指令的存储器;处理器执行计算机程序指令时实现第一方面的企业状态数据的确定方法。

    5、第四方面,本申请实施例提供一种计算机可读存储介质,计算机可读存储介质上存储有计算机程序指令,计算机程序指令被处理器执行时实现第一方面的企业状态数据的确定方法。

    6、本申请实施例提供一种企业状态数据的确定方法、装置、设备、介质及程序产品,可对待测企业的原始数据中的通信关联数据进行拓展处理,得到待测企业的拓展数据,利用原始数据和拓展数据得到待测企业的特征数据。拓展数据基于获取周期相对更短且更真实的通信关联数据得到,基于原始数据和拓展数据得到的待测企业的特征数据能够更全面、更准确地体现待测企业的特征。将待测企业的特征数据输入预先利用已知状态企业的特征数据和企业状态数据训练得到的企业状态预测模型,得到企业状态预测模型输出的待测企业的企业状态数据。企业状态预测模型为lasso模型,在对特征数据处理的过程中能够剔除无效特征,从而提高输出的企业状态数据的准确性。



    技术特征:

    1.一种企业状态数据的确定方法,其特征在于,包括:

    2.根据权利要求1所述的方法,其特征在于,所述企业状态预测模型包括与企业分类类型对应的预测子模型,预测子模型利用企业分类类型对应的所述已知状态企业的特征数据训练得到;

    3.根据权利要求2所述的方法,其特征在于,所述企业状态预测模型还包括与至少两个预测子模型对应的混合预测子模型,混合预测子模型利用所述已知状态企业的特征数据输入混合预测子模型对应的预测子模型得到的结果数据训练得到;

    4.根据权利要求1所述的方法,其特征在于,所述对所述待测企业的通信关联数据进行拓展处理,得到所述待测企业的拓展数据,包括:

    5.根据权利要求4所述的方法,其特征在于,所述预设拓展条件包括以下一者或两者以上:

    6.根据权利要求1所述的方法,其特征在于,还包括:

    7.根据权利要求6所述的方法,其特征在于,所述企业状态预测模型包括与企业分类类型对应的预测子模型;

    8.根据权利要求7所述的方法,其特征在于,所述企业状态预测模型还包括与至少两个预测子模型对应的混合预测子模型;

    9.根据权利要求1至8中任意一项所述的方法,其特征在于,

    10.一种企业状态数据的确定装置,其特征在于,包括:

    11.一种企业状态数据的确定设备,其特征在于,包括:处理器以及存储有计算机程序指令的存储器;

    12.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有计算机程序指令,所述计算机程序指令被处理器执行时实现如权利要求1至9中任意一项所述的企业状态数据的确定方法。

    13.一种计算机程序产品,其特征在于,包括计算机程序,所述计算机程序被处理器执行时实现权利要求1至9中任意一项所述的企业状态数据的确定方法。


    技术总结
    本申请公开了一种企业状态数据的确定方法、装置、设备、介质及程序产品,属于大数据领域。该方法包括:获取待测企业的原始数据,原始数据包括通信关联数据;对待测企业的通信关联数据进行拓展处理,得到待测企业的拓展数据;基于待测企业的原始数据和拓展数据,得到待测企业的特征数据;利用预先训练的企业状态预测模型对待测企业的特征数据进行处理,输出待测企业的企业状态数据,待测企业的企业状态数据包括待测企业对应的预测成员数量,企业状态预测模型为最小绝对收缩与选择算子Lasso模型,企业状态预测模型利用已知状态企业的特征数据和企业状态数据训练得到。本申请实施例能够提高得到的企业状态数据的准确性。

    技术研发人员:钟全龙,颜涛,杨冰
    受保护的技术使用者:中国移动通信集团重庆有限公司
    技术研发日:
    技术公布日:2024/10/24
    转载请注明原文地址:https://symbian.8miu.com/read-24944.html

    最新回复(0)