一种应用于政务数据标准自动化监管系统及方法与流程

    技术2025-02-16  52


    本发明涉及数据监管,具体为一种应用于政务数据标准自动化监管系统及方法。


    背景技术:

    1、我国政务数据基础设施已基本建成,要素壁垒逐步打通,共享开放程度不断加深。标准化的数据能够促进不同政府部门之间的数据共享和业务协同。政务数据标准化是数字政府建设的基础性工程,有助于加强数据治理。通过政务数据标准化,可以优化营商环境,提高市场监管效率。政务数据标准化是推动数字政府建设的关键步骤,有助于实现政府服务的数字化转型。标准化的数据能够被更高效地利用,支持数据分析和决策制定。

    2、尽管数据标准化至关重要,但在现有技术中,政务数据标准自动化平台,通过将政务数据自动化转化为标准的政务数据,但是随着时间变化,政务数据的标准发生了变化,有些不合格的政务数据被判断为合格的政务数据,对于出现这种误判的情况,需要对政务数据标准自动化平台进行更新,但是有的误判是特殊情况,不能每出现一次就进行更新,因此需要一种应用于政务数据标准自动化监管系统及方法,对政务工作人员审核转化后标准的政务数据,所用的时间进行监管,到达一定程度时,对政务数据标准自动化平台进行更新,避免政务工作人员审核大量类似的不合格的政务数据,造成合格的政务数据不能得到有效审核。


    技术实现思路

    1、本发明的目的在于提供一种应用于政务数据标准自动化监管系统及方法,以解决上述背景技术中提出的问题。

    2、为了解决上述技术问题,本发明提供如下技术方案:一种应用于政务数据标准自动化监管方法,方法包括:

    3、步骤s100:对经过标准自动化平台处理后的政务数据进行审核,采集审核结果为不合格的政务数据,将所述政务数据进行文本分类,得到若干个内容特征的词条,对各个词条所花费的平均时间和不合格政务数据的数量进行采集;

    4、步骤s200:通过计算得到各个词条的影响力,对各个词条的影响力进行计算,得到各个词条影响力等级的取值范围;

    5、步骤s300:将各个词条的影响力按照等级进行划分,通过计算得到各个词条影响力等级所花费的审核时间,对取值范围的权值进行遍历,分析得到各个词条标准影响力等级取值范围阈值,计算得到优先更新等级;

    6、步骤s400:通过对政务工作人员审核政务数据所花费的时间进行监管,分析得到当标准自动化平台需要更新时,对标准自动化平台的标准数据管理库进行更新。

    7、进一步的步骤s100包括:

    8、步骤s101:将经过标准自动化平台处理后的政务数据,通过政务工作人员进行审核,对审核结果为不合格的政务数据进行采集,得到各个不合格的政务数据,对政务工作人员审核不合格的政务数据所花费的时间进行采集,得到各个不合格的政务数据审核所花的时间;

    9、步骤s102:将不合格的政务数据进行文本分类,得到若干个内容特征的词条,对符合第i个词条的不合格政务数据进行汇总,得到第i个词条的不合格政务数据集合,采集第i个词条中的不合格政务数据的数量为xi;

    10、步骤s103:对第i个词条中不合格的政务数据审核所花的时间进行计算,得到第i个词条审核所花费的平均时间为ti。

    11、上述步骤相当于对采集得到的不合格的政务数据,通过使用自然语言处理,进行分析提取出若干个内容特征的词条,将类似满足词条标准的不合格的政务数据进行集合,得到各个词条集合,标准自动化平台是对业务部门之间、业务和技术之间、统计指标之间的政务数据进行采集,通过统一认识与口径,将政务数据进行标准化处理,使政务工作人员在进行审核过程中,清楚明确很多政务数据含义。

    12、进一步的步骤s200包括:

    13、步骤s201:调取第i个词条审核所花费的平均时间和不合格政务数据的数量,通过对第i个词条审核所花费的平均时间和不合格政务数据的数量进行计算,得到第i个词条的影响力yi,根据公式:yi=(a×ti)×(b×xi),其中a和b分别表示为词条审核所花费平均时间的权值和不合格政务数据数量的权值,对每个词条的影响力进行汇总,得到所有词条影响力的集合;

    14、步骤s202:对所有词条影响力的集合进行计算,得到所有词条影响力的平均值为p和标准差为b,所有词条影响力的集合中,对影响力最大值为ymax和影响力最小值为ymin进行采集,通过计算得到影响力划分为r个等级,根据公式:

    15、步骤s203:通过计算得到第r个词条影响力等级的取值范围,根据公式:qr=p+cr×b,其中qr表示为第r个词条影响力等级的取值范围阈值,cr表示为第r个词条影响力等级的取值范围阈值的权值,第1、2、...、r+1个词条影响力等级的取值范围为[ymin,q1)、[q1,q2)、...、[qr-1,qr)、[qr,ymax],其中q1、q2、...、qr-1表示为第1、2、...、r-1个词条影响力等级的取值范围阈值。

    16、上述步骤相当于对词条审核所花费的平均时间和不合格政务数据的数量的加入权值进行计算,得到每个词条的影响力,通过使用数据处理程序,计算得到每个词条的平均值p和标准差b。

    17、进一步的步骤s300包括:

    18、步骤s301:调取各个词条影响力等级的取值范围,将所有词条影响力的集合按照各个词条影响力等级的取值范围进行划分,在第r个词条影响力等级中,对每个影响力所对应审核所花费的平均时间和不合格政务数据的数量进行采集,计算得到第r个词条影响力等级所花费的审核时间tr;

    19、步骤s302:将cr的取值进行遍历,对第u次遍历每个词条影响力等级所花费的审核时间进行采集,得到第u次遍历每个词条影响力等级所花费的审核时间的集合,计算得出第u次遍历每个词条影响力等级所花费审核时间集合的标准差为ju,将每次遍历后的ju进行排序,最大值所对应的c’r为标准权值,将c’r输入到公式中得到标准取值范围阈值,根据公式:q'r=p+c'r×b,其中q’r表示为第r个词条标准影响力等级的取值范围阈值,第1、2、...、r+1个词条标准影响力等级的取值范围为[ymin,q’1)、[q’1,q’2)、...、[q’r-1,q’r)、[q’r,ymax],其中q’1、q’2、...、q’r-1表示为第1、2、...、r-1个词条标准影响力等级的取值范围阈值;

    20、步骤s303:将所用词条影响力的集合,按照标准取值范围进划分,计算每个词条标准影响力等级所花费的审核时间,将每个词条标准影响力等级所花费的审核时间进行排序,花费的审核时间最长的词条标准影响力等级为优先更新等级。

    21、上述步骤相当于,对每个影响力等级中,每个影响力所对应审核所花费的平均时间和不合格政务数据的数量进行采集,将审核所花费的平均时间和不合格政务数据的数量进行相乘,得到每个影响力所花费的审核时间,将每个影响力所花费的审核时间进行相加,得到每个影响力等级所花费的审核时间;

    22、对每次遍历后每个影响力所等级花费的审核时间进行集合,通过数据处理程序得到每次遍历后所花费审核时间集合的标准差。

    23、进一步的步骤s400包括:

    24、步骤s401:对政务工作人员审核政务数据所花的时间进行监管,采集一天内审核结果为合格的政务数据所花费的时间为z1,采集一天内审核结果为不合格的政务数据所花费的时间为z2,当z1<z2时,则需要对政务数据标准自动化平台进行更新;

    25、步骤s402:将优先更新等级中的所有词条,更新到政务数据标准自动化平台中的标准数据管理库中。

    26、上述步骤相当于对政务工作人员审核花费时间进行采集,分析判断政务数据标准自动化平台是否需要更新。

    27、为了更好实现上述方法还提出了一种应用于政务数据标准自动化监管系统,系统包括标准数据审核模块、分析词条模块、优化等级模块和标准数据管理模块;

    28、标准数据审核模块:对经过标准自动化平台处理后的政务数据进行审核,采集审核结果为不合格的政务数据,将所述政务数据进行文本分类,得到若干个内容特征的词条,对各个词条所花费的平均时间和不合格政务数据的数量进行采集;

    29、分析词条模块:通过计算得到各个词条的影响力,对各个词条的影响力进行计算,得到各个词条影响力等级的取值范围;

    30、优化等级模块:将各个词条的影响力按照等级进行划分,通过计算得到各个词条影响力等级所花费的审核时间,对取值范围的权值进行遍历,分析得到各个词条标准影响力等级取值范围阈值,计算得到优先更新等级;

    31、标准数据管理模块:通过对政务工作人员审核政务数据所花费的时间进行监管,分析得到当标准自动化平台需要更新时,对标准自动化平台的标准数据管理库进行更新。

    32、进一步的标准数据审核模块包括采集不合格数据单元和文本分析单元;

    33、采集不合格数据单元:对经过标准自动化平台处理后的政务数据,通过政务工作人员进行审核,对审核结果为不合格的政务数据进行采集,并对政务工作人员审核不合格的政务数据所花的时间进行采集;

    34、文本分析单元:对采集得到的不合格的政务数据进行文本分类,得到若干个词条,对每个词条符合的政务数据进行集合,并记录每个词条中不合格政务数据的数量和审核所花费的平均时间。

    35、进一步的分析词条模块包括计算影响力单元和计算取值范围单元;

    36、计算影响力单元:对每个词条审核所花费的平均时间和不合格政务数据的数量进行计算,得到每个词条的影响力;

    37、计算取值范围单元:对所有词条进行计算,通过计算得到影响力总共划分等级的个数,通过计算得到每个词条影响力等级所对应的取值范围。

    38、进一步的优化等级模块包括优化取值范围单元和计算优化更新等级单元;

    39、优化取值范围单元:将所有影响力按照等级范围进行划分,通过计算得到每个词条影响力等级所花费的审核时间,根据所述审核时间进行计算,得到各个词条标准影响力等级的取值范围;

    40、计算优化更新等级单元:将所有影响力按照标准等级范围进行划分,通过计算得到花费的审核时间最长的词条标准影响力等级为优先更新等级。

    41、进一步的标准数据管理模块包括审核时长监管单元和标准数据变更单元;

    42、审核时长监管单元:对政务工作人员审核政务数据所花的时间进行监管,对审核结果为合格的政务数据所花费的时间和结果为不合格的政务数据所花费的时间进行采集分析;

    43、标准数据变更单元:当政务数据标准自动化平台达到需要更新时,对优先更新等级中的所有词条,更新到标准数据管理库中。

    44、与现有技术相比,本发明所达到的有益效果是:本发明通过采集审核结果为不合格的政务数据,进行文本分类,对各个词条所花费的平均时间和不合格政务数据的数量进行采集;计算各个词条的影响力,将各个词条的影响力进行计算,得到各个词条影响力等级的取值范围;将影响力按照等级进行划分,对取值范围的权值进行遍历,分析得到各个词条标准影响力等级取值范围阈值,计算得到优先更新等级;对政务工作人员审核政务数据所花的时间进行监管,当标准自动化平台需要更新时,对标准自动化平台的标准数据管理库进行更新。避免政务工作人员审核大量类似的不合格的政务数据。


    技术特征:

    1.一种应用于政务数据标准自动化监管方法,其特征在于,方法包括:

    2.根据权利要求1所述的一种应用于政务数据标准自动化监管方法,其特征在于,步骤s100,包括以下步骤:

    3.根据权利要求2所述的一种应用于政务数据标准自动化监管方法,其特征在于,步骤s200,包括以下步骤:

    4.根据权利要求3所述的一种应用于政务数据标准自动化监管方法,其特征在于,步骤s300,包括以下步骤:

    5.根据权利要求4所述的一种应用于政务数据标准自动化监管方法,其特征在于,步骤s400,包括以下步骤:

    6.一种应用于政务数据标准自动化监管系统,用于实现权利要求1-5中任一项所述一种应用于政务数据标准自动化监管方法,其特征在于,系统包括标准数据审核模块、分析词条模块、优化等级模块和标准数据管理模块;

    7.根据权利要求6所述的一种应用于政务数据标准自动化监管系统,其特征在于,所述标准数据审核模块包括采集不合格数据单元和文本分析单元;

    8.根据权利要求6所述的一种应用于政务数据标准自动化监管系统,其特征在于,所述分析词条模块包括计算影响力单元和计算取值范围单元;

    9.根据权利要求6所述的一种应用于政务数据标准自动化监管系统,其特征在于,所述优化等级模块包括优化取值范围单元和计算优化更新等级单元;

    10.根据权利要求6所述的一种应用于政务数据标准自动化监管系统,其特征在于,所述标准数据管理模块包括审核时长监管单元和标准数据变更单元;


    技术总结
    本发明公开了一种应用于政务数据标准自动化监管系统及方法,属于数据监管技术领域。本发明通过采集审核结果为不合格的政务数据,进行文本分类,对各个词条所花费的平均时间和不合格政务数据的数量进行采集;计算各个词条的影响力,将各个词条的影响力进行计算,得到各个词条影响力等级的取值范围;将影响力按照等级进行划分,对取值范围的权值进行遍历,分析得到各个词条标准影响力等级取值范围阈值,计算得到优先更新等级;对政务工作人员审核政务数据所花的时间进行监管,当标准自动化平台需要更新时,对标准自动化平台的标准数据管理库进行更新。避免政务工作人员审核大量类似的不合格的政务数据。

    技术研发人员:张向飞,王栋梁,王轶,方海宾,焦宇翔
    受保护的技术使用者:上海市大数据中心
    技术研发日:
    技术公布日:2024/10/24
    转载请注明原文地址:https://symbian.8miu.com/read-26611.html

    最新回复(0)