一种基于chromium的网页转PDF自动归档方法与流程

    技术2025-02-06  44


    本发明涉及自动归档,特别是涉及一种基于chromium的网页转pdf自动归档方法。


    背景技术:

    1、公司数字档案系统建设完成后,需要归档oa系统上大量的表单和流程记录,并且每月公司在oa系统上又会产生大量的新的单据和流程审批记录,这就需要管理员一个一个的在网页中将其打印成pdf,并且还要针对不同的单据配置打印模版,最后还要将pdf上传到数字档案系统,上述动作都需要人工去完成,导致耗费大量的人力和时间,且归档的效率以及准确性较低。


    技术实现思路

    1、针对上述技术问题,本发明采用的技术方案为:

    2、根据本申请的第一方面,提供了一种基于chromium的网页转pdf自动归档方法,所述方法包括以下步骤:

    3、s100,每到达预设时间点,获取预设历史时间段内上传的每一待归档文件的唯一标识,以得到待归档文件唯一标识列表a=(a1,a2,…,ai,…,an),i=1,2,…,n;其中,ai为历史时间段内上传的第i个待归档文件对应的唯一标识,n为历史时间段内上传的待归档文件的数量;

    4、s200,根据a,生成a中每一唯一标识对应的网页链接,以得到网页链接列表la=(la1,la2,…,lai,…,lan);其中,lai为ai对应的待归档文件的网页链接;

    5、s300,根据a,确定每一待归档文件对应的pdf模版,以得到a对应的pdf模版列表pa=(pa1,pa2,…,pai,…,pan);其中,pai为ai对应的pdf模版;

    6、s400,使用预设的chromium命令访问la中的每一网页链接,将la中的每一网页链接对应的待归档文件转换为对应的待归档pdf文件,以得到a对应的待归档pdf文件列表da=(da1,da2,…,dai,…,dan);其中,dai为ai对应的待归档pdf文件;dai根据pai转换得到;

    7、s500,根据da,建立每一待归档pdf文件对应的下载链接,以得到待归档pdf文件下载链接列表ha=(ha1,ha2,…,hai,…,han);其中,hai为dai对应的下载链接;

    8、s600,将ha和a发送至预设的数字档案系统,使得数字档案系统根据ha和a对所有的待归档文件进行分类归档。

    9、进一步的,步骤s300包括以下步骤:

    10、s310,获取a中每一唯一标识对应的指定字符串,以得到a对应的指定字符串列表za=(za1,za2,…,zai,…,zan);其中,zai为ai对应的指定字符串;唯一标识对应的指定字符串为唯一标识的前m位字符串;

    11、s320,遍历za,若zai与预设的pdf模版表中的任一pdf模版名称相同,则将与zai相同的pdf模版名称对应的pdf模版确定为pai。

    12、进一步的,dai通过以下步骤得到:

    13、s410,获取lai中待归档文件中每一预设的标签对应的信息,以得到lai对应的标签信息组列表qi=(qi1,qi2,…,qij,…,qif(i)),j=1,2,…,f(i);其中,qij为lai对应的第j个标签信息组,f(i)为lai对应的标签信息组的数量;qij=(qij,1,qij,2);qij,1为lai对应的第j个标签信息组中的标签,qij,2为lai对应的第j个标签信息组中标签对应的信息;

    14、s420,遍历qi,若qij,1与pai中的任一标签形同,则将qij,2填入pai中与qij,1相同的标签对应的信息框中,以得到dai。

    15、进一步的,步骤s600包括以下步骤:

    16、s610,数字档案系统接收到ha和a之后,通过ha下载每一待归档pdf文件,以得到待归档pdf文件列表da=(da1,da2,…,dai,…,dan);

    17、s620,根据a,获取每一待归档pdf文件对应的分类信息,以得到分类信息列表fa=(fa1,fa2,…,fai,…,fan);其中,fai为dai对应的分类信息;fai=(fai,1,fai,2);fai,1为dai对应的文件类型,fai,2为dai对应的分类标识;

    18、s630,将fa中文件类型和分类标识均相同的分类信息对应的待归档pdf文件归为一类。

    19、进一步的,待归档文件包括预设类型的单据和流程记录。

    20、本发明的基于chromium的网页转pdf自动归档方法,每到达预设时间点,获取预设历史时间段内上传的每一待归档文件的唯一标识,以得到待归档文件唯一标识列表a;根据a,生成a中每一唯一标识对应的网页链接,以得到网页链接列表la;根据a,确定每一待归档文件对应的pdf模版,以得到a对应的pdf模版列表pa;使用预设的chromium命令访问la中的每一网页链接,将la中的每一网页链接对应的待归档文件转换为对应的待归档pdf文件,以得到a对应的待归档pdf文件列表da;根据da,建立每一待归档pdf文件对应的下载链接,以得到待归档pdf文件下载链接列表ha;将ha和a发送至预设的数字档案系统,使得数字档案系统根据ha和a对所有的待归档文件进行分类归档;通过本发明的方法,无需再配置打印模版,系统自动将不同待归档文件的网页自动转为pdf文件,且无需手动归档pdf文件,自动进行系统间的数据传输和匹配归档,从减小人力和时间的消耗,提高归档的效率以及准确性。



    技术特征:

    1.一种基于chromium的网页转pdf自动归档方法,其特征在于,所述方法包括以下步骤:

    2.根据权利要求1所述的基于chromium的网页转pdf自动归档方法,其特征在于,步骤s300包括以下步骤:

    3.根据权利要求1所述的基于chromium的网页转pdf自动归档方法,其特征在于,dai通过以下步骤得到:

    4.根据权利要求1所述的基于chromium的网页转pdf自动归档方法,其特征在于,步骤s600包括以下步骤:

    5.根据权利要求1所述的基于chromium的网页转pdf自动归档方法,其特征在于,待归档文件包括预设类型的单据和流程记录。


    技术总结
    本发明提供了一种基于chromium的网页转PDF自动归档方法,涉及自动归档技术领域,所述方法包括:获取预设历史时间段内上传的每一待归档文件的唯一标识,以得到待归档文件唯一标识列表A;得到网页链接列表LA;确定每一待归档文件对应的PDF模版,以得到A对应的PDF模版列表PA;将LA中的每一网页链接对应的待归档文件转换为对应的待归档PDF文件,以得到A对应的待归档PDF文件列表DA;建立每一待归档PDF文件对应的下载链接,以得到待归档PDF文件下载链接列表HA;将HA和A发送至预设的数字档案系统,行分类归档;本发明能够减小人力和时间的消耗,提高归档的效率以及准确性。

    技术研发人员:郝赛赛,李晓培,程征,王英豪
    受保护的技术使用者:河南中原消费金融股份有限公司
    技术研发日:
    技术公布日:2024/10/24
    转载请注明原文地址:https://symbian.8miu.com/read-26006.html

    最新回复(0)