本发明涉及自动归档,特别是涉及一种基于chromium的网页转pdf自动归档方法。
背景技术:
1、公司数字档案系统建设完成后,需要归档oa系统上大量的表单和流程记录,并且每月公司在oa系统上又会产生大量的新的单据和流程审批记录,这就需要管理员一个一个的在网页中将其打印成pdf,并且还要针对不同的单据配置打印模版,最后还要将pdf上传到数字档案系统,上述动作都需要人工去完成,导致耗费大量的人力和时间,且归档的效率以及准确性较低。
技术实现思路
1、针对上述技术问题,本发明采用的技术方案为:
2、根据本申请的第一方面,提供了一种基于chromium的网页转pdf自动归档方法,所述方法包括以下步骤:
3、s100,每到达预设时间点,获取预设历史时间段内上传的每一待归档文件的唯一标识,以得到待归档文件唯一标识列表a=(a1,a2,…,ai,…,an),i=1,2,…,n;其中,ai为历史时间段内上传的第i个待归档文件对应的唯一标识,n为历史时间段内上传的待归档文件的数量;
4、s200,根据a,生成a中每一唯一标识对应的网页链接,以得到网页链接列表la=(la1,la2,…,lai,…,lan);其中,lai为ai对应的待归档文件的网页链接;
5、s300,根据a,确定每一待归档文件对应的pdf模版,以得到a对应的pdf模版列表pa=(pa1,pa2,…,pai,…,pan);其中,pai为ai对应的pdf模版;
6、s400,使用预设的chromium命令访问la中的每一网页链接,将la中的每一网页链接对应的待归档文件转换为对应的待归档pdf文件,以得到a对应的待归档pdf文件列表da=(da1,da2,…,dai,…,dan);其中,dai为ai对应的待归档pdf文件;dai根据pai转换得到;
7、s500,根据da,建立每一待归档pdf文件对应的下载链接,以得到待归档pdf文件下载链接列表ha=(ha1,ha2,…,hai,…,han);其中,hai为dai对应的下载链接;
8、s600,将ha和a发送至预设的数字档案系统,使得数字档案系统根据ha和a对所有的待归档文件进行分类归档。
9、进一步的,步骤s300包括以下步骤:
10、s310,获取a中每一唯一标识对应的指定字符串,以得到a对应的指定字符串列表za=(za1,za2,…,zai,…,zan);其中,zai为ai对应的指定字符串;唯一标识对应的指定字符串为唯一标识的前m位字符串;
11、s320,遍历za,若zai与预设的pdf模版表中的任一pdf模版名称相同,则将与zai相同的pdf模版名称对应的pdf模版确定为pai。
12、进一步的,dai通过以下步骤得到:
13、s410,获取lai中待归档文件中每一预设的标签对应的信息,以得到lai对应的标签信息组列表qi=(qi1,qi2,…,qij,…,qif(i)),j=1,2,…,f(i);其中,qij为lai对应的第j个标签信息组,f(i)为lai对应的标签信息组的数量;qij=(qij,1,qij,2);qij,1为lai对应的第j个标签信息组中的标签,qij,2为lai对应的第j个标签信息组中标签对应的信息;
14、s420,遍历qi,若qij,1与pai中的任一标签形同,则将qij,2填入pai中与qij,1相同的标签对应的信息框中,以得到dai。
15、进一步的,步骤s600包括以下步骤:
16、s610,数字档案系统接收到ha和a之后,通过ha下载每一待归档pdf文件,以得到待归档pdf文件列表da=(da1,da2,…,dai,…,dan);
17、s620,根据a,获取每一待归档pdf文件对应的分类信息,以得到分类信息列表fa=(fa1,fa2,…,fai,…,fan);其中,fai为dai对应的分类信息;fai=(fai,1,fai,2);fai,1为dai对应的文件类型,fai,2为dai对应的分类标识;
18、s630,将fa中文件类型和分类标识均相同的分类信息对应的待归档pdf文件归为一类。
19、进一步的,待归档文件包括预设类型的单据和流程记录。
20、本发明的基于chromium的网页转pdf自动归档方法,每到达预设时间点,获取预设历史时间段内上传的每一待归档文件的唯一标识,以得到待归档文件唯一标识列表a;根据a,生成a中每一唯一标识对应的网页链接,以得到网页链接列表la;根据a,确定每一待归档文件对应的pdf模版,以得到a对应的pdf模版列表pa;使用预设的chromium命令访问la中的每一网页链接,将la中的每一网页链接对应的待归档文件转换为对应的待归档pdf文件,以得到a对应的待归档pdf文件列表da;根据da,建立每一待归档pdf文件对应的下载链接,以得到待归档pdf文件下载链接列表ha;将ha和a发送至预设的数字档案系统,使得数字档案系统根据ha和a对所有的待归档文件进行分类归档;通过本发明的方法,无需再配置打印模版,系统自动将不同待归档文件的网页自动转为pdf文件,且无需手动归档pdf文件,自动进行系统间的数据传输和匹配归档,从减小人力和时间的消耗,提高归档的效率以及准确性。
1.一种基于chromium的网页转pdf自动归档方法,其特征在于,所述方法包括以下步骤:
2.根据权利要求1所述的基于chromium的网页转pdf自动归档方法,其特征在于,步骤s300包括以下步骤:
3.根据权利要求1所述的基于chromium的网页转pdf自动归档方法,其特征在于,dai通过以下步骤得到:
4.根据权利要求1所述的基于chromium的网页转pdf自动归档方法,其特征在于,步骤s600包括以下步骤:
5.根据权利要求1所述的基于chromium的网页转pdf自动归档方法,其特征在于,待归档文件包括预设类型的单据和流程记录。