本发明涉及地名数据库质检的,尤其是涉及一种多源地名数据库生产的质检方法、装置、电子设备和存储介质。
背景技术:
1、地名是一种重要的空间信息。地名信息是涉及国家政治、经济、外交等领域的重要信息资源,与经济建设、社会管理、科学研究和群众生活都有着密切关系。对于群众而言,准确的地名信息是群众生产生活必不可少的基础资源;对于政府而言,国家间、地区间的政治交往、文化交流、经济交易都离不开地名数据的支撑。
2、地名在大数据时代更加需要规范化、系统化的数字管理。全球地名数据资源建设,通过全球地名数据的搜集、译写、融合、更新,生产和加工全球重点国家和地区的多尺度地名数据,弥补多尺度地名数据资源匮乏的短板。
3、现阶段地名数据库虽然在逐步创建,但是针对地名数据的质检方式,目前多为人工质检,效率低下,问题遗漏较多,数据质量无法保证;并且人工质检一般是在每个阶段完成后或是在成果阶段之后进行,不能在生产过程中及时发现问题解决问题,致使错误问题堆积,在错误成果上生产错误数据,浪费生产成本,给后续的质检和修改问题带来了很大压力。
4、综合,如何提高质检的效率、准确性,缓解项目成果阶段生产和质检的压力,避免数据问题积压过多成为目前亟需解决的技术问题。
技术实现思路
1、有鉴于此,本发明的目的在于提供一种多源地名数据库生产的质检方法、装置、电子设备和存储介质,以缓解现有的人工质检方法效率低、准确性差、数据问题堆积的技术问题。
2、第一方面,本发明实施例提供了一种多源地名数据库生产的质检方法,包括:
3、获取多源地名数据库生产的当前阶段所生产的初始生产数据,采用当前阶段的实时检查规则对所述初始生产数据进行实时检查,其中,所述当前阶段为依次遍历下述所有阶段:预处理阶段、单源归一阶段、多源融合阶段和修复处理阶段;
4、若实时检查通过,则将实时检查通过的初始生产数据作为当前阶段中间数据保存至当前阶段中间数据库;
5、若实时检查不通过,则再次进行当前阶段的生产,并重新进行实时检查,直至无问题,进而将生产的正确的初始生产数据作为当前阶段中间数据保存至所述当前阶段中间数据库;
6、在所述当前阶段完成后,采用当前阶段的全量检查规则对所述当前阶段中间数据进行全量检查;
7、若全量检查通过,则将全量检查通过的当前阶段中间数据作为当前阶段成果数据保存至当前阶段成果数据库;
8、若全量检查不通过,则再次进行当前阶段的生产,并重新依次进行实时检查和全量检查,直至无问题,进而将生产的正确的当前阶段中间数据作为当前阶段成果数据保存至所述当前阶段成果数据库;
9、将所述当前阶段成果数据作为下一阶段生产时的初始数据,以对所述初始数据进行下一阶段的生产,得到下一阶段所生产的初始生产数据,直至遍历到所述修复处理阶段,将最终得到的修复处理成果数据库作为质检后的产品库。
10、进一步的,再次进行当前阶段的生产,并重新进行实时检查,直至无问题,进而将生产的正确的初始生产数据作为当前阶段中间数据保存至所述当前阶段中间数据库,包括:
11、将生成的实时检查的错误记录存储到实时检查结果中,且在所述实时检查的错误记录中“是否修改”字段赋值为未修改,并将对应的错误的初始生产数据进行人工确认修改;
12、若所述错误的初始生产数据经确认正确,则将对应的实时检查的错误记录中“是否修改”字段赋值为确认不修改,且将确认正确的初始生产数据作为当前阶段中间数据保存至所述当前阶段中间数据库;
13、若所述错误的初始生产数据经确认错误,则对所述错误的初始生产数据进行当前阶段的生产,并重新进行实时检查,直至无问题,进而将生产的正确的初始生产数据作为当前阶段中间数据保存至所述当前阶段中间数据库,且将对应的所述实时检查的错误记录中“是否修改”字段赋值为已修改。
14、进一步的,再次进行当前阶段的生产,并重新依次进行实时检查和全量检查,直至无问题,进而将生产的正确的当前阶段中间数据作为当前阶段成果数据保存至所述当前阶段成果数据库,包括:
15、将全量检查的错误记录与对应的实时检查结果中实时检查的错误记录进行对比;
16、若所述全量检查的错误记录在所述实时检查的错误记录中存在,且所述实时检查的错误记录中“是否修改”字段赋值不是确认不修改,则将所述全量检查的错误记录存储到全量检查结果中,且将所述全量检查的错误记录中“是否修改”字段赋值为确认修改;
17、若所述全量检查的错误记录在所述实时检查的错误记录中不存在,则将所述全量检查的错误记录存储到所述全量检查结果中,且将所述全量检查的错误记录中“是否修改”字段赋值为未修改;
18、对所述全量检查结果中“是否修改”字段赋值为确认修改和未修改的当前阶段中间数据进行人工确认修改;
19、若确认正确,则将对应的“是否修改”字段赋值为确认不修改,且将确认正确的当前阶段中间数据作为当前阶段成果数据保存至所述当前阶段成果数据库;
20、若确认错误,则对确认错误的当前阶段中间数据进行当前阶段的生产,并重新进行实时检查和全量检查,直至无问题,进而将生产的正确的当前阶段中间数据作为当前阶段成果数据保存至所述当前阶段成果数据库。
21、进一步的,所述实时检查规则和所述全量检查规则为根据对应阶段的处理制定的,所述实时检查规则和所述全量检查规则属性包括:检查规则号码、检查原则、检查输出、检查归属和检查阶段。
22、进一步的,若所述当前阶段为预处理阶段,所述初始生产数据为对原始数据库中的原始数据进行预处理得到的。
23、进一步的,所述实时检查的错误记录和所述全量检查的错误记录中包括:序号、检查规则号码、检查输出、错误数据坐标、“是否修改”字段、检查归属、检查阶段和备注,其中,所述“是否修改”字段包括:未修改、确认不修改、已修改和确认修改。
24、第二方面,本发明实施例还提供了一种多源地名数据库生产的质检装置,包括:
25、实时检查单元,用于获取多源地名数据库生产的当前阶段所生产的初始生产数据,采用当前阶段的实时检查规则对所述初始生产数据进行实时检查,其中,所述当前阶段为依次遍历下述所有阶段:预处理阶段、单源归一阶段、多源融合阶段和修复处理阶段;
26、第一设定单元,用于若实时检查通过,则将实时检查通过的初始生产数据作为当前阶段中间数据保存至当前阶段中间数据库;
27、再次生产和实时检查单元,用于若实时检查不通过,则再次进行当前阶段的生产,并重新进行实时检查,直至无问题,进而将生产的正确的初始生产数据作为当前阶段中间数据保存至所述当前阶段中间数据库;
28、全量检查单元,用于在所述当前阶段完成后,采用当前阶段的全量检查规则对所述当前阶段中间数据进行全量检查;
29、第二设定单元,用于若全量检查通过,则将全量检查通过的当前阶段中间数据作为当前阶段成果数据保存至当前阶段成果数据库;
30、再次生产和实时检查全量检查单元,用于若全量检查不通过,则再次进行当前阶段的生产,并重新依次进行实时检查和全量检查,直至无问题,进而将生产的正确的当前阶段中间数据作为当前阶段成果数据保存至所述当前阶段成果数据库;
31、生产单元,用于将所述当前阶段成果数据作为下一阶段生产时的初始数据,以对所述初始数据进行下一阶段的生产,得到下一阶段所生产的初始生产数据,直至遍历到所述修复处理阶段,将最终得到的修复处理成果数据库作为质检后的产品库。
32、进一步的,所述再次生产和实时检查单元还用于:
33、将生成的实时检查的错误记录存储到实时检查结果中,且在所述实时检查的错误记录中“是否修改”字段赋值为未修改,并将对应的错误的初始生产数据进行人工确认修改;
34、若所述错误的初始生产数据经确认正确,则将对应的实时检查的错误记录中“是否修改”字段赋值为确认不修改,且将确认正确的初始生产数据作为当前阶段中间数据保存至所述当前阶段中间数据库;
35、若所述错误的初始生产数据经确认错误,则对所述错误的初始生产数据进行当前阶段的生产,并重新进行实时检查,直至无问题,进而将生产的正确的初始生产数据作为当前阶段中间数据保存至所述当前阶段中间数据库,且将对应的所述实时检查的错误记录中“是否修改”字段赋值为已修改。
36、第三方面,本发明实施例还提供了一种电子设备,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述第一方面任一项所述的方法的步骤。
37、第四方面,本发明实施例还提供了一种计算机可读存储介质,所述计算机可读存储介质存储有机器可运行指令,所述机器可运行指令在被处理器调用和运行时,所述机器可运行指令促使所述处理器运行上述第一方面任一项所述的方法。
38、在本发明实施例中,提供了一种多源地名数据库生产的质检方法,包括:获取多源地名数据库生产的当前阶段所生产的初始生产数据,采用当前阶段的实时检查规则对初始生产数据进行实时检查,其中,当前阶段为依次遍历下述所有阶段:预处理阶段、单源归一阶段、多源融合阶段和修复处理阶段;若实时检查通过,则将实时检查通过的初始生产数据作为当前阶段中间数据保存至当前阶段中间数据库;若实时检查不通过,则再次进行当前阶段的生产,并重新进行实时检查,直至无问题,进而将生产的正确的初始生产数据作为当前阶段中间数据保存至当前阶段中间数据库;在当前阶段完成后,采用当前阶段的全量检查规则对当前阶段中间数据进行全量检查;若全量检查通过,则将全量检查通过的当前阶段中间数据作为当前阶段成果数据保存至当前阶段成果数据库;若全量检查不通过,则再次进行当前阶段的生产,并重新依次进行实时检查和全量检查,直至无问题,进而将生产的正确的当前阶段中间数据作为当前阶段成果数据保存至当前阶段成果数据库;将当前阶段成果数据作为下一阶段生产时的初始数据,以对初始数据进行下一阶段的生产,得到下一阶段所生产的初始生产数据,直至遍历到修复处理阶段,将最终得到的修复处理成果数据库作为质检后的产品库。通过上述描述可知,本发明的多源地名数据库生产的质检方法中,采用检查规则进行自动检查,可批量发现数据问题,提高海量地名数据质检效率和质检准确率,并且采用了分阶段的实时检查和全量检查,加快了发现数据问题的速度,缓解了项目成果阶段生产和质检压力,避免了数据问题积压过多,提高了数据处理速度,缓解了现有的人工质检方法效率低、准确性差、数据问题堆积的技术问题。
1.一种多源地名数据库生产的质检方法,其特征在于,包括:
2.根据权利要求1所述的方法,其特征在于,再次进行当前阶段的生产,并重新进行实时检查,直至无问题,进而将生产的正确的初始生产数据作为当前阶段中间数据保存至所述当前阶段中间数据库,包括:
3.根据权利要求2所述的方法,其特征在于,再次进行当前阶段的生产,并重新依次进行实时检查和全量检查,直至无问题,进而将生产的正确的当前阶段中间数据作为当前阶段成果数据保存至所述当前阶段成果数据库,包括:
4.根据权利要求1所述的方法,其特征在于,所述实时检查规则和所述全量检查规则为根据对应阶段的处理制定的,所述实时检查规则和所述全量检查规则属性包括:检查规则号码、检查原则、检查输出、检查归属和检查阶段。
5.根据权利要求1所述的方法,其特征在于,若所述当前阶段为预处理阶段,所述初始生产数据为对原始数据库中的原始数据进行预处理得到的。
6.根据权利要求3所述的方法,其特征在于,所述实时检查的错误记录和所述全量检查的错误记录中包括:序号、检查规则号码、检查输出、错误数据坐标、“是否修改”字段、检查归属、检查阶段和备注,其中,所述“是否修改”字段包括:未修改、确认不修改、已修改和确认修改。
7.一种多源地名数据库生产的质检装置,其特征在于,包括:
8.根据权利要求7所述的装置,其特征在于,所述再次生产和实时检查单元还用于:
9.一种电子设备,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现上述权利要求1至6中任一项所述的方法的步骤。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有机器可运行指令,所述机器可运行指令在被处理器调用和运行时,所述机器可运行指令促使所述处理器运行上述权利要求1至6中任一项所述的方法。
