地质文献资源空间化处理方法及基于GIS的文献空间搜索系统与流程

    技术2026-01-02  15


    本发明涉及文献搜索及地理信息系统,尤其涉及文献资源空间化处理方法及文献空间搜索系统。


    背景技术:

    1、传统的文献信息获取方法是“以文搜文”,即输入文本搜索词,得到的是文本结果列表。这种文献信息搜索方式对具有很强地理信息特征的地质文献而言是不足的,地质研究人员习惯通过研究位置或区域入手,了解该区域已有研究文献情况,但因搜索结果中缺乏文献空间位置等地理信息,无法为其提供地图区域导航查询、文献搜索结果地图分布、文献结果条目在地图上定位等服务,影响了地质研究人员的文献信息获取效率和使用体验。

    2、地理信息系统(gis,geographic information system)是用于输入、存储、查询、分析和显示地理数据的计算机系统。gis本质上就是把地图的视觉化显示效果及地理分析功能,与查询分析等数据库操作集成在到一起。如何改进文献搜索技术以实现获取文献空间资源地理信息,如何充分应用gis的空间信息交互能力,实现文献空间资源地理信息基于gis可查询、分析和显示,这是需要解决的技术难题。


    技术实现思路

    1、本发明聚焦建立文本类地质文献数据与空间地理信息之间的关联关系,提出一种地质文献空间化处理方法和基于gis的文献空间搜索系统,可以较好解决地质文献与地图关联问题,实现研究领域搜索结果文献呈现在地图上的“以文搜图”服务方式。

    2、为了解决上述技术问题,本发明所采用的一个技术方案是:一种地质文献资源空间化处理方法(基于已有地名词数据集的文本匹配方法),其包括如下步骤:

    3、步骤1:建立待匹配文献记录的倒排索引t;

    4、步骤2:准备地名词集合g;

    5、步骤3:遍历准备地名词集合g,根据地名词集合g中每一条记录的地名字段在待匹配文献记录的倒排索引t中搜索,将匹配结果写入至倒排索引t对应的匹配结果字段中形成文献空间化结果集;

    6、所述步骤1中对文献记录的标题、关键词和摘要进行预分词,记录分词后的单词与文献记录的对应关系,以形成待匹配文献记录的倒排索引t;

    7、所述地名词集合g是一个数据表,包括地名词编码、地名词规范名、缩称、曾用名、地理坐标范围。

    8、作为进一步的技术方案,步骤3包括以下步骤:

    9、步骤31,在地名词集合g中取一条记录的地名词规范名g1,判断是否存在该地名词规范名对应的缩称g2或曾用名g3,若存在则分别取缩称g2或曾用名g3作为地名词名称;

    10、步骤32,根据地名词名称通过精确匹配方式到待匹配文献记录的倒排索引t中进行查找;若匹配到,则在倒排索引t中该条文献记录的匹配结果索引字段中分别记录该地名词名称、地名词编码、匹配的字段及其匹配位置(如“标题0”,表示在标题字段的第一个字符开始匹配到);若匹配不到,则跳转至步骤31,在地名词集合g中取下一条记录的地名词规范名g1进行匹配。

    11、作为进一步的技术方案,步骤31中,在地名词集合g中取一条记录的地名词规范名g1,判断是否存在该地名词规范名对应的缩称g2或曾用名g3,若不存在则取地名词规范名g1作为地名词名称。

    12、作为进一步的技术方案,步骤2包括以下步骤:

    13、步骤21:调用第三方地名词自动识别模型m,通过模型m分别对倒排索引t中的标题、关键词和摘要进行自动化识别,识别出地名词及其地名分类;

    14、步骤22:根据地名词及其地名分类生成地名词集合g。

    15、为了解决上述技术问题,本发明所采用的再一个技术方案是:一种基于gis的文献空间搜索系统,其包括:文献信息搜索模块、地图呈现与交互模块;

    16、所述文献信息搜索模块,用于获取用户输入的搜索词,在文献空间化结果集中进行查找匹配,得到文献搜索结果列表;

    17、所述地图呈现与交互模块,用于根据文献搜索结果列表在地名空间单元图层上显示文献资源信息;

    18、所述文献空间化结果集为使用上述任一种地质文献资源空间化处理方法得到的。

    19、作为进一步的技术方案,所述的一种基于gis的文献空间搜索系统还包括:文献列表呈现模块,用于以列表形式显示文献搜索结果列表。

    20、作为进一步的技术方案,所述的一种基于gis的文献空间搜索系统还包括:文献信息筛选模块,用于获取用户输入的筛选词,对文献搜索结果列表进行筛选。

    21、作为进一步的技术方案,所述地图呈现与交互模块还用于实现文献资源信息随地图空间范围联动。

    22、本发明具有以下有益效果:

    23、本发明的方法和系统提供了全新的文献信息获取方式,能实现以文搜图,输入文本搜索词,搜索后得到的是地图呈现结果,极大地提高了地质文献信息获取效率。



    技术特征:

    1.一种地质文献资源空间化处理方法,其特征在于,其包括如下步骤:

    2.如权利要求1所述的一种地质文献资源空间化处理方法,其特征在于,

    3.如权利要求2所述的一种地质文献资源空间化处理方法,其特征在于,

    4.如权利要求1、2或3所述的一种地质文献资源空间化处理方法,其特征在于,步骤2包括如下步骤:

    5.一种基于gis的文献空间搜索系统,其特征在于,其包括:文献信息搜索模块、地图呈现与交互模块;

    6.如权利要求5所述的一种基于gis的文献空间搜索系统,其特征在于,其还包括:文献列表呈现模块,用于以列表形式显示文献搜索结果列表。

    7.如权利要求5或6所述的一种基于gis的文献空间搜索系统,其特征在于,其还包括:文献信息筛选模块,用于获取用户输入的筛选词,对文献搜索结果列表进行筛选。

    8.如权利要求5所述的一种基于gis的文献空间搜索系统,其特征在于,所述地图呈现与交互模块还用于实现文献资源信息随地图空间范围联动。


    技术总结
    本发明涉及文献搜索及地理信息系统技术领域,具体公开了地质文献资源空间化处理方法及基于GIS的文献空间搜索系统。其中,一种地质文献资源空间化处理方法包括:步骤1:建立待匹配文献记录的倒排索引T;步骤2:准备地名词集合G;步骤3:遍历准备地名词集合G,根据地名词集合G中每一条记录的地名字段在待匹配文献记录的倒排索引T中搜索,将匹配结果写入至倒排索引T对应的匹配结果字段中形成文献空间化结果集。本发明的方法和系统提供了全新的文献信息获取方式,能实现以文搜图,输入文本搜索词,搜索后得到的是地图呈现结果,极大地提高了地质文献信息获取效率。

    技术研发人员:周峰,柴新夏,张静
    受保护的技术使用者:中国地质图书馆(中国地质调查局地学文献中心)
    技术研发日:
    技术公布日:2024/10/24
    转载请注明原文地址:https://symbian.8miu.com/read-39055.html

    最新回复(0)