本发明涉及数据处理领域,特别涉及一种基于知识图谱的中医处方数据库。
背景技术:
1、不同于现代医学具有统一明确的诊疗规则,传统中医诊疗理论之间多存在交叉,每种辨证纲领的使用范围多存在区分界限模糊、应用场景重叠度高、辨证内容交叉等问题,不同中医学派及不同中医师的诊疗规则也往往存在交叉和重叠,导致难以储备标准化的高质量中医大数据,人工智能技术的发展为推动中医药事业走向现代化、智能化、数字化提供了新的参考范式,知识图谱是人工智能的重要研究领域,本质是构建和存储不同类型数据的关联性,用图网络来表示知识及其属性和关联,可在一定程度上表征复杂的知识结构和关联。
2、中医临床处方一般包括患者的基本信息,诊断和疾病信息,药物的组成、使用情况和数量,医生的建议等。基于诊疗规则的中医专家系统在开具处方时,会综合医师的临床思维、用药经验及病人的具体情况,选择一种或几种经典的方剂进行调整和增减,在一定程度上,中医处方中药物的组成和用量共同表达了处方药医师辨证论治的结果,虽然不同的医师存在经验和理论上的差异,使得不同医师开具的处方间会存在差异性,但其本质上还是属于同一处方,但由于缺少针对于中医临床处方的识别分类技术,导致其难以形成规范化、有价值的中医处方数据信息,存在的无效数据较多,生成的知识图谱冗余度较大。为此,我们提出一种基于知识图谱的中医处方数据库。
技术实现思路
1、本发明的主要目的在于提供一种基于知识图谱的中医处方数据库,可以有效解决背景技术中的问题。
2、为实现上述目的,本发明采取的技术方案为,
3、一种基于知识图谱的中医处方数据库,所述数据库的构建步骤包括:
4、定义中医处方知识图谱中包括临床表现、证候要素、证候类型、方剂、药物、用量的实体及实体关系,从中医诊疗指南中提取所述实体及各所述实体间的关系信息,整理为结构化的数据,根据获取的数据构建基于中医诊疗指南的知识图谱;
5、输入目标证候类型,通过构建的知识图谱自动组合出对应的治法,以获取的目标证候类型的治法中推荐的中药方剂作为标准方剂,并获取各中医处方中对于目标证候类型治法的中药方剂作为待分类方剂;
6、获取标准方剂中涉及的药物种类及对应的药物用量信息,确定标准方剂中涉及的药物种类编码,构建标准方剂的药物特征向量u0=(a0k,m0k)t,其中,a0k表示为标准方剂中第k种药物的编码,m0k表示为标准方剂中第k种药物的用量,k=1,2,...,n;;
7、获取待分类方剂中涉及的药物种类及对应的药物用量信息,确定待分类方剂中涉及的药物编码,构建待分类方剂的药物特征向量ui=(bij,rij)t,其中,ui表示为第i个待分类方剂的药物特征向量;bij表示为第i个待分类方剂中第j种药物的编码,rij表示为第i个待分类方剂中第j种药物的用量,j=1,2,...,m;
8、计算对于目标证候类型治法中各待分类方剂的药物特征向量与标准方剂的药物特征向量之间的差异度,计算公式为:
9、
10、式中,d(u0,ui)表示为标准方剂的药物特征向量与第i个待分类方剂的药物特征向量之间的差异度;分别为标准方剂及待分类方剂中第t项药物种类编码的归一化值;m0t、rit分别为标准方剂及待分类方剂中第t项药物用量的归一化值,根据差异度的计算结果将待分类方剂划分为高相似性方剂和低相似性方剂,具体包括以下步骤:
11、获取标准方剂的药物特征向量与第i个待分类方剂的药物特征向量之间的差异度值;
12、将药物特征向量之间的差异度值用参数λ进行表示,利用函数将所有差异度值调整至区间[0,1]之间;
13、利用f(λ)的函数值对相似度计算数值进行分类,分类的机制为:
14、当时,差异度值分类为一级;
15、当时,差异度值分类为二级;
16、其中,f(λ)min,f(λ)max分别为函数f(λ)的最小值和最大值;
17、根据差异度值的分类结果确定待分类方剂的类型,确定机制为:
18、当差异度值分类为一级时,判定对应的待分类方剂为高相似性方剂;
19、当差异度值分类为二级时,判定对应的待分类方剂为低相似性方剂。
20、本发明具有如下有益效果,
21、与现有技术相比,本发明技术方案通过定义中医处方知识图谱中的实体及实体关系,从中医诊疗指南中提取所述实体及各所述实体间的关系信息,整理为结构化的数据,根据获取的数据构建基于中医诊疗指南的知识图谱,输入目标证候类型,通过构建的知识图谱自动组合出对应的治法,以获取的目标证候类型的治法中推荐的中药方剂作为标准方剂,并获取各中医处方中对于目标证候类型治法的中药方剂作为待分类方剂,获取标准方剂中涉及的药物种类及对应的药物用量信息,确定标准方剂中涉及的药物种类编码,构建标准方剂的药物特征向量,获取待分类方剂中涉及的药物种类及对应的药物用量信息,确定待分类方剂中涉及的药物编码,构建待分类方剂的药物特征向量,计算对于目标证候类型治法中各待分类方剂的药物特征向量与标准方剂的药物特征向量之间的差异度,根据差异度的计算结果将待分类方剂划分为高相似性方剂和低相似性方剂,根据待分类方剂的分类结果更新构建的知识图谱,通过本发明技术方案对临床处方的识别分类,可以筛选出本质上相同的临床处方,从而可以去除同类处方数据,保留更多有效处方数据信息,降低知识图谱中存储数据的冗余度。
1.一种基于知识图谱的中医处方数据库,其特征在于,所述数据库的构建步骤包括:
2.根据权利要求1所述的一种基于知识图谱的中医处方数据库,其特征在于,标准方剂的药物特征向量的表达式为:u0=(a0k,m0k)t,其中,a0k表示为标准方剂中第k种药物的编码,m0k表示为标准方剂中第k种药物的用量,k=1,2,...,n;
3.根据权利要求2所述的一种基于知识图谱的中医处方数据库,其特征在于:
4.根据权利要求1所述的一种基于知识图谱的中医处方数据库,其特征在于,药物特征向量之间的差异度计算公式为:
5.根据权利要求1所述的一种基于知识图谱的中医处方数据库,其特征在于,待分类方剂的划分方法包括以下步骤:
6.根据权利要求1所述的一种基于知识图谱的中医处方数据库,其特征在于,所述实体包括临床表现、证候要素、证候类型、治法、方剂、药物、用量。