本发明涉及数据处理 ,尤其涉及一种疾病风险分析方法及装置。
背景技术:
1、疾病风险预测就是通过分析和挖掘电子病历大数据,建立疾病风险预测模型,实现对疾病风险和发展趋势的早期预测;疾病风险预测方法可以辅助医生更准确的判断病人的身体状况,进而选择更有效的治疗方案来预防和控制疾病。
2、现有技术通常依赖经验风险模型对如结直肠癌等癌症的风险进行预测,例如,利用病理分期模型或肿瘤分化模型等,这些模型预测准确性低,无法综合反映肿瘤生态系统多样性的局限;另外,现有技术也通过整合多组学数据构建风险模型的方法,但该类风险模型使用的肿瘤表型信息的表征能力有限,导致对疾病风险预测结果不准确,进而影响疾病风险分析准确率。
技术实现思路
1、本发明提供一种疾病风险分析方法及装置,用以解决现有技术依赖经验风险模型或者整合多组学数据构建风险模型,使用的肿瘤表型信息的表征能力有限,导致对疾病风险预测结果不准确的缺陷,提高了疾病风险分析准确率。
2、本发明提供一种疾病风险分析方法,包括:
3、根据免疫特征基因表达数据对目标病患的基因表达谱数据进行免疫活性评分,得到免疫活性评分数据,并对所述基因表达谱数据进行单因素cox分析,得到基因风险评分数据,所述基因风险评分数据用于表示目标病患的风险等级;
4、根据所述免疫活性评分数据和所述基因风险评分数据对所述目标病患进行目标分析,得到疾病风险分析结果;其中,所述目标分析包括免疫评分、免疫细胞比例比较、通路富集分析、关键基因的突变和甲基化分析中的至少一项。
5、根据本发明提供的一种疾病风险分析方法,所述根据免疫特征基因表达数据对目标病患的基因表达谱数据进行免疫活性评分,得到免疫活性评分数据包括:
6、从基因表达数据库中获取所述基因表达谱数据和多个免疫特征基因表达数据;
7、对所述基因表达谱数据和所述多个免疫特征基因表达数据进行标准化处理,得到标准化处理后的基因表达谱数据和标准化处理后的免疫特征基因表达数据;
8、对标准化处理后的基因表达谱数据中的每个基因进行排序,得到基因排序列表;并根据所述标准化后的免疫特征基因表达数据计算所述基因排序列表中各基因对应的累计分布,得到所述免疫活性评分数据。
9、根据本发明提供的一种疾病风险分析方法,所述对所述基因表达谱数据进行单因素cox分析,得到基因风险评分数据包括:
10、基于风险系数模型对所述基因表达谱数据进行单因素cox分析,得到所述基因风险数据;
11、基于风险评分阈值对所述基因风险数据进行分类,得到所述基因风险评分;
12、其中,所述风险评分模型基于以临床数据和样本基因表达谱数据为输入,以实测的基因风险系数为输入对coxboost模型进行交叉验证和迭代训练得到;所述临床数据包括病患生存时间、生存状态、临床分期、年龄和性别中至少一项;所述风险评分阈值基于多个样本风险数据的中位值确定。
13、根据本发明提供的一种疾病风险分析方法,在得到所述风险评分模型之后,所述方法还包括:
14、利用定量pcr数据和rna测序数据对所述风险评分模型进行验证,在验证精度高于第二阈值的情况下,确定所述风险评分模型为有效的风险评分模型。
15、根据本发明提供的一种疾病风险分析方法,所述目标分析包括关键基因的突变和甲基化分析;
16、所述根据所述免疫活性评分数据和所述基因风险评分数据对所述目标病患进行目标分析,得到疾病风险分析结果包括:
17、根据从基因表达数据库中获取的单核苷酸变异snv数据和所述基因风险评分数据确定关键基因的突变频率,采用maftools包根据所述突变频率绘制oncoprint图,并在显示所述oncoprint图中显示所述关键基因的突变类型和频率;所述突变类型包括错义突变、无义突变、移码突变中的至少一项;
18、根据从基因表达数据库中获取的甲基化数据和所述基因风险评分数据确定所述关键基因的甲基化状态;
19、根据所述甲基化状态计算基因表达谱数据中各基因的表达水平与甲基化水平之间的相关性,以识别显著相关的基因。
20、根据本发明提供的一种疾病风险分析方法,在所述根据免疫特征基因表达数据对目标病患的基因表达谱数据进行免疫活性评分之前,所述方法还包括:
21、将所述基因表达谱数据中缺失值超过第一阈值的数据删除,得到新的基因表达谱数据。
22、本发明还提供一种疾病风险分析装置,包括:
23、评分模块,用于根据免疫特征基因表达数据对目标病患的基因表达谱数据进行免疫活性评分,得到免疫活性评分数据,并对所述基因表达谱数据进行单因素cox分析,得到基因风险评分数据,所述基因风险评分数据用于表示目标病患的风险等级;
24、分析模块,用于根据所述免疫活性评分数据和所述基因风险评分数据对所述目标病患进行目标分析,得到疾病风险分析结果;其中,所述目标分析包括免疫评分、免疫细胞比例比较、通路富集分析、关键基因的突变和甲基化分析中的至少一项。
25、本发明还提供一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现如上述任一种所述疾病风险分析方法。
26、本发明还提供一种非暂态计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现如上述任一种所述疾病风险分析方法。
27、本发明还提供一种计算机程序产品,包括计算机程序,所述计算机程序被处理器执行时实现如上述任一种所述疾病风险分析方法。
28、本发明提供的疾病风险分析方法及装置,通过根据免疫特征基因表达数据对目标病患的基因表达谱数据进行免疫活性评分,得到免疫活性评分数据,并对基因表达谱数据进行单因素cox分析,得到基因风险评分数据,再根据免疫活性评分数据和基因风险评分数据对目标病患进行目标分析,得到疾病风险分析结果, 能够综合反映目标病患的免疫状态,准确预测免疫治疗反应,提高了疾病风险分析准确率。
1.一种疾病风险分析方法,其特征在于,包括:
2.根据权利要求1所述的疾病风险分析方法,其特征在于,所述根据免疫特征基因表达数据对目标病患的基因表达谱数据进行免疫活性评分,得到免疫活性评分数据包括:
3.根据权利要求1所述的疾病风险分析方法,其特征在于,所述对所述基因表达谱数据进行单因素cox分析,得到基因风险评分数据包括:
4.根据权利要求3所述的疾病风险分析方法,其特征在于,在得到所述风险评分模型之后,所述方法还包括:
5.根据权利要求1所述的疾病风险分析方法,其特征在于,所述目标分析包括关键基因的突变和甲基化分析;
6.根据权利要求1和2任一项所述的疾病风险分析方法,其特征在于,在所述根据免疫特征基因表达数据对目标病患的基因表达谱数据进行免疫活性评分之前,所述方法还包括:
7.一种疾病风险分析装置,其特征在于,包括:
8.一种电子设备,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如权利要求1至6任一项所述疾病风险分析方法。
9.一种非暂态计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至6任一项所述疾病风险分析方法。
10.一种计算机程序产品,包括计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至6任一项所述疾病风险分析方法。