本发明涉及智能医疗领域,更具体地,涉及一种amd风险标志物的筛选方法、设备、介质和程序产品。
背景技术:
1、年龄相关性黄斑变性(age-related macular degeneration,amd)又称老年性黄斑变性,一般多见于50岁以上的人群,为视网膜黄斑区结构的衰老性改变,是全世界老年人严重损害视力的主要原因。
2、amd主要分两种,一种叫干性年龄相关性黄斑变性,另外一种就叫湿性年龄相关性黄斑变性。干性amd的发病率比较多,除了少数病人感觉到视力轻微的下降,或者偶尔有视物变形以外,一般对视力的危害不太大。但湿性amd不同,湿性amd患者视网膜产生了新生血管,由于新生血管结构不成熟,容易出血和渗出液体,可导致视力明显下降,并影响患者日常生活,是老年人视力丧失的常见原因。随着社会的老龄化,年龄相关性黄斑变性发病率有增高趋势。晚期的年龄相关性黄斑变性的视力丧失往往难以逆转,但是发病早期是有可能控制的,也是可以预防的。阐明amd的发生发展机制,找到合适的早期诊断和治疗、预后评估标志物对改善amd患者的生存是十分重要的。
3、研究与amd相关的标志物,可以实现预测待测者患有amd的风险,进而实现早干预早治疗提供了新的手段和方向。
技术实现思路
1、本发明旨在至少解决现有技术中存在的技术问题之一。为此,本发明提供一种amd风险标志物的筛选方法、设备、介质和程序产品;本发明方法通过构建转录调控网络,识别风险通路,为研究amd的发病机制提供帮助。
2、本技术第一方面公开一种amd风险标志物的筛选方法,所述方法包括:
3、s1:获取包含tf-microrna-gene信息的调控网络数据;
4、s2:获取amd相关的基因表达谱数据和mirna表达谱数据;
5、s3:对所述amd相关的基因表达谱数据和mirna表达谱数据进行差异表达分析,得到amd差异表达基因和amd差异表达mirna;
6、s4:以所述amd差异表达基因和amd差异表达mirna为种子节点集,使用图论算法从所述调控网络数据中识别出amd风险核心子网;
7、s5:基于图搜索算法从所述amd疾病核心子网中识别潜在调控通路;潜在调控通路中的任一个或多个基因、microrna为所述amd风险标志物。
8、在一些实施例中,在所述s5之后,所述方法还包括:
9、s6:获取amd相关基因集和amd相关micrornas集;
10、s7:根据所述潜在调控通路中amd相关基因集和amd相关micrornas集的比例筛选出amd风险调控通路;
11、可选的,所述比例为所述潜在调控通路中amd相关基因集和amd相关micrornas集的覆盖率,根据覆盖率筛选出amd风险调控通路;
12、可选的,所述覆盖率包括cr-de和cr-known,覆盖率大于等于0.5的通路即为所述amd风险调控通路;
13、可选的,所述cr-de的计算方式为:通路中差异表达基因/microrna;
14、可选的,所述cr-known的计算方式为:通路中amd相关基因集中的基因/microrna;
15、可选的,所述amd风险调控通路中的任一个或多个基因和/或microrna为所述amd风险标志物;
16、可选的,所述amd相关基因集从genecards数据库和retinogenetics数据库中获得;
17、可选的,所述amd相关micrornas集从hmdd和mndr数据库中获得。
18、在一些实施例中,在所述s7之后,所述方法还包括s8:对所述amd风险调控通路进行降序排序,从排序结果中选择排序靠前的n个通路,所述n个通路中的任一个或多个基因和/或microrna为所述amd风险标志物;
19、可选的,所述n为大于等于1的自然数,优选为11;
20、可选的,所述11个通路中的标志物包括以下任一种或几种:pten、tgfb1、myc、tp53、hsa-mir-494、hsa-mir-21、hsa-mir-221、hsa-mir-192、hsa-mir-29a、hsa-mir-29c、sparc、bcl2。
21、在一些实施例中,所述s5中从amd疾病核心子网中识别潜在调控通路的方法包括:
22、识别所述amd疾病核心子网中所有连接入度为0节点和出度为0节点的有向无环通路;使用bfs算法得到所有入度为0节点和出度为0节点的最短距离,所有大于最短距离的通路为所述潜在调控通路;
23、可选的,所述s1中的调控网络数据为有向无环调控网络;所述有向无环调控网络通过以下方式得到:
24、获取包含tf-gene互作关系对、tf-microrna互作关系对、microrna-gene调控关系的数据;对所述包含tf-gene互作关系对、tf-microrna互作关系对、microrna-gene调控关系的数据进行整合,得到所述有向无环调控网络;
25、可选的,所述包含tf-gene互作关系对、tf-microrna互作关系对、microrna-gene调控关系的数据已有文献支持;
26、可选的,所述tf-gene互作关系对的数据从transfac中得到;所述tf-microrna互作关系对的数据从transmir数据库中得到;所述microrna-gene调控关系的数据从mirecords、tarbase和mirtarbase中得到;
27、可选的,所述s2中的表达谱数据是使用log2方法标准化后的表达谱矩阵;
28、可选的,所述amd相关的基因表达谱数据和mirna表达谱数据从geo数据库中下载得到;
29、在一些实施例中,基于meta分析对所述基因表达谱数据中的基因进行差异表达分析,得到amd差异表达基因;
30、可选的,基于meta分析对所述mirna表达谱数据中的mirna进行差异表达分析,得到amd差异表达mirna;
31、可选的,所述差异表达分析的标准包括:当单个基因的fdr小于0.1,该基因即为所述amd差异表达基因,当单个mirna的p值小于0.05,该基因即为所述amd差异表达mirna;
32、可选的,所述图论算法包括随机游走算法,优选为重启型随机游走算法;
33、可选的,所述图搜索算法包括广度优先搜索算法。
34、本技术第二方面公开一种用于预测amd疾病的方法,所述方法包括:
35、获取待测样本中amd风险标志物的表达量;
36、基于所述amd风险标志物的表达量得出所述待测样本是否患有amd疾病的风险结果;如果所述风险标志物的表达量高于阈值,得到待测样本患有amd疾病风险高的结果;如果所述风险标志物的表达量低于阈值,得到待测样本患有amd疾病风险低的结果。
37、本技术第三方面公开一种用于预测amd疾病的方法,所述方法包括:
38、获取待测样本中amd风险标志物的表达量;所述风险标志物包括:hsa-mir-21;
39、基于所述amd风险标志物的表达量得出所述待测样本是否患有amd疾病的风险结果;如果所述风险标志物的表达量高于阈值,得到待测样本患有amd疾病风险高的结果;如果所述风险标志物的表达量低于阈值,得到待测样本患有amd疾病风险低的结果;
40、可选的,所述风险标志物还包括:hsa-mir-221;
41、可选的,所述风险标志物还包括:hsa-mir-192;
42、可选的,所述风险标志物还包括:hsa-mir-29a;
43、可选的,所述风险标志物还包括:hsa-mir-29c;
44、可选的,所述风险标志物还包括以下一种或几种:sparc、bcl2、hsa-mir-494、pten、tgfb1、myc、tp53。
45、本技术第四方面公开一种计算机设备,所述设备包括:存储器和处理器;所述存储器用于存储计算机程序;所述处理器执行所述计算机程序以实现上述方法的步骤。
46、本技术第五方面公开一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现上述方法的步骤。
47、本技术第六方面公开一种计算机程序产品,包括计算机程序,该计算机程序被处理器执行时实现上述方法的步骤。
48、本技术具有以下有益效果:
49、1、本技术创新性的公开一种amd风险标志物的筛选方法,该方法创新性地结合多个数据库构建包含转录前/转录后信息的tf-microrna-gene有向无环调控网络,再通过整合amd相关疾病/正常对照实验数据,识别出基因和micrornas作为amd风险标志物;进一步地,为了得到amd疾病的核心调控子网,再从上述amd风险标志物出发,利用机器学习算法提取得到amd疾病相关的分子调控网络,且经过验证,该核心调控子网更集中包含amd相关标志物,可信度更高。进一步地,为阐明核心子网中的上下游调控关系,进一步分析amd核心调控子网中的上下游调控关系以及识别核心调控通路,最终得到11个核心调控通路,并将通路中的转录因子、microrna和基因作为amd风险标志物。
50、2、本技术创新性的利用筛选出的amd风险标志物用于预测amd疾病,为实现早干预早治疗提供指导信息;
1.一种amd风险标志物的筛选方法,其特征在于,所述方法包括:
2.根据权利要求1所述的amd风险标志物的筛选方法,其特征在于,在所述s5之后,所述方法还包括:
3.根据权利要求2所述的amd风险标志物的筛选方法,其特征在于,在所述s7之后,所述方法还包括s8:对所述amd风险调控通路进行降序排序,从排序结果中选择排序靠前的n个通路,所述n个通路中的任一个或多个基因和/或microrna为所述amd风险标志物;
4.根据权利要求1所述的amd风险标志物的筛选方法,其特征在于,所述s5中从amd疾病核心子网中识别潜在调控通路的方法包括:
5.根据权利要求1所述的amd风险标志物的筛选方法,其特征在于,基于meta分析对所述基因表达谱数据中的基因进行差异表达分析,得到amd差异表达基因;
6.一种用于预测amd疾病的方法,其特征在于,所述方法包括:
7.一种用于预测amd疾病的方法,其特征在于,所述方法包括:
8.一种计算机设备,其特征在于,所述设备包括:存储器和处理器;所述存储器用于存储计算机程序;所述处理器执行所述计算机程序以实现权利要求1-7任一项所述的方法的步骤。
9.一种计算机可读存储介质,其特征在于,其上存储有计算机程序,所述计算机程序被处理器执行时实现上述的权利要求1-7任意一项所述的方法的步骤。
10.一种计算机程序产品,包括计算机程序,其特征在于,该计算机程序被处理器执行时实现权利要求1-7任意一项所述的方法的步骤。