基于BMI和T2D的个性化医疗和精准预防的方法及系统

    技术2024-12-20  4


    本发明属于但不限于生物医药,尤其涉及一种基于孟德尔随机化分析bmi和t2d的个性化医疗和精准预防的方法及系统。


    背景技术:

    1、肥胖是由脂肪过量沉淀导致的一种慢性复杂疾病。肥胖会增加2型糖尿病的风险,同时会影响到骨骼健康和生殖系统,并增加罹患某些癌症的风险。通过测量人的体重和升高,计算体重指数(bmi):体重(kg)/身高2(m2),可以做出超重和肥胖的诊断。但是并非所有的肥胖者都会发展为2型糖尿病,2型糖尿病患者中也有非肥胖者。李芝等人对体检人群的研究发现,糖尿病患者的bmi、腰围、体脂率与对照人群存在巨大差异。设置临界值用来作为糖尿病患者前期诊断的特异度均高于70%。美国自我报告的糖尿病患者前期,超过80%的患者存在肥胖或者超重问题。

    2、根据世界卫生组织(who)的定义,bmi介于18.5~24.9之间为正常体重,bmi<18.5,低体重,>=25为超重。因国家不同,略有差异,欧洲人标准的bmi指标标准为20~25。每一个人准确的了解“体重阈值”,可以了解身体体重参数指标,可以帮助医生为患者提供更加准确的健康指导,降低t2d疾病发生的风险。研究发现,bmi超过35kg/m2的个体糖尿病发生风险事bmi kg/m2的个体的20倍。数据显示,bmi每增加1kg/m2,t2d风险增加7%。

    3、bmi并非唯一影响t2d发展的因素,除了bmi外,其他因素,例如基因、生活方式、吸烟等也会影响t2d的风险和预后。例如,基因能够解释个体50%的bmi值差异。而吸烟可以解释2%的bmi值的差异。吸烟、控糖、体育锻炼、社会心理治疗都属于生活方式降低t2d的一部分。综上所述,bmi是评估t2d风险的重要指标,但是需要结合其他因素进行综合评估。在过去的十年里,大型财团和研究机构对生物库的建设使得识别bmi和t2d的因果关系成为可能,统计方法的发展促进了对遗传风险的量化,孟德尔随机化分析方法,基于全基因组测序数据(gwas数据),利用单核苷酸多态性snp作为工具变量(instrumental variable,iv)来揭示因果关系的新型流行病学方法应运而生。

    4、现有技术在工业应用中存在的技术问题:

    5、尽管bmi和t2d之间的关系已经在许多研究中被广泛讨论和研究,但在工业应用中,现有技术仍然存在以下几个显著的技术问题和挑战:

    6、1.因果关系不明确

    7、现有研究大多基于相关性分析,无法明确揭示bmi和t2d之间的因果关系。这种因果关系的不确定性导致无法有效地制定预防和治疗策略。

    8、2.数据整合与处理复杂

    9、生物库数据量巨大且复杂,涉及遗传信息、生活方式、环境因素等多维度数据。现有技术在整合和处理这些数据时,存在技术壁垒,难以有效提取有用信息并进行综合分析。

    10、3.个体差异缺乏考虑

    11、不同个体的bmi和t2d风险差异较大,现有技术往往忽视了个体基因、生活方式和环境等因素的影响,缺乏个性化的评估和预测方法。

    12、4.预测模型的准确性和稳定性不足

    13、现有的预测模型在bmi和t2d的评估中,往往准确性和稳定性不足。模型在不同数据集上的表现不一致,缺乏广泛的适用性和可靠性。

    14、5.缺乏综合评估方法

    15、现有技术主要依赖于单一的bmi指标,而忽略了其他重要因素(如基因、吸烟、饮食、运动等)对t2d风险的综合影响,导致评估结果不全面。

    16、6.临床应用中的挑战

    17、在实际临床应用中,医生需要更准确和全面的工具来评估t2d风险,现有技术无法满足这一需求,导致在预防和治疗策略制定中的应用效果不佳。

    18、技术问题总结:

    19、1)因果关系难以确定:现有研究大多停留在相关性层面,缺乏因果关系的明确揭示。

    20、2)数据处理复杂:大规模生物库数据的整合和处理存在技术壁垒。

    21、3)个体差异忽视:现有技术难以考虑个体基因和生活方式差异,缺乏个性化评估。

    22、4)模型准确性不足:现有预测模型的准确性和稳定性难以满足实际应用需求。

    23、5)缺乏综合评估:单一bmi指标的评估方法不全面,忽略了其他重要因素。

    24、6)临床应用挑战:现有技术难以提供准确和全面的临床评估工具。

    25、解决这些技术问题对于提升bmi与t2d因果关系研究的准确性和实用性至关重要,也为未来个性化医疗和精准预防提供了重要基础。


    技术实现思路

    1、针对现有技术存在的问题,本发明提供了一种基于孟德尔随机化分析bmi和t2d的个性化医疗和精准预防的方法及系统。

    2、本发明是这样实现的,一种基于孟德尔随机化分析bmi和t2d的个性化医疗和精准预防的方法,包括:

    3、s1:读取暴露因素及结局变量的gwas数据;

    4、s2:在gwas数据中选取合适的snp作为工具变量;

    5、s3:去除连锁不平衡的iv,去除弱工具变量;

    6、s4:去除混杂因素;

    7、s5:应用孟德尔随机化分析,进行敏感性分析、多效性校验和异质性分析。

    8、进一步,所述s1,读取暴露因素的gwas数据是获取与待研究暴露因素相关的全基因组关联分析数据;读取结局变量gwas数据是获取与bmi、t2d相关的全基因组关联分析数据;数据来源于英国生物银行(ukbiobank)全基因组关联研究数据库(https://gwas.mrcieu.ac.uk/),选择了与bmi相关的gwas数据的id(ukba248,ukbb19953,ukbb2303)和与t2d相关gwas数据的id(ebiagcst006867,ebiagcst007516,ebiagcst007518)。

    9、进一步,所述s3中去除连锁不平衡的iv,连锁不平衡主要用两个参数r2和kb来衡量,r2:它是0~1之间的数据,r2=1表示两个snp间是完全的连锁不平衡关系,r2=0则表示两个snp间是完全连锁平衡的,也即这两个snp的分配是完全随机的;kb:是指考虑连锁不平衡的区域长度。

    10、进一步,所述s3中去除弱工具变量,包括:

    11、(1)识别弱工具变量:通过统计分析得到r2和f值来判断工具变量的强度,如果f值小于10(这是一个常见的阈值),则可以将该工具变量视为弱工具变量;

    12、(2)计算f检验值:用适当的函数或脚本来计算f检验值;

    13、(3)过滤弱工具变量:根据计算得到的f值,过滤掉f值小于阈值(如10)的弱工具变量,在r中,可以通过对数据框进行子集选择或条件筛选来实现,只保留那些f值大于阈值的行。

    14、进一步,所述s4,去除混杂因素,采用文献查阅+手动删除的方法,删除本研究相关的混杂因素。

    15、进一步,所述s5中敏感性分析,通过逐一去除每个工具变量,观察结果是否发生显著变化,来评估每个工具变量对结果的影响。

    16、进一步,所述s5中异质性分析,通过p值对异质性检验,若p值<0.05,说明结果存在异质性,根据异质性的大小,选择使用固定效应模型或随机效应模型,当异质性较小时,通常使用固定效应模型;而当异质性较大时,使用随机效应模型更为合适。

    17、进一步,所述s5中多效性校验,采用mrpresso检验,通过评估每个工具变量对结果的贡献,并识别出可能的多效性工具变量,从而进行校正。

    18、本发明另一目的在于提供一种基于孟德尔随机化分析bmi和t2d的因果关系的系统,该系统具体包括:

    19、数据读取模块,用于读取暴露因素及结局变量的gwas数据;

    20、snp选取模块,用于选取合适的snp作为工具变量;

    21、筛选模块,用于去除连锁不平衡的iv、去除弱工具变量、去除混杂因素;

    22、孟德尔随机化分析模块,用于进行孟德尔随机化分析。

    23、结合上述的技术方案和解决的技术问题,本发明所要保护的技术方案所具备的优点及积极效果为:

    24、第一、研究人员观察到肥胖、葡萄糖、胰岛素抵抗、胰岛素分泌等与2型糖尿病(t2d)相关。但是,对于这些众多因素对这种因果风险在很大程度上是未知的,因此这对本研究尤为重要。因为遗传因果数据没有混淆因素和反向因果关系,而观察数据容易产生混淆因素。本发明的目的提供基于孟德尔随机化分析bmi和t2d个性化医疗和精准预防的方法。将gwas分析中的遗传变异作为工具变量,有助于克服观察性研究固有的这些偏倚,从而加强暴露因素与结局变量之间的因果关系。明确这些因果关系对于评估和管理t2d疾病风险因素至关重要。为疾病早发现、疾病分层、药物治疗、干预策略提供参考。

    25、第二,本发明的技术方案转化后的预期收益和商业价值为:

    26、本技术方案利用遗传变异作为工具变量,可以减少传统观察的混杂偏倚,从而提高因果推断的准确性和可靠性。通过本发明,有助于发现新的疾病相关的基因和生物学通路,为理解疾病发病机制和开发新的治疗方法提供重要线索。同时可以帮助识别潜在的药物靶点,指导药物设计和研发,准确的因果推断,可以为指定公共卫生策略制定提供科学依据。

    27、本发明的技术方案填补了国内外业内技术空白:

    28、孟德尔随机化分析,利用基因变异作为工具变量(ivs)来评估估计因果效应,并且不受混杂因素和逆因果效应的影响,但可能受到多效性或标记位点连锁不平衡因素的影响。常规单变量mr分析评估单个预测变量对结果的影响,通常满足三个基本假设:(a)与暴露因素“相关性”假设;(b)与结果无关(“排除性”假设);(c)与所有的(观察到和未观察到的)混杂因素独立的“可交换性”假设。如果选择的ivs与暴露因素和结局的混杂因素相关,则会与这些假设冲突,从而导致结果偏倚和认知错误。为了保证结果可靠性,采用文献或者经验找到与混杂因素相关的snp,同时使用代码包ldlink中ldtrait工具,支持批量查找snp位点。

    29、本发明的技术方案解决了人们一直渴望解决、但始终未能获得成功的技术难题:

    30、在传统的研究中,身体质量指数(bmi)与2型糖尿病(t2d)之间的关联一直是医学和公共卫生领域关注的热点。然而,这些研究往往受限于观察性设计的局限性,难以直接证明两者之间的因果关系,因为可能存在多种混杂因素(如生活方式、遗传背景、社会经济状态等)同时影响bmi和t2d的风险。

    31、本次发明的核心贡献在于首次提出了在多维度消除混杂因素的情境下,明确bmi和t2d之间因果关系的新方法。这种方法利用先进的统计技术和孟德尔随机化(mendelianrandomization,mr)等策略,能够更准确地识别暴露因素(如bmi)和结局变量(如t2d)之间的直接因果关系。

    32、本发明的技术方案克服了技术偏见:。

    33、与现有技术研究相比,本发明的有益效果在于:使用多中心的gwas数据,ncbi数据库提供的基因表达的组织数据以及snp相关的官方数据库,为研究提供良好的工具强度和统计能力。

    34、第三,本发明技术方案在工业应用中解决的现有技术问题和显著的技术进步。

    35、1.现有技术问题

    36、尽管bmi和t2d之间的关系已经在许多研究中被广泛讨论,但在工业应用中,现有技术仍然存在以下几个显著的问题和挑战:

    37、1.1因果关系不明确

    38、现有研究大多基于相关性分析,无法明确揭示bmi和t2d之间的因果关系。这种因果关系的不确定性导致无法有效地制定预防和治疗策略。

    39、1.2数据整合与处理复杂

    40、生物库数据量巨大且复杂,涉及遗传信息、生活方式、环境因素等多维度数据。现有技术在整合和处理这些数据时,存在技术壁垒,难以有效提取有用信息并进行综合分析。

    41、1.3个体差异缺乏考虑

    42、不同个体的bmi和t2d风险差异较大,现有技术往往忽视了个体基因、生活方式和环境等因素的影响,缺乏个性化的评估和预测方法。

    43、1.4预测模型的准确性和稳定性不足

    44、现有的预测模型在bmi和t2d的评估中,往往准确性和稳定性不足。模型在不同数据集上的表现不一致,缺乏广泛的适用性和可靠性。

    45、1.5缺乏综合评估方法

    46、现有技术主要依赖于单一的bmi指标,而忽略了其他重要因素(如基因、吸烟、饮食、运动等)对t2d风险的综合影响,导致评估结果不全面。

    47、1.6临床应用中的挑战

    48、在实际临床应用中,医生需要更准确和全面的工具来评估t2d风险,现有技术无法满足这一需求,导致在预防和治疗策略制定中的应用效果不佳。

    49、2.技术方案的解决方案和显著技术进步

    50、本发明提出了一种基于孟德尔随机化分析bmi与t2d因果关系的方法,解决了现有技术中的上述问题,并取得了显著的技术进步。

    51、2.1因果关系的明确揭示

    52、利用孟德尔随机化分析,通过使用遗传变异作为工具变量,有效避免了混杂因素的干扰,明确揭示了bmi与t2d之间的因果关系。这一技术进步使得能够更加准确地制定预防和治疗策略。

    53、2.2数据整合与处理

    54、通过读取和处理大规模的gwas数据,选择合适的snp作为工具变量,去除连锁不平衡和弱工具变量,以及去除混杂因素,使得数据整合与处理更加高效和精确。先进的数据处理方法提高了信息提取的有效性。

    55、2.3个性化评估

    56、结合基因、生活方式和环境因素进行综合评估,提供个性化的t2d风险评估和预测方法。考虑个体差异,提高了评估和预测的准确性和可靠性。

    57、2.4预测模型的改进

    58、通过孟德尔随机化分析方法,构建更准确和稳定的预测模型,在不同数据集上的表现一致性更好,适用性和可靠性显著提高。

    59、2.5综合评估方法

    60、不再依赖单一的bmi指标,而是结合基因、生活方式、吸烟、饮食、运动等多个因素,提供全面的t2d风险评估方法。提高了评估结果的全面性和准确性。

    61、2.6临床应用的改进

    62、为临床医生提供更加准确和全面的t2d风险评估工具,支持个性化医疗和精准预防策略的制定,提高了预防和治疗的效果。

    63、本发明的技术方案通过孟德尔随机化分析方法,结合大规模gwas数据和多维度因素,明确揭示了bmi与t2d之间的因果关系,并解决了现有技术中的多项关键问题。技术进步体现在因果关系的明确揭示、数据处理的高效性、个性化评估的实现、预测模型的准确性和稳定性、综合评估方法的全面性以及临床应用效果的提升。这些显著的技术进步不仅为t2d的预防和治疗提供了科学依据,还推动了个性化医疗和精准健康管理的发展。


    技术特征:

    1.一种基于孟德尔随机化分析bmi和t2d的个性化医疗和精准预防的方法,其特征在于,该方法具体括:

    2.根据权利要求1所述的基于孟德尔随机化分析bmi与t2d个性化医疗和精准预防的方法,其中:

    3.如权利要求1所述的基于孟德尔随机化分析bmi和t2d个性化医疗和精准预防的方法,其特征在于,所述步骤s1中,读取暴露因素及结局变量的gwas数据时,利用专用数据处理软件对数据进行预处理,包括数据格式转换和质量控制;所述步骤s3中,去除连锁不平衡的工具变量,使用plink软件进行连锁不平衡(ld)筛选,确保选取的snp彼此独立;所述步骤s5中,应用孟德尔随机化分析时,使用r软件中的“twosamplemr”包进行分析,并结合“mregger回归”进行多效性校验和异质性分析。

    4.如权利要求1所述基于孟德尔随机化分析bmi和t2d的个性化医疗和精准预防的方法,其特征在于,所述s1,读取暴露因素的gwas数据是获取与待研究暴露因素相关的全基因组关联分析数据;读取结局变量gwas数据是获取与bmi、t2d相关的全基因组关联分析数据。

    5.如权利要求1所述基于孟德尔随机化分析bmi和t2d的个性化医疗和精准预防的方法,其特征在于,所述s3中去除连锁不平衡的iv,连锁不平衡主要用两个参数r2和kb来衡量,r2:它是0~1之间的数据,r2=1表示两个snp间是完全的连锁不平衡关系,r2=0则表示两个snp间是完全连锁平衡的,也即这两个snp的分配是完全随机的;kb:是指考虑连锁不平衡的区域长度。

    6.如权利要求1所述基于孟德尔随机化分析bmi和t2d的个性化医疗和精准预防的方法,其特征在于,所述s3中去除弱工具变量,包括:

    7.如权利要求1所述基于孟德尔随机化分析bmi和t2d的个性化医疗和精准预防的方法,其特征在于,所述s4,去除混杂因素,采用文献查阅+手动删除的方法,删除本研究相关的混杂因素个性化医疗和精准预防的方法;所述s5中敏感性分析,通过逐一去除每个工具变量,观察结果是否发生显著变化,来评估每个工具变量对结果的影响。

    8.如权利要求1所述基于孟德尔随机化分析bmi和t2d的个性化医疗和精准预防的方法,其特征在于,所述s5中异质性分析,通过p值对异质性检验,若p值<0.05,说明结果存在异质性,根据异质性的大小,选择使用固定效应模型或随机效应模型,当异质性较小时,通常使用固定效应模型;而当异质性较大时,使用随机效应模型更为合适。

    9.如权利要求1所述基于孟德尔随机化分析bmi和t2d的个性化医疗和精准预防的方法,其特征在于,所述s5中多效性校验,采用mrpresso检验,通过评估每个工具变量对结果的贡献,并识别出可能的多效性工具变量,从而进行校正。

    10.一种基于如权利要求1~9所述基于孟德尔随机化分析bmi和t2d的因果关系的系统,其特征在于,该系统具体包括:


    技术总结
    本发明属于生物医药领域,公开了一种基于孟德尔随机化分析BMI和T2D的个性化医疗和精准预防的方法及系统,该方法包括:读取暴露因素及结局变量的GWAS数据;在GWAS数据中选取合适的SNP作为工具变量;去除连锁不平衡的IV,去除弱工具变量;去除混杂因素;应用孟德尔随机化分析,进行敏感性分析、多效性校验和异质性分析。本发明利用孟德尔随机化分析方法(MR)将GWAS分析中的遗传变异作为工具变量,有助于克服观察性研究固有的这些偏倚,从而加强暴露因素与结局变量之间的因果关系。明确这些因果关系对于评估和管理T2D疾病风险因素至关重要,为疾病早发现、疾病分层、药物治疗、干预策略提供参考。

    技术研发人员:王光斌,代晨阳,张宜斌,杜世梅,袁丽,冯丽
    受保护的技术使用者:成都信息工程大学
    技术研发日:
    技术公布日:2024/10/24
    转载请注明原文地址:https://symbian.8miu.com/read-23957.html

    最新回复(0)