本发明涉及核酸测序领域,更具体地,涉及一种核酸测序方法。
背景技术:
1、第三代测序技术即单分子测序,测序时不需要进行pcr扩增,而是基于单分子的电信号或化学反应信号检测,实现了对每一条dna分子的单独测序。三代测序具有效率更高、读长更长、实时测序等优势,在甲基化识别、变异检测(snp、cnv)等精细化项目中有着极大的应用前景,能胜任更加复杂的基因组测序工作。而近几年三代测序技术的更新和迭代也使测序准确度明显提升,使得测序准确度不再是其短板。
2、三代测序平台以pacbio和nanopore为代表。promethion是nanopore推出的测序芯片中产出最高的,用户手中最高通量可以达到180gb。而pacbio最新推出的revio系统单张芯片的产出直接达到了90g。高准确度和高通量已经不是限制三代测序技术应用的主要难题,而受限于国际市场测序芯片价格较高,降低测序成本成为最新的技术聚焦点。利用标签(barcode)标记技术进行单芯片上的多样本混样测序,是目前降低成本的主要方式。然而这种混样方式忽视了pacbio和nanopore公司的芯片存在价格昂贵,同时芯片通量产出均一性差,偏差较大的问题(图3),这一问题往往导致测序数据量较预估不足而需要再次补测或测序数据量超出预估而造成芯片严重浪费。这些问题显著影响了生产效率,增加了测序成本,延长了测序生产周期。因此为了节省测序成本,提高测序芯片的利用率,就需要对测序流程进行合理设计,考虑大量芯片使用上的经济合理性,降低由于芯片质量不均一和某些情况下芯片使用不合理产生的生产风险和成本。
3、专利申请cn109056077a公开了一种dna扩增子混样测序文库构建方法(见图1),主要内容是:
4、1)设计与合成带标签的扩增引物:每个待测样本设计并合成一对扩增子的扩增引物,其中每对引物的5'端带有标签序列,每对引物的5'端标签序列反向互补且唯一无重复;每对引物的3'端为扩增子的特异性引物;
5、2)扩增子样本的扩增:分别以各个样本dna为模板,以对应的带标签的扩增引物为引物进行pcr扩增,扩增之后纯化pcr产物并确定片段的大小分布;
6、3)将每个样本的dna扩增纯化产物等摩尔量混样,混样后总量大于2μg;
7、4)将混样扩增产物进行末端修复并纯化;
8、5)对步骤4)中的纯化产物与平末端接头进行连接反应;
9、6)对步骤5)获得的连接产物进行外切酶消化和纯化,得到适用于pacbio测序平台的扩增子混样测序文库。
10、上述现有技术中存在的缺陷在于:
11、1)上述专利申请是在pacbio单芯片上实现的混样测序,由于无法预估芯片质量和实际产量,对混样样本数量不能根据目标产量进行精确预估,混样样本数量较少时会降低对芯片的利用率;
12、2)当混样样本总预期数据产量显著低于实际数据产量时,由于旧芯片重复使用和保存存在很多限制条件,会造成芯片的浪费;
13、3)该方案没有考虑到芯片间的质量差异对测序结果的影响;
14、4)该方案没有考虑到芯片间的较大的通量差异,在测序样本较多,比如大队列测序样本的情形下,需要大量芯片测序时,单芯片混样会造成芯片的浪费。
技术实现思路
1、为了解决测序生产过程中由于单芯片混样测序无法预估芯片实际产量,对混样样本数量不能提前设计,以及芯片质量不均一造成的对测序结果的影响和芯片浪费等问题,本发明设计了一套多芯片混样测序方案,将各个单芯片上的混样样品进行集合,形成大队列混样样品后在多芯片上进行测序,减少了芯片质量不均一对测序结果的影响,并实现对芯片的最大程度的利用,从而降低芯片使用量和测序成本。同时,该方法对混样样本数量没有限制,混样样本数量不影响对芯片的利用率。
2、为了实现上述目的,本发明公开了一种核酸测序方法,该方法包括:
3、s1:获得两个或更多个核酸样本;
4、s2:对所述核酸样本进行建库处理,获得混合文库;
5、s3:从所述混合文库中取样,并上样至一定数量的测序芯片进行测序,所述测序芯片的数量应足以使最终得到的各芯片测序数据量的总和达到或高于各所述核酸样本待测数据量之和。
6、其中所述各芯片测序数据量的总和为所使用的各测序芯片测序数据量的累加;核酸样本待测数据量为,满足s1中各核酸样本测序要求所需的数据量。
7、优选地,各芯片对混合文库样本的测序数据量达到芯片的实际数据产量。
8、优选地,所述s3步骤包括:
9、1)从所述混合文库中取样,分批次上样至一定数量的测序芯片进行测序,每批次的芯片数量独立地选自1至n的自然数,其中n满足以下条件:最终得到的各芯片测序数据量的总和达到或高于各所述核酸样本待测数据量之和;或
10、2)从所述混合文库中取样,在不高于由下述公式预估的数量的芯片上先进行一次测序:
11、
12、其中,[]为向下取整函数,n为≥2的整数;“芯片平均产量(q)”是指测序过程中使用的所有芯片的测序实际数据产量的算数平均值;
13、进行上述测序后,如果得到的各芯片测序数据量的总和未达到各所述核酸样本待测数据量之和,则用1)的方法在附加数量的芯片上进行测序,直至得到的各芯片测序数据量的总和达到或高于各所述核酸样本待测数据量之和。
14、s1中所述核酸样本包括基因组dna样本、rna反转录合成的cdna样本、经过pcr方法获得的扩增子样本和rna样本。
15、就本发明的目的而言,所述核酸样本中的核酸片段可以是任意长度,只要能够实现有意义的测序就可以。但是一般而言,核酸样本中的核酸片段长度在50bp-1mb之间。从本发明的原理出发,本领域技术人员能够认识到,所述两个或更多个核酸样本间核酸片段长度的差异对本发明的技术效果不会产生显著的影响。
16、在s2步骤前,优选对s1中所述核酸样本的样本浓度、样本纯度和片段平均长度进行质控检测,以确保满足三代测序平台的要求。
17、建立s2中所述混合文库时,可以使用pacbio平台建库试剂盒和nanopore平台测序建库试剂盒;或者其他第三方试剂公司开发的建库试剂盒等。
18、s2中对所述核酸样本进行建库处理方法的优选为:对各核酸样本分别建库然后混样,并在建库前或建库过程中对各核酸样本分别进行标记;或将各核酸样本混样后合并建库,并在建库前或建库过程中对各核酸样本分别进行标记。其中,对各核酸样本进行标记可以采用不同的barcode组合作为标签,包括通过扩增方式或连接法添加标签。
19、优选地,s3中混合文库上样时,上样总质量的测定方法为:
20、对于各核酸样本分别建库后混样的混合文库,根据各核酸样本质量累加计算总质量;
21、或对于各核酸样本混样后合并建库的混合文库,对混合文库进行浓度测定后计算总上样质量。
22、优选地,对所述混合文库进行浓度测定的方法包括:qubit荧光计核酸浓度测定法或nanodrop分光光度计核酸浓度测定法。
23、作为本发明的一种实施方式,为了达到减少芯片用量的目的,要将所述混合文库加载至测序仪的两个或更多个芯片上进行上机测序,然后跟踪计算已使用的各芯片所产生的测序数据量的总和。“分批次上样”是指先用1或n个芯片进行第一批测序,然后在第一批芯片测序下机后,在进行下一步操作之前,计算各芯片所产生的测序数据量的总和,然后根据计算结果确定下一步如何操作。如果该总和值尚未达到目标总测序数据量,说明尚未完成测序,这时就要用1或n个芯片进行第二批测序,如此继续,直至该总和值已达到或超过目标总测序数据量。
24、例如,在实施例1中,目标总测序数据量为360g,用最初的两个芯片(pam11881和pam74180)测序下机后,计算这两个芯片所产生的测序数据量的总和。计算结果为69.85+98.65=168.5g。该总和值尚未达到目标总测序数据量360g,因此要使用下一个芯片pam74181来继续进行测序,如此继续,直到在使用了第五个芯片pam86410后,所述测序数据量总和值已达到379.4g,超过了目标总测序数据量360g,说明已完成本发明的方法。
25、本发明的另一种实施方式是,先采用下述公式预估测序所需的芯片量,在不高于此数量的芯片上先进行一次上机,直至测序数据量总和值达到或者超过目标总测序数据量:
26、
27、其中,[]为向下取整函数,n为≥2的整数;“芯片平均产量(q)”是指测序过程中使用的所有芯片的测序实际数据产量的算数平均值,一般取同批次相同测序条件下的芯片实际数据产量的算数平均值,也可以取实验室单芯片产量平均值的经验值。
28、s3步骤后,可以有两种选择:一是停止测序;二是继续使用新的芯片来进行进一步的测序。这里的第二种选择可能是出于满足目标总测序数据量以外的其他考虑,例如补充其中某单一样本的测序数据量。
29、本发明的有益效果:
30、本发明的技术方案使得各芯片实际测序产量均为产量的最大值,每个芯片均得到了充分利用,不存在单芯片不混样/单芯片混样时大量芯片产能过剩,高于目标数据量的情况,因而芯片实际使用个数将小于传统的单芯片不混样/单芯片混样方式,从而降低了芯片的使用量,进而降低了测序成本。这种降低测序成本的效果在样本数量较大,目标总测序数据量较大的情况下更为显著。此外,在多芯片测序的场合,本发明还可以降低芯片对测序的影响,提升测序均一性。
1.一种核酸测序方法,其特征在于,该方法包括以下步骤:
2.如权利要求1所述的核酸测序方法,其特征在于,所述s3步骤包括:
3.如权利要求1所述的核酸测序方法,其特征在于,s1中所述核酸样本选自基因组dna样本、rna反转录合成的cdna样本、经过pcr方法获得的扩增子样本或rna样本。
4.如权利要求3所述的核酸测序方法,其特征在于,所述核酸样本的核酸片段长度在50bp-1mb之间。
5.如权利要求1所述的核酸测序方法,其特征在于,在进行s2步骤前,对s1中所述核酸样本的样本浓度、样本纯度和片段平均长度进行质控检测。
6.如权利要求1所述的核酸测序方法,其特征在于,获得s2中所述混合文库的建库试剂盒包括:pacbio平台建库试剂盒和nanopore平台测序建库试剂盒。
7.如权利要求1所述的核酸测序方法,其特征在于,s1中核酸样本的建库处理方法为:对各核酸样本分别建库然后混样,并在建库前或建库过程中对各核酸样本分别进行标记;
8.如权利要求7所述的核酸测序方法,其特征在于,采用不同的barcode组合作为标签,对各核酸样本进行标记,包括通过扩增方式或连接法添加标签。
9.如权利要求7所述的核酸测序方法,其特征在于,s3中上样总质量的测定方法为:
10.如权利要求1所述的核酸测序方法,其特征在于,在s3步骤后,使用新的芯片继续进行测序,补充核酸样本的测序数据量。
