文库构建的本质是将片段化后的基因组DNA两端加上通用接头序列,通过PCR扩增获取足够多能够上机测序的文库核酸分子。根据样本类型,又分为DNA建库和RNA建库
高通量测序又称下一代测序技术(Next-generation Sequencing, NGS),相对于第一代DNA测序技术(Sanger法),它可以同时对几十万乃至数百万条核酸分子序列进行测定,具有通量高、成本低、规模大等显著优势,应用范围非常广泛,目前已经成为全球主流测序技术。
NGS测序流程主要分为 样本制备、文库构建、上机测序、数据分析 四个流程,在上述涉及的相关实验过程中,酶在其中起着至关重要的作用,这里针对性的对文库构建中的关键酶进行介绍。
图1. NGS测序流程图(Gulilat, M. et al. 2019, BMC Medical Genomics)
文库构建的本质是将片段化后的基因组DNA两端加上通用接头序列,通过PCR扩增获取足够多能够上机测序的文库核酸分子。根据样本类型,又分为DNA建库和RNA建库。在DNA文库构建过程中,TA克隆连接接头建库是目前商业技术中最常用的技术手段 ,主要建库流程如下:
图2. Illumina 平台DNA文库构建流程
DNA片段化
由于目前市场中测序仪的测序长度通常在 150-500bp 之间,因此需要使用机械打断或酶切打断的方法将大片段基因组DNA片段化为小片段的DNA。机械打断的方式对样本的损耗相对较高,操作方式也更为复杂,市面上也常用酶切的方式对基因组DNA进行打断。与机械法相比,酶切法的成本更低,操作更简便,加入片段化酶后仅需反应一段时间即可。 目前常用的片段化酶主要有两种,一种是基于转座子原理的Tn5转座酶,另一种是核酸内切酶的混合酶,但是这些片段化酶的效果容易被样本GC含量、碱基偏好性所影响。与此相比,翌圣研发的片段化酶(Yeasen Cat#12917)酶切效果稳定,偏好性远低于Tn5转座酶,针对不同的DNA类型样本(包括FFPE样本)都有优异的测序结果。
末端修复,3'端加“A”:
打断后的DNA会产生5'/3'黏性末端以及平末端,而所有的黏性末端都需要转为平末端,包括3'突出末端切平、5'突出末端补平。在使用TA连接的方式进行接头连接时,DNA片段还需要5'端磷酸化和在3'端加“A”,才能与带“T”黏性末端的接头互补配对。以上过程由T4 DNA聚合酶、T4多聚核苷酸激酶、Taq DNA聚合酶协作完成。 T4 DNA聚合酶(Yeasen Cat#12901)具有5'→3'DNA聚合酶活性,可沿 5'→3'方向催化合成 DNA,补平5'突出末端;同时该酶也具有3'→5'外切酶活性,能够用于3'突出末端的切平,从而将含黏性末端的DNA片段转变为平末端DNA。 由于人工合成的PCR引物、接头等5'端通常都是羟基基团而不是磷酸基团,因此需要T4多聚核苷酸激酶(Yeasen Cat#12902)在ATP 存在时催化ATP的γ-磷酸基团转移到寡核苷酸链的5'端羟基末端上,为下一步连接接头做准备。 Taq DNA聚合酶(Yeasen Cat#13486)具有5'→3'聚合酶活性,可以从5'→3'方向合成DNA,同时它具有的脱氧核苷酸转移酶活性可以在PCR产物的3'末端添加一个核苷酸“A”。
图3. 多种酶参与末端修复过程
接头连接:
接头是文库中的重要组成部分,测序中常用的Illumina平台Y型接头,包含 P5/P7、Index、以及Rd1/Rd2 SP序列 。其中,P5/P7序列用于和测序芯片上的序列进行配对,将待测片段固定在Flowcell上完成桥式扩增;Index用来区分上机测序混合文库中的不同样本,而Rd1/Rd2 SP是Read1和Read2测序引物结合区域。接头连接一般用T4 DNA连接酶(Yeasen Cat#10298),它可以修复双链DNA上的单链切口,使两个相邻的核苷酸重新连接起来,在接头连接中可将带有“T”黏性末端的接头和带“A”黏性末端的DNA片段连接起来形成一个完整的双链。
图4. Illumina 平台一般接头连接过程
PCR富集:
通过PCR反应获取到足够多带接头的DNA序列,上机完成对样本核酸序列的测序。PCR通常用的Canace 高保真DNA聚合酶(Yeasen Cat#13476)具有5'→3'聚合酶结活性,可沿 5'→3'方向合成 DNA;除此之外,还具有3'→5'外切酶的活性,能够在扩增过程中纠正错误掺入的碱基,从而快速、高保真的扩增DNA片段。 RNA文库的构建,根据RNA的种类可以分为 mRNA文库、LncRNA文库 等,其中常规RNA文库构建包括
图5. Illumina平台mRNA文库构建
RNA富集:
不论真核生物还是原核生物,其RNA中最多的是rRNA,其占比高达80%。如果直接对样本的总RNA进行测序,测序数据中绝大部分将为rRNA的相关数据,因此必须通过RNA富集的方法去除rRNA的干扰。RNA富集的方法有 基于oligo-dT富集的mRNA方法和rRNA去除法 。 真核生物mRNA在3'端具有明显的poly(A)的结构特点,利用Oligo(dT)磁珠可以富集样本转录出来的所有mRNA,从而进行转录本的分析,适用于高质量的RNA样本。而rRNA去除的方法对样本质量的要求要低于mRNA测序,同时适用于低质量(如FFPE样本)和高质量RNA样本,也适用于原核生物类型样本,商业常用RNase H消化的方法去除rRNA。具体步骤如下:
首先,合成能够与rRNA结合的特异性寡核苷酸探针;
其次,使用能够降解RNA-DNA杂合链中RNA 的RNase H(Yeasen Cat#12906)去除和探针结合的rRNA;
最后,使用可以消化单链或双链的DNA 的DNase I(Yeasen Cat#10325)消化掉DNA探针,从而最终达到去除rRNA的目的。
图6. 基于酶法的rRNA去除原理示意图
RNA片段化:
通常在二价阳离子以及高温的作用下,将大片段的RNA打断为小片段。
cDNA一链合成:
将获取的目的RNA反转录成cDNA第一条链。因为RNA极易被环境中存在的RNase降解,在反转录过程中使用RNase Inhibitor(Yeasen Cat#10603)可以抑制这些酶的活性,保护RNA不被RNase降解。与此同时,使用逆转录酶(Yeasen Cat#11112)将模板RNA反转录成cDNA;逆转录酶具有依赖RNA的DNA聚合酶活性,能够以RNA为模板,按5'→3'方向合成一条与RNA模板互补的DNA单链,也就是cDNA第一链。
cDNA二链合成:
反转录合成的单链cDNA极不稳定,需立即在DNA聚合酶Ⅰ的作用下合成cDNA第二链。在二链合成时,RNase H可以除去RNA-DNA杂合链中的RNA链,配合DNA聚合酶Ⅰ (Yeasen Cat#12903)催化合成cDNA第二链。DNA聚合酶Ⅰ 具有5'→3' DNA聚合酶活性,可在模板和引物的作用下,沿5′→3′方向合成与cDNA一链互补的序列。 后续流程分别为末端修复、3'端加“A”、接头连接、PCR富集,这些在DNA文库构建中已有列举,这里不再多做赘述。需要注意的是,当反转录完成以后,不需要再次打断核酸片段。 翌圣生产多种NGS建库相关的酶,您可以使用下表,选择最适合的文库构建产品。
表1. 翌圣NGS常规DNA&RNA建库相关核心酶 选择指南
不感兴趣
看过了
取消
人点赞
人收藏
打赏
不感兴趣
看过了
取消
您已认证成功,可享专属会员优惠,买1年送3个月!
开通会员,资料、课程、直播、报告等海量内容免费看!
打赏金额
认可我就打赏我~
1元 5元 10元 20元 50元 其它打赏作者
认可我就打赏我~
扫描二维码
立即打赏给Ta吧!
温馨提示:仅支持微信支付!
已收到您的咨询诉求 我们会尽快联系您