Dna测序

DNA测序被认为是突变检测的“金标准”。然而,在继续描述方法和技术之前,重要的是要指出测序并不是完美的,它当然也不是魔术。像任何分析方法一样,人们可能会遇到假阳性和假阴性。然而,当正确地完成和正确地解释,测序一个DNA片段几乎总是能揭示高百分比,接近100%的序列变异。

从概念上讲,要获得任何DNA片段的碱基序列需要三个步骤。首先,从某个确定的点开始(例如,PCR产物的5'端或退火引物),必须将DNA分成四个反应和

微卫星Dna序列

图17。囊性纤维化突变G542X的pcr介导定点突变分析。(A)在使用不匹配引物进行PCR扩增时,将T(星号表示)改为C,将BsiNI位点引入野生型PCR产物中。新的BstNI位置由阴影框表示,切割位置由箭头表示。由于引入的酶切位点和一个与突变无关的本构酶切位点的存在,BsiNI酶切产生三个片段。当野生型G(被小框包围)突变为T时,不匹配的引物不会产生BsiNI位点。带有突变的PCR产物只在本构限制位点被切割一次,产生两个片段。(B)对G542X突变侧的295 bp的CFTR基因区域进行扩增和BsiNI酶切。PCR产物经10%聚丙烯酰胺凝胶电泳分离,然后用溴化乙铵染色。Lane 1,正常个体(170-和101-bp片段); lane 2, individual heterozygous for the G542X mutation (195-, 170-, and 101-bp fragments); lane 3, water blank; lane 4, ^X174 DNA size markers. The 24-bp fragment migrates quickly through the gel and is not visible. (Courtesy of William G. Learning, Molecular Genetics Laboratory, University of North Carolina Hospitals.)

图17。囊性纤维化突变G542X的pcr介导定点突变分析。(A)在使用不匹配引物进行PCR扩增时,将T(星号表示)改为C,将BsiNI位点引入野生型PCR产物中。新的BstNI位置由阴影框表示,切割位置由箭头表示。由于引入的酶切位点和一个与突变无关的本构酶切位点的存在,BsiNI酶切产生三个片段。当野生型G(被小框包围)突变为T时,不匹配的引物不会产生BsiNI位点。带有突变的PCR产物只在本构限制位点被切割一次,产生两个片段。(B)对G542X突变侧的295 bp的CFTR基因区域进行扩增和BsiNI酶切。PCR产物经10%聚丙烯酰胺凝胶电泳分离,然后用溴化乙铵染色。Lane 1,正常个体(170-和101-bp片段); lane 2, individual heterozygous for the G542X mutation (195-, 170-, and 101-bp fragments); lane 3, water blank; lane 4, ^X174 DNA size markers. The 24-bp fragment migrates quickly through the gel and is not visible. (Courtesy of William G. Learning, Molecular Genetics Laboratory, University of North Carolina Hospitals.)

具体地在四个核苷酸碱基上拆分它;也就是说,在A反应中,DNA必须被分解成以A结尾的所有可能的寡核苷酸,G反应必须产生以G结尾的所有可能的寡核苷酸,以此类推。其次,这些寡核苷酸必须以某种方式标记以便检测。第三,必须以单碱基分辨率分离标记片段并进行检测。

1977年,两篇文章展示了如何执行这三个步骤并实现读取DNA序列的目标。这两种方法以截然不同的方式实现了创建寡核苷酸池的目标,每一个池都由以四个碱基之一结尾的DNA片段组成。Maxam和Gilbert使用化学物质在特定的碱基上进行DNA片段(60)。桑格和他的同事将DNA测序作为模板,合成了4个新的寡核苷酸池,每个池通过加入一个链终止二脱氧核苷酸三磷酸在每个碱基上终止(61)。这两篇论文被认为是分子生物学中最重要的里程碑。在

1980年,吉尔伯特和桑格因“对确定核酸碱基序列的贡献”而获得诺贝尔化学奖。尽管Maxam-Gilbert化学方法已应用于小的DNA片段测序,如寡核苷酸,目前,所有或几乎所有的DNA测序是使用酶的桑格方法完成的。因此,剩下的讨论将专门集中在酶桑格法上。

桑格测序反应是一个多步骤的过程。正如在现代诊断实验室中最常用的做法一样,第一步是对感兴趣的靶物进行PCR扩增。显然,这是一个关键的步骤,一个设计不良的PCR策略,非特异性扩增或低产量将导致无法解释的序列。下一步包括去除多余的脱氧核苷酸三磷酸(dNTPs)和PCR引物。接下来,将PCR产物变性,加入寡核苷酸(测序引物),并在待测序区域退火5'。DNA聚合酶(通常是一种重组耐热酶)和dNTPs和二脱氧核苷酸三磷酸(ddNTPs)的混合物(如果使用耐热酶,则进行热循环)。DNA聚合酶将向5'到3'方向延伸退火的引物,生成一条新的DNA链,作为PCR产物模板的补充。因为ddNTPs保留了一个5'羟基,它们可以被合并到不断增长的DNA互补链中。但由于缺乏3′羟基,DNA聚合酶无法进一步扩展。因此,例如,当一个ddATP被合并时,链终止于a位置,与模板中相应的T相补充。ddNTPs在生长链中结合的速率取决于反应中dNTPs与ddNTPs的比例以及聚合酶识别ddNTPs的效率。临床实验室中的大多数应用使用染料终止剂化学。在这种方法中,可检测标签(本例中为荧光标签)链接到ddntp。四个ddntp中的每一个都用四个荧光分子中的一个标记。因此,由包含一个ddATP而终止的片段将被标记为一种颜色,以G结尾的片段将被标记为另一种颜色,以此类推。 The pool of DNA fragments is then subjected to high-resolution electrophoresis, either slab gel or CE, and the presence of each of the four fluors is scored as the DNA fragments migrate past a fixed, multi-wavelength fluorescence detector. The output resembles a chro-matogram and is read from the shortest fragment to the longer fragments, with a blue (for example) peak being read as an A, a red peak being read as a C, and so forth. A schematic of the principle modifications of the Sanger sequencing chemistry is shown in Fig. 18.

自第一批报告以来,DNA测序技术取得了巨大的技术进步。在测序的早期,在几天的工作后读取100个碱基的能力是最先进的。今天,自动化序列分析仪能够以每天高达10万到20万个碱基的速度产生序列,虽然昂贵,但大型临床实验室都可以使用。

7.1.酶用于DNA测序有重大进展的一个领域是酶技术(62)。Sanger等人最初使用的酶是大肠杆菌的Klenow片段DNA聚合酶I.Klenow片段保留了聚合酶全酶的5'到3' DNA聚合酶活性,但缺乏3'到5'外切酶或校对活性。保留3'到5'外切酶活性的酶在dna测序应用中没有用处,原因有几个。首先,由于外切酶活性可以降解测序引物,因此很难达到最大标记。其次,外显子清除酶可以去除标记的染料终止剂,允许新链通过添加dntp继续生长,并在序列中留下间隙。第三,聚合酶可以在某些序列上暂停,并在聚合酶和外切酶活性之间来回循环。这可能导致峰值强度的显著变化,因为ddntp在暂停位点有更多的合并机会(63)。

Klenow片段已经被用于测序好几年了,现在仍然偶尔使用。然而,它较低的连续性和相对较低的延伸率导致了较高的背景和较低的信号比其他一些酶。Sequenase™是由Tabor和Richardson开发的T7 DNA聚合酶的商品名。序列酶版本1是一种经过化学修饰的酶,它保留了原生聚合酶的高连续性和延伸率,同时具有约1%的原始3'到5'外切酶活性(64)。序列酶2版本是一种转基因酶,它保留了更少的外显子清除酶活性(65)。在测序反应中加入锰离子几乎消除了dNTPs和ddNTPs之间的结合效率差异,从而产生了极其均匀的条带(66)。Sequenase由美国生物化学公司(Cleveland, OH)销售。热循环和热稳定性DNA聚合酶的使用对DNA测序具有一定的优势。与使用两个引物实现指数扩增的PCR反应不同,DNA测序使用一个引物。因此,热循环导致标记测序产物的线性扩增。 This 20- to 30-fold amplification is sufficient to greatly reduce the amount of template required for each reaction. In addition, because fluorescent-detection methods are not as sensitive as radioactive detection, this linear amplification is particularly useful for fluorescent sequencing. Taq polymerase, the most commonly used enzyme for PCR, does not have significant 3' to 5' exonuclease activity. It does, however, have 5'to 3' exonuclease activity. When used for sequencing, enzymes with this activity can degrade the labeled sequencing products from the 5' end, resulting in undesirable length heterogeneity of products that retain the 3' fluorescent label. Tabor and Richardson developed two genetically modified Taq polymerases in 1995 (67). One of them, marketed under the name Amplitaq FS® by Appied Biosystems (Foster City, CA), has a single point mutation that virtually eliminates the 5' to 3' exonuclease activity. The other, marketed under the name Thermo-Sequenase® by Amersham Biosciences (Piscataway, NJ) and US Biochemicals (Cleveland, OH), contains another point mutation that greatly reduces the discrimination against ddNTPs, resulting in more even band intensities.

7.2.标记DDNTP终止片段这是技术取得巨大进步的另一个领域

桑格法Dna测序

图18所示。桑格测序化学的三种常用排列的示意图。所示为原始的桑格方法,其中标记是通过包含35S-(或33P-) dATP来完成的。反应分为四部分:G反应在二脱氧GTP存在下,A反应在ddATP存在下,以此类推。每个反应都加载到平板凝胶的一个通道上。通过干燥凝胶的放射自显影进行检测。接下来是荧光染料底漆法的原理图。在这种方法中,反应再次分为四部分进行:G反应是在未标记的ddGTP和荧光染料1标记的测序引物的存在下进行的,a反应是用染料2标记的引物进行的,以此类推。延伸反应完成后,单个反应被汇集起来,并在带有多波长荧光检测器的序列分析仪的一个lane(或一个毛细管)上运行。最后一种方法是染料终止法,这种方法是在一个单管中进行反应,同时存在所有四种ddntp, ddATP用染料1标记,ddGTP用染料2标记,以此类推。 After the extension reaction, the products are electrophoresed in a single lane (or capillary) and detected with a multiwavelength fluorescence detector.

图18所示。桑格测序化学的三种常用排列的示意图。所示为原始的桑格方法,其中标记是通过包含35S-(或33P-) dATP来完成的。反应分为四部分:G反应在二脱氧GTP存在下,A反应在ddATP存在下,以此类推。每个反应都加载到平板凝胶的一个通道上。通过干燥凝胶的放射自显影进行检测。接下来是荧光染料底漆法的原理图。在这种方法中,反应再次分为四部分进行:G反应是在未标记的ddGTP和荧光染料1标记的测序引物的存在下进行的,a反应是用染料2标记的引物进行的,以此类推。延伸反应完成后,单个反应被汇集起来,并在带有多波长荧光检测器的序列分析仪的一个lane(或一个毛细管)上运行。最后一种方法是染料终止法,这种方法是在一个单管中进行反应,同时存在所有四种ddntp, ddATP用染料1标记,ddGTP用染料2标记,以此类推。 After the extension reaction, the products are electrophoresed in a single lane (or capillary) and detected with a multiwavelength fluorescence detector.

是在标签技术领域。最初的Sanger方法使用35s标记的三磷酸脱氧核苷酸来标记ddNTP终止片段。在这种方法中,一个放射性标记的dNTP(通常是a- 35s dATP或a- 33p dATP)包含在反应混合物中。标记的dNTP不会终止生长链,而是被随机合并到生长的DNA链中。在薄聚丙烯酰胺凝胶上进行电泳后,凝胶被干燥,并暴露在大片x射线薄膜上,以可视化条带。这种方法简单,不需要昂贵的设备,至今仍被广泛应用。然而,除了明显地使用放射性外,这种方法确实有一些缺点。虽然电泳通常是在长(40-50厘米)凝胶上进行的,但每次加载时可以解析的条带数量是有一定限制的。在常规条件下,通过凝胶的距离最长的低分子量碎片的分辨率非常高,而随着分子量的增加和通过凝胶的距离的减少,分辨率降低。解决这个问题的一个方法是“双倍加载”凝胶。 In this approach, the four reaction mixtures (each terminated by ddATP, ddCTP, ddGTP, or ddTTP) are loaded in adjacent lanes and subjected to electrophoresis for 1-2 h. The electrophoresis is then paused, the samples are loaded a second time into clean wells, and the electrophoresis resumed. After the electrophoresis is continued for a sufficient time for the lowest-molecular-weight bands in the second load to reach the bottom of the gel, these fragment have migrated off the end in the lanes that were loaded first. In these lanes, the longer fragments are resolved, whereas in the lanes with less electrophoresis time, the shorter fragments are resolved. Using this approach, several hundred bases can be resolved on one gel. Other approaches involve reduction of resolution at the bottom of the gel while retaining resolution on the upper portion. An example of this strategy is the use of wedge spacers. Spacers, placed between the glass plates before casting the gel, define the shape and thickness of the gel. If the spacers are thicker at the bottom than the top of the gel, the effective voltage (in V/cm) is reduced at the bottom of the gel, leading to decreased mobility and less spacing between shorter fragments. Thus, the gels can be run longer before the smaller fragments migrate off the end, and more bases can be read. The proprietary gel formulation Long Ranger® (Cambrex Bio Science Walkersville, Inc., Walkersville, MD) yields an elec-trophoretic pattern similar to those seen with wedge spacers, but without the difficulty of pouring non-uniform-shaped gels.

ddNTP终止片段的荧光标记是测序技术的一大进步。Smith等人在1985年描述了一个系统,该系统涉及用四种不同的荧光染料标记测序引物的5'端(68,69)。测序反应在四个等分中进行,放射性测序也是如此。然而,在荧光法中,A反应是用一种荧光标记的引物进行的,C反应是用第二种荧光标记的引物进行的,以此类推。反应完成后,它们被汇集在一个聚丙烯酰胺凝胶的一条通道上,并用位于凝胶底部附近固定位置的多波长荧光探测器进行检测。自动测序诞生了。其他方法使用一种荧光染料标记引物,用四道电泳将A、C、G和T反应分开(70)。多氟方法通过减少4倍的通道数量来增加吞吐量,而单氟方法降低了仪器的复杂性。此外,还提出了不同的荧光激发和检测几何图形。Smith等人采用了一种探测格式,其中激光和探测器都安装在一个外壳中,该外壳在凝胶底部附近来回移动(69)。 Ansorge et al. used a number of fixed, single-wavelength detectors and a fixed laser that illuminated the fluors through the gel from the side (70). The four-color, one-lane, moving-detector instrument design was marketed by Applied Biosystems (Foster City, CA) as the 370, 373, and 377 series of DNA sequencers. The one-color, four-lane, fixed-detector design was marketed by Pharmacia (now Amersham Biosciences [Piscataway, NJ]) as the ALF family of sequence analyzers. Both designs have been replaced by CE-based instruments.

测序技术的下一个创新是用染料终止剂化学取代染料引物化学。这项创新消除了为每段DNA测序准备昂贵的氟标记测序引物的需要。也许更重要的是,它消除了将每个反应分成四个的需要。使用无标记测序引物的能力和在一个试管中进行整个测序反应的能力允许高效地转换到机器人工作站进行检测设置,并导致大幅降低成本。最常用的四种荧光染料是羧基荧光素(缩写为FAM)、羧基-4'、5'-二氯-2'、7'-二甲氧基荧光素(JOE)、羧基四甲基罗丹明(TAMRA)和羧基- x -罗丹明(ROX)。这些染料特别有用,因为它们的发射波长间隔均匀,这有助于区分颜色,并给出高度精确的碱基调用。然而,需要两个激光器:一个在488 nm处激发荧光素染料(FAM和JOE),另一个在543 nm处激发罗丹明染料(TAMRA和ROX)。

最近的创新是由Mathies和同事(71)引入的能量转移染料(ET染料)。荧光共振能量转移(FRET)是一种量子现象,发生在两个荧光分子(1)具有激发和发射极大值,使一个荧光分子的激发光谱与另一个荧光分子的发射光谱重叠;(2)当激发波长较低的荧光在其激发极大值处被照亮时,两个荧光分子彼此非常接近。在这种条件下,当激发波长较低的荧光分子吸收一个光子后进入激发态,而不是通过光子的发射而放松到基态时,就会发生一种非辐射的能量转移,即第一个荧光分子回到基态,第二个分子被激发,以其更高的发射波长发出荧光。FRET在分子生物学中有许多应用,是许多实时PCR技术的基础,如TaqMan、分子信标和FRET探针。作为dna测序反应的标签,它们的优势是只需要一个激光来激发。ET染料使用与单染料标记相同的FAM、JOE、TAMRA和ROX染料作为第二氟。它们已适应染料终止剂化学(72),并由应用生物系统公司(福斯特城,CA)以BigDye®的名称销售。“大染料”在信号强度、染料之间对DNA迁移没有差异影响以及检测杂合子的能力方面明显优于单一染料(73)。这些染料的使用实际上已经取代了单一染料的使用。使用ET染料终止剂化学结合循环测序(74)和CE分离是许多DNA诊断实验室选择的组合方法。 An example of sequences traces around the zidovudine (AZT)-resistance mutation at codon 215 of the human immunodeficiency virus (HIV) reverse transcriptase gene using these techniques in a 'home-brew' protocol is shown in Fig.19.

7.3.毛细管阵列电泳在许多方面优于平板凝胶电泳,这一点在本章中已经提到过。它的其他优点包括速度,一个5-600碱基的dna测序可以在大约2小时内完成,而在平板凝胶仪器上同样的分离通常需要12-16小时。然而,平板凝胶具有明显的优势,可以在一个凝胶上处理多个样品(多达96道),而CE每次只提供一个样品分析。1992年,Mathies和Huang提出了毛细管阵列电泳(CAE)的概念(75)。该系统利用了25个平行毛细血管和注射和检测系统,允许并行分析25个dna测序反应。其他人很快用不同的方法来完成CAE。据笔者所知,目前市面上有3家生产96毛细管阵列仪器的厂家。分子动力学(Sunnyvale, CA) MegaBace 1000仪器是基于Mathies组(75)的设计。应用生物系统(福斯特城,CA) 3700仪器是基于

氨基酸微卫星不稳定性

图19所示。在ABI 3100序列分析仪(Applied Biosystems, Foster City, CA)上使用ET染料-引物化学和毛细管电泳生成HIV逆转录酶基因的部分序列。所示为HIV-1逆转录酶基因序列的40个碱基片段(a)来自野生型,AZT敏感的HIV-1实验室株,(B)来自AZT治疗失败患者的突变序列。注意两个点突变导致了T215Y氨基酸的变化。(由马里兰大学医学系统Heui Ra Yoo提供。)

图19所示。在ABI 3100序列分析仪(Applied Biosystems, Foster City, CA)上使用ET染料-引物化学和毛细管电泳生成HIV逆转录酶基因的部分序列。所示为HIV-1逆转录酶基因序列的40个碱基片段(a)来自野生型,AZT敏感的HIV-1实验室株,(B)来自AZT治疗失败患者的突变序列。注意两个点突变导致了T215Y氨基酸的变化。(由马里兰大学医学系统Heui Ra Yoo提供。)

表2

三种CAE仪器的一些显著特征比较

表2

三种CAE仪器的一些显著特征比较

继续阅读:数据分析软件

这篇文章有帮助吗?

0 0