测序技术简史(一)| 从发现双螺旋开始
p 对很多人来说,基因测序仪都是一个很陌生的名词。然而,如果你感受过独步世界的中国高铁技术,见证过中国发射的量子卫星,还听说过独占世界超算排行榜长达五年的中国超级计算机,那么处于全球领先地位的中国基因测序仪也绝对值得一探究竟。 /p p 人们常说,19世纪是蒸汽机的世纪,20世纪是汽车和计算机的世纪,而21世纪则是生命科学的世纪。生命科学研究将在医疗健康、体育运动、农业养殖、司法刑侦、太空探索等众多方面广泛而深远地改造人类生活。作为生命科学研究最核心的基础性工具,基因测序仪已经成为当前中美全面科技竞争的重要领域。 /p p strong span style=" color: rgb(255, 0, 0) " 什么是基因测序 /span /strong /p p 基因测序技术是基因组学研究的核心技术,是现代生命科学研究中最广泛应用的重要技术。你可能还不知道,地球上几乎所有你能看见和看不见的生命形式都是由基因编码而成的。塞满商场的人类、卖萌为生的熊猫,爬过阳台的甲虫、各类叫不上名字的树木花草以及数万亿和我们亲密接触的细菌、微生物,都是由DNA编码的生命体。 /p p style=" text-align: center" img style=" max-width:100% max-height:100% " src=" https://img1.17img.cn/17img/images/201908/uepic/a458d63e-538a-4d26-b3cd-50c2933870ba.jpg" title=" 1.jpg" alt=" 1.jpg" / /p p 每一个生命都像是执行一段代码的程序,而DNA正是生命的源代码。相应地,破解生命源代码的技术,就是DNA测序。 /p p strong span style=" color: rgb(255, 0, 0) " 发现双螺旋——让测序成为可能 /span /strong /p p 如果说测序技术的进步是发掘矿藏的过程,那么还需要先行者告诉我们矿藏的方向和位置。完成这项任务的,正是科学界的两位顶尖人物——沃森和克里克。 /p p style=" text-align: center" img style=" max-width:100% max-height:100% " src=" https://img1.17img.cn/17img/images/201908/uepic/d812d00c-25b0-471a-91bf-31490093244a.jpg" title=" 2.jpg" alt=" 2.jpg" / /p p style=" text-align: center " span style=" font-family: 楷体, 楷体_GB2312, SimKai " 双螺旋结构的发现者James Watson和Francis Crick /span /p p 1953年,沃森和克里克发现了DNA双分子螺旋结构,人类对生命的认识有了重大的突破,即:“生命是序列的,生命是数据的。”生命体的全基因组包含了其全部遗传信息,这些信息是A-T、C-G四种碱基两两配对后排列成的长链。这些碱基的排列信息可以被读取出来,以1010001的二进制形式存储在计算机中 可见,生命的密码是一组可以被数据化的碱基排布序列。因此,测定DNA序列就成为解读遗传信息的先决条件和整个生命科学研究的重要基础。 /p p 可以说,正是DNA双螺旋结构的发现,带动了DNA测序技术的大发展,开启了人类历史上方向明确而历时长久、道路曲折、投入巨大、进展惊人的探索。 /p p strong span style=" color: rgb(255, 0, 0) " 测序技术发展的四个阶段 /span /strong /p p DNA双螺旋的发现,让破解生命源代码的DNA测序在原理上成为可能,现在我们就来回顾测序技术的具体发展,其主要经历了四个阶段。因篇幅所限,这篇文章将为你展示前两个阶段。 /p p strong 阶段1:从“前直读”到“直读” /strong /p p 1964年,即DNA螺旋被发现11年后,康奈尔大学的研究者第一次分析了酵母的核苷酸序列。这次研究标志着一个新时代的开始。不过,正如承载生命信息的大分子经历了从RNA到DNA的历程,最开始的测序方法是用来测定RNA序列的,实验用不同的RNA酶对RNA模板进行“消化”(digestion),并根据反应后产物中可能重叠的序列间接推导可能的完整序列。这种测序技术流程繁琐,推导复杂,很难重复,验证还更为困难。不仅如此,在试图测定双链且更加稳定的DNA时,这种方法没能获得成功。 /p p style=" text-align: center" img style=" max-width: 100% max-height: 100% width: 600px height: 305px " src=" https://img1.17img.cn/17img/images/201908/uepic/f6459ef0-726f-4dab-805d-2c1b3ea314e1.jpg" title=" 3.jpg" alt=" 3.jpg" width=" 600" height=" 305" border=" 0" vspace=" 0" / /p p style=" text-align: center " span style=" font-family: 楷体, 楷体_GB2312, SimKai " 直读法示例 /span /p p 在技术的发展史上,新技术的出现就像制作一个木桶,每一块木板都代表一种必须具备的基础条件,任意一块板的缺失都不构成一个木桶,同时,木板之间还需要彼此适应和融合。直接读取DNA序列的测序技术(即“直读法”),正是这样一个木桶。它是在分子克隆技术、凝胶电泳技术、放射自显影三种技术全部成熟之后才出现的。在这三种技术的基础之上,直接读取DNA序列的SBC和SBS测序法问世。“直读法”的最大突破在于不再需要间接推导,而是可以直接在凝胶上按顺序直观读出测序模板,判断DNA分子每个碱基位置上为T-C还是A-G。 /p p SBC与SBS这两种方法在原理上相似,但具体操作有诸多不同。SBC法使用化学试剂,有较强的毒性,且技术复杂较难掌握,成功率不高。相比之下,SBS法使用酶试剂,具有操作简便、结果稳定、准确性高且重复性好等特点。更有意思的是,运用SBS法的设备相对简单,可以实验室自制或采用通用设备,还有使用方便的标准化试剂盒,因此很快风靡全球相关实验室。SBS法由英国科学家桑格(Frederick Sanger)于1975年率先发明,因此也被称为Sanger法。这种直读法的发明也为DNA测序的数字化和自动化奠定了基础 /p p style=" text-align: center" img style=" max-width:100% max-height:100% " src=" https://img1.17img.cn/17img/images/201908/uepic/dc28748a-368f-4144-8805-8b14db973ec8.jpg" title=" 4.jpg" alt=" 4.jpg" / /p p style=" text-align: center " span style=" font-family: 楷体, 楷体_GB2312, SimKai " Sanger电泳法跑胶结果示例图 /span br/ /p p strong 阶段2:从手工到自动化 /strong /p p 上世纪80年代以前,分子生物学这门学科一直都被戏称为“现代技术、手工操作”,直到DNA测序技术出现,分子生物学才有了第一种实现自动化和信息化的技术。此后测序技术在几十年发展历程中不断吸收其他领域新技术(如物理领域的纳米技术及激光技术、化学领域的荧光标记核苷酸技术、生化领域的毛细管电泳分析、信息领域高密度芯片等技术)并将它们融为一体的成果,形成了现代科学研究技术中的强力工具。 /p p 1986年,加州理工学院的胡德(Leroy Hood)发明了以四种荧光物质标记测序反应产物的“四色荧光法”,这些荧光物质在不同波长的激光下呈现不同颜色。这项技术成为广受欢迎的SBS测序法(Sanger测序法)走向自动化的关键突破。 /p p style=" text-align: center" img style=" max-width:100% max-height:100% " src=" https://img1.17img.cn/17img/images/201908/uepic/c56d19b1-381e-4039-89b4-c54f701e45ec.jpg" title=" 5.jpg" alt=" 5.jpg" / /p p style=" text-align: center " span style=" font-family: 楷体, 楷体_GB2312, SimKai " 四色荧光法原理示意图和自动测序仪的四色荧光“峰图” /span br/ /p p 这种方法将测序效率提高了数倍,读长达到500nt(nt:nucleotide 核苷酸,是衡量单链核酸的长度单位),分辨率大为提高 而且,这是测序技术发展史上首次真正彻底抛弃了放射性物质的使用。测序效率也称为“通量“,是指单台设备一次反应所获取的序列数据量。 /p p 另外,还有一个与通量同样重要的概念——“读长”:测序仪的测序原理是将目标DNA大量复制,然后用酶将这些DNA长链切断,并分别对每一小段测序,最后将这些片段拼接还原成完整的长链。读长就是指测序仪能读出的每一个DNA片段的长度。这两个概念很重要,后面还会经常提到。 /p p 据此,美国ABI公司在1986年推出了第一台商品化的平板电泳全自动测序仪——ABI 370A。此后,该公司又推出了多种改进型,在读长、通量、准确性方面都有很大提高,这种自动化测序仪成为划时代的国际“人类基因组计划(HGP)”得以启动的重要技术依据。 /p p 尽管这一代测序仪为“人类基因组计划”做出了突出贡献,但只实现了测序过程的自动化,在自动测序之前的细菌克隆、手工制胶、手工加样等操作都需要消耗大量的人力。一组数据可以说明问题:在“人类基因组计划”冲刺阶段,华大在6个月的时间里完成了50万次成功的测序反应,共消耗了1500万个形状大小与医用“针头”类似的移液器吸头。 /p p span style=" color: rgb(0, 0, 0) " 未完待续,详见下期: /span strong span style=" color: rgb(255, 0, 0) " 爆发式的进步 /span /strong /p p span style=" color: rgb(255, 0, 0) " strong 小贴士 /strong /span /p p strong 1.人类基因组计划(Human Genome Project, HGP) /strong /p p 人类基因组计划是一项规模宏大,跨国跨学科的科学探索工程。其宗旨在于测定组成人类染色体(指单倍体)中所包含的30亿个碱基对组成的核苷酸序列,从而绘制人类基因组图谱,并且辨识其载有的基因及其序列,达到破译人类遗传信息的最终目的。基因组计划是人类为了探索自身的奥秘所迈出的重要一步,是继曼哈顿计划和阿波罗登月计划之后,人类科学史上的又一个伟大工程。 /p p 这一计划于1990年正式启动。美国、英国、法国、德国、日本和我国科学家共同参与了这一预算达30亿美元的人类基因组计划。2001年,人类基因组工作草图发表。2003年4月14日,六国首脑共同宣布人类基因组测序胜利完成。 /p p strong 2.测序效率与读长 /strong /p p 测序效率也称为“通量”,是指单台设备一次反应所获取的序列数据量。测序仪的测序原理是将目标DNA大量复制,然后用酶将这些DNA长链切断,分别对每一小段测序,最后根据片段首尾重合的部分,拼接还原成完整的长链。读长就是指测序仪能读出的每一个DNA片段的长度。 /p p strong 3.SBC与SBS /strong /p p 这两种方法的原理相似,但具体操作有诸多不同。SBC法使用化学试剂,有较强的毒性,且技术复杂较难掌握,成功率不高。相比之下,SBS法使用酶试剂,具有操作简便、结果稳定、准确性高且重复性好等特点。且运用SBS法的设备相对简单,可以实验室自制或采用通用设备,还有使用方便的标准化试剂盒,因此很快风靡全球相关实验室。 /p