蛋白质组学大师John Yates :质谱的狂热爱好者
回顾质谱的百年发展史,得益于机械、电子和计算机行业的不断创新,质谱仪的性能也在不断提升。而真正推动质谱实现飞跃的是那些偶然的革命性创新,即具有颠覆性的技术创新——创造全新的分析规模和能力水平。蛋白质组学的大规模分析亦是革命性创新所推动实现的,John Yates III便是实现这项工作的关键科学家之一。John Yates:I was instantly hooked when I first saw a mass spectrometer. 迷恋 | 与质谱的初见作为MudPIT (Multi-dimensional Protein Identification Technology) 与SEQUEST的发明者,John Yates为蛋白质组学技术带来了突破性的进展,而他的每一份成就离不开对质谱的热爱。Yates也在某次采访中直言,在他第一眼看到质谱时,就被“迷倒了 (instantly hooked)”!MudPIT与SEQUEST的发明者——John Yates据Yates回忆,当时他还是个本科生,看到质谱仪是怎么运作的那个瞬间,他惊呼:“这好酷!”;而当看到实验室里满满当当的计算机时,他又被其强大的数据处理能力所震撼。因此,1980年获得缅因大学 (University of Maine) 动物学学士学位的Yates,选择继续在本校攻读化学专业的研究生课程。在学习过程中,为了深入探究质谱法与蛋白质组学研究的关联性,实干派Yates联系了弗吉尼亚大学(University of Virginia)的Don Hunt(弗吉尼亚大学的化学和病理学系教授)。不久后,他收到了一封手写的邀请函,并就此开展了他在弗吉尼亚大学的研究。与此同时,Yates已经看到了质谱的潜力,并希望将其应用于蛋白质组学研究中,但受限于“无法通过人工对数据进行快速解析”。因此,他带领团队在1994年开发了质谱数据的翻译器——软件工具SEQUEST。 John Yates发明SEQUEST算法释放质谱的魅力 | “翻译器”SEQUEST某种程度上而言,SEQUEST的开发是一种必然。1990年,美国能源部 (United States Department of Energy) 和美国国立卫生研究院 (National Institutes of Health, NIH) 向美国国会 (United States Congress) 提交了人类基因组测序的联合计划。自那时起,数据库开始充满了DNA序列信息,用于挖掘数据生物信息学的相关算法也大量涌现。1994年是数据依赖型采集 (data-dependent acquisition, DDA) 的诞生元年,开创性成果SEQUEST也在这一年诞生,万众瞩目。作为自下而上蛋白质组学(自下而上法:对蛋白质进行酶解处理后,得到多肽进行分析) 检索程序的开山鼻祖,SEQUEST的开创不仅奠定了蛋白质组学研究的核心基础,使更多生命科学领域中的研究人员意识并认同蛋白质组学的价值,更向全世界展示了质谱的魅力与潜力。简单来说,SEQUEST是通过利用人类基因组学的信息来解释质谱的信息(即肽和蛋白)。在研究细胞中的蛋白时,得益于这个方法,研究人员不需要对每个蛋白进行纯化,只需要对整体蛋白进行剪切,再通过质谱分析其中的每一种蛋白,便可获得全部蛋白的信息。SEQUEST分析方法可分为四步:(1)对质谱数据进行压缩;(2)通过比对蛋白质数据库 (database)与实验质谱数据在分子质量层面的信息,匹配 (compare)可能的多肽序列;(3)将从数据库中得到的序列的预测片段离子与质谱信息进行比较,从而产生最佳匹配序列表;这个序列被用于进行打分和统计学运算,进而(4)得到分析结果。SEQUEST分析步骤这套方法不仅采用了彼时最前沿的技术,如求互相关性的快速傅里叶变换(fast Fourier transform, FFT),还融入了作者在对质谱数据深入理解后的大胆假设,如对数据进行的系统归一化处理和多项经验打分权重等。SEQUEST提高了质谱技术的有效性和准确性,可以使关键性的生物和临床问题得以解决。自其开发以来,世界各地的研究人员对细胞器中的大部分蛋白质进行研究,根据正常和疾病状态中蛋白质表达差异进行“画像”,从而揭示疾病发生发展的机理。此外,这项工作也促进了蛋白质组学的大规模应用(将在下文进行介绍),他本人将其应用于确定单细胞生物体和哺乳动物细胞中蛋白质复合物成分的大规模研究中。一系列的其他软件亦在SEQUEST的影响下被开发,促进了蛋白质组在分子和细胞生物学研究中的各种应用,包括肽/蛋白的定性定量分析、翻译后修饰的鉴定、蛋白质结构动态研究等等。新战场 | 蛋白质大规模鉴定1998年,Yates提出鸟枪法蛋白质组学 (Shotgun proteomics),以推动蛋白质组的大规模鉴定分析。这个思路来源于人类基因组草图的制作方之一——塞莱拉基因组公司 (Celera Genomics)。他们采用了彼时非常先进的基因测序技术:鸟枪法 (Shotgun)。这种方法跳过将基因组拆分、克隆的过程,直接将其打成小片段进行随机测序,就像拼图一样:我们把一块完整的拼图买回家,彻底打乱后,再开启游戏之旅。2001年,基于鸟枪法蛋白质组学的想法,John Yates团队开发了MudPIT技术,并将其成果发表于 Nature Biotechnology,文章题目为Large-scale analysis of the yeast proteome by multidimensional protein identification technology。实现将鸟枪法应用于蛋白质组学是一件里程碑式的发展成就,其不仅颠覆了传统的蛋白质分析方法,还推动实现大规模分析。Yates带领团队开发MudPIT彼时应用最为广泛的蛋白质分析鉴定方法是二维聚丙烯酰胺凝胶电泳 (Two-dimensional gel electrophoresis, 2D-PAGE),该技术是通过等电点(isoelectric point, pI) 和分子量 (molecular weight, MW) 两个维度,对蛋白质进行鉴定,拥有高分辨率的特点。然而,2D-PAGE存在着一些难以克服的缺陷:(1)虽然该技术可以提供蛋白质的相对分子质量、等电点、表达丰度的相对量等信息,但它无法完成一些更为“精细”的任务,如低丰度蛋白质点的检测,极酸性和极碱性区蛋白质及高分子质量区蛋白质的分离等;另一方面,(2)这项技术自动化程度低,重复性差且耗时长;除此以外,(3)鉴定量和通量一直是这项技术的瓶颈。反观MudPIT,这是一种非凝胶技术,可以实现复杂蛋白质和多肽混合物中某一成分的分离与鉴定工作。首先,肽段先在二维液相色谱中被分离,然后再进入多维毛细管液相色谱中分离、而后进行串联质谱分析以及最后的数据库检索工作。该技术可对样品量较少的蛋白质进行快速分析,适用于蛋白质组学中大规模蛋白质的分离鉴定研究。Yates的文章将MudPIT较之2D-PAGE技术的优势全盘展示。他们完成了彼时鉴定量最大的蛋白质鉴定研究:从酿酒酵母 (S. cerevisiae) 的蛋白质组中分离鉴定了1484个蛋白质;作为对比,当时最大的基于2D-PAGE的蛋白质组学研究,仅鉴定出了流感嗜血杆菌 (Haemophilus influenza) 蛋白质组的502个蛋白质。总体来看,MudPIT的灵敏度和动态监测范围都有了更大的进步,且应用范围更广、自动化程度高。因此,MudPIT也成为了二十世的最初的十年里,研究复杂生物样本中大规模蛋白质表达、定性和定量的强有力工具。制胜密码 | 创新与协作John Yates:I’ve become very intrigued with the concept of innovation.科研进展十分依赖于研究人员的高强度攻坚,及不断创新。他们需要不停地“刁难”自己、“刁难”别人,保持新方向、新想法的敏感度。Yates也一直非常希望更多的科学家可以在他的方法上继续创新。为了帮助各位科学家早日创新、淘汰自己的方法,Yates分享了自己的“创新书单”,希望大家一起从书中学习创新路径并得到启发,如Jon Gertner的 The Idea Factory(这是一部关于传奇科研机构——贝尔实验室的传记,其中共孕育了9位诺贝尔奖得主),以及Steven Johnson的 Where Good Ideas Come from(在这本书中,作者深入发明的创新自然史,对其进行跨越学科、领域的追踪,确定了创新的七种关键模式)。Yates也回忆道,在2003年与一家质谱制造商讨论合作时,他的第一个问题是“扫描速度可以更快吗?”也正是这个问题使得我们迎来了现在的升级版质谱仪。此外,当新设备准备落地时,Yates还会不断提出新的想法,与合作方商讨,寻找更优解。除创新以外,Yates还十分主张团队协作性,并先后培养出来70多位优秀的科学家。其中一位曾在Yates实验室进行博士后工作的研究员Michael Washburn(目前是美国堪萨斯大学医学中心肿瘤生物学教授)称,Yates使他深刻认识到建立一个多学科团队的必要性。因为质谱研究不是一场单机游戏,它极度需要跨学科的方法论,复合型人才的相互教导,才能解决研究瓶颈取得成果。因此,在当年与Yates一起开发出MudPIT后,Washburn在蛋白质组学研究领域继续开疆拓土,并以基于质谱来研究染色质重塑复合物而闻名。Michael Washburn成就、扎根 | 年轻的蛋白质组学SEQUEST 与 MudPIT 的开发,及其他杰出的科研成果奠定了Yates在蛋白质组学领域的泰斗地位,他也毫不意外地入选了 2011年 “2000-2010年全球顶尖一百位化学家”名单。John Yates入选2011年 “2000-2010年全球顶尖一百位化学家”名单此外,他于2019年获得ASMS质谱杰出贡献奖及 Khwarizmi 国际奖,以表彰他对蛋白质组学的贡献。蛋白质组学诞生(1997年)至今才二十余年。得益于全球科学家和HUPO的不懈努力,这个年轻的前沿学科已获得许多令人振奋、惊叹的里程碑式成果。未来,我们亦期待、欢迎有更多的年轻研究人员参与进来,一同以蛋白质组学为支点,揭示生命的奥秘,开创疾病治疗的新篇章。年轻科研力量的崛起是科技创新、发展的重要引擎。2015年,HUPO特设Early Career Researchers (ECRs)项目,以推动年轻科研人员对新知识、新思想和前沿科技创新的引领作用。具体而言,该项目的主旨为:(1)为ECR提供更多研究和交流平台,提高他们的科学知名度:HUPO设立稿件竞赛 (Manuscript Competition),以便让杰出的年轻科学们展示自己最新工作成果;(2)为ECR策划职业发展相关活动,提高他们在学术界、工业界的竞争力:HUPO邀请来自不同科研、技术和商业领域的世界知名科学家,分享他们的科研经历与职业生涯;(3)提高蛋白质组学领域的公平性、多样性和包容性。参考资料1. Washburn, M. P., Wolters, D., & Yates, J. R. (2001). Large-scale analysis of the yeast proteome by multidimensional protein identification technology. Nature biotechnology, 19(3), 242-247.2. Proteomics goes global. Nature biotechnology, 24, 302–303 (2006). https://doi.org/10.1038/nbt0306-3023. Eng, K. J., McCormack, A. L., & Yates, J. R. (1994). An approach to correlate tandem mass spectral data of peptides with amino acid sequences in a protein database. Journal of the American Society Mass Spectrometry, 5(11), 976–989.4. Yates, J. R. (2013). The revolution and evolution of shotgun proteomics for large-scale proteome analysis. Journal of the American Chemical Society, 135(5), 1629-1640.5. Vivien, M. (2013). Digging deep into proteomes. Nature Method, 10(1), 3.6. MICHGAN STATE UNIVERSITY. (n.d). Dr. Michael Washburn. Retrieved from https://bmb.natsci.msu.edu/about/awards/john-a-boezi-memorial-alumnus-award/dr-michael-washburn/7. Scripps Research. (2019). Chemist John Yates receives 2019 ASMS John B. Fenn Award for innovations that advanced mass spectrometry. Retrieved from https://www.scripps.edu/news-and-events/press-room/2019/20190614-yates-amsmaward.html