推荐厂家
暂无
暂无
质谱与蛋白质组学蛋白质组学对一个细胞或组织所表达的蛋白质进行的系统分析,而质谱是它的关键性分析工具。在过去的两年中,标准蛋白质组技术中的进展增进了更高水平自动化和敏感性的蛋白质识别技术。另外,新的技术促成了鉴定蛋白质功能相关特性的里程碑性的进展,包括它们的定量和在蛋白质复合物中复杂情况。缩写2DE two-dimensional gel electrophoresis双向凝胶电泳CID collision-induced dissociation碰撞诱导的解离ESI electrospray ionization电喷雾离子化FT-ICR Fourier-transform ion cyclotron resonance傅里叶-变换离子回旋加速器共振ICAT isotope-coded affinity tagsIEF isoelectric focusing等电聚焦MALDI matrix-assisted laser desorption ionization基质辅助的激光解析离子化Q-TOF quadrupole-TOFRP reversed phase反向TOF time-of-flight飞行时间简介蛋白质组学的核心组成是系统识别一个细胞或组织中表达的每一个蛋白质,以及确定每个蛋白质的突出特征(比如,丰度、修饰状态以及在多蛋白质复合体中的复杂状态)。这些分析的技术包括分离蛋白质和肽的分离科学、识别和定量分析物的分析科学和数据管理和分析的生物信息学。它的初步工具包括使用IEF(等电点聚焦)/SDS-PAGE凝胶的高分辨率的双向凝胶电泳(2DE),结合质谱和数据库搜索来分离、识别和定量在一个复合样本中存在的个体蛋白质,最终识别被分离的蛋白质。一个常用的方法用在Fig1中用图解说明。此技术以及由此而来的变化(综述见[1])已经被用来识别和分类在复杂样本中存在的大量蛋白质,并在蛋白质组数据库中呈现它们,该过程我们这里称之为"描述蛋白质组学"比如,Shevchenko等[2]从2D凝胶上系统地鉴定了150个蛋白质。数目庞大的这样的数据库现在可以找到。同样的技术现在已经被作为普遍的发现工具来动态检测一个细胞或组织对外来或内部干扰反应而在蛋白质组中的改变。因为检测动态改变需要精确定量每个被检测成分,我们使用"定量蛋白质组学"来定义。在此报告中,我们总结了自1999年1月至2000年4月来报道的与蛋白质组学和质谱相关的最重要的进展。在核心质谱技术中的进展已经导致2DE为基础的蛋白质组学技术的进一步改进。它们同时又促进了传统凝胶为基础的方法的替代方法,诸如引入以同位素稀释理论为基础的精确蛋白质定量技术和蛋白质复合物的系统分析。蛋白质组分析的MS技术进展在此部分,我们总结了在MS设备、它们的控制和操作中的进展,以及比较质谱数据和序列数据库识别蛋白质所用的搜索工具的进展。随着新型质谱仪的引入,蛋白质组学研究现存类型的质谱仪性能已经显著改进了。在此综述期间最普遍使用的仪器是可以分为两类:单一阶段的质谱仪和串联质谱为基础的系统。单一阶段的质谱仪,最显著的是基质辅助的激光解吸电离(MALDI)飞行时间(TOF)仪器,被用于无数通过肽质谱图谱技术大规模蛋白质识别的项目中。此方法在鉴别表达自小一些的和完全测序的基因组的蛋白质特别成功[3,4]。串联质谱仪器诸如triple quadrpole、离子捕获(ion-trap)和近来引进的混合quadrupole飞行时间(Q-TOF)被常规应用于[url=https://insevent.instrument.com.cn/t/Yp][color=#3333ff]LC-MS[/color][/url]/MS或用电喷雾电离(ESI)来生成肽片段离子谱,以便通过搜寻序列数据库进行蛋白质鉴定。使用仪器控制程序来自动选择肽离子进行碰撞诱导的解离(CID)(数据依赖CID)的不断增多是这些MS/MS仪器的一个明显的趋势。一些新的构造的具有高潜能的质谱仪被引入到蛋白质组学研究中产生深刻影响。两个研究组近来一个MALDI离子源和一个混合Q-TOF耦联了起来[5,6]。Q-TOF提供的质量准确性和敏感性提升了数据库搜寻结果并同时使它成为MS/MS从头测序的当然仪器选择。MALDI Q-TOF构造提供了激动人心的机会进行自动化和高通量应用以及在一个样品盘上存档样品进行日后研究的可能。Medzihradszky等[7]描述了一个不同的混合仪器称之为MALDI TOF TOF。此设备享有许多MALDI Q-TOF的优点,另外能够进行高能量CID和非常快速的扫描速率。傅里叶-变换离子回旋加速器共振(FT-ICR)质谱对于蛋白质组学来说相对陌生。这些设备具有非常高的敏感性和分辨率,质量精确性可以达到1ppm。这些特征被用来在一次分析中测量和定量几百种蛋白质的完整的分子质量[8]。Goodlett等[9]表明FT-MS测量的一个肽的准确质量以及可以容易获得的限制因素能够通过序列数据库搜索被用来识别蛋白质。蛋白质组学如果没有软件工具来进行质谱数据和序列数据库的关联将变得几无可能。现存的数据库搜索程序已经变得越来越成熟和可以(从网络)可获得。另外,引入了新的算法。主要相关程序是Sequest[10],MASCOT[11],PeptedeSearch[12],PROWL[13]和Protein Prospector[14]。在它们中间,Sequest使用CID谱设置了蛋白质识别的实验室标准(benchmark),因为它与边界MS/MS数据工作得最好,并高度可信,可以从整个[url=https://insevent.instrument.com.cn/t/Yp][color=#3333ff]LC-MS[/color][/url]/MS实验中自动分析数据,并不需要任何使用者的破译工作。在所提的程序中,然而,只有Sequest不能在网络上搜索。MASCOT是一个新的、快速、网络可进入和多功能的程序,具有进行肽指纹分析、用部分破译或未破译的CID谱进行数据库搜索的功能。
2003年人类基因组精细图绘制完成,是人类科学史上一个里程碑式的事件。后基因组时代的研究重点自然落在了蛋白质头上。为啥?因为中心法则告诉我们,基因的产物——蛋白质,是生命活动的最终执行者。与基因组类比,研究生物体内全套蛋白质的科学,就是蛋白质组学。基因组计划完成的同年,人类蛋白质组计划启动,令人激动的是,2014年人类蛋白质组的草图也完成了。而蛋白质组学能够飞速发展的最大功臣非质谱莫属。质谱的应用范围非常广泛,但这里只讨论蛋白质组学中的质谱。简单地说,质谱法(mass spectrometry)就是对肽段离子的重量(质荷比,m/z)进行测量的分析方法。样品经质谱仪(mass spectrometer)检测得到质谱图(mass spectrum),通过对质谱图的分析就可以对样品中的蛋白进行鉴定、定量。亲,图1的这种典型的蛋白质组学流程都很熟悉吧。蛋白首先都要被特异性的酶(通常为Trypsin)切割为肽段,再进行后续分析,这在蛋白质组学中被称为“自下而上”的研究策略(Bottom-up proteomics)。我们平时见到的质谱分析基本都是这种类型。提到蛋白质组,即会联想到一系列高大上的名词,iTRAQ、SWATH、SILAC、Shotgun、Label-free等等。很多概念容易弄混淆,下面我们就来理理清楚。图1. 典型的蛋白质组学流程大体上,质谱研究蛋白主要是鉴定和定量。通过二级质谱图(MS2或者MS/MS)进行数据库搜索匹配鉴定蛋白。通过各种标记或非标记的手段对不同样品中的蛋白进行比较就是定量。蛋白定量比较是质谱最重要的用途,图2是对定量方法的一个简单总结。非标定量(Label-free)不需要标记,不同样品分别处理、分别进质谱检测;优点是处理简单、无需标记、价格便宜、可以比较很多组样品,缺点是对操作步骤、LC、质谱稳定性要求严格。SILAC是在细胞培养基中加入稳定同位素标记的氨基酸,在代谢水平标记蛋白,一级质谱图进行定量,可以做到三组样品混合后进行比较,定量准确,但是不能标记组织样本,养细胞成本也较贵。双甲基化标记是通过化学反应的办法在肽段水平进行标记,一级质谱定量,也可以三组对比,标记试剂都比较便宜,而且可以标记任何来源的样品。iTRAQ和TMT是商品化的试剂盒,肽段水平标记,二级质谱定量;分别可以做到最多8组和10组样品间蛋白质组的比较。图2. 质谱定量方法以上这几个是一家的,还有几个名词是属于另外一家,比如Shotgun (DDA)、SWATH/DIA、SRM (MRM)、MRMHR/PRM。质谱进行数据采集的方式大致分为三种:鸟枪法(Shotgun)、选择反应监控(SRM)和全景式的SWATH/DIA。下面对照图3再来简单介绍一下。图3. 质谱扫描方式DDA、IDA、Shotgun和鸟枪法说的是相同的东西,意思是质谱在每个循环的中从一级里挑选丰度高的TopN个肽段去打碎做二级扫描,得到的结果通过与已知数据库中的理论蛋白进行匹配。DDA简单有效,分析流程比较成熟,也是目前质谱分析的主流方式。DDA也有其固有的缺陷,即具有一定的随机性,偏向于检测丰度较高的肽段,而抑制了低丰度肽段的检测。靶向策略被称为质谱领域的Western blot。质谱只去采集目标肽段大小的离子信息,因而提高了灵敏度和特异性。这种方法用来研究感兴趣的特定蛋白,定量准确,但是通量很有限。SWATH/DIA这种全景式的数据采集方式在最近几年突然火了起来,被认为在不远的未来可能会取代DDA的主流位置。该方法采取的策略是将扫描范围内的所有肽段按照质荷比分为若干个窗口,再对每个窗口里所有的肽段一起打碎,采二级,数据分析时通过抽提蛋白的子离子信息进行定量。SWATH/DIA解决了DDA中随机性选择肽段的缺陷,所以重复性更好,定量的准确性基本达到了SRM的水平,而且可以实现大规模定量。借用听来的一个比喻来说明:DDA就像机关枪扫射,数量多、体积大的目标命中的概率要大一些。靶向扫描(SRM或PRM)就像精准狙击,排除干扰,目标明确,每一枪直指目标,但是难以大规模消灭敌人。SWATH/DIA就是地毯式轰炸,只要暴露在我方攻击范围内的敌人,不管三七二十一,全部炸完。图4. 定量方法与采集方式结合如果将上述的定量方法(图2)和质谱数据采集方式(图3)结合起来,就得到了现在基于质谱的蛋白质组学研究的各种策略(图4)。再打个比方,保证吃货们一听就懂:鸡、鱼、肉、蛋、蔬菜要通过炒锅、烤箱、高压锅、微波炉等烹调之后才能变为美食,填饱肚子。同样的,各种定量方法(非标的和标记的)处理的样品,要通过质谱各种采集方式变为电脑中的数据,才能分析并从中得到蛋白的信息。本次的介绍就先到这里了,如果其中有什么问题,欢迎您批评和建议,我们会努力变得更好;如果需要跟我们进行技术交流和讨论,欢迎大家联系武汉金开瑞。后续我们还会继续推出对质谱技术各方面进行解析的文章,敬请期待。ReferencesA draft map of the human proteome. Nature 509: 575–581 (2014)Mass-spectrometry-based draft of the human proteome. Nature 509: 582–587 (2014)A review: Annu. Rev. Biochem. 80: 273–99 (2011)SILAC: Molecular & Cellular Proteomics 1: 376-386 (2002)iTRAQ: Molecular & Cellular Proteomics 343: 91–99 (2010)SRM: Nature Methods 9: 555–566 (2012)SWATH: Molecular & Cellular Proteomics 11: 1–17 (2012)
20世纪基因组学研究取得的巨大成就为蛋白质组学的发展奠定了基础。蛋白质组学是从整体水平上分析生命体、组织或细胞的蛋白质组成及其活动规律的科学,以基因表达产物为研究对象,延伸了基因组学研究深度,更深层次地揭示了生命活动规律。蛋白质组学的研究内容主要包括蛋白质表达存在方式(修饰形式)的鉴定、结构与功能分析、蛋白质定位、蛋白质差异表达以及蛋白质间相互作用分析等[1]。目前蛋白质组学研究技术主要包括:二维电泳技术、蛋白质芯片技术、质谱技术等[2]。其中,二维电泳技术是早期蛋白质组学的重要技术之一,但是由于实验步骤多,耗时长,重复性差等特点,已经逐步被新型技术所取代。蛋白质芯片技术是将多种蛋白质纯品点于芯片表面,形成蛋白质矩阵进行免疫等标记反应,主要受限于很多蛋白质无法获得纯品而不能用于芯片制备。质谱技术由于灵敏度高、特异性强、分析范围宽等优点逐渐成为蛋白质组学的主要研究手段,可以对特定生命过程中的功能性蛋白质分子进行定性和定量检测,因此在基础科研和临床研究中得到了广泛的应用[3,4]。一、基于质谱的蛋白质组学技术1.基于质谱的蛋白质组学定性技术:蛋白质定性鉴定的基本原理在于:蛋白质组的基本序列已经通过基因组学信息获得,可以用来鉴定多肽的氨基酸序列,并且获得多肽与蛋白质的对应关系[1],即质谱提供的多肽碎片数据可以与蛋白质数据库自动匹配来确定多肽序列与蛋白质归属。基本技术策略分为:(1)自上而下(Top–down)策略[5],即完整蛋白质在质谱中进行分析,可以提供完整蛋白质的质量数,但是由于质谱仪受到质量分析范围的限制,此方法在常规实验室不易实现。(2)自下而上(Bottom–up)策略[6],即蛋白质被蛋白酶水解成多肽,然后对多肽进行质谱分析和碎裂。基于这条策略的大致步骤为:蛋白质样品首先经过酶解降解为多肽,然后对多肽进行色谱–质谱分离与鉴定,最后通过搜索引擎(MASCOT:http://www.matrixscience.com/server.html, SEQUEST:http://fields.scripps.edu/sequest等)在公共蛋白质组学数据库(SWISS–PORT: http://web.expasy.org/groups/swissprot, NCBI:http://www.ncbi.nlm.nih.gov/pubmed等)中自动完成质谱数据的解析,确定多肽序列与蛋白质种类。该技术灵敏度高,特异性好,仪器自动化程度高,可以鉴定出生物样品中成千上万种蛋白质,被认为是大规模、高通量蛋白质定性检测的首选方法。2.基于质谱的蛋白质组学相对定量技术:对于大多数生命科学和医学研究来说,仅完成样品中蛋白质组的定性研究是远远不够的,还需要对蛋白质组进行定量分析。由于组学的研究对象是多个蛋白质,单次检测很难实现所有蛋白质的绝对定量,因此蛋白质组学定量多为相对定量检测。蛋白质组学定量的质谱技术包括谱图计数、质谱峰强度定量、同位素定量技术等。其中使用同位素作为内标定量的方法是目前质谱定量的最佳手段,即对整体蛋白质组进行同位素标记,并使用每一种天然蛋白质与同位素蛋白质的比值进行相对定量分析。主要分为细胞层面标记和蛋白质层面标记两种技术路线:(1)细胞层面标记的细胞培养氨基酸稳定同位素标记(stable isotope labeling with amino acids in cell culture,SILAC)方法[7]:即在两种细胞样品中分别加入轻重同位素标记的培养基,经过传代培养后,两种细胞样品中的全部蛋白质中分别嵌合了轻重同位素,可以在质谱上根据同位素的不同质荷比直接判断样品来源并进行定量比对。(2)蛋白质层面标记:使用含有同位素的小分子与样品全部蛋白质直接标记,如同位素标记相对和绝对定量技术(isobaric tags for relative and absolute quantification,iTRAQ)[8]、同位素编码亲和标记(isotope–coded affinity tag,iCAT) [9]、18O标记[10]等方法,此类方法使用带有稳定同位素的小分子与特定氨基酸侧链反应,使得多个样品可以分别连接含有不同同位素个数(多至8个)的小分子,从而产生一级数据相同但是二级数据不同的质谱谱图,通过二级谱图强度比对进行多个样品的定量分析。3.基于质谱的目标蛋白质绝对定量技术:质谱技术对目标蛋白质的绝对定量检测主要通过质谱多反应监控技术与同位素多肽内标技术联用来实现[11]。该方法首先选定目标蛋白质的一个或多个多肽,合成序列相同但含有稳定同位素的多肽作为内标,定量加入样品中,通过监测特定多肽及其同位素多肽的质谱峰强度进行比对和计算获得目标蛋白质的定量值。质谱多反应监控技术通过进行母离子筛选与子离子筛选等二次选择过程,筛选出目标蛋白质,而非目标蛋白质由于无法通过筛选达到检测器,极大降低了噪音干扰。因此,此方法针对性强,本底噪音低,是目前质谱技术中定量能力最好的一种,可以控制变异系数小于15%,检测限低至纳克每毫升,适合血液、组织等临床样品的定量检测[11]。二、质谱技术发现肿瘤蛋白质标志物质谱技术作为一项强有力的研究工具在科学研究中发挥着巨大的作用,特别在肿瘤相关研究中,目前已经获得美国食品药品监督管理局(Food and Drug Administration,FDA)批准的肿瘤标志物包括多种蛋白质前列腺特异性抗原(prostate–specific antigen, PSA), 癌胚抗原(carcinoembryonic antigen CEA), 人类表皮生长因子受体2(human epidermal growth factor receptor 2,Her–2), 人绒毛膜促性腺激素(human chorionic gonadotropin, HCG), 糖类抗原CA125等,均揭示了蛋白质与肿瘤发生发展密切相关。这些已有成果极大促进了质谱技术在肿瘤蛋白质标志物研究中的应用,并取得了标志性进展。例如:美国约翰霍普金斯大学的Chan课题组发现了新型卵巢癌蛋白质标志物,他们使用表面增强激光解析电离质谱技术(surface enhanced laser desorption and ionization time–of–flight mass spectrometry, SELDI–TOF MS)技术对503个妇女的血清进行了蛋白质组学的分析[12],在随后的大量临床验证中最终确定CA125、β2微球蛋白,转铁蛋白,甲状腺运载蛋白和载脂蛋白A1的联合检测可以作为卵巢癌的新型临床诊断指标。2009年9月该试剂盒OVA1(商品名称:http://ova–1.com)获得了美国FDA的认证,进入临床使用,被认为是国际肿瘤蛋白质标志物研究的重要标志性成果。同时,肿瘤仍然是国际上致死率最高的疾病之一,缺乏早期检测技术和有效治疗方案,临床中还存在着大量问题需要解决,新型标志物的研发迫在眉睫。由于肿瘤蛋白质标志物研究的难度大,风险高,因此近十年来仅有几例试剂盒获得了美国FDA批准,进入临床使用。大量标志物研究还停留在论文研究水平,其中临床问题、研究思路和技术方案的选择直接关系到研究的成功与否。1.临床问题选择:在肿瘤蛋白质标志物研究中,临床问题的选择是研究核心。在肿瘤研究中,需要解决的临床问题往往包括肿瘤早期检测、肿瘤分期检测、治疗方案与药物选择、疗效评估等多个方面。研究者需要根据不同肿瘤的临床情况,具体分析并凝练不同肿瘤的主要临床问题。例如,对于病程发展快、五年存活率低、没有有效手术或化疗手段的肿瘤,早期诊断是研究重点,如胰腺癌、卵巢癌、肺癌等;对于病程发展慢、手术效果明显的肿瘤,肿瘤的愈后与复发是需要关注的问题,如前列腺癌、肠癌等;还有一些肿瘤有特殊的检测需求,如乳腺癌虽然有临床有效的雌激素受体(estrogen receptor,ER),孕激素受体(progesterone receptor,PR),HER2等基因标志物,可以进行药物靶点治疗,但是三阴性乳腺癌的检测还缺乏有效的标志物与治疗方案。因此,在肿瘤蛋白质标志物研究实验开展之前,明确临床问题,并以此确定临床样品入组标准,是研究成功的核心基础。2.研究思路设计:不同于基础科学实验,临床实验需要在大量样本中进行实验结果的验证,因此肿瘤蛋白质标志物研究往往包括新型标志物发现和验证两部分。标志物发现实验是在疾病组和对照组之间进行蛋白质组学分析,鉴定样本中的未知蛋白质组并进行相对定量比较,分析数据选择出在两组样本中差异最大的一个或几个蛋白质作为新型标志物的候选物。随后,标志物验证实验在大量未知样本中进行蛋白质候选物的定量检测,使用发现实验中建立的区分标准进行判读,计算检测灵敏性(sensitivity)和特异性(specificity)。有效的蛋白质标志物研究往往需要发现与验证的两步设计思路来相互保证。3.技术方案选择:根据蛋白质标志物研究的两步设计思路,发现实验中使用基于质谱的蛋白质组学定性技术与相对定量技术对样本中的大量未知蛋白质进行分析,获得标志物候选物名单。验证实验中根据已有名单,进行目标蛋白质(非蛋白质组学)的精确定量检测。这几种质谱技术的配合使用,可以满足不同实验情况和目的,最终实现新型蛋白质标志物的成功研发。三、展望质谱技术是现阶段蛋白质组学研究的核心技术,具有灵敏度高、特异性强、分析通量大等优势,特别是其与同位素内标的联合使用,大大提高了质谱定量能力,因此在多种肿瘤标志物研究中取得了突破性进展并被广泛应用。目前,大量肿瘤蛋白质标志物候选物已经通过使用质谱技术被从血液、组织、体液中筛选出来,预计在完成大规模临床验证后可以作为新型标志物在临床使用,促进肿瘤检测水平的发展。同时值得注意的是,质谱技术还不具备进行蛋白质组的绝对定量能力。相对于免疫等传统蛋白质检测技术,仪器昂贵,操作复杂,自动化程度低,这些因素决定了质谱目前适用于蛋白质的临床研究,但不适用于蛋白质的临床检验,这是质谱技术面临的重要挑战之一。参考文献[1]何华勤. 简明蛋白质组学[M]. 北京:中国林业出版社, 2011:1,76,85-95,119,125-138.[2]RuediA, MatthiasM. Mass spectrometry-based proteomics[J]. Nature, 2003, 422(13):198-207.[3]甄艳, 施季森. 质谱技术在蛋白质组学研究中的应用[J]. 南京林业大学学报:自然科学版, 2011, 35(1):103-108.[4]孙瑞祥, 付岩, 李德泉,等. 基于质谱技术的计算蛋白质组学研究[J]. 中国科学E辑信息科学, 2006, 36(2):222-234.[5]WhiteleggeJ,HalgandF,SoudaP, et al. Top-down mass spectrometry of integral membrane proteins [J]. Expert Review Proteomics, 2006, 3(6):585-596.[6]ChaitBT. Mass spectrometry:bottom-up or top-down? [J]. Science, 2006, 314(5796):65-66.[7]TranDT, AdhikariJ, FitzgeraldMC. StableIsotope Labeling with Amino Acids in Cell Culture (SILAC)-based strategy for proteome-wide thermodynamic analysis of protein-ligand binding interactions [J]. Mol Cell Proteomics, 2014,13(7):1800-1813.[8]DytfeldD, KandarpaM, StrahlerJR, et al. Proteomic Profiling of Multiple Myeloma (MM) Cells Using iTRAQ and Label-Free Quantitative Proteomics for the Prediction of Complete or near Complete Response (CR/nCR) In Frontline Treatment with Lenalidomide, Bortezomib, and Dexamethasone [J]. Blood, 2010, 116(21):271-272.[9]García-SantamarinaS, BoronatS, DomènechA, et al. Monitoring in vivo reversible cysteine oxidation in proteins using ICAT and mass spectrometry [J]. Nat Protoc,2014,9(5):1131-1145.[10]MirzaSP, GreeneAS, OlivierM. 18O labeling over a coffee break:a rapid strategy for quantitative proteomics [J]. J Proteome Res, 2008,7(7):3042-3048.[11]曹冬, 张养军, 钱小红. 基于生物质谱的蛋白质组学绝对定量方法研究进展[J]. 质谱学报, 2008, 29(3):185-190.[12]ZhangZ, BastRC, YuY,et al. Three biomarkers identified from serum proteomic analysis for the detection of early stage ovarian cancer[J]. Cancer Res,2004,64(16), 5882-5890.