当前位置: 仪器信息网 > 行业主题 > >

粗蛋白质

仪器信息网粗蛋白质专题为您整合粗蛋白质相关的最新文章,在粗蛋白质专题,您不仅可以免费浏览粗蛋白质的资讯, 同时您还可以浏览粗蛋白质的相关资料、解决方案,参与社区粗蛋白质话题讨论。

粗蛋白质相关的资讯

  • 全国饲料工业标准化技术委员会发布国家标准《饲料中水分、粗蛋白质、粗纤维、粗脂肪、赖氨酸、蛋氨酸快速测定 近红外光谱法》征求意见稿
    国家标准计划《饲料中水分、粗蛋白质、粗纤维、粗脂肪、赖氨酸、蛋氨酸快速测定 近红外光谱法》由 TC76(全国饲料工业标准化技术委员会)归口 ,主管部门为国家标准化管理委员会。主要起草单位 四川威尔检测技术股份有限公司 、中国农业科学院农业质量标准与检测技术研究所[国家饲料质量监督检验中心(北京)] 、通威股份有限公司 。附件:国家标准《饲料中水分、粗蛋白质、粗纤维、粗脂肪、赖氨酸、蛋氨酸快速测定 近红外光谱法》编制说明.pdf国家标准《饲料中水分、粗蛋白质、粗纤维、粗脂肪、赖氨酸、蛋氨酸快速测定 近红外光谱法》征求意见稿.pdf
  • 激光从蛋白质分子粗细的小孔穿过
    报讯据美国《每日科学》网站8月31日报道,美国加州大学伯克利分校制出世界最小半导体激光器,能使激光从一个蛋白质分子粗细的小孔中穿过。相关论文8月30日在线发表在《自然》杂志网站上。该成果在激光物理学领域具有里程碑式的意义,将有可能开创光学研究的新时代。   加州大学伯克利分校纳米科学与工程中心主任张翔(音译)说:“该研究打破了传统意义上对激光极限的认识,在生物学、通信和计算机领域有着广泛的应用前景。”   据了解,在分子生物学上,纳米级的激光可用于对DNA分子进行探测和控制;在通信领域可大幅提高基于光传导的信息传送速度和带宽;在光学计算机领域对现有技术也有极大的促进作用。   在传统观点看来,包括激光在内的电磁波最细只能聚焦到其波长的一半。经过努力,科学家们找到了一种将电子和光子相互震荡并让其沿着金属表面传播的方法,才将激光压缩到几十纳米细,这种沿着金属表面传播的电磁表面波就是表面等离子体。此后各国科学家开始竞相建造等离子体激光器,但由于金属内在电阻的干扰,表面等离子体在产生后极易衰减,研究人员不得不为此再制造磁场以汇聚光线。   张翔和他的研究小组破解了这个难题。他们用比头发丝还要细1000倍的硫化镉纳米丝在金属银的表面分隔出一个5纳米宽的缝隙。在这个结构中所产生的激光比其波长小20倍。由于光能主要集中在这个极为狭小的缝隙中,其在传播中损耗也被降到了最低。自发辐射率的增加程度是衡量该设备的一个重要指标,在这项研究中,研究人员在该设备5纳米的间隙中测量到了6倍的自发辐射率。(王小龙) 本篇文章来源于 科技网|www.stdaily.com原文链接:http://www.stdaily.com/kjrb/content/2009-09/02/content_100089.htm
  • 定量蛋白质组学揭示内质网应激作用下蛋白质的构象变化
    大家好,本周为大家分享一篇发表在Analytical Chemistry上的文章Quantitative Structural Proteomics Unveils the Conformational Changes of Proteins under the Endoplasmic Reticulum Stress1,文章的通讯作者是来自美国佐治亚理工学院的Ronghu Wu助理教授。在真核细胞中,内质网(endoplasmic reticulum,ER)负责蛋白质组中40%蛋白质的合成和成熟。蛋白质合成或折叠过程中的变化都将影响内质网的稳态,进而导致未折叠蛋白的积累和蛋白分泌效率的降低。在过去几十年的研究中,内质网应激反应被广泛研究,但是内质网应激反应后蛋白质折叠状态的变化却没有被深入研究。基于丰度的蛋白质组学方法不能直接用于分析蛋白质状态的变化,在这篇文章中,作者整合了半胱氨酸(cysteine,Cys)共价标记、选择性富集和定量蛋白质组学,称为半胱氨酸靶向共价蛋白绘制(cysteine targeted covalent protein painting,Cys-CPP),用于研究蛋白质组范围内的蛋白质结构和变化(图1A)。  使用CPP分析蛋白质结构,需要一种具有高反应活性的探针。作者设计了一种针对半胱氨酸的探针,其中包含半胱氨酸反应基团、用于富集的生物素部分和用于生成半胱氨酸特异性识别位点标签的可裂解连接部分(图1B)。以变性处理后的蛋白样品作为蛋白质展开形式的参考,计算肽段在原始样本和变性样本中的比例从而获得宝贵的蛋白质结构信息。  图1.利用半胱氨酸反应探针定量分析人细胞蛋白质组中半胱氨酸暴露率的原理。(A)Cys-CPP的一般工作流程。(B)半胱氨酸残基与探针之间的反应。富集后,进行紫外裂解,在修饰的半胱氨酸上留下一个小标记,用质谱进行位点特异性分析。  半胱氨酸暴露率Rexpo通过每条肽段在原始样本和变性样本中的比值进行计算。结果显示:(1)半胱氨酸的暴露率和溶剂可及性呈现正相关(图2C) (2)在丝氨酸和苏氨酸等极性氨基酸残基旁边的半胱氨酸具有相对较高的暴露率,这与人们普遍认为亲水残基更有可能暴露在蛋白质表面的观点一致 (3)甘氨酸和脯氨酸附近的半胱氨酸具有更高的暴露率,这是因为这两种氨基酸通常出现在蛋白质的转角和环结构中,对半胱氨酸的空间位阻较小 (4)半胱氨酸暴露率与其有/无序区(图2D)或所处二级结构(图2E)的相关性分析均表明,较低的暴露率与更稳定和结构化的局部环境有很好的相关性。这些数据结果共同证明目前的方法可以准确地测得半胱氨酸暴露率,并为蛋白质结构提供有价值的信息。  图2.HEK293T细胞中半胱氨酸暴露率的分析。(A) VAHALAEGLGVIAC#IGEK(#代表标记位点)的串联质谱样本。报告离子的强度使我们可以准确定量一个半胱氨酸的暴露率(左框为报告离子强度的放大视图)。(B)蛋白CCT3中被定量半胱氨酸的定位和暴露率演示(PDB代码:6qb8)。(C−E)比较不同的溶剂可及性(C)、预测无序区(D)和二级结构(E)的半胱氨酸暴露率。  衣霉素(Tunicamycin,Tm)可抑制 N-糖基化并阻断 GlcNAc 磷酸转移酶 (GPT)。由于蛋白质的N-糖基化经常发生在共翻译过程中,在蛋白质折叠的调节中起着至关重要的作用,所以衣霉素会引起细胞内质网中未折叠蛋白的积累并诱导内质网应激。基于此,作者用衣霉素对细胞进行处理,计算并对比了衣霉素处理样本和正常样本中的半胱氨酸暴露率。正如预期的那样,Tm处理样本中许多半胱氨酸的暴露率升高,且Tm对于蛋白质不稳定区域的作用尤为显著。根据Tm处理样本和正常样本之间半胱氨酸暴露率的差值,作者将所有位点划分为5个部分,在Tm处理下,近三分之一的半胱氨酸定位区域没有明显的结构变化(差值在-0.05~0.05之间),而28%的位点则高度暴露(差值0.15)(图3B)。对这两种蛋白质进行基因本体(GeneOntology,GO)功能富集分析(图3C),结果显示:差值在-0.05~0.05之间的蛋白通常是糖异生或折叠过后具有良好结构区域的蛋白,而差值0.15的蛋白则是与囊泡转运相关的蛋白。这表明抑制N-糖基化主要影响经典分泌途径中的蛋白质,与预期相符。  图3.利用Tm抑制蛋白质N-糖基化对蛋白质折叠影响的系统研究。(A)Tm处理和对照样品之间半胱氨酸暴露率的比较。(B) 不同暴露率变化范围内的蛋白质数量。(C)在具有高度展开或稳定区域半胱氨酸的蛋白之间进行GO功能富集分析。  由于Tm对于预先存在的、折叠良好的蛋白质所产生的影响可能远小于对新合成蛋白的影响,分别研究Tm对这两种蛋白的影响是必要的。作者通过将目前的方法Cys-CPP与细胞培养中氨基酸的稳定同位素标记(pSILAC)结合(图4A),探究了细胞中已存在蛋白和新合成蛋白在内质网应激作用下的不同变化。结果显示:(1)抑制N-糖基化对新合成蛋白的去折叠影响比对已存在蛋白的影响更显著(图4C) (2)N-糖基化除了调节蛋白质的二级结构外,在蛋白质三级或四级结构的形成中起着更重要的作用(图4D)。  图4. 抑制N-糖基化对新合成蛋白和已存在蛋白折叠状态影响的研究。(A)量化新合成蛋白和已存在蛋白折叠状态变化的实验设置。(B) 经Tm处理和未经处理的细胞中新合成和已存在蛋白质的重叠。括号内为每组蛋白质数。(C)不同蛋白质组中暴露率的分布。(D) 在有或没有Tm处理的细胞中、在不同的二级结构下,新合成和已存在蛋白之间半胱氨酸暴露率的差值分布。  本文通过设计一种半胱氨酸靶向探针,定量半胱氨酸残基的暴露率,系统地研究了蛋白质的结构以及结构的变化。结果表明,半胱氨酸暴露率与蛋白质局部结构的相关性非常好。利用该方法,作者研究了Tm引起的内质网应激反应下细胞中蛋白质的结构变化。此外,通过将Cys-CPP与pSILAC结合,研究了在内质网应激反应下原有蛋白和新合成蛋白的结构变化差异,并详细分析了内质网应激对蛋白质去折叠的影响,深入和准确地了解内质网应激下的蛋白质结构变化,有助于深入了解蛋白质的功能和细胞活性。  参考文献:[1] Yin K, Tong M, Sun F, et al. Quantitative Structural Proteomics Unveil the Conformational Changes of Proteins under the Endoplasmic Reticulum Stress[J]. Analytical Chemistry, 2022,
  • 谁是蛋白质质谱与蛋白质组学领域世界第一牛人?
    俗话说:文无第一,如果非要整出个蛋白质质谱与蛋白质组学领域世界第一牛人,显然并不是一件容易的事,也注定是一件有争议的事。作为一个半路出家的准业内人,我就本着无知者无畏的革命精神,说一下我自己心目中的第一牛人:Ruedi Aebersold。   考虑到科学网的大多数网友对蛋白质组学并不了解,先简单科普一下,根据百度百科的定义:“蛋白质组学(Proteomics)一词,源于蛋白质(protein)与 基因组学(genomics)两个词的组合,意指“一种基因组所表达的全套蛋白质”,即包括一种细胞乃至一种生物所表达的全部蛋白质。” 1995年(也有1994,1996年之说)Marc Wikins首次提出蛋白质组(Proteome)的概念1,1997年, Peter James(就职于有欧洲MIT之称的瑞士联邦工学院(ETH))又在此基础上率先提出蛋白质组学的概念2。基因组学和蛋白质组学的概念又进一步催生了N多的各种各样的组学(omics),两者的诞生的发展,也使系统生物学成为可能,本文的主人公Ruedi Aebersold与Leroy Hood一起于2000年在美国西雅图创办了系统生物学研究所(ISB),该所的建立不但标志着系统生物学作为一门独立的学科的诞生(此句话貌似不靠谱,参见文后14楼的评论),也带动了包括蛋白质组学在内的多种组学的发展,当然各种组学的发展也同时促进了系统生物学的发展。尽管日本也于2000年在东京建立了系统生物学研究所,但是同为第一个吃螃蟹的,东京的这个所,无论是学术水平还是世界影响都无法和西雅图的那个系统生物学领域的麦加相提并论。闲话少叙,我之所以认为Ruedi Aebersold是蛋白质质谱与蛋白质组学领域世界第一牛人,是基于如下原因:   Ruedi Aebersold对蛋白质组学的最大贡献可谓是同位素代码标记技术(ICAT),现在这一蛋白组定量技术自从1999年在Nature上发表以来,该技术已世界广泛应用,该论文迄今(截至2013年1月11日)已被引用了近3000次。Web of Science的检索结果显示,蛋白组学领域迄今已经至少有超过10万篇论文发表,按照被引用次数排名,该论文位居第三位。有意思的是,被引用次数排第四位的是Ruedi Aebersold和另外一位牛人Mathias Mann(下面会介绍)于2003年发表在Nature上的有关蛋白质质谱与蛋白质组学的综述论文,迄今也已被引用近2800次。而引用次数排第一和第二的两篇论文的通讯作者并算不上是蛋白质质谱与蛋白质组学领域的,蛋白质组学仅仅是他们使用的工具,他们的影响也在这个领域之外。蛋白质组学领域,最重要的专业协会应该算是HUPO (国际人类蛋白质组组织), 最重要的专业会议也当属HUPO世界大会,Ruedi Aebersold曾获HUPO含金量最高的成就奖,他本人也经常是HUPO世界大会的分会主席或大会特邀报告人。当然Aebersold还获得了包括美国质谱协会(ASMS)大奖在内的许多专业大奖。可能有人会列出另外的自己心中的第一牛人(如上述的Mathias Mann),但Ruedi Aebersold无疑至少是领域内公认的前几位的世界级牛人。另外,顺便说一下德国马普所的Mathias Mann(其在丹麦首都也有实验室),Mann和Aebersold可谓是蛋白质组学领域的双子星座,都是该领域的顶级牛人,Mann发表的论文有多篇都在蛋白质组学领域被引用次数前10位,不少被引用次数都上千次。上述的Mann和Aebersold两人能在Nature发表综述论文也说明了他们的江湖地位。Aebersold和Mann所发表的论文总被引次数分别超过了5万和3万次,这个数字在世界所有领域都是惊人的。另外,Mathias Mann在蛋白质组学最大的贡献可以说是发明了蛋白质组体内标记技术SILAC3,这种技术与Ruedi Aebersold发明的ICAT已及另外一种标记iTRAQ是公认的应用最为广泛的蛋白质组学定量标记技术。   今年年近花甲的Ruedi Aebersold是世界蛋白质组学的开拓者之一,现在在上述的ETH的工作,和最早提出蛋白质组学Peter James在同一个大学。作为土生土长的瑞士人,Ruedi Aebersold是在2004年底、2005年初才开始在ETH全职工作的,可谓是瑞士的大海龟。Ruedi Aebersold此前在西雅图的ISB和华盛顿大学工作,作为ISB的元老和共同创办人,Ruedi Aebersold现在还是ISB的兼职教授,发表论文时也还署ISB地址。Mann和Aebersold都是欧洲人,现在又都致力于将蛋白质质谱与蛋白质组学应用到临床,尽管蛋白质组学已有十多年发展历史,现在最大的一个瓶颈可以说在基本无法应用到临床,现有的技术,对于临床应用而言,时间和经济成本都太高(无法高通量、检测成本太贵)。这一块硬骨头显然不是一般人能够啃得动的,需要从临床样品制备、质谱技术到数据分析都要有突破甚至革命性的创新,我很期待,也相信Mann和Aebersold有能力最终使蛋白质组学(尤其是基于此的生物标志物鉴定技术)应用到临床。   我国在蛋白质质谱与蛋白质组学领域在世界上最出名的无疑非贺福初莫属,贺福初的名字在国内搞蛋白质组学应该都知道他的名字,他的头衔很多(如将军、院士),我就不一一列举了,新年伊始他又多了一个牛头衔:万人计划中的科技领军人才。贺的工作和学术水平,我不熟悉,不敢评头论足。他的文章被引用次数最高的是发表在Cancer Research一篇论文,迄今已有126次,但并非是蛋白质组学领域。在蛋白质组学领域,他的被引次数(含自引)最高的论文是2007年发表在蛋白质组学顶级期刊MCP的文章4,迄今已有105次引用。蛋白质质谱领域,我国在世界上最出名的学者估计要数复旦大学的杨芃原了,他的被引用次数最高的一篇论文,是2005年发表在化学顶级期刊德国应用化学的文章5,迄今已被引用70次,杨芃原为该论文的共同通讯作者。我国在蛋白质组学目前被引用次数最高的是南开大学王磊(澳大利亚海归、长江学者)2007年发表在美国科学院院刊(PNAS)的论文6,迄今被引次数已经超过500次。   蛋白质质谱仪主要生产商Thermo Fisher(即原来的Finnegan), 最近新出了本挂历,这本特别的挂历上列了13位在蛋白质质谱与蛋白质组学领域的牛人,上述的Ruedi Aebersold和Mathias Mann都在之列,其余11位简单介绍、列表如下。 姓 名 工作单位 主要贡献 Richard D. Smith 美国太平洋西北国家实验室 1990年首次用三重四级杆质谱Top-down(自上而下)分析完整蛋白 John Yates III 美国Scripps研究所 SEQUEST MS/MS数据库搜索程序 Joshua Coon 美国威斯康星大学麦迪逊分校 发明了电子转移解离技术(ETD) Neil Kelleher 美国西北大学 Top-down蛋白质组学 Kathryn Lilley 英国剑桥大学 蛋白质组学定量技术 Pierre Thibault 加拿大蒙特利尔大学 应用生物质谱和蛋白质组学到细胞生物学 Michael MacCoss 美国华盛顿大学(西雅图) 稳定同位素标记技术 Albert Heck 荷兰Utrecht大学 基于质谱的结构生物学 Catherine Costello 美国波士顿大学 HUPO前任主席,质谱技术发展及应用 Alexander Makarov 德国Thermo Fisher Scientific 生物质谱全球研发总监 领导研发Orbitrap质谱仪 Donald Hunt 美国弗吉尼亚大学 FT-MS and ETD   简单的说,上述13位世界级牛人都来自欧美,没有一位来自亚洲,也没有一位华人。我不知道以Ruedi Aebersold代表的上述牛人是如何炼成的,但可以肯定的是:他们不是欧美版的“百人”计划,也不是“千人”计划,更不是“万人”计划而“计划”出来的。网上的公开信息表明:Ruedi Aebersold除了在国际专业协会和期刊有学术兼职外,没有任何行政职务,就是一普通教授,但是这不妨碍他成为蛋白质质谱与蛋白质组学领域世界第一牛人。
  • 中国蛋白质组学世界领先
    2003年12月15日,由中国科学院院士贺福初牵头的“人类肝脏蛋白质计划”(HLPP)启动,这是我国领导的第一项重大国际合作计划,也是第一个人类组织/器官的蛋白质组计划。 北京蛋白质组研究中心主任、蛋白质组学国家重点实验室副主任秦钧告诉《中国科学报》记者,十余年来,HLPP经历了三代更迭,从第一代版本的肝脏总蛋白质组,到第二代的肝脏细胞器蛋白质组,以及到刚刚完成的第三代肝脏不同细胞亚群的蛋白质组解析。HLPP的肝脏蛋白质组研究正在并将继续作为“中国人类蛋白质组计划”(CNHPP)的先导,为CNHPP的发展探明道路。 事实上,通过HLPP研究十余年的努力,中国蛋白质组研究团队已向世界交上了一份漂亮的答卷。 据记者了解,中国科学家成功构建了迄今国际上质量最高、规模最大的人类第一个器官蛋白质组的表达谱、修饰谱、连锁图及其综合数据库;首次实现人类组织与器官转录组和蛋白质组的全面对接;在炎症诱发肿瘤等方面,发现一批针对肝脏疾病、恶性肿瘤等重大疾病的潜在药靶、蛋白质药物和生物标志物。 2008年,张学敏课题组首次发现炎症和免疫的新型调控分子CUEDC2,可作为肿瘤耐药的新标志物,从而为克服癌细胞耐药提供了原创性的药物新靶点和治疗新思路。2010年,周钢桥课题组“逮到”肝癌的易感基因,为肝癌的风险预测和早期预警提供了重要理论依据和生物标记̷̷上述几项成果均发表于国际顶级的《科学》《自然》系列杂志。 秦钧认为,蛋白质组学研究是我国生命科学中几个能够始终跻身世界前沿的科学领域之一。 而现在,世界蛋白质组学领域内的新一轮科技竞赛已开始。中国科学院院士、中国科学院大连化学物理研究所研究员张玉奎表示,虽然中国在蛋白质组学领域走在了世界前列,但国外有些团队如今正快马加鞭,中国科学家必须加快步伐,不能丧失已经取得的优势。 这也是我国开展CNHPP研究的一个重要原因。“这是真正的原始创新,是中国能够引领世界科技发展的重要领域之一。”贺福初说。
  • 蛋白质组:解码生命“天书”
    人类和老鼠的外貌可说是天渊之别,但实际上他们却有着近99%相同的基因组。何以&ldquo 失之毫厘差之千里&rdquo ?正是蛋白质放大了他们基因上的细微差别。 日前,中国人类蛋白质组计划全面启动。&ldquo 基因组学中微小的差异,在蛋白质组学中可以被千倍甚至几近万倍地放大。&rdquo 亚太蛋白质组组织主席、中国科学院院士贺福 初表示,这一计划的实施将对基因组序列图进行&ldquo 解码&rdquo ,进而全景式揭示生命奥秘,为提高重大疾病防诊治水平提供有效手段。 解码生命的&ldquo 密钥&rdquo 提起蛋白质,大家并不陌生。它是生物体内一种极为重要的高分子有机物,约占人体干重的54%。 不过,&ldquo 蛋白质组&rdquo 一词却鲜有人了解。其实,蝴蝶由卵变虫、成蛹、再破茧成蝶,幕后&ldquo 操盘者&rdquo 并非基因组,而是蛋白质组。&ldquo 1994年澳大利亚科学家率先提出蛋白质组这个概念,指某个时刻、某个组织、器官或个体中所有蛋白质的集合。&rdquo 贺福初说。 科学家们之所以对蛋白质组产生浓厚兴趣,还要从人类基因组计划说起。2003年4月,耗资27亿美元、经由6国科学家历时13年奋战的人类基因组计划,以人类基因组序列图的绘制完成为标志,画上了句号。 没想到,更大的挑战还在后头&mdash &mdash &ldquo 科学界曾经认为,只要绘制出了人类基因组序列图,就能了解疾病的根源,但是错了&rdquo 。国际蛋白质组组织启动计划主席萨姆· 哈纳什说,事实上,我们此时只了解10%的基因的功能,剩下的90%仍是未知的。 &ldquo 人类基因组计划并不像事前所预期的那样,能够逾越蛋白质这一生物功能的执行体层次,揭示人类生、老、病、死的全部秘密。基因组序列只是提供了一维遗传信息,而更复杂的多维信息发生在蛋白质组层面。&rdquo 贺福初表示。 就 人体而言,各个器官的基因组是一样的,而它们之所以形态、功能各异,正是其结构与功能的物质基础&mdash &mdash 不同的蛋白质组在&ldquo 操盘&rdquo 。&ldquo 就像蛹化蝶,无论形态如 何变化,基因组是不变的。&rdquo 军事医学科学院放射与辐射医学研究所研究员钱小红说,人的每一种生命形态,都是特定蛋白质组在不同时间、空间出现并发挥功能的 结果。比如,某些蛋白质表达量偏离常态,就能够表征人体可能处于某种疾病状态。 &ldquo 无论是正常的生理过程还是病理过程,最直接的体现是蛋白质以及它们的集合体&mdash &mdash 蛋白质组。&rdquo 上述专家们表示。&ldquo 生,源于基因组;命,却一定由蛋白质组决定。只有蛋白质组才能根本阐释生命。&rdquo 贺福初说。 独辟蹊径的&ldquo 中国画卷&rdquo 事实上,早在上世纪90年代人类基因组计划成形之际,已有科学家提出解读人类蛋白质组的想法。其目标是,将人体所有蛋白质归类,并描绘出它们的特性、在细胞中所处的位置以及蛋白质之间的相互作用等。 《科学》杂志在2001年,也将蛋白质组学列为六大科学研究热点之一,其&ldquo 热度&rdquo 仅次于干细胞研究,名列第二。 不过,严峻的现实挑战,让这一想法迟迟停留在&ldquo 纸上谈兵&rdquo 阶段。&ldquo 生物蛋白质数的差别大概是基因数差别的三个数量级左右,人类基因总数大概2万多个,人体内的蛋白质及其变异、修饰体却是百万级的数量。&rdquo 贺福初表示。 不仅如此,人类基因组图谱只有一张,而蛋白质组图谱每个器官、每个器官的每一种细胞都有一张,且在生理过程和疾病状态时还会发生相应改变。工程的艰巨性可想而知。 但困难并未阻挡住科学家们对其探索的脚步。1995年,首先倡导&ldquo 蛋白质组&rdquo 的两家澳大利亚实验室分别挂牌成立蛋白质组研究中心。随后欧美日韩等国均有行动。 1998年初,从事基因组研究的贺福初敏锐地嗅到这朵夜幕后悄然盛开的&ldquo 莲花&rdquo ,逐渐将精力投入到这个新兴领域。 2001年,&ldquo 基因组会战&rdquo 尚未鸣金,《自然》、《科学》杂志即发出&ldquo 蛋白质组盟约&rdquo 。同年秋,&ldquo 人类蛋白质组计划&rdquo 开始孕育。 2002 年4月,贺福初在华盛顿会议上阐述&ldquo 人类肝脏蛋白质组计划&rdquo 。同年11月,&ldquo 人类血浆蛋白质组计划&rdquo &ldquo 人类肝脏蛋白质组计划&rdquo 正式启动,贺福初担任&ldquo 人类 肝脏蛋白质组计划&rdquo 主席。其后两年间,德国牵头的&ldquo 人类脑蛋白组计划&rdquo 、瑞士牵头的&ldquo 大规模抗体计划&rdquo 、英国牵头的&ldquo 蛋白质组标准计划&rdquo 及加拿大牵头的 &ldquo 模式动物蛋白质组计划&rdquo 相继启动。 然而,很少有人知道,这种以生物系统为单元的研究策略酝酿之初饱受诟病。贺福初回忆,在华盛顿,中国人提出蛋白质组计划必须按生物系统(如器官、组织、细胞)进行一种战略分工和任务分割,一石激起千层浪,争议四起。 &ldquo 要想通过分工合作来完成全景式分析人类蛋白质组的宏大目标,必须以人体的生物系统作为研究单元和分工的规则。这个策略,10年来合者渐众,不过目前仍存争议,中国的先见之明可能得在下个10年成为不可阻挡的潮流。&rdquo 贺福初坦陈。 定位疾病的&ldquo GPS&rdquo 历经10余年的努力,以贺福初为代表的中国蛋白质组研究团队,在该领域向世界交了一份漂亮答卷: 成功构建迄今国际上质量最高、规模最大的人类第一个器官(肝脏)蛋白质组的表达谱、修饰谱、连锁图及其综合数据库; 首次实现人类组织与器官转录组和蛋白质组的全面对接; 在 炎症诱发肿瘤等方面,发现一批针对肝脏疾病、恶性肿瘤等重大疾病的潜在药靶、蛋白质药物和生物标志物。如,2008年,张学敏课题组首次发现炎症和免疫的 新型调控分子CUEDC2,可作为肿瘤耐药的新标志物,从而为克服癌细胞耐药提供了原创性的药物新靶点和治疗新思路。2010年,周钢桥课题组&ldquo 逮到&rdquo 肝 癌的易感基因,为肝癌的风险预测和早期预警提供了重要理论依据和生物标记。2012年,张令强课题组研制出世界上首个能特异性靶向成骨细胞的核酸递送系 统,提供了一种基于促进骨形成的全新骨质疏松症治疗途径,向解决骨丢失无法补回这一医学难题迈出了坚实的一步。2014年,张令强课题组首次在国际上揭示 泛素连接酶Smurf1是促进结直肠癌发生发展,并且导致病人预后差的一个重要因子&hellip &hellip 上述几项成果均发表于国际顶级的《科学》、《自然》系列杂志。 还没来得及分享这一喜悦,激烈的角逐又让他们绷紧了神经。日前,英国《自然》杂志公布美国、印度和德国等合作完成的人类蛋白质组草图。研究人员表示,这一成果有助于了解各个组织中存在何种蛋白质,这些蛋白质与哪些基因表达有关等,从而进一步揭开人体的奥秘。 &ldquo 尽 管还有许多不完善的地方,但确实是蛋白质组学领域乃至整个生命科学领域,具有里程碑意义的科学贡献。&rdquo 中国科学院院士饶子和直陈。中国科学院院士张玉奎指 出,虽然中国在蛋白质组的一些领域走在了世界前列,但国外有些团队正快马加鞭,我们不得不警醒,否则很快将被甩出第一阵营。 6 月10日,中国人类蛋白质组计划全面启动实施。&ldquo 蛋白质组,可以揭示疾病的发病机制和病理过程,发现新型诊断标志物、治疗和创新药物,可以全面提高疾病防 诊治水平。这个项目完成后,将揭示人体器官蛋白质组的构成,一旦哪一部位出现异常即可实现&lsquo GPS定位&rsquo ,进而找到针对性的诊断措施、干预措施和预防措 施。&rdquo 记者了解到,中国人类蛋白质组计划第一阶段,将全面揭示肝癌、肺癌、白血病、肾病等十大疾病所涉及的主要组织器官的蛋白质组,了解疾病发生的主要异常,进而研制诊断试剂以及筛选药物。这将在2017年左右完成。 &ldquo 这是真正的原始创新,也是中国能够引领世界科技发展的重要领域之一。&rdquo 贺福初强调说。
  • ​PACTS辅助热蛋白质分析用于肽-蛋白质相互作用研究
    大家好,本周为大家分享一篇发表在Analytical Chemistry上的文章,PACTS-Assisted Thermal Proteome Profiling for Use in Identifying Peptide-Interacting Proteins。该文章的通讯作者是来自北京蛋白质组学研究中心的贾辰熙和Chen Yali研究员。生物活性肽是一类重要的生物分子,通过与蛋白受体相互作用,参与调控多种生物学进程。研究肽-蛋白相互作用对于理解这些功能分子的调节机制至关重要。目前已开发多种方法用于表征肽-蛋白的相互作用,例如通过引入荧光探针在多肽上来监测蛋白-多肽的相互作用,或者将多肽固定在磁珠或其他载体材料上进行进一步的亲和沉淀。然而以上方法都需要对多肽进行修饰,导致多肽的结构发生改变,进一步影响多肽-蛋白相互作用,产生假阳性结果。细胞热转移变分析(CETSA)和热蛋白质组分析(TPP)作为一种无修饰/无标签技术已被广泛用蛋白-配体相互作用研究。当配体与蛋白结合后,蛋白的热稳定性发生了改变,导致熔解曲线(Melting cure)发生位移。通过监测熔解温度的变化(∆Tm),实现对蛋白-配体相互作用的检测。CETSA以及TPP允许在天然环境下研究分子互作,从而保留了内源性蛋白表达水平、翻译后修饰、局部微环境等生物物理特性。除了改变蛋白质的热稳定性,肽配体与蛋白质受体相互作用还会导致蛋白构象、疏水性和溶剂可及性的改变,一些配体甚至起到生物助溶的作用。所有这些特性的改变会导致研究体系中靶蛋白丰度的变化。这种由肽段配体结合诱导蛋白的丰度改变现象称之为PACTS。而PACTS也可以被合理的利用用于识别与肽段配体结合的靶蛋白。基于此,本文将PACTS与TPP技术相结合用于肽-蛋白质相互作用研究,PACTS可以辅助TPP分析,特别是在TPP分析过程中,由于配体-靶蛋白结合导致靶蛋白丰度降低至质谱检测限以下,无法绘制熔解曲线的情况下,PACTS可以作为另一个重要的监测手段。如图1所示,PACTS辅助TPP分析的实验流程大致如下:将蛋白提取液分成2份,分别与缓冲液(对照组)、肽配体(实验组)孵育,再将孵育后的每组样本等分成10份,在10个不同的温度下加热3 min。加热完成后,离心,收集上清液。利用SDS-PAGE将肽段与蛋白分离并进行胶内酶切。酶切后的肽段随即用TMT 10-plex标记,最后通过LC-MS/LS进行定量分析。将37 °C下对照组、实验组中同一蛋白的丰度变化作为PACTS的衡量指标(蓝框)。将在不同温度下蛋白的相对丰度变化转化为熔解曲线(黑框),实验组相较于对照组,同一蛋白熔解曲线的位移(∆Tm)作为TPP的衡量指标。综合两种方法识别出的靶标蛋白,作为最终的筛选结果。图1. PACTS辅助TPP分析的实验流程图作者首先用标准肽段-蛋白互作对验证了PACTS辅助TPP分析的可行性。如图2所示,右侧为对照组/实验组中靶蛋白在不同温度下丰度变化(Western blot),中间及左侧则是基于Western blot数据生成PACTs以及熔解曲线。对于JIP1-JNK1互作对,PACTS显示没有明显的丰度变化,而熔解曲线则显示发生了位移(图2A)。与之相反的,对于HOXB-AS3-hnRNP A1互作对,PACTS显示出明显的丰度变化,而熔解曲线则由于靶蛋白丰度降至检测限以下而无法绘制(图2B)。以上两个例子都说很好地说明,PACTS和TPP是两种互补的检测手段,使用两种方法同时检测有利用提高结果的准确性。作者还考察了不同细胞环境对蛋白-配体互作的影响(图CD及图EF)。来源于293T细胞的OPRN1与Enkephalin配体互作产生的熔解温度变化为∆Tm= 0.5 °C(图E),而来源于Hippocampus的OPRN1与Enkephalin配体互作产生的熔解温度变化为∆Tm= -14.4 °C(图F)。这个差异可能是由于孵育时不同的微环境造成的。图2. PACTS辅助TPP分析标准肽段-蛋白互作对。随后,作者将PACTS辅助TPP分析应用到组学层面。Aβ肽是淀粉样斑的主要成分,而淀粉样斑块主要存在于阿尔茨海默症(AD)患者的大脑中。在Aβ肽中,Aβ1-42在介导神经毒性和氧化应激中起关键作用。THP-1细胞类似于小胶质细胞,小胶质细胞功能障碍加速了与年龄相关的神经退行性疾病的进展,如AD。作者利用了PACTS辅助TPP分析研究了THP-1细胞中与Aβ1-42肽段相互作用的蛋白。如图3所示,图3A为PACTS结果,共发现37个蛋白在37 °C下有丰度变化。而TPP结果(图3B)则显示66个蛋白熔解曲线发生了位移。PACTS与TPP的结果具有较小的重合,说明两种方法具有互补性。GO分析表明(图3C),大多数与Aβ1-42相互作用的蛋白存在于细胞外泌体、胞质溶胶和细胞膜中。外泌体在AD中充当双刃剑,一方面,外泌体传播有毒的Aβ肽和过度磷酸化的tau遍及整个大脑,并诱导神经元凋亡。另一方面,它们消除大脑中的Aβ肽并促进其降解。了解Aβ肽与外泌体蛋白之间的相互作用有利于更好的开发AD治疗治疗药物。此外,作者用Western blot的方法进一步确认识别出的靶标蛋白(图D-E)。最后,作者用免疫共沉淀的方法进一步证明靶蛋白与Aβ1-42存在相互作用。图3. PACTS辅助TPP分析与Aβ1-42相互作用的蛋白总之,本文开发一种PACTS辅助TPP的分析方法,可用于大规模组学层面肽段-蛋白质相互作用研究。该方法具有无标记、无修饰的优势,无需额外实验,即可在TPP分析的同时获得PACTS信息。该方法也有助于理解多肽-蛋白质复合物相关的分子调控机制,进一步开发新型治疗药物。撰稿:刘蕊洁编辑:李惠琳原文:PACTS-Assisted Thermal Proteome Profiling for Use in Identifying Peptide-Interacting Proteins 参考文献1.Zhao T, Tian J, Wang X, et al. PACTS-Assisted Thermal Proteome Profiling for Use in Identifying Peptide-Interacting Proteins. Anal Chem. 2022 94(18): 6809-6818. doi:10.1021/acs.analchem.2c00581
  • 蛋白质测序技术发展漫谈(续)——基于荧光、纳米孔的单分子蛋白质测序
    前文回顾(点击查看):蛋白质测序技术发展漫谈(上篇);蛋白质测序技术发展漫谈(中篇);蛋白质测序技术发展漫谈(下篇)前面描述了目前成熟的蛋白质测序方法,并对最流行的基于质谱的蛋白质测序方法进行了综述。非质谱依赖的蛋白质测序手段,除了几十年前发展的基于Edman降解法通过气相或液相色谱测序的方法,最近热门领域的方法主要包括基于荧光或纳米孔的单分子蛋白质测序,代表了未来的发展方向。基于纳米孔单分子蛋白质测序方法纳米孔测序(nanopore sequencing)法是借助电泳驱动力使待测单个分子逐一通过纳米孔,通过检测纳米孔截面的电流变化来实现对序列的测定。纳米孔测序最初在1996年被提出,通过膜通道检测多核苷酸序列,也就是单分子DNA的测序[1]。随着使用纳米孔对单分子DNA测序技术的逐渐成熟[2-5],纳米孔技术也被应用在单分子蛋白质的鉴定上。对于DNA来说,其二级结构和电荷相对比较一致,它的聚合物比较容易处理,而且仅由四种碱基组成,单分子DNA测序比较简单。相比之下,蛋白质分子由20种氨基酸组成,并且蛋白的电荷和疏水性多变,还存在大量的二级和三级结构,因此基于纳米孔技术对蛋白质的鉴定要比DNA困难很多[6]。当前的基于纳米孔对蛋白质分析的主要探索方向是通过寡核苷酸适配子或抗体等亲和分子对纳米孔进行功能化,当蛋白质或肽段分子通过纳米孔时,由于不同氨基酸在纳米孔附近的结合或通过会引起不同幅度的电流变化,基于这些变化就可以确定氨基酸的种类,从而逐个得到所测蛋白质或肽段的序列信息(图1)。图 1 借助纳米孔的横向电流检测单分子蛋白质[2]牛津大学的Hagan Bayley[7]团队将单个α-血溶素蛋白孔插入两侧带有电极的膜中,磷酸化的蛋白质在DNA寡核苷酸的牵引下展开,并穿过纳米孔,通过记录纳米孔的电流变化区分出了202个磷酸化蛋白质的4种不同亚型,但无法鉴定蛋白质的一级结构。Francesco[8]团队将蛋白质或氨基酸吸附在金纳米星上,并施加电等离子体力将粒子推进并约束在金纳米孔内,利用金纳米星与金纳米孔壁之间的单个热点,实现了单分子表面增强拉曼散射(SERS)探测,用于检测氨基酸,并且可以分辨仅含有两个不同氨基酸的单个多肽分子抗利尿激素和催产素。Cao等[9]通过单个定点突变,在具有锥形识别位点的耻垢分枝杆菌孔蛋白A(MspA)的纳米孔内腔中引入了甲硫氨酸,从而将该反应有目的的移植到了MspA纳米孔最尖锐的识别位点,并观测到了相应的单分子反应信号。该纳米孔可以引入更多的离子电流,从而放大检测信号,其狭窄的识别位点则提供了更高的空间分辨率,大大削弱了周围氨基酸的干扰,从而拓宽生物纳米孔的单分子检测功能,有望推进基于孔道的单分子蛋白质测序研究。Ouldali[10]研究团队研发出了一种新型气溶素纳米孔,此纳米孔借助将氨基酸附着在聚阳离子载体上,使氨基酸在纳米孔上停留时间变长,并检测其通过纳米孔时电流的变化,最终可识别出组成蛋白质的15种氨基酸,也能检测到组成蛋白质的其余5种氨基酸的电流变化,但是无法对其进行区分。虽然只是对氨基酸进行识别,但作者设想通过对蛋白或者肽段末端氨基酸逐个降解,利用纳米孔技术鉴定从末端释放出来的氨基酸,从而对蛋白质或肽段序列进行测定。Zhao[11]等将一对金属电极分隔在约2nm的孔洞旁,当氨基酸线性穿过这种纳米孔的时候,每一个氨基酸都会完成一个回路,并反馈出相应的电信号,常见的20种氨基酸在通过纳米孔时都可以产生电信号。有的氨基酸需通过大约50种不同信号特征被鉴定,但绝大多数的氨基酸仅需要不到10个信号特征被鉴别。这种方法不仅能够高可信度的鉴定氨基酸,还能区分翻译后修饰的氨基酸(肌氨酸)及其前体(甘氨酸)、区分同分异构体的亮氨酸与异亮氨酸、区分对应对映异构体的氨基酸镜像分子L-天冬酰胺和D-天冬酰胺。此技术被应用于对两条由四个氨基酸组成的短肽(GGGG 和GGLL)进行测序,单分子短肽穿过纳米孔,孔道两边电极记录每个氨基酸通过时产生的电信号,通过测序算法,识别代表不同氨基酸的特征信号,从而得到短肽的序列。基于纳米孔单分子蛋白测序目前还属于初步发展阶段,除了需要根据电信号准确区分组成蛋白质的氨基酸以外,另一个关键是设计可一次拉动一个蛋白质或氨基酸穿过纳米孔的“马达”。为了让蛋白质或肽段顺利穿过纳米孔,研究者们在蛋白质一端添加了一串带有负电的氨基酸或者一段短DNA,用氨基酸或DNA链拉动蛋白质,可以使一些蛋白质打开折叠并顺利穿过纳米孔,但另一些复杂折叠的蛋白需要更多拉力,于是研究者在引导序列上添加了可以打开折叠的ClpX的识别位点[12]。这个系统能够将简单折叠的目标蛋白牵引过纳米孔,但对于折叠非常紧密的蛋白质仍要使用变性剂来打开折叠。基于纳米孔技术对单分子肽段或蛋白质测序目前还停留在对氨基酸鉴定和对短肽的区分阶段,还不能实际应用于对蛋白质的测序。虽然纳米孔测序具有高通量、对样品需求量少的优点,但是现有的纳米孔过大,失去了对氨基酸的区分能力,同时蛋白质分子通过孔道过快,加大了对信号读取难度;其次由于需要将蛋白的三级和二级结构破坏掉,纳米孔道需要能够耐受非常苛刻的化学和力学条件;第三,由于蛋白带电不均匀,控制其穿孔的速率也非常困难。所以目前的方法还不能准确的测得蛋白质的序列,基于纳米孔的单分子蛋白质测序技术还有很大的发展空间。基于荧光的单分子蛋白质测序方法基于荧光的单分子蛋白质测序同纳米孔测序一样,都可以对极少量蛋白质样品进行检测,其原理是先将蛋白质酶解成肽段,对肽段中特定氨基酸选择性标记不同的荧光基团[13],对不同氨基酸上的荧光进行观察,从而确定肽段部分氨基酸序列,再将这些序列与蛋白质组序列比对,即可确定肽段的来源蛋白(图2)。图 2 基于荧光的单分子蛋白测序流程[14]。Ginkel[15] 和Yao [16]都利用ClpXP蛋白酶辅助对肽段进行选择性荧光标记,可对序列中的赖氨酸和半胱氨酸进行标记,通过Förster共振能量转移依次读出被标记的肽段的氨基酸的信号。Swaminathan[14] 将蛋白质酶解成肽段,再将肽段固载到玻璃片上[17],使用特定荧光基团分别对肽段中的赖氨酸和半胱氨酸选择性标记,通过Edman降解技术对固载的肽段进行降解,每次降解后都使用全内反射荧光(TIPF)显微镜进行观测。如果被标记的赖氨酸和半胱氨酸在Edman降解中从肽段N端释放出来,被标记的以上两种氨基酸的位置就会被检测到。同时还发展了用于监测单个肽荧光强度的图像处理算法,并对误差源进行分类和建模,可以测得序列中部分氨基酸的信息。将测得的部分序列与参考蛋白质组序列比对,即可确定肽段的来源蛋白,通过与蛋白质组序列比对,可以鉴定到在人源蛋白质组中的绝大多数蛋白质。基于荧光单分子蛋白测序技术主要有三方面难点,一方面在于目前仅能对赖氨酸和半胱氨酸等几种氨基酸进行特异性荧光基团的标记,无法对所有氨基酸都进行标记;第二个难点是Edman降解是在强酸或强碱的环境中进行,对这些荧光基团的稳定性要求很高;第三个难点是对后期图像处理有较高的要求,如果序列中每个氨基酸都标记上不同的荧光基团,且发光峰易交叠难分辨,这给荧光处理算法带来了难度。因此,基于荧光的单分子蛋白测序技术虽然可以对极微量蛋白质样品分析,但目前仅能测得部分氨基酸序列,对蛋白质全序列的测定目前尚不能实现。[1] Kasianowicz J J, Brandin E, Branton D, et al. Characterization of individual polynucleotide molecules using a membrane channel [J]. Proceedings of the National Academy of Sciences, 1996, 93(24): 13770-13773.[2] Branton D, Deamer D W, Marziali A, et al. The potential and challenges of nanopore sequencing [J]. Nanoscience and technology: A collection of reviews from Nature Journals, 2010: 261-268.[3] Laver T, Harrison J, O’neill P, et al. Assessing the performance of the oxford nanopore technologies minion [J]. Biomolecular detection and quantification, 2015, 3: 1-8.[4] Karlsson E, Lärkeryd A, Sjödin A, et al. Scaffolding of a bacterial genome using MinION nanopore sequencing [J]. Sci Rep, 2015, 5(1): 1-8.[5] Huang S, Romero-Ruiz M, Castell O K,et al. High-throughput optical sensing of nucleic acids in a nanopore array [J]. Nature nanotechnology, 2015, 10(11): 986-991.[6] Nivala J, Marks D B, Akeson M. Unfoldase-mediated protein translocation through an α-hemolysin nanopore [J]. Nat Biotechnol, 2013, 31(3): 247-250.[7] Rosen C B, Rodriguez-Larrea D, Bayley H. Single-molecule site-specific detection of protein phosphorylation with a nanopore [J]. Nat Biotechnol, 2014, 32(2): 179.[8] Huang J, Mousavi M, Giovannini G, et al. Multiplexed Discrimination of Single Amino Acid Residues in Polypeptides in a Single SERS Hot Spot [J]. Angewandte Chemie 2020, 59(28): 11423-11431.[9] Cao J, Jia W, Zhang J, et al. Giant single molecule chemistry events observed from a tetrachloroaurate (III) embedded Mycobacterium smegmatis porin A nanopore [J]. Nature communications, 2019, 10(1): 1-11.[10] Ouldali H, Sarthak K, Ensslen T, et al. Electrical recognition of the twenty proteinogenic amino acids using an aerolysin nanopore [J]. Nat Biotechnol, 2020, 38(2): 176-181.[11] Zhao Y, Ashcroft B, Zhang P, et al. Single-molecule spectroscopy of amino acids and peptides by recognition tunnelling [J]. Nature nanotechnology, 2014, 9(6): 466-473.[12] Nivala J, Mulroney L, Luan Q, et al. Unfolding and Translocation of Proteins Through an Alpha-Hemolysin Nanopore by ClpXP [M]. Nanopore Technology. Springer. 2021: 145-155.[13] Hernandez E T, Swaminathan J, Marcotte E M, et al. Solution-phase and solid-phase sequential, selective modification of side chains in KDYWEC and KDYWE as models for usage in single-molecule protein sequencing [J]. New J Chem, 2017: 462-469.[14] Swaminathan J, Boulgakov A, Hernandez E, et al. Highly parallel single-molecule identification of proteins in zeptomole-scale mixtures [J]. Nat Biotechnol, 2018, 36(11): 1076-1082.[15] Ginkel J V, Filius M, Szczepaniak M, et al. Single-molecule peptide fingerprinting [J]. Proceedings of the National Academy of Sciences, 2018, 115(13): 3338-3343.[16] Yao Y, Docter M, Ginkel JV, et al. Single-molecule protein sequencing through fingerprinting: computational assessment [J]. Phys Biol, 2015, 12(5): 055033.[17] Howard C, Floyd B, Bardo A, et al. Solid-Phase Peptide Capture and Release for Bulk and Single-Molecule Proteomics [J]. ACS Chem Biol, 2020, 15(6): 1401-1407.作者简介:中国科学院大连化学物理研究所 单亦初副研究员1997年于中国科学技术大学获理学学士学位。2002年于中国科学院大连化物所获理学博士学位。2002年10月至2009年5月在德国马普协会马格德堡研究所、美国德克萨斯大学医学院及澳大利亚弗林德斯大学工作。2009年7月应聘到中国科学院大连化物所任副研究员。主持多项研究课题,包括国家重点研发计划子课题、国家自然科学基金面上项目等。已在Analytical Chemistry、Journal of Proteome Research、Journal of Chromatography A等杂志发表论文近80篇。主要研究方向包括蛋白质组鉴定和蛋白质组相对及绝对定量、蛋白质翻译后修饰富集和鉴定、蛋白质组末端肽富集和鉴定、蛋白质相互作用分析、蛋白质全序列从头测定及药物靶蛋白筛选。(本文经授权发布,仅供读者学习参考)专家约稿招募:若您有生命科学相关研究、技术、应用、经验等愿意以约稿形式共享,欢迎邮件投稿或沟通(邮箱:liuld@instrument.com.cn )。
  • 预测:蛋白质组学和生命科学促使手性色谱柱市场增长
    p   近日,国外研究机构发布2017-2021年手性色谱柱市场研究报告,报告指出,安捷伦、赛默飞、岛津和默克是手性色谱柱市场的主流厂商,其他供货商包括:BD、Daice、GE医疗、珀金埃尔默、菲罗门、Regis Technologies、Regis Technologies、东曹、VWR、沃特世、W.R Grace和 ZirChrom Separations。 /p p   一位研究分析师在报告中指出:“蛋白质组学市场和生命科学部分的增长是手性色谱住市场发展的趋势之一。过去几年中,蛋白质组学已经表现出强劲的增长态势,预期,到2018年,蛋白质组学市场将达到近2000万美元,主要是由于蛋白质组学在诊断、药物发现以及其他领域中的应用。手性色谱柱在蛋白药物发现过程中扮演着重要的角色,主要用于分离对映异构体,以进一步分析其疗效。人口增长、慢性疾病种类增多、预期寿命延长以及可支配收入的增多刺激医疗保健费用增长,进而促使生命科学工业的快速增长。随之而来的便是药物批准试验中所用到的手性色谱柱增多。因此,蛋白质组学和生命科学工业的发展导致全球手性色谱柱市场的增长。” /p p   报告指出,药物批准试验中色谱分析是驱动手性色谱柱市场发展的因素之一。制药工业中手性化合物的分离越来越重要,药物中对映异构体的分子手性往往导致生物系统表现出不同的反应。人体也对手性化合物具有选择性,其与外消旋药物不同的相互作用使对映异构体代谢出不同的最终产物。因此,一个对映异构体可产生预期的疗效,也可以无效甚至有毒的结果。外消旋药物中的对映异构体在生物活性如药理、毒理和代谢研究可表现出不同的结果。 /p p   报告进一步指出,手性色谱柱市场面临的挑战之一是强有力的替代技术。寿命长、成本高的仪器设备需要频繁的定期维修保养。现代仪器对环境变化和原材料老化非常敏感和脆弱,企业通过提供维修服务和技术支持为其带来很大一部分收益。通过在仪器服役期间提供技术维修服务,企业可以获得额外的收入和利润。例如,2015年,因服务支持、耗材配件以及客户培训的交易,沃特世公司的售后服务部门的销售额增加了30%,这部分业务包括手性色谱柱业务。然而,对客户而言,尤其是重视价格的终端用户,仪器维修保养是一个挑战。因此,任何能够提高性能、改善使用寿命、降低价格的替代技术的出现都将对手性色谱柱市场形成威胁。 /p p br/ /p
  • 蛋白质组学的前世今生与未来: 蛋白质存在形式 -- 记中南大学湘雅医院詹显全教授
    p style=" text-align: justify line-height: 1.75em "   詹显全,中南大学教授、博士研究生导师、博士后合作导师,英国皇家医学会会士(FRSM)、美国科学促进会(AAAS)会员、欧洲预测预防个体化医学协会(EPMA)的会士和国家代表、美国肿瘤学会(ASCO会士、欧洲科技合作组织(e-COST)的海外评审专家,中国抗癌药物国家地方联合工程实验室技术委员会委员、技术带头人和副主任,临床蛋白质组学与结构生物学学科学术带头人和学科负责人,国家临床重点专科建设项目重点实验室建设项目学科带头人,湖南省百人计划专家、湖南省高层次卫生人才“225”工程医学学的学科带头人、中南大学“531”人才工程专家。目前正致力于从多参数系统策略角度阐述肿瘤的分子机理、发现肿瘤分子标志物,研究并整合基因组、转录组、蛋白质组和代谢组的变异来实现肿瘤的预测、预防与个体化治疗及精准医学。已发表学术论文130 余篇,主编国际学术专著3 本,参编国际学术专著16 本,获得美国发明专利2 个。受邀在中科院1 区影响因子9.068 MassSpectrometry Reviews 和中科院2 区影响因子3.65 Frontiers in Endocrinology 的国际期刊上客座主编了3 个专刊。 /p p style=" text-align: justify line-height: 1.75em text-indent: 2em " 本篇文章仪器信息网获得授权转载,来源中国科技成果杂志。 /p p style=" text-align: center line-height: 1.75em "    span style=" color: rgb(0, 112, 192) " strong 深入剖析蛋白质组学技术最新进展与应用 /strong /span /p p style=" text-align: justify line-height: 1.75em "   詹显全:人类结构基因组测序接近尾声,人们就从结构基因组学研究转向功能基因组学研究,即对转录组和蛋白质组进行研究。1995 年正式提出了”蛋白质组”和”蛋白质组学”的概念,距今已有25 年历史了。 /p p style=" text-align: justify line-height: 1.75em text-indent: 2em " 蛋白质组学的主要技术包括蛋白质组的分离技术、鉴定技术和蛋白质组信息学技术。 span style=" text-indent: 2em " 蛋白质组的分离技术主要有双向凝胶电泳(2DE)和多维液相色谱(2DLC)。蛋白质组的鉴定技术主要是基于质谱(MS)的技术,主要分为肽质指纹(PMF)和串联质谱(MS/MS)分析技术,其用于蛋白质大分子分析的两大离子源主要有MALDI 和ESI。质谱技术发展很快,主要朝向高灵敏度、高通量和高精度方向发展。 /span /p p style=" text-align: justify line-height: 1.75em "   蛋白质组信息学技术主要是用来构建蛋白质相互用网络的相关技术。蛋白质组的分离技术和质谱技术的不同联合就形成了各种类型的蛋白质组学分析技术:如2DE-MS和2DLC-MS。2DE-MS 又有2DE-MALDI-PMF 和2DE-ESI-LC-MS/MS, 该技术在蛋白质组学研究的头10-15 年是其主要技术,然而常规概念认为2DE 的通量不高,即一个2D 胶点中一般仅含有1 ~ 2 个蛋白质,通常一次实验其通量仅能鉴定几十到一千个蛋白质,这样其在蛋白质组学中的地位逐渐被淡化。 /p p style=" text-align: justify line-height: 1.75em text-indent: 2em " 2DLC-MS 主要有iTRAQ or TMT-based SCX-LC-MS/MS and labelfree LC-LC-MS/MS, 这就是人们通常说的“Bottomup”蛋白质组学,该技术在最近10 ~ 15 年在蛋白质组学中起着核心技术的作用,因为其通量明显增加,一次实验其通量可达到几千到一万的蛋白质能被鉴定,但该法鉴定的结果是一个protein group, 实质上鉴定的是编码蛋白质的基因, 而并没有鉴定到真正意义上的蛋白质,即蛋白质存在形式(Proteoforms 或Protein species)。蛋白质存在形式(Proteoforms)是蛋白质组的基本单元。人类基因大约2 万个,人类转录本至少10 万个,每个转录本指导核糖体按三联密码子决定一个氨基酸残基来合成氨基酸序列,刚合成出来的蛋白质氨基酸序列是没有功能的,它必须到达其指定的位置如胞内、胞外,和不同的亚细胞器等,形成特定的三位空间结构,并与其周围的相关分子相互作用,形成一个复合物(complex)才能发挥其功能作用。从核糖体刚合成出来到其指定的位置过程中有很多的蛋白质翻译后修饰(PTMs 据估计人体有400 ~ 600 种PTMs)。我们最近对蛋白质存在形式的概念给出了最新最完整的定义:蛋白质的氨基酸序列+ 翻译后修饰+ 空间构型+ 辅助因子+ 结合伴侣分子+ 空间位置+ 特定的功能。而蛋白质的概念被定义为:由同一个基因编码的所有蛋白质存在形式的集合体。这样,人类蛋白质组中的蛋白质存在形式(Proteoforms)至少有100 万或甚至达10 亿 (图1)。 /p p style=" text-align: center" img style=" max-width: 100% max-height: 100% width: 600px height: 427px " src=" https://img1.17img.cn/17img/images/202008/uepic/1d18fad3-b010-4ea5-a812-432853ad4ec6.jpg" title=" 1111111.png" alt=" 1111111.png" width=" 600" height=" 427" border=" 0" vspace=" 0" / /p p style=" text-align: center line-height: 1.75em "   图1 :Proteoforms 的概念及形成模式 (Zhan et al,Med One, 2018 Zhan et al., Proteomes, 2019) /p p style=" text-align: justify line-height: 1.75em "   如此庞大数量的Proteoforms/Protein species, 如何对其进行大规模的探测、鉴定和定量,是一个至关重要的事情。目前关于Proteoforms 的研究有两套策略一是“Top-down”MS 技术, 二是“Top-down” 和“Bottom-up”相结合的技术即2DE-LC/MS 技术(图2)。 /p p style=" text-align: center" img style=" max-width: 100% max-height: 100% width: 600px height: 415px " src=" https://img1.17img.cn/17img/images/202008/uepic/94f48c94-fd0b-4959-90fb-dd399cebf074.jpg" title=" 2.png" alt=" 2.png" width=" 600" height=" 415" border=" 0" vspace=" 0" / /p p style=" text-align: center line-height: 1.75em "   图2 :Proteoforms 研究技术比较(Zhan et al., Med One, 2018 Zhan et al., Proteomes, 2019) /p p style=" text-align: justify line-height: 1.75em "   “Top-down”MS 技术能探测、鉴定和定量Proteoforms,获得蛋白质的氨基酸序列和PTMs 信息,然而该技术的通量较低,目前最大通量鉴定到5700 个Proteoforms, 对应到860 蛋白质。 /p p style=" text-align: justify line-height: 1.75em "   最近,詹显全教授团队发现2DE-LC/MS 技术是一超高通量的技术平台,在探测、鉴定和定量Proteoforms方面, 可以鉴定达几十万至上100 万的Proteoforms。随着质谱灵敏度的显著提高,自2015 年以来,詹显全教授团队就发现每个2D 胶点包含了平均至少50 个甚至达几百个Proteoforms,并且大多数是低丰度的 并在近1 ~ 2 年来发表了相关论文来全面阐述2DE-LC/MS 的新理念和实践,完全打破了40 多年来人们对双向电泳的传统认识 (即一个2D 胶点中一般仅含有1 ~ 2 蛋白质),为大规模的Proteoforms 研究提供了技术基础。Proteoforms/Protein species 概念的发展极大的丰富了蛋白质组的内涵,是蛋白质组学研究的更高层次,是国际科学发展的前沿,必将影响着整个生命科学和医学科学的研究和实践,有助于发现可靠而有效的疾病标志物,用于深度理解疾病分子机制和决定药物靶点,或者用于有效的预测、诊断、预后评估。另外,蛋白质组是表型组的重要成分,是基因组功能的最终执行者,是基因组和转录组研究所不能替代的,要实现真正的个性化医学和精准医学,蛋白质组学研究是不能绕过去的。 /p p style=" text-align: center line-height: 1.75em "    span style=" color: rgb(0, 112, 192) " strong 基于整合组学发现疾病标志物才是精准发展之重 /strong /span /p p style=" text-align: justify line-height: 1.75em "   1. 您一直专注于肿瘤蛋白质组学的研究,例如垂体瘤、卵巢癌等相关恶性肿瘤结合组学的研究,请谈谈在这方面的最新的研究成果,以及过程中的主要挑战和解决方案 /p p style=" text-align: justify line-height: 1.75em "   詹显全: 垂体瘤是颅内常见肿瘤,绝大多数是良性的,只有少数具有侵袭性和恶性,并能引起激素分泌紊乱和颅内压迫症状,出现严重的临床症状,危害人体健康。临床上分为功能性垂体瘤和非功能性垂体瘤,并且非功能性垂体瘤不表现血中激素水平增加,不易早期诊断,经常是当肿瘤体积增加到压迫周围组织器官产生压迫综合征时才被诊断,这时已经是中晚期了,且其分子 /p p style=" text-align: justify line-height: 1.75em "   机制并不清楚,缺乏早期诊断标志物和药物治疗靶标。因此,非功能性垂体瘤被选为主要研究对象。虽然垂体瘤是在颅内,但我们认为垂体瘤是一种多病因、多过程、多结果的全身性的慢性疾病,并且还具有肿瘤的异质性 它涉及到一系列的分子改变,包括发生在基因组、转录组、蛋白质组、代谢组和相互作用组水平上的改变,而这些不同水平改变的分子和信号通路又不是孤零零的起作用,而是相互间具有千丝万缕的联系。因此,我们很难用一种单一因素来解决其预测、预防、诊断、治疗和预后评估 而必须从单因素模式转向多参数系统思维模式。垂体瘤的多病因、多过程、多结果、全身性、慢性、分子网络系统性给其“同病同治”提出了严峻挑战,同时为实现其个性化的精准预测、精准预防、精准诊断和精准治疗提供了机遇和条件。多组学(基因组学、转录组学、蛋白质组学、代谢组学、影像组学)和系统生物学技术的发展驱动了这一多参数系统思维模式的转变、推进了其个性化医学和精准医学的研究和实践。因此,我们认为多参数系统策略观和多组学是进行垂体瘤个性化医学和精准医学的研究和实践的重要理念和技术方案。 /p p style=" text-align: justify line-height: 1.75em "   我们从2001 开始进行垂体瘤的蛋白质组学及其翻译后修饰组学研究,从2008 年开始进行多组学和分子网络研究,及预测预防个体化医学(PPPM)和精准医学(PM)研究。经过过去近20 年未间断的研究,我们在垂体瘤的蛋白质组学、翻译后修饰组学、多组学、分子网络和系统生物学研究方面在国际上处于了主导地位。 /p p style=" text-align: justify line-height: 1.75em "   在我们研究过程中,我深深体会到一个重大思转变就是从以前的单参数模式转向了多参数系统思维模式,这符合肿瘤的真实情况。另外,就是多组学技术促进了这一模式的转变,并是其主要的解决方案。 /p p style=" text-align: justify line-height: 1.75em "   2. 从您的研究方向及重点出发,您认为多组学研究在精准医学中接下来的研究应当侧重于哪些方面,以及如何才能比较好的实现从研究到临床的转化落地? /p p style=" text-align: justify line-height: 1.75em "   詹显全:我的研究对象是肿瘤(垂体瘤、卵巢癌、肺癌、胶质瘤),研究理念是肿瘤的多参数系统策略观,技术手段是多组学和系统生物学,研究的目标是要解决肿瘤的预测预防个体化医学(PPPM)和精准医学(PM)。 /p p style=" text-align: justify line-height: 1.75em "   我们认为多组学中的不同组学对PPPM/PM 的贡献是不平衡的,即个性化的表型组是基因组通向PPPM/PM 应用实践的桥梁,而蛋白质组和代谢组是表型组中两重要成分。蛋白质组的内涵包括蛋白质的拷贝数变化、剪切变化、翻译后修饰、转位、再分布、空间构型、与周围分子相互作用、及信号通路网络问题。代谢组的内涵涉及到体内所有物质(包括糖、脂、蛋白质、核酸)的代谢产物及其代谢网络问题。要真正实现PPPM 和PM,蛋白质组和代谢组的贡献是基因组所不能替代的是不能绕过去的。人们应从以基因组为中心的研究和实践转向以表型组为中心的研究和实践。其中蛋白质组的研究又应以翻译后修饰和蛋白质存在形式(Proteoforms)作为今后的研究方向。Proteoforms 的研究必将影响着整个生命科学和医学科学。从临床转化研究来看,基于多组学的整合生物标志物是发展方向。对于这里的生物标志物,我们将其分为两类:一类是解决疾病分子机制和药物靶点的生物标志物,这类生物标志物一定要有因果关系 一类是解决预测、诊断、预后评估的生物标志物,这类标志物不一定要求有因果关系,但必要要有量的变化。 /p p style=" text-align: justify line-height: 1.75em "   3. 作为EPMA(欧洲预测预防个体化医学协会)的中国代表,想请您分享下国际上对于组学研究在精准医疗中的应用现状、趋势以及发展规划 /p p style=" text-align: justify line-height: 1.75em "   詹显全:欧洲预测预防个体化医学协会(EPMA)是国际个体化医学领域领头的学术协会,由来自全球55 个国家和地区的专家学者组成,其创办的官方杂志EPMA Journal( 中科院2 区,ESI IF5.661) 涵盖了24 个专题内容,较全面地反映了预测预防个体化医学(PPPM)和精准医学(PM)的研究、实践与最新动态,还涉及到PPPM 和PM 的政策、伦理、卫生经济和社会保障等许多方面,为PPPM 和PM 的科研、实践提供了一个很好的交流平台。 /p p style=" text-align: justify line-height: 1.75em text-indent: 2em " 我本人作为EPMA 的中方代表(National Representative of EPMA in China) 和其官方杂志EPMA Journal 的副主编,参与了其经历的重要活动。我从2008 开始起在EPMA 中主要负责多组学和创新技术方面,在EPMA 白皮书中的“肿瘤预测预防个体化医学的多参数系统策略观”这部分最早就是我写的,之后我们写了一系列文章来论述基于多组学的多参数系统策略的研究和实践。因此,在EPMA,我们的基于多组学的多参数系统策略观还是比较早的,近五六年来多组学研究在EPMA 圈内(55 个国家和地区)发展得很快,已经深入到PPPM 的各个领域。 /p p style=" text-align: justify line-height: 1.75em "   另外,我认为,精准医学在理念上没错,严格意义上的精准医学是个理想化的概念,人们只能无限去逐步接近它。现阶段搞精准医学还是要回归到人类健康的保护过程,即预测、预防、诊断、治疗和预后评估,这里应该是针对个人来说而不是针对群体,严格说来应该是个性化的精准预测、精准预防、精准诊断、精准治疗和精准预后评估。对于人类健康保护过程来说,预测、预防还是上策,其次就是早诊断、早治疗。多组学研究已渗入到人类健康保护过程的每个环节,主要用来寻找基于多组学的生物标志物,当然这里的生物标志物应泛指前面说的两类:一类是解决疾病机制和治疗靶点的标志物,一类是解决预测、诊断、预后评估的标志物。 /p p style=" text-align: justify line-height: 1.75em text-indent: 2em " 因此,基于多组学的PPPM/PM 的研究和实践一定是今后发展的一个长远趋势。 /p p style=" text-align: center" img style=" max-width: 100% max-height: 100% width: 600px height: 802px " src=" https://img1.17img.cn/17img/images/202008/uepic/581ff7cf-5c3e-4fd6-8f5f-805989791ee5.jpg" title=" 詹.jpg" alt=" 詹.jpg" width=" 600" height=" 802" border=" 0" vspace=" 0" / /p p br/ /p
  • 中国科大建立新的蛋白质从头设计方法
    近期,中国科学技术大学教授刘海燕、副教授陈泉团队采用数据驱动策略,提出一条全新的蛋白质从头设计路线,相关成果2月9日以“用于蛋白质设计的以主链为中心的神经网络能量函数”为题发表于《自然》(Nature)杂志。  蛋白质是生命功能的主要执行者,其结构与功能由氨基酸序列所决定。目前,能够形成稳定三维结构的蛋白质几乎全部是天然蛋白质,其氨基酸序列是长期自然进化形成。在天然蛋白结构功能不能满足工业或医疗应用需求时,想要得到特定的功能蛋白,就需对其结构和序列进行设计。目前,国际上报道的蛋白质从头设计工作主要使用天然结构片段作为构建模块来拼接产生人工结构。然而这种方法存在设计结果单一、对主链结构细节过于敏感等不足,限制了设计主链结构的多样性和可变性。蛋白质从头设计中最困难的问题是如何充分地探索蛋白质主链结构空间,发现新颖的、“高可设计性”主链结构,目前还缺乏相关的系统性解决方法。   中国科大相关团队长期深耕计算结构生物学方向的基础研究和应用基础研究。刘海燕、陈泉团队十余年来致力于发展数据驱动的蛋白质设计方法,经过长期不懈努力,建立并实验验证了给定主链结构设计氨基酸序列的ABACUS模型,进而发展了能在氨基酸序列待定时从头设计全新主链结构的SCUBA模型。SCUBA采用一种新的统计学习策略,基于核密度估计(或近邻计数,NC)和神经网络拟合(NN)方法,从原始结构数据中得到神经网络形式的解析能量函数,能够高保真地反应实际蛋白质结构中不同结构变量间的高维相关关系,在不确定序列的前提下,连续、广泛地搜索主链结构空间,自动产生“高可设计性”主链。  理论计算和实验证明,用SCUBA设计主链结构,能够突破只能用天然片段来拼接产生新主链结构的限制,显著扩展从头设计蛋白的结构多样性,进而设计出不同于已知天然蛋白的新颖结构。“SCUBA模型+ABACUS模型”构成了能够从头设计具有全新结构和序列的人工蛋白完整工具链,是RosettaDesign之外目前唯一经充分实验验证的蛋白质从头设计方法,并与之互为补充。在该研究中,团队展示了9种从头设计的蛋白质分子的高分辨晶体结构,它们的实际结构与设计模型一致,其中5种蛋白质具有天然蛋白质中尚未观察到的新型拓扑结构。   Nature审稿人认为,“与现有方法不同,现有方法要么使用参数方程来描述预定义螺旋结构的空间,要么基于片段组装的方法依赖于已知蛋白质片段。SCUBA方法原则上允许人们探索任意主链结构,然后填充序列,允许人们设计比自然界中观察到的更广泛的蛋白质几何结构”,“蛋白质从头设计仍然具有挑战性,本工作中六种不同蛋白质的高分辨率设计是一项重要成就,表明此方法工作良好”,“本研究中报道的成功设计数量之多令人印象深刻,并提供了强有力的证据,证明了基础技术是鲁棒的。所采用的基于神经网络的能量项是新颖的,因为它们刻画了更传统的统计方法无法企及的多维特征,该方法具有足够的新颖性和实用性”。   该研究为工业酶、生物材料、生物医药蛋白等功能蛋白的设计奠定了基础。研究工作得到科技部、国家自然科学基金委和中科院的资助支持。   论文链接
  • 蛋白质结构解析六十年
    几种不同折叠模式的蛋白质模型(图片来源Protein Data Bank Japan )   上个世纪初,科学家们认为蛋白质是生命体的遗传物质,而具有独特的作用。随着这个理论被证伪,真正的遗传物质DNA的结构被给予了很大关注。然而,蛋白质作为生命体的重要大分子,其重要性也从未被忽视,而且在1950年代开始,科学家一直在探寻DNA序列和蛋白质序列的相关性。与此同时,蛋白质测序和结构解析蛋白质结构的努力开始慢慢获得回报。更多的生化研究揭示了蛋白质的功能重要性,因此蛋白质的三维结构的解析对于深入理解蛋白质功能和生理现象起着决定性作用。   本文简要回顾了蛋白质结构解析的重大历史事件,并总结了蛋白质结构解析的常用方法和结构分析方向。通过了解蛋白质结构,能够让我们更好地理解生物体的蛋白的理化特性,以及其相关联的化学反应途径及其机制,对于我们认识生物世界和研发治疗方法和药物都起着关键作用。在即将召开的2015高分辨率成像与生物医学应用研讨会上,各位专家学者将会进一步讨论相关议题。   蛋白质结构解析六十年来大事件   在1958年,英国科学家John Kendrew和Max Perutz首先发表了用X射线衍射得到的高分辨率的肌红蛋白Myoglobin的三维结构,然后是更加复杂的血红蛋白Hemoglobin。因此,这两个科学家分享了1962年的诺贝尔化学奖。事实上,这项工作在早在1937年就开始了。   然后在1960年代,蛋白质结构解析方法不断进步,获得了更高的解析精度。这个时期,蛋白质序列和DNA序列间关系也被发现,中心法则被Francis Crick提出,然后科学界见证了分子生物学的崛起。分子生物学(Molecular Biology)的名称在1962年开始被广泛接受和使用,并逐渐演变出一些支派,如结构生物学。然后在1964年,Aaron Klug提出了一种基于X射线衍射原理发展而来的全新的方法电子晶体学显微镜(crystallographic electron microscopy ),可以解析更大蛋白质或者蛋白质核酸复合体结构。因为这项研究,他获得了1982诺贝尔化学奖。1969年,Benno P. Schoenborn 提出可以用中子散射和原子核散射来确定大分子中固定位置的氢原子坐标。   进入1970年代,很多新的方法开始发展。存储蛋白质三维结构的Protein Data Bank(1971年) 开始出现,这对于规范化和积累蛋白质数据有着重要意义。1975年新的一种仪器叫做多丝区域检测器,让X-ray的检测和数据收集更加快速高效。次年,Robert Langride将X-ray衍射数据可视化,并在加州大学圣地亚哥分校成立了一个计算机图形实验室。同年,KeithHodgson和同事首次证明了可以使用同步加速器获得的X射线并对单个晶体进行照射,并取得了很好的实验效果。然后在1978年,核磁共振NMR首次被用于蛋白质结构的解析 同年首个高精度病毒(西红柿丛矮病毒)衣壳蛋白结构被解析。   在1980年代,更多蛋白质结构被解析,蛋白质三维结构的描述越来越成熟,而且蛋白质结构解析也被公认成为药物研发的关键步骤。在1983年,冷冻蚀刻的烟草花叶病毒结构在电子显微镜结构下得到描述。两年后德国科学家John Deisenhofer等解析出了细菌光合反应中心,因此他们共享了1988年的诺贝尔化学奖。次年,两个课题组解析了HIV与复制相关的蛋白酶结构,对针对HIV的药物研发提供了理论基础。   下一个十年,因为大量同步加速器辅助的X射线衍射的使用,数千个蛋白质结构得到解析,迎来了蛋白质结构组的曙光。1990年多波长反常散射方法(MAD)方法用于X射线衍射晶体成像,与同步辐射加速器一起,成为了近二十多年来的最常用的的方法。Rod MacKinnon在199年发表了第一个高精度的钾离子通道蛋白结构,对加深神经科学的理解起了重要作用,因此他分享了2003年的诺贝尔化学奖。Ada Yonath等领导的课题组在1999年首次解析了核糖体结构(一种巨大的RNA蛋白质复合体)。  进入新千年,更多的技术细节被加入到蛋白质解析研究领域。2001年,Roger Kornberg和同事们描述了第一个高精度的RNA聚合酶三维结构,正因此五年后他们共享了诺贝尔化学奖。2007年,首个G蛋白偶联受体结构的解析更是对药物研究带了新的希望。近些年来,越来越多的大的蛋白质结构得到解析。Cryo-EM超低温电子显微镜成像用于超大蛋白质结构成像的研究日益成熟,并开始广泛用于蛋白质结构的解析。   蛋白质结构解析的常用实验方法   1.X-ray衍射晶体学成像   X射线衍射晶体学是最早用于结构解析的实验方法之一。X射线是一种高能短波长的电磁波(本质上属于光子束),被德国科学家伦琴发现,故又被称为伦琴射线。理论和实验都证明了,当X射线打击在分子晶体颗粒上的时候,X射线会发生衍射效应,通过探测器收集这些衍射信号,可以了解晶体中电子密度的分布,再据此析获得粒子的位置信息。利用这种特点,布拉格父子研制出了X射线分光计并测定了一些盐晶体的结构和金刚石结构。首个DNA结构的解析便是利用X射线衍射晶体学获得的。   后来,获得X射线来源的技术得到了改进,如今更多地使用同步辐射的X射线源。来自同步辐射的X射线源可以调节射线的波长和很高的亮度,结合多波长反常散射技术,可以获得更高精度的晶体结构数据,也成为了当今主流的X射线晶体成像学方法。由X射线衍射晶体学解析的结构在RCSB Protein Data Bank中占到了88%。   X射线衍射成像虽然得到了长足的发展,仍然有着一定的缺点。X射线对晶体样本有着很大的损伤,因此常用低温液氮环境来保护生物大分子晶体,但是这种情况下的晶体周围环境非常恶劣,可能会对晶体产生不良影响。而且,X射线衍射方法不能用来解析较大的蛋白质。   上海同步辐射加速器外景(图片来源 上海同步辐射光源网站)   2.NMR核磁共振成像   核磁共振成像NMR全称Nuclear magnetic resonance,最早在1938被Isidor Rabi (1946年诺贝尔奖)描述,在上世纪的后半叶得到了长足发展。其基本理论是,带有孤对电子的原子核(自选量子数为1)在外界磁场影响下,会导致原子核的能级发生塞曼分裂,吸收并释放电磁辐射,即产生共振频谱。这种共振电磁辐射的频率与所处磁场强度成一定比例。利用这种特性,通过分析特定原子释放的电磁辐射结合外加磁场分别,可以用于生物大分子的成像或者其他领域的成像。有些时候,NMR也可以结合其他的实验方法,比如液相色谱或者质谱等。   RCSB Protein Data Bank数据库中存在大约11000个用NMR解析的生物大分子结构,占到总数大约10%的结构。NMR结构解析多是在溶液状态下的蛋白质结构,一般认为比起晶体结构能够描述生物大分子在细胞内真实结构。而且,NMR结构解析能够获得氢原子的结构位置。然而,NMR也并非万能,有时候也会因为蛋白质在溶液中结构不稳定能难得获取稳定的信号,因此,往往借助计算机建模或者其他方法完善结构解析流程。   使用NMR解析的血红蛋白结构建模(图片来源RCSB PDB)   3.Cryo-EM超低温电子显微镜成像   电子显微镜最早出现在1931年,从设计之初就是为了试图获得高分辨率的病毒图像。通过电子束打击样本获得电子的反射而获取样本的图像。而图像的分辨率与电子束的速度和入射角度相关。通过加速的电子束照射特殊处理过的样品表明,电子束反射,并被探测器接收,并成像从而获得图像信息。具体做法是,将样品迅速至于超低温(液氮环境)下并固定在很薄的乙烷(或者水中),并置于样品池,在电子显微镜下成像。图像获得后,通过分析图像中数量众多的同一种蛋白质在不同角度的形状,进行多次的计算机建模从而可以获得近原子级别的精度(最低可以到2.0埃)。   Cyro-EM解析TRPV1离子通道蛋白(图片来源Structure of the TRPV1 ion channel )   将电子显微镜和计算机建模成像结合在一起的大量实践还是在新世纪之后开始流行的。随着捕捉电子的探测器技术(CCD技术,以及后来的高精度电子捕捉、电子计数electron counting设备)的提升,更多的信息和更低的噪音保证了高分辨率的图像。   近些年来,Cryo-EM被用来解析很多结构非常大(无法用X-ray解析)的蛋白质(或者蛋白质复合体),取得了非常好的结果。同时,单电子捕捉技术取代之前的光电转换成像的CCD摄像设备,减少了图像中的噪音和信号衰减,同时并增强了信号。计算机成像技术的成熟和进步,也赋予了Cryo-EM更多的进步空间。然而,Cyro-EM与X-ray不同,该方法不需要蛋白质成为晶体,相同的是都需要低温环境来减少粒子束对样品的损害。   除去介绍的这三种方法以外,计算机建模技术也越来越多地被用在了蛋白质结构解析中。而且新解析的结构也会提高计算机建模的精确度。未来,我们或许能够用计算机构建原子级别的细胞模型,构建在芯片上的细胞。   蛋白质结构对了解生命体的生化反应、有针对性的药物研发有着重要意义。从1958到如今已经接近60年,蛋白质结构解析得到了较快的发展。然而,在如今DNA测序如此高效廉价的时代,蛋白质和DNA结构解析并没有进入真正高速发展阶段,这也导致了在如此多的DNA序列数据非常的今天,结构数据却相对少的可怜。大数据时代的基因组、蛋白质组、代谢组、脂类组等飞速发展的时候,蛋白质结构组也得到了更加广泛的重视。发展高精度、高效的结构解析技术也一直都有着重要意义。未来,蛋白质结构解析,对针对蛋白质的药物筛选,和计算机辅助的药物研究研究不应被低估。未来说不定在蛋白质结构领域有着更多惊喜,让我们拭目以待。 第一届电镜网络会议部分视频回放
  • 安捷伦助力中国蛋白质组研究,金牌赞助“2010蛋白质组学与疾病”专题研讨会
    蛋白质组学研究是我国目前生命科学研究的前沿和重点研究项目,“十一五”期间我国蛋白质组学研究取得多项重大成果,以北京蛋白质组研究中心为代表的国内科研机构更是将我国蛋白质组研究提升到世界领先地位!2009年9月科技部中国生物技术发展中心在深圳组织召开了有关蛋白质组研究战略研讨会,标志着“十二五”发展战略规划蛋白质组研究项目正式启动!我国的蛋白质组研究将迎来一个新的发展机遇期。   为了积极促进我国蛋白质组学的研究与发展,中国生物化学与分子生物学会蛋白质组学专业委会主办、北京蛋白质组研究中心和德国慕尼黑国际博览集团承办的“2010蛋白质组学与疾病”专题研讨会定于9月16-18日慕尼黑上海分析生化展期间在上海新国际博览中心召开。   此次研讨会由北京蛋白质组研究中心技术总监钱小红教授担任会议主席,中国生物化学与分子生物学会蛋白质组学专业委员会主任贺福初院士担任名誉主席。 大会将重点围绕蛋白质组学及其在疾病研究中的应用取得的新进展进行研讨。演讲嘉宾将包括:中南大学湘雅医院院长陈主初教授,复旦大学化学系杨芃原教授,中国协和医科大学赵晓航研究员,北京蛋白质组研究中心魏开华研究员,徐平研究员,姜颖副研究员等。   安捷伦科技公司作为大会的金牌赞助商将全程支持此次大会的召开。在同期举办的analytica China 慕尼黑上海分析生化展上,安捷伦科技公司也将向广大用户全面展示包括在蛋白质组学与疾病研究领域的高端仪器在内的各类仪器产品以及“以先进的技术和整体解决方案为用户提供一站式服务”的理念。欢迎届时参观安捷伦科技的展台1202。   “2010蛋白质组学与疾病”专题研讨会:http://www.a-c.cn/ac/Conference/Proteomics/   关于安捷伦科技   安捷伦科技(NYSE: A)是全球领先的测量公司,是通信、电子、生命科学和化学分析领域的技术领导者,公司的18,000名员工在110多个国家为客户服务。在2008财政年度,安捷伦的业务净收入为58亿美元。要了解安捷伦科技的信息,请访问:http://www.instrument.com.cn/netshow/SH100320/。
  • 蛋白质组学全球市场已达500亿美元
    01 摘要蛋白质组学目前的研究活动的成长与基因组学早期的发展轨迹相似。基因组学花费了大概十年的时间实现了产业化。尽管蛋白质组学技术起步的时间比基因组学更早,但蛋白质组学相对更大的复杂性导致其与基因组学相比需要更先进的技术。然而,今天,蛋白质组学的重要研究瓶颈正在被不断突破,让科学家们看到了其在研究、转化和临床意义上达到与基因组学相当的水平的前景。因此,随着时间的推移,蛋白质组学在研究和临床中应用的商业机会将与基因组学的可用市场总量(TAM)规模趋于一致,目前全球TAM已经达到500亿美元。并且我们有理由相信,由于蛋白质组学动态、变化的性质将使得其超过基因组学而转化为更加具有经常性、重复性的临床应用。质谱是最能促进蛋白质组学工业化的技术,但其工作流程的标准化,尤其是样品制备阶段的标准化,仍然存在着挑战。对于长期投资商来说,应该对在这个生态圈中拥有于众不同知识产权的供应商给与更大的关注。尽管以基于高元多工分析方法为代表的新兴检测方法与质谱方法相比仅处于早期发展阶段,但也具有巨大的潜力。02 背景与投资情况论述生命的基本构成部分是核酸和氨基酸。核酸是基因的基本构成成分。氨基酸是蛋白质的基本构成成分。事实上,我们体内每个细胞的成分都可以归类于蛋白质、基因、脂质或碳水化合物这四类大分子化合物。脂质和碳水化合物组成简单不易出错。因此,最重要的是对基因和蛋白质进行深入了解。我们对人类生物学的理解,从细胞功能到疾病的因果关系,再到药物治疗,都是我们对基因组学和蛋白质组学知识的衍生品。在20世纪,先进显微镜和生物化学技术的发明导致我们对基于结构的蛋白质和基因的理解有了很大的进步。在21世纪,基因组学经历了一场革命,使其从一个刚刚起步的研究领域经历了工业化的过程,成为了临床生物学重要方面。这不仅使得人类对生物学有了更深更新的了解,也提供了包括液体活检诊断,CAR-T细胞治疗,甚至是mRNA疫苗的一系列新的临床治疗及诊断方法。蛋白质组学在21世纪也取得了重要进展。这不仅是由于质谱和X射线晶体学等成像方面新技术的出现,也是由于免疫检定试剂方面的生物化学方法创新,使得我们可以分离特定的蛋白进行进一步的研究。与基因组学相比,蛋白质组学还未取得飞跃。这并不是由于它相对于基因学的有较小的前景和应用场景,这只与它的方法的复杂性有关。我们认为,下一个十年蛋白质组学将进入快车道,使生物学研究、医学治疗和诊断方面进入一个以蛋白质为中心的新时代。蛋白质组学的挑战。超过95%的获得FDA批准的药物都是以蛋白质为目标,但蛋白质组中的多数组分却尚未被人们所了解。我们相信,十年后,西方国家的蛋白质组学公司所创造的股权价值将与今天基于基因组学的公司所创造的约2500亿美元的市值相当或更多。创新的速度正在加快:在1869年由弗里德里希-米歇尔(Friedrich Miescher)发现核酸之后近85年才由沃森和克里克于1953年发现了DNA双螺旋。从沃森和克里克的发现到2001年第一个人类基因组序列的发表花费了近50年时间。从2001年人类基因组的第一份草图到2021年7月公布的第一份完整序列花费了20年时间。总而言之,从核酸发现到确定完整的人类基因组花费了近155年的时间。在接下来的155年里,创新的速度将呈指数型增长,而蛋白质组学将是其中最大的受益者。03 蛋白质组学的今天:挑战与机遇什么是蛋白质组学?它为什么重要?图一:蛋白质组学受益于多种技术跨越式进步蛋白质组学作为一个术语首次出现在1996年,它被定义为对一个细胞系的整个蛋白质图谱进行大规模表征。蛋白质组学的要点是完整性和深度:通过检测和解读该细胞中的所有蛋白质的作用以及相互作用来彻底了解细胞功能,而不是应用传统的通过抗体分离已知蛋白质的方法单独检测每个蛋白质。基于抗体的蛋白质检测将继续在后续的工作中得到应用,但蛋白质组学是针对所有蛋白质,它们的相互作用,及其多种形态的大规模、高通量、高灵敏度的分析。因为蛋白质修饰和相互作用出错是发生疾病的通常原因,蛋白质组学研究对理解造成疾病发生的原因非常重要,Source: Graves PR, Haystead TA., Molecular biologist’s Guide to Proteomics(2002)04 蛋白质组学和基因组学之间的关系是什么?当马克-威尔金斯(Mark Wilkins)在1996年首次使用蛋白质组学一词时,他明确表示他指的是“基因组的补充”。基因是细胞的说明书。通过RNA的表达,他们指示细胞要构建哪些蛋白质。蛋白质细胞构建之后,它们通过与其他蛋白质和环境的相互作用而被翻译和修饰。因此,1) 基因组学的大部分功能效用通过蛋白质组体现;2) 下游事件-包括蛋白质间的相互作用,新的蛋白质形态和动态修饰的产生,及其对细胞分裂的影响-是蛋白质组学而不是基因组学的主题。Source: Virag D, Dalmadi K B. Current Trends in the Analysis of Post-translational Modifications (2020)因此,基因组学和蛋白质组学是相互关联的,而不是分开的,但蛋白质组学在功能上更为重要及复杂。有25000个独立的基因,但有超过100万种蛋白形式。虽然一个人的基因组不会改变,但一个人的蛋白质组是动态的。身体里的变化是通过蛋白质的修饰来表达的。你出生时的基因组和今天一样。但你的蛋白质组每天都在变化。05 为什么蛋白质组学研究如此困难?1. 分子的复杂性和多样性Source: Creative-Proteomics.com蛋白质分子本身的分子结构更为复杂。DNA是由4种核苷酸组成的,而蛋白质是由20种不同的氨基酸组成的。翻译后修饰,如甲基化和羟基化,改变了蛋白质的形态和功能。每个蛋白质可以有9种不同的蛋白形式。取决于翻译后修饰和蛋白质间的相互作用。这意味着同一个蛋白质可以有9种不同的功能。DNA的分子结构相对简单,有4种核苷酸变体,这意味着基因测序方法(如合成测序)不能应用于蛋白质组。需要新的、更复杂的、定制的方法来捕获生物样本中数百万种不同的蛋白质形态。2. 动态范围问题Source: Montanaro Research Aebersold R., Targeted Proteomic Strategy for Clinical Biomarker Discovery (2009)Y轴表示血浆样品中特定蛋白质分子的浓度和丰度。虽然有些蛋白质的含量极高,但大多数蛋白质类型的浓度很小,甚至可以忽略不计。红圈中的蛋白质存在于蛋白质组的“黑暗角落”,在这种极低的丰度下,这些蛋白质非常难以测得。大多数蛋白质的丰度极低。在血浆细胞中发现的约12,000个独立的蛋白质中,前10个占总蛋白量的90%,而其他约11,990个仅占10%。3. 少数的暴政如下饼图显示了血浆样品中蛋白质的相对丰度。单一的一种蛋白质,即血浆白蛋白,占了57%的总丰度,使读取其余的1万种蛋白质更加困难。Source: Anderson NG., Molecular Cell Proteomics (2002)06 蛋白质组学市场机遇有多大?我们相信,蛋白质组学在分子生物学研究以及临床医学和诊断方面有与基因组学一样远大的前景。Source: Montanaro Research自2001年第一个人类基因组的组装以来,基因组学已经成为生物医学的一个工业化部分, 纯基因组学公司的总市值达到2400亿美元。Illumina是其中最大的公司。蛋白质组学TAM(可用市场总量)如今已经达到数百亿美元。Somalogic estimate the total TAM to be $50 bn (Source: Somalogic)虽然临床应用方面的TAM具有最大的长期潜力,但在未来5年内研究和发展方面的TAM是最容易解决的。Source: Souda P., Proteomics: The Next Frontier, SVB Leerink (2021)SVB Leerink的蛋白质组学专家Puneet Souda估计,目前仅美国的研发TAM 有140亿美元,这基于学术界和制药业共约 26,100 个实验室总经费的2.5%的保守估计。如果我们把西方国家的实验室数量看作是约50,000个,并更合理的假设占总经费的5%的资金分配给蛋白质组学研究,我们估计在全球发达经济体中的蛋白质组学研发TAM为500亿美元。
  • Science:人类蛋白质图谱分析大进展
    2015年1月23日一期的Science公布了基于人类蛋白质图谱的大分析结果,包括与癌症相关的详细蛋白质图片,血液中蛋白质种类和数量,以及市场上被批准的所有药物所作用的目标蛋白质。 人类蛋白质图谱(The Human Protein Atlas),是由Knut and Alice Wallenberg基金会于2014年11月支持的一个大型跨国研究项目。近期他们又开放了一个以人器官组织为基础的蛋白质图谱数据库。基于1300万个注释的图像,整个数据库涵盖了人体中的所有主要组织和器官的蛋白质分布,也标注了仅表达在特定组织,如脑,心脏或肝脏的蛋白。作为一个开放的数据资源,这个数据库提高了对人类生物学的基本见解,更有望帮助推动新的诊断和药物的开发。 在Science的这篇文章里,"基于组织的人类蛋白质组图谱" 结合基因组学,转录组学,蛋白质组学,以及基于抗体的分析,详细分析了大约20,000个蛋白质编码基因。分析结果表明,蛋白编码基因几乎一半都是普遍表达在所有分析的组织。而有大概的15%的蛋白质编码基因大量表达在一个或几个特定的组织或器官,包括众所周知的组织特异性蛋白质,如胰岛素和肌钙蛋白。睾丸是含有最丰富种类蛋白质的器官,其后是大脑和肝脏。分析结果还表明,大约3000种蛋白质是从细胞中分泌释放的,另有5500种蛋白位于细胞膜结构。 这一蛋白质图分析结果为制药行业的提供了重要信息。研究小组的Uhlé n表示,他们发现了市场上使用的药品有70%的作用目标是分泌或膜结合蛋白。有趣的是,另外30%被发现是作用其他组织和器官,这可能有助于解释药物的一些副作用,并且对未来药物开发提供一定的参考价值。 该数据库已经免费对外开放,网址是www.proteinatlas.org.
  • 蛋白质浓度测定常用的三种方法
    测定蛋白质浓度的方法有很多,科研工作者广泛使用的方法比如紫外吸收法,双缩脲法,BCA方法,Lowry法,考马斯亮蓝法,凯氏定氮法等等 ,今天小编以UV法,BCA法,考马斯亮蓝法,其中的三种方法的测定蛋白质浓度的原理、优缺点、操作以及注意事项做详细介绍。UV法这种方法是在280nm波长,直接测试蛋白。选择Warburg 公式,光度计可以直接显示出样品的浓度,或者是选择相应的换算方法,将吸光值转换为样品浓度。蛋白质测定过程非常简单,先测试空白液,然后直接测试蛋白 质。从而显得结果很不稳定。蛋白质直接定量方法,适合测试较纯净、成分相对单一的蛋白质。紫外直接定量法相对于比色法来说,速度快,操作简单;但是容易受 到平行物质的干扰,如DNA的干扰;另外敏感度低,要求蛋白的浓度较高。(1)简易经验公式 蛋白质浓度(mg/ml) = [1.45*OD280-0.74*OD260 ] * Dilution factor(2)精确计算 通过计算OD280/OD260的比值,然后查表得到校正因子F,再通过如下公式计算最终结果:蛋白质浓度(mg/ml) = F *(1/d) *OD 280 * D,其中d为测定OD值比色杯的厚度,D为溶液的稀释倍数BCA法原理:BCA(bicinchonininc acid)与二价铜离子的硫酸铜等其他试剂组成的试剂混合一起即成为苹果绿,即 BCA 工作试剂。在碱性条件下,BCA 与蛋白质结合时,蛋白质将 Cu2+ 还原为 Cu+,工作试剂由原来的苹果绿色变为紫色复合物。562 nm 下其光吸收强度与蛋白质浓度成正比。BCA 蛋白浓度测定试剂盒,Abbkine的蛋白质定量试剂盒(BCA法)提供一个简单,快捷,兼容去污剂的方法,准确定量总蛋白。成分试剂 A100 mL试剂 B2 mL标准蛋白(BSA)1 mL×2,1 mg/mL保存条件 运输温度:室温(标准蛋白 4~8 ℃ 运输)保存温度:室温(标准蛋白 -20 ℃ 保存)有效日期:12 个月使用方法方法一:96 孔板1. 配制 BCA 工作液:根据标准品和样品数量,按 50 体积试剂 A,1 体积试剂 B 配制适量 BCA 工作液。充分混匀。2. 将蛋白标准品按 0 μL,1 μL,2 μL,4 μL,6 μL,8 μL,10 μL 加入 96 孔板的蛋白标准品孔中。加灭菌双蒸水补足到 10 μL。取 10 μL 待测样品加入 96 孔板的待测样品孔中。每个测定要做 2~3 个平行。3. 向待测样品孔和蛋白标准品孔中各加入 200 μL BCA 工作液(即样品与工作液的体积比为 1:20),混匀。4. 37 ℃ 温浴 30 min。冷却至室温。5. 酶标仪 562 nm 波长下测定吸光度。6. 制作标准曲线。从标准曲线中求出样品浓度。方法二:试管法1. 配制工作液:根据标准品和样品数量,按 50 体积试剂 A,1 体积试剂 B 配制适量 BCA 工作液,充分混匀。工作液配制的量要与测定所用的比色杯对应。每个测定要做 2~3 个平行。本处列举的比色体系所用的是 0.5 mL 的比色杯。如比色杯规格不同,体系需要放大到实验将采用的比色杯准确读数所需要的体积。2. BSA 标准品和样品的准备:样品用水或其它不干扰显色反应的缓冲液配制,使待测定的浓度位于标准曲线的线性部分。每个反应准备 3 个平行测定。标准曲线一般 5~6 个点即可。根据样品的估测浓度确定各点的具体浓度。稀释 BSA 时可以用水或与样品一致的溶液。如待测样品的浓度约为 200 μg/mL,可按下表的次序加入 BSA 标准品、样品及 BCA 工作液。3. 取适量体积的标准蛋白,以蛋白液:工作液=1:20 的比例混匀。37 ℃ 温浴 30 min。冷却至室温。4. 将样品与标准品在 562 nm波长下测定吸光度。考马斯亮蓝法实验原理:考马斯亮蓝 (Coomassie Brilliant Blue) 法测定蛋白质浓度,是利用蛋白质―染料结合的原理,定量测定微量蛋白浓度快速、灵敏的方法。这种蛋白质测定法具有超过其他几种方法的突出优点,因而正在得到广泛的应用。目前,这一方法是也灵敏度最高的蛋白质测定法之一。考马斯亮蓝 G-250 染料,在酸性溶液中与蛋白质结合,使染料的最大吸收峰 (lmax) 的位置,由 465 nm 变为 595 nm,溶液的颜色也由棕黑色变为蓝色。通过测定 595 nm 处光吸收的增加量可知与其结合蛋白质的量。研究发现,染料主要是与蛋白质中的碱性氨基酸 (特别是精氨酸) 和芳香族氨基酸残基相结合。突出优点(1)灵敏度高,据估计比 Lowry 法约高四倍,其最di蛋白质检测量可达 1 mg。这是因为蛋白质与染料结合后产生的颜色变化很大,蛋白质-染料复合物有更高的消光系数,因而光吸收值随蛋白质浓度的变化比 Lowry 法要大的多。(2)测定快速、简便,只需加一种试剂。完成一个样品的测定,只需要 5 分钟左右。由于染料与蛋白质结合的过程,大约只要 2 分钟即可完成,其颜色可以在 1 小时内保持稳定,且在 5 分钟至 20 分钟之间,颜色的稳定性最好。因而完全不用像 Lowry 法那样费时和需要严格地控制时间。(3)干扰物质少。如干扰 Lowry 法的 K+、Na+、Mg2+ 离子、Tris 缓冲液、糖和蔗糖、甘油、巯基乙醇、EDTA 等均不干扰此测定法。缺点(1)由于各种蛋白质中的精氨酸和芳香族氨基酸的含量不同,因此考马斯亮蓝染色法用于不同蛋白质测定时有较大的偏差,在制作标准曲线时通常选用 g-球蛋白为标准蛋白质,以减少这方面的偏差。(2)仍有一些物质干扰此法的测定,主要的干扰物质有:去污剂、 Triton X-100、十二烷基硫酸钠 (SDS) 等。试剂与器材1、试剂 考马斯亮蓝试剂:考马斯亮蓝 G-250 100 mg 溶于 50 mL 95% 乙醇中,加入 100 mL 85% 磷酸,用蒸馏水稀释至 1000 mL。2、标准和待测蛋白质溶液(1)标准蛋白质溶液结晶牛血清蛋白,预先经微量凯氏定氮法测定蛋白氮含量,根据其纯度用 0.15 mol/L NaCl 配制成 1 mg/mL 蛋白溶液。(2)待测蛋白质溶液。 人血清,使用前用 0.15 mol/L NaCl 稀释 200 倍。3、器材 试管 1.5×15 cm(×6),试管架,移液管管 0.5 mL(×2) 1 mL(×2) 5 mL(×1);恒温水浴;分光光度计。操作方法 一、制作标准曲线 取 7 支试管,按下表平行操作。摇匀,1 h 内以 0 号管为空白对照,在 595 nm 处比色。绘制标准曲线:以 A595 nm 为纵坐标,标准蛋白含量为横坐标,在坐标纸上绘制标准曲线。二、未知样品蛋白质浓度测定 测定方法同上,取合适的未知样品体积,使其测定值在标准曲线的直线范围内。根据所测定的 A595 nm 值,在标准曲线上查出其相当于标准蛋白的量,从而计算出未知样品的蛋白质浓度(mg/mL)。注意事项(1)在试剂加入后的 5-20 min 内测定光吸收,因为在这段时间内颜色是最we定的。(2)测定中,蛋白-染料复合物会有少部分吸附于比色杯壁上,测定完后可用乙醇将蓝色的比色杯洗干净。(3)利用考马斯亮蓝法分析蛋白必须要掌握好分光光度计的正确使用,重复测定吸光度时,比色杯一定要冲洗干净,制作蛋白标准曲线的时候,蛋白标准品最好是从低浓度到高浓度测定,防止误差。
  • 人工智能成功预测蛋白质相互作用 确定100多个新蛋白质复合物
    美国科学家主导的国际科研团队在最新一期《科学》杂志撰文指出,他们利用人工智能和进化分析,绘制出了真核生物的蛋白质之间相互作用的3D模型,首次确定了100多个可能的蛋白质复合物,并为700多个蛋白质复合物提供了结构模型,深入研究蛋白质相互作用有望催生新的药物。  研究负责人之一、美国西南大学人类发育与发展中心助理教授丛前(音译)称,研究结果代表了结构生物学新时代的重大进步。  丛前解释说,蛋白质通常成对或成组工作,形成复合物,以完成生物体存活所需的任务。虽然科学家已经对其中一些相互作用开展了深入研究,但许多仍是未解之谜。了解蛋白质之间所有的相互作用将揭示生物学的许多基本方面,并为新药研发提供参考。  但半个世纪以来,鉴于许多蛋白质结构的不确定性,科学家们很难了解这些相互作用。2020年和2021年,深度思维公司和华盛顿大学戴维贝克实验室独立发布了两种人工智能技术“阿尔法折叠”和RoseTTAFold,它们使用不同的策略预测蛋白质结构。  在最新研究中,丛前等人通过对许多酵母蛋白复合物建模,扩展了人工智能结构预测工具箱。为了找到可能相互作用的蛋白质,科学家们首先搜索相关真菌的基因组,寻找发生突变的基因,然后使用上述两种人工智能技术来确定这些蛋白质是否可以3D结构结合在一起。  他们确定了1505种可能的蛋白质复合物,其中699个结构已被表征,验证了其方法的实用性;另外700个复合物目前获得的数据有限,剩下106个从未被研究过。为更好地理解这些很少被描述或未知的复合物,团队研究了类似的蛋白质,并根据新发现的蛋白质与此前已知蛋白质的相互作用,确定了新发现蛋白质的作用。
  • 中科院加强蛋白质研究平台建设
    中科院加强蛋白质研究平台建设   路甬祥为中科院蛋白质科学中心大楼揭牌   2009年12月28日,全国人大常委会副委员长、中国科学院院长路甬祥到中科院生物物理研究所调研,并为中国科学院蛋白质科学中心大楼正式启用揭牌。中科院党组成员、副秘书长、北京分院党组书记、常务副院长何岩,副秘书长、办公厅(党组办)主任邓麦村,生物局局长张知彬,计财局局长孔力和北京生命科学研究院等领导和专家陪同调研。   蛋白质是所有生命活动载体和功能执行者,也是生物技术研发的主体,是药物靶标发现、重大疾病诊断标志物、重大新药创制、重大传染病防诊治、重要农作物改良、生物能源转化、工业生物催化等多个领域的创新源泉和重要的战略资源。蛋白质研究集科学与技术、基础和应用于一身,将催生一系列新的生物技术,带动医药、农业和绿色产业的发展,引领未来生物经济。因此,蛋白质科学是目前发达国家激烈争夺的生命科学制高点。   中科院北京地区蛋白质研究力量是目前国内蛋白质研究实力颇为雄厚的一支研究队伍,在中科院奥运园区生命科学园内汇聚了生物物理研究所等8个研究所,拥有一批以多名院士、“千人计划”、“百人计划”领衔的蛋白质科学研究领域的领军人才,在蛋白质科学领域高端人才和创新团队最为密集,成果产出丰硕,创新能力强大。曾以胰岛素晶体结构解析等成果为中国蛋白质科学的发展作出了历史性贡献,近年来更以中国膜蛋白结构零的突破、SARS、禽流感、H1N1病毒结构与功能研究的重大成果引领中国蛋白质研究发展、服务于国家重大需求和人民健康,承担着国家中长期重大科学计划——“蛋白质研究计划”、973、863、“重大新药创制”和“重大传染病防治”重大专项等一批国家重大科研任务。   中国科学院蛋白质研究平台依托生物物理所,从2004年开始建设,历经两期工程,已经投入3.7亿元,着力打造国际先进的蛋白质研究共享设施,同时平台高度重视优秀的技术支撑队伍、管理队伍建设和开放共享机制创新,组建了一支以首席技术专家领衔的专业技术支撑队伍,并在大型科研装备开放共享和关键技术自主创新方面取得突出成效,先后为众多科研机构、大学、医院和企业提供了技术服务,取得了良好的社会效益和经济效益。目前平台56台套大型仪器设备全部上网对全社会开放服务,截至2009年12月15日,共完成6203个有效预约服务,测试样品数达到29254个,有效机时达到35639小时。大型仪器平均有效共享率达到82%。   该蛋白质科学研究平台围绕蛋白质科学研究,促进学科交叉和资源集成,以高起点、高水平、高目标、大框架实现跨越式可持续发展,将成为支撑国家重大科学研究计划、开拓蛋白质科学前沿研究领域、产出国际领先水平的原创性成果、造就国家战略科技人才、引领生物高技术产业发展、具有国际一流水平的国家研究实验基地。   路甬祥一行视察了蛋白质科学中心的实验室建设与科研工作情况,并与科学中心的院士、专家进行了座谈交流。   路甬祥指出,中国科学院大力推动蛋白质科学研究平台建设,是为了进一步夯实基础,加强与大学和其他研究机构的联合合作,进一步对外开放,为蛋白质科学国家实验室建设提供条件保障,为我国生命科学的持续发展提供有力支撑。通过几年的实践,生物物理研究所在大型仪器公用共享方面业已经积累了丰富的成功经验,值得借鉴和推广。   路甬祥强调,作为蛋白质科学研究的重要支撑,国家实施蛋白质科学基础设施建设,是为了更好地促进我国蛋白质科学的发展,不论设施建在什么地方,都应把国家利益放在首位,都要汇聚国内最强的研究力量参与建设,都要面向全国开放共享,都要经得起历史的检验。中国科学院以生物物理研究所为代表的京区各单位,在国家几十年来长期支持下,经过几代科学家不懈努力,形成了蛋白质科学研究的骨干力量和优良的学风,取得了一系列重大研究成果。中科院京区有关单位应积极主动参与国家蛋白质科学北京地区基础设施的建设,并与其他蛋白质科学研究力量开展强强联合,共同为提升我国的蛋白质科学研究水平,为促进生物科技和生物产业的发展,保障13亿人民的健康,不断做出科技工作者的创新贡献。
  • 赛默飞在美开设高级蛋白质组学研究中心
    为了促进利用先进的质谱技术进行标志物蛋白质组学研究,赛默飞世尔科技、格莱斯顿研究所、加州大学和QB3(美国定量生物科学研究所)联合在美国三藩市的格莱斯顿研究所开设了赛默飞世尔科技疾病标志物发现蛋白质组学中心。   此研究中心负责人是格莱斯顿研究所高级研究员、加州大学分子与分子药理学教授和加州大学生命科学研究所主任Nevan J. Krogan 博士。Nevan J. Krogan 说,这里的科研人员来自格莱斯顿研究所、加州大学和QB3 ,在这里的工作会使他们掌握解决复杂生物系统中蛋白质动力学的先进质谱技术。这些技术将使研究者获得前所未有的基因与其产生的蛋白质之间的互动知识,也将帮助解决之前无法解释的生物医学问题。   研究中心进行的研究活动包括高分辨率蛋白质-蛋白质相互作用导图的创建、高级蛋白质表征、基因组定向蛋白质组筛选、大量蛋白质或翻译后修饰蛋白的超高灵敏度定量分析等。   此中心也会展示用于精细生物学发现和定量的最新质谱,包括新的Orbitrap Fusion和TSQ Quantiva三重四极杆LC/MS 系统。除了进行研究之外,赛默飞研究中心将作为促进生物学质谱应用的据点,举办一系列特邀报告会、讨论会、研习班和培训。 编译:郭浩楠
  • 用亲和色谱法和四维蛋白质组学法系统鉴定血液中与顺铂结合的蛋白质
    大家好,本周为大家分享一篇发表在J Proteome Res.上的文章,Systematic Identification of Proteins Binding with Cisplatin in Blood by Affinity Chromatography and a Four-Dimensional Proteomic Method,该文章的通讯作者是华中科技大学药学院的杜支凤教授。以顺铂为代表的铂类抗癌药物广泛应用于治疗多种癌症肿瘤,如胃肠道癌、头颈部癌和卵巢癌等。在静脉滴注后,这些药物水解形成活性分子,与DNA结合并抑制DNA链的合成与复制,最终致使细胞死亡。然而,由于铂与硫醇的高亲和力,大多数铂在静脉注射后会与血液中的蛋白质结合;例如,人血清白蛋白 (HSA) 是含量最丰富的血清蛋白,也是血液中铂类药物的主要结合蛋白;另外,在红细胞中负责运输氧气的血红蛋白 (HB) 也被发现与铂结合,因此,有必要研究铂类药物在血液中的蛋白结合行为。先前的研究已经证明,利用质谱方法可以实现对高丰度蛋白质的可靠鉴定;然而,由于高丰度蛋白的干扰,占总蛋白的 80% 以上的低丰度蛋白则很少被鉴定。此外,由于缺乏足够信息,以及在胰蛋白酶消化过程中还原和烷基化剂的使用导致蛋白上的铂化位点无法被确定。更重要的是,目前排除假阳性结果的唯一方法是根据铂化肽的特征同位素模式,人工对比理论同位素和实验同位素,从而导致鉴定过程非常耗时并且具有较强的主观性。因此,有必要开发一种可靠、高效的方法来鉴定血液中铂类药物的结合蛋白质组。在血液蛋白质组学研究中,免疫亲和层析常用于消耗高丰度蛋白并富集低丰度蛋白。它有利于低丰度蛋白的鉴定和定量,从而可以提高血液中的蛋白质组覆盖范围。除了色谱分离外,离子淌度质谱 (IM−MS) 根据离子的迁移率差异进行分离,同样有助于低丰度蛋白质的分析。在金属化蛋白的鉴定中,金属化肽和游离肽的同位素分布模式明显具有差异,这有助于确定这些肽是否与金属药物结合。已经开发了一些数据处理软件程序来自动分配金属药物在已知蛋白质上的结合位点,如智能数字注释程序 (SNAP) 算法和 Apm2s 。本文结合高丰度蛋白分离和4D蛋白质组学方法 (IM-MS) ,系统、全面地鉴定了血液中顺铂的结合蛋白,并利用铂化肽的特征同位素模式和相似性算法来消除假阳性的识别。如图1所示,首先用超滤去除游离药物,然后使用多亲和去除柱分离血液样本中的高丰度和低丰度蛋白;用FAIMS Pro界面的nano-LC−MS/MS进行消化和分析;用MaxQuant对铂化的多肽和蛋白进行鉴定,用相似性算法Apm2s排除假阳性结果。在此基础上,采用基于平行反应监测 (PRM) 的方法测定了血浆中多肽与顺铂的结合率。本研究为系统鉴定血液中金属药物的结合蛋白提供了一种新方法,鉴定出的蛋白可能有助于了解铂类抗癌药物的毒性。图1 铂化蛋白的分离和鉴定以及用蛋白质组学方法测定顺铂与多肽之间的结合率的示意图本研究采用顺铂与人血浆的反应混合物建立了一种分析方法。为了与文献进行比较,样品的制备方法与文献中的制备方法相同1。选择CID作为碎裂方式,结果表明,从低丰度部分共鉴定出212个蛋白,从高丰度部分共鉴定出169个蛋白。在低丰度部分,共鉴定出1192个游离肽和208个铂化肽。其中,154个铂化肽被排除为假阳性结果,如文中表S1所示。高丰度部分的游离肽数和铂化肽数分别为1124个和169个,其中,144个铂化肽被排除为假阳性,如表S2所示。低丰度结合蛋白的鉴定在以往的研究中,由于高丰度蛋白的干扰,很少发现低丰度蛋白与铂的结合。本研究在高丰度蛋白被消耗后,从29个蛋白中共鉴定出54个铂化肽。APOA4中铂化肽的理论和实际质谱如图2所示,前体离子和铂化产物离子表现出特征的同位素峰。图片显示了关键的碎片离子的质谱图,用于分配铂化位点。在鉴定出的铂化蛋白中,CERU、FETUA、ITIH1和B4E1Z4有4个或更多的含铂肽,这表明铂可以与这些蛋白质的多条肽段结合。虽然低丰度蛋白只占血液中蛋白的一小部分,但它们具有非常重要的功能,对于维持正常生理活动不可或缺。例如,CERU可以将Fe2+氧化为Fe3+,并在铁代谢中发挥重要作用;B4E1Z4与补体激活相关。顺铂与这些蛋白的结合是否会对其功能产生影响仍有待进一步研究。图2 从低丰度蛋白部分鉴定出的铂化蛋白APOA4。(A)铂化肽的理论(左)和实验质谱(右);(B)铂化肽的MS/MS和指示铂化位点的关键碎片离子的质谱图高丰度结合蛋白的鉴定IGHG1中一个铂化肽的理论和实验质谱如图3所示,其前体离子和铂化产物离子表现出特征同位素峰。根据关键的碎片离子确定了铂化位点。在已鉴定的蛋白中,ALBU(白蛋白)和CO3(补体C3)有4个或更多的含铂多肽。HSA负责血液中药物和小分子的运输,CO3在补体系统的激活中起着重要作用。高丰度蛋白与顺铂的结合已被用于提高肿瘤化疗的疗效和选择性,而新发现的高丰度结合蛋白有助于相关研究。与低丰度组分鉴定的铂化蛋白相比,大部分与低丰度组分蛋白不同,两个组分中仅共同检测到FETUA和CFAH作为铂化蛋白,这表明亲和层析对高丰度蛋白和低丰度蛋白的分离效果较好。图3 从高丰度蛋白部分鉴定出铂化蛋白IGHG1。(A)铂化肽的理论(左)和实验质谱(右);(B)铂化肽的MS/MS和指示铂化位点的关键碎片离子的质谱图IM−MS分离铂化肽异构体如图4所示,通过nano-LC−IM−MS/MS成功分离了低丰度蛋白组分中FETUA的铂化肽异构体。同分异构体a和b是典型的铂化肽,由质谱图的同位素模式显示,它们被很好地分离。它们的MS/MS不同,根据关键碎片离子,异构体a和b的铂化位点分别被划分为M和H/T。这个例子显示了IM−MS对复杂样品的分辨能力。图4 用nanoLC−IM−MS/MS分离的低丰度蛋白组分中FETUA的铂化肽异构体。(A)m/z=764.67提取离子色谱和异构体a、b的质谱,理论质谱见中间;(B)异构体的MS/MS和关键碎片离子的质谱图结合蛋白的铂化位点在本文的两项研究中,His 和 Met 是首选的铂结合位点。此外,D、E、S和Y也被发现是铂结合位点。这也是合理的,因为血清蛋白的供氧氨基酸已被证明是顺铂的动力学首选结合位点。很少有Cys残基被鉴定为结合位点,这可能是由于没有还原和烷基化。肽的半胱氨酸常形成二硫键,不经还原和烷基化就无法识别,因此,序列覆盖率会很低。在未来的研究中,应使用替代还原剂来提高肽序列覆盖率。生物信息学分析 为了揭示铂化蛋白质的定位、功能和途径,将从高丰度和低丰度部分中鉴定的蛋白质组合起来并通过生物信息学工具进行分析。如图5A所示,GO分析表明大部分结合蛋白位于细胞外区域,发挥蛋白结合、金属离子结合、酶抑制剂等功能;因此,镀铂蛋白的定位证实了鉴定的可靠性。此外,这些蛋白质参与内肽酶活性、免疫系统过程、补体激活、炎症反应和凝血的负调节。为了阐明所涉及的途径,对鉴定的蛋白质进行了KEGG途径富集分析,结果表明最显着的富集途径是补体和凝血级联途径(图5B)。补体和凝血级联途径已被证明在造血干/祖细胞的动员中发挥关键作用,这对造血具有重要意义。顺铂的血液学毒性与其在补体和凝血级联途径中与血液蛋白的结合之间的相关性值得进一步研究。图5 (A)通过GO 分析确定的铂化蛋白的定位、分子功能和生物学过程;(B)铂化蛋白的富集途径血液蛋白与顺铂的结合率 由于未检测到一些铂化肽的游离形式,因此仅使用高丰度组分中的13种肽进行亲和力研究。可靠地计算了属于五种蛋白质的六种铂化肽的结合率。PRM分析中这些肽的信息见表S5,定量结果见图6。其中,富含组氨酸的糖蛋白的一种肽与顺铂的结合率最高,这可能是由于顺铂对含组氨酸和带负电荷的生物分子的高亲和力。Apoa1 蛋白的一个肽与顺铂的结合率最低。在本研究中可以确定结合率的铂化肽数量较少,这主要是由于某些肽的质谱响应低以及某些肽存在氧化形式。因此,这些肽的结合比率不能通过 PRM 方法确定。然而,与以往的研究相比,根据属于同一蛋白质的肽的质谱计数粗略估计某种蛋白质的丰度,这种方法可以更准确地确定高丰度肽与铂的结合率。图6 根据PRM分析多肽与顺铂的结合亲和力顺铂与血液蛋白的结合与其药代动力学、活性、毒性和副作用密切相关。然而,血液蛋白质组的复杂性限制了低丰度结合蛋白的鉴定。在本研究中,基于亲和色谱和nanoLC-IM-MS/MS 的 4D 蛋白质组学方法被用于分离低丰度和高丰度蛋白质并分析这两个部分。基于铂化肽的特征同位素分布和相似性算法,排除了假阳性鉴定。结果,共有 39 种蛋白质被鉴定为铂化蛋白质,这比之前研究中的数量要高得多。随后的生物信息学分析表明,这些结合蛋白位于细胞外区域,主要参与内肽酶活性、免疫系统过程、补体激活、炎症反应和凝血的负调控。最显着的富集途径是补体和凝血级联,这可能与顺铂的血液学毒性有关。高丰度部分的 PRM 分析表明,富含组氨酸的糖蛋白中的肽与高丰度组分中的顺铂的结合率最高。综上所述,本研究揭示了人类血液中与顺铂结合的蛋白质组,并计算了顺铂与血液蛋白的结合率。这种方法虽然在数据分析方面比较耗时,但它可以识别复杂系统中金属药物的低丰度结合蛋白,并且可以准确测量药物与血液蛋白的结合率。
  • 蛋白质组学在病毒入侵宿主中的研究
    2020年初,一场突如其来的疫情打乱了大家的生活节奏。面对来势汹涌的疫情,全国上下正在积聚力量,全力战胜新型高致病性冠状病毒(2019-nCoV)。医护人员、解放军战士、志愿者们纷纷奔赴武汉,与疫魔竞速,守卫着国民的生命安全,致敬最美逆行者!同时疫情研究者一样没有停下自己的脚步,特别是在分子水平,我们调研了基于Orbitrap超高分辨的蛋白质组学和结构组学技术在病毒学研究中的应用,谨以此文致敬白衣天使和深耕医学研究的学者。Orbitrap技术促进病毒机理研究病毒与宿主共同进化,获得捕获和操纵宿主细胞过程进行复制的机制传播。同样,宿主细胞会通过部署防御机制或通过适应感染环境。在整个感染过程中,细胞严重依赖于时空调控的病毒-宿主蛋白-蛋白相互作用的形成。 蛋白质组学方法与病毒学的结合促进了对病毒复制、抗病毒宿主反应和病毒对宿主防御的颠覆机制的深入研究。而Orbitrap技术依靠其高灵敏度、高精度,高通量等特性在该方面表现出色。案例一:Orbitrap技术深度挖掘病毒-宿主蛋白质相互作用2019年Viruses杂志上发表了基于组学技术研究宿主变化的综述,质谱技术中基于亲和纯化分离蛋白质复合物随后进行MS分析(AP-MS)的方法可以用于分离病毒-病毒和病毒-宿主多蛋白复合物,可识别间接和直接的蛋白质相互作用,提供相互作用事件的瞬时信息,或跟踪单个病毒基因产物的过表达,以深入了解单个蛋白质的功能;表达蛋白质组学技术(定量蛋白质组学和翻译后修饰组学)可以研究病毒蛋白的组成,宿主在病毒入侵过程中蛋白质和翻译后修饰的动态变化。(Viruses 2019, 11, 878 doi:10.3390/v11090878)迄今为止,基于蛋白质组学方法的进展已经为识别数量惊人的病毒-宿主蛋白关联铺平了道路,科学家基于这些数据构建了包含了5000多种病毒成分和宿主细胞之间的非冗余蛋白相互作用数据库。这些有价值的信息库包括相互作用蛋白数据库、VirHostNet(http://virhostnet.prabi.fr/)、VirusMentha(Nucleic Acids Res. 2015 43(D1):D588–D592)、IntAct-MINT(Nucleic Acids Res. 2015 43(D1):D583–D587)和Uniprot。 案例二:Orbitrap技术揭示新型塞卡病毒宿主因子Pietro,Scaturro, Alexey, et al. Nature, 2018 寨卡病毒(ZIKV)最近成为全球健康问题,由于它的广泛传播和与严重的联系新生儿神经症状和小头症。然而,与致病性相关的分子机制关于ZIKV的大部分仍然未知。 技术路线:利用赛默飞 LTQ-Orbitrap和Orbitrap Q Exactive HF质谱进行全蛋白质组学和修饰蛋白质组学(实验路线见下图a),研究对象为神经细胞系SK-N-BE2和NPC细胞,表征细胞对病毒的反应,在蛋白质组和磷酸化蛋白质组水平上的变化,利用亲和蛋白组学方法鉴定ZIKV蛋白的细胞靶点。使用这种方法,找到了386个与zikv相互作用的蛋白质,导致宿主在神经发育受损,视网膜缺陷和不孕。此外,确定了寨卡病毒感染后1216个磷酸化位点存在上调或下调,来自AKT, MAPK-ERK和ATM-ATR信号通路中,为防范ZIKV感染扩散提供机制基础。在功能上,系统地理解了ZIKV诱导后的宿主的蛋白质和细胞通路水平的扰动,并对感染后细胞施加Rock抑制剂药物干预,利用非标定量蛋白质组学方法分析差异蛋白进行验证(下图热图),补充这一空白。技术路线图案例三:Orbitrap技术深入探寻寨卡病毒病毒与宿主的相互作用Etienne Coyaud, et al. Molecular & Cellular Proteomics,2018,技术路线技术路线:本文利用生物素识别以及IPMS亲和纯化结合MS 方法,研究寨卡病毒侵染后病毒与宿主细胞蛋白质的相互作用(技术路线见上图),实验结果揭示了1224个蛋白3033多肽形成的相互作用网络(见下图a)。相互作用包括多肽加工和质量控制、囊泡方面的作用运输,RNA处理和脂质代谢。40%的 作用都是以新报道的相互作用。通过数据挖掘分析,揭示过氧化物酶体在ZIKV感染中的关键作用。病毒宿主蛋白相互作用网络图 温馨提示:积极防护 保护自己 戴口罩 勤洗手
  • “真”单细胞蛋白质组学引领者,“真”不是吹的
    1. “真”单细胞蛋白质组学引领者2019年8月12日,Nature Methods编辑Vivien Marx在Nature Methods上在线发表了题为“A dream of single-cell proteomics”的文章,蛋白质组学领域的领军人物之一苏黎世联邦理工学院Ruedi Aebersold教授在文章中评论到“It’s early days, but it’s not a distant dream to be able to tally the proteins in single cells” 。巧合的是,2019年也是基于timsTOF Pro的4D-蛋白质组学技术开始腾飞的一年。 2020年12月蛋白质组学领域两大领军科学家Matthias Mann团队(Max Planck Institute of Biochemistry)和Ruedi Aebersold团队(ETH Zurich)在Nature Methods发表题为“diaPASEF: parallel accumulation–serial fragmentation combined with data-independent acquisition”的文章,其共同开发的基于4D平台的DIA技术——diaPASEF,能够全面提升蛋白质鉴定覆盖率、重现性和定量准确性。因此,4D-DIA技术大幅提升的可靠性,之前不太被大家认可的DIA(数据非依赖性采集)技术真正开始大步向前,也是从此刻开始,4D-蛋白质组学技术的发展一发不可收拾。2021年11月2日,在第69届ASMS会议上,布鲁克公司发布第一代单细胞蛋白质组学质谱timsTOF SCP,“真”单细胞蛋白质组学方案横空出世,全球首台商品化timsTOF SCP落户于广州,表明在单细胞蛋白质组学领域中国研究者的前瞻性。在timsTOF SCP发布的第一年,单个HeLa细胞蛋白质鉴定已经接近2500种,即使在现在,这个单细胞鉴定深度也是其它质谱仪所不能企及的。这也让蛋白质组学领域领军科学家之一Matthias Mann教授发出了"I always said that single cell proteomics would not happen in my lifetime, but I'm happy to have been proven wrong。" 这样的感叹。2. “真”单细胞蛋白质组学质谱进化到第二代,可以上车了 2023年6月5日,在第71届ASMS会议上,布鲁克公司继续在“真”单细胞蛋白质组学上发力,重磅发布了timsTOF Ultra,“真”单细胞蛋白质组学质谱发展到第二代。timsTOF Ultra配备新型Captive Stray(CSI)Ultra离子源,第四代TIMS(捕集离子淌度)XR离子淌度和14位数模转换器,MSMS扫描速度提升到300Hz,继续占据MSMS扫描速度的头把交椅。 以HeLa细胞为例,人们一般认为单个细胞的蛋白质含量为200-250pg,于是有人将250 pg的进样量的蛋白鉴定数目等价于单细胞蛋白质组鉴定数目,但实际上系列稀释样本可以用来部分表现仪器灵敏度,无法代表真正单个细胞蛋白鉴定水平,“真”单细胞蛋白质组学的数据才是检验质谱灵敏度的唯一标准。布鲁克公司在第一代“真”单细胞蛋白质组学质谱timsTOF SCP上积累的宝贵经验和技术,在第二代timsTOF Ultra上完全得到了释放,通过CellenOne对HeLa细胞分选,获取1个、5个和10个细胞,采用dia-PASEF方法进行数据采集,Spectronaut 18数据分析,单个细胞22min可以鉴定超过3700种蛋白质(每个样本3针重复),1个HeLa细胞两次重复所鉴定的蛋白质强度相关系数0.95,显示出低至1个细胞的进样量也能得到高重复性。 德国柏林马克斯德 尔布吕克分子医学中心空间蛋白质组学研究小组负责人Fabian Coscia博士采用第一代“真”单细胞蛋白质组学质谱timsTOF SCP进行FFPE组织的单细胞分析,单个肝细胞当量的组织可以定量1500-2000种蛋白质。timsTOF Ultra灵敏度的提升,必将在FFPE组织的单细胞分析中发挥更强大的威力。3. “真”单细胞蛋白质组学主打“成熟可复制”单细胞蛋白质组学研究是一项复杂而前沿的科研领域,涉及许多挑战和门槛,比如用什么技术进行单个细胞的分选、分选后对单个细胞操作时怎么尽可能将低样本损失、质谱的灵敏度能否达到单细胞蛋白质组学所需灵敏度,这些挑战和门槛让很多研究者对单细胞蛋白质组学望而却步。布鲁克推出的一套完整的“真”单细胞蛋白质组学方案,把单细胞蛋白质组学研究的这些挑战和门槛全部打破,主打一个“成熟可复制”,甚至没有蛋白质组学经验的人也可以快速上手,短时间内就可产生高质量单细胞蛋白质组学数据。小结得益于质谱技术的进步,单细胞蛋白质组学领域将很快迎来爆发,布鲁克timsTOF Ultra的发布,必将成为单细胞蛋白质组学领域爆发的强劲动力。timsTOF Ultra超越了传统的限制,为新的科学可能性打开了大门。无论是单细胞蛋白质组学、免疫肽组学或者血浆蛋白质组学,timsTOF Ultra提供了无与伦比的扫描速度和灵敏度,帮助研究人员打破工作的界限并取得突破性成果。参考文献1. Marx, V. A dream of single-cell proteomics. Nat Methods 16, 809–812 (2019). 2. Meier, F., Brunner, AD., Frank, M. et al. diaPASEF: parallel accumulation–serial fragmentation combined with data-independent acquisition. Nat Methods 17, 1229–1236 (2020). 3. Brunner, AD., Thielert, M., Vasilopoulou C. et al. Ultra-high sensitivity mass spectrometry quantifies single-cell proteome changes upon perturbation. Molecular Systems Biology (2022)18:e107984. Makhmut, A., Qin, D., Fritzsche, S., et al. A framework for ultra-low input spatial tissue proteomics. bioRxiv 2023.05.13.540426
  • 专题 | 机器学习方法预测蛋白质-配体结合构象
    引言准确预测蛋白质-配体(在本文的语境中,配体意指小分子有机化合物)的结合构象是计算生物学中的一项重要任务。一方面,它有助于人们理解蛋白质与内源小分子或药物分子的互作机制。另一方面,在药物设计或药物筛选(无论是单个蛋白-多个配体的正向筛选,还是单个配体-多个蛋白的逆向筛选)的过程中,也离不开对复合物构象的准确预测:这是准确计算蛋白质-配体结合稳定性(亲和力)的必要条件。对于给定蛋白和给定配体分子,依据是否已知结合口袋(也称配体结合位点)可以将复合物构象预测任务分为两类:口袋未知的盲对接(blind docking)任务和口袋已知的局部对接(local docking)任务。其中,盲对接任务是更普遍的、更富有挑战性的任务。在传统的对接流程中,这一任务又被划分为几个子任务:先借助口袋搜索算法确定可能的结合位点(即,转化为局部对接任务) 再利用构象生成(采样)方法生成大量可能的复合物构象,并依据打分函数评价各个构象(即,进一步确定配体的位置、朝向,以及各个键对应的扭转角) 挑选出打分值最优者作为最终结果。但是,对接过程面临着打分函数不够准确、构象搜索空间巨大导致计算耗时过长等挑战。比如,对于后者,文献[1]计算结果表明:对于单个配体复合物的盲对接任务而言,借助GNINA和Glide这两款传统的对接软件,生成百万量级的复合物构象并从中挑选最优者,平均耗时分别约为150 s和1500 s。在巨型分子库的(如ZINC 15数据库,含有约数十亿个化合物分子[2])虚拟筛选过程中,使用传统方法逐一对接每个分子在计算速度上是不可接受的。而数据驱动的机器学习方法为优化各个子任务的准确性和计算效率带来希望。此外,同样基于机器学习方法,部分研究者发展出“端到端”的、更为直接的对接流程:训练一个拟合自由能面(free energy landscape)的模型,无需将原有的对接任务划分为多个子任务,以蛋白质与配体的三维结构为输入,输出即为可能的复合物构象。参照Anfinsen提出的蛋白质折叠热力学假说,可以设想:如果存在一个能量函数,能够将复合物在三维空间下的所有状态映射到它对应的自由能,那么可以将复合物构象预测问题转化为该能量函数的最优化问题[3]。这是机器学习拟合自由能面的出发点。与传统的对接方法相比,这样的方法也同样可能在准确性和计算效率等指标上得到提升。本文将针对口袋搜索、构象生成、打分函数、自由能面建模这四个方向:整理相应的评价体系,包括常用的评价指标或测试集 挑选并简要介绍部分具有代表性的机器学习模型 结合模型评估实验讨论当前模型或评价体系存在的不足以及未来可能的发展方向。1.机器学习口袋搜索 1.1 评价体系目前存在两种描述蛋白质-配体结合口袋的方式。其中一种方法借助蛋白质表面的点云(surface points)来描述。这种方法被称作以配体为中心(ligand-centric)的方法。另一种方法则借助蛋白质上的原子来描述,那些蛋白质上的、与配体重原子距离小于一定阈值的重原子被定义为配体结合原子。这种方法被称作以蛋白质为中心(protein-centric)的方法。这两种描述方法相应地衍生出两类评价指标。对于前者,通常以配体原子中心距(预测的口袋中心与配体任意原子的距离,distance between the center of the predicted site to any atom of the ligand,DCA)、配体中心距(预测的口袋中心与配体中心的距离,distance between the center of the predicted site to the center of the ligand,DCC)、体素交并比(预测的口袋体积与配体所占据的空间体积的交并比,discretized volume overlap,DVO)等指标来衡量[4][5]。直观上,在这三个指标中:DCA最为宽松(只需大致判断配体位置),DCC更为严格(额外考察了配体大小),DVO最为严格(额外考察了配体构象)。但在多数文献中,常使用DCA和DCC这两个指标,并以4 Å作为预测成功与否的阈值[4]。对于后者,Yan等人以原子水平的交并比(Intersection over Union)来衡量[6]。具体地,计算预测的配体结合原子与标注的配体结合原子的交集与并集的比值。这也是机器学习目标检测任务中的常用指标。1.2 模型方法目前发展的大多数口袋搜索算法,都是以搜索蛋白质表面点云为目标。例如Krivák等人于2015年提出的P2Rank[7]:刻画蛋白质Connolly点云中各个点的物化特征,并使用随机森林模型对每个点进行可靶性预测,最后对点聚类得到口袋预测结果。以DCA为评价标准,P2Rank在多个数据集上表现优于传统方法Fpocket。Krivák等人后续还提供了P2Rank的网络服务[8],并对多种方法口袋搜索方法进行了更加全面的总结和比较,其中包括Jiménez等人于2017年开发的、使用3D网格(体素)刻画结合位点的DeepSite[9]。值得一提的是,在Krivák等人的结果中(测试数据集为COACH420、HOLO4K,评价指标DCC),DeepSite表现不及Fpocket 而在Jiménez等人的结果中(测试数据集CHEN251,评价指标DCC、DVO),DeepSite表现显著优于Fpocket。最近,Yan等人另辟蹊径,以鉴定蛋白质上的配体结合原子为目标,发表了PointSite方法[6],并声称其在多个数据集上(包括COACH420、HOLO4K、CHEN251等等,以原子水平的交并比为评价指标)取得了SOTA。Yan等人将口袋搜索问题转化为计算机视觉领域的点云分割问题 此处的点以蛋白质上的原子表示,以充分挖掘原子之间的键连特征。此外,作者还指出:将PointSite方法引入到其它口袋搜索方法如FPocket、P2Rank中(具体而言,使用点云分割的结果对后者的预测结果进行过滤),可以进一步提升配体结合位点的鉴定效果。1.3 讨论从以上几种方法的评估实验中可看出,模型在不同测试数据集上的相对表现可能存在差异,因此需要建立一套统一的、合适的数据集进行测试。另外,在训练数据集的准备过程中,将未鉴定到配体结合的位点直接划分为负样本也值得考量。2.2在具体使用建议上,最近有研究将口袋搜索方法引入到完整的对接流程中[10][11],相较于FPocket、P2Rank等方法,PointSite表现最优。  2. 机器学习构象生成 2.1 评价指标对于构象生成模型而言,需要考察所生成构象的多样性和准确性,由此分别衍生出两类指标:覆盖率(COV,coverage)和匹配程度(MAT,matching metrics)。针对测试集中的每一个构象:查看是否能够在生成的构象集合里找到RMSD值小于给定阈值的构象(如果能,则表示该模型能够覆盖当前测试构象),可以计算得到覆盖率 计算生成的构象集合与当前测试构象的最小RMSD值,取平均可以得到匹配程度的值。以上是从测试集的角度衡量模型表现(召回率) 相应地,将测试集构象与生成集构象在计算中对调,则可判断模型的准确率。目前常见的测试数据集包括GEOM-QM9和GEOM-Drugs[12]。2.2 模型方法构象生成模型沿着两个思路发展:直接生成各个原子的3D坐标 先生成原子对距离、二面角等中间参数,再将分子3D坐标还原。对于前者,技术难点在于保证模型对于输入分子的旋转-平移不变性(整体改变分子坐标,得到的构象是相同的,也即对齐过程)。对于后者,则可能生成不合法的中间参数(比如违反三角几何关系),或者中间参数的误差在训练过程中不断累积,影响分子3D坐标重构,需要进行后续的力场优化 但这是目前大多数方法所选取的道路。此处简要介绍最近发展的GeoDiff模型[13]和DMCG模型(Direct Molecular Conformation Generation)[14]。Xu等人于2022年提出GeoDiff,使用扩散模型直接生成原子坐标。GeoDiff在GEOM-Drugs数据集上测试集覆盖率可达约89%、匹配程度约0.86 Å,并且经过力场优化之后可以进一步提升模型表现。作者指出:在逆向扩散过程中(生成过程),如果某一时刻T的密度函数具有旋转-平移不变性,且逆向生成的条件概率函数具有旋转-平移不变性,则T时刻以前任意时刻的密度函数也具有旋转-平移不变性。同年, Zhu等人提出基于变分自编码器的DMCG模型,在GEOM-QM9和GEOM-Drugs数据集上均取得最优(对于后者,覆盖率约96%,匹配程度约0.70 Å)。作者指出:模型除了满足旋转-平移不变性外,对于对称结构还应当满足置换不变性(交换对称原子的坐标,得到的构象是相同的)。为此,计算任意旋转-平移操作以及对称原子置换操作下的两个结构的距离最小值,并将其引入损失函数中,以满足以上两种不变性。消融实验表明,如果不考虑这一项损失,则覆盖率将下降约20个百分点,匹配程度将提高约0.3 Å。2.3 讨论今年3月,Zhou等人[15]基于RDKit设计了一种简单的生成算法:使用RDKit分别采样二面角、采样几何片段、采样能量并生成相应的构象,随后按照能量大小进行聚类。在GEOM-QM9和GEOM-Drugs两个数据集上,与GeoDiff、DMCG等深度学习方法相比,该算法几乎在所有指标上取得SOTA。作者认为,目前的测试基准不足以覆盖实际应用中(如分子对接中)涉及的构象生成任务。  事实上,生成足够的分子构象不会降低测试构象集上的匹配程度和覆盖率(召回率),但可能降低生成构象集的相应指标(查准率)。而Zhou等人(包括Zhu等人的DMCG)并未在文中给出关于后者的模型评价,因此模型的实用性仍有待考察。另外,目前的构象生成方法均以单个配体的势能极小值作为优化目标,针对(已知口袋的)复合物中配体的构象生成模型仍有待开发。最后,GeoDiff模型与DMCG模型的发展也启示我们挖掘任务目标中蕴含的性质(对称性、不变性),在模型训练中引入合适的归纳偏置。  3. 机器学习打分函数3.1 评价指标Su等人[16]于2019年建立了一套打分函数的基准测试数据集CASF-2016。CASF-2016及其前身CASF-2013已被广泛用于评估打分函数的表现。同时,Su等人设计了四类指标分别考察打分函数的打分能力、排名能力、对接能力和筛选能力。打分能力通常以Pearson相关系数来衡量:考察天然蛋白复合物的计算打分值与实验结合常数的对数之间的线性相关性。排名能力通常以Spearman等级相关系数或Kendall等级相关系数来衡量:对于同一蛋白、不同配体的多个天然蛋白复合物结构,考察计算打分值给出的排名与实验结合常数给出的排名之间的匹配程度。对接能力以对接成功率衡量:对于单个复合物,在天然配体结合构象和一系列计算生成的诱饵分子构象(decoy)中,若计算打分最高者与真实结合构象的RMSD小于2 Å,则认为对接成功 对于多个复合物,进一步计算对接成功率。筛选能力以筛选成功率衡量:在天然配体和一系列其它配体分子中,计算打分前1%(5%、10%)结果里包含天然配体的比例。由此可见,打分能力直接以实验数据作为参考,是评估打分函数是否可靠的基本测试。排名能力是对打分能力的补充。打分能力越好,排名能力通常也越好 反之则未必成立(存在对实验结合常数进行非线性拟合的打分函数)。对接能力测试将计算生成的构象引入测试集中,因此更贴近实际对接操作、对于打分函数的选择更具参考意义。需要指出的是,对接能力测试给出的结果通常只能代表该打分函数的对接能力上限,在CASF-2016的测试中可能呈现分数虚高的情形(在测试中能够以90%的成功率在top-1中挑选出天然配体构象,但在实际应用中却不能达到这一表现)。这主要归结于实际应用中计算生成的构象不够充分。筛选能力涉及多种配体的对接,因此可视为对排名能力和对接能力的综合考察。3.2 模型方法针对打分函数的机器学习方法,前人已给出详尽的综述[17][18][19]。本文将展开介绍经典的ΔVinaRF20打分函数[20],以及最近发展的DeepDock[21]和RTMScore[22]。ΔVinaRF20由Wang等人于2016年提出,在CASF-2013、CASF-2016测试集上的各指标中均排名靠前[16][20]。具体地,在CASF-2016测试集上,ΔVinaRF20在打分能力和排名能力两个指标上分别以0.82和0.75取得最优,在对接能力上以89.1%(top1)仅次于Autodock Vina(90.2%),在正向筛选能力以42.1%(top1)取得最优、逆向筛选能力以15.1%(top1)位居第五(次于最优方法ChemPLP@GOLD约2.4%)。Wang等人指出:机器学习打分函数与经典的打分函数在这些指标中各有所长,前者长于打分,后者长于对接和筛选。因此作者拟结合二者优点:一方面对训练集进行数据增强,将计算生成的诱饵结构引入训练集中(同时计算估计亲和力作为标签),以提高机器学习打分函数的对接和筛选能力 另一方面使用随机森林方法对AutoDock Vina中的打分函数进行参数化修正(使用Δ-machine learning方法,类似残差拟合)。Méndez-Lucio等人于2021年提出的DeepDock方法在CASF-2016的正向筛选和逆向筛选能力评估中分别以43.9%和23.9%取得SOTA,但DeepDock给出的打分值与实验结合常数的对数之间不存在相关性(在训练过程中未引入实验结合常数的相关信息)。DeepDock方法使用二维分子图刻画配体、多面体网格点刻画蛋白质口袋(参考了MaSIF的编码框架[23]),分别学习蛋白质口袋与配体原子的节点表示 随后两两组合配体和靶蛋白的节点形成节点对,使用混合密度函数拟合节点对的距离分布(概率密度函数)。作者指出:相较于通过最小化距离误差来学习节点对距离的平均值,混合密度函数能够学习训练集中节点对多个可能的距离,从而更好地刻画构象预测任务中的多值特性。在DeepDock的基础上,Shen等人从两方面进行改进得到RTMScore:一方面,使用无向图编码蛋白质口袋残基,在编码过程中满足对于输入复合物坐标的旋转不变性 另一方面使用Graph Transformer模型以学习更深层次的特征。作者声称RTMScore在CASF-2016测试集上的对接能力和筛选能力达到SOTA,相较DeepDock得到大幅提升:对接成功率达到98.6%,正向筛选成功率达73.7%,逆向筛选成功率达38.9%。3.3 讨论DeepDock等方法的发展展现了图模型在捕获蛋白质-配体互作的潜力,以及直接拟合蛋白残基-配体原子距离似然函数的有效性。事实上,距离似然函数不仅能作为打分函数评估当前构象,还能够作为某种“势能面曲线”指导构象优化。此外,这些新近提出的DeepDock等方法有待更广泛的测试验证。在其它论文的评估实验中[24],RTMScore在对接能力中依旧表现最优。但考虑到缺少打分能力、排名能力等测试数据,后续仍需要更多的测试评估(尤其是将打分函数整合到完整的对接流程中)以验证这些方法的可靠性。  4. 机器学习自由能面4.1 评价体系拟合自由能面的模型直接处理盲对接任务,生成复合物构象。其中存在两类评价指标。一类指标评估计算准确性。通常以预测复合物(如果模型给出多个可能的构象,则选取打分值top-1者)中配体重原子RMSD小于2 Å所占的比例来衡量模型对接能力。一般以2 Å作为对接成功与否的判断阈值[10]。还有通过配体质心距离小于2 Å(或5 Å)所占的比例来考察模型是否能够找到正确的结合口袋。此外,为判断生成的配体构象在化学上是否合理,Corso等人额外考察了配体构象中存在位阻冲突(steric clash,配体内部重原子之间的距离是否小于0.4 Å)的比例。另一类指标评估计算效率 这在大型分子数据库的虚拟筛选过程中同样不可忽视。以对接一个分子所需的平均CPU(如果可能,使用并行加速)或GPU时间来衡量。4.2 模型方法拟合蛋白质-配体自由能面的机器学习方法最近得到逐步发展,代表性的方法包括EquiBind[1]、TANKBind[25]、DiffDock[10]。Stärk等人于2022年提出基于图几何深度学习的EquiBind方法,在机器学习方法直接预测蛋白质-配体结合构象这一问题中做出开创性贡献。该方法以随机的配体分子构象(比如使用RDKit生成的构象)作为输入,无需经过大规模的构象采样即可在约0.1 s的时间内给出复合物结构。由此给出的结构在寻找结合口袋的能力上与传统方法(如QuickVina-W)相当(配体质心距小于2 Å的比例均约40%),但在配体结合构象的预测上却表现不佳(配体RMSD小于2 Å的比例约6%,不及QuickVina、GLIDE等方法所达到的约20%)。虽然可以在该结构的基础上结合传统方法进一步微调配体位置和构象,但将增加预测所需的时间成本至数十秒或数百秒。同年,Lu等人提出TANKBind。相较于EquiBind,在保留推理速度(约0.5秒)的同时,TANKBind在配体构象预测上取得和传统方法相当的结果(配体RMSD小于2 Å的比例约19%),口袋预测能力则获得较大提升(配体质心距小于2 Å的比例约56%)。不同于EquiBind对整个蛋白质进行编码的方法,TANKBind采用P2Rank寻找口袋位置,随后针对该位置的蛋白质区块(由半径20 Å内的残基构成),拟合蛋白质残基与配体原子的距离。此外,受AlphaFold2的启发,TANKBind将三角几何约束引入残基与配体原子的距离建模中。消融实验表明,三角几何约束可以显著提升模型表现:配体RMSD小于2 Å的比例提升约15%,配体质心距小于2 Å的比例提升约12%。同年十月, Corso、Stärk等人提出DiffDock模型。该模型在对接准确性上首次实现了对传统对接模型的大幅超越。在holo态的蛋白晶体对接结果中,配体重原子RMSD小于2 Å所占的比例可达到38.2%,约为传统方法的两倍。这一结果对应于40次采样,消耗计算时间约40秒。与DeepDock想法类似,DiffDock使用生成模型来学习构象的概率分布并建立了一套相应的“扩散”方法(构象采样方法)。4.3 讨论今年2月,Yu等人[11]重新设计实验,考察了DiffDock等机器学习模型在盲对接任务中的哪一阶段领先传统方法、领先到何种程度。作者将盲对接任务拆分为口袋搜索和局部对接两个子任务,设计了三组实验:完全使用DiffDock等模型完成盲对接 使用其它方法搜索口袋(如前文所述的PointSite、P2Rank),使用Uni-dock[26](一种基于AutoDock Vina 1.2的GPU加速对接方法)局部对接 使用DiffDock搜索口袋,使用Uni-dock局部对接。结果表明:DiffDock方法在口袋搜索中效果更佳(相较于PointSite等方法而言,引入了配体分子的结构信息),但与ground truth、即表中的GT pocket相比仍存在提升空间 口袋确定,传统对接手段得到的结果优于DiffDock等机器学习模型。作者进一步指出:给定口袋下预测蛋白质-配体构象的机器学习方法是后续发展的方向(正如机器学习构象生成中所讨论的) 对于端到端的模型比较实验中,需要更审慎地评估传统方法的表现。另外,随着蛋白质结构预测方法的发展,评估模型在apo态蛋白质上的对接表现是有必要的,也是更符合实际情形的。事实上,目前几种模型所使用的训练集均为holo态蛋白(缺乏足够数量的与holo态对应的apo态蛋白结构)。为泛化模型的对接能力至apo态蛋白结构,通常采取折中方案:假定apo态与holo态的主链变动不大,而在模型编码过程中只使用主链碳原子的信息。DiffDock论文中首次评估了各种方法在ESMFold给出的蛋白质结构上的对接能力。结果显示,各模型的对接表现均显著下降(对于DiffDock而言,配体重原子RMSD小于2 Å所占的比例从38.2%下降至20.3%)。机器学习方法建模对接过程中蛋白质的结构变化仍然道阻且长。将分子动力学模拟过程中产生的动态信息引入模型中也许是一种可能的突破方向[27]。最后,正如AlphaFold2可作为打分函数评估蛋白质结构是否合理[3],DiffDock等拟合自由能面的模型,其在打分函数的各项评价指标中表现如何也值得进一步探究。  参考文献  [1] Equibind: Geometric deep learning for drug binding structure prediction  [2] Artificial intelligence–enabled virtual screening of ultra-large chemical libraries with deep docking  [3] State-of-the-Art Estimation of Protein Model Accuracy Using AlphaFold  [4] A Critical Comparative Assessment of Predictions of Protein-Binding Sites for Biologically Relevant Organic Compounds  [5] Improving detection of protein-ligand binding sites with 3D segmentation  [6] PointSite: A Point Cloud Segmentation Tool for Identification of Protein Ligand Binding Atoms  [7] P2RANK: Knowledge-Based Ligand Binding Site Prediction Using Aggregated Local Features  [8] P2Rank: machine learning based tool for rapid and accurate prediction of ligand binding sites from protein structure  [9] DeepSite: protein-binding site predictor using 3D-convolutional neural networks  [10] DiffDock: Diffusion Steps, Twists, and Turns for Molecular Docking  [11] Do Deep Learning Models Really Outperform Traditional Approaches in Molecular Docking?  [12] GEOM, energy-annotated molecular conformations for property prediction and molecular generation  [13] GeoDiff: a Geometric Diffusion Model for Molecular Conformation Generation  [14] Direct Molecular Conformation Generation  [15] Do Deep Learning Methods Really Perform Better in Molecular Conformation Generation?  [16] Comparative Assessment of Scoring Functions: The CASF-2016 Update  [17] Machine-learning methods for ligand-protein molecular docking  [18] Protein–Ligand Docking in the Machine-Learning Era  [19] From machine learning to deep learning: Advances in scoring functions for protein–ligand docking  [20] Improving scoring-docking-screening powers of protein–ligand scoring functions using random forest  [21] A geometric deep learning approach to predict binding conformations of bioactive molecules  [22] Boosting Protein–Ligand Binding Pose Prediction and Virtual Screening Based on Residue–Atom Distance Likelihood Potential and Graph Transformer  [23] Deciphering interaction fingerprints from protein molecular surfaces using geometric deep learning  [24]: A fully differentiable ligand pose optimization framework guided by deep learning and a traditional scoring function  [25] TANKBind: Trigonometry-Aware Neural NetworKs for Drug-Protein Binding Structure Prediction  [26] Uni-Dock: GPU-Accelerated Docking Enables Ultralarge Virtual Screening  [27] Pre-Training of Equivariant Graph Matching Networks with Conformation Flexibility for Drug Binding  本文作者:ZF责任编辑:WFZ
  • 三问中国人类蛋白质组计划
    前不久,历经多年论证、被誉为我国生命科学研究领域里程碑事件的中国人类蛋白质组计划(简称CNHPP)正式在京启动,来自清华大学、北京大学、中国科学院、军事医学科学院、解放军总医院、复旦大学等40多所高校、科研机构的近百名专家,共同见证了这一历史性时刻。 蛋白质组计划和基因组计划有何不同?中国的蛋白质组研究在国际上处于什么位置?中国人类蛋白质组计划将如何进行? 围绕上述问题,人民日报记者独家采访了有关专家。 一问 为什么要搞中国人类蛋白质组计划? 生,源于基因组;命,却一定由蛋白质组决定。只有蛋白质组才能从根本上阐释生命 相比&ldquo 蛋白质组&rdquo ,&ldquo 蛋白质&rdquo 一词更为人们所熟知。它是生物体内一种极为重要的高分子有机物,占人体干重的54%,1838年由荷兰科学家格里特首先发现。 基于此,1994年,澳大利亚科学家率先提出&ldquo 蛋白质组&rdquo ,意指某个时刻,某个组织、器官或个体中所有蛋白质的集合,是一个整体的概念。 科学家们之所以对蛋白质组产生浓厚兴趣,还得从人类基因组计划说起。2003年4月,经由6国科学家历时13年奋战的人类基因组计划画上了句号。 &ldquo 科学界曾经认为,只要绘制出人类基因组序列图,就能了解疾病的根源。但我们错了。&ldquo 国际蛋白质组组织首任主席萨姆 哈纳什说,事实上,我们只了解10%基因的功能,剩下的90%仍是未知的。 &ldquo 人们总以为蛋白质组计划是基因组计划的附庸或者说是子产品,这也是一个误区。人类基因组计划并不像事前所预期的那样,能够逾越蛋白质这一生物功能去揭示人类 生、老、病、死的全部秘密,基因组序列只是提供了一维遗传信息,而更复杂的多维信息则发生在蛋白质组层面。&rdquo 国际人类蛋白质组计划执委、亚太蛋白质组组织 主席、中国科学院院士贺福初说,基因组和蛋白质组的关系,好比词典与文章、元素表与化工厂。 &ldquo 基因组学中微小的差异,在蛋白质组学中可以被千倍甚至近万倍地放大,想要解密基因组,必须先系统认识蛋白质组。&rdquo 贺福初认为。 他举例说,人体各个器官如耳、鼻、喉、心、肝、肺,其基因组完全相同,不同的是蛋白质组。因此,不同器官形态、功能各异,是蛋白质组在背后&ldquo 操盘&rdquo 。 &ldquo 就 像蛹化蝶,无论形态如何变化,基因组是不变的。&rdquo 军事医学科学院放射与辐射医学研究所研究员钱小红这样比喻。在她看来,人的每一种生命形态,都是特定蛋白 质组在不同时间、空间出现并发挥功能的结果。比如,某些蛋白质表达量偏离常态的高或低,就能够表征人体可能处于某种疾病状态。 &ldquo 生,源于基 因组;命,却一定由蛋白质组决定。只有蛋白质组才能从根本上阐释生命。&rdquo 贺福初进一步解释道,&ldquo 蛋白质组,可以揭示疾病的发病机制和病理过程,发现新型诊 断标志物、治疗和创新药物,可以全面提高疾病防诊治水平。这个项目如完成,将揭示人体器官蛋白质组的构成,一旦哪一部位出现异常即可实现&lsquo GPS定位&rsquo , 进而找到针对性的诊断措施、干预措施和预防措施。&rdquo 二问 中国能搞人类蛋白质组计划吗? 以贺福初院士为代表的中国蛋白质组研究团队,在该领域向世界交上了一份漂亮的答卷,在某些方面已走在全球前列 近代以来,中国先后错过了多次世界科技革命的机遇。蛋白质组学研究,恰恰是我国生命科学中少数几个能够始终跻身世界前沿的科学领域。 据专家介绍,中国人类蛋白质组事业的发展,也催生了一系列大型研究基地和覆盖全国的协作网络。据不完全统计,目前包括中科院、教育部、卫生计生委、军队以及 湖南、广东、重庆、浙江等在内的省部级重点实验室已超过10个。由贺福初院士发起,以军事医学科学院、清华、北大为代表的7家单位共同筹建的北京蛋白质组 研究中心,于2005年被确立为&ldquo 人类肝脏蛋白质组计划&rdquo 国际执行总部,成为一座世界级的&ldquo 生命之都&rdquo 。 此外,自2000年至2010年,中国累计发表论文2800多篇,位列全球该领域第四。值得一提的是,最近4年,中国在该领域发文量直线上升,历史性地达到1000多篇,年度论文发表数已跃居世界第二(第一为美国),位居全国其他学科前列。 历经十余年的努力,中国蛋白质组研究团队向世界交上了一份漂亮的答卷:成功构建迄今国际上质量最高、规模最大的人类第一个器官&mdash &mdash 肝脏蛋白质组的表达谱、修 饰谱、连锁图及其综合数据库;首次实现人类组织与器官转录组和蛋白质组的全面对接;在炎症诱发肿瘤等方面,发现一批针对肝脏疾病、恶性肿瘤等重大疾病的潜 在药靶、蛋白质药物和生物标志物。如,2008年,张学敏课题组首次发现炎症和免疫的新型调控分子CUEDC2,可作为肿瘤耐药的新标志物,从而为克服癌 细胞耐药提供了原创性的药物新靶点和治疗新思路。2010年,周钢桥课题组&ldquo 逮到&rdquo 肝癌的易感基因,为肝癌的风险预测和早期预警提供了重要理论依据和生物 标记&hellip &hellip 上述几项成果均发表于国际顶级的《科学》《自然》系列杂志。 三问 中国人类蛋白质组计划怎样进行? 将分三个阶段进行,计划产生的大数据将全景式地揭示人体蛋白质组成及其调控规律,解读人类基因组这部&ldquo 天书&rdquo 世界蛋白质组学领域内的新一轮科技竞赛已开始。中科院院士张玉奎指出,虽然中国在蛋白质组一些领域走在了世界前列,但国外有些团队如今正快马加鞭。这警醒我们:必须加快步伐,否则很快将被甩出第一阵营。 &ldquo 逆水行舟不进则退,我们绝不能丧失已经取得的优势。&rdquo 贺福初说。 据悉,中国人类蛋白质组计划将分三个阶段展开。第一阶段,全面揭示肝癌、肺癌、白血病、肾病等十大疾病所涉及主要的组织器官的蛋白质组,了解疾病发生的主要 异常,进而研制诊断试剂、筛选药物,力争2017年左右完成;第二阶段,争取覆盖中国人的其他常见疾病,提升中国人群疾病的防治水平;第三阶段,实现人类 更多疾病的覆盖。 当前,全球每年产生的生物数据总量高达EB级(10的18次方比特),生命科学领域正在爆发数据革命。生物数据最大的是基因组数据,它完成后,蛋白质组数据 无疑将成为更大、更重要和更核心的科学数据。我国已部署建设的蛋白质科学基础设施将相继投入运行,这是国际上最大的蛋白质组学研究基地,将有力支撑和推动 中国人类蛋白质组计划的实施和大数据的产生。中国人类蛋白质组计划产生的大数据将全景式地揭示人体蛋白质组成及其调控规律,解读人类基因组这部&ldquo 天书&rdquo 。 &ldquo 这 项计划,是以中国重大疾病的防治需求为牵引,发展蛋白质组研究相关设备及关键技术,绘制人类蛋白质组生理和病理精细图谱、构建人类蛋白质组&lsquo 百科全书&rsquo , 为提高重大疾病防诊治水平提供有效手段和中国生物医药产业发展提供原动力。&rdquo 贺福初说,&ldquo 我们首先看重科学价值,其次才是经济效益,因为这是真正的原始创 新,是中国能够引领世界科技发展的重要领域之一。&rdquo
  • 蛋白质工程:跨学科研究揭神奇面纱
    在基因工程基础上发展起来的蛋白质工程,被称为“第二代基因工程”。在亚太地区蛋白质学会主席、北京大学跨院系蛋白质科学中心主任昌增益教授看来,蛋白质工程不仅蕴涵着人类攻克癌症等生命难题的重大契机,其在产业化上的巨大发展空间也是不言而喻的。   近年来,蛋白质工程研究和应用已遍及医疗、工业、农业等领域。目前,分子生物学家们已经能够通过对蛋白质进行修饰、加工、改良,使蛋白质“升级换代”。例如,人们对药物蛋白进行PEG(聚乙二醇)修饰,可以延长药物蛋白的作用半衰期 葡萄糖异构酶在工业上有着广泛的应用,人们对其基因进行定点诱变,将第138位的甘氨酸(Gly138)替代为脯氨酸(Pro)后,可显著提高葡萄糖异构酶的热稳定性,有利于其在食品工业上的应用 转入多拷贝串联的金属硫蛋白α-结构域编码基因的转基因植株,有着比野生植株更高的对重金属的抗性等等。   然而,昌增益认为,对蛋白质工程这座“金矿”的开发才刚刚开始。“尽管几十年来人们在蛋白质基础研究方面有了很大进步,但是我们对蛋白质这类结构和功能极其多样的神奇生命分子的认知还很有限,对蛋白质功能机制的研究方法和手段还远不够完善。”   他表示,如何揭示蛋白质分子发挥作用的规律,是一个复杂而艰深的难题。“借助其他学科平台,通过跨学科研究对蛋白质工程提出新的理论、新的方法,从不同的层面揭示蛋白质运作的机制,将是一个新的挑战和机遇。”   据了解,蛋白质工程研究的触角已经延伸到了各个高科技领域,包括生物、化学、物理、医学、工程以及计算机等。   “多学科、多角度、多层次的系统研究,能够帮助人们更深刻地揭示蛋白质‘神奇’的面纱,同时也能促进各学科的发展。”昌增益说。
  • 蛋白质结构分析新技术创测定速度纪录
    《自然-方法学》:蛋白质结构分析新技术创测定速度纪录   过去需几年时间完成的工作现在仅用几天即可完成   据美国物理学家组织网7月20日报道,隶属于美国能源部的劳伦斯伯克利国家实验室的科学家开发出一种利用小角度X射线散射技术测定蛋白质结构的新方法,大大提高了蛋白质结构研究分析的效率,使过去需要几年时间完成的工作仅需要几天即可完成,这将极大地促进结构基因组学的研究进程。   结构基因组学是一门研究生物中所有蛋白质结构的科学。通过对蛋白质结构的分析,可大致了解蛋白质的功能。结构基因组学重视快速、大量的蛋白质结构测定,而快速结构测定技术正是该学科研究面临的一个瓶颈问题。目前通常使用的两种测定技术,X射线晶体衍射和核磁共振质谱技术,虽然精确,但速度很慢,测定一个基因的蛋白质结构,动辄就需要几年的时间。随着新发现的蛋白质及蛋白质复合物越来越多,目前的分析速度远远不能满足研究的需要。   为解决这个瓶颈问题,劳伦斯伯克利国家实验室的科学家们借助了该实验室的先进光源(ALS)。他们运用一种称为小角度X射线散射(SAXS)的技术,对处于自然状态下(如在溶液之中)的蛋白质进行成像,其分辨率大约为10埃米(1埃米等于1/10纳米),足够用来测定蛋白质的三维结构。ASL产生的强光可以使实验所需材料减至最少,这使得该技术可以用于几乎所有生物分子的研究。   为了最大限度提高测定速度,研究小组安装了一个自动装置,可自动使用移液器吸取蛋白质样品到指定位置,以便利用X射线散射进行分析研究。他们还使用美国能源部国家能源研究科学计算机中心(NERSC)的超级计算资源进行数据分析。利用这一系统,研究小组取得了惊人的研究效率,在1个月内分析测定了火球菌的40组蛋白质结构。如果使用X射线晶体衍射技术,这可能需要花几年时间。同时,他们所获取的信息十分全面,涵盖了溶液中大部分蛋白质样本的结构信息。相比于在结构基因组学启动计划中使用核磁共振和晶体衍射技术仅能获取15%的信息量来说,这是十分巨大的进步。   高通量蛋白质结构分析有助于加快生物燃料的研究步伐,帮助解读极端微生物在恶劣环境中的繁荣之谜,更好地理解蛋白质的功能。研究小组之所以首先选择火球菌进行实验分析,就是因为它可用来生产清洁能源——氢。同时,在许多工业流程中都会出现高酸高热的环境状态,而这正是火球菌喜欢的生存环境。   但这种技术也有不足之处,追求速度会造成一种失衡,使成像质量相应打了折扣。与X射线晶体衍射成像的超高分辨率相比,小角度X射线散射成像的分辨率比较低,大约是10埃米。但这并不妨碍该技术的应用前景,因为并不是所有的研究都需要超高精度成像。对于结构基因组学研究来说,有时只要知道一种蛋白质与另一种蛋白质具有相似的结构,就可以了解其功能。而且,小角度X射线散射技术能够提供溶液中蛋白质形状、结构及构造变化等方面的精确信息,足以弥补其在成像精度方面的不足。   该研究成果刊登在7月20日《自然—方法学》杂志网络版上,美国斯克利普斯研究所和乔治亚州大学的科学家亦参与了该项研究。
  • 新技术找到人类蛋白质关键变构位点
    从不同角度显示的人类蛋白质PSD95-PDZ3 的三维图像。图片来源:安德烈福尔/CRG科技日报根据6日发表在《自然》网站上的一项新研究,人类蛋白质表面的潜在治疗靶点的数量比之前认为的要多得多。西班牙巴塞罗那基因组调控中心(CRG)的研究人员开发出一项突破性新技术,揭示了许多控制蛋白质功能的“秘密大门”,从理论上讲,这些“门”可以显著改变痴呆症、癌症和传染病等各种疾病的进程。现在,他们已经绘制出这些被称为“变构位点”的靶点的第一张图。这种发现靶点的方法可能会改变药物发现的“游戏规则”,从而研发更安全、更智能且更有效的药物。它使世界各地的研究实验室能够靶向任何蛋白质,包括那些以前被认为“无药可及”(undruggable)的蛋白质。蛋白质在所有生物体中发挥着核心作用,并执行重要功能,如提供支撑结构、加速反应、充当信使或对抗疾病。它们由氨基酸组成,在三维空间中折叠成无数不同的形状。蛋白质的形状对其功能至关重要,氨基酸序列中只要有一个错误就会对人类健康造成潜在的毁灭性后果。变构是蛋白质功能中一大未解之谜。当分子与蛋白质表面结合时会产生变构效应,这反过来又会导致该蛋白质远处的位置发生变化,从而通过“遥控”来调节其功能。许多致病突变,包括许多癌症驱动因素,都是因为其变构效应而具有病理性。尽管变构位点很关键,但它们却非常难找。此次,研究人员开发了一种名为双深度PCA(ddPCA)的技术来应对这一挑战。他们将其描述为一种“蛮力实验”,就好比发现一辆车有问题之后,不只是检查局部,而是拆卸整辆车,并逐个检查零件。通过一次性测试一万件零件,研究人员确定了所有真正重要的部件。CRG系统生物学项目协调人、该研究报告的作者本莱纳教授解释说:“我们故意以数千种不同的方式打破事物,以建立一个事物如何运作的完整图景。”该方法通过改变构成蛋白质的氨基酸来发挥作用,从而产生数千种不同版本的蛋白质,而序列中只有一两个差异。然后,研究人员在实验室的活细胞中同时测试突变蛋白质的影响。研究人员称,每个细胞都是一个小工厂,会生产不同版本的蛋白质。在一个试管中有数百万个不同的工厂,因此可以非常迅速地测试一种蛋白质的所有不同版本的工作情况。实验收集的数据被输入计算机神经网络进行分析,产生全面的地图,精确定位蛋白质表面的变构位置。该技术有望促进蛋白质功能和进化的研究。如果扩大规模,可以从氨基酸序列中精确预测蛋白质的特性。研究人员认为,一旦成功,这将开启预测性分子生物学的新时代,使发展新药和清洁的、以生物学为基础的工业成为可能。
  • 我国蛋白质组学研究取得系列成果
    由中国科学院院士贺福初领衔的北京蛋白质组研究中心/蛋白质组学国家重点实验室,在国际学术刊物《分子与细胞蛋白质组学》(Molecular & Cellular Proteomics,MCP)2009年第三期上,同时发表了《亨廷顿疾病患者脑脊液的脑特异性蛋白含量下调》等3篇研究论文。3篇论文在该刊同期发表,创造了该刊单期同一单位发表论文数量之最。3篇研究论文分别从亨廷顿疾病(HD)发病机理、乙型肝炎病毒(HBV)相关疾病的诊断治疗方法、蛋白质组质谱数据筛查新模型等方面进行了深入研究。   钱小红研究员课题组合作发表的《亨廷顿疾病患者脑脊液的脑特异性蛋白含量下调》一文,发现了亨廷顿疾病潜在的生物标志物。该研究以患者脑脊液为样本,通过对基因组和蛋白质组数据的整体研究,规模化地筛选和鉴定与亨廷顿疾病发生、发展密切相关的蛋白质,揭示出HD患者脑脊液中高表达的蛋白可作为HD的潜在生物标志物,为有效诊断亨廷顿疾病提供了可能的参考指标。   HBV感染作为一种严重危害人类健康的重大疾病,目前治疗手段有限,其重要原因是缺乏有效的治疗靶点。   姜颖副研究员课题组用先进的蛋白质复合体分离和鉴定方法,发现了治疗乙型肝炎病毒相关疾病的潜在靶点,为系统了解乙型肝炎病毒的生命周期和研发相关疾病的治疗药物提供了新的思路。   大规模、高通量的蛋白质组研究产生了海量数据,其中包含了大量的“噪声”,而可靠的数据是进一步生物学分析的基础。目前的分析方法均采用了过严的标准,这在降低假阳性的同时也人为造成了数据较高的假阴性,导致大量数据浪费。因此,“在保证高可信度的前提下,最大限度地利用实验数据”一直是蛋白质组学界的追求。朱云平研究员课题组基于随机数据库策略、非参概率密度模型和贝叶斯公式,建立了串联质谱数据过滤的多元贝叶斯非参模型,将质谱数据的利用率提高了10%~40%,创造了目前该领域研究的最好水平。
  • ​研究蛋白质热稳定性的几种方法
    研究蛋白质热稳定性的几种方法蛋白跟核酸不一样,核酸都是由四个碱基组成,只是组成的顺序不一样,但是整体的结构都是类似的双螺旋结构。而蛋白由20多种不同氨基酸组成,需要折叠成正确的三维结构才能发挥自身作用。所以每个不同功能的蛋白长得样子其实都是不同的。蛋白的高级结构决定其功能,行使功能需要正确折叠。蛋白由20多种不同氨基酸组成,需要折叠成正确的三维结构才能发挥自身作用。蛋白质在一定的物理和化学条件(加热、加压、脱水、振荡、紫外线照射、超声波、强酸、强碱、尿素、重金属盐、十二烷基硫酸钠)下,其空间构象容易发生改变而失活,因此研究蛋白的构象和构型变化对其应用有重要的价值。蛋白质的变性作用主要是由于蛋白质分子内部的结构被破坏。天然蛋白质的空间结构是通过氢键等次级键维持的,而变性后次级键被破坏,蛋白质分子就从原来有序的卷曲的紧密结构变为无序的松散的伸展状结构(但一级结构并未改变)。热变性是蛋白质变性中最常见的一类现象。蛋白质的热稳定性是指蛋白质多肽链在温度影响下的形变能力,主要体现在温度改变时多肽链独特的化学特性和空间构象的变化,变化越小热稳定性越高。蛋白质的热稳定性受到不同温度、pH值、离子强度等外界因素的影响,在生物技术、药物研发以及食品工业等领域,具有重要意义。蛋白质变性温度是生物学家们研究蛋白质的热稳定性的一个重要的概念,是指蛋白质在特定温度条件下受到热力作用时,其结构发生变化的温度点,一般温度较高时,蛋白质从稳定的三维结构变化成松散的无序结构。蛋白质的热稳定性一般使用热变性中点温度(meltingtemperature,Tm)来表示,即蛋白质解折叠50%时的温度。蛋白质的热变性过程与其空间构象的改变密切相关,Tm值能反映变温过程中蛋白质构象改变的趋势,是衡量蛋白质热稳定性的一个重要指标。蛋白质Tm值的测定在生物医药行业具有广泛的应用,如嗜热蛋白、工业酶等的改造与筛选,蛋白质药物与配体、制剂或辅料的相互作用,蛋白质药物的缓冲液稳定条件筛选等。目前,许多多种方法可以用来测量蛋白质的变性温度,如圆二色光谱法(circulardichroism,CD)、差示扫描量热法(differentialscanningcalorimetry,DSC)、动态光散射法(DynamicLightScattering)和差示扫描荧光法(differentialscanningfluorimetry,DSF)等。 目前,许多多种方法可以用来测量蛋白质的变性温度,如圆二色光谱法(circulardichroism,CD)、差示扫描量热法(differentialscanningcalorimetry,DSC)、动态光散射法(DynamicLightScattering)和差示扫描荧光法(differentialscanningfluorimetry,DSF)等。 01 圆二色谱法(CD)圆二色光谱(简称CD),或红外(傅里叶变换红外(FourierTransformInfrared,FTIR)光谱),是应用最为广泛的测定蛋白质二级结构的方法,是研究稀溶液中蛋白质构象的一种快速、简单的方法。圆二色谱法诞生于20世纪60年代,其原理是利用左、右两束偏振光透过具有手性结构的生物大分子等活性介质,获得的圆二色谱来分析其结构特点,是蛋白质、核酸、糖类等生物大分子二级结构分析的常规手段之一。蛋白由α螺旋和β折叠构成,α螺旋和β折叠在红外和紫外光段有特异的光吸收。蛋白质对左旋和右旋圆偏振光的吸收存在差异,利用远紫外区(190~260nm)的光谱特征能够快速分析出溶液中蛋白质的二级结构,进而分析和辨别出蛋白质的三级结构类型,变温过程中测量蛋白等物质的圆二色谱,能反映其随温度升高结构变化的趋势。此外,通过测定蛋白质在不同温度下的平均残基摩尔椭圆度[θ]可以获得蛋白质的Tm值。特点:圆二色光谱(CD)适用于测定稀释溶液的热稳定性,操作相对简单,成本较低。但是相关仪器很昂贵,对缓冲液要求也高,要求溶液不能有任何的紫外吸收,也很难做到高通量检测。 02差示扫描量热法(DSC) 蛋白变性时会有温度变化,检测温度变化就能知道蛋白变性程度。差示扫描量热法的应用始于20世纪60年代,是在程序控温下,通过测量输给待测物和参比物的功率差与温度的关系,以获得吸放热量的技术。差示扫描量热法能定量测量热力学参数,可提供与蛋白质热变性过程中构象变化有关的热效应信息。差示扫描量热法(DSC)是一个很经典的一个技术,基于的蛋白变性过程中对热量的吸收。蛋白是有三维结构的,比如氢键,疏水键,范德华力。一旦通过加热然后把结构破坏掉,需要吸收热量。所以可以测量热量变化,就是加热结构变化过程中的热量吸收。通过对参照物和样品同时进行升温或冷却处理,测定两者为保持相同温度所产生的热量差,从而计算蛋白质的Tm值。特点:差示扫描量热法(DSC)能够提供直接的热量变化数据,定量准确、操作简便。但检测通量低、耗时较长,需要的样品体积和浓度比较大。相关仪器中最核心的部件是样品池,对周围环境要求极高。 03 动态光散射法(DLS)动态光散射是基于光学的方法,检测的是蛋白变性之后会发生聚集,导致颗粒的大小发生改变,对散射信号的影响。蛋白在变性过程中,从一个规则高级折叠结构打开,变成一个线性的松散结构。本来外部是亲水的氨基酸,内部是疏水的氨基酸。一旦打开之后,这些疏水的氨基酸会相互就是结合到一起。就是因为疏水的一个相互作用,然后变成一个球状聚集体。此过程会引起这个光的散射的变化。基于动态光散射的信号随着加热的过程的变化就代表粒径的变化,可以计算出蛋白质的Tm值。动态光散射用于表征蛋白质、高分子、胶束、糖和纳米颗粒的尺寸。如果系统是单分散的,颗粒的平均有效直径可以求出来,这一测量取决于颗粒的心,表面结构,颗粒的浓度和介质中的离子种类。DLS也可以用于稳定性研究,通过测量不同时间的粒径分布,可以展现颗粒随时间聚沉的趋势。随着微粒的聚沉,具有较大粒径的颗粒变多。同样,DLS也可以用来分析温度对稳定性的影响。特点:动态光散射可以做到孔板式的检测,具有比较高的通量。但是对于某些样品的检测有限制,因为并不是所有的蛋白在变异之后都会形成这种聚集体,而有一些可能需要很高的浓度才会提升,浓度较低条件下,就观察不到粒径的变化。 04 外源差示扫描荧光法(DSF)差示扫描荧光(DSF)也被称为热荧光法(ThermoFluor),是一种经济高效且易于使用的生物物理技术,通过检测当温度升高或变性剂存在时荧光发射光谱的相应变化来确定蛋白质的变性温度(热变性温度Tm值或化学变性Cm值)。Pantoliano等最先应用此技术测定了上百种蛋白质的热稳定性。差示扫描荧光法分为添加外源荧光染料与不添加荧光染料两种方式,都是利用加热使蛋白内部疏水基团暴露这一特点进行检测Tm值。传统DSF经常使用350/330比值法来进行数据分析根据荧光源不同分为内源荧光DSF和外源荧光染料DSF。基于外源染料荧光的DSF其原理是利用能与蛋白内部疏水基团相互作用的染料为荧光源。蛋白质加热变性后疏水基团暴露,疏水基团与亲和性染料结合产生荧光信号,检测荧光强度变化测定蛋白质的Tm值。特点:借助荧光定量PCR适用于高通量筛选,信号强度可控,灵敏度和准确性都较高。但添加的外源染料可能会对蛋白质结构和功能产生影响,且操作较复杂,不适用于所有蛋白研究。比如做膜蛋白研究时,溶液环境中需要添加双亲性的分子,一端疏水一端亲水。这种情况荧光分子会直接结合到疏水端,导致直接产生荧光信号。并且染料种类的选择、浓度的选择也很繁琐。外源荧光染料DSF也可能会产生背景荧光以及非特异吸附等假阳性结果。 05 内源差示扫描荧光法(inDSF)内源差式扫描荧光inDSF,基于蛋白质中特定氨基酸的荧光特性。这些氨基酸的荧光强度与其所处的微环境密切相关,因此,当蛋白质的结构发生变化时,这些氨基酸的荧光信号也会随之改变。不需要额外的荧光染料加入到检测体系中,利用蛋白内部芳香族氨基酸的自发光原理。不需要任何额外的标记或固定步骤,避免引入结果的不确定性。研究发现,蛋白质分子中芳香环氨基酸在处于不同极性的微环境时(如疏水或亲水环境中),其被激发的内源荧光的最大发射光谱会发生位移。蛋白质中内源荧光主要来自含芳香环氨基酸如色氨酸(Trp),苯丙氨酸(Phe)和酪氨酸(Tyr),其中以色氨酸内源荧光最强。当它在蛋白内部时,发射光主要在330波段,当蛋白一旦去折叠,暴露在溶剂中,发出的光就会从330波长红移到350。所以通过280激发,检测330/350的比值变化,就能测量蛋白质的Tm值。以色氨酸为例,在蛋白质疏水的内核微环境中,其内源荧光最大发射波长在330nm左右,而在亲水的极性微环境中,色氨酸的内源荧光最大发射波长则出现在350nm左右。蛋白质热变性或者化学变性通常会导致色氨酸残基周围微环境的极性发生变化,使通常被包埋于蛋白质疏水内核的色氨酸逐渐暴露于亲水的环境中,从而导致发射内源荧光最大发射波长发生红移(RedShift),即向更大的波长区域移动。特点:内源差式扫描荧光DSF无需复杂的样品处理或标记步骤,实验过程简单方便。但不是所有蛋白质都含有足够的荧光基团,所以对于部分样品检测灵敏度不够,且检测可能会受其他基团影响。 06 技术对比总结总得来说,DSF和DLS法在样品用量及测定效率上更有优势,比较适合进行高通量筛选。但DSF法需要样品含有色氨酸、酪氨酸或额外添加荧光染料,这可能会对样品测量范围带来一定限制,DLS对样品浓度有要求。DLS还可以获取聚集体粒径大小的信息。DSC法虽然在样品用量与检测效率上不及DSF,但作为量热的经典方法仍是不可缺少的Tm值测量手段,在进行批量样品的热稳定性筛选时,可以使用DSF法初筛,DSC法复筛。此外,DSC能测定蛋白质变性过程中的热容变化ΔCp、焓变ΔH、解折叠自由能ΔG、玻璃态转变温度、分子流动临界温度等其他重要热力学参数。CD作为检测蛋白二级结构的经典方法,在Tm值测定方面具有其独特优势和一定的局限性,也是研究加热过程中蛋白结构改变的重要方法。蛋白质Tm值测定具有重要的实际应用价值,例如辅助生物药物开发、生产和质量控制,评估生物相似性、优化蛋白药物配方等,还可以作为探索蛋白质高级结构的手段之一指导蛋白质工程,如比较不同突变对蛋白质稳定性的影响,研究结构域改变与功能活性改变关联性等。比较不同Tm值测定方法,全面了解技术特点及测量效果对于Tm值测定的实际应用具有一定的指导意义,在科研或生产工作中可以灵活选用或联用多种技术来阐明不同条件下的结构变化特点。 07 国产蛋白稳定性分析仪PSA-16 北京佰司特科技有限责任公司于2023-10-01日推出了自主研发的第一款国产蛋白稳定性分析仪,该设备性能和参数达到进口设备的水平,价格却远低于进口产品,弥补了目前国产自主设备在蛋白稳定性专业研究分析领域的空白。多功能蛋白稳定性分析仪PSA-16是一款无需荧光染料、高通量、低样品消耗量的检测蛋白质稳定性的设备。该设备基于内源差示扫描荧光技术(intrinsic fluorescence DSF),通过检测温度变化/变性剂浓度变化过程中蛋白内源紫外荧光的改变,获得蛋白质的热稳定性(Tm值)、化学稳定性(Cm值)等参数。可应用于蛋白缓冲液条件筛选及优化、小分子与蛋白结合情况的定性测定、蛋白质修饰及改造后的稳定性测定、蛋白变/复性研究、不同批次间蛋白稳定性对比等多个方面。 多功能蛋白稳定性分析仪PSA-16应用涵盖植物、生物学、动物科学、动物医学、微生物学、工业发酵、环境科学、农业基础、蛋白质工程等多学科领域。蛋白质是最终决定功能的生物分子,其参与和影响着整个生命活动过程。现代分子生物学、环境科学、动医动科、农业基础等多种学科研究的很多方向都涉及蛋白质功能研究,以及其下游的各种生物物理、生物化学方法分析,提供稳定的蛋白质样品是所有蛋白质研究的先决条件。因此多功能蛋白稳定性分析仪PSA-16在各学科的研究中都有重要的意义。1. 抗体或疫苗制剂、酶制剂的高通量筛选2. 抗体或疫苗、酶制剂的化学稳定性、长期稳定性评估、等温稳定性研究等3. 生物仿制药相似性研究(Biosimilar Evaluation)4. 抗体偶联药物(ADC)研究5. 多结构域去折叠特性研究6. 物理和化学条件强制降解研究7. 蛋白质变复性研究(复性能力、复性动力学等)8. 膜蛋白去垢剂筛选,膜蛋白结合配体筛选(Thermal Shift Assay)9. 基于靶标的高通量小分子药物筛选(Thermal Shift Assay)10. 蛋白纯化条件快速优化等
  • 基于质谱的血浆蛋白质组学领域新进展
    6月美国质谱学会年会(ASMS)上发布的最新数据表明,新的仪器和工作流程极大地提高了基于质谱的血浆蛋白组学实验的覆盖深度和通量。这些进步可使质谱成为各应用领域中更有用的工具,包括血浆蛋白生物标志物的开发以及迄今由Olink和SomaLogic等亲和性平台主导的大规模人群研究。  血浆是一种易于获取和常用的样本来源,尤其是在临床工作和人群研究中。然而,由于血浆含有大量丰度较高的蛋白质和较宽的动态范围,传统的质谱蛋白质组学分析能力不足。对于细胞裂解物的分析,质谱工作流程可测量8000到12000个蛋白质,但对血浆,类似的工作流程只能测量500到1000个蛋白质。虽然可通过去除丰度较高的蛋白质或进行粗分离来改善这一情况,但这也会牺牲通量。  去年,瑞士蛋白质组学公司Biognosys在Journal of Proteome Research杂志上发表了一项研究,他们使用赛默飞的Orbitrap Exploris 480质谱仪,通过两小时的液相色谱梯度测量了180个去除了高丰度蛋白的血浆样品中的2732个蛋白质,这是未进行血浆分离处理情况下最高深度的血浆蛋白质组分析。  最近,蛋白质组学公司Seer推出了一种新的血浆蛋白组学解决方案。该公司的Proteograph系统使用一组纳米颗粒来富集血浆蛋白质,然后可以使用质谱等技术对其进行鉴定和定量分析。与传统的血浆蛋白组学方法相比,Seer系统在覆盖深度和通量上都有所提升。在一份发表于四月BioRxiv 预印本的研究中,威尔康奈尔医学院-卡塔尔团队使用该系统分析了345个血浆样本,测量了大约3000种蛋白质,在其液相色谱-质谱法的运行时间下每天可分析大约10个样本。  根据以上数据,Biognosys分析和Seer系统的覆盖深度都接近于Olink的Explore平台,后者可以在血浆中测量大约3000种蛋白质,但它们仍远远落后于SomaLogic的SomaScan平台,后者可以在血浆中测量大约7000种蛋白质。在每周约70个样本的处理量上,Biognosys和Seer系统的通量仍然落后于Olink和SomaLogic平台,后者每周分别可以处理多达1000个和340个样本。  ASMS年会上,赛默飞展示了使用Seer最新发布的Proteograph XT试剂盒在其新的Orbitrap Astral仪器上测量大约6000种蛋白质的数据,每天处理大约30个血浆样本。这些数据标志着血浆蛋白组学工作流程的重大进展,并表明在大规模血浆研究方面,结合Seer Proteograph等血浆富集技术的质谱法与基于亲和性的平台现在可能成为竞争对手。  剑桥大学临床医学院MRC流行病学单位的生物信息学家Maik Pietzner表示:“坦白说,我们没有预见到这么大的飞跃。”他和他的同事在大规模蛋白质基因组学研究中使用了SomaLogic的SomaScan和Olink的Explore。他指出,根据ASMS展示的数据,“看起来现在似乎变得可行了”,因为他们的研究需要1000个或更大的样本队列。  华盛顿大学基因科学教授Michael MacCoss还表示,质谱技术具备的覆盖深度和通量使其成为大规模人群研究的有用工具。他说:“像英国生物库(UK Biobank)或弗雷明汉心脏研究(Framingham Heart Study)这样的大型队列……这些样本的价值是巨大的,研究人员希望能够以最少的资源获取最多的信息,很多实验都使用了Olink或SomaLogic。”  如果质谱技术能够可靠地提供ASMS演示中展示的覆盖深度和通量,它可能成为亲和性平台的有力补充和竞争对手。许多蛋白质存在多种形式,或称为蛋白质变体,其变异包括氨基酸变异、截断或翻译后修饰等,这些变化会影响它们的功能,在亲和性平台上往往不清楚或不确定测量的是蛋白质的哪种变体。质谱方法更适合分析这些不同的蛋白质变体。  Olink总裁Carl Raimond表示,他认为质谱和亲和性平台是“绝对互补的”,并补充说“看到蛋白质分析领域有创新是非常好的”。然而,他表示在Olink占据领先地位的大规模人群研究中质谱技术近期可能无法成为竞争对手,他同时也质疑ASMS展示的令人印象深刻的数据在广泛应用时是否能够经受考验。他说:“细节决定成败。提出要求很容易,但真正能够实现或提出关于这一要求背后的问题则是完全不同的事情。”Raimond补充说,虽然质谱技术不断改进,但亲和性平台也将不断进步。Olink正在将其Explore平台扩展到约5,000种蛋白质靶点,而SomaLogic计划在今年年底前将SomaScan平台扩展到覆盖约10,000种蛋白质。Pietzner同样表示,虽然在ASMS上发布的数据令人兴奋,但他和他的同事们期待看到更广泛的数据,包括总体的蛋白质覆盖范围,不同蛋白质和肽段在样本中检出的一致性和重复性。他说,“亲和性方法已经应用于规模大于50,000的人群队列中,并带来了惊人的发现。我们需要进行头对头的比较以评估这些新的质谱技术是否能够实现类似的扩展。”  MacCoss表示,使用质谱进行此类研究的公司或研究人员需要提供数据,证明他们能够在每个样本中一致且可重复地测量一组核心蛋白。他说:“当人们使用Olink时会有一个清单,上面列出了每次都会测到的蛋白质。我们仍然需要这样做。我们仍然需要说,这是每次实验都会返回定量值的蛋白质列表……以及测量中获得高质量分析数值的蛋白。”  Pietzner表示,他和他的同事目前正在努力扩展他们的蛋白质基因组学研究以包括质谱技术。强生和强生制药公司的神经科学数据科学主管,以及英国生物库药物蛋白质组学项目(PPP)主席Christopher Whelan表示,目前一个规模最大的蛋白质基因组学人群研究项目正在实施基于质谱的蛋白质组学。  Seer本月宣布推出Seer技术访问中心,该中心将组合其XT试剂盒与Orbitrap Astral质谱仪,为没有质谱仪的用户提供蛋白质组学服务。  尽管到目前为止很难全面评估赛默飞的Orbitrap Astral和Seer的Proteograph XT的性能,但一些早期用户表示其产生的结果很出色。  Cedars-Sinai精准生物标志物实验室主任Jennifer Van Eyk一直在使用Orbitrap Astral进行血浆蛋白质分析,在这方面它比先前的仪器有更强的能力。Van Eyk表示,在每天运行60个样本时,新仪器可测得的蛋白质数量是相同工作流程下使用Thermo Fisher的Exploris 480仪器的2到2.5倍。  她说:“我们不仅可以检测到更多蛋白质,而且可以定量更多蛋白质,并且这些蛋白质是可重复的,也就是说,如果我们运行一个样本五次,我们确实会五次都观察到同样的蛋白。这是一个很大的飞跃。”这台仪器最出色的或许是其高通量,Van Eyk表示,她和她的同事们每天可以运行多达180个的未去除高丰度蛋白的血浆样本并获得良好的数据和深度的覆盖。她说,“在每天运行180个样本的情况下,突然间你可以开始讨论运行10,000个样本,然后它就成为一个人群研究了。”Van Eyk和她的同事目前正在试验Seer Proteograph系统,以“充分测试”其性能,并评估是否要将其作为血浆蛋白质组学工作流程的一部分。  威斯康星大学麦迪逊分校的生物分子化学和化学教授Joshua Coon指出,他的实验室能够使用50分钟的液相色谱梯度在未处理的血浆中测量大约1,500种蛋白质,并且已经在该仪器上开发出了一种一分钟的直接注射方法,能够在每个样本中测量约200种蛋白质。  Coon还是SeerProteograph平台的用户,尽管他尚未将其与Orbitrap Astral结合使用。他的实验室一直在使用Seer XT试剂盒分析阿尔茨海默病患者的血浆样本以及长期新冠肺炎(long COVID)个体的样本。他说,尽管他的团队尚未开始处理大批量样本,但在初步工作中,实验室每个样本一致地测量到约3,000种蛋白质,这是不使用Seer系统时的五倍左右。他认为,当研究人员将工作流程应用于Orbitrap Astral系统时,这些数字还会进一步提高。  除了覆盖深度外,Coon表示,Proteograph对简化质谱样品制备非常有用。他说:“我没有完全认识到到它的自动化程度,它非常方便。现在主要的用户是一个一年级和二年级的研究生……所以他们必须快速学习。他们在处理样本、获得消化产物和肽段方面取得了很大的成功。当你有新人或者长时间不做该工作的人时,进行大规模蛋白质组学研究的样品制备将耗费整个实验一半以上的精力,只需使用该平台然后熟练掌握。”  尽管Seer Proteograph平台提供的覆盖深度使质谱血浆蛋白质组学在某些应用中与Olink和SomaLogic等亲和力平台更具竞争力,但Seer本身在血浆富集领域面临新的竞争。  在ASMS会议上,蛋白质组学样品制备公司PreOmics推出了其ENRICH-ist富集血浆和血清蛋白质的试剂盒。该试剂盒使用非功能化顺磁性微珠来富集低丰度蛋白质,据该公司称,与未去除高丰度以及未富集的血浆相比,用该试剂盒处理血浆可将蛋白质检出率从50%提升至100%。PreOmics首席执行官Garwin Pichler表示,微珠与缓冲液的结合可在去除高丰度蛋白的同时富集低丰度蛋白以提高覆盖深度。Biognosys推出了一种新的基于微珠的血浆蛋白质组富集试剂盒,作为其TrueDiscovery服务平台的一部分。据该公司称,这种试剂盒可以高通量定量人类血浆中约4,000种蛋白质。  此外,在本月,华盛顿大学研究人员领导的团队在BioRxiv预印本上发表了一篇论文,描述了一种使用ReSyn Biosciences的磁性微粒富集血浆蛋白质的方法,其通过结合血浆中的膜结合囊泡并分析相关蛋白质来提高覆盖深度。华大的MacCoss是这篇预印本的通讯作者,该预印本的第一作者Christine Wu也是该富集方法的主要开发者。他们能够在Orbitrap Astral上使用30分钟的液相色谱梯度稳定地定量约4,800种血浆蛋白质,每天可处理约40个样本。在使用一小时的液相色谱梯度时,他们能够测量5,000到6,000种蛋白质。MacCoss他们迄今没有过度挑战该方法的能力,所以这些数字是相对保守的。MacCoss表示,由于Seer公司的技术成本较高,研究人员对于血浆蛋白质组学富集的替代方法很感兴趣。他说:“Seer在制造这些产品方面做得很好,但成本是一个高门槛。”  维也纳分子病理研究所的蛋白质组学负责人Karl Mechtler表示,他与Seer的讨论中,每个样品的报价大约是600美元。他说:“如果我有100个样品,对于一个蛋白质组学实验室来说,这是一笔巨款。”他指出,对于一个典型的蛋白质组学实验室,一个合适的价格范围应该在每个样品25到50美元左右。Wu表示,使用华大的富集方法进行实验的每个样品成本低于5美元。PreOmics将ENRICH-ist试剂盒作为完整蛋白质组学样品准备工作流程的一部分销售,每个样品总共80美元。  在回答成本问题时,Seer公司董事长兼首席执行官Omid Farokhzad表示,他认为价格是“价值交换的问题”。他说:“并非所有内容都是等价的。问题在于,从Seer所提供的与其替代方案所提供的内容来说,价值交换是什么?”在血浆蛋白质组学领域最新的发展中,这个问题的答案似乎是一个不断变化的目标。  参考文献:[1] Tognetti Marco,Sklodowski Kamil,Müller Sebastian et al. Biomarker Candidates for Tumors Identified from Deep-Profiled Plasma Stem Predominantly from the Low Abundant Area.[J] .J Proteome Res, 2022, 21: 1718-1735.[2] bioRxiv - Genomics Pub Date : 2023-04-21 , DOI:10.1101/2023.04.20.537640Karsten Suhre, Guhan Ram Venkataraman, Harendra Guturu, Anna Halama, Nisha Stephan,Gaurav Thareja, Hina Sarwath, Khatereh Motamedchaboki, Margaret Donovan, Asim Siddiqui, Serafim Batzoglou, Frank Schmidt
Instrument.com.cn Copyright©1999- 2023 ,All Rights Reserved版权所有,未经书面授权,页面内容不得以任何形式进行复制