当前位置: 仪器信息网 > 行业主题 > >

蛋白质序列

仪器信息网蛋白质序列专题为您整合蛋白质序列相关的最新文章,在蛋白质序列专题,您不仅可以免费浏览蛋白质序列的资讯, 同时您还可以浏览蛋白质序列的相关资料、解决方案,参与社区蛋白质序列话题讨论。

蛋白质序列相关的资讯

  • 岛津推出《蛋白质测序仪PPSQ在生物药N-末端氨基酸序列分析的应用》方案
    —抗体药、蛋白质药、N-末端甲硫氨酸缺失或焦谷氨酸环化封闭等—? 目前,在制药领域,生物药得到越来越多的关注。生物药是利用DNA重组、细胞融合、细胞培养等生物技术开发出的蛋白质药物、抗体药物等。几乎所有蛋白质合成都起始于N-末端,其序列组成对于蛋白质整体的生物学功能有着重要的影响力,因此蛋白质的序列分析对于生物药效果非常关键。 2015版《中国药典》三部人用重组DNA技术产品总论对生物药的生产及质量控制方面,,针对其蛋白质结构提出技术要求,应测定目标产品的氨基酸序列,并与其基因序列推断的理论氨基酸序列进行比较。因此,N-末端氨基酸序列分析是很多已上市生物药的年检项目,如重组人促红素注射液(CHO细胞) 、重组人粒细胞刺激因子注射液等。此外,国际法规中也有对于生物药N-末端氨基酸序列测定的要求。药品注册的国际协调组织颁布的指导法规ICH-Q6B规定,生物药进行申报时,必须提供N-末端氨基酸序列信息。《欧洲药典》中规定,生物仿制药申报也必须提供N-末端序列。 Edman降解法是蛋白质N-末端测序的常用方法,岛津公司的蛋白质测序仪(Protein Sequencer)PPSQ以Edman降解法为基础,将蛋白质从N-末端顺次切断进行序列分析。此方法具有直接测定、可靠性高的优势。近期,岛津推出新型的蛋白质测序仪PPSQ 51A/53,配备SPD-M30A高灵敏度检测器、软件满足FDA 21 CFR Part 11数据完整性的要求。PPSQ 51A/53梯度系统更是在等度系统基础上,提高检测灵敏度,适合微量样品的氨基酸序列分析。我们应用岛津PPSQ 51A/53A开发了单克隆抗体药、重组蛋白药的N-末端氨基酸序列分析方法,另外,也开发了具有特殊结构的生物药N-末端氨基酸序列分析方法,如甲硫氨酸缺失、焦谷氨酸环化封闭等样品,编写了《蛋白质测序仪PPSQ在生物药N-末端氨基酸序列分析的应用》文集:包括经十二烷基硫酸钠聚丙烯酰胺凝胶电泳分离轻链和重链,从而测定N-末端氨基酸序列的单克隆抗体药贝伐单抗和曲妥珠单抗等;含有特殊结构的如N-末端部分甲硫氨酸缺失的重组人粒细胞巨噬细胞刺激因子注射液原液、N-末端焦谷氨酸环化封闭类单克隆抗体帕尼单抗、含有二硫键的溶菌酶和催产素;用自制的脱盐装置分析具有高浓度盐的蛋白质药物重组人促红素原液(CHO细胞)和重组人粒细胞刺激因子注射液。关于岛津 岛津企业管理(中国)有限公司是(株)岛津制作所于1999年100%出资,在中国设立的现地法人公司,在中国全境拥有13个分公司,事业规模不断扩大。其下设有北京、上海、广州、沈阳、成都分析中心,并拥有覆盖全国30个省的销售代理商网络以及60多个技术服务站,已构筑起为广大用户提供良好服务的完整体系。本公司以“为了人类和地球的健康”为经营理念,始终致力于为用户提供更加先进的产品和更加满意的服务,为中国社会的进步贡献力量。
  • 岛津应用:应用蛋白质测序仪PPSQ-53A测定N-末端部分甲硫氨酸缺失的蛋白质类药物的N-末端氨基酸序列
    生物体在合成蛋白质时,N-末端首位的甲硫氨酸在蛋白质加工过程中可能被酶切除。本文以蛋白质类药物重组人粒细胞巨噬细胞刺激因子注射液原液为例,演示了应用蛋白质测序仪PPSQ-53A进行N-末端甲硫氨酸部分缺失的蛋白质分析的方法和结果。本应用蛋白质测序仪PPSQ-53A测定了发生N-末端部分甲硫氨酸切除的蛋白质类药物重组人粒细胞巨噬细胞刺激因子的-N未端前16个氨基酸的序列,结果与理论序列一致。除了氨基酸定性,根据信号峰强度,可以粗略估计样品N-末端甲硫氨酸的缺失比例。以上表明应用PPSQ-53A可以测定N-未端部分甲硫氨酸缺失的蛋白质的N-末端氨基酸序列。可作为此类生物药物样品分析时的参考。 ?了解详情,敬请点击《应用蛋白质测序仪PPSQ-53A测定N-末端部分甲硫氨酸缺失的蛋白质类药物的N-末端氨基酸序列》关于岛津 岛津企业管理(中国)有限公司是(株)岛津制作所于1999年100%出资,在中国设立的现地法人公司,在中国全境拥有13个分公司,事业规模不断扩大。其下设有北京、上海、广州、沈阳、成都分析中心,并拥有覆盖全国30个省的销售代理商网络以及60多个技术服务站,已构筑起为广大用户提供良好服务的完整体系。本公司以“为了人类和地球的健康”为经营理念,始终致力于为用户提供更加先进的产品和更加满意的服务,为中国社会的进步贡献力量。
  • 岛津应用:蛋白质测序仪PPSQ-53A分析贝伐单抗N-末端氨基酸序列
    贝伐单抗是重组的人源化单克隆抗体。2004年2月26日获得FDA的批准,是美国第一个获得批准上市的抑制肿瘤血管生成的药。本文应用 SDS-PAGE(十二烷基硫酸钠聚丙烯酰胺凝胶电泳)将贝伐单抗的重链和轻链进行分离,使用电转印方法将 SDS-PAGE膜上的样品转移到PPSQ使用的PVDF膜上,使用蛋白质测序仪PPSQ-53A对贝伐单抗进行N-末端氨基酸序列分析。实验结果显示测定的重链和轻链的N-末端氨骏序列与理论相符,验证了方法的准确性,表明此方法适合抗体药N-末端的氨基酸序列分析。本文可作为分析抗体药N-末端氨基酸序列分析时的参考。 了解详情,敬请点击《蛋白质测序仪PPSQ-53A分析贝伐单抗N-末端氨基酸序列》关于岛津 岛津企业管理(中国)有限公司是(株)岛津制作所于1999年100%出资,在中国设立的现地法人公司,在中国全境拥有13个分公司,事业规模不断扩大。其下设有北京、上海、广州、沈阳、成都分析中心,并拥有覆盖全国30个省的销售代理商网络以及60多个技术服务站,已构筑起为广大用户提供良好服务的完整体系。本公司以“为了人类和地球的健康”为经营理念,始终致力于为用户提供更加先进的产品和更加满意的服务,为中国社会的进步贡献力量。
  • 蛋白质测序技术发展漫谈(续)——基于荧光、纳米孔的单分子蛋白质测序
    前文回顾(点击查看):蛋白质测序技术发展漫谈(上篇);蛋白质测序技术发展漫谈(中篇);蛋白质测序技术发展漫谈(下篇)前面描述了目前成熟的蛋白质测序方法,并对最流行的基于质谱的蛋白质测序方法进行了综述。非质谱依赖的蛋白质测序手段,除了几十年前发展的基于Edman降解法通过气相或液相色谱测序的方法,最近热门领域的方法主要包括基于荧光或纳米孔的单分子蛋白质测序,代表了未来的发展方向。基于纳米孔单分子蛋白质测序方法纳米孔测序(nanopore sequencing)法是借助电泳驱动力使待测单个分子逐一通过纳米孔,通过检测纳米孔截面的电流变化来实现对序列的测定。纳米孔测序最初在1996年被提出,通过膜通道检测多核苷酸序列,也就是单分子DNA的测序[1]。随着使用纳米孔对单分子DNA测序技术的逐渐成熟[2-5],纳米孔技术也被应用在单分子蛋白质的鉴定上。对于DNA来说,其二级结构和电荷相对比较一致,它的聚合物比较容易处理,而且仅由四种碱基组成,单分子DNA测序比较简单。相比之下,蛋白质分子由20种氨基酸组成,并且蛋白的电荷和疏水性多变,还存在大量的二级和三级结构,因此基于纳米孔技术对蛋白质的鉴定要比DNA困难很多[6]。当前的基于纳米孔对蛋白质分析的主要探索方向是通过寡核苷酸适配子或抗体等亲和分子对纳米孔进行功能化,当蛋白质或肽段分子通过纳米孔时,由于不同氨基酸在纳米孔附近的结合或通过会引起不同幅度的电流变化,基于这些变化就可以确定氨基酸的种类,从而逐个得到所测蛋白质或肽段的序列信息(图1)。图 1 借助纳米孔的横向电流检测单分子蛋白质[2]牛津大学的Hagan Bayley[7]团队将单个α-血溶素蛋白孔插入两侧带有电极的膜中,磷酸化的蛋白质在DNA寡核苷酸的牵引下展开,并穿过纳米孔,通过记录纳米孔的电流变化区分出了202个磷酸化蛋白质的4种不同亚型,但无法鉴定蛋白质的一级结构。Francesco[8]团队将蛋白质或氨基酸吸附在金纳米星上,并施加电等离子体力将粒子推进并约束在金纳米孔内,利用金纳米星与金纳米孔壁之间的单个热点,实现了单分子表面增强拉曼散射(SERS)探测,用于检测氨基酸,并且可以分辨仅含有两个不同氨基酸的单个多肽分子抗利尿激素和催产素。Cao等[9]通过单个定点突变,在具有锥形识别位点的耻垢分枝杆菌孔蛋白A(MspA)的纳米孔内腔中引入了甲硫氨酸,从而将该反应有目的的移植到了MspA纳米孔最尖锐的识别位点,并观测到了相应的单分子反应信号。该纳米孔可以引入更多的离子电流,从而放大检测信号,其狭窄的识别位点则提供了更高的空间分辨率,大大削弱了周围氨基酸的干扰,从而拓宽生物纳米孔的单分子检测功能,有望推进基于孔道的单分子蛋白质测序研究。Ouldali[10]研究团队研发出了一种新型气溶素纳米孔,此纳米孔借助将氨基酸附着在聚阳离子载体上,使氨基酸在纳米孔上停留时间变长,并检测其通过纳米孔时电流的变化,最终可识别出组成蛋白质的15种氨基酸,也能检测到组成蛋白质的其余5种氨基酸的电流变化,但是无法对其进行区分。虽然只是对氨基酸进行识别,但作者设想通过对蛋白或者肽段末端氨基酸逐个降解,利用纳米孔技术鉴定从末端释放出来的氨基酸,从而对蛋白质或肽段序列进行测定。Zhao[11]等将一对金属电极分隔在约2nm的孔洞旁,当氨基酸线性穿过这种纳米孔的时候,每一个氨基酸都会完成一个回路,并反馈出相应的电信号,常见的20种氨基酸在通过纳米孔时都可以产生电信号。有的氨基酸需通过大约50种不同信号特征被鉴定,但绝大多数的氨基酸仅需要不到10个信号特征被鉴别。这种方法不仅能够高可信度的鉴定氨基酸,还能区分翻译后修饰的氨基酸(肌氨酸)及其前体(甘氨酸)、区分同分异构体的亮氨酸与异亮氨酸、区分对应对映异构体的氨基酸镜像分子L-天冬酰胺和D-天冬酰胺。此技术被应用于对两条由四个氨基酸组成的短肽(GGGG 和GGLL)进行测序,单分子短肽穿过纳米孔,孔道两边电极记录每个氨基酸通过时产生的电信号,通过测序算法,识别代表不同氨基酸的特征信号,从而得到短肽的序列。基于纳米孔单分子蛋白测序目前还属于初步发展阶段,除了需要根据电信号准确区分组成蛋白质的氨基酸以外,另一个关键是设计可一次拉动一个蛋白质或氨基酸穿过纳米孔的“马达”。为了让蛋白质或肽段顺利穿过纳米孔,研究者们在蛋白质一端添加了一串带有负电的氨基酸或者一段短DNA,用氨基酸或DNA链拉动蛋白质,可以使一些蛋白质打开折叠并顺利穿过纳米孔,但另一些复杂折叠的蛋白需要更多拉力,于是研究者在引导序列上添加了可以打开折叠的ClpX的识别位点[12]。这个系统能够将简单折叠的目标蛋白牵引过纳米孔,但对于折叠非常紧密的蛋白质仍要使用变性剂来打开折叠。基于纳米孔技术对单分子肽段或蛋白质测序目前还停留在对氨基酸鉴定和对短肽的区分阶段,还不能实际应用于对蛋白质的测序。虽然纳米孔测序具有高通量、对样品需求量少的优点,但是现有的纳米孔过大,失去了对氨基酸的区分能力,同时蛋白质分子通过孔道过快,加大了对信号读取难度;其次由于需要将蛋白的三级和二级结构破坏掉,纳米孔道需要能够耐受非常苛刻的化学和力学条件;第三,由于蛋白带电不均匀,控制其穿孔的速率也非常困难。所以目前的方法还不能准确的测得蛋白质的序列,基于纳米孔的单分子蛋白质测序技术还有很大的发展空间。基于荧光的单分子蛋白质测序方法基于荧光的单分子蛋白质测序同纳米孔测序一样,都可以对极少量蛋白质样品进行检测,其原理是先将蛋白质酶解成肽段,对肽段中特定氨基酸选择性标记不同的荧光基团[13],对不同氨基酸上的荧光进行观察,从而确定肽段部分氨基酸序列,再将这些序列与蛋白质组序列比对,即可确定肽段的来源蛋白(图2)。图 2 基于荧光的单分子蛋白测序流程[14]。Ginkel[15] 和Yao [16]都利用ClpXP蛋白酶辅助对肽段进行选择性荧光标记,可对序列中的赖氨酸和半胱氨酸进行标记,通过Förster共振能量转移依次读出被标记的肽段的氨基酸的信号。Swaminathan[14] 将蛋白质酶解成肽段,再将肽段固载到玻璃片上[17],使用特定荧光基团分别对肽段中的赖氨酸和半胱氨酸选择性标记,通过Edman降解技术对固载的肽段进行降解,每次降解后都使用全内反射荧光(TIPF)显微镜进行观测。如果被标记的赖氨酸和半胱氨酸在Edman降解中从肽段N端释放出来,被标记的以上两种氨基酸的位置就会被检测到。同时还发展了用于监测单个肽荧光强度的图像处理算法,并对误差源进行分类和建模,可以测得序列中部分氨基酸的信息。将测得的部分序列与参考蛋白质组序列比对,即可确定肽段的来源蛋白,通过与蛋白质组序列比对,可以鉴定到在人源蛋白质组中的绝大多数蛋白质。基于荧光单分子蛋白测序技术主要有三方面难点,一方面在于目前仅能对赖氨酸和半胱氨酸等几种氨基酸进行特异性荧光基团的标记,无法对所有氨基酸都进行标记;第二个难点是Edman降解是在强酸或强碱的环境中进行,对这些荧光基团的稳定性要求很高;第三个难点是对后期图像处理有较高的要求,如果序列中每个氨基酸都标记上不同的荧光基团,且发光峰易交叠难分辨,这给荧光处理算法带来了难度。因此,基于荧光的单分子蛋白测序技术虽然可以对极微量蛋白质样品分析,但目前仅能测得部分氨基酸序列,对蛋白质全序列的测定目前尚不能实现。[1] Kasianowicz J J, Brandin E, Branton D, et al. Characterization of individual polynucleotide molecules using a membrane channel [J]. Proceedings of the National Academy of Sciences, 1996, 93(24): 13770-13773.[2] Branton D, Deamer D W, Marziali A, et al. The potential and challenges of nanopore sequencing [J]. Nanoscience and technology: A collection of reviews from Nature Journals, 2010: 261-268.[3] Laver T, Harrison J, O’neill P, et al. Assessing the performance of the oxford nanopore technologies minion [J]. Biomolecular detection and quantification, 2015, 3: 1-8.[4] Karlsson E, Lärkeryd A, Sjödin A, et al. Scaffolding of a bacterial genome using MinION nanopore sequencing [J]. Sci Rep, 2015, 5(1): 1-8.[5] Huang S, Romero-Ruiz M, Castell O K,et al. High-throughput optical sensing of nucleic acids in a nanopore array [J]. Nature nanotechnology, 2015, 10(11): 986-991.[6] Nivala J, Marks D B, Akeson M. Unfoldase-mediated protein translocation through an α-hemolysin nanopore [J]. Nat Biotechnol, 2013, 31(3): 247-250.[7] Rosen C B, Rodriguez-Larrea D, Bayley H. Single-molecule site-specific detection of protein phosphorylation with a nanopore [J]. Nat Biotechnol, 2014, 32(2): 179.[8] Huang J, Mousavi M, Giovannini G, et al. Multiplexed Discrimination of Single Amino Acid Residues in Polypeptides in a Single SERS Hot Spot [J]. Angewandte Chemie 2020, 59(28): 11423-11431.[9] Cao J, Jia W, Zhang J, et al. Giant single molecule chemistry events observed from a tetrachloroaurate (III) embedded Mycobacterium smegmatis porin A nanopore [J]. Nature communications, 2019, 10(1): 1-11.[10] Ouldali H, Sarthak K, Ensslen T, et al. Electrical recognition of the twenty proteinogenic amino acids using an aerolysin nanopore [J]. Nat Biotechnol, 2020, 38(2): 176-181.[11] Zhao Y, Ashcroft B, Zhang P, et al. Single-molecule spectroscopy of amino acids and peptides by recognition tunnelling [J]. Nature nanotechnology, 2014, 9(6): 466-473.[12] Nivala J, Mulroney L, Luan Q, et al. Unfolding and Translocation of Proteins Through an Alpha-Hemolysin Nanopore by ClpXP [M]. Nanopore Technology. Springer. 2021: 145-155.[13] Hernandez E T, Swaminathan J, Marcotte E M, et al. Solution-phase and solid-phase sequential, selective modification of side chains in KDYWEC and KDYWE as models for usage in single-molecule protein sequencing [J]. New J Chem, 2017: 462-469.[14] Swaminathan J, Boulgakov A, Hernandez E, et al. Highly parallel single-molecule identification of proteins in zeptomole-scale mixtures [J]. Nat Biotechnol, 2018, 36(11): 1076-1082.[15] Ginkel J V, Filius M, Szczepaniak M, et al. Single-molecule peptide fingerprinting [J]. Proceedings of the National Academy of Sciences, 2018, 115(13): 3338-3343.[16] Yao Y, Docter M, Ginkel JV, et al. Single-molecule protein sequencing through fingerprinting: computational assessment [J]. Phys Biol, 2015, 12(5): 055033.[17] Howard C, Floyd B, Bardo A, et al. Solid-Phase Peptide Capture and Release for Bulk and Single-Molecule Proteomics [J]. ACS Chem Biol, 2020, 15(6): 1401-1407.作者简介:中国科学院大连化学物理研究所 单亦初副研究员1997年于中国科学技术大学获理学学士学位。2002年于中国科学院大连化物所获理学博士学位。2002年10月至2009年5月在德国马普协会马格德堡研究所、美国德克萨斯大学医学院及澳大利亚弗林德斯大学工作。2009年7月应聘到中国科学院大连化物所任副研究员。主持多项研究课题,包括国家重点研发计划子课题、国家自然科学基金面上项目等。已在Analytical Chemistry、Journal of Proteome Research、Journal of Chromatography A等杂志发表论文近80篇。主要研究方向包括蛋白质组鉴定和蛋白质组相对及绝对定量、蛋白质翻译后修饰富集和鉴定、蛋白质组末端肽富集和鉴定、蛋白质相互作用分析、蛋白质全序列从头测定及药物靶蛋白筛选。(本文经授权发布,仅供读者学习参考)专家约稿招募:若您有生命科学相关研究、技术、应用、经验等愿意以约稿形式共享,欢迎邮件投稿或沟通(邮箱:liuld@instrument.com.cn )。
  • 蛋白质测序技术发展漫谈(上)
    本期中国科学院大连化物所单亦初老师将分享蛋白质测序技术的发展,本次分享将以连载形式以飨读者。蛋白质一级结构是组成蛋白质的氨基酸序列。蛋白氨基酸序列分析是确定蛋白质全部氨基酸序列的过程。通过蛋白质测序获得的信息有许多用途,包括:蛋白质的鉴定;合成可用作免疫原的肽段;用于治疗的抗体仿制产品的研发;以市场上销售的抗体试剂为基础进行抗体药物研发。目前的蛋白质测序方法主要分为三类:基于PCR扩增的蛋白质测序、Edman降解测序以及基于质谱的蛋白质测序。基于PCR扩增的蛋白质测序是利用细胞中表达的DNA或者RNA进行基因测序,然后再按照氨基酸密码子表转换为蛋白质的氨基酸序列,本质上属于基因测序技术。Edman降解测序是较早发展的蛋白质测序技术,利用化学方法从蛋白质的N端将氨基酸依次降解,再使用高效液相色谱对氨基酸进行鉴定。但是这种方法只能用于鉴定蛋白质和多肽的N-末端氨基酸残基(通常是几个-十几个残基,最多不超过四十个残基),无法对大的蛋白质进行全序列测定。此外,Edman降解法也有一定的局限,例如N末端封闭或有化学修饰的情况下将不能使用Edman降解法对蛋白质序列进行分析。目前使用最广的蛋白质测序方法是质谱法,较Edman降解法而言,其优点在于,质谱法更敏感,可以更快地裂解肽,可以识别末端封闭或修饰的蛋白质。基于质谱的蛋白质测序策略可分为两大类:自上而下策略(Top-Down)和自下而上(Bottom-Up)策略。自上而下的策略无需对蛋白质进行降解,直接使用LC-MS对完整蛋白质进行分析,根据谱图中碎片离子确定其序列;自下而上策略是先将蛋白质水解成肽段,通过LC-MS对肽段检测,再对肽段从头测序以及序列拼接从而得到完整蛋白质序列。图 :蛋白质序列测定原理Kira Vyatkina[1]通过自上而下的策略发展了一种Twister测序算法对单克隆抗体测序,虽然不需要使用蛋白酶酶解,减少了蛋白质预处理的步骤,但仅可以鉴定到抗体的序列片段。Liu[2]结合自上而下和自下而上两种策略发展了TBNovo测序算法对蛋白质进行测序,将自上而下的质谱数据作为抗体序列的骨架,再将胰蛋白酶酶解肽段的质谱数据对骨架的序列进行补充覆盖。由于特异性蛋白酶酶解后肽段种类少、覆盖率低,对抗体的轻链和CAH2区的测序覆盖率为86.9%和75.2%。Sen[3]发展了一种基于同源数据库搜索与从头测序结合的Supernovo测序算法,通过4种蛋白酶对单克隆抗体分别酶解,该测序方法仅可实现对抗体重链的可变区测序,无法对抗体全序列进行测定。Savidor[4]发展了一种蛋白质全序列从头测序的方法。将蛋白质在微波辅助下快速酸解,得到了种类丰富的肽段,使用其发展的肽段序列拼接算法——“肽段标签组装”(Peptide Tag Assembler,PTA),对从头测序的肽段进行序列拼接,但由于酸解的消化方式会使谷氨酰胺和天冬酰胺发生脱酰胺化,分别变为谷氨酸和天冬氨酸,降低了对蛋白质序列测定的准确度。为了解决蛋白质测序覆盖度低、准确度低的问题,我们发展了一种蛋白质全序列测定新方法[5]:该方法使用多种非特异性蛋白酶对蛋白质连续酶解,提高蛋白质酶解肽段种类和重叠度,从而提高蛋白质测序的覆盖度;此外,发展了一种序列拼接算法,根据从头测序得到的肽段序列中每个氨基酸的得分值和出现次数,对蛋白质序列进行组装和拼接,显著提高了蛋白质全序列测定的准确度。利用该测序方法对牛血清白蛋白的多种非特异性蛋白酶酶解后的肽段序列进行测序和拼接,实现了对牛血清白蛋白全序列100%准确度的测定。此外,将该方法应用于对乳腺癌药物单克隆抗体赫赛汀的全序列测定,重链和轻链的测序准确度分别达到99.6%和100%。参考文献[1] K V. De Novo Sequencing of Top-Down Tandem Mass Spectra: A Next Step towards Retrieving a Complete Protein Sequence [J]. Proteomes, 2017, 5(1), https://doi.org/10.3390/proteomes5010006[2] LIU X, DEKKER L J M, WU S, et al. De novo protein sequencing by combining top-down and bottom-up tandem mass spectra [J]. J Proteome Res, 2014,13(7): 3241-3248.[3] KI S, WH T, S N, et al. Automated Antibody De Novo Sequencing and Its Utility in Biopharmaceutical Discovery [J]. J Am Soc Mass Spectrom, 2017, 28(5): 803-810.[4] SAVIDOR A, BARZILAY R, ELINGER D, et al. Database-independent Protein Sequencing (DiPS) Enables Full-length de Novo Protein and Antibody Sequence Determination [J]. Mol Cell Proteomics, 2017, 16(6): 1151-1161.[5]杨超,单亦初,张玮杰等,基于非特异性蛋白酶连续酶解的蛋白质全序列测定方法,化学学报,修稿中。作者简介:中国科学院大连化学物理研究所 单亦初副研究员1997年于中国科学技术大学获理学学士学位。2002年于中国科学院大连化物所获理学博士学位。2002年10月至2009年5月在德国马普协会马格德堡研究所、美国德克萨斯大学医学院及澳大利亚弗林德斯大学工作。2009年7月应聘到中国科学院大连化物所任副研究员。主持多项研究课题,包括国家重点研发计划子课题、国家自然科学基金面上项目等。已在Analytical Chemistry、Journal of Proteome Research、Journal of Chromatography A等杂志发表论文近80篇。主要研究方向包括蛋白质组鉴定和蛋白质组相对及绝对定量、蛋白质翻译后修饰富集和鉴定、蛋白质组末端肽富集和鉴定、蛋白质相互作用分析、蛋白质全序列从头测定及药物靶蛋白筛选。(本文经授权发布,仅供读者学习参考)专家约稿招募:若您有生命科学相关研究、技术、应用、经验等愿意以约稿形式共享,欢迎邮件投稿或沟通(邮箱:liuld@instrument.com.cn)。
  • N端封闭蛋白序列分析进行时——台式MALDI-8020
    胰蛋白酶消化,质谱法轻松鉴定蛋白质,已经是非常成熟的工作流程。即使是刚接触MS的使用者也可以很快掌握。在质谱法鉴定蛋白的工作流程中,蛋白质鉴定是通过使用搜索引擎,例如 Mascot或Matrix Science进行简单的数据库搜索来实现的。然而,对于数据库中未列出的蛋白质鉴定需求,或需要进行蛋白质末端序列分析的这两种情况,通常采用更昂贵的高端仪器和更复杂的工作流程,需要熟练的操作员。此外,蛋白质测序仪也通常用作蛋白质末端序列分析的方法,但遇到 N 端封闭的蛋白质,去封闭是必要的。作为样品序列分析前的预处理,预处理效果取决于蛋白质类型,可能效果不佳,对操作人员有一定要求,需要一定程度的技能和经验,这些可能会限制其使用。 近年来,利用MALDI-TOF离子源(ISD:In-Source Decay)中发生的蛋白质碎裂离子,可以分析N末端被封闭或未在数据库中登记的蛋白质序列MS图谱。此外,ISD理论上不受每个样品质量的限制,因此无需胰蛋白酶消化即可直接对高质量蛋白质进行测序。结合电泳胶提取蛋白和岛津台式机MALDI-8020,通过N端封闭蛋白的分子量测定和序列分析的例子,让我们来了解下大蛋白分子直接测序技术MALDI-ISD。 将模型样品N 端被乙酰化的牛碳酸酐酶 (Sigma-Aldrich)溶解在缓冲溶液中进行电泳, 95 °C 下加热 5 分钟,然后在聚丙烯酰胺凝胶(ATTO 12.5 %,预制 e-PAGEL)上进行电泳。所得聚丙烯酰胺凝胶用考马斯亮蓝染色以检测蛋白质斑点。使用含有表面活性剂的提取缓冲溶液,我们从凝胶分离的碳酸酐酶的条带中提取蛋白质。使用氯仿/甲醇在提取缓冲溶液中沉淀蛋白质以去除表面活性剂和盐,并使用 MALDI-TOF 质谱仪进行测量。芥子酸用作 MALDI 基质用于蛋白质分子量测量,1,5-二氨基萘 (DAN) 用于 ISD 的序列分析。 图1、碳酸酐酶电泳图图2、从凝胶中提取的碳酸酐酶MS图(基质芥子酸) 接下来,从25 pmol凝胶蛋白条带中提取碳酸酐酶,与基质DAN混合,MALDI-8020线性模式进一步分析。结果如图3所示,主要检测到c离子(从蛋白质N段产生的片段)质量一致的峰。通过使用免费软件Mass++ TM和蛋白质氨基酸序列比对工具Basic Local Alignment Search Tool (BLAST),我们对从检测到的峰中获得的氨基酸序列进行了同源性搜索。 图3、MALDI-ISD鉴定结果 鉴定结果显示匹配结果最高的是碳酸酐酶。通过检测到的c离子片段质量和数据库中已有的碳酸酐酶氨基酸序列,我们可以推断出N段序列是SHHWGYGKH...,并且是N-乙酰化的。 MALDI-8020线性模式MALDI-ISD技术,无需复杂的工作流程,无需胰蛋白酶消化即可直接对高质量蛋白质(如本文所述m/z 29030示例)进行N端测序。 该方法在岛津应用专家与美国佛罗里达州立大学、日本爱媛大学高级研究支持中心生物医学分析部、利物浦大学生化与系统生物学系等共同发表的一篇文献中也有应用到。PEPPI-MS基于聚丙烯酰胺凝胶的预分馏,实现质谱法鉴定完整蛋白或蛋白复合物。凝胶分离回收14种人血清蛋白,提取后,用MALDI-8020的MALDI-ISD产生的产物离子鉴定人血清白蛋白N端氨基酸序列。 MALDI-8020是岛津MALDI家族一款体积小巧,性能卓越的特色产品。荣获2018 IBO工业设计大奖银奖。 主要特点:● 线性台式MALDI-TOF● 200Hz固态激光器,355nm波长● 进样速度快● TrueClean™ 自动源清洁功能。配备大口径离子光学系统,使仪器长期使用中源的污染风险降到最低。配备基于紫外激光器的源清洁功能,可自动快速实现源自清洁。● 静音(参考文献:岛津应用新闻 No.B83J. Proteome Res. 2020, 19, 3779−3791
  • 蛋白质测序技术发展漫谈(中)
    前文回顾(点击):蛋白质测序技术发展漫谈(上)前面提到,基于质谱的蛋白质测序主要流程为:首先对蛋白质酶解得到肽段,经过LC-MS/MS分析得到相应的质谱数据,再使用测序软件根据质谱数据对肽段测序,最后对测序得到的肽段序列进行拼接。其中根据肽段的二级质谱图进行从头测序是其核心内容。目前已发展的肽段从头测序算法有三十余种,主要可以分为三类:图方法、穷举法和动态规划法,包括PEAKS[ 1]、pNovo系列[2]、Pepnovo[3]、Novor[4]等。 Muth[5]评估了Novor、PEAKS和PepNovo三种测序软件在实验数据集上测序的准确度,这三款软件对肽段的测序准确度最高只有35%。这是由于质谱谱图中存在着噪声和干扰离子,无法有效的区分谱图中可用于肽段测序的碎片离子[6],使得精准解析谱图的难度增加且耗费大量的时间。基于碎片离子的蛋白质组稳定同位素标记定量方法通过在细胞培养或样品处理的过程中引入不同种类的同位素标记,混合后进行LC-MS分析。不同稳定同位素标记的相同序列肽段质量相同或相近,可在质谱中同时碎裂,形成成对的碎片离子[7]。借鉴该方法,可更好的区分并提取用于测序的碎片离子,用于肽段的序列测定。Nie[8]在细胞培养时加入同位素标记的精氨酸和赖氨酸,再利用Lys-N和Arg-C对提取的蛋白质酶解,形成N端为精氨酸、C端为赖氨酸的等重肽段,在二级谱中可形成成对的b离子和成对的y离子,但这种标记方法只能在细胞水平标记,且通过两种蛋白酶酶解后只有少部分肽段质量相等并被鉴定到。Zhang[9]发展了部分等重肽段末端标记方法,使用Lys-C酶解后,肽段的C端为含有氨基的赖氨酸,再通过对两末端使用不同同位素标记,使得相同序列的肽段质量差为2 Da,在二级谱中产生了质量差为4 Da的成对b离子和质量差为6 Da的成对y离子,为使肽段能够碎裂在同一张谱图中,质谱的分离窗口需要被放大到4 m/z甚至更多[10],但放大分离窗口会导致更多的质量相近的肽段发生共碎裂,谱图会变得更加复杂难以解析,增加了从头测序的难度。为此,我们开发了一种基于二甲基化标记和胰蛋白酶催化18O标记的肽段末端准等重标记(Pseudo Isobaric Peptide Termini Labelling,PIPTL)从头测序方法 [11](图1)。经该方法进行同位素标记后,序列相同的肽段质量仅相差0.0166 Da,这些准等重肽段无需扩大质谱分离窗口即可在质谱中同时碎裂,产生成对的b离子和成对的y离子;基于发展的PIPTL-Novo测序算法,根据不同系列碎片离子质量差可快速准确提取并区分b/y离子,再对b/y离子进行测序分析,从而实现对肽段的准确测序。以牛血清白蛋白为研究对象,对肽段从头测序的准确度进行评价,测序准确率为95.5%;最后将此从头测序方法应用于对单克隆抗体赫赛汀重链和轻链的序列测定,对赫赛汀的酶解肽段从头测序准确率为93.6%。图1 基于二甲基化和胰蛋白酶催化18O标记的PIPTL-Novo策略参考文献[1] Ma B, Zhang K, Hendrie C, et al. PEAKS: powerful software for peptide de novo sequencing by tandem mass spectrometry. Rapid Commun Mass Spectrom, 2003, 17(20): 2337-42.[2] Yang H, Chi H, Zhou W-J, et al. Open-pNovo: de novo peptide sequencing with thousands of protein modifications. J Proteome Res, 2017, 16(2): 645-54.[3] Frank A M, Savitski M M, Nielsen M L, et al. De novo peptide sequencing and identification with precision mass spectrometry. J Proteome Res, 2007, 6(1): 114-23.[4] Ma B. Novor: real-time peptide de novo sequencing software. J AmSoc Mass Spectrom, 2015, 26(11): 1885-94.[5] Muth T, Renard B Y. Evaluating de novo sequencing in proteomics: already an accurate alternative to database-driven peptide identification? . Brief Bioinform, 2018, 19(5): 954-70.[6] Lu B, Chen T. A suboptimal algorithm for de novo peptide sequencing via tandem mass spectrometry. Journal of Computational Biology, 2003, 10(1): 1-12.[7] Merrill A E, Coon J J. Quantifying proteomes and their post-translational modifications by stable isotope label-based mass spectrometry. Curr Opin Chem Biol, 2013, 17(5): 779-86.[8] Nie A-Y, Zhang L, Yan G-Q, et al. In vivo termini amino acid labeling for quantitative proteomics. Anal Chem, 2011, 83(15): 6026-33.[9] Zhang S, Shan Y, Zhang S, et al. NIPTL-Novo: Non-isobaric peptide termini labeling assisted peptide de novo sequencing. J Proteomics, 2017, 154(40-8.[10] Hennrich M L, Mohammed S, Altelaar A M, et al. Dimethyl isotope labeling assisted de novo peptide sequencing. J Am Soc Mass Spectrom, 2010, 21(12): 1957-65.[11] 杨超,刘健慧,张玮杰等,基于末端准等重同位素标记的肽段从头测序方法. 分析化学, 2021, 49 (03), 366-376.作者简介:中国科学院大连化学物理研究所 单亦初副研究员1997年于中国科学技术大学获理学学士学位。2002年于中国科学院大连化物所获理学博士学位。2002年10月至2009年5月在德国马普协会马格德堡研究所、美国德克萨斯大学医学院及澳大利亚弗林德斯大学工作。2009年7月应聘到中国科学院大连化物所任副研究员。主持多项研究课题,包括国家重点研发计划子课题、国家自然科学基金面上项目等。已在Analytical Chemistry、Journal of Proteome Research、Journal of Chromatography A等杂志发表论文近80篇。主要研究方向包括蛋白质组鉴定和蛋白质组相对及绝对定量、蛋白质翻译后修饰富集和鉴定、蛋白质组末端肽富集和鉴定、蛋白质相互作用分析、蛋白质全序列从头测定及药物靶蛋白筛选。(本文经授权发布,仅供读者学习参考)专家约稿招募:若您有生命科学相关研究、技术、应用、经验等愿意以约稿形式共享,欢迎邮件投稿或沟通(邮箱:liuld@instrument.com.cn)。中国临床质谱产业化发展论坛(点击报名)仪器信息网联合浙江省先进质谱技术与分子检测重点实验室、宁波大学质谱技术与应用研究院,共同举办“第六届中国质谱产业化发展论坛——临床质谱产业化发展”,在2021年第十五届中国科学仪器发展年会(ACCSI 2021)召开同期,邀请临床质谱业内专家、国内质谱企业、第三方医学实验室、医院专家代表,共同就中国临床质谱技术与产业化发展等话题展开探讨、答疑解惑,为中国临床质谱产业链上中下游三方搭建互动交流平台,助力中国临床质谱产业发展,进一步优化和拓展临床质谱产业市场,共同促进中国质谱产业健康快速发展。
  • 蛋白质测序技术发展漫谈(下)
    前文回顾(点击查看):蛋白质测序技术发展漫谈(上篇);蛋白质测序技术发展漫谈(中篇)前面讨论了基于质谱的蛋白质测序技术的一般流程及基于质谱的肽段序列测定方法。在组成蛋白质的20种氨基酸中,亮氨酸和异亮氨酸互为同分异构体,具有相同的分子质量,无法通过二级质谱产生的同系列离子的质量差异被区分。然而亮氨酸/异亮氨酸对单克隆抗体药物的功能影响巨大,典型的单克隆抗体在互补决定区(CDR)中含有至少3个亮氨酸/异亮氨酸,在复杂的样品中可以存在多达9个。单克隆抗体中CDR的错误识别,会导致抗原结合亲和力与抗体的特异性大量丧失。因此,对单克隆抗体中的全部亮氨酸或异亮氨酸进行准确测定意义重大[1-2]。亮氨酸和异亮氨酸的侧链分别是异丁基和仲丁基,通过质谱的多级碎裂产生的特征离子可以对亮氨酸和异亮氨酸进行区分。一种方法是通过不同系列的碎片离子质量差来区分,其原理是肽段在ETD-HCD或EThcD碎裂模式下可产生z离子,含有异亮氨酸和亮氨酸肽段分别失去一个乙基自由基(C2H5)和一个丙基自由基(C3H7),产生质量分别减少29 Da和43 Da的w离子,因此通过质谱产生的z/w离子质量差,可区分肽段中的亮氨酸和异亮氨酸[2-5]。Zhokhov[3]对人血清白蛋白(HSA)、gp188蛋白两种蛋白质的43条胰蛋白酶酶解肽段中的93个亮氨酸和异亮氨酸进行鉴定,准确区分了其中的83个,但由于z/w离子分别产生在ETD和HCD谱图中,在鉴定过程中需要人工筛选含有z/w离子的谱图。Tatiana[4]等通过EThcD的碎裂模式对蛙皮肤分泌的14条肽段进行鉴定,使肽段的z/w离子出现在同一张谱图中,区分鉴定了这些肽段中的61/75个亮氨酸和异亮氨酸。由于不能保证每个含有亮氨酸或异亮氨酸的肽段在质谱中碎裂一定会产生相应的z/w离子,因此通过z/w离子质量差的方法无法对蛋白序列中全部的亮氨酸和异亮氨酸准确测定。另一种方法是通过亮氨酸和异亮氨酸的亚胺离子的三级碎片离子区分,其原理是亮氨酸或异亮氨酸质子化的离子(132 Da)容易损失甲酸而形成相应的亚胺离子(86 Da),它们的亚胺离子在三级碎裂中分别会产生m/z 69和m/z 43的特征离子。Nakamura[6]使用嗜热菌蛋白酶对人钙降素进行酶解,得到以亮氨酸或异亮氨酸为N端的肽段,通过该方法确定钙降素的第4和9个氨基酸为亮氨酸,第27个氨基酸为异亮氨酸,但此方法的缺点是当一条肽段中含有不止一个亮氨酸或异亮氨酸时,特征离子峰相会互干扰,无法对其判断。Bagal[5]将亚胺离子的三级碎片离子的方法和z/w离子质量差的方法结合,并将该策略用于两个单克隆抗体CDR中的亮氨酸和异亮氨酸的鉴定,由于使用胰蛋白酶酶解产生的肽段长度过长,对鉴定造成影响,仅对6条肽段中的亮氨酸和异亮氨酸的准确鉴定,无法区分CRD区全部亮氨酸和异亮氨酸。Sheila[7]使用4种蛋白酶对单克隆抗体进行酶解,对二级质谱产生的a1离子进行三级碎裂,排除了肽段内部亮氨酸或异亮氨酸的干扰,根据每个三级谱图中特征峰强度的比值对亮氨酸和异亮氨酸区分,由于谱图中噪音干扰以及肽段的共碎裂,会使一些含有特征离子的谱图不能用于准确区分亮氨酸和异亮氨酸,最终对单克隆抗体中的71.1%-94.1%亮氨酸和异亮氨酸进行区分。我们借鉴该方法,结合非特异酶连续酶解技术,以及基于碎片离子质量校正和多谱图共同打分策略,实现了对单克隆抗体药物赫赛汀轻链中7个异亮氨酸和18个亮氨酸,重链中9个异亮氨酸和33个亮氨酸的鉴定,准确度100%,轻链鉴定的覆盖度为100%,重链鉴定的覆盖度为97.67%。鉴定蛋白质中亮氨酸和异亮氨酸的流程图[1] Hurtado P P, O' Connor P B. Differentiation of isomeric amino acid residues in proteins and peptides using mass spectrometry [J]. Mass Spectrom Rev, 2012, 31(6): 609-25.[2] Xiao Y, Vecchi M M, Wen D. Distinguishing between Leucine and Isoleucine by Integrated LC-MS Analysis Using an Orbitrap Fusion Mass Spectrometer [J]. Anal Chem, 2016, 88(21): 10757-66.[3] Zhokhov S S, Kovalyov S V, Samgina T Y, et al. An EThcD-Based Method for Discrimination of Leucine and IsoleucineResidues in Tryptic Peptides [J]. J Am Soc Mass Spectrom, 2017, 28(8): 1600-11.[4] Samgina T Y, Kovalev S V, Tolpina M D, et al. EThcD Discrimination of Isomeric Leucine/Isoleucine Residues in Sequencing of the Intact Skin Frog Peptides with Intramolecular Disulfide Bond [J]. J Am Soc Mass Spectrom, 2018, 29(5): 842-52.[5] Bagal D, Kast E, Cao P. Rapid Distinction of Leucine and Isoleucine in Monoclonal Antibodies Using Nanoflow LCMS(n) [J]. Anal Chem, 2017, 89(1): 720-7.[6] Nakamura T, Nagaki H, Ohki Y, et al. Differentiation of leucine and isoleucine residues in peptides by consecutive reaction mass spectrometry [J]. 1990, 62(3): 311-3.[7] Maibom-Thomsen S, Heissel S, Mortz E, et al. Discrimination of Isoleucine and Leucine by Dimethylation-Assisted MS3 [J]. Anal Chem, 2018, 90(15): 9055-9.作者简介:中国科学院大连化学物理研究所 单亦初副研究员1997年于中国科学技术大学获理学学士学位。2002年于中国科学院大连化物所获理学博士学位。2002年10月至2009年5月在德国马普协会马格德堡研究所、美国德克萨斯大学医学院及澳大利亚弗林德斯大学工作。2009年7月应聘到中国科学院大连化物所任副研究员。主持多项研究课题,包括国家重点研发计划子课题、国家自然科学基金面上项目等。已在Analytical Chemistry、Journal of Proteome Research、Journal of Chromatography A等杂志发表论文近80篇。主要研究方向包括蛋白质组鉴定和蛋白质组相对及绝对定量、蛋白质翻译后修饰富集和鉴定、蛋白质组末端肽富集和鉴定、蛋白质相互作用分析、蛋白质全序列从头测定及药物靶蛋白筛选。(本文经授权发布,仅供读者学习参考)专家约稿招募:若您有生命科学相关研究、技术、应用、经验等愿意以约稿形式共享,欢迎邮件投稿或沟通(邮箱:liuld@instrument.com.cn)。
  • 蛋白质组测序也迈入千元时代?
    导读:自今年1月份Illumina让&ldquo 1000美元基因组&rdquo 成为现实,许多生物技术公司及科研机构纷纷购买其测序仪,而今美研究者指出DNA编码的蛋白质是几乎所有生命过程的主要执行者,可实现千元基因组测序的工具,也可以最终帮助人们完成千元蛋白质组测序。 人类生命的蓝图是三十亿碱基对组成的人类基因组。1000美元基因组测序,让人都觉得有些疯狂,然而有研究者认为千元测序蛋白质组也将成为现实。 今年初,全美最大最佳的五所&ldquo 大学城&rdquo 之一拥有近130年历史的Arizona State University(亚利桑纳州立大学)生物 设计学院( Biodesign Institute)的Stuart Lindsay及其团队同事,在纳米孔DNA测序技术的基础上,让单链肽段穿过纳米孔,纳米孔两边的电极可记录每个氨基酸通过时产生的电信号。他们使用一种机器学习算法,让电脑能够识别代表不同氨基酸的特征信号。这些信号可以作为可靠的指纹,帮助人们鉴别氨基酸的种类,以及氨基酸发生的微妙改变。因此开发了能够精确鉴定氨基酸的蛋白单分子测序技术。 这项研究于四月六日发表在Nature Nanotechnology杂志的网站上。 从基因组到蛋白组 蛋白对于细胞的生长、分化和修复至关重要,它们能够催化化学反应,抵御疾病,具有各种各样的重要功能。自今年1月份Illumina让&ldquo 1000美元基因组&rdquo 成为现实,研究者们将眼光转向了蛋白质组测序的研究。 与线虫等简单生物相比,人类的基因数相对较少,不过科学家们鉴定的人类蛋白已经超过了十万,而且不少人认为这些蛋白只是冰山一角。有限的基因数为何能形成如此大量的蛋白呢?这是因为蛋白能通过多种机制发生改变,选择性剪切和翻译后修饰就是其中两个关键的过程。 在这项研究中,研究人员将一对金属电极分隔在约两纳米的孔洞旁边,当线性穿过这种纳米孔的时候,每一个氨基酸都会完成一个电回路,并发出相应的电信号。而这样的电信号可以帮助人们判断,通过纳米孔的是哪一个氨基酸。 这一技术称为recognition tunneling,原本是Lindsay等人开发的DNA单分子测序技术。&ldquo 大约两年前,我们的一次实验室会议提出,可以尝试将这一技术用于氨基酸测序,&rdquo Lindsay说。与DNA的A、G、C、T相比,用 recognition tunneling鉴定组成蛋白的二十种氨基酸实际上是一个更大的挑战。 蛋白质单分子测序技术具有巨大的应用价值,可以帮助人们检测被选择性剪切或翻译后修饰改变的微量蛋白。而这些蛋白往往是疾病研究所追寻的目标,用其他技术很难检测得到。 PCR能够将样品中微量的DNA快速扩增,但在蛋白研究领域还没有这样的技术,Lindsay强调。在这种情况下,能进行单分子水平上进行检测的recognition tunneling,&ldquo 将给蛋白质组学研究带来一场彻底的变革&rdquo 。 这项研究为人们展示了一个,快速测序单个蛋白分子的低成本方法。据Lindsay介绍,该技术通过大约50种不同的信号特征来鉴定氨基酸,不过绝大多数鉴别只需要不到10个信号特征。 值得注意的是,recognition tunneling不仅能够高度可信的鉴定氨基酸,区分翻译后修饰的蛋白(肌氨酸)及其前体(甘氨酸),还能够鉴别被称为对映体的镜像分子,以及质量相同但序列不同的分子。 千元蛋白组? Lindsay的研究指出,可实现千元基因组测序的工具,也可以最终帮助人们完成千元蛋白质组测序。事实上,Lindsay认为这一里程碑离我们并不遥远。 目前,这一技术还需要使用复杂的实验室仪器&mdash &mdash 扫描隧道显微镜STM。不过Lindsay和他的同事正在开发一个可以快速鉴定氨基酸和其他分析物的新设备,以便将低成本的蛋白质组测序真正推广到临床。 该技术不仅可以用来在临床上测序蛋白质和检测新生物指标,还有望给医疗领域带来彻底的改变,在单分子水平上精确监控患者对治疗的应答情况。
  • Science重磅:纳米孔直接测序蛋白质,精度高达100%,还可识别氨基酸修饰
    蛋白质是构成生物体的主要成分,同时也是生命活动的主要承担者。具有生物学功能的蛋白质往往具有特定的空间结构,而蛋白质结构在多个层级上被定义,其中一级结构,即氨基酸的种类和排列,最为重要,它可以决定蛋白质的高级结构。但一直以来,想要直接读取蛋白质的一级结构是十分困难的,在大多数情况下,科学家们会根据基因序列和氨基酸密码子表来“破译”蛋白质的氨基酸序列。然而,由于转录后修饰和翻译后修饰的存在,破译结果并非完全正确,甚至与真实的氨基酸序列有很大差异。2021年11月4日,荷兰代尔夫特理工大学的研究人员在 Science 期刊上发表了题为:Multiple rereads of single proteins at single–amino acid resolution using nanopores(利用纳米孔在单氨基酸分辨率下对单蛋白质进行多次重读)的研究论文。该研究利用纳米孔测序技术成功扫描并读取单个蛋白质的氨基酸序列:线性化的DNA-肽复合物缓慢通过一个微小的纳米孔,根据电流的变化和强度,研究人员就能读取相关的蛋白质信息内容,直接对蛋白质的氨基酸序列进行测序。蛋白质是生命活动的主要承担者。事实上,所有生物的蛋白质都是由大约20种不同的氨基酸组成的长肽链,就像项链上有不同种类的珠子一样。遗憾的是,目前的蛋白质测序方法价格昂贵,而且不能检测许多稀有蛋白质。近年来发展起来的纳米孔测序技术,已经能够直接扫描和排序单个DNA分子。如今,这篇发表在Science 上的研究表明,我们完全可以以类似于DNA纳米孔测序的方式直接读取蛋白质的氨基酸序列。本研究的通讯作者 Cees Dekker 教授表示:在过去的30年里,基于纳米孔的DNA测序已经从一个想法发展成为一个实际的工作设备,并成功开发了商业化的便携式纳米孔测序仪,服务于价值数十亿美元的基因组测序市场。在我们的论文中,我们将纳米孔的概念扩展到单个蛋白质的读取。这可能会对基础蛋白质研究和医学诊断产生重大影响。牛津纳米孔开发的纳米孔基因测序仪直接读取氨基酸序列对于如何利用纳米孔读取肽链中的单个氨基酸的特征,这篇论文的第一作者 Henry Brinkerhoff 博士打了一个形象的比喻:“想象一下,一个肽链中的氨基酸链就像一条项链,上面有不同大小的珠子。然后,你打开水龙头,慢慢地把项链送入下水道,也就是纳米孔。如果在某个时间点是一颗大珠子,它会堵塞下水道,那里面的水也就成了涓涓细流。相反,如果是一颗小珠子,那么下水道剩余的空隙就会比较大,水流也更大。”用纳米孔肽阅读器直接读取氨基酸序列因此,通过这项技术,研究人员可以非常精确地测量纳米孔的电流大小,并以此推测相应的氨基酸种类。更关键的是,这个过程并不会影响肽链的完整性,因此我们能够一次又一次地读取单个肽链,然后对所有数据进行拟合,从而以基本上100%的准确率获得肽链的序列组成。解旋酶(红色)拖动连接了多肽(紫色)的 DNA 分子(黄色),使其缓慢通过纳米孔(绿色),从而通过读取电信号(橙色高亮)表征多肽的氨基酸序列。条形码般的识别精度为了进一步验证这项技术的准确性,研究人员改变了肽链的某个氨基酸,然后能够检测到显著差异的电信号,表明该技术是极其灵敏的。事实上,这项新技术在识别单个蛋白质和绘制它们之间的细微变化方面非常强大,打个形象的比方——就像超市的收银员通过扫描条形码来识别每个产品一样。这也可能为未来的蛋白质从头测序提供新的途径。纳米孔肽阅读器可以区分单氨基酸替代的单肽Henry Brinkerhoff 博士表示:这项方法可能为未来蛋白质测序奠定基础,但就目前来说,蛋白的从头测序仍然是一个巨大的挑战。我们仍然需要大量描述来自不同序列的电信号,以便创建一个对应电信号和蛋白质序列的“密码表”。但即便如此,该研究已经能够成功分辨蛋白质序列中的单个氨基酸的改变,这无疑是一项重大进步,也将产生许多直接应用。看见生物学的“暗物质”https://www.science.org/doi/10.1126/science.abl4381
  • 多肽药物质控丨当混合多肽遇见蛋白质测序仪
    在多肽类药物的生产质控中,氨基酸序列的测定是必不可少的检测项目。对于常规组成单一的合成多肽药物来说,氨基酸序列的分析较为简单,可通过Edman降解法或质谱法进行测定,其中Edman降解法被认为更加直接可靠。但对于组成复杂的混合多肽药物来说,比如,醋酸格拉替雷(Glatiramer acetate,简写为GA),由于多肽组成形式复杂多变,可能具有超过一万亿个不同序列的独特多肽,如果对每种多肽成分的氨基酸序列进行精确测定,似乎既不可能,其实也无必要,我们需要考虑新的方法对混合多肽进行整体表征。 n 快速了解醋酸格拉替雷醋酸格拉替雷是一种人工合成的多肽类制剂,由Glu(谷氨酸)、Ala(丙氨酸)、Tyr(酪氨酸)和Lys(赖氨酸)四种氨基酸随机聚合而成,原研药由以色列药厂TEVA研发制造(商品名Copaxone),于1996年获美国FDA核准用于治疗多发性硬化症(MS),其2020年全球销售额达到13.37亿美元,2021年7月,TEVA的“醋酸格拉替雷注射液”在中国的上市申请获得受理。多发性硬化症是一种常见的以中枢神经系统炎性脱髓鞘为主要特征的自身免疫性疾病,临床表现包括视物模糊,感觉、运动异常,智能、情感等高级功能障碍,在中青年人群中多发,且有较高致残率。醋酸格拉替雷被认为是通过改变造成MS发病机制的免疫过程而起作用的,其疗效与耐受性在临床上获得了十足的肯定。 醋酸格拉替雷是一种由Tyr、Lys、Glu、Ala随机聚合而成的多肽混合物(CAS号:147245-92-9) 醋酸格拉替雷的第一个仿制药Glatopa (由Sandoz 公司和 Momenta公司共同开发)于2015年上市,由于原研药的专利到期,未来将有更多的仿制药上市。 n 醋酸格拉替雷的合成与质量评估在醋酸格拉替雷的生产过程中,通过聚合及解聚反应,可以将其分子量控制在一个较窄的范围(平均分子量4700~11000 Da)。生产工艺的改变以及所用试剂的变化都有可能使药物的组分比例发生变化。利用Edman降解法,通过监测N端每一个循环的4种氨基酸的组成比例以及变化趋势,可以对药品质量进行评估。 岛津解决方案 l 蛋白质测序仪对醋酸格拉替雷进行质量评价的原理Edman降解法是进行N端氨基酸序列分析的经典方法,岛津以其为原理设计的全自动蛋白质测序仪(以下简称PPSQ),由液相系统和可执行自动化Edman降解反应的主机组成,将氨基酸从多肽链的N端依次切割下来,通过色谱的保留时间判定氨基酸种类,结果直接可靠。PPSQ除了对N端氨基酸序列进行定性分析外,利用液相色谱稳定的定量能力,还可以对多肽特定循环氨基酸的摩尔生成量及组成比例进行定量分析。 岛津在售蛋白质测序仪PPSQ-51/53A Edman降解反应图解 l 样品前处理取适量稀释后的样品加入经聚凝胺处理的玻璃纤维膜上,干燥后安装到PPSQ反应器上进行分析。实验仅作示例,共测试了3个批次的原研药Copaxone以及4个批次的某在研仿制药,每个批次测试N端前6个循环。 反应器构造图 l 实验结果 1)N端氨基酸组成定性分析醋酸格拉替雷原研药每个循环均检测到Glu、Ala、Tyr、Lys等4种氨基酸,这与药品由Glu、Ala、Tyr、Lys等4种氨基酸随机聚合而来,结果一致。 醋酸格拉替雷原研药Copaxone与某在研仿制药N端氨基酸分析色谱图示例(1-6循环)(黑色:原研药Copaxone;红色:某在研仿制药;DTT、DMPTU、DPTU为试剂峰) 2)各循环中每种氨基酸的相对摩尔含量的分析根据仪器自动生成的氨基酸生成量,计算每种氨基酸的摩尔含量,例如,Glu的相对摩尔含量为: 根据氨基酸的相对摩尔含量,绘制各循环中各氨基酸生成量的趋势图,如下。 醋酸格拉替雷Copaxone 与某在研仿制药N端前6个循环相对氨基酸水平分析(纵坐标:相对摩尔含量;横坐标:循环数) 3)原研药与某在研仿制药的比较从趋势图来看,仿制药各循环氨基酸生成量趋势,与原研药整体相似,但GA仿制药-批次1的Glu的相对含量略低,GA仿制药-批次4的各循环Tyr的相对含量略高,批次1中Glu的偏低与批次4中Tyr的偏高是否正常,需要对原研药进行多批次实验,以判断是否超出正常范围。GA仿制药-批次2及GA仿制药-批次3的Tyr生成量趋势与其他样品有明显不同,提示仿制药生产工艺可能存在与原研不同的地方。 结 语通过醋酸格拉替雷N端各氨基酸生成量的趋势变化的分析比较,可为仿制药的开发及生产质控提供参考,醋酸格拉替雷N端相对氨基酸水平分析亦可作为醋酸格拉替雷仿制药与原研药一致性评价的依据。这也为我们今后分析类似混合蛋白或多肽药物提供了参考思路。 参考文献:J. Andersona, C. Bell, et al., Demonstration of equivalence of a generic glatiramer acetate (Glatopa™ ), Journal of the Neurological Sciences 359 (2015) 24–34 撰稿人:顿俊玲 *本文内容非商业广告,仅供专业人士参考。
  • DeepMind重磅推出AlphaFold:人工智能预测基因序列蛋白形状结构
    p   Alphabet(谷歌)旗下公司 DeepMind 的人工智能 AlphaGo 曾在国际象棋、围棋等项目中取得了超越人类的表现,其研究不仅震惊世界,也两次登上 Nature。如今,该公司已将人工智能技术应用到最具挑战性的科学研究问题中,其刚刚推出的 AlphaFold 可以仅根据基因“代码”预测生成蛋白质的 3D 形状。 /p p   DeepMind 表示,AlphaFold 是“该公司首个证明人工智能研究可以驱动和加速科学新发现的重要里程碑”。看来,人类医学研究要前进一步了。 /p p    img src=" https://img1.17img.cn/17img/images/201812/uepic/fc4cf612-a444-4567-b697-76cdcdfc9dea.jpg" title=" 1.jpg" alt=" 1.jpg" style=" text-align: center " / /p p style=" text-align: center "    span style=" color: rgb(127, 127, 127) " 2017 年 5 月,谷歌 DeepMind 人工智能项目 AlphaGo(执棋者:黄士杰博士)对战当时世界第一的围棋选手柯洁。 /span /p p style=" text-indent: 2em " 周日,在墨西哥坎昆举办的一场国际会议中,DeepMind 的最新 AI——AlphaFold 在一项极其困难的任务中击败了所有对手,成功地根据基因序列预测出蛋白质的 3D 形状。 /p p   “蛋白质折叠”是一种令人难以置信的分子折叠形式,科学界以外很少有人讨论,但却是一个非常重要的问题。生物由蛋白质构成,生物体功能由蛋白质形状决定。理解蛋白质的折叠方式可以帮助研究人员走进科学和医学研究的新纪元。 /p p   “对于我们来说,这真的是一个关键时刻,”DeepMind 联合创始人兼 CEO Demis Hassabis表示,“这个项目就像灯塔,这是我们关于人和资源的首次重大投资,用于解决一个根本性的、现实世界的重要问题。” /p p   在 2016 年 AlphaGo 击败李世乭后,DeepMind 就开始将目光转向蛋白质折叠。尽管实践证明,游戏是 DeepMind AI 项目的优秀试验场,但在游戏中取得高分并非他们的终极目标。“我们的目标从来就不是赢得围棋或雅达利比赛的胜利,而是开发能够解决蛋白质折叠这类问题的算法,”Hassabis 表示。 /p p    strong 为什么要预测蛋白质结构 /strong /p p   人体能够产生数万甚至数百万的蛋白质。每个蛋白质都是一个氨基酸链,而后者的类型就有 20 种。蛋白质可以在氨基酸之间扭曲、折叠,因此一种含有数百个氨基酸的蛋白质有可能呈现出数量惊人(10 的 300 次方)的结构类型。 /p p   蛋白质的 3D 形状取决于其中包含的氨基酸数量和类型,而这一形状也决定了其在人体中的功能。例如,心脏细胞蛋白质的折叠方式可以使血流中的任何肾上腺素都粘在它们上面,以加速心率。免疫系统中的抗体是折叠成特定形状的蛋白质,以锁定入侵者。几乎身体的每一种功能——从收缩肌肉和感受光线到将食物转化为能量——都和蛋白质的形状及运动相关。 /p p   通常情况下,蛋白质会呈现出能量效率最高的任何形状,但它们可能会纠缠在一起或者折叠错误,导致糖尿病、帕金森和阿茨海默症等疾病。如果科学家可以根据蛋白质的化学构成来预测其形状,他们就能知道它是做什么的,会如何出错并造成伤害,并设计新的蛋白质来对抗疾病或履行其它职责,比如分解环境中的塑料污染。 /p p    strong AI 如何改变研究方法? /strong /p p   正因为蛋白质的结构如此重要,在过去的五十年中,科学家已经能使用低温电子显微镜和核磁共振等实验技术确定蛋白质的形状,但是每一种方法都依赖大量的试验与误差反馈,每种结构可能需要花费数万美元、历时数年进行研究。因此生物学家转攻 AI 方法,以完成这一困难且单调的过程。 /p p   幸运的是,由于基因测序成本快速降低,基因组领域的数据非常丰富。因此在过去几年中,依赖于基因组数据的预测问题正越来越多地借助深度学习方法。DeepMind 非常关注这一问题,并提出了 AlphaFold,这一项工作目前已经提交到了Critical Assessment of Structure Prediction (CASP)。 /p p   DeepMind 用 AlphaFold 参加了 CASP,这是一年两次的蛋白质折叠奥运会,吸引了来自世界各地的研究小组。比赛的目的是根据氨基酸列表来预测蛋白质的结构,这些氨基酸列表会在几个月内每隔几天发送给参赛团队。这些蛋白质的结构最近已经通过费力又费钱的传统方法破解,但还没有公开。提交最准确预测的团队将获胜。 /p p   尽管是首次参加比赛,AlphaFold 就在 98 名参赛者中名列榜首,准确地从 43 种蛋白质中预测出了 25 种蛋白质的结构。而同组比赛中获得第二名的参赛者仅准确预测出了 3 种。值得一提的是,AlphaFold 关注从头开始建模目标形状,且并不使用先前已经解析的蛋白质作为模板。AlphaFold 在预测蛋白质结构的物理性质上达到了高度的准确性,然后基于这些预测可以使用两种不同的方法预测构建完整的蛋白质结构。 /p p    strong 使用神经网络预测物理属性 /strong /p p   AlphaFold 构建的模型都依赖深度神经网络,这些经过训练的神经网络可以从基因序列中预测蛋白质的属性。DeepMind 的研究人员表示,神经网络预测的蛋白质属性主要有:(a)氨基酸对之间的距离 (b)连接这些氨基酸的化学键及它们之间的角度。这些方法的首要进步就是对常用技术的提升,它们可以估计氨基酸对是否彼此接近。 /p p style=" text-align: center" img src=" https://img1.17img.cn/17img/images/201812/noimg/d256b4f4-6189-437b-8ead-d45a99ae81de.gif" title=" 2.gif" alt=" 2.gif" width=" 375" height=" 375" style=" width: 375px height: 375px " / /p p style=" text-indent: 2em " 为了构建 AlphaFold,DeepMind 在数千已知的蛋白质上训练了一个神经网络,直到它可以仅凭氨基酸预测蛋白质的 3D 结构。给定一种新的蛋白质,AlphaFold 利用神经网络来预测氨基酸对之间的距离,以及连接它们的化学键之间的角度。接着,AlphaFold 调整初步结构以找到能效最高的排列。该项目花了两周时间来预测其第一个蛋白质结构,但现在几小时内就可以完成了。 /p p   根据神经网络预测的两种物理属性,DeepMind 还训练了一个神经网络以预测蛋白质成对残基(residues)之间距离的独立分布,这些概率能组合成估计蛋白质结构准确率的评分。此外,DeepMind 还训练了另一个独立的神经网络,该网络使用集群中的所有距离来估计预测的结构与实际结构之间的差距。 /p p style=" text-align: center" img src=" https://img1.17img.cn/17img/images/201812/uepic/b1b25d1b-42ba-454c-ae29-93402575df61.jpg" title=" 3.jpg" alt=" 3.jpg" / /p p style=" text-align: center "    img src=" https://img1.17img.cn/17img/images/201812/noimg/3bbdee91-2067-417d-8e22-92b8a5543cc6.gif" title=" 4.gif" alt=" 4.gif" style=" text-align: center width: 533px height: 178px " width=" 533" height=" 178" / /p p    strong 预测蛋白质结构的新方法 /strong /p p   这些评分函数可以用来探索蛋白质内部,以找到与预测匹配的结构。DeepMind 的第一种方法建立在结构生物学的常用技术上,用新的蛋白质片段反复替换蛋白质整体结构的某个部分。他们训练了一个生成神经网络来创造新的片段,这些片段被用来不断提高蛋白质结构的评分。 /p p style=" text-align: center" img src=" https://img1.17img.cn/17img/images/201812/uepic/e657a13d-1262-4040-8074-dda8e8ac5791.jpg" title=" 5.jpg" alt=" 5.jpg" width=" 492" height=" 315" style=" width: 492px height: 315px " / /p p   先通过神经网络预测氨基酸之间的距离和化学键角度,然后再根据两种物理属性对结构进行评分,最后通过梯度下降优化评分。 /p p   第二种方法是通过梯度下降来优化评分,得到的结构高度精确。梯度优化被用在整个蛋白质链,而不是组装前必须单独折叠的片段,这种做法降低了预测过程的复杂性。 /p p    strong 未来可期 /strong /p p   首次涉足蛋白质折叠领域的成功表明,机器学习系统可以整合各种信息来源,帮助科学家快速找到各种复杂问题的创造性解决方案。人工智能已经通过 AlphaGo 和 AlphaZero 等系统掌握了复杂的游戏,与此类似,利用人工智能攻克基本科学问题的未来同样可期。 /p p   雷丁大学的研究人员 Liam McGuffin 在比赛中带领得分最高的英国学术团体。他表示,“DeepMind 今年似乎取得了更大的进展,我想进一步了解他们的方法。我们的资源并不充足,但我们仍然有很强的竞争力。” /p p   “预测蛋白质折叠形状非常重要,对解决很多世纪难题有重大影响。这种能力可以影响健康、生态、环境,基本上可以解决任何涉及生命系统的问题。” /p p   “包括我们在内的很多团队几年来一直都在使用基于机器学习的方法,而深度学习和人工智能的进步似乎也产生了越来越重要的影响。我对这个领域很乐观,我觉得我们会在 21 世纪 20 年代真正解决这个问题。”McGuffin 表示。 /p p   Hassabis 也表示还有很多工作要做。“我们还没有解决蛋白质折叠问题,目前只是迈出了第一步。这是一个极具有挑战性的问题,但我们有一个良好的体系,还有很多想法尚未付诸实践。” /p p   蛋白质折叠的早期进展令人兴奋,它证明了人工智能对科学发现的效用。尽管在能够对疾病治疗、环境管理等方面产生量化影响之前,我们还有很多工作要做,但我们知道人工智能的潜力是巨大的。在一个专注于研究机器学习如何推进科学发展的专业团队的努力下,我们期待看到技术能够有所作为。 /p
  • Nat. Methods | PROBER技术用于检测活细胞中与可编程特异性DNA序列相关的蛋白
    大家好,本周分享一篇发表在Nature Methods上的文章PROBER identifies proteins associated with programmable sequence-specific DNA in living cells,本文的通讯作者是来自斯坦福大学的Paul A. Khavari教授,他们组主要致力于干细胞分化与癌症的基因组调控方面的研究。在本文中,作者团队开发了一种通过游离基因招募的近端生物素化技术(PROBER),用于在活细胞中研究与特殊DNA序列相互作用的蛋白。时空和细胞类型特异性基因表达模式由称为顺式调控元件(CREs)的DNA序列控制,它可以通过招募一些蛋白因子来激活或抑制转录复合物的形成。目前已经确定了数千个富含转录因子结合基序的CRE,但其中仅有少数进行了生化表征,因此开发新的工具来定义这些相互作用蛋白是非常必要的。目前,用于识别与感兴趣DNA序列相关蛋白的方法,如CAPTURE、Chap等大多需要交联,这可能会导致偏差的引入。因此,在本文中,作者开发了一种通过近端生物素化定量检测活细胞中短DNA序列(≤80bp)相关蛋白复合物的方法——PROBER。在设计上,PROBER主要需要三种质粒。其中pBait包含目的DNA序列作为“诱饵”,克隆在酿酒酵母GAL4 结合上游激活序列 (UAS) 16的三个串联重复之间;pSprayer质粒表达融合Cal4的枯草芽孢杆菌BASU生物素连接酶(HA tag);pDriver表达SV40大T抗原用于通过它们的 SV40 复制起点对所有质粒进行高拷贝游离扩增。在生物素存在时,结合在UAS序列上的生物素连接酶可以生物素化结合在目标DNA序列上的蛋白复合物,裂解细胞后采用链霉亲和素捕获生物素化的蛋白质,并使用WB或质谱进行检测。为验证方法的可行性,作者检测了YY1(Yin Yang1),发现与乱序的对照组相比,实验组可以有效地富集到YY1,并且同时富集到了与YY1相互作用的 INO80 复合物中的NFRKB 和 RUVBL1 亚基。接下来,作者也将PROBER与DNA pull down法进行了对比,GO 分析表明,通过 DNA pull down鉴定到的大多数蛋白与 RNA 结合有关,而 PROBER 鉴定到的蛋白质与转录控制有关。最后,作者将PROBER技术应用于了hTERT启动子突变体相互作用蛋白的鉴定。hTERT被发现在多种癌症中会产生单个位点突变(C250T、C228A 和 A161C),作者克隆了这些突变并使用PROBER进行富集,发现了一些由于癌症相关突变而增加的启动子调节因子。总的来说,本文开发了一种近端生物素化方法PROBER,用于活细胞中与短DNA序列相关蛋白的检测。
  • 转录组测序结合蛋白质组分析探索蝾螈再生奥秘
    来自德国及美国等处的研究人员针对基因组特别大,难以进行全基因组测序的动物,提出了以转录组测序与蛋白质组分析联合以解析功能基因的策略,并以蝾螈进行实验,开辟了组织及器官再生研究的新思路。该研究成果已发表近期的《Genome Biology》杂志上。 蝾螈是一种在侏罗纪中期演化的有尾两栖动物,目前存活的约有400种。红色斑点蝾螈虽然小,但其组织工程学技艺却令人惊叹。蝾螈在失去了组织,包括心肌、中枢神经系统元件甚至眼睛的晶状体后仍能再生。一般来讲,动物的再生组织的能力是所有多细胞动物所共有的古老程序,因此,医生们一直希望蝾螈的这种能力依赖于基础遗传学程序,而该程序潜伏在包括哺乳动物在内的所有动物中,这样他们就可以在再生医学中利用蝾螈的再生机制。 然而蝾螈的基因组十分庞大,比人类基因组大十倍,要从头获得蝾螈的全基因组序列不容易。因此研究者们将目光转向基因表达所产生的RNA,他们利用454新一代测序技术对蝾螈的转录组进行了研究。经过从头组装N. viridescens的转录组,获得了超过120,000个RNA转录本,约有15,000个转录本编码蛋白质,其中有826个转录本是蝾螈所特有的。这些转录本中包含了不同器官所有再生阶段的转录本,这些转录本中的一部分与其它生物相似。通过对蝾螈胚胎和幼体的心脏、四肢、眼睛、尾、肝脏、脾脏等组织中再生过程表达的蛋白的分离以及质谱分析方法,对这些蛋白进行分类及与转录本的比对。 通过454新一代测序结果与质谱技术的结合,发现了500多个其它生物中从未被发现的肽段,接下来会进一步探索这些蛋白是否与再生能力相关。这项研究不仅为目前科学家们提供了两栖类动物的基因数据,更为基因组测序困难的动物研究,提出了一种新思路。 参考文献: Genome Biol. 2013 Feb 20 14(2):R16. A de novo assembly of the newt transcriptome combined with proteomic validation identifies new protein families expressed during tissue regeneration.Looso M, Preussner J, Sousounis K, Bruckskotten M, Michel CS, Lignelli E, Reinhardt R, Hoeffner S, Krueger M, Tsonis PA, Borchardt T, Braun T.
  • 蛋白质结构解析六十年
    几种不同折叠模式的蛋白质模型(图片来源Protein Data Bank Japan )   上个世纪初,科学家们认为蛋白质是生命体的遗传物质,而具有独特的作用。随着这个理论被证伪,真正的遗传物质DNA的结构被给予了很大关注。然而,蛋白质作为生命体的重要大分子,其重要性也从未被忽视,而且在1950年代开始,科学家一直在探寻DNA序列和蛋白质序列的相关性。与此同时,蛋白质测序和结构解析蛋白质结构的努力开始慢慢获得回报。更多的生化研究揭示了蛋白质的功能重要性,因此蛋白质的三维结构的解析对于深入理解蛋白质功能和生理现象起着决定性作用。   本文简要回顾了蛋白质结构解析的重大历史事件,并总结了蛋白质结构解析的常用方法和结构分析方向。通过了解蛋白质结构,能够让我们更好地理解生物体的蛋白的理化特性,以及其相关联的化学反应途径及其机制,对于我们认识生物世界和研发治疗方法和药物都起着关键作用。在即将召开的2015高分辨率成像与生物医学应用研讨会上,各位专家学者将会进一步讨论相关议题。   蛋白质结构解析六十年来大事件   在1958年,英国科学家John Kendrew和Max Perutz首先发表了用X射线衍射得到的高分辨率的肌红蛋白Myoglobin的三维结构,然后是更加复杂的血红蛋白Hemoglobin。因此,这两个科学家分享了1962年的诺贝尔化学奖。事实上,这项工作在早在1937年就开始了。   然后在1960年代,蛋白质结构解析方法不断进步,获得了更高的解析精度。这个时期,蛋白质序列和DNA序列间关系也被发现,中心法则被Francis Crick提出,然后科学界见证了分子生物学的崛起。分子生物学(Molecular Biology)的名称在1962年开始被广泛接受和使用,并逐渐演变出一些支派,如结构生物学。然后在1964年,Aaron Klug提出了一种基于X射线衍射原理发展而来的全新的方法电子晶体学显微镜(crystallographic electron microscopy ),可以解析更大蛋白质或者蛋白质核酸复合体结构。因为这项研究,他获得了1982诺贝尔化学奖。1969年,Benno P. Schoenborn 提出可以用中子散射和原子核散射来确定大分子中固定位置的氢原子坐标。   进入1970年代,很多新的方法开始发展。存储蛋白质三维结构的Protein Data Bank(1971年) 开始出现,这对于规范化和积累蛋白质数据有着重要意义。1975年新的一种仪器叫做多丝区域检测器,让X-ray的检测和数据收集更加快速高效。次年,Robert Langride将X-ray衍射数据可视化,并在加州大学圣地亚哥分校成立了一个计算机图形实验室。同年,KeithHodgson和同事首次证明了可以使用同步加速器获得的X射线并对单个晶体进行照射,并取得了很好的实验效果。然后在1978年,核磁共振NMR首次被用于蛋白质结构的解析 同年首个高精度病毒(西红柿丛矮病毒)衣壳蛋白结构被解析。   在1980年代,更多蛋白质结构被解析,蛋白质三维结构的描述越来越成熟,而且蛋白质结构解析也被公认成为药物研发的关键步骤。在1983年,冷冻蚀刻的烟草花叶病毒结构在电子显微镜结构下得到描述。两年后德国科学家John Deisenhofer等解析出了细菌光合反应中心,因此他们共享了1988年的诺贝尔化学奖。次年,两个课题组解析了HIV与复制相关的蛋白酶结构,对针对HIV的药物研发提供了理论基础。   下一个十年,因为大量同步加速器辅助的X射线衍射的使用,数千个蛋白质结构得到解析,迎来了蛋白质结构组的曙光。1990年多波长反常散射方法(MAD)方法用于X射线衍射晶体成像,与同步辐射加速器一起,成为了近二十多年来的最常用的的方法。Rod MacKinnon在199年发表了第一个高精度的钾离子通道蛋白结构,对加深神经科学的理解起了重要作用,因此他分享了2003年的诺贝尔化学奖。Ada Yonath等领导的课题组在1999年首次解析了核糖体结构(一种巨大的RNA蛋白质复合体)。  进入新千年,更多的技术细节被加入到蛋白质解析研究领域。2001年,Roger Kornberg和同事们描述了第一个高精度的RNA聚合酶三维结构,正因此五年后他们共享了诺贝尔化学奖。2007年,首个G蛋白偶联受体结构的解析更是对药物研究带了新的希望。近些年来,越来越多的大的蛋白质结构得到解析。Cryo-EM超低温电子显微镜成像用于超大蛋白质结构成像的研究日益成熟,并开始广泛用于蛋白质结构的解析。   蛋白质结构解析的常用实验方法   1.X-ray衍射晶体学成像   X射线衍射晶体学是最早用于结构解析的实验方法之一。X射线是一种高能短波长的电磁波(本质上属于光子束),被德国科学家伦琴发现,故又被称为伦琴射线。理论和实验都证明了,当X射线打击在分子晶体颗粒上的时候,X射线会发生衍射效应,通过探测器收集这些衍射信号,可以了解晶体中电子密度的分布,再据此析获得粒子的位置信息。利用这种特点,布拉格父子研制出了X射线分光计并测定了一些盐晶体的结构和金刚石结构。首个DNA结构的解析便是利用X射线衍射晶体学获得的。   后来,获得X射线来源的技术得到了改进,如今更多地使用同步辐射的X射线源。来自同步辐射的X射线源可以调节射线的波长和很高的亮度,结合多波长反常散射技术,可以获得更高精度的晶体结构数据,也成为了当今主流的X射线晶体成像学方法。由X射线衍射晶体学解析的结构在RCSB Protein Data Bank中占到了88%。   X射线衍射成像虽然得到了长足的发展,仍然有着一定的缺点。X射线对晶体样本有着很大的损伤,因此常用低温液氮环境来保护生物大分子晶体,但是这种情况下的晶体周围环境非常恶劣,可能会对晶体产生不良影响。而且,X射线衍射方法不能用来解析较大的蛋白质。   上海同步辐射加速器外景(图片来源 上海同步辐射光源网站)   2.NMR核磁共振成像   核磁共振成像NMR全称Nuclear magnetic resonance,最早在1938被Isidor Rabi (1946年诺贝尔奖)描述,在上世纪的后半叶得到了长足发展。其基本理论是,带有孤对电子的原子核(自选量子数为1)在外界磁场影响下,会导致原子核的能级发生塞曼分裂,吸收并释放电磁辐射,即产生共振频谱。这种共振电磁辐射的频率与所处磁场强度成一定比例。利用这种特性,通过分析特定原子释放的电磁辐射结合外加磁场分别,可以用于生物大分子的成像或者其他领域的成像。有些时候,NMR也可以结合其他的实验方法,比如液相色谱或者质谱等。   RCSB Protein Data Bank数据库中存在大约11000个用NMR解析的生物大分子结构,占到总数大约10%的结构。NMR结构解析多是在溶液状态下的蛋白质结构,一般认为比起晶体结构能够描述生物大分子在细胞内真实结构。而且,NMR结构解析能够获得氢原子的结构位置。然而,NMR也并非万能,有时候也会因为蛋白质在溶液中结构不稳定能难得获取稳定的信号,因此,往往借助计算机建模或者其他方法完善结构解析流程。   使用NMR解析的血红蛋白结构建模(图片来源RCSB PDB)   3.Cryo-EM超低温电子显微镜成像   电子显微镜最早出现在1931年,从设计之初就是为了试图获得高分辨率的病毒图像。通过电子束打击样本获得电子的反射而获取样本的图像。而图像的分辨率与电子束的速度和入射角度相关。通过加速的电子束照射特殊处理过的样品表明,电子束反射,并被探测器接收,并成像从而获得图像信息。具体做法是,将样品迅速至于超低温(液氮环境)下并固定在很薄的乙烷(或者水中),并置于样品池,在电子显微镜下成像。图像获得后,通过分析图像中数量众多的同一种蛋白质在不同角度的形状,进行多次的计算机建模从而可以获得近原子级别的精度(最低可以到2.0埃)。   Cyro-EM解析TRPV1离子通道蛋白(图片来源Structure of the TRPV1 ion channel )   将电子显微镜和计算机建模成像结合在一起的大量实践还是在新世纪之后开始流行的。随着捕捉电子的探测器技术(CCD技术,以及后来的高精度电子捕捉、电子计数electron counting设备)的提升,更多的信息和更低的噪音保证了高分辨率的图像。   近些年来,Cryo-EM被用来解析很多结构非常大(无法用X-ray解析)的蛋白质(或者蛋白质复合体),取得了非常好的结果。同时,单电子捕捉技术取代之前的光电转换成像的CCD摄像设备,减少了图像中的噪音和信号衰减,同时并增强了信号。计算机成像技术的成熟和进步,也赋予了Cryo-EM更多的进步空间。然而,Cyro-EM与X-ray不同,该方法不需要蛋白质成为晶体,相同的是都需要低温环境来减少粒子束对样品的损害。   除去介绍的这三种方法以外,计算机建模技术也越来越多地被用在了蛋白质结构解析中。而且新解析的结构也会提高计算机建模的精确度。未来,我们或许能够用计算机构建原子级别的细胞模型,构建在芯片上的细胞。   蛋白质结构对了解生命体的生化反应、有针对性的药物研发有着重要意义。从1958到如今已经接近60年,蛋白质结构解析得到了较快的发展。然而,在如今DNA测序如此高效廉价的时代,蛋白质和DNA结构解析并没有进入真正高速发展阶段,这也导致了在如此多的DNA序列数据非常的今天,结构数据却相对少的可怜。大数据时代的基因组、蛋白质组、代谢组、脂类组等飞速发展的时候,蛋白质结构组也得到了更加广泛的重视。发展高精度、高效的结构解析技术也一直都有着重要意义。未来,蛋白质结构解析,对针对蛋白质的药物筛选,和计算机辅助的药物研究研究不应被低估。未来说不定在蛋白质结构领域有着更多惊喜,让我们拭目以待。 第一届电镜网络会议部分视频回放
  • 中国科大建立新的蛋白质从头设计方法
    近期,中国科学技术大学教授刘海燕、副教授陈泉团队采用数据驱动策略,提出一条全新的蛋白质从头设计路线,相关成果2月9日以“用于蛋白质设计的以主链为中心的神经网络能量函数”为题发表于《自然》(Nature)杂志。  蛋白质是生命功能的主要执行者,其结构与功能由氨基酸序列所决定。目前,能够形成稳定三维结构的蛋白质几乎全部是天然蛋白质,其氨基酸序列是长期自然进化形成。在天然蛋白结构功能不能满足工业或医疗应用需求时,想要得到特定的功能蛋白,就需对其结构和序列进行设计。目前,国际上报道的蛋白质从头设计工作主要使用天然结构片段作为构建模块来拼接产生人工结构。然而这种方法存在设计结果单一、对主链结构细节过于敏感等不足,限制了设计主链结构的多样性和可变性。蛋白质从头设计中最困难的问题是如何充分地探索蛋白质主链结构空间,发现新颖的、“高可设计性”主链结构,目前还缺乏相关的系统性解决方法。   中国科大相关团队长期深耕计算结构生物学方向的基础研究和应用基础研究。刘海燕、陈泉团队十余年来致力于发展数据驱动的蛋白质设计方法,经过长期不懈努力,建立并实验验证了给定主链结构设计氨基酸序列的ABACUS模型,进而发展了能在氨基酸序列待定时从头设计全新主链结构的SCUBA模型。SCUBA采用一种新的统计学习策略,基于核密度估计(或近邻计数,NC)和神经网络拟合(NN)方法,从原始结构数据中得到神经网络形式的解析能量函数,能够高保真地反应实际蛋白质结构中不同结构变量间的高维相关关系,在不确定序列的前提下,连续、广泛地搜索主链结构空间,自动产生“高可设计性”主链。  理论计算和实验证明,用SCUBA设计主链结构,能够突破只能用天然片段来拼接产生新主链结构的限制,显著扩展从头设计蛋白的结构多样性,进而设计出不同于已知天然蛋白的新颖结构。“SCUBA模型+ABACUS模型”构成了能够从头设计具有全新结构和序列的人工蛋白完整工具链,是RosettaDesign之外目前唯一经充分实验验证的蛋白质从头设计方法,并与之互为补充。在该研究中,团队展示了9种从头设计的蛋白质分子的高分辨晶体结构,它们的实际结构与设计模型一致,其中5种蛋白质具有天然蛋白质中尚未观察到的新型拓扑结构。   Nature审稿人认为,“与现有方法不同,现有方法要么使用参数方程来描述预定义螺旋结构的空间,要么基于片段组装的方法依赖于已知蛋白质片段。SCUBA方法原则上允许人们探索任意主链结构,然后填充序列,允许人们设计比自然界中观察到的更广泛的蛋白质几何结构”,“蛋白质从头设计仍然具有挑战性,本工作中六种不同蛋白质的高分辨率设计是一项重要成就,表明此方法工作良好”,“本研究中报道的成功设计数量之多令人印象深刻,并提供了强有力的证据,证明了基础技术是鲁棒的。所采用的基于神经网络的能量项是新颖的,因为它们刻画了更传统的统计方法无法企及的多维特征,该方法具有足够的新颖性和实用性”。   该研究为工业酶、生物材料、生物医药蛋白等功能蛋白的设计奠定了基础。研究工作得到科技部、国家自然科学基金委和中科院的资助支持。   论文链接
  • 抗断裂且可拉伸,仿生蛋白质创造二维分层复合材料
    科技日报北京7月25日电 据最新一期《美国国家科学院院刊》报道,美国宾夕法尼亚州立大学研究人员利用鱿鱼环齿上的仿生蛋白质创造了一种复合的层状二维材料,这种材料具有抗断裂和很强的弹性。大自然创造出像骨头、贝壳这样的分层材料,正是这种多级结构才确保了骨头具有极高的抗断裂强度,得以支撑庞大的身体。骨头中含有无数空隙,然而,随着生长发育,它对缺陷的敏感度会降低。这意味着即使骨头已经含有诸多“缺陷”,也依然具有较高的强度。宾夕法尼亚州立大学高级纤维技术中心主任、劳埃德和多罗夕福尔哈克仿生材料主席梅利克德米雷尔和多萝西福尔哈克表示:“研究人员很少报告骨头和贝壳的这种界面特性,因为它很难通过实验进行测量。”以此为灵感,新开发的复合二维材料是由像石墨烯或MXene(通常是过渡金属碳化物、氮化物或碳氮化物)这样的原子层厚的硬材料组成的,这些材料之间被一层东西黏合并隔开。虽然大块石墨烯或MXene具有块体性能,但二维复合材料的强度来自界面性质。德米雷尔介绍说,他们使用的是一种界面材料,可通过重复序列加以修改,从而能够微调性质,让它变得灵活而强大。此外,这种材料还具有独特的热传导性质。“这种材料很适合做跑鞋的鞋垫。”德米雷尔说,“它可以给脚部降温,反复弯曲也不会把鞋垫弄坏。”这些二维复合材料还可用于柔性电路板、可穿戴设备和其他需要强度和灵活性的设备。根据德米雷尔的说法,传统的连续介质理论无法解释为什么这些材料既坚固又灵活,但模拟表明,界面很重要。当组成界面的材料比例较高时,当材料受到压力时,界面会发生局部断裂,但作为整体的材料不会断裂。【总编辑圈点】搜索“鱿鱼环齿”,会发现科研人员早已对它摩拳擦掌,开展过多项研究,并尝试在不同领域应用。鱿鱼环齿蛋白质可被加工制成纤维和薄膜,可以替代塑料制品,提升织物的耐磨性,制作可穿戴设备… … 当然,要大规模应用这种仿生材料,需要先制造出仿生蛋白质,毕竟也不能一只只抓住鱿鱼扒拉蛋白质。本文中,科研人员用仿生蛋白质制造出复合层状材料,可以让它又坚固又灵活。从大自然的神奇生物身上,人类获得了很多“外挂”,改造后为自己服务。
  • 蛋白质组:解码生命“天书”
    人类和老鼠的外貌可说是天渊之别,但实际上他们却有着近99%相同的基因组。何以&ldquo 失之毫厘差之千里&rdquo ?正是蛋白质放大了他们基因上的细微差别。 日前,中国人类蛋白质组计划全面启动。&ldquo 基因组学中微小的差异,在蛋白质组学中可以被千倍甚至几近万倍地放大。&rdquo 亚太蛋白质组组织主席、中国科学院院士贺福 初表示,这一计划的实施将对基因组序列图进行&ldquo 解码&rdquo ,进而全景式揭示生命奥秘,为提高重大疾病防诊治水平提供有效手段。 解码生命的&ldquo 密钥&rdquo 提起蛋白质,大家并不陌生。它是生物体内一种极为重要的高分子有机物,约占人体干重的54%。 不过,&ldquo 蛋白质组&rdquo 一词却鲜有人了解。其实,蝴蝶由卵变虫、成蛹、再破茧成蝶,幕后&ldquo 操盘者&rdquo 并非基因组,而是蛋白质组。&ldquo 1994年澳大利亚科学家率先提出蛋白质组这个概念,指某个时刻、某个组织、器官或个体中所有蛋白质的集合。&rdquo 贺福初说。 科学家们之所以对蛋白质组产生浓厚兴趣,还要从人类基因组计划说起。2003年4月,耗资27亿美元、经由6国科学家历时13年奋战的人类基因组计划,以人类基因组序列图的绘制完成为标志,画上了句号。 没想到,更大的挑战还在后头&mdash &mdash &ldquo 科学界曾经认为,只要绘制出了人类基因组序列图,就能了解疾病的根源,但是错了&rdquo 。国际蛋白质组组织启动计划主席萨姆· 哈纳什说,事实上,我们此时只了解10%的基因的功能,剩下的90%仍是未知的。 &ldquo 人类基因组计划并不像事前所预期的那样,能够逾越蛋白质这一生物功能的执行体层次,揭示人类生、老、病、死的全部秘密。基因组序列只是提供了一维遗传信息,而更复杂的多维信息发生在蛋白质组层面。&rdquo 贺福初表示。 就 人体而言,各个器官的基因组是一样的,而它们之所以形态、功能各异,正是其结构与功能的物质基础&mdash &mdash 不同的蛋白质组在&ldquo 操盘&rdquo 。&ldquo 就像蛹化蝶,无论形态如 何变化,基因组是不变的。&rdquo 军事医学科学院放射与辐射医学研究所研究员钱小红说,人的每一种生命形态,都是特定蛋白质组在不同时间、空间出现并发挥功能的 结果。比如,某些蛋白质表达量偏离常态,就能够表征人体可能处于某种疾病状态。 &ldquo 无论是正常的生理过程还是病理过程,最直接的体现是蛋白质以及它们的集合体&mdash &mdash 蛋白质组。&rdquo 上述专家们表示。&ldquo 生,源于基因组;命,却一定由蛋白质组决定。只有蛋白质组才能根本阐释生命。&rdquo 贺福初说。 独辟蹊径的&ldquo 中国画卷&rdquo 事实上,早在上世纪90年代人类基因组计划成形之际,已有科学家提出解读人类蛋白质组的想法。其目标是,将人体所有蛋白质归类,并描绘出它们的特性、在细胞中所处的位置以及蛋白质之间的相互作用等。 《科学》杂志在2001年,也将蛋白质组学列为六大科学研究热点之一,其&ldquo 热度&rdquo 仅次于干细胞研究,名列第二。 不过,严峻的现实挑战,让这一想法迟迟停留在&ldquo 纸上谈兵&rdquo 阶段。&ldquo 生物蛋白质数的差别大概是基因数差别的三个数量级左右,人类基因总数大概2万多个,人体内的蛋白质及其变异、修饰体却是百万级的数量。&rdquo 贺福初表示。 不仅如此,人类基因组图谱只有一张,而蛋白质组图谱每个器官、每个器官的每一种细胞都有一张,且在生理过程和疾病状态时还会发生相应改变。工程的艰巨性可想而知。 但困难并未阻挡住科学家们对其探索的脚步。1995年,首先倡导&ldquo 蛋白质组&rdquo 的两家澳大利亚实验室分别挂牌成立蛋白质组研究中心。随后欧美日韩等国均有行动。 1998年初,从事基因组研究的贺福初敏锐地嗅到这朵夜幕后悄然盛开的&ldquo 莲花&rdquo ,逐渐将精力投入到这个新兴领域。 2001年,&ldquo 基因组会战&rdquo 尚未鸣金,《自然》、《科学》杂志即发出&ldquo 蛋白质组盟约&rdquo 。同年秋,&ldquo 人类蛋白质组计划&rdquo 开始孕育。 2002 年4月,贺福初在华盛顿会议上阐述&ldquo 人类肝脏蛋白质组计划&rdquo 。同年11月,&ldquo 人类血浆蛋白质组计划&rdquo &ldquo 人类肝脏蛋白质组计划&rdquo 正式启动,贺福初担任&ldquo 人类 肝脏蛋白质组计划&rdquo 主席。其后两年间,德国牵头的&ldquo 人类脑蛋白组计划&rdquo 、瑞士牵头的&ldquo 大规模抗体计划&rdquo 、英国牵头的&ldquo 蛋白质组标准计划&rdquo 及加拿大牵头的 &ldquo 模式动物蛋白质组计划&rdquo 相继启动。 然而,很少有人知道,这种以生物系统为单元的研究策略酝酿之初饱受诟病。贺福初回忆,在华盛顿,中国人提出蛋白质组计划必须按生物系统(如器官、组织、细胞)进行一种战略分工和任务分割,一石激起千层浪,争议四起。 &ldquo 要想通过分工合作来完成全景式分析人类蛋白质组的宏大目标,必须以人体的生物系统作为研究单元和分工的规则。这个策略,10年来合者渐众,不过目前仍存争议,中国的先见之明可能得在下个10年成为不可阻挡的潮流。&rdquo 贺福初坦陈。 定位疾病的&ldquo GPS&rdquo 历经10余年的努力,以贺福初为代表的中国蛋白质组研究团队,在该领域向世界交了一份漂亮答卷: 成功构建迄今国际上质量最高、规模最大的人类第一个器官(肝脏)蛋白质组的表达谱、修饰谱、连锁图及其综合数据库; 首次实现人类组织与器官转录组和蛋白质组的全面对接; 在 炎症诱发肿瘤等方面,发现一批针对肝脏疾病、恶性肿瘤等重大疾病的潜在药靶、蛋白质药物和生物标志物。如,2008年,张学敏课题组首次发现炎症和免疫的 新型调控分子CUEDC2,可作为肿瘤耐药的新标志物,从而为克服癌细胞耐药提供了原创性的药物新靶点和治疗新思路。2010年,周钢桥课题组&ldquo 逮到&rdquo 肝 癌的易感基因,为肝癌的风险预测和早期预警提供了重要理论依据和生物标记。2012年,张令强课题组研制出世界上首个能特异性靶向成骨细胞的核酸递送系 统,提供了一种基于促进骨形成的全新骨质疏松症治疗途径,向解决骨丢失无法补回这一医学难题迈出了坚实的一步。2014年,张令强课题组首次在国际上揭示 泛素连接酶Smurf1是促进结直肠癌发生发展,并且导致病人预后差的一个重要因子&hellip &hellip 上述几项成果均发表于国际顶级的《科学》、《自然》系列杂志。 还没来得及分享这一喜悦,激烈的角逐又让他们绷紧了神经。日前,英国《自然》杂志公布美国、印度和德国等合作完成的人类蛋白质组草图。研究人员表示,这一成果有助于了解各个组织中存在何种蛋白质,这些蛋白质与哪些基因表达有关等,从而进一步揭开人体的奥秘。 &ldquo 尽 管还有许多不完善的地方,但确实是蛋白质组学领域乃至整个生命科学领域,具有里程碑意义的科学贡献。&rdquo 中国科学院院士饶子和直陈。中国科学院院士张玉奎指 出,虽然中国在蛋白质组的一些领域走在了世界前列,但国外有些团队正快马加鞭,我们不得不警醒,否则很快将被甩出第一阵营。 6 月10日,中国人类蛋白质组计划全面启动实施。&ldquo 蛋白质组,可以揭示疾病的发病机制和病理过程,发现新型诊断标志物、治疗和创新药物,可以全面提高疾病防 诊治水平。这个项目完成后,将揭示人体器官蛋白质组的构成,一旦哪一部位出现异常即可实现&lsquo GPS定位&rsquo ,进而找到针对性的诊断措施、干预措施和预防措 施。&rdquo 记者了解到,中国人类蛋白质组计划第一阶段,将全面揭示肝癌、肺癌、白血病、肾病等十大疾病所涉及的主要组织器官的蛋白质组,了解疾病发生的主要异常,进而研制诊断试剂以及筛选药物。这将在2017年左右完成。 &ldquo 这是真正的原始创新,也是中国能够引领世界科技发展的重要领域之一。&rdquo 贺福初强调说。
  • 蛋白质组学的前世今生与未来: 蛋白质存在形式 -- 记中南大学湘雅医院詹显全教授
    p style=" text-align: justify line-height: 1.75em "   詹显全,中南大学教授、博士研究生导师、博士后合作导师,英国皇家医学会会士(FRSM)、美国科学促进会(AAAS)会员、欧洲预测预防个体化医学协会(EPMA)的会士和国家代表、美国肿瘤学会(ASCO会士、欧洲科技合作组织(e-COST)的海外评审专家,中国抗癌药物国家地方联合工程实验室技术委员会委员、技术带头人和副主任,临床蛋白质组学与结构生物学学科学术带头人和学科负责人,国家临床重点专科建设项目重点实验室建设项目学科带头人,湖南省百人计划专家、湖南省高层次卫生人才“225”工程医学学的学科带头人、中南大学“531”人才工程专家。目前正致力于从多参数系统策略角度阐述肿瘤的分子机理、发现肿瘤分子标志物,研究并整合基因组、转录组、蛋白质组和代谢组的变异来实现肿瘤的预测、预防与个体化治疗及精准医学。已发表学术论文130 余篇,主编国际学术专著3 本,参编国际学术专著16 本,获得美国发明专利2 个。受邀在中科院1 区影响因子9.068 MassSpectrometry Reviews 和中科院2 区影响因子3.65 Frontiers in Endocrinology 的国际期刊上客座主编了3 个专刊。 /p p style=" text-align: justify line-height: 1.75em text-indent: 2em " 本篇文章仪器信息网获得授权转载,来源中国科技成果杂志。 /p p style=" text-align: center line-height: 1.75em "    span style=" color: rgb(0, 112, 192) " strong 深入剖析蛋白质组学技术最新进展与应用 /strong /span /p p style=" text-align: justify line-height: 1.75em "   詹显全:人类结构基因组测序接近尾声,人们就从结构基因组学研究转向功能基因组学研究,即对转录组和蛋白质组进行研究。1995 年正式提出了”蛋白质组”和”蛋白质组学”的概念,距今已有25 年历史了。 /p p style=" text-align: justify line-height: 1.75em text-indent: 2em " 蛋白质组学的主要技术包括蛋白质组的分离技术、鉴定技术和蛋白质组信息学技术。 span style=" text-indent: 2em " 蛋白质组的分离技术主要有双向凝胶电泳(2DE)和多维液相色谱(2DLC)。蛋白质组的鉴定技术主要是基于质谱(MS)的技术,主要分为肽质指纹(PMF)和串联质谱(MS/MS)分析技术,其用于蛋白质大分子分析的两大离子源主要有MALDI 和ESI。质谱技术发展很快,主要朝向高灵敏度、高通量和高精度方向发展。 /span /p p style=" text-align: justify line-height: 1.75em "   蛋白质组信息学技术主要是用来构建蛋白质相互用网络的相关技术。蛋白质组的分离技术和质谱技术的不同联合就形成了各种类型的蛋白质组学分析技术:如2DE-MS和2DLC-MS。2DE-MS 又有2DE-MALDI-PMF 和2DE-ESI-LC-MS/MS, 该技术在蛋白质组学研究的头10-15 年是其主要技术,然而常规概念认为2DE 的通量不高,即一个2D 胶点中一般仅含有1 ~ 2 个蛋白质,通常一次实验其通量仅能鉴定几十到一千个蛋白质,这样其在蛋白质组学中的地位逐渐被淡化。 /p p style=" text-align: justify line-height: 1.75em text-indent: 2em " 2DLC-MS 主要有iTRAQ or TMT-based SCX-LC-MS/MS and labelfree LC-LC-MS/MS, 这就是人们通常说的“Bottomup”蛋白质组学,该技术在最近10 ~ 15 年在蛋白质组学中起着核心技术的作用,因为其通量明显增加,一次实验其通量可达到几千到一万的蛋白质能被鉴定,但该法鉴定的结果是一个protein group, 实质上鉴定的是编码蛋白质的基因, 而并没有鉴定到真正意义上的蛋白质,即蛋白质存在形式(Proteoforms 或Protein species)。蛋白质存在形式(Proteoforms)是蛋白质组的基本单元。人类基因大约2 万个,人类转录本至少10 万个,每个转录本指导核糖体按三联密码子决定一个氨基酸残基来合成氨基酸序列,刚合成出来的蛋白质氨基酸序列是没有功能的,它必须到达其指定的位置如胞内、胞外,和不同的亚细胞器等,形成特定的三位空间结构,并与其周围的相关分子相互作用,形成一个复合物(complex)才能发挥其功能作用。从核糖体刚合成出来到其指定的位置过程中有很多的蛋白质翻译后修饰(PTMs 据估计人体有400 ~ 600 种PTMs)。我们最近对蛋白质存在形式的概念给出了最新最完整的定义:蛋白质的氨基酸序列+ 翻译后修饰+ 空间构型+ 辅助因子+ 结合伴侣分子+ 空间位置+ 特定的功能。而蛋白质的概念被定义为:由同一个基因编码的所有蛋白质存在形式的集合体。这样,人类蛋白质组中的蛋白质存在形式(Proteoforms)至少有100 万或甚至达10 亿 (图1)。 /p p style=" text-align: center" img style=" max-width: 100% max-height: 100% width: 600px height: 427px " src=" https://img1.17img.cn/17img/images/202008/uepic/1d18fad3-b010-4ea5-a812-432853ad4ec6.jpg" title=" 1111111.png" alt=" 1111111.png" width=" 600" height=" 427" border=" 0" vspace=" 0" / /p p style=" text-align: center line-height: 1.75em "   图1 :Proteoforms 的概念及形成模式 (Zhan et al,Med One, 2018 Zhan et al., Proteomes, 2019) /p p style=" text-align: justify line-height: 1.75em "   如此庞大数量的Proteoforms/Protein species, 如何对其进行大规模的探测、鉴定和定量,是一个至关重要的事情。目前关于Proteoforms 的研究有两套策略一是“Top-down”MS 技术, 二是“Top-down” 和“Bottom-up”相结合的技术即2DE-LC/MS 技术(图2)。 /p p style=" text-align: center" img style=" max-width: 100% max-height: 100% width: 600px height: 415px " src=" https://img1.17img.cn/17img/images/202008/uepic/94f48c94-fd0b-4959-90fb-dd399cebf074.jpg" title=" 2.png" alt=" 2.png" width=" 600" height=" 415" border=" 0" vspace=" 0" / /p p style=" text-align: center line-height: 1.75em "   图2 :Proteoforms 研究技术比较(Zhan et al., Med One, 2018 Zhan et al., Proteomes, 2019) /p p style=" text-align: justify line-height: 1.75em "   “Top-down”MS 技术能探测、鉴定和定量Proteoforms,获得蛋白质的氨基酸序列和PTMs 信息,然而该技术的通量较低,目前最大通量鉴定到5700 个Proteoforms, 对应到860 蛋白质。 /p p style=" text-align: justify line-height: 1.75em "   最近,詹显全教授团队发现2DE-LC/MS 技术是一超高通量的技术平台,在探测、鉴定和定量Proteoforms方面, 可以鉴定达几十万至上100 万的Proteoforms。随着质谱灵敏度的显著提高,自2015 年以来,詹显全教授团队就发现每个2D 胶点包含了平均至少50 个甚至达几百个Proteoforms,并且大多数是低丰度的 并在近1 ~ 2 年来发表了相关论文来全面阐述2DE-LC/MS 的新理念和实践,完全打破了40 多年来人们对双向电泳的传统认识 (即一个2D 胶点中一般仅含有1 ~ 2 蛋白质),为大规模的Proteoforms 研究提供了技术基础。Proteoforms/Protein species 概念的发展极大的丰富了蛋白质组的内涵,是蛋白质组学研究的更高层次,是国际科学发展的前沿,必将影响着整个生命科学和医学科学的研究和实践,有助于发现可靠而有效的疾病标志物,用于深度理解疾病分子机制和决定药物靶点,或者用于有效的预测、诊断、预后评估。另外,蛋白质组是表型组的重要成分,是基因组功能的最终执行者,是基因组和转录组研究所不能替代的,要实现真正的个性化医学和精准医学,蛋白质组学研究是不能绕过去的。 /p p style=" text-align: center line-height: 1.75em "    span style=" color: rgb(0, 112, 192) " strong 基于整合组学发现疾病标志物才是精准发展之重 /strong /span /p p style=" text-align: justify line-height: 1.75em "   1. 您一直专注于肿瘤蛋白质组学的研究,例如垂体瘤、卵巢癌等相关恶性肿瘤结合组学的研究,请谈谈在这方面的最新的研究成果,以及过程中的主要挑战和解决方案 /p p style=" text-align: justify line-height: 1.75em "   詹显全: 垂体瘤是颅内常见肿瘤,绝大多数是良性的,只有少数具有侵袭性和恶性,并能引起激素分泌紊乱和颅内压迫症状,出现严重的临床症状,危害人体健康。临床上分为功能性垂体瘤和非功能性垂体瘤,并且非功能性垂体瘤不表现血中激素水平增加,不易早期诊断,经常是当肿瘤体积增加到压迫周围组织器官产生压迫综合征时才被诊断,这时已经是中晚期了,且其分子 /p p style=" text-align: justify line-height: 1.75em "   机制并不清楚,缺乏早期诊断标志物和药物治疗靶标。因此,非功能性垂体瘤被选为主要研究对象。虽然垂体瘤是在颅内,但我们认为垂体瘤是一种多病因、多过程、多结果的全身性的慢性疾病,并且还具有肿瘤的异质性 它涉及到一系列的分子改变,包括发生在基因组、转录组、蛋白质组、代谢组和相互作用组水平上的改变,而这些不同水平改变的分子和信号通路又不是孤零零的起作用,而是相互间具有千丝万缕的联系。因此,我们很难用一种单一因素来解决其预测、预防、诊断、治疗和预后评估 而必须从单因素模式转向多参数系统思维模式。垂体瘤的多病因、多过程、多结果、全身性、慢性、分子网络系统性给其“同病同治”提出了严峻挑战,同时为实现其个性化的精准预测、精准预防、精准诊断和精准治疗提供了机遇和条件。多组学(基因组学、转录组学、蛋白质组学、代谢组学、影像组学)和系统生物学技术的发展驱动了这一多参数系统思维模式的转变、推进了其个性化医学和精准医学的研究和实践。因此,我们认为多参数系统策略观和多组学是进行垂体瘤个性化医学和精准医学的研究和实践的重要理念和技术方案。 /p p style=" text-align: justify line-height: 1.75em "   我们从2001 开始进行垂体瘤的蛋白质组学及其翻译后修饰组学研究,从2008 年开始进行多组学和分子网络研究,及预测预防个体化医学(PPPM)和精准医学(PM)研究。经过过去近20 年未间断的研究,我们在垂体瘤的蛋白质组学、翻译后修饰组学、多组学、分子网络和系统生物学研究方面在国际上处于了主导地位。 /p p style=" text-align: justify line-height: 1.75em "   在我们研究过程中,我深深体会到一个重大思转变就是从以前的单参数模式转向了多参数系统思维模式,这符合肿瘤的真实情况。另外,就是多组学技术促进了这一模式的转变,并是其主要的解决方案。 /p p style=" text-align: justify line-height: 1.75em "   2. 从您的研究方向及重点出发,您认为多组学研究在精准医学中接下来的研究应当侧重于哪些方面,以及如何才能比较好的实现从研究到临床的转化落地? /p p style=" text-align: justify line-height: 1.75em "   詹显全:我的研究对象是肿瘤(垂体瘤、卵巢癌、肺癌、胶质瘤),研究理念是肿瘤的多参数系统策略观,技术手段是多组学和系统生物学,研究的目标是要解决肿瘤的预测预防个体化医学(PPPM)和精准医学(PM)。 /p p style=" text-align: justify line-height: 1.75em "   我们认为多组学中的不同组学对PPPM/PM 的贡献是不平衡的,即个性化的表型组是基因组通向PPPM/PM 应用实践的桥梁,而蛋白质组和代谢组是表型组中两重要成分。蛋白质组的内涵包括蛋白质的拷贝数变化、剪切变化、翻译后修饰、转位、再分布、空间构型、与周围分子相互作用、及信号通路网络问题。代谢组的内涵涉及到体内所有物质(包括糖、脂、蛋白质、核酸)的代谢产物及其代谢网络问题。要真正实现PPPM 和PM,蛋白质组和代谢组的贡献是基因组所不能替代的是不能绕过去的。人们应从以基因组为中心的研究和实践转向以表型组为中心的研究和实践。其中蛋白质组的研究又应以翻译后修饰和蛋白质存在形式(Proteoforms)作为今后的研究方向。Proteoforms 的研究必将影响着整个生命科学和医学科学。从临床转化研究来看,基于多组学的整合生物标志物是发展方向。对于这里的生物标志物,我们将其分为两类:一类是解决疾病分子机制和药物靶点的生物标志物,这类生物标志物一定要有因果关系 一类是解决预测、诊断、预后评估的生物标志物,这类标志物不一定要求有因果关系,但必要要有量的变化。 /p p style=" text-align: justify line-height: 1.75em "   3. 作为EPMA(欧洲预测预防个体化医学协会)的中国代表,想请您分享下国际上对于组学研究在精准医疗中的应用现状、趋势以及发展规划 /p p style=" text-align: justify line-height: 1.75em "   詹显全:欧洲预测预防个体化医学协会(EPMA)是国际个体化医学领域领头的学术协会,由来自全球55 个国家和地区的专家学者组成,其创办的官方杂志EPMA Journal( 中科院2 区,ESI IF5.661) 涵盖了24 个专题内容,较全面地反映了预测预防个体化医学(PPPM)和精准医学(PM)的研究、实践与最新动态,还涉及到PPPM 和PM 的政策、伦理、卫生经济和社会保障等许多方面,为PPPM 和PM 的科研、实践提供了一个很好的交流平台。 /p p style=" text-align: justify line-height: 1.75em text-indent: 2em " 我本人作为EPMA 的中方代表(National Representative of EPMA in China) 和其官方杂志EPMA Journal 的副主编,参与了其经历的重要活动。我从2008 开始起在EPMA 中主要负责多组学和创新技术方面,在EPMA 白皮书中的“肿瘤预测预防个体化医学的多参数系统策略观”这部分最早就是我写的,之后我们写了一系列文章来论述基于多组学的多参数系统策略的研究和实践。因此,在EPMA,我们的基于多组学的多参数系统策略观还是比较早的,近五六年来多组学研究在EPMA 圈内(55 个国家和地区)发展得很快,已经深入到PPPM 的各个领域。 /p p style=" text-align: justify line-height: 1.75em "   另外,我认为,精准医学在理念上没错,严格意义上的精准医学是个理想化的概念,人们只能无限去逐步接近它。现阶段搞精准医学还是要回归到人类健康的保护过程,即预测、预防、诊断、治疗和预后评估,这里应该是针对个人来说而不是针对群体,严格说来应该是个性化的精准预测、精准预防、精准诊断、精准治疗和精准预后评估。对于人类健康保护过程来说,预测、预防还是上策,其次就是早诊断、早治疗。多组学研究已渗入到人类健康保护过程的每个环节,主要用来寻找基于多组学的生物标志物,当然这里的生物标志物应泛指前面说的两类:一类是解决疾病机制和治疗靶点的标志物,一类是解决预测、诊断、预后评估的标志物。 /p p style=" text-align: justify line-height: 1.75em text-indent: 2em " 因此,基于多组学的PPPM/PM 的研究和实践一定是今后发展的一个长远趋势。 /p p style=" text-align: center" img style=" max-width: 100% max-height: 100% width: 600px height: 802px " src=" https://img1.17img.cn/17img/images/202008/uepic/581ff7cf-5c3e-4fd6-8f5f-805989791ee5.jpg" title=" 詹.jpg" alt=" 詹.jpg" width=" 600" height=" 802" border=" 0" vspace=" 0" / /p p br/ /p
  • 新技术找到人类蛋白质关键变构位点
    从不同角度显示的人类蛋白质PSD95-PDZ3 的三维图像。图片来源:安德烈福尔/CRG科技日报根据6日发表在《自然》网站上的一项新研究,人类蛋白质表面的潜在治疗靶点的数量比之前认为的要多得多。西班牙巴塞罗那基因组调控中心(CRG)的研究人员开发出一项突破性新技术,揭示了许多控制蛋白质功能的“秘密大门”,从理论上讲,这些“门”可以显著改变痴呆症、癌症和传染病等各种疾病的进程。现在,他们已经绘制出这些被称为“变构位点”的靶点的第一张图。这种发现靶点的方法可能会改变药物发现的“游戏规则”,从而研发更安全、更智能且更有效的药物。它使世界各地的研究实验室能够靶向任何蛋白质,包括那些以前被认为“无药可及”(undruggable)的蛋白质。蛋白质在所有生物体中发挥着核心作用,并执行重要功能,如提供支撑结构、加速反应、充当信使或对抗疾病。它们由氨基酸组成,在三维空间中折叠成无数不同的形状。蛋白质的形状对其功能至关重要,氨基酸序列中只要有一个错误就会对人类健康造成潜在的毁灭性后果。变构是蛋白质功能中一大未解之谜。当分子与蛋白质表面结合时会产生变构效应,这反过来又会导致该蛋白质远处的位置发生变化,从而通过“遥控”来调节其功能。许多致病突变,包括许多癌症驱动因素,都是因为其变构效应而具有病理性。尽管变构位点很关键,但它们却非常难找。此次,研究人员开发了一种名为双深度PCA(ddPCA)的技术来应对这一挑战。他们将其描述为一种“蛮力实验”,就好比发现一辆车有问题之后,不只是检查局部,而是拆卸整辆车,并逐个检查零件。通过一次性测试一万件零件,研究人员确定了所有真正重要的部件。CRG系统生物学项目协调人、该研究报告的作者本莱纳教授解释说:“我们故意以数千种不同的方式打破事物,以建立一个事物如何运作的完整图景。”该方法通过改变构成蛋白质的氨基酸来发挥作用,从而产生数千种不同版本的蛋白质,而序列中只有一两个差异。然后,研究人员在实验室的活细胞中同时测试突变蛋白质的影响。研究人员称,每个细胞都是一个小工厂,会生产不同版本的蛋白质。在一个试管中有数百万个不同的工厂,因此可以非常迅速地测试一种蛋白质的所有不同版本的工作情况。实验收集的数据被输入计算机神经网络进行分析,产生全面的地图,精确定位蛋白质表面的变构位置。该技术有望促进蛋白质功能和进化的研究。如果扩大规模,可以从氨基酸序列中精确预测蛋白质的特性。研究人员认为,一旦成功,这将开启预测性分子生物学的新时代,使发展新药和清洁的、以生物学为基础的工业成为可能。
  • 单分子蛋白质测序、单细胞代谢组学及体积电镜等上榜2023 年值得关注的七项技术 |《自然》长文
    《自然》选出将在未来一年对科学产生巨大影响的工具和技术。从蛋白质测序到电子显微镜,从考古学到天文学,本文将讲述七项有可能会在未来一年震动科学界的技术。  单分子蛋白质测序  蛋白质组体现了细胞或生物体制造的一整套蛋白质,可以提供关于健康和疾病的深入信息,但对蛋白质组的表征仍然是一项挑战性的工作。  相对于核酸来说,蛋白质是由更多的分子砌块(building blocks)组成的,约有20种天然存在的氨基酸(相比之下,组成DNA和信使RNA等分子的只有4种核苷酸) 因此,蛋白质具有更大的化学多样性。有些蛋白质在细胞中的含量较少 并且与核酸不同,蛋白质不能被扩增 ——这意味着蛋白质分析方法必须使用任何能用的材料。  大多数蛋白质组学分析使用质谱法,这是一种根据蛋白质的质量和电荷来分析蛋白质混合物的技术。这些谱图可以同时量化数千种蛋白质,但检测到的分子并不总能明确识别,并且混合物中的低丰度蛋白质常常被忽视。现在,能对样本中的许多(甚至全部)蛋白质进行测序的单分子技术可能即将问世,其中许多技术类似于用于DNA的技术。  德克萨斯大学奥斯汀分校的生物化学家Edward Marcotte正在研究一种这样的技术,称为荧光测序(fluorosequencing)[1]。Marcotte的技术报道于2018年,该技术基于一种逐步的化学过程,在此过程中,单个氨基酸被荧光标记,然后从表面偶联蛋白的末端逐个被剪切下来,此时摄像机会捕捉到所产生的荧光信号。Marcotte解释道:“我们可以用不同的荧光染料标记蛋白质,然后在切割时逐个分子地观察。”去年,位于康涅狄格州的生物技术公司Quantum Si的研究人员描述了一种荧光测序的替代方法,该方法使用荧光标记的“粘合剂”蛋白来识别蛋白质末端的特定氨基酸(或多肽)序列[2]。  其他研究人员正在开发模仿基于纳米孔的DNA测序技术,根据多肽通过微小通道时引起的电流变化来分析多肽。荷兰代尔夫特理工大学的生物物理学家Cees Dekker及其同事于2021年展示了这样一种方法,他们利用蛋白质制成纳米孔,并能够区分通过纳米孔的多肽中的单个氨基酸[3]。在以色列理工学院,生物医学工程师Amit Meller的团队正在研究由硅基材料制成的固态纳米孔器件,该器件可以同时对许多不同的蛋白质分子进行高通量分析。他说:“你可能可以同时观察数万甚至数百万个纳米孔。”  尽管目前单分子蛋白质测序只是概念上的验证,但其商业化正在迅速推进。例如,Quantum Si公司已宣布计划今年推出第一代仪器,并且Meller指出,2022年11月在代尔夫特举行的蛋白质测序会议上有一个专门针对该领域初创企业的讨论组。他说:“这让我想起了第二代DNA测序技术面世前的那些日子。”  Marcotte是德克萨斯州奥斯汀市蛋白质测序公司Erisyon的联合创始人,他对此持乐观态度。他说:“这已经不是个行不行的问题,而是这项技术几时能送到人们手上。”  詹姆斯韦勃太空望远镜  天文学家们从去年开始就翘首以盼,兴奋不已。经过20多年的精心设计和建造,美国国家航空航天局(NASA)与欧洲航天局和加拿大航天局合作,于2021年12月25日成功将詹姆斯韦布太空望远镜(James Webb Space Telescope,缩写JWST)送入轨道。因为仪器设备需要展开并确定第一轮观测的位置,全世界不得不等待了近七个月,JWST才开始正常工作。  等待是值得的。马里兰州巴尔的摩市太空望远镜科学研究所天文学家、JWST的望远镜科学家Matt Mountain表示,最初传来的图像超出了他的最高预期。“实际上天空并不空旷——到处都是星系,”他说,“理论上我们知道这一点,但真正看到这一景象带来了别样的情感冲击。”  詹姆斯韦布太空望远镜(James Webb Space Telescope)的6.5米主镜片(图中展示了18片镜片中的6片)可以探测数十亿光年外的物体。资料来源:NASA/MSFC/David Higginbotham  JWST的设计是为了接替哈勃太空望远镜的工作。哈勃望远镜可以看到令人惊叹的宇宙景象,但也有盲点:它基本上无法看见在红外范围内具有光信号的古老恒星和星系。要弥补这一点,需要一台高灵敏度的仪器,其灵敏度要能够探测到数十亿光年外发出的极为微弱的红外信号。  JWST的最终设计包括18个完全光滑的铍质镜片阵列,当其完全展开时,直径为6.5米。Mountain说,这些反射镜的设计非常精密,“要是把一块镜面等比放大到美国那么大,上面的隆起也不超过几英寸(高)。”这些反射镜配有最先进的近红外和中红外探测器。  这一设计使JWST能够填补哈勃望远镜的空白,包括捕获来自一个有135亿年历史的星系发出的信号,该星系产生了宇宙中最早的一些氧和氖原子。JWST也带来了一些惊喜,例如,它能够测量某些类型的系外行星的大气组成。  世界各地的研究人员都在排队等待观察时间。英国卡迪夫大学的天体物理学家Mikako Matsuura正在用JWST进行两项研究,调查宇宙尘埃的产生和破坏,这些尘埃可能会导致恒星和行星的形成。Matsuura说,与她所在小组过去使用的望远镜相比,“JWST拥有完全不同的灵敏度和清晰度等级”。她说:“我们看到了这些天体内部正在发生的完全不同的现象——这真令人叹为观止。”  体积电子显微镜  电子显微镜(Electron microscopy,EM)以其卓越的分辨率而闻名,但观察的主要是样本的表面。深入研究样本的内部需要将样本切成非常薄的切片,这对于生物学家来说往往不够。伦敦弗朗西斯克里克研究所(Francis Crick Institute)的电子显微镜学家Lucy Collinson解释说,仅覆盖单个细胞的体积就需要200个切片。她说:“如果你只有一个[切片],你就是在玩统计把戏。”  现在,研究人员正在将EM的分辨率应用于包含多个立方毫米体积的3D组织样本上。  此前,从2D的EM图像重建这样体积的样本(例如,绘制大脑的神经连接图)需要经历艰苦的样本准备、成像和计算过程,才能将这些图像转换为多图像堆叠。现在,最新的“体积电子显微镜”技术大大简化了这一过程。  这些技术有各种优点和局限性。连续切面成像(Serial block-face imaging)是一种相对快速的方法,它使用金刚石刀片在树脂包埋样品上切下一系列薄片,并进行成像,可以处理约1立方毫米大小的样品。然而,它的深度分辨率较差,这意味着生成的体积重建将相对模糊。聚焦离子束扫描电子显微镜(Focused ion beam scanning electron microscopy,FIB-SEM)能制备更薄的薄片样品,因此深度分辨率更高,但更适用于体积较小的样品。  Collinson将体积电子显微镜的兴起描述为一场“安静的革命”,因为研究人员专注于用这种方法得到的结果,而不是生成这些结果的技术。但这正在改变。例如,2021年,弗吉尼亚州珍利亚研究园区(Janelia Research Campus)从事电子显微镜中细胞器分割(Cell Organelle Segmentation in Electron Microscopy,COSEM)计划的研究人员在《自然》上发表了两篇论文,聚焦了在绘制细胞内部结构方面取得的重大进展[4,5]。“这是一个绝佳的原理论证。”Collinson说。  COSEM研究计划使用精密的定制FIB-SEM显微镜,在保持良好空间分辨率的同时,可将单个实验中可成像的体积增加约200倍。将这些仪器与深度学习算法结合使用,该团队能够在各种细胞类型的完整3D体积中定义各种细胞器和其他亚细胞结构。  这种样品制备方法费力且难以掌握,并且由此产生的数据集非常庞大。但这一努力是值得的:Collinson已经看到了该技术在传染病研究和癌症生物学方面产生的见解。她现在正在与同事们合作,探索以高分辨率重建整个小鼠大脑的可行性。她预计这项工作将需要十多年的时间,花费数十亿美元,并产生5亿GB左右的数据。她说:“这可能与绘制第一个人类基因组工作的数据量在一个数量级。”  CRISPR无限可能  基因组编辑工具CRISPR–Cas9作为在整个基因组的目标位点引入特定变化的首选方法,在基因治疗、疾病建模和其他研究领域取得了突破,无可非议地享有盛誉。但它的用途多受限制。现在,研究人员正在寻找规避这些限制的方法。  CRISPR编辑由短链向导RNA(short guide RNA,sgRNA)协调,sgRNA将相关的Cas核酸酶导向其目标基因组序列。但这种酶发挥作用还需要在靶点附近有一种叫做原间隔序列邻近基序(protospacer adjacent motif,PAM)的序列 如果没有PAM,基因编辑很可能会失败。  在波士顿的马萨诸塞州总医院,基因组工程师Benjamin Kleinstover利用蛋白质工程技术,从化脓性链球菌中制造出常用Cas9酶的“近乎不受PAM序列限制的(near-PAMless)”Cas变体。一个Cas变体需要由三个连续核苷酸碱基组成的PAM,其中腺嘌呤(A)或鸟嘌呤(G)核苷酸位于中间位置[6]。“这些酶现在几乎可以读取整个基因组,而传统的CRISPR酶只读取1%到10%的基因组。”Kleinstover说。  这种对PAM序列不太严格的要求,增加了编辑“脱靶”的机会,但进一步的蛋白质工程设计可以提高其特异性。作为一种替代方法,Kleinstiver的团队正在设计和测试大量Cas9变体,每个变体对不同的PAM序列表现出高度的特异性。  还有许多天然存在的Cas变体有待发现。自然条件下,CRISPR–Cas9系统是一种针对病毒感染的细菌防御机制,不同的微生物进化出了具有不同PAM序列偏好的各种酶。意大利特伦托大学的病毒学家Anna Cereseto和微生物组研究人员Nicola Segata梳理了100多万个微生物基因组,鉴定和表征了一组多样的Cas9变体,他们估计这些变体可能总共可以针对98%以上的已知人类致病突变[7]。  然而,其中只有少数能在哺乳动物细胞中发挥作用。Cereseto说:“我们的想法是测试许多种酶,看看是什么决定因素使这些酶正常工作。”从这些天然酶库和高通量蛋白质工程工作中获得的见解来看,Kleinstiver说,“我认为我们最终会有一个相当完整的编辑工具箱,能让我们编辑任何我们想要的碱基。”  高精度放射性碳测年  去年,考古学家利用放射性碳测年技术的进步,对维京探险家首次抵达美洲的确切年份——甚至是季节——进行了研究。荷兰格罗宁根大学的同位素分析专家Michael Dee和他的博士后Margot Kuitems带领的一个团队在加拿大纽芬兰岛北岸的一个聚落中发现了一些被砍伐的木材,通过对这些木材的研究,确定这棵树很可能在1021年被砍伐,而且可能是在春天[8]。  自20世纪40年代以来,科学家一直在利用有机人工制品的放射性碳测年法来缩小历史事件发生的时间范围。他们通过测量同位素碳-14的痕迹来做到这一点,碳-14是宇宙射线与地球大气相互作用的结果,在数千年中缓慢衰变。但这种技术的精确度通常仅为几十年左右。  加拿大纽芬兰省兰塞奥兹牧草地(L'Anse aux Meadows)木材的精确放射性碳年代测定显示,维京人于1021年在此地砍倒了一棵树。图片来源:All Canada Photos/Alamy  2012年,情况发生了变化,日本名古屋大学物理学家三宅芙沙(Fusa Miyake)领导的研究小组发现[9],公元774到775年之间,日本雪松年轮中碳-14含量显著升高。随后的研究[10]不仅证实了这一时期世界各地的木材样本中都存在这种碳-14含量的显著升高,而且还发现历史上存在至少五次这样的碳-14含量上升,最早的一次可以追溯到公元前7176年。有研究人员将这些碳-14峰值与太阳风暴活动联系起来,但这一假设仍在探索中。  无论其原因是什么,这些“三宅事件”的存在,能让研究人员通过检测一个特定的三宅事件,然后对此后形成的年轮进行计数,从而准确地确定木制文物的制造年份。Kuitems说,研究人员甚至可以根据最外圈年轮的厚度来确定树木被砍伐的季节。  考古学家现在正在将这种方法应用于新石器时代聚落和火山爆发遗址的研究,Dee希望用它来研究中美洲的玛雅帝国。在接下来的十年左右,Dee乐观地认为,“我们将对这些古老文明中的许多历史事件有真正精确到年代的完全记录,我们将能够以相当精细的时间尺度谈论这些历史发展。”  至于三宅,则还在继续寻找历史中的时间标尺。她说:“我们现在正在寻找过去一万年中与公元774到775年的事件相当的其他碳-14升高。”  单细胞代谢组学  代谢组学是研究驱动细胞的脂质、碳水化合物和其他小分子的科学,它最初是一套表征细胞或组织中代谢产物的方法,但现在正在转向单细胞水平。科学家们可以利用这些细胞水平的数据,理清大量看似相同的细胞的功能复杂性。但这一转变带来了艰巨的挑战。  代谢组包含大量具有不同化学性质的分子。欧洲分子生物学实验室的代谢组学研究人员Theodore Alexandrov说,其中一些分子存在的时间非常短暂,代谢周转率为亚秒级别。它们可能很难检测:尽管单细胞RNA测序可以捕获细胞或生物体中产生的近一半的RNA分子(转录组),但大多数代谢分析仅涵盖细胞代谢产物的一小部分。这些缺失的信息里可能包含了重要的生物学奥秘。  “代谢组实际上是细胞的活性部分。”伊利诺伊大学厄巴纳-香槟分校的分析化学家Jonathan Sweedler说,“在疾病状态下,如果你想知道细胞状态,你真的要研究代谢产物。”  许多代谢组学实验室使用分离的细胞,这些细胞被捕获在毛细管中,使用质谱法单独分析。相比之下,“成像质谱”方法获取了样本中不同位置的细胞代谢产物发生变化的空间信息。例如,研究人员可以使用一种称为基质辅助激光解吸/电离(MALDI)的技术,其中激光束扫过经特殊处理的组织切片,释放出代谢产物,用于随后的质谱分析。这种方法也能捕获样本中代谢物来源的空间坐标。  Sweedler说,理论上,这两种方法都可以量化数千个细胞中的数百种化合物,但要实现这一目标通常需要顶级的定制硬件设备,成本在百万美元左右。  现在,研究人员正在普及这项技术。2021年,Alexandrov团队报道了SpaceM,这是一种开源软件工具,它能用光学显微镜成像数据,使用标准商用质谱仪对培养的细胞进行空间代谢组学分析[11]。他说:“我们算是做了数据分析部分的体力活。”  Alexandrov的团队使用SpaceM对数以万计人和小鼠细胞中的数百种代谢产物进行了分析,并转向标准的单细胞转录组学方法将这些细胞分类。Alexandrov表示,他尤为热情的是后一项工作,以及构建“代谢组学图谱”的想法——类似于为转录组学开发的图谱,以加速该领域的进展。他说:“这绝对是一个前沿领域,并将对科学起到巨大的推动作用。”  体外胚胎模型  研究人员现在可以在实验室中制造出人工合成胚胎(下图),它与8天大的自然胚胎(上图)类似。来源:Magdalena Zernicka Goetz实验室  科学家们已经在小鼠和人类的细胞水平上详细描绘了从受精卵到完全形成的胚胎这一过程。但驱动这一过程早期阶段的分子机制仍不清楚。现在,“胚状体”模型的一系列活动有助于填补这些知识空白,让研究人员更清楚地了解可以决定胎儿发育成败的重要早期事件。  该领域一些最精细的模型,来自加州理工学院和英国剑桥大学的发育生物学家Magdalena Zernicka Goetz的实验室。2022年,她和她的团队证明,他们可以完全从胚胎干细胞(embryonic stem cells,ES细胞)中产生植入期的小鼠胚胎[12,13]。  与所有多能干细胞一样,ES细胞可以形成任何细胞或组织类型,但它们需要与两种类型的胚外细胞密切相互作用才能完成正常的胚胎发育。Zernicka-Goetz团队研究出了诱导ES细胞形成这些胚外细胞的方法,并表明这些细胞可以与ES细胞共培养,以产生胚胎模型,该模型的成熟度是以前的体外实验无法达到的。“它就如你能想象的胚胎模型那样。”Zernicka Goetz说,“我们的胚胎模型发育出一个头部和心脏——而且还在跳动。”她的团队能够利用这个模型来揭示个别基因的改变如何破坏正常的胚胎发育。  经过工程设计用于模拟胚胎8细胞期的细胞构成的胚状体。来源:M.A Mazid et al./Nature  在中国科学院广州生物医药与健康研究院,干细胞生物学家Miguel Esteban和同事们正在采取一种不同的策略:重新编程人类干细胞,以模拟最早的发育阶段。  Esteban说:“我们最初的想法是,实际上甚至制造合子也是可能的。”该团队没能完全实现这一点,但他们的确发现了一种培养策略,能使这些干细胞回到类似于8细胞期人类胚胎的状态[14]。这是一个至关重要的发育期里程碑,与基因表达的巨大变化相关,最终产生不同的胚胎细胞和胚外细胞谱系。  尽管还不完美,但Esteban的模型展示了自然状态下8细胞期胚胎中细胞的关键特征,并凸显了人类和小鼠胚胎如何启动向8细胞期阶段转变之间的重要差异。Esteban说:“我们发现,一种甚至在小鼠体内都没有表达的转录因子,调节着整个转化过程。”  结合起来,这些模型可以帮助研究人员描绘出仅仅几个细胞是如何发育为高度复杂的脊椎动物躯体的。  在许多国家,对人类胚胎的研究只能在发育14天以内进行,但在这些限制条件下,研究人员仍有许多工作可做。Esteban说,非人类灵长类动物模型提供了一种可能的替代方案,而Zernicka-Goetz说,她的小鼠胚胎策略也可以产生发育到第12天的人类胚胎。她说:“在这个我们能研究的胚胎阶段,仍有很多问题有待提出。”  参考文献:  1. Swaminathan, J. et al. Nature Biotechnol.36, 1076–1082 (2018).  2. Reed, B. D. et al. Science 378, 186–192 (2022).  3. Brinkerhoff, H., Kang, A. S. W., Liu, J., Aksimentiev, A. & Dekker, C. Science 374, 1509–1513 (2021).  4. Heinrich, L. et al. Nature 599, 141–146 (2021).  5. Xu, C. S. et al. Nature 599, 147–151 (2021).  6. Walton, R. T., Christie, K. A., Whittaker, M. N. & Kleinstiver, B. P. etal. Science 368, 290–296 (2020).  7. Ciciani, M. et al. Nature Commun. 13, 6474 (2022).  8. Kuitems, M. et al. Nature 601, 388–391 (2022).  9. Miyake, F., Nagaya, K., Masuda, K. & Nakamura, T. Nature 486, 240–242 (2012).  10. Brehm, N. et al. Nature Commun. 13, 1196 (2022).  11. Rappez, L. et al. Nature Methods 18, 799–805 (2021).  12. Amadei, G. et al. Nature 610, 143–153 (2022).  13. Lau, K. Y. C. et al. Cell Stem Cell 29, 1445–1458 (2022).  14. Mazid, M. A. et al. Nature 605, 315–324 (2022).  原文以Seven technologies to watch in 2023为标题发表在2023年1月23日《自然》的技术特写版块上
  • 我国或将实现蛋白质测序仪器和试剂国产化
    基因测序技术飞速发展,使得几十个甚至上百个基因的测序能够在几天之内完成,近日,&ldquo 蛋白质测序仪器和试剂国产化&rdquo 项目实施工作会议在北京大学顺利落幕,会议得到了北京大学前沿交叉学科研究院方竞院长的大力支持。   90年代人类基因组计划,中国科学家承担了1%的任务 而2010年代的人类蛋白组计划,则是由中国科学家领军 20年来,从承担人类基因组计划1%到人类蛋白组计划的领袖全球,证明了中国科学的长足进步,也体现了中国科学家的卓越贡献。此次工作会议是科研与产业化结合非常好的范例,由国内蛋白组领域的重要企业参会,并成立了&ldquo 中国人类蛋白质计划企业工作组&rdquo ,由知名企业担任企业工作组组长,努力打破生物质谱被国外企业垄断的局面,迅速将相关的研究成果运用于临床诊断。   &ldquo 蛋白质测序仪器和试剂国产化&rdquo 项目,基于&ldquo 中国人类蛋白质组计划&rdquo ,项目共分9个课题,其中&ldquo 激光解析基体辅助离子源-蛋白测序仪器&rdquo 课题,是一重点研究方向,将会加大蛋白质组学在临床领域的研究与应用,快速推动生物质谱技术在临床医疗领域的应用。   利用对人体DNA分子的鉴定来辅助诊断的技术(分子诊断技术)在上个世纪就已经出现了,比如,FISH等核酸杂交技术已经可以进行染色体和基因水平的分析。上世纪90年代,定量PCR技术的兴起大大加快了突变鉴定的速度,可以进行DNA上单个位点突变的鉴定,被广泛应用于临床。本世纪初,人类基因组草图绘制的完成标志着第一代基因测序技术的成熟,对一个或几个基因的测序开始应用在临床上,对基因突变测量的分辨率得以提升,在传染病的鉴定以及癌症等致命性疾病的靶向治疗中应用广泛。   除了精度的提高,基因芯片技术的发明使得同时检测许多基因的变化成为可能。如今新一代测序技术的进展使得大规模测序的速度急剧提高,成本急剧降低,越来越多的疾病找到了可用于诊断或分型的分子标志物,同时检测几十个基因的微小变化也不再困难,对传染病病原体的鉴定变得更加快速,许多遗传性疾病都可以实现无创的产前诊断。   科技的进步应用于医疗领域需要经过一段时间,与IT等领域不同,医疗领域是政府监管最为严格的领域,合规性是临床应用上绕不开的问题。一项技术的成熟必须得到政府监管部门的认可才能得到应用,而新技术的批准、质控可溯源体系的建立、收费标准的建立等需要耗费时间。新一代测序的应用涉及到测序仪器、测序试剂、生物信息软件与数据库的相互配合,虽然这项技术在21三体综合症的产前诊断等应用方面展现出了极好的前景,但我们必须承认,在从基因序列到疾病的探索中,还有许多未知的问题需要解决。
  • 【综述】蛋白质组学研究进展
    p style=" text-align: center " img src=" http://img1.17img.cn/17img/images/201601/insimg/4a14f65e-cb82-47d8-87d5-ea4b0d204756.jpg" title=" sss_56a5b6877c56c.jpg" / /p p   1、蛋白质组和基因组 br/ /p p   蛋白质组是指一种基因组所表达的全套蛋白质1,其英文为“proteome”。 有关蛋白质组的系统研究是蛋白质组学,英文为“proteomics”。基因组是生命体中全部基因的集合体,其英文为“genome”。有关基因组的系统研究是基因组学,其英文为“genomics”。 “proteome”和“proteomics”是由Marc Wilkins 及其同事于20世纪90年代初参照基因组和基因组学两个英文单词而创造出来的2。蛋白质组学是研发、利用、改进各种技术手段研究蛋白质组或在细胞某一生理通路中相关蛋白质集合的组成、结构、功能、代谢的一门新兴科学。 /p p   基因决定蛋白质的水平,然而,蛋白质的水平分为转录水平和表达水平,mRNA只包含前者,后者则是由mRNA被翻译所实现,而在翻译过程中通常伴随对蛋白质功能和活性起至关重要的修饰过程,如糖基化、泛素化等3。通过研究蛋白质组学,可以获取蛋白定位与修饰的定性信息和相关定量数据,丰富认知蛋白质表达水平和相关蛋白作用,对了解生命复杂活动有更深更全的认识。 /p p   2、蛋白质组的发展背景 /p p   自二十世纪九十年代以来,传统生物学得以突飞猛进地发展,并取得瞩目成就,其中三个重要点彪炳史册,也促使传统生物学获得质的转变。 /p p   第一 基因、表达序列标记(EST, expressed sequence tag)、蛋白质序列数据库的成长。细菌、酵母、线虫、果蝇的全部基因序列逐渐明了,甚至后来人类基因组计划也顺利告捷 其它的植物、动物、微生物也不断在探索。人们把已经掌握的基因分门别类地建立了序列数据库。 /p p   第二 生物信息学的发展。易获取的浏览型生物信息工具层出不穷,这种免费的网页式数据库可以让我们从其中获得所需的特殊的物质结构,如蛋白质结构中的结构域和模体等。 /p p   第三 寡核苷酸微阵列技术的发展。通过不同荧光标记的DNA样本同时与微阵列反应,形成不同荧光的现象,大幅提高Northern blot 的效率4。 /p p   3、蛋白质组学分类 /p p   蛋白质组学分类可有不同原则。 /p p   根据蛋白质来源可分为植物蛋白质组学、动物蛋白质组学、微生物蛋白质组学。植物蛋白质组学是以来源于植物或与植物相关蛋白质为研究对象,分析其在植物发生、生长、调节、凋谢等生命过程中的作用、功能、代谢、结构等的体系。同理,动物蛋白质组学是以来源于动物或与动物相关蛋白质为研究对象,最重要的一大内容就是研究人类相关蛋白质。微生物蛋白质组学是以来源于微生物或与微生物相关蛋白质为研究对象。 /p p   根据研究目的和阶段不同可分为结构蛋白质组学、表达蛋白质组学、功能蛋白质组学。结构蛋白质组学主要分析蛋白质大分子的多级结构形态,包括氨基酸顺序、二级结构、三级结构和四级结构 并着重于研究其共性结构特征和特殊功能基团 也是用于建立细胞内信号转导的网络图谱并解释某些特定蛋白表达对细胞产生特定的作用5。表达蛋白质组学是以经典蛋白质组技术如双向凝胶电泳和图像分析为方法着重于研究细胞内蛋白质表达过程及结果的体系3。功能蛋白质组学是以细胞内单一同种蛋白质功能体现、蛋白质之间、蛋白质与其他大分子之间相互作用关系为研究目的,研究和表述选定蛋白质,探明有关蛋白的修饰和信号转导通路,疾病机制或蛋白-药物作用关系3。 /p p   根据研究内容,还可分为组成性蛋白质组学、差异显示蛋白质组学、相互作用蛋白质组学。组成性蛋白质组学是鉴定某个体系的蛋白质并阐述其翻译后修饰的特性。差异显示蛋白质组学又名比较蛋白质组学,是对重要生命过程或人类重大疾病进行生理、病理体系或过程的蛋白质表达比较。相互作用蛋白质组学则是研究蛋白质间相互作用,绘制某体系蛋白质作用网络图谱8。 /p p   4、白质组学研究工具 /p p   蛋白质组学研究的重要工具主要有四个。 /p p   第一,蛋白质、表达序列标记(EST, expressed sequence tag)、基因序列数据库的建立与成熟 也可以说是生物信息学。因为蛋白质组学中所用的大多数技术所获得的数据通常都是高通量、高复杂度的,只有通过生物信息学分析才能对蛋白质的种类、结构和功能进行分析确定。 /p p   第二,质谱(MS)技术。其将样品分子离子化,根据离子间质荷比的差异分离并确定质量,实现高灵敏度、高特异性。首先,质谱技术能准确测量高达100kDa的完整大分子蛋白质,其准确度和特异度比SDS-PAGE还要高。其次,质谱技术也能准确测量从蛋白质分解下来的多肽。最后,它还可以测定多肽的氨基酸顺序,即多肽测序4。现有三条途径,一是肽链质量图谱,二是串联质谱途径,三是联合途径7。其中一种较理想的技术平台是表面增强激光解吸离子化飞行时间质谱(SEL-DI)技术,可分析疏水性蛋白质、pI过高或过低蛋白质、低分子量蛋白质(& lt 25 000)和未经处理的样品中许多被掩盖的低浓度蛋白质,短时间内即可获得蛋白质的分子量、PI、特殊修饰位点等参数8。 /p p   第三,能将MS数据与数据库中特异的蛋白质顺序匹配的软件。它是快速、特异地将第一和第二工具联系在一起的分析方式。 /p p   第四,蛋白分析分离方法。通过蛋白分析分离方法可以简化蛋白复合物,同时产生不同蛋白质差异比较方法。普通的蛋白质分析分离方法包括1D-SDS-PAGE、高效液相色谱法(HPLC)、毛细管电泳(CE)、等点聚焦电泳(IEF)等。其中二维凝胶电泳如2D-SDS-PAGE是目前蛋白质组学中分离单一蛋白质的广泛应用方法。当然,多维分析分离方法是最理想的分离蛋白质和多肽的方法,譬如,离子交换液相色谱与反相高效液相色谱串联形成的分离系统是分离多肽混合物的有力方法4。 /p p   5、白质组学的应用 /p p   蛋白质组学原则性应用包括四个方面4:组成性应用、蛋白质表达模型、蛋白质网络图谱、蛋白质修饰图谱。组成性应用是指运用质谱及其相关技术将目的蛋白质按相关标准定性或定量地纳入蛋白质数据库,在此过程中研发相应技术的应用。蛋白质表达模型是指研究在生理或病理状态目的蛋白质在细胞内定位并表达情况,同时研究细胞在暴露物理、化学、药物等因素下蛋白质表达状况。蛋白质网络图谱是研究两种或两种以上蛋白质在生物体内组成结构、表达功能、调节控制间作用情况。蛋白质修饰图谱是探明蛋白质的修饰定位及修饰后功能表现。 /p p   当然,蛋白质组学在生活中无处不在,疾病、食品、植物、药品等等。 /p p   蛋白质组学在疾病中应用方向主要是发现新的疾病标志物,以探明疾病发生机制、发展变化,为治疗途径提供思路。Brea等利用双向电泳串联质谱技术,差异比较心源性脑栓塞患者和粥样硬化血栓性梗死患者各12例的血清蛋白,发现触珠蛋白相关蛋白和淀粉样蛋白A等蛋白质在粥样硬化血栓性梗死患者血清中显著升高9。 /p p   蛋白质组学在食品中应用方向主要是检测食品中过敏源检测、鉴定食品成分等,也给食品科学研究提供了新的研究思路和技术3。李明云等优化了相应的试验条件,并将蛋白质组双向电泳相关技术引入大黄鱼肝脏蛋白质分析中,得到了较清晰的大黄鱼肝脏蛋白双向电泳图谱。 /p p   蛋白质组学在植物中应用方向主要是植物群体遗传、环境信号应答与适应机制、植物组织器官、植物亚细胞等7。其中,如果研究的植物是农作物如棉花、马铃薯、水稻等,就可以简单地视作蛋白质组学在农业中的运用了。Chang等对玉米强制缺氧和低氧研究,发现低氧处理的效应不仅是氧气含量过低诱导增加糖酵解酶,通过质谱鉴定了46个相关蛋白质10。 /p p   蛋白质组学在药品中应用方向主要是药物研发、药物作用机制、耐药机制、药物毒理学等。在对紫杉醇类药物抗癌作用研究中,Bauer等对乳腺癌复发患者进行紫杉醇类药物治疗后进行蛋白质组学分析,发现a-防卫素可作为预测该类药物治疗乳腺癌治疗作用的生物标记物11。 /p p   6、展望 /p p   蛋白质组学在短短30年间发展迅猛,渗入到生活的许多方面,也对保证人类生存质量和良性繁衍有重大作用。但其思路不开阔,技术高效性、灵敏性、特异性仍有待提高,应用普及度低,蛋白质分离、纯化技术研发,基因组学丰富度低是制约蛋白质组学及其相关技术发展的瓶颈。不过,相信随着物理技术和化学方法的不断发展,研究水平的深入,蛋白质组学会随着基因组学的发展得到更进一步地丰富。 /p p   参考文献: /p p   1.诗,吕建新主编《分子生物学检验技术》第2版 /p p   2.Pandey A, Mann M. Proteomics to study genes and genomics [J] Nature,2000,405(6788):837-846. /p p   3.尹稳、伏旭、李平《蛋白质组学的应用研究进展》 [J]. 生物技术通报 2014年第1期 /p p   4.aniel C. Liebler《Introduction to Proteomics》:1-13 /p p   5.英超,党源,李晓艳,等. 蛋白质组学及其技术发展 [J]. 生物技术通讯,2010,21(1):139-144. /p p   6.鑫《比较蛋白质组学研究与应用进展》[J]. 国际免疫学杂志 2006年5月第29卷第3期:156-159 /p p   7.宇,荆玉祥,沈世华《植物蛋白质组学研究进展》 [J] 植物生态学报,2004,28(1):114-125 /p p   8.ore LE,Pfeiffer R,Warner M,et al. Identification of biomarkers of arsenic exposure and metabolism in urine using SELDI technology . Biochem Mol Toxicol , 2005,19(3):176. /p p   9.rea D,Sobrino T,Blanco M, et al. Usefulness of haptog lob in and serum amyloid A proteins as biomarkers for atherothrombotic ischemic stroke diagnosis confirmation [J]. Atherosclerosis,2009,205:561-567. /p p   10.ng,W.W.,L.Huang,M.Shen,C.Webster,A.L.Burlingame& amp J.K.Roberts.2000.Patterns of protein synthesis and tolerance of anoxia in root tips of maize seedlings acclimated to a low oxygen environment,and identification of proteins by mass spectrometry.Plant Physiology,122:295~318. /p p   11.er JA,Chakravanhy AB,Rosenbluth JM,et al.Identification of markers of taxane sensitivity using proteomic and genomic analyses of breast tumors from patients receiving neo-adjuvant paclitaxel and radiation[J].Clin Cancer Res,2010,16(2):681-690. /p p br/ /p
  • 大会报告:蛋白质组数据处理技术研究进展
    仪器信息网讯,2010年5月15日,蛋白质组数据处理暨全国生物质谱学术交流会”在云南省丽江市召开。会议为期两天,主要讨论了蛋白质组学技术和应用、数据挖掘和生物质谱等方面的现状及其进展。在所有的大会报告中,除一些关于蛋白质组学技术最新研究进展的大会特邀报告外,第一天的专家报告集中讨论了糖蛋白组的最新分析技术与研究进展,第二天的报告集中讨论了蛋白质数据处理技术,包括蛋白质组生物数据库及分析平台的构建、数据统计分析方法的研究等方面。   蛋白质组数据库被认为是蛋白质组知识的储存库,包含所有鉴定的蛋白质信息。而基于质谱技术的蛋白质组学数据分析,是识别新型生物标记物模式的有效手段。质谱仪检测的数据含有大量潜在信息,因此,建立完善的蛋白质组学数据库,开发实用性强的数据处理软件工具,以及提供良好的蛋白质组数据分析、处理方对蛋白质组学的发展至关重要。在本次大会上,中国科学院计算技术研究所贺思敏研究员、浙江大学生物医学工程与仪器科学学院段会龙教授、国防科技大学机电工程与自动化学院谢红卫教授等专家学者作了关于此方面最新研究进展的报告,本文作简要报道:   报告题目: 蛋白质组数据分析软件pFind系统新进展   报告人:中国科学院计算技术研究所贺思敏研究员 贺思敏研究员   pFind系统是中国科学院计算技术研究所自2002年开始持续研发的蛋白质组数据分析软件,可以替代同类国际主流软件,已安装在国内多家蛋白质组学重点研究单位,并在ABRF组织的国际评测以及核心岩藻糖化修饰位点鉴定等科研实战中表现出色。   贺思敏研究员在报告中首先介绍pFind系统不同于国际同类软件的核心算法设计和系统实现,然后介绍pFind系统近期在开放式修饰类型发现、高精度一级质谱分析、新型碎裂方式串联质谱分析、肽序列从头测序、标记定量分析以及并行加速系统研制等方面的进展,最后介绍了pFind系统的下一步研究设想。   报告题目:构建心血管蛋白质组生物医学数据库及分析平台   报告人:浙江大学生物医学工程与仪器科学学院段会龙教授 段会龙教授   心血管疾病是威胁人类健康的主要疾病。以高分辨率质谱技术为基础的心脏蛋白质组研究是发展心血管研究的一个重要方向。段会龙课题组通过对心血管医学和生物学、蛋白质组学和生物医学信息学的多学科交叉研究,构建了心血管生物医学数据库,重点在心血管蛋白质组数据集成、处理和分析,生物医学数据库体系构建、数据共享和发布等诸多关键技术上进行突破。   该课题组目前已完成了如下工作:   (1)心血管蛋白质组数据体系结构:构建了以蛋白质组信息为主体的数据库体系结构,以心脏线粒体蛋白质组为基础建立了核心数据集,该核心数据集包含了1663种心脏线粒体蛋白质以及与之相对应的2万7千多个生物质谱谱图。   (2)心血管蛋白质组数据库搜索引擎:初步建立了数据搜索引擎,可通过蛋白、肽段序列等信息对相应的生物质谱谱图进行检索,实现了与欧洲生物信息学研究所 (EBI) 的IPI蛋白质数据库间的数据关联。   (3)心血管生物医学数据库平台:研究和开发了相应的数据库网络公共平台。该网络平台的首个版本将在2010年末面向全世界发布,通过对心血管生物医学数据信息和资源的实时共享,服务于全世界心血管研究群体。   报告题目:大规模蛋白质组研究中的质谱数据定量分析方法   报告人:国防科技大学机电工程与自动化学院谢红卫教授 谢红卫教授   谢红卫教授利用一系列大规模定量分析的数据集,包括稳定同位素标记和进行重复实验的无标记定量数据,进行了一系列分析和研究,目前取得了很大的结果:   (1)总结了无标记和稳定同位素标记定量数据分析的典型流程,并且结合实际的数据分析结果,初步研究了各种分析流程优势和问题。   (2)针对丁来那个信息提取问题,利用重复实验数据集,比较优化了其关键步骤。   (3)利用实际实验数据,初步研究了同位素分布实验误差和质荷比误差等对定量分析参数选择有重要影响的问题。   (4)针对定量计算速度慢的问题,提出了索引文件和基于hash表的信息检索方式,将定量计算的时间缩短为原来的1/10。   (5)设计了一种可逆的色谱保留时间对齐模型,大大缩短了无标记定量数据处理中色谱保留时间对齐的计算复杂度。   (6)提出了一种以信号强度为参量的差异分布模型,能够提高差异检验的灵敏度。   (7)开发了无标记定量软件LFQuant、标记定量软件SILVER,已经无鉴定定量分析工具XICFinder。其中SILVER能够支持自定义标记方法,提供了图形化界面。LFQuant速度和定量精度等性能经过了多次优化。   报告题目:多层次蛋白质磷酸化分析中的数据处理方法研究   报告人:中国科学院大连化学物理研究所叶明亮研究员 叶明亮研究员   叶明亮研究员在报告中提到,根据研究目的的不同,蛋白质磷酸化的分析可以划分为三个层次:信号转导通路中关键节点蛋白质的磷酸化、生物体内的所有蛋白质的磷酸化(即磷酸化蛋白质组)、生物体内的所有激酶与底物的相互作用(磷酸化调控网络)。不同层次的分析有不同的目的,样品的复杂度也不同,因此需要不同的数据处理方法。   在节点蛋白质的磷酸化分析方面,为实现对某一感兴趣蛋白质中磷酸化位点的全面分析鉴定,发展了一种基于改进的目标-伪数据库用于数据检索,来高覆盖率、高可靠鉴定简单蛋白样品中的磷酸化位点信息的方法。并且从搜库耗时上,允许用多种低特异性的酶来提高简单蛋白样品的序列鉴定的覆盖度,从而更加全面的鉴定样品的磷酸化位点信息。   在磷酸化蛋白质组层次上要实现在保持较高可信度和灵敏度的情况下对海量质谱数据以及检索数据进行自动化处理。针对磷酸化蛋白质组学中磷酸化肽段鉴定难,假阳性率高,主要依赖于人工验证的现状,发展了一种结合MS2和MS3图谱以及正伪数据库检索的自动磷酸化肽段鉴定方法。该方法结合了MS2和MS3的鉴定信息,提高了磷酸化肽段鉴定的灵敏度和可信度,可以自动的对磷酸化肽段进行鉴定而无需进一步的人工验证。利用这种方法,结合磷酸肽的多维分析已经可以从人肝组织中鉴定超过8000个磷酸化位点。最近,其课题组还发展了一种基于分类筛选的磷酸化肽段鉴定方法,该方法结合了MS2/MS3方法的高可信度,并且考虑了部分不易发生中性丢失的磷酸化肽段的鉴定,进一步提高了磷酸化肽段鉴定的灵敏度。   在磷酸化调控网络层次主要是揭示激酶与底物蛋白质上磷酸化位点的对应关系,叶明亮研究员表示,这是该课题组今后研究的一个重要方向,目前已经在与合作者利用生物信息学的方法模拟构建磷酸化网络图。
  • DeepMind遇上对手? Meta AI预测6亿蛋白质结构
    ESM宏基因组图谱数据库包含6.17亿个蛋白质的结构预测。(图片来源:ESM宏基因组图谱)  英国人工智能(AI)公司DeepMind今年公布了2.2亿个蛋白质的预测结构,几乎涵盖了DNA数据库中已知生物的所有蛋白质。现在,另一个科技巨头正在填补蛋白质宇宙中的暗物质。  美国Meta公司(前身为Facebook)的研究人员使用人工智能预测了约6亿个蛋白质的结构,这些蛋白质来自细菌、病毒和其他尚未被表征的微生物。相关研究11月1日发表于预印本网站BioRxiv。  “这些是非常神秘的蛋白质,为深入了解生物学提供了可能性。”Meta人工智能蛋白质团队研究负责人Alexander Rives说。  该团队使用“大型语言模型”生成了这些预测。“大型语言模型”是一种人工智能,可作为通过几个字母或单词预测文本的工具的基础。  通常语言模型是在大量文本的基础上进行训练的。为了将其应用于蛋白质,Rives团队将已知蛋白质序列“喂”给它们,这些蛋白质由20个不同的氨基酸链表示,每个氨基酸链由一个字母表示。然后,该模型学会了在氨基酸比例模糊的情况下“自动补全”蛋白质。  Rives说,这种训练使模型对蛋白质序列有了直观的理解,蛋白质序列包含了蛋白质形状的信息。  第二步,受DeepMind开创性蛋白质结构人工智能算法AlphaFold的启发,模型将这种洞察力与已知蛋白质结构和序列之间关系的信息相结合,从蛋白质序列中生成预测结构。  今年夏天早些时候,Rives团队报告称,其模型算法名为ESMFold,虽准确性不如AlphaFold,但在预测结构方面要快60倍左右。“这意味着我们可以将结构预测扩展到更大的数据库中。”Rives说。  作为一个测试案例,研究团队决定将模型应用于大规模测序的“宏基因组”DNA数据库,这些DNA来自环境,包括土壤、海水、人类肠道、皮肤和其他微生物栖息地。绝大多数编码潜在蛋白质的DNA条目来自从未被培养过的生物,也不为科学家所知。  Meta团队总共预测了超过6.17亿个蛋白质的结构,这项工作只花了两周时间。Rives表示,预测是免费的,任何人都可以使用,就像模型的底层代码一样。  在这6.17亿个蛋白质结构中,该模型认为超过1/3的预测是高质量的,因此研究人员可以确信蛋白质的整体形状是正确的,在某些情况下,模型可以识别更精细的原子级细节。值得一提的是,其中数以百万计的结构都是全新的,与实验确定的蛋白质结构数据库,或从已知生物体预测的AlphaFold数据库中的结构都不同。  AlphaFold数据库的很大一部分是由几乎相同的结构组成,而宏基因组数据库则涵盖了以前从未见过的蛋白质宇宙的很大一部分。  哈佛大学进化生物学家Sergey Ovchinnikov对ESMFold做出的数亿个预测表示怀疑。他认为,有些蛋白质可能缺乏确定的结构,而另一些可能是非编码DNA,被误认为是蛋白质编码材料。  德国慕尼黑工业大学计算生物学家Burkhard Rost对Meta公司模型的速度和准确性的结合印象深刻。但他质疑,宏基因组数据库预测蛋白质是否真的比AlphaFold的精确度更高。基于语言模型的预测方法,更适合快速确定突变如何改变蛋白质结构,这是AlphaFold无法做到的。  据DeepMind的一位代表说,该公司目前没有在其数据库中进行宏基因组结构预测的计划,但不排除在未来这样做的可能性。  韩国首尔国立大学计算生物学家Martin Steinegger认为,利用这类工具的下一步,显然是研究生物学中的暗物质。“这些宏基因组结构的分析很快就会出现爆炸式增长。”  相关论文信息:  https://doi.org/10.1101/2022.07.20.500902
  • 蛋白质组学全球市场已达500亿美元
    01 摘要蛋白质组学目前的研究活动的成长与基因组学早期的发展轨迹相似。基因组学花费了大概十年的时间实现了产业化。尽管蛋白质组学技术起步的时间比基因组学更早,但蛋白质组学相对更大的复杂性导致其与基因组学相比需要更先进的技术。然而,今天,蛋白质组学的重要研究瓶颈正在被不断突破,让科学家们看到了其在研究、转化和临床意义上达到与基因组学相当的水平的前景。因此,随着时间的推移,蛋白质组学在研究和临床中应用的商业机会将与基因组学的可用市场总量(TAM)规模趋于一致,目前全球TAM已经达到500亿美元。并且我们有理由相信,由于蛋白质组学动态、变化的性质将使得其超过基因组学而转化为更加具有经常性、重复性的临床应用。质谱是最能促进蛋白质组学工业化的技术,但其工作流程的标准化,尤其是样品制备阶段的标准化,仍然存在着挑战。对于长期投资商来说,应该对在这个生态圈中拥有于众不同知识产权的供应商给与更大的关注。尽管以基于高元多工分析方法为代表的新兴检测方法与质谱方法相比仅处于早期发展阶段,但也具有巨大的潜力。02 背景与投资情况论述生命的基本构成部分是核酸和氨基酸。核酸是基因的基本构成成分。氨基酸是蛋白质的基本构成成分。事实上,我们体内每个细胞的成分都可以归类于蛋白质、基因、脂质或碳水化合物这四类大分子化合物。脂质和碳水化合物组成简单不易出错。因此,最重要的是对基因和蛋白质进行深入了解。我们对人类生物学的理解,从细胞功能到疾病的因果关系,再到药物治疗,都是我们对基因组学和蛋白质组学知识的衍生品。在20世纪,先进显微镜和生物化学技术的发明导致我们对基于结构的蛋白质和基因的理解有了很大的进步。在21世纪,基因组学经历了一场革命,使其从一个刚刚起步的研究领域经历了工业化的过程,成为了临床生物学重要方面。这不仅使得人类对生物学有了更深更新的了解,也提供了包括液体活检诊断,CAR-T细胞治疗,甚至是mRNA疫苗的一系列新的临床治疗及诊断方法。蛋白质组学在21世纪也取得了重要进展。这不仅是由于质谱和X射线晶体学等成像方面新技术的出现,也是由于免疫检定试剂方面的生物化学方法创新,使得我们可以分离特定的蛋白进行进一步的研究。与基因组学相比,蛋白质组学还未取得飞跃。这并不是由于它相对于基因学的有较小的前景和应用场景,这只与它的方法的复杂性有关。我们认为,下一个十年蛋白质组学将进入快车道,使生物学研究、医学治疗和诊断方面进入一个以蛋白质为中心的新时代。蛋白质组学的挑战。超过95%的获得FDA批准的药物都是以蛋白质为目标,但蛋白质组中的多数组分却尚未被人们所了解。我们相信,十年后,西方国家的蛋白质组学公司所创造的股权价值将与今天基于基因组学的公司所创造的约2500亿美元的市值相当或更多。创新的速度正在加快:在1869年由弗里德里希-米歇尔(Friedrich Miescher)发现核酸之后近85年才由沃森和克里克于1953年发现了DNA双螺旋。从沃森和克里克的发现到2001年第一个人类基因组序列的发表花费了近50年时间。从2001年人类基因组的第一份草图到2021年7月公布的第一份完整序列花费了20年时间。总而言之,从核酸发现到确定完整的人类基因组花费了近155年的时间。在接下来的155年里,创新的速度将呈指数型增长,而蛋白质组学将是其中最大的受益者。03 蛋白质组学的今天:挑战与机遇什么是蛋白质组学?它为什么重要?图一:蛋白质组学受益于多种技术跨越式进步蛋白质组学作为一个术语首次出现在1996年,它被定义为对一个细胞系的整个蛋白质图谱进行大规模表征。蛋白质组学的要点是完整性和深度:通过检测和解读该细胞中的所有蛋白质的作用以及相互作用来彻底了解细胞功能,而不是应用传统的通过抗体分离已知蛋白质的方法单独检测每个蛋白质。基于抗体的蛋白质检测将继续在后续的工作中得到应用,但蛋白质组学是针对所有蛋白质,它们的相互作用,及其多种形态的大规模、高通量、高灵敏度的分析。因为蛋白质修饰和相互作用出错是发生疾病的通常原因,蛋白质组学研究对理解造成疾病发生的原因非常重要,Source: Graves PR, Haystead TA., Molecular biologist’s Guide to Proteomics(2002)04 蛋白质组学和基因组学之间的关系是什么?当马克-威尔金斯(Mark Wilkins)在1996年首次使用蛋白质组学一词时,他明确表示他指的是“基因组的补充”。基因是细胞的说明书。通过RNA的表达,他们指示细胞要构建哪些蛋白质。蛋白质细胞构建之后,它们通过与其他蛋白质和环境的相互作用而被翻译和修饰。因此,1) 基因组学的大部分功能效用通过蛋白质组体现;2) 下游事件-包括蛋白质间的相互作用,新的蛋白质形态和动态修饰的产生,及其对细胞分裂的影响-是蛋白质组学而不是基因组学的主题。Source: Virag D, Dalmadi K B. Current Trends in the Analysis of Post-translational Modifications (2020)因此,基因组学和蛋白质组学是相互关联的,而不是分开的,但蛋白质组学在功能上更为重要及复杂。有25000个独立的基因,但有超过100万种蛋白形式。虽然一个人的基因组不会改变,但一个人的蛋白质组是动态的。身体里的变化是通过蛋白质的修饰来表达的。你出生时的基因组和今天一样。但你的蛋白质组每天都在变化。05 为什么蛋白质组学研究如此困难?1. 分子的复杂性和多样性Source: Creative-Proteomics.com蛋白质分子本身的分子结构更为复杂。DNA是由4种核苷酸组成的,而蛋白质是由20种不同的氨基酸组成的。翻译后修饰,如甲基化和羟基化,改变了蛋白质的形态和功能。每个蛋白质可以有9种不同的蛋白形式。取决于翻译后修饰和蛋白质间的相互作用。这意味着同一个蛋白质可以有9种不同的功能。DNA的分子结构相对简单,有4种核苷酸变体,这意味着基因测序方法(如合成测序)不能应用于蛋白质组。需要新的、更复杂的、定制的方法来捕获生物样本中数百万种不同的蛋白质形态。2. 动态范围问题Source: Montanaro Research Aebersold R., Targeted Proteomic Strategy for Clinical Biomarker Discovery (2009)Y轴表示血浆样品中特定蛋白质分子的浓度和丰度。虽然有些蛋白质的含量极高,但大多数蛋白质类型的浓度很小,甚至可以忽略不计。红圈中的蛋白质存在于蛋白质组的“黑暗角落”,在这种极低的丰度下,这些蛋白质非常难以测得。大多数蛋白质的丰度极低。在血浆细胞中发现的约12,000个独立的蛋白质中,前10个占总蛋白量的90%,而其他约11,990个仅占10%。3. 少数的暴政如下饼图显示了血浆样品中蛋白质的相对丰度。单一的一种蛋白质,即血浆白蛋白,占了57%的总丰度,使读取其余的1万种蛋白质更加困难。Source: Anderson NG., Molecular Cell Proteomics (2002)06 蛋白质组学市场机遇有多大?我们相信,蛋白质组学在分子生物学研究以及临床医学和诊断方面有与基因组学一样远大的前景。Source: Montanaro Research自2001年第一个人类基因组的组装以来,基因组学已经成为生物医学的一个工业化部分, 纯基因组学公司的总市值达到2400亿美元。Illumina是其中最大的公司。蛋白质组学TAM(可用市场总量)如今已经达到数百亿美元。Somalogic estimate the total TAM to be $50 bn (Source: Somalogic)虽然临床应用方面的TAM具有最大的长期潜力,但在未来5年内研究和发展方面的TAM是最容易解决的。Source: Souda P., Proteomics: The Next Frontier, SVB Leerink (2021)SVB Leerink的蛋白质组学专家Puneet Souda估计,目前仅美国的研发TAM 有140亿美元,这基于学术界和制药业共约 26,100 个实验室总经费的2.5%的保守估计。如果我们把西方国家的实验室数量看作是约50,000个,并更合理的假设占总经费的5%的资金分配给蛋白质组学研究,我们估计在全球发达经济体中的蛋白质组学研发TAM为500亿美元。
  • 蛋白质结构预测哪家强?两大国际团队同日在顶刊开源代码
    蛋白质是生命的物质基础,每个蛋白质的氨基酸链扭曲、折叠、缠绕成复杂的结构,想要破解这种结构通常需要花很长的时间,甚至难以完成。截至目前,约有10万个蛋白质的结构已经用实验方法得到了解析,但这在已经测序的数10亿计的蛋白质中只占了很小一部分。  但“看清”蛋白的结构和人类的很多疾病机理、药物研发等等息息相关。在蛋白质结构解析的几十年历史中,X射线晶体学、核磁共振波谱学(NMR)、冷冻电镜(Cryo-SEM)技术纷纷发挥了巨大的贡献,但这些技术在科学界看来,都有着劳心劳力又价格高昂的缺点。  如何简单地通过蛋白质的氨基酸序列来预测其形状?如何能解答这一问题,了解生命运作方式的将打开截然不同的一扇窗。这种设想提出的50多年后,谷歌旗下人工智能公司DeepMind在去年12月的国际蛋白质结构预测竞赛CASP上投下重磅,他们开发的基于神经网络的新模型AlphaFold2击败了其他选手,在预测准确性方面达到接近人类实验结果,让整个结构生物学界震惊。北京时间7月15日,DeepMind团队在顶级学术期刊《自然》(Nature)以“加快评审文章”(Accelerated Article Preview)形式在线发表了一篇题为“Highly accurate protein structure prediction with AlphaFold”的论文,全面详述了半年前造成轰动的这一模型,并首次对外分享开源代码。该论文于今年5月11日提交,7月12日被接收。  DeepMind团队提供了一份声明,公司创始人兼首席执行官Demis Hassabis在声明中表示,去年在CASP14大会上我们揭晓了一个可以将蛋白质3D结构预测精确到原子水平的全新AlphaFold系统,此后我们承诺会分享我们的方法,并为科学共同体提供广泛、免费的获取途径。  “今天我们迈出了承诺的第一步,在《自然》期刊上分享AlphaFold的开源代码,并发表了系统的完整方法论,详尽细致说明AlphaFold是如何做到精确预测蛋白质3D结构的。作为一家致力于推动科学进步的公司,我们期待看到我们的方法将为科学界启发出什么其他新的研究方法,也期待很快能和大家分享更多我们的新进展。”Hassabis表示。值得一提的是,就在同一天,另一顶级期刊《科学》(Science)也在线发表了另一预测蛋白质结构的研究文章,题为“Accurate prediction of protein structures and interactions using a three-track neural network”。  来自华盛顿大学、哈佛大学、德克萨斯大学西南医学中心等团队的研究人员开发了新的深度学习工具RoseTTAFold,其拥有媲美AlphaFold2的蛋白质结构预测超高准确度,而且更快、所需计算机处理能力更低。同样,研究团队也对外分享了开源代码。该论文提交于6月7日,7月7日被接收。  清华大学生命科学学院院长、高精尖中心执行主任王宏伟表示,“高质量结构预测的源代码开放对整个科学界尤其是结构生物学领域的促进作用必然是巨大的。”他评价道,对于DeepMind这样一家商业公司来说,“团队愿意向公众分享代码,是一个新型科研范式的突破,将整体上有利于人类更好地探索未知。”  预测蛋白质结构,接近实验室测量  50多年前,科学家们就设想用计算机预测蛋白质结构。近年来,共同演化、接触图预测、深度机器学习等技术的引入,一些实验室的算法精度有了很大程度的提高。  曾经开发出Alphago、战胜人类顶尖棋手的DeepMind团队是其中的佼佼者,其团队的强大和资源雄厚是一般实验室无法企及的。2020年12月1日,他们在生物领域展现出实力,在两年一度的权威蛋白质结构预测评估竞赛(CASP)中用AlphaFold2击败其他参赛团队。  CASP是由马里兰大学John Moult教授等人于1994年组织。竞赛使用的是最新解决且尚未在蛋白质数据库(PDB)中存放或公开披露的结构,结构生物学家们利用X射线晶体学、核磁共振波谱学、冷冻电镜的方法,把这些蛋白质的结构解析出来。做蛋白质结构预测的团队则利用计算机程序来预测它们的结构。最后由独立的科学家团队则把计算机预测的模型和实验室的结构对照,分析不同计算机算法的预测结果。这是一种“双盲”测试,长期以来一直是评价结构预测准确性的金标准。  去年的CASP14共有84个常规题目,其中有14题因为生物实验没给出确定结构等原因被取消或延缓,其他70个题目的单体和复合物蛋白质所含有的氨基酸个数从73到2180不等。  19个国家的215个小组参加了CASP14。DeepMind公司的AlphaFold2预测的大部分结构达到了空前的准确度,不仅与实验方法不相上下,还远超解析新蛋白质结构的其他方法。将实验方法得到的蛋白质结构叠加在AlphaFold2的结构上,组成蛋白质主链骨架的叠加原子之间的距离中位数(95%的覆盖率)为0.96埃(0.096纳米)。成绩排第二的方法只能达到2.8埃的准确度。  AlphaFold2的神经网络能在几分钟内预测出一个典型蛋白质的结构,还能预测较大蛋白质(比如一个含有2180个氨基酸、无同源结构的蛋白质)的结构。该模型能根据每个氨基酸对其预测可靠性进行精确预估,方便研究人员使用其预测结果。  AlphaFold2最终被Moult评价道,“在某种意义上,问题已经解决了”。  值得一提的是,在最新发布的论文中,DeepMind还简化了AlphaFold2。AlphaFold的首席研究员John Jumper说,“这个网络需要几天的计算时间来生成CASP的一些蛋白质的结构,而开源版本的速度要快16倍。根据蛋白质的大小,它可以在几分钟到几小时内生成结构。”  受AlphaFold2的启发,华盛顿大学医学院生物化学家、蛋白质设计研究所所长David Baker等人开发了RoseTTaFold。华盛顿大学医学院官网对该研究的介绍称,在高精度的蛋白质结构预测方面,Baker等人“在很大程度上重现了DeepMind团队的表现。”  相较于AlphaFold2只解决了单个蛋白质的结构,RoseTTaFold不仅适用于简单的蛋白质,也适用于蛋白质复合物。据介绍,RoseTTaFold利用深度学习技术,根据有限信息准确、快速地预测蛋白质结构。从结构上来看,RoseTTAFold 是一个三轨(three-track)神经网络,它可以兼顾蛋白质序列的模式、氨基酸如何相互作用以及蛋白质可能的三维结构。在这种结构中,一维、二维、三维信息来回流动,使得网络能够集中推理蛋白质的化学部分与它的折叠结构。巴塞尔大学的计算结构生物学家Torsten Schwede对《科学》杂志说,许多生物功能依赖于蛋白质之间的相互作用。“直接从序列信息中处理蛋白质-蛋白质复合物的能力使其对生物医学研究中的许多问题极具吸引力。”  Baker同时坦言,AlphaFold2的结构更加准确。但是根特大学的结构生物学家Savvas Savvides说,Bake实验室的方法更好地捕捉到了“蛋白质结构的本质和特性”,比如识别从蛋白质侧面伸出的原子串,这些特征是蛋白质之间相互作用的关键。  纽约大学医学院的细胞和结构生物学家Gira Bhabha说,两种方法都很有效。她表示,“DeepMind和Baker实验室的进展都是惊人的,将改变我们利用蛋白质结构预测推进生物学的方式。”  开源代码,如何促进整个科学界?  相比于去年年底带来的震撼,这次外界更感兴趣的是上述两支团队开源代码这一动作。  此前的6月中旬,在Baker实验室发布RoseTTAFold预印本三天之后,DeepMind的Hassabis在推特上表示,AlphaFold2的细节正在接受一份出版物的审查,公司将“为科学界提供广泛的免费访问”。  而从6月1日开始,Baker等人已经开始挑战他们的方法,让研究人员发送来他们最令人困惑的蛋白质序列。加州大学旧金山分校的结构生物物理学家David Agard的研究小组发送了一组没有已知类似蛋白质的氨基酸序列,几个小时内,他的团队就得到了一个蛋白质模型,“这可能为我们节省了一年的工作。”Agard说。  除了免费提供RoseTTaFold的代码外,Baker团队还建立了一个服务器,研究人员可以插入蛋白质序列并得到预测的结构。贝克说,自从上个月推出以来,该服务器已经预测了大约500人提交的5000多种蛋白质的结构。  不过,上述两支团队的源代码都是免费的,但也有观点认为,对于没有技术专长的研究人员来说,它可能还不是特别有用。不过,DeepMind的科学人工智能负责人Pushmeet Kohli表示,DeepMind已经与一些选定的研究人员和组织合作,以预测特定的目标,其中包括总部位于瑞士日内瓦的非营利组织“Drugs for ignored Diseases”。“在这个领域,我们还有很多想做的事情。”  Hassabis提到,去年在CASP14大会上我们揭晓了一个可以将蛋白质3D结构预测精确到原子水平的全新AlphaFold系统,此后我们承诺会分享我们的方法,并为科学共同体提供广泛、免费的获取途径。“今天我们迈出了承诺的第一步,在《自然》期刊上分享AlphaFold的开源代码,并发表了系统的完整方法论,详尽细致说明AlphaFold是如何做到精确预测蛋白质3D结构的。作为一家致力于推动科学进步的公司,我们期待看到我们的方法将为科学界启发出什么其他新的研究方法,也期待很快能和大家分享更多我们的新进展。”  DeepMind团队认为,这一精准的预测算法可以让蛋白质结构解析技术跟上基因组革命的发展步伐。  Baker团队也提到,“我们希望这个新工具将继续造福整个研究界。”  中国科学院合肥物质科学研究院强磁场科学中心研究员谢灿对澎湃新闻(www.thepaper.cn)记者表示,“总的来说,对学术界来肯定是好事,肯定会促进结构生物学和相关领域的发展。在承认学术贡献的基础上的开放和共享,本来就应该是学术研究最基本的要求。”  结构生物学是谢灿的“老本行”,“我当年花了8年的时间去解析一个蛋白的晶体结构,我能切身体会如果有一个精准预测蛋白结构的算法出现,对结构生物学家意味着什么。”  但他认为,不必要担忧这些算法的出现会让结构生物学家失业,在技术迭代之下,结构生物学这些年受到的冲击太多了,“而事实上,只不过是某一个领域某一个技术在某一个历史阶段更容易出工作出成绩。”谢灿认为,无论再精准的预测,终究也只是预测,“AlphaFold2不是实验,同样也需要实验去证实。”  王宏伟在AlphaFold2刚出现之时也曾评价道,对于复杂的结构生物学问题,预测手段本身还不能号称完全解决了问题。实验结构生物学领域接下来需要做的一个事情是要拥抱变化,更好地与预测方法结合以及共同发展。
  • 三问中国人类蛋白质组计划
    前不久,历经多年论证、被誉为我国生命科学研究领域里程碑事件的中国人类蛋白质组计划(简称CNHPP)正式在京启动,来自清华大学、北京大学、中国科学院、军事医学科学院、解放军总医院、复旦大学等40多所高校、科研机构的近百名专家,共同见证了这一历史性时刻。 蛋白质组计划和基因组计划有何不同?中国的蛋白质组研究在国际上处于什么位置?中国人类蛋白质组计划将如何进行? 围绕上述问题,人民日报记者独家采访了有关专家。 一问 为什么要搞中国人类蛋白质组计划? 生,源于基因组;命,却一定由蛋白质组决定。只有蛋白质组才能从根本上阐释生命 相比&ldquo 蛋白质组&rdquo ,&ldquo 蛋白质&rdquo 一词更为人们所熟知。它是生物体内一种极为重要的高分子有机物,占人体干重的54%,1838年由荷兰科学家格里特首先发现。 基于此,1994年,澳大利亚科学家率先提出&ldquo 蛋白质组&rdquo ,意指某个时刻,某个组织、器官或个体中所有蛋白质的集合,是一个整体的概念。 科学家们之所以对蛋白质组产生浓厚兴趣,还得从人类基因组计划说起。2003年4月,经由6国科学家历时13年奋战的人类基因组计划画上了句号。 &ldquo 科学界曾经认为,只要绘制出人类基因组序列图,就能了解疾病的根源。但我们错了。&ldquo 国际蛋白质组组织首任主席萨姆 哈纳什说,事实上,我们只了解10%基因的功能,剩下的90%仍是未知的。 &ldquo 人们总以为蛋白质组计划是基因组计划的附庸或者说是子产品,这也是一个误区。人类基因组计划并不像事前所预期的那样,能够逾越蛋白质这一生物功能去揭示人类 生、老、病、死的全部秘密,基因组序列只是提供了一维遗传信息,而更复杂的多维信息则发生在蛋白质组层面。&rdquo 国际人类蛋白质组计划执委、亚太蛋白质组组织 主席、中国科学院院士贺福初说,基因组和蛋白质组的关系,好比词典与文章、元素表与化工厂。 &ldquo 基因组学中微小的差异,在蛋白质组学中可以被千倍甚至近万倍地放大,想要解密基因组,必须先系统认识蛋白质组。&rdquo 贺福初认为。 他举例说,人体各个器官如耳、鼻、喉、心、肝、肺,其基因组完全相同,不同的是蛋白质组。因此,不同器官形态、功能各异,是蛋白质组在背后&ldquo 操盘&rdquo 。 &ldquo 就 像蛹化蝶,无论形态如何变化,基因组是不变的。&rdquo 军事医学科学院放射与辐射医学研究所研究员钱小红这样比喻。在她看来,人的每一种生命形态,都是特定蛋白 质组在不同时间、空间出现并发挥功能的结果。比如,某些蛋白质表达量偏离常态的高或低,就能够表征人体可能处于某种疾病状态。 &ldquo 生,源于基 因组;命,却一定由蛋白质组决定。只有蛋白质组才能从根本上阐释生命。&rdquo 贺福初进一步解释道,&ldquo 蛋白质组,可以揭示疾病的发病机制和病理过程,发现新型诊 断标志物、治疗和创新药物,可以全面提高疾病防诊治水平。这个项目如完成,将揭示人体器官蛋白质组的构成,一旦哪一部位出现异常即可实现&lsquo GPS定位&rsquo , 进而找到针对性的诊断措施、干预措施和预防措施。&rdquo 二问 中国能搞人类蛋白质组计划吗? 以贺福初院士为代表的中国蛋白质组研究团队,在该领域向世界交上了一份漂亮的答卷,在某些方面已走在全球前列 近代以来,中国先后错过了多次世界科技革命的机遇。蛋白质组学研究,恰恰是我国生命科学中少数几个能够始终跻身世界前沿的科学领域。 据专家介绍,中国人类蛋白质组事业的发展,也催生了一系列大型研究基地和覆盖全国的协作网络。据不完全统计,目前包括中科院、教育部、卫生计生委、军队以及 湖南、广东、重庆、浙江等在内的省部级重点实验室已超过10个。由贺福初院士发起,以军事医学科学院、清华、北大为代表的7家单位共同筹建的北京蛋白质组 研究中心,于2005年被确立为&ldquo 人类肝脏蛋白质组计划&rdquo 国际执行总部,成为一座世界级的&ldquo 生命之都&rdquo 。 此外,自2000年至2010年,中国累计发表论文2800多篇,位列全球该领域第四。值得一提的是,最近4年,中国在该领域发文量直线上升,历史性地达到1000多篇,年度论文发表数已跃居世界第二(第一为美国),位居全国其他学科前列。 历经十余年的努力,中国蛋白质组研究团队向世界交上了一份漂亮的答卷:成功构建迄今国际上质量最高、规模最大的人类第一个器官&mdash &mdash 肝脏蛋白质组的表达谱、修 饰谱、连锁图及其综合数据库;首次实现人类组织与器官转录组和蛋白质组的全面对接;在炎症诱发肿瘤等方面,发现一批针对肝脏疾病、恶性肿瘤等重大疾病的潜 在药靶、蛋白质药物和生物标志物。如,2008年,张学敏课题组首次发现炎症和免疫的新型调控分子CUEDC2,可作为肿瘤耐药的新标志物,从而为克服癌 细胞耐药提供了原创性的药物新靶点和治疗新思路。2010年,周钢桥课题组&ldquo 逮到&rdquo 肝癌的易感基因,为肝癌的风险预测和早期预警提供了重要理论依据和生物 标记&hellip &hellip 上述几项成果均发表于国际顶级的《科学》《自然》系列杂志。 三问 中国人类蛋白质组计划怎样进行? 将分三个阶段进行,计划产生的大数据将全景式地揭示人体蛋白质组成及其调控规律,解读人类基因组这部&ldquo 天书&rdquo 世界蛋白质组学领域内的新一轮科技竞赛已开始。中科院院士张玉奎指出,虽然中国在蛋白质组一些领域走在了世界前列,但国外有些团队如今正快马加鞭。这警醒我们:必须加快步伐,否则很快将被甩出第一阵营。 &ldquo 逆水行舟不进则退,我们绝不能丧失已经取得的优势。&rdquo 贺福初说。 据悉,中国人类蛋白质组计划将分三个阶段展开。第一阶段,全面揭示肝癌、肺癌、白血病、肾病等十大疾病所涉及主要的组织器官的蛋白质组,了解疾病发生的主要 异常,进而研制诊断试剂、筛选药物,力争2017年左右完成;第二阶段,争取覆盖中国人的其他常见疾病,提升中国人群疾病的防治水平;第三阶段,实现人类 更多疾病的覆盖。 当前,全球每年产生的生物数据总量高达EB级(10的18次方比特),生命科学领域正在爆发数据革命。生物数据最大的是基因组数据,它完成后,蛋白质组数据 无疑将成为更大、更重要和更核心的科学数据。我国已部署建设的蛋白质科学基础设施将相继投入运行,这是国际上最大的蛋白质组学研究基地,将有力支撑和推动 中国人类蛋白质组计划的实施和大数据的产生。中国人类蛋白质组计划产生的大数据将全景式地揭示人体蛋白质组成及其调控规律,解读人类基因组这部&ldquo 天书&rdquo 。 &ldquo 这 项计划,是以中国重大疾病的防治需求为牵引,发展蛋白质组研究相关设备及关键技术,绘制人类蛋白质组生理和病理精细图谱、构建人类蛋白质组&lsquo 百科全书&rsquo , 为提高重大疾病防诊治水平提供有效手段和中国生物医药产业发展提供原动力。&rdquo 贺福初说,&ldquo 我们首先看重科学价值,其次才是经济效益,因为这是真正的原始创 新,是中国能够引领世界科技发展的重要领域之一。&rdquo
  • 首届中国计算蛋白质组学研讨会在京召开
    蛋白质组学的兴起带动了质谱技术的快速发展,而质谱技术的进步则拓宽了蛋白质组学研究问题的广度。随着蛋白质组学的兴起,特别是质谱技术的快速发展,蛋白质组学研究中产生的数据规模越来越大。依靠简单的手工处理已经远远不能满足问题的需求,通过先进的计算机算法与软件工具来自动处理大批量的蛋白质组数据已经成为蛋白质组学研究的重要分支,这就是“计算蛋白质组学”(Computational Proteomics)。   仪器信息网讯 为了总结交流近年来我国计算蛋白质组学领域的基础研究与前沿动向,推动计算技术在蛋白质组研究中发挥更加切实的作用,2010年11月10-11日,由中国科学院计算技术研究所主办的“首届中国计算蛋白质组学研讨会”在北京中国科学院计算技术研究所召开。来自全国高等院校、科研机构、企事业单位的150余位从事计算蛋白质组学及其相关研究的专家学者参加了此次会议。 会议现场   会议主办方代表贺思敏研究员在会上表示:一般来说,计算蛋白质组学以计算技术为主要手段,是基于质谱技术的规模化蛋白质表达分析,也包括结构与功能的高通量分析。近年来,随着“精密蛋白质组学”概念和LTQ Orbitrap等技术的诞生,计算蛋白质组学的的研究发展迅速。   从2005年开始美国相继举办了3次蛋白质组学研讨会,欧洲也陆续开展了3次蛋白质组学研讨会,其他国家会议也相继设立蛋白质组学的专题会议。同时,国际上专业的学术期刊也相继刊载了蛋白质组学的综述文章,这标志着计算蛋白质组学已经取得了学术界的普遍重视,首届中国计算蛋白质组学研讨会也正是应运而生。   在我国,一些从事生化领域研究的专家几乎从不“上岸”,而部分毕业于信息领域的专家又从不“下水”,当然也存在着一批学者教授属于“两栖”作战,这样的研究现状不利于计算蛋白质研究的快速发展,因此,本次研讨会也是为了促进计算技术与生化领域的专家交流沟通。 中国科学院计算技术研究所贺思敏研究员   同时,大会还邀请了20多位计算蛋白质领域的著名专家学者做了精彩的学术报告,报告内容涉及质谱数据分析、蛋白质鉴定、翻译后修饰、蛋白质定量、蛋白质相互作用、蛋白质定位、蛋白质结构、蛋白基因组学等。 上海复旦大学杨芃原教授 报告题目:糖蛋白结构的质谱数据库   目前,通过各种技术构建专业性强、针对性明显的糖链结构数据库已经引起了关注。杨芃原教授的研究基于生物质谱的数据分析,建立了蛋白质糖基化位点以及糖链结构数据库。并开发了一套糖蛋白鉴定和糖链结构确立的理论算法,并将理论算法在我们创建的软件GRIP(Glycopeptide Reveal & Interpretation Platform)中全部实现。分析表明,该方法可有效进行通量化的糖蛋白结构质谱分析,展现了比较好的应用前景。 加拿大西安大略大学张凯中教授 报告题目:利用串联质谱技术解析多糖结构   张凯中教授主要介绍了生命科学中蛋白糖结构及其和串联质谱与计算机科学的关系。张凯中教授表示,蛋白质中糖结构的变化是一种重要的蛋白质转录后修饰;蛋白质被酶处理后,经色谱分离,可用串联质谱解析其多糖结构。基于糖肽序列从头测序算法,张教授通过分析花生类蛋白质中的多糖结构得到了一种多项式时间算法简单模型,实践表明,该方法更具启发性。 美国加州大学旧金山分校关慎恒教授 报告题目:利用稳定同位素代谢标记研究哺乳动物动态蛋白质组的数据处理平台   据关慎恒教授介绍,放射性同位素标记与稳定同位素标记是目前用于研究蛋白周转的主要工具。关慎恒教授利用稳定同位素代谢标记,通过测量小数组织中的1000多个蛋白的代谢常数,建立了复杂生物体系蛋白代谢周转组动力学的试验和信息处理平台。通过此平台,可以处理无标定量、SILAC。氢氘交换的实验数据。 华大基因张勇先生 报告题目:从新一代测序技术的组学到基于质谱仪的蛋白质组学--华大基因的生物信息学   张勇先生介绍到,对于海量数据的信息分析和挖掘成为华大基因立足世界基因组领域的根本。除了测序仪,质谱仪无疑成为蛋白质组领域的高通量仪器。目前,华大基因通过利用海量数据的信息学分析从而识别关键要素,发挥了高通量、低成本的仪器特性。华大基因也逐步从 DNA、RNA水平,向蛋白质水平研究发展。。 加拿大滑铁卢大学马斌教授 报告题目:利用质谱和同源数据库进行全蛋白测序   马斌教授首先谈到了,蛋白质数据库搜索和传统同源查找时遇到的问题,并分别给出了“分两步走”和“兼听则明”的两个解决办法。另外,串联质谱(MS/MS)的在该领域的应用仍然是一个非常具有挑战性的问题。马斌教授提出了一种新算法和自动化软件(CHAMPS),实验表明,该方法具有大于99%的序列覆盖率和100%的蛋白质序列准确性。 中科院计算所孙瑞祥副研究员 报告题目:电子转运裂解质谱特征及其在蛋白质鉴定中的应用   孙瑞祥研究员指出,近10年内,肽段或完整蛋白质在质谱仪中的裂解技术-电子捕获裂解(ECD)与电子转运裂解(ETD)逐渐发展起来。其中,目前市场上ETD主流仪器的供应商主要有赛默飞世尔、布鲁克、安捷伦、ABI、日立等公司。ECD和ETD在蛋白质组学中的应用,特别是在蛋白质的翻译后修饰鉴定和“自顶而下”的完整蛋白质裂解研究中已经展示出了诱人的前景。 中科院大连化学物理研究所叶明亮研究员 报告题目:基于质谱的蛋白质组学数据处理新方法和平台发展   叶明亮研究员介绍到,在蛋白质组学数据处理方法和平台方面分别发展了针对非修饰肽段和磷酸化肽段鉴定的数据筛选方法。此外,还发展了一种结合二级质谱(MS2)和三级质谱(MS3)图谱以及正伪数据库检索的自动磷酸化肽段鉴定方法。该方法结合了MS2和MS3的高灵敏度和可信度,可以自动的对磷酸化肽段进行鉴定而无需进一步的人工验证。 参会者合影留念   另外,为了使参会人员能够获得有关蛋白质组质谱数据分析的基本技能,同时了解到本学科发展的最新动态,本次会议还安排了质谱技术与蛋白质组学基础培训,共有72人注册参加了此次培训课程,培训现场提问的听众络绎不绝,气氛十分活跃。 培训人员与专家交流探讨
  • Thermo蛋白质组学解决方案在高端心血管研究中的应用
    本文将讨论伦敦国王学院采用的蛋白质组学解决方案在先进的心血管研究中的重要性。 引言 蛋白质组学是对蛋白质的大范围分析,被认为是生物系统研究的下一趋势。尽管干细胞疗法对于再生医学和组织工程具有很大的潜力,但是干细胞如何分化为心血管系统细胞的机理仍不明晰。很多以往的研究着重于基因表达,但是蛋白质组学能够在超越基因水平上通过对蛋白质改性的研究推进对干细胞分化的认识。 高端蛋白质组学解决方案的出现使得研究者可以揭示干细胞分化的新认识,这一点通过传统技术无法获得。该方法的应用可能引出治疗和治愈心血管疾病的新方法。 研究进展 伦敦国王学院James Black中心的心血管蛋白质组学研究团体(The Vascular Proteomics Group)正进行蛋白质组学的最新研究。该团体具有包括基因组学、蛋白质组学、多光子共聚焦显微镜技术(multiphoton confocal microscopy)和核磁共振成像技术(MRI)等一系列核心能力。2007年12月,心血管科获得了英国心脏基金会颁发的优秀研究奖奖金9,000,000欧元奖金。部分奖金将用于推进蛋白质组学研究应用于心血管疾病的发展。国王学院的研究焦点之一就是确定干细胞如何修复心血管或者缺血心肌。 心血管蛋白质组学研究团体进行研究的目的是解释干细胞起源的心血管细胞不同的蛋白质组学和代谢特点。因为干细胞研究对于再生医学和组织工程具有深远意义,研究的总体目标是鉴别出可能成为促进干细胞分化的药物靶标的关键蛋白或者小分子。 蛋白质组学在心血管研究中的重要性 以往研究局限于表面标记物的表达来表征干细胞。然而,细胞表面标记物并不一定表明很多细胞活化状态的信息。但是它可以解释为什么注射入一个病人体内的干细胞比在另外一个病人体内更有效。 心血管蛋白质组学研究团体的目标是展示注入病人体内的细胞特性及其分子特性的综合架构。这一目标需要通过分离干细胞和研究其分泌因子来完成。标准的ELISAs(酶联免疫吸附试验)可以一次测试一个分子,质谱可以对某个数值以上的所有蛋白进行综合测试。分泌蛋白质组的复杂性是非常有限的,因此,即使是ng/mL水平的蛋白质,例如细胞因子和趋化因子,也可以被鉴别出来。 随着研究的进行,国王学院将分离出病人的干细胞,表征其分泌因子,并设法确定干细胞如何有益于临床应用。 挑战 心血管蛋白质组学研究团体进行的研究中,所用设备的灵敏度和耐受性是非常重要的。国王学院的研究者和技术人员是生物医学研究者,因此,该团体所需要的是一种用户友好,几乎不需要日常维护,并可以给出高准确数据的非常可靠的解决方案。该解决方案必须可以可进行短肽序列分析和提供准确的蛋白鉴定。国王学院要求前沿技术来支持研究中心多学科环境和核心能力。 因此,中心要寻找一种高速、强大而尽少维护的系统,用以发展鉴别复杂蛋白质的高通量方法。该系统可以保证小组准确分析很多样品。操作仪器也需要高度灵敏和高度可靠以便应用蛋白质组学来保证细胞分化和在移植或者组织修复中的安全使用。 解决方案 对于这项具体的研究,国王学院要求一种高灵敏度仪器来处理大数量的样品和分析低浓度水平的较大的分子。 国王学院购买了高性能质谱、蛋白质鉴定和生物标记物发现工作平台(Thermo Scientific LTQ Orbitrap XL)和具有电子转移解离能力(ETD)的线性离子阱(Thermo Scientific LTQ XL)等仪器的组合。这些设备提供了研究必需的高质量和高灵敏度。 采用高性能的线性离子阱使得国王学院可以比传统离子阱质谱输送更多的结构信息;ETD选项则提供了传统分析方法无法提供的序列信息。研究小组发现通过快速交互变换破碎技术,可以显著扩大蛋白质组的范围,并增强了蛋白质改性鉴定的把握。心血管蛋白质组学研究团体相信ETD技术是蛋白质组学研究的未来,因而愿意成为首先使用这种前沿设备的一员。ETD提供了蛋白质分析中最前沿的技术,该组织相信,在未来,ETD将成为蛋白质组学研究中广泛应用的一种破碎技术。 OrbitrapXL很高的质量准确度和分辨率使得国王学院可以研究不同干细胞的分泌因子。即使是低丰度蛋白,仍然可能获得可靠的匹配,而准确的质量则增加了复杂基质中肽分析的可靠性。 这些不同仪器的组合为复杂的蛋白质分析和智能肽序列分析提供了综合解决方案。 结论 国王学院的心血管蛋白质组学研究组织将蛋白质组学应用于干细胞和心血管研究中。该研究的潜在意义在于应用于临床治疗。从长远看来,该组织希望鉴定因子,这一点传递了干细胞疗法的优势。从药理学观点来看,给病人注入蛋白或者小分子比细胞要好的多。 将蛋白质组学应用于心血管研究中的高级专业技术将会帮助今天的研究者推进他们对心血管疾病的认识,并有助于将来新药品的发现以及基于干细胞的治疗。
Instrument.com.cn Copyright©1999- 2023 ,All Rights Reserved版权所有,未经书面授权,页面内容不得以任何形式进行复制