当前位置: 仪器信息网 > 行业主题 > >

蛋白质结构

仪器信息网蛋白质结构专题为您整合蛋白质结构相关的最新文章,在蛋白质结构专题,您不仅可以免费浏览蛋白质结构的资讯, 同时您还可以浏览蛋白质结构的相关资料、解决方案,参与社区蛋白质结构话题讨论。

蛋白质结构相关的资讯

  • 蛋白质结构解析六十年
    几种不同折叠模式的蛋白质模型(图片来源Protein Data Bank Japan )   上个世纪初,科学家们认为蛋白质是生命体的遗传物质,而具有独特的作用。随着这个理论被证伪,真正的遗传物质DNA的结构被给予了很大关注。然而,蛋白质作为生命体的重要大分子,其重要性也从未被忽视,而且在1950年代开始,科学家一直在探寻DNA序列和蛋白质序列的相关性。与此同时,蛋白质测序和结构解析蛋白质结构的努力开始慢慢获得回报。更多的生化研究揭示了蛋白质的功能重要性,因此蛋白质的三维结构的解析对于深入理解蛋白质功能和生理现象起着决定性作用。   本文简要回顾了蛋白质结构解析的重大历史事件,并总结了蛋白质结构解析的常用方法和结构分析方向。通过了解蛋白质结构,能够让我们更好地理解生物体的蛋白的理化特性,以及其相关联的化学反应途径及其机制,对于我们认识生物世界和研发治疗方法和药物都起着关键作用。在即将召开的2015高分辨率成像与生物医学应用研讨会上,各位专家学者将会进一步讨论相关议题。   蛋白质结构解析六十年来大事件   在1958年,英国科学家John Kendrew和Max Perutz首先发表了用X射线衍射得到的高分辨率的肌红蛋白Myoglobin的三维结构,然后是更加复杂的血红蛋白Hemoglobin。因此,这两个科学家分享了1962年的诺贝尔化学奖。事实上,这项工作在早在1937年就开始了。   然后在1960年代,蛋白质结构解析方法不断进步,获得了更高的解析精度。这个时期,蛋白质序列和DNA序列间关系也被发现,中心法则被Francis Crick提出,然后科学界见证了分子生物学的崛起。分子生物学(Molecular Biology)的名称在1962年开始被广泛接受和使用,并逐渐演变出一些支派,如结构生物学。然后在1964年,Aaron Klug提出了一种基于X射线衍射原理发展而来的全新的方法电子晶体学显微镜(crystallographic electron microscopy ),可以解析更大蛋白质或者蛋白质核酸复合体结构。因为这项研究,他获得了1982诺贝尔化学奖。1969年,Benno P. Schoenborn 提出可以用中子散射和原子核散射来确定大分子中固定位置的氢原子坐标。   进入1970年代,很多新的方法开始发展。存储蛋白质三维结构的Protein Data Bank(1971年) 开始出现,这对于规范化和积累蛋白质数据有着重要意义。1975年新的一种仪器叫做多丝区域检测器,让X-ray的检测和数据收集更加快速高效。次年,Robert Langride将X-ray衍射数据可视化,并在加州大学圣地亚哥分校成立了一个计算机图形实验室。同年,KeithHodgson和同事首次证明了可以使用同步加速器获得的X射线并对单个晶体进行照射,并取得了很好的实验效果。然后在1978年,核磁共振NMR首次被用于蛋白质结构的解析 同年首个高精度病毒(西红柿丛矮病毒)衣壳蛋白结构被解析。   在1980年代,更多蛋白质结构被解析,蛋白质三维结构的描述越来越成熟,而且蛋白质结构解析也被公认成为药物研发的关键步骤。在1983年,冷冻蚀刻的烟草花叶病毒结构在电子显微镜结构下得到描述。两年后德国科学家John Deisenhofer等解析出了细菌光合反应中心,因此他们共享了1988年的诺贝尔化学奖。次年,两个课题组解析了HIV与复制相关的蛋白酶结构,对针对HIV的药物研发提供了理论基础。   下一个十年,因为大量同步加速器辅助的X射线衍射的使用,数千个蛋白质结构得到解析,迎来了蛋白质结构组的曙光。1990年多波长反常散射方法(MAD)方法用于X射线衍射晶体成像,与同步辐射加速器一起,成为了近二十多年来的最常用的的方法。Rod MacKinnon在199年发表了第一个高精度的钾离子通道蛋白结构,对加深神经科学的理解起了重要作用,因此他分享了2003年的诺贝尔化学奖。Ada Yonath等领导的课题组在1999年首次解析了核糖体结构(一种巨大的RNA蛋白质复合体)。  进入新千年,更多的技术细节被加入到蛋白质解析研究领域。2001年,Roger Kornberg和同事们描述了第一个高精度的RNA聚合酶三维结构,正因此五年后他们共享了诺贝尔化学奖。2007年,首个G蛋白偶联受体结构的解析更是对药物研究带了新的希望。近些年来,越来越多的大的蛋白质结构得到解析。Cryo-EM超低温电子显微镜成像用于超大蛋白质结构成像的研究日益成熟,并开始广泛用于蛋白质结构的解析。   蛋白质结构解析的常用实验方法   1.X-ray衍射晶体学成像   X射线衍射晶体学是最早用于结构解析的实验方法之一。X射线是一种高能短波长的电磁波(本质上属于光子束),被德国科学家伦琴发现,故又被称为伦琴射线。理论和实验都证明了,当X射线打击在分子晶体颗粒上的时候,X射线会发生衍射效应,通过探测器收集这些衍射信号,可以了解晶体中电子密度的分布,再据此析获得粒子的位置信息。利用这种特点,布拉格父子研制出了X射线分光计并测定了一些盐晶体的结构和金刚石结构。首个DNA结构的解析便是利用X射线衍射晶体学获得的。   后来,获得X射线来源的技术得到了改进,如今更多地使用同步辐射的X射线源。来自同步辐射的X射线源可以调节射线的波长和很高的亮度,结合多波长反常散射技术,可以获得更高精度的晶体结构数据,也成为了当今主流的X射线晶体成像学方法。由X射线衍射晶体学解析的结构在RCSB Protein Data Bank中占到了88%。   X射线衍射成像虽然得到了长足的发展,仍然有着一定的缺点。X射线对晶体样本有着很大的损伤,因此常用低温液氮环境来保护生物大分子晶体,但是这种情况下的晶体周围环境非常恶劣,可能会对晶体产生不良影响。而且,X射线衍射方法不能用来解析较大的蛋白质。   上海同步辐射加速器外景(图片来源 上海同步辐射光源网站)   2.NMR核磁共振成像   核磁共振成像NMR全称Nuclear magnetic resonance,最早在1938被Isidor Rabi (1946年诺贝尔奖)描述,在上世纪的后半叶得到了长足发展。其基本理论是,带有孤对电子的原子核(自选量子数为1)在外界磁场影响下,会导致原子核的能级发生塞曼分裂,吸收并释放电磁辐射,即产生共振频谱。这种共振电磁辐射的频率与所处磁场强度成一定比例。利用这种特性,通过分析特定原子释放的电磁辐射结合外加磁场分别,可以用于生物大分子的成像或者其他领域的成像。有些时候,NMR也可以结合其他的实验方法,比如液相色谱或者质谱等。   RCSB Protein Data Bank数据库中存在大约11000个用NMR解析的生物大分子结构,占到总数大约10%的结构。NMR结构解析多是在溶液状态下的蛋白质结构,一般认为比起晶体结构能够描述生物大分子在细胞内真实结构。而且,NMR结构解析能够获得氢原子的结构位置。然而,NMR也并非万能,有时候也会因为蛋白质在溶液中结构不稳定能难得获取稳定的信号,因此,往往借助计算机建模或者其他方法完善结构解析流程。   使用NMR解析的血红蛋白结构建模(图片来源RCSB PDB)   3.Cryo-EM超低温电子显微镜成像   电子显微镜最早出现在1931年,从设计之初就是为了试图获得高分辨率的病毒图像。通过电子束打击样本获得电子的反射而获取样本的图像。而图像的分辨率与电子束的速度和入射角度相关。通过加速的电子束照射特殊处理过的样品表明,电子束反射,并被探测器接收,并成像从而获得图像信息。具体做法是,将样品迅速至于超低温(液氮环境)下并固定在很薄的乙烷(或者水中),并置于样品池,在电子显微镜下成像。图像获得后,通过分析图像中数量众多的同一种蛋白质在不同角度的形状,进行多次的计算机建模从而可以获得近原子级别的精度(最低可以到2.0埃)。   Cyro-EM解析TRPV1离子通道蛋白(图片来源Structure of the TRPV1 ion channel )   将电子显微镜和计算机建模成像结合在一起的大量实践还是在新世纪之后开始流行的。随着捕捉电子的探测器技术(CCD技术,以及后来的高精度电子捕捉、电子计数electron counting设备)的提升,更多的信息和更低的噪音保证了高分辨率的图像。   近些年来,Cryo-EM被用来解析很多结构非常大(无法用X-ray解析)的蛋白质(或者蛋白质复合体),取得了非常好的结果。同时,单电子捕捉技术取代之前的光电转换成像的CCD摄像设备,减少了图像中的噪音和信号衰减,同时并增强了信号。计算机成像技术的成熟和进步,也赋予了Cryo-EM更多的进步空间。然而,Cyro-EM与X-ray不同,该方法不需要蛋白质成为晶体,相同的是都需要低温环境来减少粒子束对样品的损害。   除去介绍的这三种方法以外,计算机建模技术也越来越多地被用在了蛋白质结构解析中。而且新解析的结构也会提高计算机建模的精确度。未来,我们或许能够用计算机构建原子级别的细胞模型,构建在芯片上的细胞。   蛋白质结构对了解生命体的生化反应、有针对性的药物研发有着重要意义。从1958到如今已经接近60年,蛋白质结构解析得到了较快的发展。然而,在如今DNA测序如此高效廉价的时代,蛋白质和DNA结构解析并没有进入真正高速发展阶段,这也导致了在如此多的DNA序列数据非常的今天,结构数据却相对少的可怜。大数据时代的基因组、蛋白质组、代谢组、脂类组等飞速发展的时候,蛋白质结构组也得到了更加广泛的重视。发展高精度、高效的结构解析技术也一直都有着重要意义。未来,蛋白质结构解析,对针对蛋白质的药物筛选,和计算机辅助的药物研究研究不应被低估。未来说不定在蛋白质结构领域有着更多惊喜,让我们拭目以待。 第一届电镜网络会议部分视频回放
  • 蛋白质结构分析新技术创测定速度纪录
    《自然-方法学》:蛋白质结构分析新技术创测定速度纪录   过去需几年时间完成的工作现在仅用几天即可完成   据美国物理学家组织网7月20日报道,隶属于美国能源部的劳伦斯伯克利国家实验室的科学家开发出一种利用小角度X射线散射技术测定蛋白质结构的新方法,大大提高了蛋白质结构研究分析的效率,使过去需要几年时间完成的工作仅需要几天即可完成,这将极大地促进结构基因组学的研究进程。   结构基因组学是一门研究生物中所有蛋白质结构的科学。通过对蛋白质结构的分析,可大致了解蛋白质的功能。结构基因组学重视快速、大量的蛋白质结构测定,而快速结构测定技术正是该学科研究面临的一个瓶颈问题。目前通常使用的两种测定技术,X射线晶体衍射和核磁共振质谱技术,虽然精确,但速度很慢,测定一个基因的蛋白质结构,动辄就需要几年的时间。随着新发现的蛋白质及蛋白质复合物越来越多,目前的分析速度远远不能满足研究的需要。   为解决这个瓶颈问题,劳伦斯伯克利国家实验室的科学家们借助了该实验室的先进光源(ALS)。他们运用一种称为小角度X射线散射(SAXS)的技术,对处于自然状态下(如在溶液之中)的蛋白质进行成像,其分辨率大约为10埃米(1埃米等于1/10纳米),足够用来测定蛋白质的三维结构。ASL产生的强光可以使实验所需材料减至最少,这使得该技术可以用于几乎所有生物分子的研究。   为了最大限度提高测定速度,研究小组安装了一个自动装置,可自动使用移液器吸取蛋白质样品到指定位置,以便利用X射线散射进行分析研究。他们还使用美国能源部国家能源研究科学计算机中心(NERSC)的超级计算资源进行数据分析。利用这一系统,研究小组取得了惊人的研究效率,在1个月内分析测定了火球菌的40组蛋白质结构。如果使用X射线晶体衍射技术,这可能需要花几年时间。同时,他们所获取的信息十分全面,涵盖了溶液中大部分蛋白质样本的结构信息。相比于在结构基因组学启动计划中使用核磁共振和晶体衍射技术仅能获取15%的信息量来说,这是十分巨大的进步。   高通量蛋白质结构分析有助于加快生物燃料的研究步伐,帮助解读极端微生物在恶劣环境中的繁荣之谜,更好地理解蛋白质的功能。研究小组之所以首先选择火球菌进行实验分析,就是因为它可用来生产清洁能源——氢。同时,在许多工业流程中都会出现高酸高热的环境状态,而这正是火球菌喜欢的生存环境。   但这种技术也有不足之处,追求速度会造成一种失衡,使成像质量相应打了折扣。与X射线晶体衍射成像的超高分辨率相比,小角度X射线散射成像的分辨率比较低,大约是10埃米。但这并不妨碍该技术的应用前景,因为并不是所有的研究都需要超高精度成像。对于结构基因组学研究来说,有时只要知道一种蛋白质与另一种蛋白质具有相似的结构,就可以了解其功能。而且,小角度X射线散射技术能够提供溶液中蛋白质形状、结构及构造变化等方面的精确信息,足以弥补其在成像精度方面的不足。   该研究成果刊登在7月20日《自然—方法学》杂志网络版上,美国斯克利普斯研究所和乔治亚州大学的科学家亦参与了该项研究。
  • 对于人类蛋白质相互作用网络的结构解析
    大家好,本周为大家分享一篇发表在Nat. Struct.上的文章,Towards a structurally resolved human protein interaction network,该文章的通讯作者是瑞典斯德哥尔摩大学的Petras Kundrotas、Arne Elofsson和欧洲分子生物学实验室的Pedro Beltrao。蛋白质-蛋白质相互作用(PPIs)的表征对于理解形成功能单位的蛋白质组和细胞生物学研究的基础是至关重要的。同时,蛋白质复合物的结构表征是理解蛋白质的功能机制、研究突变的影响和研究细胞调控过程的关键步骤。最近,基于神经网络的方法已经被证明了准确预测单个蛋白质和蛋白质复合物的结构的能力;然而,其在大规模预测人类复杂结构中的应用尚未得到有效测试。在此,本文测试了应用AlphaFold2在预测人类蛋白质相互作用结构上的潜力和局限性,并通过实验提示了界面残基中潜在的调节机制。除此之外,本文还提供了使用预测的二元复合物来构建高阶组装的案例,以此拓展了对于人类细胞生物学的理解。人类蛋白质相互作用的结构预测本文基于AlphaFold2的FoldDock管道对65484对来源于HuRI与hu.MAP V.2.0数据库中实验测定的PPIs的结构进行预测。文章合并了一个pDockQ分数,该分数可以根据置信度对模型进行排序。结果显示,已知相互作用蛋白的pDockQ往往高于随机集;对于hu.MAP数据集显示出平均比HuRI数据集更高的可信度,这表明,高可信度模型集中在具有高亲和力和直接相互作用的蛋白质相互作用区域。实验表明,AlphaFold2可以预测大型复合物中直接相互作用的蛋白对的结构(图1)。图1 | AlphaFold2复合物预测在大规模人类PPIs数据集上的应用影响预测置信度的特征如图1a所示,相较于HuRI和hu. MAP数据库中的蛋白质对,出现在蛋白质数据库(PDB)中的蛋白质对更加富集于高分模型部分。为了更好地理解这种差异,本文首先研究了一个由大型(10链)异质蛋白复合物构建的额外数据集。通过实验,结果显示直接相互作用对与间接相互作用对之间pDockQ分数的差异是显著的,这表明与间接相互作用对相比,即使直接相互作用对是大型复合体的一部分,也往往能够被预测。除此之外,由于HuRI数据库中的许多蛋白质间相互作用很可能是短暂的,而AlphaFold2无法可靠地预测这种相互作用(图2)。图2 | 影响预测置信度的蛋白质和相互作用特征:不同数据集的分析预测的复合物结构在化学交联上的验证化学交联结合质谱分析是一种识别蛋白质对中邻近的活性残基的方法,可以用来帮助确定可能的蛋白质界面。为了确定预测的复合物结构是否满足这种正交空间约束,本文获取了528对具有预测模型的蛋白质对的残基对的交联集合。在此章节中,文章提供了多个案例证明了化学交联验证的有效性(图3)。图3 | 对于预测复合物模型的化学交联支持复合物界面上与疾病相关的错义突变与人类疾病相关的错义突变可以通过多种机制改变蛋白质的功能,包括破坏蛋白质的稳定性、变构调节酶活性和改变PPIs。为了确定预测结构的有效性,本文汇编了一组位于界面残基上的突变,这些突变之前曾被实验测试过对于相应相互作用的影响。文章使用FoldX预测突变时结合亲和力的变化,并观察到破坏相互作用的突变强烈影响了结合的稳定性;另外,本文就在一系列生物学功能中具有界面疾病突变的蛋白质网络簇进行了举例说明(图4)。图4 | 蛋白质复合物界面残基的疾病突变蛋白质复合物界面的磷酸化调节蛋白质磷酸化可以通过改变修饰残基的大小和电荷来调节结合亲和力来调节蛋白质的相互作用,将磷酸化位点定位到蛋白质界面可以为它们在控制蛋白质相互作用中的功能作用产生机制假说。本文使用了最近对人类磷酸化蛋白质组26的鉴定,在高置信度模型中鉴定出了界面残基上的4,145个独特的磷酸化位点。实验表明,某些界面可能受到特定激酶和条件的协调调控。虽然不是所有界面上的磷酸位点都可能调节结合亲和力,但这一分析为特定扰动后的相互作用的潜在协调调控提供了假设(图5)。图5 | 界面残基上磷酸化位点的协同调控来自二元蛋白质相互作用的高阶组装蛋白质既能够同时与多个伙伴相互作用组成更大的蛋白复合物,又能够在时间和空间上分离。这也反映在文章的结构特征网络中,即蛋白质可以在群体中被发现,如蛋白质相互作用全局网络视图所示(图6)。由于使用AlphaFold2预测更大的复合物组装可能受到计算需求的限制,文章测试了蛋白质对的结构是否可以迭代结构上对齐。文章在上述网络中覆盖的一组小的复合物上测试了这一过程,并将一个实验确定的结构与预测的模型进行对齐,展示了该过程的潜力和局限性。受测试例子的鼓励,本文定义了一个自动化过程,通过迭代对齐生成更大的模型。总之,文章发现可以迭代地对齐相互作用的蛋白质对的结构来构建更大的组装,但同时也发现了目前限制这一过程的问题。图6 | 对高阶组装的蛋白质复合物的预测结论本文通过一系列的实验评估了应用AlphaFold2预测已知人类PPIs的复杂结构的潜力与局限性。分析结果表明,由亲和纯化、共分馏和互补的方法组合支撑的蛋白质相互作用能够产生更高置信度的模型。文章证明,可以使用模型指标(如pDockQ评分)对高置信度模型进行排序,为大规模PPIs和稳定复合物的详细研究提供支持;而来自交联质谱实验的数据为进一步验证这些预测提供了理想的资源。除此之外,本文用疾病突变和磷酸化数据证明了蛋白质界面的结构模型对于理解分子机制以及突变和翻译后修饰的影响至关重要;最后,文章提出了从预测的二元配合物出发构建更大的组件结构模型的想法。后续仍需要更多的工作来确定确切的化学计量学,设计方法和评分系统来构建如此更大的复杂组件,以及预测具有弱和瞬态相互作用的蛋白质之间的相互作用。参考文献(1) Burke DF, Bryant P, Barrio-Hernandez I, et al. Towards a structurally resolved human protein interaction network [published online ahead of print, 2023 Jan 23]. Nat Struct Mol Biol. 2023 10.1038/s41594-022-00910-8. doi:10.1038/s41594-022-00910-8
  • 地球生命起源蛋白质结构或揭示
    美国罗格斯大学领导的团队在探究生物学中最深刻的未解问题之一时,发现了可能导致古代地球原始汤中生命起源的蛋白质结构。该研究近日发表在《科学进展》杂志上。  研究人员探索了原始生命如何起源于我们星球上的简单非生命材料,他们得出结论,任何有生命的东西都需要从太阳或热液喷口等来源收集和使用能量。  用分子术语来说,这意味着转移电子的能力对生命至关重要。由于电子转移的最佳元素是金属,并且大多数生物活动都是由蛋白质进行的,因此研究人员决定探索两者的结合,即结合金属的蛋白质。  他们比较了所有现有的与金属结合的蛋白质结构,以建立任何共同特征,前提是这些共同特征存在于祖先蛋白质中,并且经过多样化和传承,创造了我们今天看到的众多蛋白质。  蛋白质结构的进化需要了解新折叠是如何从先前存在的折叠中产生的,因此研究人员设计了一种计算方法,发现目前存在的绝大多数金属结合蛋白都有些相似,无论它们结合的金属类型如何。  研究主要作者、罗格斯大学新不伦瑞克分校生物化学和微生物学系教授雅娜布罗姆伯格表示,现有蛋白质的金属结合核心确实都相似,尽管蛋白质本身可能不相似。这些金属结合核心通常由重复的子结构组成,有点像乐高积木。奇怪的是,这些子结构也存在于蛋白质的其他区域,而不仅仅是金属结合核心。观察表明,这些子结构的重排可能有一个或少数共同祖先,并产生了目前可用的全部蛋白质及其功能,亦即人类所知道的生命。  布罗姆伯格说,“我们对生命如何在这个星球上产生信息知之甚少,而我们的工作提供了以前无法获得的解释。这种解释或有助于我们在其他行星和行星体上寻找生命。我们对特定结构构件的发现也可能影响未来合成生物学工作——科学家的目标正是重构出具有特异性的活性蛋白质”。
  • “蛋白质动态学新技术”成功解析蛋白复合体结构
    近日,中国科学院武汉物理与数学研究所研究员唐淳课题组利用基于973重大科学研究计划“蛋白质动态学研究的新技术新方法”建立的研究技术,协助华中农业大学教授殷平课题组首次解析了N6腺嘌呤甲基转移酶METTL3-METTL14蛋白复合体结构,该研究成果发表于《自然》杂志。  该工作揭示了RNA N6腺嘌呤甲基化修饰过程中的结构基础,是表观遗传学领域的一项重大突破。唐淳、武汉物数所副研究员龚洲和博士后刘主参与该项目,利用课题组发展的新技术新方法,通过结合小角X光散射与计算机模拟的手段,为该蛋白复合体的结构解析提供了研究方法上的帮助。  经过近3年的努力,唐淳课题组发展、建立了包括核磁共振波谱、小角X光散射、化学交联质谱分析、单分子荧光检测和成像等技术在内的多种生物物理化学手段,并开发相应的整合计算方法,用于蛋白质动态结构及其转换过程的研究。课题组除了完成自身的科研项目外,积极开展广泛的合作与交流,与国内外同行共享研究技术和方法。目前,得益于“蛋白质动态学研究的新技术新方法”项目的实施,课题组已助力多个重要蛋白质结构的解析,取得了一系列的研究成果,研究成果发表于《自然—化学生物学》、eLife 等国际一流杂志。
  • 新型蛋白质结构分析手段-氢氘交换质谱技术进展
    贾伟、陈熙 沃特世科技(上海)有限公司实验中心 氢氘交换质谱法是一种研究蛋白质空间构象的质谱技术。它在蛋白质结构及动态变化研究、蛋白质相互作用位点发现、蛋白表位及活性位点鉴定方面有着广泛的应用。随着氢氘交换质谱技术的不断发展,它正在成为结构生物学家及生物药物研发的重要手段。 氢氘交换质谱(HDX MS,hydrogen deuterium exchange mass spectrometry)是一种研究蛋白质空间构象的质谱技术。其原理是将蛋白浸入重水溶液中,蛋白的氢原子将于重水的氘原子发生交换,而且蛋白质表面与重水密切接触的氢比位于蛋白质内部的或参与氢键形成的氢的交换速率快,进而通过质谱检测确定蛋白质不同序列片段的氢氘交换速率,从而得出蛋白质空间结构信息[1]。这个过程就像将握着的拳头浸入水中,然后提出水面并张开手掌。这时,湿润的手背表明它在&ldquo 拳头&rdquo 的结构中处于外表面,而较为干燥的手心表明它是&ldquo 拳头&rdquo 的内部。除样品制备外,氢氘交换质谱法的主要过程包括:交换反应、终止反应、将蛋白快速酶切为多肽、液相分离、质谱检测、数据解析。其中交换步骤需要在多个反应时长下进行,如0s、10s、1min、10min、60min等,以绘制交换率曲线,得到准确全面的信息。氢氘交换质谱技术在蛋白质结构及其动态变化研究[1]、蛋白质相互作用位点发现[2]、蛋白表位及活性位点鉴定方面有着广泛的应用[3]。 与经典的蛋白质结构研究方法相比,如X射线晶体衍射(X-Ray Crystallography)和核磁共振(NMR. Nuclear Magnetic Resonance)等方法,氢氘交换质谱不能够提供精确的蛋白空间结构,它直接提供的主要信息包括哪些氨基酸序列位于蛋白质空间结构的表面位置(包括动态变化中的)、可能的活性位点和蛋白-蛋白相互作用位点等。但是氢氘交换质谱技术有着其他经典方法不具备的优点:首先,可以进行蛋白质结构动态变化的研究是氢氘交换质谱的一个突出优点,包括变化中的活性位点及表位;其次,氢氘交换质谱在蛋白复合体构象的研究中也具有独到的优势;此外,氢氘交换质谱还具有对样品需求量小、纯度要求相对较低、研究对象为溶液环境下的蛋白质的天然构象而非晶体中构象等优势[1,4,5]。自1991年第一篇研究论文发表起,氢氘交换质谱技术不断发展,已经成为结构生物学及质谱技术中一个非常重要的应用领域[6]。但是氢氘交换质谱实验的复杂的实现过程在一定程度上影响了其应用的广泛度。主要的难点有:1、如何避免交换后氘代肽段的回交现象;2、实验控制的高精确性和重现性要求;3、交换后造成的叠加的质谱峰如何准确分辨;4、简易高效的分析软件需求;5、以氨基酸为单位的交换位点辨析。沃特世公司自2005年起,针对以上难点不断进行攻关,推出了目前唯一商业化的全自动氢氘交换质谱系统解决方案&mdash &mdash nanoACQUITY UPLC® HD-Exchange System(图1)。在全世界范围内,这套系统已经帮助科学家在包括Cell、Nature等顶级研究期刊中发表研究论文[7,8]。除科研需求外,沃特世氢氘交换质谱系统也受到众多国际领先制药公司的认可,并用于新药开发中蛋白药物活性位点及表位的研究工作中。 氢氘交换实验中的回交现象将严重影响实验数据的可信度,甚至导致错误结果的产生。要避免回交需要做到两点:尽量缩短液质分析时间和保证液质分析中的温度和pH为最低回交反应系数所要求的环境。沃特世UPLC® 系统采用亚二纳米色谱颗粒填料,较HPLC使用的大颗粒填料,UPLC具有无与伦比的分离度。因此UPLC可以做到在不损失色谱分离效果的要求下,极大缩短液相分析时间的要求[9]。对于对温度和pH控制问题,在多年的工程学改进中,nanoACQUITY UPLC HD-Exchange System已经实现了对酶切、液相分离等步骤的全程控制[10]。 对氢氘交换质谱实验精确性和重现性的要求是其应用的第二个主要难点。在实验中一般需要采集0s、10s、1min、10min、60min、240min等多个时间点的数据。如果进行人工手动实验,很难做到对10S-10min等几个时间点的精确操作。再考虑到重复实验的需求,人工手动操作会对最终数据可信度产生影响。而且实验过程重复繁琐,将给实验人员带来非常大的工作压力。nanoACQUITY UPLC HD-Exchange System完全通过智能机械臂,精确完成交换、终止交换、进样、酶切等一系列实验过程,而且始终保证各个步骤所需不同的温度环境。这些自动化过程不但保证了实验数据的可靠性,提高了实验效率,也将科学家从繁琐的重复实验中解放出来。 氢氘交换实验的质谱数据中,随着交换时间的延长,发生了交换反应的多肽,由于质量变大,其质谱信号将逐渐向高质荷比方向移动。因此,这些质谱峰可能与哪些未发生交换反应的多肽质谱峰逐渐叠加、相互覆盖。相互叠加的质谱信号,不但影响对峰归属的判断,更会增加交换率数据的误差。因为交换率判断需要通过对发生交换的多肽进行定量,毫无疑问因叠加的而混乱的质谱数据将极大的影响对质谱峰的准确定量。这点对于单纯通过质荷比进行分析的质谱仪来说完全无能为力。但是,这个看似不可能完成的任务却被沃特世 nanoACQUITY UPLC HD-Exchange System攻克了。这是因为,不同于其它常见质谱,沃特世的SYNAPT® 质谱平台还具备根据离子大小及形态进行分离的功能(行波离子淌度分离)。在数据处理时,除多肽离子的质荷比信息外,还可以通过离子迁移时间(离子淌度维度参数)将不同离子区分。因此这种SYNPAT独有的被命名为HDMSE的质谱分析技术可以将因质荷比相同而重叠的多肽分离开,轻而易举地解决了质谱信号叠加的问题,得到准确的交换率数据[11,12](图2)。SYNPAT质谱平台一经推出就夺得了2007年PITTCON金奖,目前已经推出了新一代的SYNAPT G2HDMS、SYNAPT G2-S HDMS等型号,并具备ESI、MALDI等多种离子源。除氢氘交换技术外,SYNAPT质谱系统在蛋白质复合体结构研究中也是独具特色,已有多篇高质量应用文献发表[13,14,15]。 实现氢氘交换质谱技术的第四个关键点,是如何高效分析实验产生的多时间点及多次重复带来的大量数据。人工完成如此巨大的信息处理工作,将消耗科学家大量的时间。沃特世氢氘交换质谱解决方案所提供的DynamX软件可以为科学家提供简便直观的分析结果,并包含多种呈现方式。 在某些特殊研究中,要求对蛋白氢氘交换位点做到精确到氨基酸的测量,这是氢氘交换质谱研究的又一个难点。在常规的研究中采用CID(碰撞诱导解离)碎裂模式,可能导致氘原子在多肽内重排,而致使不能对发生交换的具体氨基酸进行精确定位。SYNPAT质谱提供的ETD(电子转移解离)碎裂模式可以避免氘原子重排造成的信息混乱,并具有良好的碎裂信号[16]。 沃特世的nanoACQUITY UPLC HD-Exchange System为氢氘交换质谱实验提供了前所未有的简易的解决方案,强有力地推动了氢氘交换技术在蛋白质结构及动态变化研究、蛋白质相互作用位点发现、蛋白表位以及活性位点鉴定方面的应用,正在成为众多结构生物学科学家和生物制药企业必不可少的工作平台。 参考文献 (1) John R. Engen, Analysis of Protein Conformation and Dynamics by Hydrogen/Deuterium Exchange MS. Anal. Chem. 2009,81, 7870&ndash 7875 (2) Engen et al. probing protein interactions using HD exchange ms in ms of protein interactions. Edited by Downard, John Wiley & Sons, Inc. 2007, 45-61 (3) Tiyanont K, Wales TE, Aste-Amezaga M, et al. Evidence for increased exposure of the Notch1 metalloproteasecleavage site upon conversion to an activated conformation. Structure. 2011, 19, 546-554 (4) Heck AJ. Native mass spectrometry: a bridge between interactomics and structural biology. Nat Methods. 2008, 5, 927-933. (5) Esther van Duijn, Albert J.R. Heck. Mass spectrometric analysis of intact macromolecular chaperone complexes. Drug Discovery Today. Drug Discovery Today: Technologies Volume 3, 2006, 21-27 (6) Viswanat ham Katta, Brian T. C hait, Steven Ca r r. Conformational changes in proteins probed by hydrogen-exchange electrospray-ionization mass spectrometry. Rapid Commun. Mass Spectrom. 1991, 5, 214&ndash 217 (7) Chakraborty K, Chatila M, Sinha J, et al. Chaperonin-catalyzed rescue of kinetically trapped states in protein folding. Cell. 2010 Jul 9 142(1):112-22. (8) Zhang J, Adriá n FJ, Jahnke W, et al. Targeting Bcr-Abl by combining allosteric with AT P-binding-site inhibitors. Nature. 2010,463, 501-506 (9) Wu Y, Engen JR, Hobbins WB. Ultra performance liquid chromatography (UPLC) further improves hydrogen/deuterium exchange mass spectrometry. J Am Soc Mass Spectrom. 2006 , 17, 163-167 (10) Wales T E, Fadgen KE, Gerhardt GC, Engen JR. High-speed and high-resolution UPLC separation at zero degrees Celsius. Anal Chem. 2008, 80, 6815-6820 (11) Giles K, Pringle SD, Worthington KR, et al. Applications of a travelling wave-based radio-frequency-only stacked ring ion guide. Rapid Commun Mass Spectrom. 2004, 18, 2401-2414 (12) Olivova P, C hen W, C ha kra borty AB, Gebler JC. Determination of N-glycosylation sites and site heterogeneity in a monoclonal antibody by electrospray quadrupole ion-mobility time-offlight mass spectrometry. Rapid Commun Mass Spectrom. 2008, 22,29-40 (13) Ruotolo BT, Benesch JL, Sandercock AM, et al. Ion mobilitymass spectrometry analysis of large protein complexes. Nat Protoc.2008, 3, 1139-52. (14) Uetrecht C, Barbu IM, Shoemaker GK, et al. Interrogatingviral capsid assembly with ion mobility-mass spectrometry. Nat Chem.2011, 3,126-132 (15) Bleiholder C, Dupuis NF, Wyttenbac h T, Bowers MT. Ion mobility-mass spectrometry reveals a conformational conversion from random assembly to &beta -sheet in amyloid fibril formation. Nat Chem. 2011, 3, 172-177 (16) Kasper D. Rand, Steven D. Pringle, Michael Morris, John R., et al. ETD in a Traveling Wave Ion Guide at Tuned Z-Spray Ion Source Conditions Allows for Site-Specific Hydrogen/Deuterium Exchange Measurements. J Am Soc Mass Spectrom. 2011, in press
  • 蛋白质结构研究大装置安家上海
    园区微晶体结构研究站 园区荧光激发细胞分选仪 海科路园区设施 科研人员研究大分子复合体  7月28日上午,全球生命科学领域首个综合性大科学装置——蛋白质科学研究(上海)设施(以下简称“上海设施”)在上海通过国家验收。中国科学院院长白春礼、上海市市长杨雄、国家发改委副主任林念修等出席验收会。  据介绍,作为国家重大科技基础设施项目之一的上海设施,主要围绕蛋白质科学研究的前沿领域和我国生物医药、农业等产业的发展需求,建设高通量、高精度、规模化的蛋白质制取与纯化、结构分析、功能研究等大型装置,实现技术与设备的集成化、通量化和信息化。目前已建成用于蛋白质结构研究的9大技术系统。  验收委员会认为,上海设施建成了国际一流的蛋白质科学研究支撑体系,是全球生命科学领域以各种大型科学仪器和先进技术集成为核心的首个综合性大科学装置,其总体指标达到国际先进水平,部分指标达到国际领先水平。  白春礼表示,建设设施不是最终的目的,吸引全国和全世界的优秀科学家来从事高水平科研工作、产出重大科技成果才是应该致力追求的目标。上海设施要成立设施科技委员会和用户委员会,建立科学民主开放的课题遴选制度,不断扩大设施开放共享。  据统计,上海设施2014年5月开放试运行,截至2015年7月,各系统累计运行5万多小时,共执行用户课题500多个 服务60多家单位,以中科院和高校科研机构为主,覆盖北京、上海、香港等地 同时吸引了一批国际药企和国内外优秀科学家开展前沿课题研究。用户使用上海设施的设备和服务做出了一系列重要成果,有多项研究成果发表在Nature、PNAS等高水平国际学术刊物上。
  • 颜宁等点评:AI 精准预测蛋白质结构,结构生物学何去何从?
    p style=" text-indent: 2em " 12 月 1 日,谷歌旗下的 DeepMind 公司宣布,其 strong 新一代 AlphaFold 人工智能系统 /strong 在国际蛋白质结构预测竞赛(CASP)上击败了其余的参会选手, strong 精确预测了蛋白质的三维结构 /strong , strong 准确性可与冷冻电子显微镜(cryo-EM)、核磁共振或 X 射线晶体学等实验技术相媲美。 /strong /p p br/ /p p style=" text-indent: 2em " (详见《解决生物学 50 年来的重大挑战!生物界「AlphaGo」精准预测蛋白质结构》)这一消息引发了全球媒体关注,前 Genentech 首席执行官 Arthur D. Levinson 博士盛赞这一成就是 strong 「划时代的进步」 /strong 。 /p p br/ /p p style=" text-indent: 2em " 人工智能的「进击」对生物学、对其他学科会有什么影响?网络上有人提出: strong AI 都能解蛋白质结构了,结构生物学家是不是该失业了? /strong /p p br/ /p p style=" text-indent: 2em " 《返朴》总编、结构生物学家颜宁特邀几位同仁对这一新闻各抒己见, 回答大家的疑问。 /p p style=" text-align: center text-indent: 2em " img style=" max-width: 100% max-height: 100% width: 558px height: 618px " src=" https://img1.17img.cn/17img/images/202012/uepic/73bb911a-86ca-490b-a90a-f01fb76aa418.jpg" title=" 微信图片_20201204191414.jpg" alt=" 微信图片_20201204191414.jpg" width=" 558" height=" 618" / /p p style=" text-align: center text-indent: 2em " span style=" font-size: 12px " by Asier Sanz | https://asiersanz.com/ /span /p p br/ /p p style=" text-align: center text-indent: 2em " strong AlphaFold2 是个大突破,但我们还有努力的方向 /strong /p p br/ /p p style=" text-align: center text-indent: 2em " 张阳 /p p style=" text-align: center text-indent: 2em " (ITASSER 创造者,美国密歇根大学教授) /p p br/ /p p style=" text-indent: 2em " AlphaFold2 显然是蛋白质结构预测领域的重大突破。这可能是从 1969 年第一篇& nbsp Journal of Molecular Biology& nbsp 用比较建模方法预测蛋白质结构发表& nbsp 51 年以来最大的突破。 /p p br/ /p p style=" text-indent: 2em " 这个领域过去 20 年来,进展一直比较缓慢,但最近几年,随着共同进化、接触图预测以及引入深度学习之后,很多软件,比如 I-TASSER 和 Rosetta 等,都有了很大进步。 /p p br/ /p p style=" text-indent: 2em " 就 I-TASSER 来讲,两年前在第 13 届 CASP(CASP13)时,它能够正确预测的非同源蛋白数目比其六年前在 CASP11 上提高了 5 倍。这次 CASP14 也比 CASP13 的预测能力提高了很多。但 AlphaFold2 这次比上次进步更大,和两年前的上一个版本相比,& nbsp AlphaFold2 的主要变化是直接训练蛋白质结构的原子坐标,而不是用以往常用的、简化了的原子间距或者接触图。 /p p br/ /p p style=" text-indent: 2em " 传统上,蛋白质结构预测可以分成基于模板和从头预测,但是 AlphaFold2 只用同一种方法 —— 机器学习,对几乎所有的蛋白质都预测出了正确的拓扑学的结构,其中有大约 2/3 的蛋白质预测精度达到了结构生物学实验的测量精度。这说明,至少是在单结构域的蛋白结构,他们接近解决了这个问题。 /p p br/ /p p style=" text-indent: 2em " 谷歌这次为什么能够取得如此大的成功? /p p br/ /p p style=" text-indent: 2em " 这首先与它们拥有强大的人力和计算资源有关。 /p p br/ /p p style=" text-indent: 2em " 计算机上,他们使用 TPU(据他们的宣传是比 GPU 快 15 倍),学术界的实验室只有 CPU 或者 GPU,而很多实验室都还没有 GPU。他们对媒体宣传中说 Alphafold2 最后只用相当于 100 个 GPU 的资源训练了两周就产生了最后的模型,学界大多数实验室都可以做到,这是不客观的。因为产生一个新的想法,到训练成功的模型,中间起码要反复测试重复 100 次甚至 1000 次。这就像吃了十个馒头的饿汉一 样,不能说吃了最后一个馒头吃饱了,就觉得只吃最后一个馒头就够了。 /p p br/ /p p style=" text-indent: 2em " 另外,他们可以高薪招聘大量专业人才,集中精力攻关一件事,不需要担心基金申请、教学和学生毕业论文等等。这些人力和计算资源上的差别是谷歌 DeepMind 这样的工业研究机构比起学术界在攻关科学或者工程问题上的最大优势。 /p p br/ /p p style=" text-indent: 2em " 当然,学术界在蛋白质结构预测这么多年的积累,也给 AlphaFold2 的成功奠定了基础。 /p p br/ /p p style=" text-indent: 2em " 我自己很高兴他们取得了这么大突破。这个工作首先证明了蛋白质结构预测问题是可以被解决的。这其实不是一个简单的问题,因为蛋白质结构和序列的复杂关系,常常让人们 —— 特别是做结构预测的人 —— 怀疑,蛋白质折叠这个问题是不是可解, 或者有没有唯一解。 /p p br/ /p p style=" text-indent: 2em " 我们在 15 年前的一篇 PNAS 论文中提到,用 PDB 库中的模板,在理论上可以解决 “单结构域蛋白质结构预测” 这个问题,但那是一个基于模板的传统解法, 难点是如何找到最好的模板。谷歌他们这次用「暴力」的机器学习,「暴力」地解决了这个问题。这个做法的成功会对很多相关领域都产生深远影响。 /p p br/ /p p style=" text-indent: 2em " 有人说这个 AlphaFold2 会让很多相关行业的人失业。我认为恰恰相反,它给很多领域提供了解决问题的新途径和新思维,因而会极大推动相关领域的发展,因此会产生更多更大的机会。即便是在蛋白质结构预测这个相对较小的领域,我们还有很多事情要做。 /p p br/ /p p style=" text-indent: 2em " AlphaFold2 这次只有 2/3 的蛋白预测做到实验精度,还有 1/3 做不到,是否还有更快更好的途径来产生更高精度结构的算法?基于商业或其它考虑,我相信谷歌可能不会公开代码或 Server。 /p p br/ /p p style=" text-indent: 2em " 所以,最终可能还得学术界的同行共同努力,完善和推广这一技术,让其真正惠及生物医学研究以及普通公众的健康需求。 /p p br/ /p p style=" text-align: center text-indent: 2em " strong 共赢大于竞争 /strong /p p br/ /p p style=" text-align: center text-indent: 2em " 龚新奇 /p p style=" text-align: center text-indent: 2em " (中国人民大学数学科学研究院教授,清华大学北京结构生物学高精尖中心合作研究员) /p p br/ /p p style=" text-indent: 2em " 2020 年第 14 届国际蛋白质结构预测竞赛(CASP14)共有 84 个常规(Regular)题目,其中有 14 个题目因为生物实验没给出确定结构等原因被取消或延缓,其他 70 个题目的单体和复合物蛋白质所含有的氨基酸个数从 73 到 2180 不等。 /p p br/ /p p style=" text-indent: 2em " 19 个国家的 215 个小组参加了 CASP14。最终,谷歌旗下 DeepMind 公司的人工智能系统 AlphaFold2 在 2018 年的 Alphafold 基础上迭代创新,超常发挥,一枝独秀,基本解决了「从氨基酸序列预测蛋白质结构」这个困扰人类 50 年的生物学第二遗传密码问题。 /p p br/ /p p style=" text-indent: 2em " AlphaFold2 的成功表现在三个方面: /p p style=" text-indent: 2em " 1.不少结构的预测精确度跟实验晶体结构相当,可以替代晶体结构; br/ /p p style=" text-indent: 2em " 2.一些含有多个结构域的复杂超长的单链结构也达到了可以跟实验结构比较的程度; /p p style=" text-indent: 2em " 3.帮助解析了竞赛中涉及到的、实验多年没拿到的 X 射线晶体和 cryo-EM 冷冻电镜结构,比如 T1058 的膜蛋白是用了 Alphafold2 的预测模型之后,才跟原有晶体学数据综合成功解析了结构。 br/ /p p style=" text-indent: 2em " AlphaFold2 团队的& nbsp John Jumper 报告表明,他们使用了基于注意机制的神经网络,动态调整网络中节点的顺序和链接;依靠的是端到端的优化整体构建结构,而不是氨基酸距离;网络中内置了大量的序列、结构和宏基因组等多重比较信息;还依赖分子模拟软件优化去掉了原子的堆积碰撞。 /p p br/ /p p style=" text-indent: 2em " 在 AlphaFold2 的摘要作者名单里,交叉团队的 30 位作者中有 19 位都被标记为相同贡献的第一作者。他们将近 8 分钟的宣介视频,记录了团队成员在新冠疫情期间精诚合作、攻坚克难的宝贵场景。 /p p br/ /p p style=" text-indent: 2em " CASP 组织者 John Moult 指出,计算下一步还有更困难的问题要解决:超大复合物结构、动态构象变化、蛋白质设计、药物设计等等。 /p p br/ /p p style=" text-indent: 2em " 除了我们蛋白质结构预测小同行对 AlphaFold2 的成功很欣喜之外,社会上还有多个不同方向的学术界、产业界和新闻界对它寄予了厚望。 /p p br/ /p p style=" text-indent: 2em " 在欣喜的同时,蛋白质结构预测小同行也有一些保留意见: /p p style=" text-indent: 2em " 1.工程化明显,依赖于强大的 GPU 计算资源和代码优化团队; br/ /p p style=" text-indent: 2em " 2.谷歌公司几乎可以收集全球所有网络信息,虽然看起来 AlphaFold2 的自动化程度很高,但他们在人工操作中使用了哪些信息值得关注; /p p style=" text-indent: 2em " 3.预测对了结构,但不等于明白了蛋白质折叠过程和原理。 /p p br/ /p p style=" text-indent: 2em " strong 生物实验科学家也有不少看法: /strong /p p style=" text-indent: 2em " 1.算出结构只是生物学规律发现的第一步; /p p style=" text-indent: 2em " 2.计算的多个 models 中,有时打分排序不准; /p p style=" text-indent: 2em " 3.开放 AlphaFold2 的 server 之后,使用效果不一定那么好; /p p style=" text-indent: 2em " 4.只是在已有蛋白质结构数据集上训练得到的模型,尚不能计算其它构象或其它类别的分子结构。 /p br/ p style=" text-indent: 2em " 还有关心这个领域的其他方向的专家也提出了问题:怎么理解这个算法成功的原理?怎么跟原有的热力学、物理学等基本原理相融相通? /p p br/ /p p style=" text-align: center text-indent: 2em " 我认为 AlphaFold2 是个大突破,后续可能性很多,会替代一些简单的结构生物学实验,但对当下科学家追求的前沿生物学来说,共赢大于竞争;对生物学、数学和计算机学等学科而言,则会带来新的机遇。 br/ br/ strong 技术服务于科学探索,结构生物学早就进入新时代 /strong br/ 颜宁 /p p style=" text-align: center text-indent: 2em " (美国普林斯顿大学雪莉?蒂尔曼终身讲席教授,美国科学院外籍院士) /p p br/ /p p style=" text-indent: 2em " 首先,简单说一下,什么是生物学里的「结构」。 /p br/ p style=" text-indent: 2em " 用个不太恰当的类比:变形金刚。比如擎天柱是辆车还是个机器人,这就是不同的结构了,机器人能打架大车做运输,功能也不一样。而不同的汽车人组成成分可能差不多,都有合金、玻璃、橡胶,但是形态各异,特长也不一样。 br/ 生物分子的组成成分和基本单元就那么几种,但是组装起来,不同的序列不同的结构,于是功能各异、五花八门。这个结构不是静止的,每一个生物大分子基本都像个小机器,比变形金刚更复杂、更变化多端。 /p p br/ /p p style=" text-indent: 2em " 因为结构决定了生物大分子的功能,所以解析高分辨率结构在过去几十年一直是理解生物大分子工作机理最有力的工具。但是一直以来,因为技术局限,对于绝大多数生物大分子的结构解析困难重重。所以,一批科学家另辟蹊径,试图在已有的知识基础上,绕开劳心劳力又劳财的实验步骤,从蛋白质的序列直接通过计算预测出它们精准的三维结构。 /p p br/ /p p style=" text-indent: 2em " 蛋白结构预测并不是一个新鲜学科,一直以来就是结构生物学的一个分支,很多科学家不断开发算法,希望根据序列预测出来的结构越来越准确。 br/ 这个领域在过去十几年进步迅速,并且与实验结构生物学融合度越来越高。比如,自从进入电镜时代,看到一堆黑白灰的密度,如果其中某些部分没有同源结构,通过软件预测一个大致的结构模型,放到密度图里面做框架,再根据实验数据调整,已经是个常规操作。 /p p br/ /p p style=" text-indent: 2em " 这次人工智能赢得 CASP 的新闻亮点有两个,一是 AI,二是准确度高。这确实是突破,但是有了两年前的新闻(注:2018 年,DeepMind 开发的第一代 AlphaFold 首次参加 CASP 并且拔得头筹)做铺垫,现在这次委实是意料之中。 br/ 至于衍生出来的所谓「结构生物学家都要失业了」的调侃 —— 如果你对结构生物学的理解还停留在 20 年前,那这么说也不是不行。但是结构生物学自身一直在发展着,一场冷冻电镜的分辨率革命更是令结构生物学不同往日了。 br/ 我在 2015 年主持一个学术研讨会的时候曾经评论过:结构生物学的主语是生物学,是理解生命、是做出生物学发现。 br/ 但是,在 X - 射线晶体学为主要手段的时代,获得大多数研究对象的结构本身太难了,于是很多研究者把「获得结构」本身作为了目标,让外行误以为结构生物学就是解结构。但我从进入这个领域之初,就被教育得明明白白:结构本身只是手段,它们是为了回答问题、做出发现。而电镜使得「发现」二字尤为突出。 br/ br/ 看到结构本身、知道你的研究对象长啥样,倒也可以称之为发现,但我刚刚说的「发现」,特指那些超乎想象的、通过结构才揭示出来的、自然界里神奇的存在或者令人叹为观止的机理。 /p br/ p style=" text-indent: 2em " 我讲课最喜欢举的例子之一就是施一公组的剪接体结构。为啥呢?因为它集合了结构生物学发现里几乎所有的精彩要素和挑战。 br/ br/ 第一,在剪接体结构出来之前,有很多剪接体的组分甚至是未知的。不同于传统的结构生物学,先知道你要研究对象是啥,再吭哧吭哧地去把它们的结构解出来 —— 剪接体的电镜分析是看到了密度图之后,完全不晓得这是啥,需要通过质谱等手段去鉴定组分。我从 2015 年就预测:电镜与质谱组合,将会变成一个重要的生物学研究发现手段。在电镜时代,这样的例子越来越多。比如清华大学隋森芳老师组的那个巨大的藻胆体结构,靠质谱都不够了。为了搞明白组分,他们甚至先做了基因组测序。 br/ br/ 第二,几十上百个蛋白如何众星捧月地把那么几条貌似简单的 RNA 掰成与几个小小的金属离子配合的核酶反应中心,在茫茫碱基中,在正确的时间正确的地点牵线搭桥,剪掉 intron(内含子),连接 exon(外显子)?就为了这一「剪子」& nbsp 一「钩针」,为了几毫秒的过程,这么个庞然大物的几十上百个组成部件却要分分合合,这个过程是真神奇。 /p p br/ /p p style=" text-align: center text-indent: 2em " img style=" max-width:100% max-height:100% " src=" https://img1.17img.cn/17img/images/202012/uepic/72bc97e7-d254-461b-b199-1156f73a37c8.jpg" title=" 微信图片_20201204191624.jpg" alt=" 微信图片_20201204191624.jpg" / /p p style=" text-align: center text-indent: 2em " span style=" font-size: 12px " 施一公实验室报道的首个酵母剪接体的结构 /span /p p style=" text-align: center text-indent: 2em " span style=" font-size: 12px " (图源:生物化学经典教材 Lehninger Principles of Biochemistry(第七版)封面) /span /p p style=" text-align: center text-indent: 2em " span style=" font-size: 12px " br/ /span 结构生物学目前的实验手段只能获得静止的 3D 照片,为了揭示这部电影,就要不断获得中间态的 3D 照片,帧数越多,电影越精准。但即便如此,这个过程中的动力学问题,简单说,就是变化速度,依旧不是现在的结构生物学实验手段可以揭示的,需要借助更多生物物理技术、计算生物学手段去探索。 br/ 我自己的工作虽然没有剪接体那么酷炫,但是电压门控钠离子通道如何感受膜电势的变化,开门关门,就这么个过程,听着简单,我们死磕三年了,依旧束手无策。另外,我们今年发的两篇 PNAS 论文其实代表了结构生物学的另一个努力方向:在实验操作过程中对生物大分子施加外力(电场、磁场、各种长度的波......)。 br/ 也许是受到我自身专业领域的局限,AlphaFold 迄今带给我的震撼还赶不上冷冻电镜的革命,后者将我们从技术挣扎中解放出来,可以专注于结构带来的生物学发现本身。 br/ br/ AlphaFold 目前最成功的预测是针对单链分子,当然将来预测复合物的高精结构也应该不在话下。相比于对蛋白折叠的贡献,我倒是更希望 AI 能够助力 Molecular Dynamics Simulation(分子动力学模拟)。对结构生物学而言,这个领域才是亟需进步的。 br/ br/ 我个人认为生命是地球上最神奇的存在,那么多未知要探索,任何一次技术进步都是契机。该考虑的是如何把新技术为我所用,去问出、去探索更有意思的问题。 br/ 最后,当 AI 能够成功预测我们正在孜孜以求的生物大分子动态、原位高分辨率结构的时候,那失业的一定不止是结构生物学家、或者生物学家了 :p br/ br/ strong 各抒己见 /strong /p p style=" text-indent: 2em " strong br/ /strong 根据现在披露的结果,AlphaFold2 已经基本达到实验解析结构的精度。前天 AlphaFold2 团队的报告展示了新冠病毒 SARS-COV-2 的预测结果,说明 RNA 聚合酶这么大的蛋白也能基本预测准确。 /p br/ p style=" text-indent: 2em " 理论上,这会对结构生物学有很大冲击,尤其是以后单颗粒 cryo-EM 的实验方法上,是否还需要把分辨率做得那么高?低分辨率的电子密度图,甚至 SAXS 数据结合预测结果应该就能解决问题了。 br/ 但是,现实中的冲击不会那么大。这是因为,AlphaFold2 模型的创新性非常高,其中结合的 2D transformer 和 3D equivariant transformer 都是 AI 领域的前沿技术,模型的训练难度很大。 /p br/ p style=" text-indent: 2em " DeepMind 的训练方法在学术界很难复现,估计学术界要花几年的时间才能跟上,因此短期内 AlphaFold2 对结构生物学的影响会比较有限。DeepMind 可能会和个别实验室合作,预测蛋白质结构。 /p br/ p style=" text-align: right text-indent: 2em " ——& nbsp 龚海鹏(计算生物学家,清华大学结构生物学高精尖创新中心研究员) /p br/ br/ p style=" text-indent: 2em " AlphaFold 为结构生物学家提供了除晶体学、冷冻电镜、NMR 以外的另外一种手段,用于揭示生物大分子发挥作用的分子机制。 /p br/ p style=" text-align: right text-indent: 2em " —— 张鹏(结构生物学家,主要利用晶体学和冷冻电镜技术;中科院分子植物科学卓越创新中心研究员) /p br/ br/ p style=" text-indent: 2em " AlphaFold 目前还不能预测复杂的分子机器,主要是因为蛋白 - 蛋白相互作用非常复杂,存在极多的可能性。实验手段所揭示出来的蛋白 - 蛋白相互作用方式还只是冰山一角,更何况在不同生理条件和过程中的结构变化。因此,未来对有特定功能的、多个成分组成的、生物大分子复合体的结构解析,以及体内的结构分析,将成为结构生物学实验研究的主要内容。无论有没有 AlphaFold,结构生物学也正在朝这个方向发展。 /p p style=" text-indent: 2em " Rosetta(注:从头蛋白结构建模算法)也好,AI 也罢,结构预测都是基于已有的实验数据够大。没有足够的数据积累,这些基于统计和数据库的预测就无法实现。完全基于物理学和化学第一性原理的结构预测还没有出现。 br/ 实验科学永远是探索未知的必要手段。新的软件算法应该是成为实验科学家的更有力工具,而不是取代实验科学。 /p p br/ /p br/ p style=" text-align: left text-indent: 2em " —— 王宏伟(cryo-EM 专家,清华大学结构生物学高精尖创新中心执行主任,清华大学生命科学学院院长) br/ br/ br/ br/ & nbsp & nbsp & nbsp 最近两年,结构生物学领域经历了与围棋界类似的故事。Alphago Fan 版本时围棋界并不认为它能够战胜人类顶尖高手,可是 Alphago Lee 后整个围棋界甘拜下风,并且转向 AI 拜师学艺。2018 年 Alphafold 出现时,实验结构生物学领域认为被战胜的仅仅是传统的结构预测领域,2020 年 Alphafold2 之后,实验结构生物学领域应该开始思考如何与之共存以及如何「拜师学艺」了。 /p p style=" text-align: left text-indent: 2em " br/ & nbsp & nbsp & nbsp 目前阶段人工智能在围棋上已经远远超过人类顶尖棋手,但是人类围棋比赛并未因此取消,如同汽车发明后奥林匹克仍然在进行田径比赛一样。原因之一是人工智能虽然超越了人类,但并未解决围棋的最终解。同样的道理,对于复杂的结构生物学问题,预测手段本身还不能号称完全解决了问题。 /p p style=" text-align: left text-indent: 2em " br/ & nbsp & nbsp & nbsp 实验结构生物学领域接下来需要做的一个事情是要拥抱变化,更好地与预测方法结合以及共同发展。 /p br/ p style=" text-align: right text-indent: 2em " —— 周强(cryo-EM 专家,西湖大学生命科学学院特聘研究员) /p p br/ /p p br/ /p p style=" text-indent: 2em " 蛋白质体系越大,结构的解析越难仅依赖计算方法。Cryo-ET& nbsp (冷冻电镜断层成像)& nbsp 技术擅长解析体外难表达的大分子机器结构、细胞中的原位蛋白结构等复杂体系,因此很难被脱离实验手段的方法取代。目前,由于体系过于复杂,使用分子动力学模拟整颗病毒尚未实现,要模拟细菌、细胞、组织,还要很长的路要走。 /p p br/ /p
  • DeepMind遇上对手? Meta AI预测6亿蛋白质结构
    ESM宏基因组图谱数据库包含6.17亿个蛋白质的结构预测。(图片来源:ESM宏基因组图谱)  英国人工智能(AI)公司DeepMind今年公布了2.2亿个蛋白质的预测结构,几乎涵盖了DNA数据库中已知生物的所有蛋白质。现在,另一个科技巨头正在填补蛋白质宇宙中的暗物质。  美国Meta公司(前身为Facebook)的研究人员使用人工智能预测了约6亿个蛋白质的结构,这些蛋白质来自细菌、病毒和其他尚未被表征的微生物。相关研究11月1日发表于预印本网站BioRxiv。  “这些是非常神秘的蛋白质,为深入了解生物学提供了可能性。”Meta人工智能蛋白质团队研究负责人Alexander Rives说。  该团队使用“大型语言模型”生成了这些预测。“大型语言模型”是一种人工智能,可作为通过几个字母或单词预测文本的工具的基础。  通常语言模型是在大量文本的基础上进行训练的。为了将其应用于蛋白质,Rives团队将已知蛋白质序列“喂”给它们,这些蛋白质由20个不同的氨基酸链表示,每个氨基酸链由一个字母表示。然后,该模型学会了在氨基酸比例模糊的情况下“自动补全”蛋白质。  Rives说,这种训练使模型对蛋白质序列有了直观的理解,蛋白质序列包含了蛋白质形状的信息。  第二步,受DeepMind开创性蛋白质结构人工智能算法AlphaFold的启发,模型将这种洞察力与已知蛋白质结构和序列之间关系的信息相结合,从蛋白质序列中生成预测结构。  今年夏天早些时候,Rives团队报告称,其模型算法名为ESMFold,虽准确性不如AlphaFold,但在预测结构方面要快60倍左右。“这意味着我们可以将结构预测扩展到更大的数据库中。”Rives说。  作为一个测试案例,研究团队决定将模型应用于大规模测序的“宏基因组”DNA数据库,这些DNA来自环境,包括土壤、海水、人类肠道、皮肤和其他微生物栖息地。绝大多数编码潜在蛋白质的DNA条目来自从未被培养过的生物,也不为科学家所知。  Meta团队总共预测了超过6.17亿个蛋白质的结构,这项工作只花了两周时间。Rives表示,预测是免费的,任何人都可以使用,就像模型的底层代码一样。  在这6.17亿个蛋白质结构中,该模型认为超过1/3的预测是高质量的,因此研究人员可以确信蛋白质的整体形状是正确的,在某些情况下,模型可以识别更精细的原子级细节。值得一提的是,其中数以百万计的结构都是全新的,与实验确定的蛋白质结构数据库,或从已知生物体预测的AlphaFold数据库中的结构都不同。  AlphaFold数据库的很大一部分是由几乎相同的结构组成,而宏基因组数据库则涵盖了以前从未见过的蛋白质宇宙的很大一部分。  哈佛大学进化生物学家Sergey Ovchinnikov对ESMFold做出的数亿个预测表示怀疑。他认为,有些蛋白质可能缺乏确定的结构,而另一些可能是非编码DNA,被误认为是蛋白质编码材料。  德国慕尼黑工业大学计算生物学家Burkhard Rost对Meta公司模型的速度和准确性的结合印象深刻。但他质疑,宏基因组数据库预测蛋白质是否真的比AlphaFold的精确度更高。基于语言模型的预测方法,更适合快速确定突变如何改变蛋白质结构,这是AlphaFold无法做到的。  据DeepMind的一位代表说,该公司目前没有在其数据库中进行宏基因组结构预测的计划,但不排除在未来这样做的可能性。  韩国首尔国立大学计算生物学家Martin Steinegger认为,利用这类工具的下一步,显然是研究生物学中的暗物质。“这些宏基因组结构的分析很快就会出现爆炸式增长。”  相关论文信息:  https://doi.org/10.1101/2022.07.20.500902
  • 蛋白质结构预测哪家强?两大国际团队同日在顶刊开源代码
    蛋白质是生命的物质基础,每个蛋白质的氨基酸链扭曲、折叠、缠绕成复杂的结构,想要破解这种结构通常需要花很长的时间,甚至难以完成。截至目前,约有10万个蛋白质的结构已经用实验方法得到了解析,但这在已经测序的数10亿计的蛋白质中只占了很小一部分。  但“看清”蛋白的结构和人类的很多疾病机理、药物研发等等息息相关。在蛋白质结构解析的几十年历史中,X射线晶体学、核磁共振波谱学(NMR)、冷冻电镜(Cryo-SEM)技术纷纷发挥了巨大的贡献,但这些技术在科学界看来,都有着劳心劳力又价格高昂的缺点。  如何简单地通过蛋白质的氨基酸序列来预测其形状?如何能解答这一问题,了解生命运作方式的将打开截然不同的一扇窗。这种设想提出的50多年后,谷歌旗下人工智能公司DeepMind在去年12月的国际蛋白质结构预测竞赛CASP上投下重磅,他们开发的基于神经网络的新模型AlphaFold2击败了其他选手,在预测准确性方面达到接近人类实验结果,让整个结构生物学界震惊。北京时间7月15日,DeepMind团队在顶级学术期刊《自然》(Nature)以“加快评审文章”(Accelerated Article Preview)形式在线发表了一篇题为“Highly accurate protein structure prediction with AlphaFold”的论文,全面详述了半年前造成轰动的这一模型,并首次对外分享开源代码。该论文于今年5月11日提交,7月12日被接收。  DeepMind团队提供了一份声明,公司创始人兼首席执行官Demis Hassabis在声明中表示,去年在CASP14大会上我们揭晓了一个可以将蛋白质3D结构预测精确到原子水平的全新AlphaFold系统,此后我们承诺会分享我们的方法,并为科学共同体提供广泛、免费的获取途径。  “今天我们迈出了承诺的第一步,在《自然》期刊上分享AlphaFold的开源代码,并发表了系统的完整方法论,详尽细致说明AlphaFold是如何做到精确预测蛋白质3D结构的。作为一家致力于推动科学进步的公司,我们期待看到我们的方法将为科学界启发出什么其他新的研究方法,也期待很快能和大家分享更多我们的新进展。”Hassabis表示。值得一提的是,就在同一天,另一顶级期刊《科学》(Science)也在线发表了另一预测蛋白质结构的研究文章,题为“Accurate prediction of protein structures and interactions using a three-track neural network”。  来自华盛顿大学、哈佛大学、德克萨斯大学西南医学中心等团队的研究人员开发了新的深度学习工具RoseTTAFold,其拥有媲美AlphaFold2的蛋白质结构预测超高准确度,而且更快、所需计算机处理能力更低。同样,研究团队也对外分享了开源代码。该论文提交于6月7日,7月7日被接收。  清华大学生命科学学院院长、高精尖中心执行主任王宏伟表示,“高质量结构预测的源代码开放对整个科学界尤其是结构生物学领域的促进作用必然是巨大的。”他评价道,对于DeepMind这样一家商业公司来说,“团队愿意向公众分享代码,是一个新型科研范式的突破,将整体上有利于人类更好地探索未知。”  预测蛋白质结构,接近实验室测量  50多年前,科学家们就设想用计算机预测蛋白质结构。近年来,共同演化、接触图预测、深度机器学习等技术的引入,一些实验室的算法精度有了很大程度的提高。  曾经开发出Alphago、战胜人类顶尖棋手的DeepMind团队是其中的佼佼者,其团队的强大和资源雄厚是一般实验室无法企及的。2020年12月1日,他们在生物领域展现出实力,在两年一度的权威蛋白质结构预测评估竞赛(CASP)中用AlphaFold2击败其他参赛团队。  CASP是由马里兰大学John Moult教授等人于1994年组织。竞赛使用的是最新解决且尚未在蛋白质数据库(PDB)中存放或公开披露的结构,结构生物学家们利用X射线晶体学、核磁共振波谱学、冷冻电镜的方法,把这些蛋白质的结构解析出来。做蛋白质结构预测的团队则利用计算机程序来预测它们的结构。最后由独立的科学家团队则把计算机预测的模型和实验室的结构对照,分析不同计算机算法的预测结果。这是一种“双盲”测试,长期以来一直是评价结构预测准确性的金标准。  去年的CASP14共有84个常规题目,其中有14题因为生物实验没给出确定结构等原因被取消或延缓,其他70个题目的单体和复合物蛋白质所含有的氨基酸个数从73到2180不等。  19个国家的215个小组参加了CASP14。DeepMind公司的AlphaFold2预测的大部分结构达到了空前的准确度,不仅与实验方法不相上下,还远超解析新蛋白质结构的其他方法。将实验方法得到的蛋白质结构叠加在AlphaFold2的结构上,组成蛋白质主链骨架的叠加原子之间的距离中位数(95%的覆盖率)为0.96埃(0.096纳米)。成绩排第二的方法只能达到2.8埃的准确度。  AlphaFold2的神经网络能在几分钟内预测出一个典型蛋白质的结构,还能预测较大蛋白质(比如一个含有2180个氨基酸、无同源结构的蛋白质)的结构。该模型能根据每个氨基酸对其预测可靠性进行精确预估,方便研究人员使用其预测结果。  AlphaFold2最终被Moult评价道,“在某种意义上,问题已经解决了”。  值得一提的是,在最新发布的论文中,DeepMind还简化了AlphaFold2。AlphaFold的首席研究员John Jumper说,“这个网络需要几天的计算时间来生成CASP的一些蛋白质的结构,而开源版本的速度要快16倍。根据蛋白质的大小,它可以在几分钟到几小时内生成结构。”  受AlphaFold2的启发,华盛顿大学医学院生物化学家、蛋白质设计研究所所长David Baker等人开发了RoseTTaFold。华盛顿大学医学院官网对该研究的介绍称,在高精度的蛋白质结构预测方面,Baker等人“在很大程度上重现了DeepMind团队的表现。”  相较于AlphaFold2只解决了单个蛋白质的结构,RoseTTaFold不仅适用于简单的蛋白质,也适用于蛋白质复合物。据介绍,RoseTTaFold利用深度学习技术,根据有限信息准确、快速地预测蛋白质结构。从结构上来看,RoseTTAFold 是一个三轨(three-track)神经网络,它可以兼顾蛋白质序列的模式、氨基酸如何相互作用以及蛋白质可能的三维结构。在这种结构中,一维、二维、三维信息来回流动,使得网络能够集中推理蛋白质的化学部分与它的折叠结构。巴塞尔大学的计算结构生物学家Torsten Schwede对《科学》杂志说,许多生物功能依赖于蛋白质之间的相互作用。“直接从序列信息中处理蛋白质-蛋白质复合物的能力使其对生物医学研究中的许多问题极具吸引力。”  Baker同时坦言,AlphaFold2的结构更加准确。但是根特大学的结构生物学家Savvas Savvides说,Bake实验室的方法更好地捕捉到了“蛋白质结构的本质和特性”,比如识别从蛋白质侧面伸出的原子串,这些特征是蛋白质之间相互作用的关键。  纽约大学医学院的细胞和结构生物学家Gira Bhabha说,两种方法都很有效。她表示,“DeepMind和Baker实验室的进展都是惊人的,将改变我们利用蛋白质结构预测推进生物学的方式。”  开源代码,如何促进整个科学界?  相比于去年年底带来的震撼,这次外界更感兴趣的是上述两支团队开源代码这一动作。  此前的6月中旬,在Baker实验室发布RoseTTAFold预印本三天之后,DeepMind的Hassabis在推特上表示,AlphaFold2的细节正在接受一份出版物的审查,公司将“为科学界提供广泛的免费访问”。  而从6月1日开始,Baker等人已经开始挑战他们的方法,让研究人员发送来他们最令人困惑的蛋白质序列。加州大学旧金山分校的结构生物物理学家David Agard的研究小组发送了一组没有已知类似蛋白质的氨基酸序列,几个小时内,他的团队就得到了一个蛋白质模型,“这可能为我们节省了一年的工作。”Agard说。  除了免费提供RoseTTaFold的代码外,Baker团队还建立了一个服务器,研究人员可以插入蛋白质序列并得到预测的结构。贝克说,自从上个月推出以来,该服务器已经预测了大约500人提交的5000多种蛋白质的结构。  不过,上述两支团队的源代码都是免费的,但也有观点认为,对于没有技术专长的研究人员来说,它可能还不是特别有用。不过,DeepMind的科学人工智能负责人Pushmeet Kohli表示,DeepMind已经与一些选定的研究人员和组织合作,以预测特定的目标,其中包括总部位于瑞士日内瓦的非营利组织“Drugs for ignored Diseases”。“在这个领域,我们还有很多想做的事情。”  Hassabis提到,去年在CASP14大会上我们揭晓了一个可以将蛋白质3D结构预测精确到原子水平的全新AlphaFold系统,此后我们承诺会分享我们的方法,并为科学共同体提供广泛、免费的获取途径。“今天我们迈出了承诺的第一步,在《自然》期刊上分享AlphaFold的开源代码,并发表了系统的完整方法论,详尽细致说明AlphaFold是如何做到精确预测蛋白质3D结构的。作为一家致力于推动科学进步的公司,我们期待看到我们的方法将为科学界启发出什么其他新的研究方法,也期待很快能和大家分享更多我们的新进展。”  DeepMind团队认为,这一精准的预测算法可以让蛋白质结构解析技术跟上基因组革命的发展步伐。  Baker团队也提到,“我们希望这个新工具将继续造福整个研究界。”  中国科学院合肥物质科学研究院强磁场科学中心研究员谢灿对澎湃新闻(www.thepaper.cn)记者表示,“总的来说,对学术界来肯定是好事,肯定会促进结构生物学和相关领域的发展。在承认学术贡献的基础上的开放和共享,本来就应该是学术研究最基本的要求。”  结构生物学是谢灿的“老本行”,“我当年花了8年的时间去解析一个蛋白的晶体结构,我能切身体会如果有一个精准预测蛋白结构的算法出现,对结构生物学家意味着什么。”  但他认为,不必要担忧这些算法的出现会让结构生物学家失业,在技术迭代之下,结构生物学这些年受到的冲击太多了,“而事实上,只不过是某一个领域某一个技术在某一个历史阶段更容易出工作出成绩。”谢灿认为,无论再精准的预测,终究也只是预测,“AlphaFold2不是实验,同样也需要实验去证实。”  王宏伟在AlphaFold2刚出现之时也曾评价道,对于复杂的结构生物学问题,预测手段本身还不能号称完全解决了问题。实验结构生物学领域接下来需要做的一个事情是要拥抱变化,更好地与预测方法结合以及共同发展。
  • 大连化物所:基于nMS表征影响蛋白质结构的分子机制
    近日,连化物所生物分子结构表征新方法研究组(1822组)王方军研究员、刘哲益副研究员团队与西南交通大学封顺教授团队合作,利用我所自主搭建的高能紫外激光解离—串联质谱仪器,揭示了质子化氨基酸侧链的正电荷在电喷雾离子化过程中影响蛋白质结构的分子机制,为质谱精确表征蛋白质高级结构提供了参考。非变性质谱(nMS)是研究蛋白质及其复合物组成和高级结构的前沿质谱技术。在nMS分析中采用生物兼容溶液和非变性电喷雾离子化将蛋白质从液相转移至气相并保持高级结构和相互作用。然而带正电荷的质子化氨基酸侧链在失去水分子的溶剂化稳定作用后,会与空间接近的蛋白骨架羰基形成氢键,通过分子内溶剂化稳定侧链正电荷。虽然有报道通过离子迁移—质谱检测到了分子内溶剂化引起的蛋白质碰撞截面积变化,但是对其发生的具体位点和引起结构变化的区域仍然缺乏有效分析手段进行精确表征。在本工作中,研究团队利用我所自主搭建的高能紫外激光解离—串联质谱仪器和蛋白质光解离质谱数据处理软件系统,通过蛋白质紫外光解离碎片离子的价态分布和位点解离碎片产率分析,探测到肌红蛋白带电残基侧链分子内溶剂化的具体位点,以及对蛋白质结构影响的区域位置。团队系统表征了不同价态(质子化数目)下的蛋白质结构差异,发现高电荷价态下蛋白质气相结构易受分子内溶剂化效应的影响而偏离溶液态结构,低电荷蛋白质离子的气相结构更加接近溶液状态。研究团队进一步证明,冠醚18C6与蛋白质带电侧链的络合主要发生在溶液中,随后在电喷雾离子化过程中起到稳定蛋白质结构的作用。紫外激光解离质谱分析揭示冠醚主要结合在蛋白质离子的高电荷密度区域,通过阻断带电侧链的分子内溶剂化使蛋白质气相结构更加接近溶液状态。相关研究结果展示了高能紫外激光解离质谱在同时获取蛋白质序列和动态结构信息中的显著优势,为nMS表征中蛋白质溶液结构的保持和高效表征提供了重要的理论和技术参考。近年来,我所王方军和肖春雷研究员通过交叉学科联合创新攻关,在大连相干光源搭建了高能紫外激光解离—串联质谱实验线站,兼容50-150nm极紫外自由电子激光和193nm准分子激光解离模式,已在多肽(Anal. Chim. Acta,2021)、蛋白质(Cell Chem. Biol.,2022)、金属团簇(J. Phys. Chem. Lett.,2020;Sci. China Chem,2022)等大分子体系的解离和结构表征中取得了系列研究成果。相关研究成果以“Ultraviolet Photodissociation Reveals the Molecular Mechanism of Crown Ether Microsolvation Effect on the Gas-Phase Native-like Protein Structure”为题,于近日发表在《美国化学会志》(Journal of the American Chemical Society)上。该工作的共同第一作者是我所1822组联合培养硕士研究生周伶强和刘哲益。
  • 大连化物所利用原位化学交联—质谱技术解码细胞中蛋白质动态结构
    近日,大连化学物理研究所生物技术研究部生物分子高效分离与表征研究组(1810组)赵群研究员和张丽华研究员等人与中国科学院精密测量科学技术创新研究院龚洲副研究员合作,提出了利用原位化学交联—质谱技术(in vivo XL-MS),解码细胞中蛋白质动态结构的策略。该策略将AlphaFold2的结构作为先验信息,结合in vivo XL-MS数据与多种结构计算方法评估结构与交联信息的匹配度,重构了细胞内多种蛋白质,尤其是多结构域蛋白质和固有无序蛋白质(intrinsically disordered protein,IDP)的原位动态结构。为深入研究蛋白质在细胞微环境中发挥功能的分子机制提供技术支撑。活细胞内蛋白质的原位动态结构对于揭示其生物学功能至关重要。随着深度学习算法助力蛋白质结构预测的发展迭代,AlphaFold2实现了对蛋白质结构的全面预测,然而该方法对柔性区域的结构预测仍面临挑战。近年来,in vivo XL-MS以高通量、高灵敏,且对蛋白质纯度要求低等优势,在解析活细胞内蛋白质的原位动态结构方面展示出重要潜力。张丽华团队一直致力于in vivo XL-MS新技术研究,实现了蛋白质原位构象和相互作用的规模化解析(Anal. Chem.,2020;Anal. Chem.,2022;Anal. Chem.,2022;Anal. Chem.,2022;Anal. Chem.,2023;Angew. Chem. Int. Ed.,2023;Nat. Commun.,2023)。   本工作中,针对多结构域蛋白质,研究团队提出了将结构域作为整体,利用结构域间的XL-MS数据对细胞内蛋白质动态结构建模,实现了三种多结构域蛋白质——钙调蛋白、hnRNP A1和hnRNP D0在细胞内的动态结构表征。此外,针对IDP,研究团队提出了两种互补的结构表征策略:一是将XL-MS信息直接转换为距离约束用于IDP的结构计算,二是首先使用全原子分子动力学模拟进行无偏采样,然后基于XL-MS数据对采样结构进行评估和筛选。利用这两种策略,研究团队解码了高迁移率组蛋白HMG-I/Y和HMG-17在细胞内的动态系综构象。   上述成果以“Decoding Protein Dynamics in Cells Using Chemical Cross-Linking and Hierarchical Analysis”为题,于近日发表在《德国应用化学》(Angewandte Chemie International Edition)。该工作的第一作者是1810组博士研究生张蓓蓉。该工作得到了国家重点研发计划、国家自然科学基金、中国科学院青促会等项目的资助。
  • 中山大学李惠琳:非变性质谱技术推动蛋白质结构研究,助力新药研发
    蛋白质是生命的物质基础,通过与不同生物分子间的相互作用在生物体内执行着各项重要工作,其功能与结构直接相关。因此,解析蛋白质及其复合物高阶结构对于深入理解蛋白质功能、生理现象及药物研发具有重要意义。过去的60余年,随着X-射线晶体衍射(X-ray)、核磁共振(NMR)以及冷冻电镜(cryoEM)等技术的出现和不断发展,蛋白质结构解析取得了长足发展。然而,如何在分析蛋白质时使其保持近似自然生理环境的非变性状态,对其动态、异质性、相互作用等属性的研究是结构生物学领域的热点和难点。  质谱技术的不断发展使其在蛋白质结构表征领域发挥了越来越重要的作用。非变性质谱(native MS)兴起于20世纪90年代,是一种可以分析蛋白高阶结构的生物质谱方法。与传统的破坏蛋白质立体结构和弱相互作用力的方法不同,非变性质谱采用质谱兼容的近生理pH值的溶液体系(主要为醋酸铵)和更温和的电离方式,使生物大分子在气相中能够最大程度地保持自然折叠状态、非共价相互作用和相关的生物学功能。因此,非变性质谱可以提供分子质量、寡聚态、构象(折叠vs 去折叠)、异质性、配体结合、靶蛋白-小分子亲和力以及复合物中蛋白亚基的相互作用网络关系等更具生物学意义的重要信息,为蛋白质“序列-结构-功能”关系提供分子基础,已成为结构生物学不可或缺的互补工具,在生物制药、蛋白一配体、蛋白一蛋白复合物结构分析等诸多领域具有广泛应用。  近年来,蛋白质结构研究领域经历着剧烈的技术迭代。2021年人工智能(AI) AlphaFol2横空出世,将蛋白质3D结构预测的精度从60%提升到90%以上,在给传统结构解析技术带来冲击的同时,也为结构质谱的发展提供了契机。  未来,非变性质谱技术的发展需要简化样品处理,提升仪器的灵敏度、分析通量和鲁棒性,实现内源性蛋白复合物样本的直接或原位分析,推动其在生物医药表征、蛋白多聚态等领域的更广泛应用。非变性质谱技术与离子消度(MS)、自上而下串联解离(top-down)、电荷检测质谱(CDMsS)等创新联用技术和方法的不断开发及完善,将极大地提升结构信息的广度、丰富度及精确度,补充生物物理学方法缺失的结构信息。同时,非变性质谱与cryoEM1、氢完交换质谱(HDX-MS)、交联质谱等技术联用将更加常态化,这些实验数据与AI结构预测算法的进一步整合将有效解决蛋白及蛋白复合物结构预测存在的精度问题,推动结构生物学发展,助力新药研发。  此外,非变性质谱技术的应用发展将更加关注:1)蛋白复合物结构一功能关系的研究,通过与计算机模拟(MD)、HDX-Ms、cryoEM等技术联用,揭示标志物蛋白在人类疾病发展过程中的作用,推动靶向药物设计和精淮医疗 2)通过研究小分子与靶蛋白的相互作用获取二者结合的亲和力信息,加速靶向药物筛选 3)翻译后修饰(PTMS)、突变等因素导致的蛋白高度异质性及其对蛋白或亚基折叠动力学、构象及构象变化、结合计量比等造成的结构和功能影响 4)蛋白与其他生物分子(配体、DNAA/RNA、金属离子等)之间的相互作用。  李惠琳,中山大学药学院教授,博士生导师。主要从事生物大分子质谱新技术的开发及应用,其研究主要侧重于1)开发整合结构质谱技术,并对蛋白质机器结构、功能和动态变化及靶向药物作用分子机制进行深入研究2)开发middle-down/top-down蛋白质组学技术,探索蛋白翻译后修饰在生命过程中的调控机制。承担国家自然科学基金项目3项,荣获美国质谱学会颁发的Postdoctoral Career Development Award (2014) ,入选珠江人才计划(青年拔尖人才,2019),其研究成果发表在Nature Chemistry, Analytical Chemistry, J. Am.Soc.Mass Spectrom.等杂志。  "非变性质谱技术研究与应用"专栏共收录7篇论文,既介绍了非变性质谱技术的样品制备、离子源、质量分析器、联用技术等基础内容,也涵括了样品提取、样品引入、离子化及电荷操控等方式,以及在蛋白结构及构象解析、蛋白・蛋白相互作用等领域的应用,代表了国内非变性质谱技术的发展现状。希望本专栏能成为《质谱学报》广大读者颇有价值的科技文献,同时也希望更多的学者加入到非变性质谱研究领域,推动我国结构质谱技术的创新发展。
  • 利用自上而下质谱对蛋白质高阶结构和动力学进行时间分辨表征的微流控平台
    大家好,本周为大家分享一篇发表在Analytical Chemistry上的文章,Microfluidic Platform for Time-Resolved Characterization of Protein Higher-Order Structures and Dynamics Using Top-Down Mass Spectrometry [1],文章的通讯作者是北京大学生物医学前沿创新中心的王冠博教授和中国科学院深圳先进技术研究院的门涌帆副研究员。  蛋白质的高阶结构和动力学特性对理解蛋白质的生物学功能和揭示其潜在机制至关重要。自顶向下质谱法(Top-down MS)在完整蛋白水平和肽段碎片水平都能获得结构信息。非变性Top-down MS可以分析蛋白质复合体的结构以及完成亚基鉴定和修饰分析。自顶向下氢/氘交换质谱(Top-down HDX MS)为构象或结合界面分析提供了高空间分辨率,并实现了构象特异性表征。微流控芯片可以为这些质谱工作流程的前端反应提供优越的平台。然而,目前大多数质谱微芯片装置是为Bottom-up或Top-down蛋白质组学设计的。本文中,作者提出了一种用于蛋白质高阶结构和动态Top-down MS分析的芯片设计策略。它适用于时间分辨的非变性质谱和HDX质谱,该设计旨在有效电离完整的蛋白质复合物,灵活控制多种反应物流动,并在较大的流速范围内精确控制反应时间在亚微升/分钟。本文通过对单克隆抗体、抗体-抗原复合物和共存蛋白构象等体系的分析来验证该装置的性能。  TDK-MS(Top-down and kinetic MS)芯片的结构如图1A所示,该方法可以有效电离完整的蛋白质,包括单克隆抗体(mAb)和抗体-抗原复合物(图1 B, C)。  图1. 完整蛋白质和蛋白质复合体在非变性条件下的高效电离  虽然分析蛋白质组合化学计量学和监测构象变化需要保持蛋白质高阶结构和非共价相互作用的完整性,然而为了推导结构信息或在串联MS中展开蛋白质以提高碎裂效率,往往需要不同程度的变性来产生亚复合体,因此变性剂的浓度和变性的时间对变性程度至关重要。本文中,作者采用交错人字微结构(Herringbone microstructure, HM)(图2A, B),并对其性能进行了评估(图2C−E)。如此高的混合效率为进一步微型化芯片混合模块提供了可能。在监测Mb的变性时,作者使用TDK-MS芯片和商用混合三通管平行混合holo-Mb溶液(5 μM)与乙腈(ACN),并比较它们在混合比例变化时的响应(图2F)。TDK-MS芯片在非变性和变性条件之间切换的快速响应通过NIST mAb的变性得到了证明,在向NIST mAb溶液中添加甲酸后,响应时间小于5分钟(图2G)。  图2. 高效混合和快速响应的流体控制  微芯片的灵活通道设计允许引入独立控制的溶液。例如,尽管酸和有机溶剂都能诱导变性,但这两种变性剂同时存在时,对变性途径的影响是不同的。Mb和Hb是血红素蛋白,其中血红素基团分别非共价连接在1条多肽链和4条非共价组装链上,因此这是研究共存复合体解离动力学和亚基构象变化的理想模型。将5 μM holo蛋白溶液与ACN和FA按一定的混合比例依次混合,可以通过解离产物的出现和蛋白质离子电荷态分布的变化来表征复杂的解离和蛋白质的展开。在固定ACN浓度下,随着FA浓度从0.01增加到0.3% (v/v),依次观察到的主要现象是血红素丢失、apo-Mb展开以及折叠的holo-Mb转化为展开的apo-Mb(图3A)。相比之下,在FA浓度恒定的情况下,当ACN从1增加到50%时,Mb主要表现为血红素损失,只有中等程度的apo-Mb展开,这可能是由于展开的部分迅速聚集(图3B)。  图3. (A)增加FA浓度,固定ACN浓度和(B)增加ACN浓度,固定FA浓度时获得的Mb和Hb的质谱图。  在HDX MS检测中,TDK-MS芯片提供了快速和有效的氘代及淬灭,精确控制HDX反应时间,并在2H-标记形式下高效电离完整蛋白质(图4)。  图4. 2H标记完整的(A)Mb、(B)Hb α亚基和(C)Hb β亚基在不同反应时间下的HDX质谱图  由于过大的流速不利于电离效率,并且有可能会增加堵塞或流动中断的风险,因此流速应保持在最佳范围内,这又限制了混合通道中HDX时间的可调节范围,从而影响了HDX动力学分析的灵活性。为了解决这一问题,作者设计了一个具有多个不同长度反应通道的混合模块,在不更换芯片的情况下,除了改变流速外,还可以通过通道切换在更大范围内调整反应时间。在原型芯片中,5个不同长度的通道可以在对蛋白质电离和流动稳定性都最优的流速下,产生从几秒到几分钟不等有效的HDX时间(图5)。  图5. Top-Down HDX MS 分析  本文中作者开发的策略将有利于生物大分子结构的精细分析,并有助于质谱微芯片的方法开发。
  • 解决生物学50年来的重大挑战!生物界“AlphaGo”精准预测蛋白质结构
    p style=" text-indent: 2em " 提到DeepMind公司,我们首先想到的可能是几年前,它开发的人工智能AlphaGo“横扫”顶尖人类围棋职业选手,变革了围棋的思考方式。除了在棋类比赛中所向披靡以外,DeepMind也在加速科学发现上迈出了重要一步。今日,DeepMind宣布,其新一代AlphaFold人工智能系统,在国际蛋白质结构预测竞赛(CASP)上击败了其余的参会选手,能够精确地基于氨基酸序列,预测蛋白质的3D结构。其准确性可以与使用冷冻电子显微镜(CryoEM)、核磁共振或 X 射线晶体学等实验技术解析的3D结构相媲美。这一突破被多家媒体称为“变革生物科学和生物医学”的突破。前基因泰克(Genentech)首席执行官Arthur D. Levinson博士称这一成就为“划时代的进步”(once in a generation advance)。 /p p style=" text-align: center text-indent: 2em " img style=" max-width:100% max-height:100% " src=" https://img1.17img.cn/17img/images/202012/uepic/33325072-7059-48e8-b1d4-6321cae2e263.jpg" title=" 微信图片_20201201221037.png" alt=" 微信图片_20201201221037.png" / /p p style=" text-align: center text-indent: 2em " span style=" font-size: 12px " 图片来源:DeepMind Blog /span /p p br/ /p p style=" text-indent: 2em " strong 生物学50年来的重大挑战 /strong /p p br/ /p p style=" text-indent: 2em " 我们都知道,蛋白质对生命来说是不可或缺的,它们支持生物体的几乎所有功能。这些复杂的大分子由氨基酸链构成,而蛋白质的功能很大程度上决定于它的3D结构。生物医学领域的众多挑战,包括开发治疗疾病的创新疗法,依赖于对蛋白质结构和功能的理解。 /p p br/ /p p style=" text-indent: 2em " 在过去的五十年中,科学家们已经能够利用冷冻电子显微镜、核磁共振或 X 射线晶体学等实验手段在实验室中确定蛋白质的形状,但每种方法都依赖于大量的试错,耗时耗力,可能需要花上好几年时间。1972年,诺贝尔化学奖得主Christian Anfinsen博士表示,理论上,蛋白质的氨基酸序列应该能够完全决定它的3D结构。这一假说激发了50年来基于氨基酸序列,通过计算方法预测蛋白质3D结构的探索。 /p p br/ /p p style=" text-indent: 2em " 然而,这一领域面临的重大挑战是理论上,氨基酸链可能形成的蛋白质构象的数目是个非常庞大的天文数字。有学者估计,一个典型的蛋白质理论上可以形成10的300次方(1后面加300个0)个可能构象。然而在自然界,蛋白质能够自发地在几毫秒内,迅速折叠成其中一个构象。用什么样的计算方法,才能从10的300次方的可能构象中找到那个正确的构象? /p p br/ /p p style=" text-indent: 2em " strong AlphaFold:生物界的“AlphaGo” /strong /p p br/ /p p style=" text-indent: 2em " DeepMind的研究人员把折叠好的蛋白质设想成一幅具有3D结构的“空间图画”(spatial graph),而氨基酸则是这副“空间图画”中节点和线条。基于神经网络系统,他们设计了AlphaFold系统来解析这一空间图画的结构。它使用了进化相关的氨基酸序列,多序列对比(multiple sequence alignment, MSA)以及对氨基酸对(amino acid pairs)的评估来优化“空间图画“的描绘。 /p p style=" text-align: center text-indent: 2em " img style=" max-width:100% max-height:100% " src=" https://img1.17img.cn/17img/images/202012/uepic/7ffebf8d-21e2-421e-bff5-adf328b90caf.jpg" title=" 微信图片_20201201221204.png" alt=" 微信图片_20201201221204.png" / /p p style=" text-align: center text-indent: 2em " ▲AlphaFold的神经网络模型构架(图片来源:DeepMind Blog) /p p br/ /p p style=" text-indent: 2em " 研究人员使用蛋白质数据库中接近17万个不同的蛋白质结构,以及包含未知结构的蛋白序列数据库对AlphaFold进行训练。通过不断地迭代,AlphaFold系统学习到了基于氨基酸序列,精确预测蛋白结构的能力。 /p p br/ /p p style=" text-indent: 2em " 与实验结果相差无几的蛋白质结构预测 /p p br/ /p p style=" text-indent: 2em " 国际蛋白质结构预测竞赛(CASP)是由马里兰大学的John Moult教授和加州大学戴维斯分校的Krzysztof Fidelis教授联合创建的国际性比赛,旨在评估、促进和确认最佳的蛋白质结构预测手段。CASP选择已经通过实验手段解析,但是尚未公布的蛋白质结构作为目标,让世界各地的研究团队运用自己的计算手段预测它们的结构。一个独立的团队会评估预测结构与通过实验手段解析的蛋白结构之间的差异。 /p p br/ /p p style=" text-indent: 2em " 2018年,DeepMind开发的第一代AlphaFold首次参加CASP并且拔得头筹。而今年,新一代的AlphaFold在CASP中的表现更为惊艳。CASP使用称为GDT的评分系统来评估预测蛋白结构的精确性。这个评分从0到100,如果评分达到90分以上,可以认为预测的结构与实验手段获得的结构相当。 /p p style=" text-align: center text-indent: 2em " img style=" max-width:100% max-height:100% " src=" https://img1.17img.cn/17img/images/202012/uepic/87def9e4-8753-401b-9fa9-3ada59e01d7b.jpg" title=" 微信图片_20201201221209.png" alt=" 微信图片_20201201221209.png" / /p p style=" text-align: center text-indent: 2em " strong ▲2006-2020年CASP比赛中最佳蛋白折叠预测系统的评分表现(图片来源:DeepMind Blog) /strong /p p br/ /p p style=" text-indent: 2em " 在今年的CASP中,AlphaFold系统对所有蛋白靶点3D结构预测的中位GDT评分为92.4分。即便是针对最难解析的蛋白靶点,AlphaFold的中位GDT评分也达到了87.0分。在接受检验的近100个蛋白靶点中,AlphaFold对三分之二的蛋白靶点给出的预测结构与实验手段获得的结构相差无几。CASP创始人Moult教授表示,在有些情况下,已经无法区分两者之间的区别是由于AlphaFold的预测出现错误,还是实验手段产生的假象。 /p p style=" text-align: center" br/ /p p style=" text-indent: 2em " img src=" https://img1.17img.cn/17img/images/202012/uepic/14003fd2-fbf1-4fc4-b34a-087e4fa5f63d.jpg" title=" 微信图片_20201201221209.png" alt=" 微信图片_20201201221209.png" style=" max-width: 100% max-height: 100% " / /p p style=" text-align: center text-indent: 2em " ▲AlphaFold根据氨基酸序列预测的蛋白结构与实验手段解析的结果几乎完全重合(绿色,实验结果;蓝色,计算预测结果;图片来源:DeepMind Blog) /p p br/ /p p style=" text-indent: 2em " strong 对真实世界的影响 /strong /p p br/ /p p style=" text-indent: 2em " 在今年早些时候,DeepMind已经利用这一系统预测了多种新冠病毒蛋白的结构。后续的实验显示, strong AlphaFold预测的新冠病毒Orf3a蛋白结构与冷冻电镜解析的结构非常相似。 /strong /p p br/ /p p style=" text-indent: 2em " 虽然,AlphaFold不见得会取代冷冻电子显微镜等其它实验手段,但是DeepMind的研究人员表示,这一令人兴奋的结果表明,生物学家们可以使用计算结构预测作为科学研究的核心工具之一。这一手段对于特定类型的蛋白来说可能尤为便利,例如膜蛋白一直非常难于结晶,因此很难用实验手段获得它们的结构。 /p p br/ /p p style=" text-indent: 2em " 而对于从事计算和机器学习研究的DeepMind团队来说,AlphaFold的表现证明了AI在辅助基础科学发现方面惊人的潜力。该团队在公司发布的博文中表示,他们相信,AI将成为人类拓展科学知识前沿最有力的工具之一! /p p br/ /p
  • 天池大赛-冷冻电镜蛋白质结构建模大赛圆满落幕
    随着云计算技术的加持,生命科学行业加速驶向了快车道。为更好地推动这一前沿学科的发展和人才培养,阿里云联合英特尔(中国)面向全球开发者,组织了天池大赛—“创新大师杯”冷冻电镜蛋白质分子结构建模大赛,致力于探索智能计算在生命科学领域的应用与创新。本次挑战赛吸引了全球1917支高水平队伍参赛,横跨美国、新加坡、印度等41个国家和地区,不仅有世界顶尖院校参加,还吸引了中国科学院、国家超算中心、国家数字化工程中心、字节跳动、科大讯飞等知名的科研机构和企业参加。经过数月激烈角逐,在2022年8月5日,阿里云召开的生命科学与智能计算峰会上,本届大赛颁奖典礼也如期举行。  蛋白质的空间结构是结构生物学的关键研究对象,其对于理解蛋白质功能以及相关生物学过程的工作机理有非常重要的意义。准确的蛋白质结构原子模型不仅能够帮助研究者在理论上理解生命活动的内在原理,同时也能为药物研发等诸多工程实践提供指导。  枚举每一种蛋白质可能存在的结构,需要花费大量的时间。最近,在强大的算法与算力的支持下,DeepMind将运算时间从数月缩短至了数小时。AI生物学带来了极致的效率革命,这对于人类攻克癌症等疑难杂症有着划时代的意义。要在数据洪流的时代实现重大的科学突破、分析基因组数据,应用于药物研发、疾病检测、个性化治疗,依赖于高效便捷的大数据分析技术和强大的计算平台支持。蛋白质破解的事件是一个标志,在生命科学领域取得突破性进展还需要高效的HPC系统和强大的算力,分析计算复杂、散点化、非结构化的生物医学大数据。  本次大赛基于阿里云弹性高性能计算(Elastic High Performance Computing,E-HPC)进行。阿里云E-HPC平台,基于阿里云基础设施,可灵活生产基于任何ECS实例构成的HPC集群,满足不同应用特征的性价比要求。阿里云E-HPC主要面向教育科研、企事业单位和个人,提供快捷、弹性、安全的一站式公共云HPC服务。计算实例基于intel第三代至强可扩展处理器(CooperLake),通过高效、面向未来的服务器基础设施提供卓越的性能和灵活性,推动新的业务突破和科学发现。深度学习加速和增强型AVX-512等内置优势提供了人工智能和HPC的融合以及工作负载性能。同时运用基于IceLake的Software Guard Expressions技术,通过内存中独立于操作系统或硬件配置的应用程序隔断,提供细粒度的数据保护。  本次大赛意在探索基于大数据训练的人工智能方法在由电势能分布获取蛋白质原子模型方面的潜力,为未来云计算和生命科学领域的人才储备。
  • 布鲁克在ASMS 2016推出蛋白质结构分析解决方案—HDX Solution
    布鲁克在第64届美国质谱年会(ASMS 2016)宣布推出布鲁克HDX Solution —氢氘交换解决方案。BHDX解决方案将LEAP H/D-X PAL自动样品处理系统与布鲁克maXis II ETD UHR-QTOF质谱系统以及HDExaminer软件相结合,提供了一套自动可靠的HDX-MS工作流。Bruker HDX解决方案通过H/D比值获得单一同位素精确定量分析结果,为深入了解生物分子结构提供可靠依据。  这些年来,生物制药表征分析需要对生物蛋白的空间构象有更加深入的了解,还要了解多种因素如pH值、温度和压力等对蛋白的影响。对于这一挑战,HDX-MS已经成为了一种有价值的分析技术。生物制药分析方法需要运用强大的分析统计工具,自动化的提供高质量数据。HDX-MS已成为生物制药领域的常规而可靠的分析方法。  关键结构的鉴定、药物/蛋白的解析以及蛋白之间相互作用、蛋白质构象变化等是目前生物治疗发展过程中面临的关键问题。Bruker HDX解决方案使得液相分离和MS/MS检测自动化,简化数据分析和解析工作,并能获得可靠的蛋白结构解析结果。  布鲁克道尔顿生物制药副总裁Bob Galvin博士评论说:“最新Bruker HDX解决方案的推出,进一步加强了布鲁克生物表征产品系列,使得生物制药领域的研究者能够更快、更准确的深入了解到蛋白质构象和相互作用。”关于HDX解决方案  Bruker HDX解决方案提供了完整的工作流程,将LEAP H / DX PAL自动进样器应用于预定标记实验,并结合了UHPLC系统与高分辨质谱系统。maXis II ETD UHR-QTOF质谱系统的质量准确度达到ppm级以下,高灵敏度与同位素保真度提高了系统获取准确H/D比值的能力。再加上HDX-MS解析软件Sierra Analytics HDExaminer的应用,创造了更大的应用空间与简便的应用环境。LEAP H / DX PAL自动进样器与maXis II ETD UHR-QTOF质谱系统  在市场处于领先的超高质量分辨率QTOF质谱与ETD(电子转移解离)能力结合,开创了布鲁克maXis II系统HDX-MS实验的新纪元。比起在肽段水平的研究,在更微量水平的探索能更容易的提供特异性识别位点。LEAP H/D-X PAL自动进样设备将稳健可靠的样品处理整合到布鲁克HDX 解决方案。革新的时间安排软件能够自动安排样品处理步骤,包括贴标签、培养、消化和灭活等,提高LC的效率与整个实验室效率。  用HDExaminer软件获得的信息可用于研究在干扰状态下蛋白质的构象变化。通过数据输出,有关这些变化的数据信息可被容易的可视化,也可通过导入如PyMol的晶体结构可视化程序更深入的了解这些变化。  海德堡大学分子生物学中心的Matthias P. Mayer教授表示:“通过布鲁克HDX解决方案,我们能够以高精度、高重复性和最小的动手时间测量氢交换反应动力学。系统的自动安排软件帮助我们充分利用仪器使用时间,从而提高我们的实验室效率”编译:郭浩楠
  • 深度学习辅助从冷冻电镜密度图逐步组装多结构域蛋白质
    冷冻电子显微镜的进展为大分子蛋白质结构测定提供了潜力,但是在多域蛋白质的域间方向建模,成功率仍然很低。近日,Nature子刊,作者使用冷冻电子显微镜开发了自动的域增强建模(DEMO-EM)方法。DEMO-EM方法通过结合刚体域拟合和柔性装配模拟(具有深度神经网络域间距离分布的灵活装配模拟)的渐进式结构精调程序,从冷冻电子显微镜图中组装多域蛋白结构。该方法在包含多达 12 个连续和不连续结构域的大规模蛋白质基准集上进行了测试,这些结构域具有中到低分辨率的密度图,其中,对于 97% 的案例,DEMO-EM 生成的模型具有正确的域间方向(模板建模分数(TM 分数)0.5),并且优于最先进的方法。DEMO-EM流程图使用结核分枝杆菌依赖性因子的三域蛋白进行说明从查询序列开始,域边界首先由FUpred和ThraDom预测,每个域的模型由DI-TASSER生成。同时,使用深度学习卷积网络DomainDist预测域间距离。其次,每个域模型都通过拟牛顿搜索独立地拟合到密度图。第三,初始全长模型通过两步刚体REMC模拟优化,以最小密度图和全长模型之间的DCS。第四,使用由DCS、域间距离分布和基于知识的力场引导的REMC模拟,通过原子级、分段级和域级精调的柔性装配对从刚体装配模拟中选择的最低DCS模型进行精调,得到decopy构象由SPICKER聚类以获得质心模型。最后,对全原子模型再次进行柔性装配模拟,其中质心模型的约束增加了能量,最终模型是用FASPR和FG-MD侧链重新包装后的最低能量模型构建。DEMO-EM是一种基于冷冻电镜图的多域蛋白质结构确定的分层方法,由四个连续步骤组成:(1)确定域边界并对单个域建模(2)将域模型与密度图匹配初始框架生成(3)用于域位置和方向优化的刚体域结构组装(4)全长结构模型的柔性结构组装和细化模拟从冷冻电镜合成密度图构建多结构域蛋白从查询的氨基酸序列开始,首先应用LOMETS[1]从PDB创建多个模版比对,其中ThreaDom用于根据域保守分数预测域边界。如果蛋白质被LOMETS定义为“简单”目标,并且比对覆盖率95%,则应用ThraDom预测的域定义。否则,通过FUpred(通过最大化域内接触的数量[3]和最小化由基于深度学习的神经网络ResPRE[2])预测的接触图上的域间接触的数量来预测域边界。接下来使用DI-TASSER[4]生成每个域的结构模型,它是I-TASSER[5]的一个版本,通过将深度学习预测的残基间接触和距离图以及氢键电位结合到迭代搜索全基因组和宏基因组序列数据库来构建多序列比对(MSA)。然后根据TripletRes预测的接触选择最前面的MSA,将其输入到ResPRE[2],TripletRes是基于深度残基神经网络预测距离图、氢键网络和扭转角。这些预测的约束被集成到I-TASSER力场中以指导replica-exchange 蒙特卡洛模拟(REMC)。最终模型由SPICKER聚类并由FG-MD改进。对于包含来自查询序列不同区域的两个或多个片段的不连续域,域模型是通过顺序连接所有片段的序列获得的。基于深度神经网络的域间距离预测为了帮助指导域方向组装,域间距离图由深度残差神经网络算法DomainDist预测,DomainDist 是TripletRes 的扩展,最初开发它是为了基于共进化矩阵的三元组预测残基间接触图,但在这里扩展以预测 2-20 Å 范围内 36 个 bin 内残基间距离的概率。DomainDist 程序在从 PDB 收集的 26,151 种蛋白质的非冗余数据集上进行训练,其中每种蛋白质的 MSA 是使用 HHblits搜索 Unilust30 序列数据库构建的. 除了 TripletRes 中采用的二维 (2D) 协同进化特征外,还采用了三个一维 (1D) 特征,包括隐马尔可夫模型、Potts 模型的序列和场参数的 one-hot 表示并平铺到两个维度并与二维协同进化特征连接。神经网络结构是按照卷积策略设计的,使用 ResNet 基础模块。神经网络模型由 Adam 优化算法训练,以最小化交叉熵损失。尽管 DEMO-EM 只考虑了域间距离信息,但在训练过程中同时考虑了域内和域间距离信息。基于拟牛顿的域匹配和冷冻电子密度图对于来自 DI-TASSER 的每个单独的域模型,我们使用有限内存Broyden-Fletcher-Goldfarb-Shanno (L-BFGS),一种具有六维 (6D) 平移-旋转自由度的准牛顿优化算法,来识别与密度图相关性最高的域的最佳位置和方向。由于L-BFGS是一种局部优化方法,其结果取决于初始解,因此作者通过枚举欧拉角的所有组合( φ, θ and ψ ),以步长Srot_ang穿过密度图空间。对于domain pose,密度相关分数(density correlation score,DCS)用于指导L-BFGS模拟。Nvol是voxels的个数(网格点),ρEM (vi ) 是第i个voxel的实验密度。decopy结构探针密度定义为:刚体域组装执行两轮刚体域组装模拟以优化域位置和方向。在第一轮中,这些域被视为粒子,并进行快速的REMC模拟,以根据全局模拟密度相关性调整各个域的位置。第二轮刚体REMC模拟用于微调域位姿,其具有更详细的能量立场。原子级灵活的域组装和细化灵活的域组装和细化过程包含两个阶段的模拟,具有渐进的voxels分辨率和采样焦点。在第一阶段,实施了6种不同的动作,(1)LMProt 扰动,(2)围绕连接两个末端的轴的片段旋转,(3)片段沿序列的构象移位,(5)刚体段平移,(5)刚体尾部旋转和(6)刚体域级平移和旋转。第二阶段,使用在所有原子上计算的DCS实现Voxel大小为2 Å 的更精细的密度图。此外,所有残基都有相同的概率被选中进行移动和采样。当交换次数达到 100 时,模拟终止。选择最低能量的诱饵来构建最终模型,侧链原子由 FASPR 重新包装,然后是 FG-MD 细化。结果表2显示了从同一组预测域模型开始时从 MDFF 和 Rosetta 获得的结果,其中初始构象由 Situs 和 MAINMAST 建模组装。这些数据再次表明,DEMO-EM 的表现优于 MDFF、Rosetta 和 MAINMAST,全长模型的平均 TM 分数分别比 MDFF、Rosetta 和 MAINMST 高 60.0%、87.2% 和 144.4%。最后,作者在所有 51 个案例上将 DEMO-EM 与最先进的端到端深度学习结构预测方法 AlphaFold2 进行了比较。由上表所示, 虽然 AlphaFold2 预测的单个域的 TM-score (0.89) 比 DEMO-EM (0.84) 高,这可能是因为 DI-TASSER 构建的域模型质量较低,整体质量DEMO-EM 构建的全长模型(TM-score 为 0.88)优于 AlphaFold2(TM-score 为 0.84),DEMO-EM 在 28 出时获得了比 AlphaFold2 更高的 TM-score 51 种蛋白质。作者还将 AlphaFold2 构建的相同全长模型输入 MDFF、Rosetta 和 DEMO-EM,以检查灵活组装和细化过程的性能。所有方法都改进了初始全长模型,即使对于最佳预测模型,也显示了冷冻电镜数据的有用性。源代码:https://zhanggroup.org/DEMO-EM/参考资料[1] Zheng, W. et al. LOMETS2: improved meta-threading server for fold-recognition and structure-based function annotation for distant-homology proteins. Nucleic Acids Res. 47, W429–W436 (2019)[2]Li, Y., Hu, J., Zhang, C., Yu, D.-J. & Zhang, Y. ResPRE: high-accuracy protein contact prediction by coupling precision matrix with deep residual neural networks. Bioinformatics 35, 4647–4655 (2019)[3] Zheng, W. et al. FUpred: detecting protein domains through deep-learning based contact map prediction. Bioinformatics 36, 3749–3757 (2020)[4] Zheng, W. et al. Protein structure prediction using deep learning distance and hydrogen‐bonding restraints in CASP14. Proteins 89, 1734–1751 (2021)[5]Yang, J. et al. The I-TASSER suite: protein structure and function prediction. Nat. Methods 12, 7–8 (2015).
  • 汇集结构质谱尖兵,开拓蛋白质结构生物学的新天地——第十四届质谱网络会议报告推荐
    随着生命科学研究的深入开展,科学界对解析复杂生物大分子结构以揭示生命现象的渴望日益增加。在各种结构生物学技术快速发展的背景下,结构质谱技术凭借其独特的优势,日益成为连接静态结构与动态功能、实现从分子到细胞的跨尺度研究的重要手段。在12月12-15日即将召开的“第十四届质谱网络会(iCMS 2023)”同期,特别新增了“结构质谱新方法”主题专场,来自全国的顶尖科学家团队将汇聚一堂,围绕氢/重氢交换质谱、化学交联质谱、原位质谱等前沿技术,报告他们在蛋白质结构生物学研究中的最新进展。本次主题会议的召开,恰逢结构质谱技术发展的重要机遇,必将推动该领域技术的重要突破及交叉创新,开启生命科学研究的新篇章。热忱欢迎质谱界的科技工作者报名参会交流、了解前沿动态、开拓合作视野。部分报告预告如下,点击报名  》》》会议主持人:中山大学 教授 李惠琳中山大学药学院教授,博士生导师。主要从事生物质谱新技术的开发及应用,侧重于(1)开发整合结构质谱技术(包括native top-down MS, HDX-MS, CX-MS等),用于药物作用分子机制及蛋白复合物结构研究;(2)Middle-down/top-down蛋白质组学新技术的开发及应用。共发表SCI收录论文40篇,其中第一作者或通讯作者15篇,主要发表在Nat. Chem.、Anal. Chem.等期刊;2014年获得American Society of Mass Spectrometry Postdoctoral Career Development Award;2019年入选“珠江人才计划”青年拔尖人才;主持国家自然科学基金项目3项。报告人:香港理工大学 教授 姚钟平报告题目:氢氘交换质谱揭示β-内酰胺酶与抑制剂相互作用的动态构象复旦大学学士及硕士,香港科技大学博士,香港理工大学应用生物及化学科技学系教授。长期从事质谱、分析化学、化学生物学、组学的交叉学科研究,主要发展和应用质谱技术解决化学、生物、食品安全、信息科学等领域的基础和应用问题,在Nature Communications, PNAS, JACS等期刊发表论文100多篇。现任香港研究资助局专家委员会委员、深圳市中药药学及分子药理学重点实验室副主任、中国化学会有机分析专业委员会委员、Frontiers in Chemistry副主编以及Analytica Chimica Acta, Rapid Communications in Mass Spectrometry,《中国质谱学报》,《分析测试学报》等期刊编委。会上,姚钟平教授将作主题为《氢氘交换质谱揭示β-内酰胺酶与抑制剂相互作用的动态构象》的报告。利用氢氘交换质谱(HDX-MS)并结合原态离子迁移质谱(Native IM-MS)以及分子动态(MD)模拟,发现不同亚型的A型β-内酰胺酶在几个主要的结构域存在显著的动态构象差异。进一步研究了A型β-内酰胺酶与抑制蛋白结合界面的动态结构变化,结果揭示了H10区域是一个可调节β-内酰胺酶抑制作用的别构部位。报告人:浙江大学 研究员 周默为报告题目:非变性质谱剖析异质性蛋白复合体结构和功能信息浙江大学首位“求是实验岗”研究员,分析化学专业,长期从事前沿生物质谱技术和仪器的开发工作。2008年本科毕业于武汉大学,2013年博士毕业于美国俄亥俄州立大学,之后两站博士后分别在美国FDA和西北太平洋国家实验室PNNL。2018年成为PNNL的研究员开展独立研究,培养多名博士后和学生。2023年加入浙江大学。截至目前共发表60余篇学术论文,代表作包括在Angewandte Chemie, Nature Communications, Analytical Chemistry等期刊的论文。现任自上而下蛋白组协会(Consortium for Top Down Proteomics)的青年委员会主席,曾担任美国质谱协会(ASMS)的出版委员会委员、短课程讲师、评审委员等学术任职,努力推动新分析测试技术的开发和跨学科领域的应用研究。本次会议中,周默为研究员将为介绍题为《非变性质谱剖析异质性蛋白复合体结构和功能信息》的报告。精准表征生物大分子的微观结构对各类生物工程、生物医药领域的研究至关重要。由于大部分质谱检测到的分子量范围有限,在分析之前生物大分子需要先被剪切为分子量更小的片段。但是剪切和碎片化的过程中会丢失一些关键的结构信息。前沿质谱技术提高了仪器的分子量上限,使非变性条件“自上而下”研究完整的生物大分子更加容易。我将以具体案例,阐述自上而下非变性质谱技术在异质性蛋白质复合体结构和功能解析中的贡献,以及与其他方法的互补性。报告人:北京大学 研究员 王冠博报告题目:生物样本中蛋白高级结构的质谱分析北京大学生物医学前沿创新中心研究员。北京大学学士,美国马萨诸塞大学博士,曾于荷兰乌特勒支大学暨荷兰蛋白组学中心从事博士后研究;曾任南京师范大学教授、博士生导师。主要从事免疫反应相关蛋白质的高级结构及相互作用研究,以生物质谱为核心工具,结合新型分析设备研发,应用于生物物理学、蛋白质药物分析等领域。长年与国际药企合作研发新型药物表征技术并应用于新药研发。获国际国内授权专利,出版《Mass Spectrometry in Biopharmaceutical Analysis》等专著、译著、合著多部。任中国生物化学与分子生物学会蛋白质组学专业分会委员、国际学术组织Consortium for Top-Down Proteomics青委会委员。本次会议中,王冠博研究员将围绕生物样本中蛋白高级结构的质谱分析主题分享报告。生物质谱已成为蛋白质多次结构表征的重要工具。为将蛋白结构质谱技术的应用拓展至生物样本乃至临床样本中,我们针对背景基质复杂、糖基化等修饰异质性高、超大分子量颗粒结构层次多样等问题,以非变性质谱等质谱手段为核心工具开发了一系列组合策略,提供生物样本乃至临床样本中的蛋白高级结构和相互作用关系信息。报告人:中国科学院大连化学物理研究所 研究员 王方军报告题目:高能紫外激光解离-串联质谱仪器研发和应用2011年于中科院大连化物所获博士学位,师从邹汉法研究员。研究工作致力于生物大分子质谱新仪器、新方法及其在生命健康领域的应用研究,搭建了世界首台50-150 nm可调波长极紫外激光超快解离-串联质谱;提出了位点光解离碎片产率和原位化学标记效率定量表征蛋白质结构变化的两种质谱分析新原理,实现亚微克蛋白质复合物序列和结构变化单氨基酸位点分辨表征;发展了蛋白质-纳米材料界面相互作用精细结构的质谱分析新方法等。在Nat. Protoc.,J. Am. Chem. Soc.,Cell Chem. Biol.,Chem. Sci.,Anal. Chem.等期刊发表论文130余篇,他引5000余次。本次会议中,王方军研究员将分享题为《高能紫外激光解离-串联质谱仪器研发和应用》的报告。高能/真空紫外激光解离是表征生物大分子序列和动态结构的前沿结构质谱表征技术,但相关仪器和理论都亟待发展。报告人将介绍近年来自主研发的皮秒脉冲极紫外激光解离装置和蛋白质原位光化学标记仪器的原理、主要参数、与商品化质谱对比、及在蛋白质瞬态结构表征、蛋白-蛋白识别和相互作用机制分析等方面的应用情况。报告人:中国科学院大连化学物理研究所 研究员 赵群报告题目:活细胞内蛋白质原位构象和相互作用规模化解析新方法研究中国科学院大连化学物理研究所研究员,博士生导师。本科毕业于西北大学化学基地班。同年进入大连化学物理研究所攻读博士学位,师从张玉奎院士和张丽华研究员,2014年获得理学博士学位。毕业后留所工作至今,主要从事蛋白质组定性定量及相互作用分析新技术研究,共发表学术论文62篇,其中近五年以通讯/第一作者(含共同)在Nat. Commun., Angew. Chem. Int. Ed.,Anal. Chem.等SCI期刊发表论文23篇;已获20项发明专利授权。作为课题负责人承担国家重点研发计划,作为项目负责人承担国家自然科学基金面上基金等,2023年获国家自然科学基金优秀青年基金支持;2018年入选大连市科技之星,2020年入选中国科学院青年促进会会员,2023年获中国化学会菁青化学新锐奖;兼任《色谱》青年编委、中国化工学会理事、中国蛋白质组学会青年委员、中科院青促会沈阳分会委员等。本次会议中,赵群研究员将围绕题为《活细胞内蛋白质原位构象和相互作用规模化解析新方法研究》的报告。作为生命活动的执行者,蛋白质通过相互作用形成复合体等形式行使其特定的生物学功能。不同于细胞外的离体环境,细胞内的限域效应、拥挤效应和细胞器微环境等对于维持蛋白质复合体的结构和功能起着至关重要的作用。因此,实现细胞内蛋白质相互作用的精准解析对于深入研究其生物学功能,进而理解生命现象本质具有重要意义。近年来,化学交联质谱技术已逐渐成为蛋白质复合物解析的重要手段。它是利用化学交联剂将空间距离足够接近的蛋白质内/间的氨基酸以共价键连接起来,再利用质谱对交联肽段进行鉴定,进而实现蛋白质相互作用的组成、界面和位点的解析。现有化学交联技术主要用于解析体外表达纯化的或细胞裂解液中的蛋白质复合物,而在细胞内蛋白质复合物的原位构像解析方面仍处于起步阶段。 针对上述问题,我们团队发展了一系列新型高生物兼容性的可透膜多功能化学交联剂,实现了活细胞内蛋白质复合物构像的原位交联捕获;建立了多种高选择性的低丰度交联肽段的富集方法和高可信度的交联肽段鉴定方法,显著提高了原位交联信息的鉴定灵敏度、覆盖度和准确度;进而,通过靶向富集特定亚细胞器内的交联蛋白质复合物,实现了亚细胞器空间分辨的蛋白质相互作用精准解析;在上述基础上,利用基于化学交联距离约束的分子动力学技术获得了蛋白质复合物的动态系综构像,实现了活细胞微环境下蛋白质复合物组成、相互作用界面及作用位点的规模化精准解析,为规模化地揭示蛋白质复合物功能状态下的结构调控机制提供了重要的技术支撑。为了分享质谱技术及应用的最新进展,促进各相关单位的交流与合作, 仪器信息网与北美华人质谱学会(CASMS)将于2023年12月12-15日联合举办第十四届质谱网络会议(iCMS2023)  。以上仅是部分报告嘉宾的分享预告,更多精彩内容请参加会议页面:https://www.instrument.com.cn/webinar/meetings/iCMS2023/ (点击下图去报名)》》》
  • “全球高被引学者”徐华强:透析蛋白质结构,走出生命科学“石器时代”
    结构生物学就是靠先进光源、冷冻电镜,去看清一个个蛋白质结构这么简单?在徐华强看来,这只是一种表象,其终极目的是厘清生命科学的底层逻辑,从而使生命科学从目前的“石器时代”走向人类能够健康获得百年寿命的理想年代。从事结构生物学近30年,58岁的徐华强已在《细胞》《自然》《科学》(CNS)三大国际知名学术期刊上发表论文32篇,在各类学术期刊发表论文250多篇,论文被他引逾2.9万次,连续多年被评为“全球高被引学者”。在接下来的人生中,他想在新药研制上更进一步,通过对蛋白质结构的充分认识,研制出可以带来领域变革的原创新药。人物小传徐华强,国际著名结构药理学家,中国科学院上海药物研究所研究员、中科院受体结构与功能重点实验室主任。长期从事激素受体结构研究及相关受体的药物研发,其研究成果在国内外产生深刻影响,曾入选美国《科学》杂志“2009年十大科学突破”“2014年度中国科学十大进展”,以及两院院士评选的“2015年中国十大科技进展新闻”。追寻兴趣投身结构生物学由此厘清生命科学的底层逻辑与结构生物学结缘之前,徐华强经历了十多年的寻寻觅觅:本想学高能物理,却“误入”清华大学工程物理系的核反应堆专业;本科毕业后,他又转向生物学,硕士毕业后赴美国杜克大学攻读博士… … 1994年博士毕业,他决定继续坚持将自己爱好的物理与生物结合,投身当时新兴的结构生物学研究。博士后毕业时,徐华强不得不考虑现实生活,去了当时世界排名前五的制药公司葛兰素史克从事研发工作,短短六年就晋升为高级资深研究员。正当一切顺风顺水时,徐华强决定遵从自己的兴趣,于2002年重回学术界从事基础研究。在徐华强看来,兴趣就是一个人生的锚点,在一生的风浪中,哪怕个人力量十分渺小,但有了锚点,也可大大增强自己抗击风浪的能力。沿着兴趣所在的结构生物学领域,徐华强在创新发现的道路上一发不可收拾,并逐渐向心中所理解的“道”靠近。“为什么做药这么难,被称为‘九死一生’?”在徐华强看来,究其根本,是因为人类对生命科学的底层逻辑不清楚——还处于认识生命的“石器时代”。“所谓科学,就是可以预测结果。如果我们可以像制造火箭、飞机的工程学、物理学底层逻辑那样,清晰了解生命的运行,那么新药研发就会变得更加精准而便捷。”在接下来的岁月里,徐华强希望为厘清生命科学的底层逻辑做更多探索。近年来,他决定用自己多年的积累,在基础科学与临床药物之间搭起一座桥梁,通过蛋白质结构辅助设计、新药分子设计,研制出可以带来领域变革的原创新药。回国筑起研究高地实现“零的突破”创造“世界第一”徐华强经常做出一些出人意料的决定,这些决定都成为他人生的重要转折点。2008年,相识多年的好友——时任中科院上海药物所副所长的蒋华良找到徐华强,希望他能回国帮助药物所建立起靶标中心,提升研究所原创新药研发能力。于是,2009年,上海药物所与徐华强任职的范安德研究所签订合作协议,共建联合实验室。GPCR是人体最大膜受体家族和重要的药物靶标,靶向GPCR的上市药物占比超过30%。徐华强回国十年,建立起的中科院受体结构功能实验室在实现国内GPCR结构解析“零的突破”后,又主导解析了30多种与神经、免疫和代谢性疾病密切相关的GPCR结构。如今,上海药物所解析的GPCR结构数量已可位列“世界第一”。感受到中国科技的腾飞势头,2019年9月,徐华强决定全职回国。“一开始夫人不理解,但我坚信,美国的实验室已经发展成熟,不一定需要我,但中国的实验室正在节节攀登,更需要我!”的确,时间一次次证明徐华强的决定是对的。2020年,新冠疫情暴发。徐华强带领团队联合合作单位,靠泡面度日,经过46天日夜奋战,成功解析新冠肺炎病毒RNA复制酶单独结构,相关成果发表在《科学》杂志上。此后,他的团队频频发力。2021年底,徐华强带领团队不到一个月就迅速解析出奥密克戎BA.1变异株刺突蛋白以及结合人源受体ACE2的高分辨率冷冻电镜结构。2022年3月中旬,他又和团队一起主动要求封控在园区,针对奥密克戎BA.2变异株开展科研攻关… … 尽管受到疫情影响,但仅今年一季度,徐华强实验室就发表了10篇论文,预计全年将发表30篇。▲徐华强(右)在指导学生。“实验失败不要紧,但一定不能造假。”徐华强的博士生王悦说,这是徐老师最常对学生说的一句话,这位“普通话不太好,笑起来眼睛会消失,走路低着头”的导师永远会向学生伸出帮助之手。在徐华强培养的学生中,一批90后学生已开始以第一作者身份在CNS上发表论文。其中,29岁的庄友文成为今年入选“上海科技青年35人引领计划”的年龄最小者,26岁的段佳斩获华人生命科学领域在读博士最高奖项“吴瑞奖”。回首人生起伏,徐华强认为,人生永远都需要提前布局,在相信事情肯定会变好的同时,也要时刻为意外做好准备。同时,清晰认识自己、保持好的心态、不断追求思维高度和专业性,都是走好人生每一步的基石。
  • 定量蛋白质组学方法应用于病毒结构、功能及感染机制研究
    p style=" text-align: justify text-indent: 2em line-height: 1.75em " 病毒是一种特殊的生命形式,与人类的疾病和健康都密切相关。在一些情况下,某些病毒会侵染人体,导致一系列的疾病,甚至危及生命。对病毒的防控,我们可以通过了解病毒的特点与传播规律,阻止病毒传播;也可以通过研发相应的疫苗来提前预防病毒的感染,而这些工作都需要对病毒有深入的认识和了解。SCIEX面向全球提供不同类型的高端质谱平台和多组学研究方案,能够在基础研究、临床诊疗和药物研发的领域助力对于病毒相关的研究与防控。 /p p style=" text-align: center text-indent: 2em line-height: 1.75em " span style=" color: rgb(0, 112, 192) " strong 基于iTRAQ试剂的定量蛋白质组学揭示相似病毒的结构和功能差异 /strong /span /p p style=" text-indent: 2em line-height: 1.75em " span style=" color: rgb(0, 112, 192) " strong /strong /span /p p style=" text-align: center" img style=" max-width:100% max-height:100% " src=" https://img1.17img.cn/17img/images/202004/uepic/dec9490a-bd41-4d1e-9bd3-67dc8f2d04d3.jpg" title=" 11111.jpg" alt=" 11111.jpg" / /p p style=" text-indent: 2em line-height: 1.75em text-align: center " span style=" text-align: justify text-indent: 2em " 图1:iTRAQ试剂结合定量蛋白质组学能够揭示病毒不同状态下的蛋白丰度差异(来源Zhihong Hu,JVI, 2012) /span /p p style=" text-align: justify text-indent: 2em line-height: 1.75em " EV71(肠道病毒71型)是导致幼儿手足口病的主要病原体之一,其表达两种EV71病毒,包涵体衍生型病毒(occlusion-derived virus,ODV)和出芽型病毒(budded virus,BV)。ODV主要侵染肠,而BV则有可能侵染其他易感组织。如果能够对这两种病毒蛋白层面的差异进行分析,那么就能够掌握病毒颗粒侵染偏向的线索。 /p p style=" text-align: justify text-indent: 2em line-height: 1.75em " 基于iTRAQ试剂的定量蛋白质组学能够很好的完成相似样品在蛋白层面的差异比较。 /p p style=" text-align: justify text-indent: 2em line-height: 1.75em " 在本研究中,研究人员使用不同的iTRAQ试剂(116和117)来标记不同两种不同的肽段样品,等量混合后,使用SCIEX高分辨质谱仪进行数据采集。数据分析软件通过采集到的二级谱图,不仅可以进行肽段序列的鉴定,还能够通过报告离子116和117的相对强度来对该肽段在两个样品中的相对丰度进行定量。通过SCIEX 高分辨质谱系统对EV71两种不同状态下的病毒颗粒中的51个蛋白质进行定量蛋白质组学分析,揭示了EV71在不同状态下高表达的蛋白质,其中有12个BV特异表达的蛋白,有21个ODV特异表达的蛋白,这其中的差异很有可能就是病毒颗粒侵染偏向的原因,这为我们后续的研究提供了重要的线索。 /p p style=" text-align: center text-indent: 2em line-height: 1.75em " strong span style=" color: rgb(0, 112, 192) " 基于SWATH采集技术的定量蛋白质组学绘制全面的病毒蛋白表达及功能谱图 /span /strong /p p style=" text-indent: 2em line-height: 1.75em " strong span style=" color: rgb(0, 112, 192) " /span /strong /p p style=" text-align: center" img style=" max-width:100% max-height:100% " src=" https://img1.17img.cn/17img/images/202004/uepic/d6902936-0d92-4585-aa4e-308c18e939cc.jpg" title=" 2222.jpg" alt=" 2222.jpg" / /p p style=" text-indent: 2em line-height: 1.75em text-align: center " span style=" text-align: justify text-indent: 2em " 图2:使用SWATH采集技术结合定量蛋白质组学方法来得到病毒不同蛋白在侵染过程中不同时间点的表达情况(来源:MCP, Anthony,2015) /span /p p style=" text-align: justify text-indent: 2em line-height: 1.75em " 为了预防和控制急性病毒感染在全球流行,对病毒的基础研究是战略性的。病毒的基础研究中,病毒蛋白的功能,及其在宿主细胞中的动力学是重要的环节,能够让我们更加透彻的了解病毒。SWATH(sequential windowed acquisition of all theoretical fragment ions)采集技术结合定量蛋白质组学策略作为一种数据非依赖采集策略,基于超快速扫描的高分辨质谱TripleTOF系统,能够全面的采集到样品中所有肽段的信息,为我们完整的展现病毒所有蛋白的变化水平。在这个研究中,科研人员使用牛痘病毒为模式病毒,基于TripleTOF系统的SWATH采集模式,为我们展示了病毒蛋白在体内动力学变化的研究流程。 /p p style=" text-align: justify text-indent: 2em line-height: 1.75em " 研究者将不同侵染阶段的样品分别进行蛋白提取及酶解,无需额外的同位素标记及其他后续工作,直接使用SCIEX特有的SWATH采集模式对不同的样品进行采集。之后借助数据分析软件,导入数据库后,就可以直接得到病毒各种蛋白在不同侵染阶段的表达曲线。基于这些信息,我们能够很清楚的了解病毒的不同蛋白各自在何时被表达及执行功能,能够帮助我们绘制出病毒不同蛋白的表达及功能谱图,是病毒基础研究重要的一环。 /p p style=" text-align: center text-indent: 2em line-height: 1.75em " span style=" color: rgb(0, 112, 192) " strong 基于差异比较蛋白质组学进行SARS冠状病毒炎症机制研究 /strong /span /p p style=" text-indent: 2em line-height: 1.75em " span style=" color: rgb(0, 112, 192) " strong /strong /span /p p style=" text-align: center" img style=" max-width:100% max-height:100% " src=" https://img1.17img.cn/17img/images/202004/uepic/8fe2a6d0-6c5e-40b7-87b2-4a5543e1715e.jpg" title=" 3333.jpg" alt=" 3333.jpg" / /p p style=" text-indent: 2em line-height: 1.75em " span style=" color: rgb(0, 112, 192) " strong /strong /span br/ /p p style=" text-align: center text-indent: 2em line-height: 1.75em " 图3:定量蛋白质组学策略揭示SARS病毒的PLpro蛋白对宿主细胞免疫相关信号通路的影响(来源:Proteomcis,Cheng-Wen Lin,2012) /p p style=" text-align: justify text-indent: 2em line-height: 1.75em " SARS(重症急性呼吸综合征)冠状病毒的PLpro蛋白具有去泛素化酶活性,能够让干扰素调节因子3(Interferon regulatory Factor 3)和NF-kB失活,抑制I型干扰素信号通路,从而降低干扰素(IFN)的表达。在这个研究中,作者使用SCIEX高分辨质谱系统对PLpro过表达的人源幼单核细胞系的蛋白质组学和细胞因子水平进行了分析。发现PLpro过表达后,细胞内炎症因子TGF-b1相关的蛋白呈现显著的上调趋势,与此相关的信号通路为p38 MAPK及 ERK1/2信号通路。这份研究能够为我们在临床抑制SARS冠状病毒介导的炎症提供机制依据。 /p p br/ /p
  • 自然通讯成果|非变性纳米蛋白质组学捕获内源性心肌肌钙蛋白复合物的结构和动态性信息
    大家好,本周为大家分享一篇发表在Nat. Commun.上的文章:Structure and dynamics of endogenous cardiac troponin complex in human heart tissue captured by native nanoproteomics ,文章的通讯作者是威斯康星大学麦迪逊分校的葛瑛教授。  蛋白质大多都是通过组装成蛋白复合物来执行特定的生物功能,因而表征内源性蛋白复合物的结构和动力学将有助于生命过程的理解。蛋白复合物在其组装、翻译后修饰(Post-translational modifications,PTMs)和非共价结合等方面是高度动态的,在native状态下通常以低丰度存在,这给研究其结构和动态性的传统结构生物学技术(如X-ray和NMR)带来了巨大的挑战。非变性Top-down质谱(nTDMS)结合了非变性质谱和Top-down蛋白组学的优势,目前已发展成蛋白复合物结构表征的有力工具,可以保留蛋白质亚基-配体间的非共价作用和PTMs等重要信息。然而,由于内源性蛋白复合物自身的低丰度特性,导致对其的分离纯化和检测非常困难,所以nTDMS目前仅限用于过表达的重组或高丰度蛋白质的表征。在本研究中,作者开发了一种非变性纳米蛋白质组学(Native nanoproteomics)技术平台,通过使用表面功能化的超顺磁性纳米颗粒(Nanoparticles,NPs)直接富集组织中的蛋白复合物,然后再利用高分辨质谱表征其结构和动态性。这里选用心肌肌钙蛋白(Cardiac troponin,cTn)异源三聚体复合物(~77 kDa)作为研究对象。cTn三聚体复合物是调节横纹肌肌动蛋白收缩的Ca2+离子调节蛋白,由TnC、cTnI和cTnT这3个亚基组成。其中,TnC是Ca2+结合亚基,cTnI是抑制肌动蛋白-肌球蛋白相互作用的亚基,而cTnT细丝锚定亚基。TnC与Ca2+的结合,以及cTnI 亚基的磷酸化,会共同引起细丝上的分子级联事件,诱导心肌收缩所必需的肌动蛋白-肌球蛋白交叉桥的形成。传统结构生物学技术不能有效捕获cTn复合物高度动态的构象变化,并且先前研究用的cTn复合物是由原核细胞表达的,缺乏PTMs的信息。因此,作者开发了native纳米蛋白组学的方法,以实现对人内源性cTn复合物结构和动力学的全面表征。作者首先使用肽功能化的超顺磁性氧化铁NPs富集了人心脏的内源性cTn复合物,同时优化了非变性蛋白提取缓冲液(高离子强度LiCl溶液,生理pH)。富集到的cTn复合物中的3种亚基的含量比例为1:1:1,真实反应了肌节cTn异源三聚体复合物的组成。作者也发现含有750 mM L-Arg,750 mM咪唑和50 mM L-Glu(pH 7.5)的溶液对蛋白复合物的洗脱效果最好,并且不会破坏亚基间的相互作用。该富集方法具有很好的重现性,proteoforms信息得到很好保留,且可以直接用于化学计量分析。总的实验流程如图1所示,洗脱后的cTn复合物经体积排阻色谱(Sze-exclusion chromatography,SEC)除盐和交换至醋酸铵溶液中,随后对cTn复合物进行多种nTDMS分析:1)在线SEC监测复合物 2)超高分辨傅里叶变换离子回旋共振质谱(FTICR-MS)表征复合物的化学计量比和proteoforms 3)捕获离子淌度质谱(TIMS-MS)解析调控复合物构象变化中的非共价作用的结构动态性。  图1. 用于表征人心脏中内源性cTn复合物的native纳米蛋白组学平台。  为了全面表征内源性cTn复合物,作者使用FTICR-MS进行proteoforms测序和复合物表征。图2展示了native状态下检测丰度最高的cTn复合物的电荷态(19+),其中包含了4种独特的proteoforms,这些复合物主要带有单磷酸化的cTnT、单磷酸化和双磷酸化的cTnI,以及结合了3个Ca2+的TnC。这些结果表明人cTn复合物在肌节中以结构多样化的分子组成存在,具有高度异质的共价和非共价修饰,可产生一系列不同的完整复合物。  图2. FTICR-MS分析展示的cTn复合物状态。红色方框中是最高丰度电荷态(19+)的放大谱图,理论同位素分布(红色圆圈)可以与谱图很好叠加,说明结果具有高质量精度(质量偏差在2 ppm 以内)。  作者接着对cTn复合物进行complex-up分析,以研究复合物的化学计量比及其组成。图3a~3b分别显示的是完整cTn三聚体复合物,以及经CAD碎裂后的蛋白亚基谱图。但这里没有检测到cTnI单体,可能是因为cTnI和TnC在native状态下的亲和力很强,且cTnI单体带的电荷不多,导致其在高m/z区域出峰,所以不易被检测到.随后,作者又对解离出的亚基进行complex-down分析。图3c展示了检测到的cTnT的多种proteoforms:未磷酸化的 cTnT、单磷酸化的cTnT(p cTnT)和 C 端 Lys 截断的磷酸化cTnT(pcTnT [aa 1-286]),CAD碎裂谱图也发现cTnT的C端较N端更易暴露在外界溶剂中。图3e则是cTn(I-C)二聚体的谱图,共检测到6种具有不同数量Ca2+结合和磷酸化的proteoforms。二级谱图可将cTnI的两个磷酸化位点准确定位在Ser22和Ser23,同时发现cTnI序列两端都较内部区域更易暴露于溶剂中。但还无法通过nTDMS准确推断Ca2+结合和磷酸化是如何影响cTn复合物的稳定性。作者在此也没有优化FTICR-MS在非常高m/z范围的离子检测,所以也会遗漏带少量电荷的cTn复合物信息。  图3.nTDMS表征人心脏来源的cTn复合物。(a~b)完整cTn复合物和经CAD碎裂后的亚基谱图 (c~d)cTnT单体及其代表性的CAD碎裂谱图 (e~f)cTn(I-C)二聚体及其代表性的CAD碎裂谱图。  人TnC蛋白含有3个钙结合EF-hand基序(结构域 II~IV)。结构域 II与Ca2+结合的亲和力较低,是触发心肌收缩的调控域。结构域 III 和 IV则与Ca2+具有强的亲和力,在心肌舒张和收缩时均始终保持与Ca2+充分结合,但结构域 II只有在收缩时才被Ca2+占据。这里观察到了TnC分别与0、1、2和3个Ca2+结合的情况,通过CAD碎裂也进一步定位了TnC与Ca2+结合的具体氨基酸序列(图4)。研究发现结构域 II的骨架最容易发生碎裂,而结构域 III的骨架最难碎裂。目前结构域 II~IV的序列在UniprotKb中分别对应65DEDGSGTVDFDE76、105DKNADGYIDLDE116和141DKNNDGRIDY152。这里分别将与1、2和3个Ca2+结合的TnC隔离出来进行CAD碎裂(m/z分别为2312、2316和2321),可以更准确地将结构域 III、II和IV的序列分别定位到113DLD115、141DKNND145和73DFDE76(图4c),表明非变性纳米蛋白组学方法在定位非共价金属结合方面具有高分辨能力。  图4.nTDMS定位 TnC与Ca2+结合的结构域。(a)FTICR-MS隔离与不同数量Ca2+结合的TnC单体 (b~c)与两个Ca2+结合的TnC的CAD碎裂谱图,蓝色、红色和黄色方框分别对应结构域 II 、III和IV。  Ca2+与TnC的结合会对cTn复合物的功能和构象有着很大影响。cTn复合物的核心区维持着构象的稳定,但当Ca2+与TnC发生结合时,其柔性区会经历广泛的构象变化,复合物结构会从“closed”状态转变成“opened”状态,这会促进肌动蛋白和肌球蛋白间的相互作用,最终导致心肌收缩。然而,传统结构生物学技术很难捕获cTn复合物与Ca2+结合时的构象变化。因此,作者使用离子淌度质谱来分析cTn复合物的构象变化。TnC亚基和与Ca2+结合的cTn(I-C)二聚体的淌度分离谱图如图5所示。与0~3个Ca2+结合的TnC的碰撞截面(Collision Cross-Section,CCS)值分别为1853、1849、1829和1844 Å2(图5a~5b),TnC构象比IMPACT预测的更为紧凑,但cTn(I-C)二聚体的CCS值与预测的非常接近(图5c~5d)。作者推测TnC与两个Ca2+结合会形成更致密的构象,是因为在静息舒张时Ca2+与结构域 III 和 IV充分结合。当第三个 Ca2+与结构域II结合时,TnC转变为“opened”构象,使其N端与cTnI的C端相结合,进而引发心肌收缩(图5e)。cTn(I-C)二聚体与Ca2+结合时的构象变化也是如此(图5f)。  图5.TnC单体(a~b)和与Ca2+结合的cTn(I-C)二聚体(c~d)的离子淌度分离谱图 (e~f)TnC和cTn(I-C)二聚体与Ca2+结合时的构象变化。  最后,作者通过添加EGTA来剥离cTn复合物中的Ca2+,以进一步研究Ca2+在维持复合物结构稳定性上的作用。图6b~6c是没有EGTA孵育时的cTn复合物的TIMS-MS谱图。cTn复合物的CCS值与理论预测值非常符合。随着EGTA孵育浓度的增加(25、50和100mM),Ca2+逐渐被螯合,cTn复合物的结构也越来越舒展,体现在平均电荷态逐渐增加,以及逐渐在较低m/z范围内出峰,这表明cTn复合物构象的稳定性丢失与EGTA浓度的增加相关(图6d~6f)。虽然100mM EGTA孵育也不敢保证Ca2+的完全剥离,并且cTnI的存在又会增强TnC与Ca2+的结合,但TIMS-MS为我们研究cTn复合物与Ca2+结合时的构象变化提供了一种切实可行的分析手段。  图6.cTn复合物与EGTA孵育时的构象变化。(a)cTn复合物的构象随EGTA孵育浓度的增加发生改变 (b~c)cTn复合物的TIMS-MS谱图 (d~f)cTn复合物与不同浓度EGTA(25、50和100mM)孵育的谱图和CCS分析。  总的来说,本研究开发了一种可用于内源性蛋白复合物富集和结构表征的非变性纳米蛋白组学方法,以获取其组装、proteoforms异质性和动态非共价结合等方面的生物信息。本文采用的功能化NPs可被灵活设计成选择性结合特定的靶蛋白,在富集和洗脱过程中可以很好保持其近似生理条件下的存在状态。更为重要的是,功能化NPs与nTDMS的整合可以作为一种强有力的结构生物学工具,可以作为传统技术的补充,用于内源性蛋白复合物的表征。  撰稿:陈昌明 编辑:李惠琳文章引用:Structure and dynamics of endogenous cardiac troponin complex in human heart tissue captured by native nanoproteomics  参考文献  Chapman EA,Roberts DS, Tiambeng TN, et al. Structure and dynamics of endogenous cardiac troponin complex in human heart tissue captured by native nanoproteomics. Nat Commun. 2023 14(1):8400. Published 2023 Dec 18. doi:10.1038/s41467-023-43321-z
  • 定量蛋白质组学揭示内质网应激作用下蛋白质的构象变化
    大家好,本周为大家分享一篇发表在Analytical Chemistry上的文章Quantitative Structural Proteomics Unveils the Conformational Changes of Proteins under the Endoplasmic Reticulum Stress1,文章的通讯作者是来自美国佐治亚理工学院的Ronghu Wu助理教授。在真核细胞中,内质网(endoplasmic reticulum,ER)负责蛋白质组中40%蛋白质的合成和成熟。蛋白质合成或折叠过程中的变化都将影响内质网的稳态,进而导致未折叠蛋白的积累和蛋白分泌效率的降低。在过去几十年的研究中,内质网应激反应被广泛研究,但是内质网应激反应后蛋白质折叠状态的变化却没有被深入研究。基于丰度的蛋白质组学方法不能直接用于分析蛋白质状态的变化,在这篇文章中,作者整合了半胱氨酸(cysteine,Cys)共价标记、选择性富集和定量蛋白质组学,称为半胱氨酸靶向共价蛋白绘制(cysteine targeted covalent protein painting,Cys-CPP),用于研究蛋白质组范围内的蛋白质结构和变化(图1A)。  使用CPP分析蛋白质结构,需要一种具有高反应活性的探针。作者设计了一种针对半胱氨酸的探针,其中包含半胱氨酸反应基团、用于富集的生物素部分和用于生成半胱氨酸特异性识别位点标签的可裂解连接部分(图1B)。以变性处理后的蛋白样品作为蛋白质展开形式的参考,计算肽段在原始样本和变性样本中的比例从而获得宝贵的蛋白质结构信息。  图1.利用半胱氨酸反应探针定量分析人细胞蛋白质组中半胱氨酸暴露率的原理。(A)Cys-CPP的一般工作流程。(B)半胱氨酸残基与探针之间的反应。富集后,进行紫外裂解,在修饰的半胱氨酸上留下一个小标记,用质谱进行位点特异性分析。  半胱氨酸暴露率Rexpo通过每条肽段在原始样本和变性样本中的比值进行计算。结果显示:(1)半胱氨酸的暴露率和溶剂可及性呈现正相关(图2C) (2)在丝氨酸和苏氨酸等极性氨基酸残基旁边的半胱氨酸具有相对较高的暴露率,这与人们普遍认为亲水残基更有可能暴露在蛋白质表面的观点一致 (3)甘氨酸和脯氨酸附近的半胱氨酸具有更高的暴露率,这是因为这两种氨基酸通常出现在蛋白质的转角和环结构中,对半胱氨酸的空间位阻较小 (4)半胱氨酸暴露率与其有/无序区(图2D)或所处二级结构(图2E)的相关性分析均表明,较低的暴露率与更稳定和结构化的局部环境有很好的相关性。这些数据结果共同证明目前的方法可以准确地测得半胱氨酸暴露率,并为蛋白质结构提供有价值的信息。  图2.HEK293T细胞中半胱氨酸暴露率的分析。(A) VAHALAEGLGVIAC#IGEK(#代表标记位点)的串联质谱样本。报告离子的强度使我们可以准确定量一个半胱氨酸的暴露率(左框为报告离子强度的放大视图)。(B)蛋白CCT3中被定量半胱氨酸的定位和暴露率演示(PDB代码:6qb8)。(C−E)比较不同的溶剂可及性(C)、预测无序区(D)和二级结构(E)的半胱氨酸暴露率。  衣霉素(Tunicamycin,Tm)可抑制 N-糖基化并阻断 GlcNAc 磷酸转移酶 (GPT)。由于蛋白质的N-糖基化经常发生在共翻译过程中,在蛋白质折叠的调节中起着至关重要的作用,所以衣霉素会引起细胞内质网中未折叠蛋白的积累并诱导内质网应激。基于此,作者用衣霉素对细胞进行处理,计算并对比了衣霉素处理样本和正常样本中的半胱氨酸暴露率。正如预期的那样,Tm处理样本中许多半胱氨酸的暴露率升高,且Tm对于蛋白质不稳定区域的作用尤为显著。根据Tm处理样本和正常样本之间半胱氨酸暴露率的差值,作者将所有位点划分为5个部分,在Tm处理下,近三分之一的半胱氨酸定位区域没有明显的结构变化(差值在-0.05~0.05之间),而28%的位点则高度暴露(差值0.15)(图3B)。对这两种蛋白质进行基因本体(GeneOntology,GO)功能富集分析(图3C),结果显示:差值在-0.05~0.05之间的蛋白通常是糖异生或折叠过后具有良好结构区域的蛋白,而差值0.15的蛋白则是与囊泡转运相关的蛋白。这表明抑制N-糖基化主要影响经典分泌途径中的蛋白质,与预期相符。  图3.利用Tm抑制蛋白质N-糖基化对蛋白质折叠影响的系统研究。(A)Tm处理和对照样品之间半胱氨酸暴露率的比较。(B) 不同暴露率变化范围内的蛋白质数量。(C)在具有高度展开或稳定区域半胱氨酸的蛋白之间进行GO功能富集分析。  由于Tm对于预先存在的、折叠良好的蛋白质所产生的影响可能远小于对新合成蛋白的影响,分别研究Tm对这两种蛋白的影响是必要的。作者通过将目前的方法Cys-CPP与细胞培养中氨基酸的稳定同位素标记(pSILAC)结合(图4A),探究了细胞中已存在蛋白和新合成蛋白在内质网应激作用下的不同变化。结果显示:(1)抑制N-糖基化对新合成蛋白的去折叠影响比对已存在蛋白的影响更显著(图4C) (2)N-糖基化除了调节蛋白质的二级结构外,在蛋白质三级或四级结构的形成中起着更重要的作用(图4D)。  图4. 抑制N-糖基化对新合成蛋白和已存在蛋白折叠状态影响的研究。(A)量化新合成蛋白和已存在蛋白折叠状态变化的实验设置。(B) 经Tm处理和未经处理的细胞中新合成和已存在蛋白质的重叠。括号内为每组蛋白质数。(C)不同蛋白质组中暴露率的分布。(D) 在有或没有Tm处理的细胞中、在不同的二级结构下,新合成和已存在蛋白之间半胱氨酸暴露率的差值分布。  本文通过设计一种半胱氨酸靶向探针,定量半胱氨酸残基的暴露率,系统地研究了蛋白质的结构以及结构的变化。结果表明,半胱氨酸暴露率与蛋白质局部结构的相关性非常好。利用该方法,作者研究了Tm引起的内质网应激反应下细胞中蛋白质的结构变化。此外,通过将Cys-CPP与pSILAC结合,研究了在内质网应激反应下原有蛋白和新合成蛋白的结构变化差异,并详细分析了内质网应激对蛋白质去折叠的影响,深入和准确地了解内质网应激下的蛋白质结构变化,有助于深入了解蛋白质的功能和细胞活性。  参考文献:[1] Yin K, Tong M, Sun F, et al. Quantitative Structural Proteomics Unveil the Conformational Changes of Proteins under the Endoplasmic Reticulum Stress[J]. Analytical Chemistry, 2022,
  • 人工智能成功预测蛋白质相互作用 确定100多个新蛋白质复合物
    美国科学家主导的国际科研团队在最新一期《科学》杂志撰文指出,他们利用人工智能和进化分析,绘制出了真核生物的蛋白质之间相互作用的3D模型,首次确定了100多个可能的蛋白质复合物,并为700多个蛋白质复合物提供了结构模型,深入研究蛋白质相互作用有望催生新的药物。  研究负责人之一、美国西南大学人类发育与发展中心助理教授丛前(音译)称,研究结果代表了结构生物学新时代的重大进步。  丛前解释说,蛋白质通常成对或成组工作,形成复合物,以完成生物体存活所需的任务。虽然科学家已经对其中一些相互作用开展了深入研究,但许多仍是未解之谜。了解蛋白质之间所有的相互作用将揭示生物学的许多基本方面,并为新药研发提供参考。  但半个世纪以来,鉴于许多蛋白质结构的不确定性,科学家们很难了解这些相互作用。2020年和2021年,深度思维公司和华盛顿大学戴维贝克实验室独立发布了两种人工智能技术“阿尔法折叠”和RoseTTAFold,它们使用不同的策略预测蛋白质结构。  在最新研究中,丛前等人通过对许多酵母蛋白复合物建模,扩展了人工智能结构预测工具箱。为了找到可能相互作用的蛋白质,科学家们首先搜索相关真菌的基因组,寻找发生突变的基因,然后使用上述两种人工智能技术来确定这些蛋白质是否可以3D结构结合在一起。  他们确定了1505种可能的蛋白质复合物,其中699个结构已被表征,验证了其方法的实用性;另外700个复合物目前获得的数据有限,剩下106个从未被研究过。为更好地理解这些很少被描述或未知的复合物,团队研究了类似的蛋白质,并根据新发现的蛋白质与此前已知蛋白质的相互作用,确定了新发现蛋白质的作用。
  • 阿里云携手英特尔举办“冷冻电镜蛋白质结构建模大赛” 近900参赛队伍角逐28万奖金
    仪器信息网讯 日前,阿里云携手英特尔(中国)举办办的“英特尔创新大师杯”冷冻电镜蛋白质结构建模大赛正在开放报名中,目前已有近900个参赛队伍报名,将在接下来的近三个月内角逐28万元奖金。蛋白质的空间结构是结构生物学的关键研究对象,其对于理解蛋白质功能以及相关生物学过程的工作机理有非常重要的意义。准确的蛋白质结构原子模型不仅能够帮助研究者在理论上理解生命活动的内在原理,同时也能为药物研发等诸多工程实践提供指导。2021年7月,人工智能预测蛋白质3D结构技术一声惊雷,DeepMind和华盛顿大学团队的最新成果同日抢发Nature和Science!去年年底,谷歌 AI 团队 DeepMind 的第二代 AlphaFold 算法在生物界引起了极大的轰动,它能准确地预测蛋白质的结构,以至于许多人宣布这个长达数十年的问题“已被解决”。 具体而言,AlphaFold2 在国际蛋白质结构预测竞赛(CASP)上精确地基于氨基酸序列预测蛋白质的3D结构。其准确性可以与使用冷冻电镜(CryoEM)、核磁共振或 X 射线晶体学等实验技术解析的3D结构相媲美。据介绍,本次大赛将基于阿里云弹性高性能计算(Elastic High Performance Computing,E-HPC)进行。阿里云E-HPC平台,基于阿里云基础设施,可灵活生产基于任何ECS实例构成的HPC集群,满足不同应用特征的性价比要求。阿里云E-HPC主要面向教育科研、企事业单位和个人,提供快捷、弹性、安全的一站式公共云HPC服务。计算实例基于第三代英特尔® 至强® 可扩展处理器(CooperLake),通过高效、面向未来的服务器基础设施提供卓越的性能和灵活性,推动新的业务突破和科学发现。英特尔® 深度学习加速和增强型英特尔® AVX-512等内置优势提供了人工智能和HPC的融合以及工作负载性能。同时运用基于第三代英特尔® 至强® 可扩展处理器(IceLake)的Software Guard Expressions技术,通过内存中独立于操作系统或硬件配置的应用程序隔断,提供细粒度的数据保护。本次大赛意在探索基于大数据训练的人工智能方法在由电势能分布获取蛋白质原子模型方面的潜力。大赛组织主办单位:阿里云计算有限公司、英特尔(中国)有限公司指导单位:国家蛋白质科学中心(上海)承办单位:阿里云高性能计算、阿里巴巴达摩院、阿里云天池平台赛事链接:https://tianchi.aliyun.com/competition/entrance/531916/introduction 背景介绍蛋白质的空间结构是结构生物学的关键研究对象,其对于理解蛋白质功能以及相关生物学过程的工作机理有非常重要的意义。准确的蛋白质结构原子模型不仅能够帮助研究者在理论上理解生命活动的内在原理,同时也能为药物研发等诸多工程实践提供指导。目前解析蛋白质结构的主流方法有x射线晶体学(x-ray crystallography)、核磁共振波谱法(nuclear magnetic resonance spectroscopy)和冷冻电镜方法(cryo-electron microscopy),其中前两者具有长时间的实践积累和成熟的工作流程以及较为严苛的使用条件。今年来随着软硬件方面的突破,冷冻电镜方法,尤其是冷冻电镜单颗粒分析(single-particle cryo-EM)以其易用性和对生物样品相对宽松的要求逐渐成为获取蛋白质结构,尤其是生物大分子复合体结构的首选方案。在冷冻电镜单颗粒结构解析中,蛋白质被速冻在玻璃态的冰层里,电镜产生的电子束与其发生相互作用后被直接电子探测器捕捉,生成大量二维投影图像,之后利用专业软件重构出蛋白质的电势能分布,再基于电势能分布搭建出蛋白质的原子模型。获取蛋白质电势能分布目前已经有较为成熟的软件来完成,而从电势能分布获取原子模型则主要还是由研究人员手动操作,虽然有各种辅助软件可以利用,但是出于对准确度的要求,此项工作仍旧是整个工作流程中比较繁琐且主观性较强的环节。枚举每一种蛋白质可能存在的结构,需要花费大量的时间。最近,在强大的算法与算力的支持下,DeepMind将运算时间从数月缩短至了数小时。AI生物学带来了极致的效率革命,这对于人类攻克癌症等疑难杂症有着划时代的意义。要在数据洪流的时代实现重大的科学突破、分析基因组数据,应用于药物研发、疾病检测、个性化治疗,依赖于高效便捷的大数据分析技术和强大的计算平台支持。蛋白质破解的事件是一个标志,在生命科学领域取得突破性进展还需要高效的HPC系统和强大的算力,分析计算复杂、散点化、非结构化的生物医学大数据。本次大赛将基于阿里云弹性高性能计算(Elastic High Performance Computing,E-HPC)进行。阿里云E-HPC平台,基于阿里云基础设施,可灵活生产基于任何ECS实例构成的HPC集群,满足不同应用特征的性价比要求。阿里云E-HPC主要面向教育科研、企事业单位和个人,提供快捷、弹性、安全的一站式公共云HPC服务。计算实例基于第三代英特尔® 至强® 可扩展处理器(CooperLake),通过高效、面向未来的服务器基础设施提供卓越的性能和灵活性,推动新的业务突破和科学发现。英特尔® 深度学习加速和增强型英特尔® AVX-512等内置优势提供了人工智能和HPC的融合以及工作负载性能。同时运用基于第三代英特尔® 至强® 可扩展处理器(IceLake)的Software Guard Expressions技术,通过内存中独立于操作系统或硬件配置的应用程序隔断,提供细粒度的数据保护。本次大赛意在探索基于大数据训练的人工智能方法在由电势能分布获取蛋白质原子模型方面的潜力。赛程安排本次大赛分为初赛、复赛和决赛三个阶段,具体安排和要求如下:报名与实名认证(即日起—2021年9月28日,UTC+8)初赛(2021年8月16日-2021年9月29日,UTC+8)复赛(2021年10月11日—2021年11月11日,UTC+8)决赛答辩(11月下旬)奖项设置相关:2020年蛋白质结构预测大赛据悉,2020年,阿里云发起“蛋白质结构预测大赛”,当时赛题由达摩院顾斐博士、天津大学博士夏启等志愿者设计,数据来源于蛋白质数据库(PDC),希望通过比赛让更多跨学科开发者参与蛋白质二级结构预测研究中,以技术抗击疫情。最终参赛队伍为242个。
  • Nature | 我国科学家开发融合蛋白质图像和相互作用的细胞多尺度结构模型
    细胞是跨越了至少四个数量级的、复杂而精妙的模块化系统【1】。对细胞内模块化系统的刻画主要有两种方式,一是蛋白质荧光成像,一是蛋白质生物物理特性,这两种方面的技术可以产生大量的数据,但是这两种方式所产生的数据库具有不同的质量和分辨率,通常需要分别进行处理。那如何将两种方式的优点进行同时整合呢?近日,美国加州大学圣地亚哥分校Trey Ideker研究组(第一作者为博士生秦越)与瑞典皇家理工学院以及斯坦福大学Emma Lundberg研究组合作发文题为A multi-scale map of cell structure fusing protein images and interactions,将来自于人类蛋白质图谱(Human Protein Atlas)【2】的免疫荧光图像与BioPlex数据库【3】中亲和纯化结果进行整合,构建了多维度细胞整合图谱MuSIC1.0(Multi-scale integrated cell),对人类细胞中的结构层次进行了统一化的分析,从而解析出69个亚细胞系统,为整合各种各样不同类型的数据来创建全蛋白细胞模型铺平了道路。真核细胞由多种大的组分组成,比如细胞器、凝聚体或者蛋白质复合体,从而形成一个多维度的结构。人类蛋白图谱系统性地对人类细胞中蛋白质在亚细胞结构中定位进行了全面解析,与此同时质谱与亲和纯化(Mass spectrometry combined with affinity purification, AP-MS)技术将临近标记引入蛋白质组学探究之中,从而能够快速检测蛋白和蛋白之间的相互作用。因此,如果能将蛋白质成像与生物物理之间的关联结合起来,便可以对细胞结果进行更进一步地解析。为此,作者们构建了一种机器学习方法,可以将蛋白质成像与生物物理特性进行关联和集成,从而构建一个亚细胞结构组成组分的统一图谱。图1 蛋白质成像与AP-MS数据库整合策略首先,作者们使用深度神经网络(Deep neural network,DNN)对蛋白质图像与相互作用数据进行整合,确定每个平台中蛋白质的坐标,对蛋白质之间的距离进行校准和组合,从而确认在不同维度下蛋白质复合体的组装方式(图1)。这两个全方位的数据库均来自HEK293细胞。作者们对蛋白质配对之间的相互作用距离进行检测,举例来说,来自蛋白质复合体中的蛋白之间相互作用距离少于20nm,而细胞器中的蛋白质之间距离可能会超过1μm。作者们分析了661个蛋白质之间的所有距离,以识别相互接近的蛋白质组分。随着距离的变化,能够产生一个蛋白质多维度结构层次图谱(图2)。由此,作者们发现所构建的MuSIC系统能够以很广的范围对生物系统内的蛋白质相互作用进行测量和捕捉。图2 结构层次图谱建立和检测的流程在建立起该整合图谱后,作者们希望对MuSIC系统进行一个全局性的评估。MuSIC图谱中有370个蛋白以前未在AP-MS实验中用于亲和标记进行相互作用因子的钓取。因此,作者们对134个猎物蛋白进行标记进行AP-MS实验,从而检测到339个相互作用配对,进而对该整合图谱的准确性进行了全面的验证。在MuSIC发现的全新的亚细胞系统中,有一个由七个蛋白质复合体组成的直径估计为81nm的系统,作者们将此系统命名为前体核糖体RNA加工组装复合体(Pre-ribosomal RNA processing assembly,PRRPA)。为了对PRRPA复合体在前体rRNA加工中的作用进行确认,作者们使用siRNA对每个蛋白进行了敲降,发现所有的敲降都会一定程度上破坏核糖体RNA的成熟。另外,作者们使用RNA免疫共沉淀定量qPCR对这些蛋白结合45S前体rRNA的能力进行检测,再次证明了这些蛋白质在前体rRNA加工过程中的作用。同时作者们发现所建立的MuSIC系统也可以对一些蛋白质的功能进行更为全面的认识,包括发现已知蛋白的全新功能和未知蛋白的潜在功能。总的来说,该工作通过汲取蛋白质荧光成像与蛋白质生物物理特性两方面之长构建了多尺度细胞整合图谱MuSIC 1.0,进一步地提高了现有蛋白质荧光图像中信息的分辨率,也为蛋白质相互作用提供了空间维度的信息,为人类细胞中蛋白质组研究提供了更为全面的认识。原文链接:https://doi.org/10.1038/s41586-021-04115-9
  • 成果:AlphaFold2改进版与交联质谱技术预测蛋白质结构进展
    大家好,本周为大家分享一篇发表在Nature Biotechnology上的文章,Protein structure prediction with in-cell photo-crosslinking mass spectrometry and deep learning,该文章的通讯作者是德国柏林工业大学的Juri Rappsilber教授和机器人与生物学实验室的Oliver Brock团队。  由谷歌公司旗下的DeepMind团队所开发的AlphaFold2对于蛋白质结构的准确预测是一项巨大的成就,其对生命科学的影响仍然在显现。虽然AlphaFold2可以从一级序列预测准确的蛋白质结构,但对于发生构象变化或已知同源序列很少的蛋白质仍然存在挑战。  本文介绍了AlphaLink,AlphaFold2算法的一个改进版本,它将实验距离约束信息合并到其网络架构中,通过使用稀疏的实验约束作为锚点,提高了AlphaFold2在预测具有挑战性的目标方面的性能。文章通过使用非典型氨基酸光亮氨酸(Photo-L),通过交联质谱获得细胞内残基-残基接触的信息,并通过实验证实了这一点。  AlphaLink可以根据所提供的距离约束来预测蛋白质的不同构象,证明了实验数据在推动蛋白质结构预测方面的价值。该研究提出的用于集成蛋白质结构预测数据的抗噪声框架为从细胞内数据准确表征蛋白质结构开辟了新道路。  AlphaFold2基于静态输入数据预测静态模型,它在两个信息源上进行了训练,即蛋白质数据库(PDB)和多序列比对(MSA)中的蛋白质结构。这种方法受到了那些进化信息不足的目标的挑战,从而产生了不太可信或错误的预测。此外,X射线衍射分析的蛋白结构不能很好地反映结构的灵活性、多种构象和动态相互作用,而在溶液(理想状态下是在细胞内)中观察到的蛋白质的结构约束可以帮助解决这些问题。因此,在 AlphaFold2框架中添加这样的限制,可以引导预测在特定条件下发生的原位结构状态。  交联质谱(XL-MS)能够提供距离约束,可用于蛋白质结构预测。特别是,光反应氨基酸(Photo-AA)很容易被原核细胞和真核细胞结合,这为探索蛋白质的原位构象提供了可能性。此外,Photo-AA交联产生了相对紧密的距离限制,与共同进化接触良好对齐,这是大多数蛋白质结构预测方法的基础,包括AlphaFold2。  在本文中,作者介绍了AlphaLink,这是一种结构预测方法,它将Photo-AA交联的实验数据直接集成到AlphaFold2体系结构中(图1)。AlphaLink使用深度学习来合并共同进化关系的距离空间和交联数据,充分利用了数据的互补性。作者证明了AlphaLink可以利用嘈杂的实验接触来改善对模拟和真实实验数据上具有挑战性的目标的预测,从而将预测转向蛋白质的原位构象(图2)。为了测试AlphaLink,作者用光亮氨酸进行了大规模的交联质谱研究,文章表明,即使是稀疏交联的质谱数据也可以将预测锚定到特定的构象状态,从而打开了通过混合实验/深度学习方法探测动力学的可能性(图3)。该研究还进一步将 AlphaLink扩展到任意距离约束,引入了将距离约束编码为图表的二次表征(图4、5)。  AlphaLink:通过OpenFold将交联技术集成到AlphaFold2中  图 1. AlphaLink中的信息流程  集成photo-AA交联实现对具有挑战性靶点的抗噪声预测    图 2. AlphaLink与AlphaFold2的性能比较  Photo-L作为原位结构探针  图 3. 在大肠杆菌中的原位photo-L交联质谱  利用原位photo-L数据进行构造预测  图 4. 利用大肠杆菌膜部分的细胞内photo-L交联质谱数据的结构预测  原位探测构象动力学  图 5. Photo-AA数据,指导特定构象状态的预测  综上所述,本文的研究结果表明,AlphaLink成功地通过深度学习、利用实验距离约束来改善蛋白质结构的预测。文章提出了一个基于Photo-AA交联质谱的工作流程,提供了类接触距离信息,并获得了细胞内第一个大规模的Photo-AA交联质谱数据集。然后,文章在AlphaLink中实现了基于Photo-AA的蛋白质结构预测。本文的方法利用一系列通用接触,以显式距离约束或双图表示,以引导OpenFold管道走向与实验数据一致的结构。因此,本文概述的工作流程为混合实验辅助人工智能预测蛋白质结构提供了一个总体框架,直接在原位研究蛋白质的结构与功能之间的关系,而不需要任何基因操作。  撰稿:聂旻涵编辑:李惠琳  原文:Protein structure prediction with in-cell photo-crosslinking mass spectrometry and deep learning  李惠琳课题组网址www.x-mol.com/groups/li_huilin  参考文献  1. Stahl, Kolja et al. “Protein structure prediction with in-cell photo-crosslinking mass spectrometry and deep learning.” Nature biotechnology, 10.1038/s41587-023-01704-z. 20 Mar. 2023, doi:10.1038/s41587-023-01704-z.
  • 王方军团队成果:发布蛋白质-纳米材料界面相互作用的结构质谱表征实验手册
    近日,中国科学院大连化学物理研究所生物技术研究部生物分子结构表征新方法研究组研究员王方军团队发布了表征蛋白质-纳米材料界面相互作用精细结构的赖氨酸反应性分析-质谱(LRP-MS)实验手册。  微/纳米材料在生命科学、医药健康、生物催化等领域广泛应用,探讨蛋白质与材料之间的界面相互作用分子机制对生物医用材料的安全性评价、纳米药物的毒性评估和理性设计、生物-无机功能杂合体的改性和催化活性提升等具有重要意义。然而,现有光谱学等方法只能表征材料引起的蛋白质结构整体变化情况,蛋白质-材料界面相互作用分子细节的探测面临挑战。  赖氨酸残基通常定位于亲水性蛋白质表面,其侧链伯氨基的化学标记反应性取决于其溶剂可及性和微环境非共价相互作用。当蛋白质表面与微/纳米材料结合时,结合界面上赖氨酸的溶剂可及性和反应性均随之降低。因此,王方军等提出了赖氨酸的反应性变化是探测蛋白质-微/纳米材料复合体中蛋白质定位方向、相互作用序列区域、关键结合位点、材料结合引起蛋白质结构变化的有效指标。该团队发展了在蛋白质—微/纳米材料复合体活性和变性条件下的两步同位素二甲基化标记的标准化策略,结合质谱定量分析实现蛋白质上赖氨酸反应性的全面分析,研究通过材料结合前后赖氨酸标记反应性的显著性差异确定蛋白质-材料的界面序列区域和关键位点。  王方军团队长期从事生物大分子结构质谱尖端仪器和创新方法研究,所发展的LRP-MS策略近年来已应用于蛋白质-蛋白质、蛋白质-小分子、蛋白质-微/纳米材料的界面相互作用分子机制解析,取得了系列研究进展。  近日,相关研究成果以Structural Characterization of the Protein-Material Interfacial Interactions Using Lysine Reactivity Profiling-Mass Spectrometry为题,发表在《自然-实验手册》(Nature Protocols)上。研究工作得到国家重点研发计划、国家自然科学基金和大连化物所创新基金等的支持。  论文链接:https://www.nature.com/articles/s41596-023-00849-0
  • 破译蛋白质结构的秘诀:利用富含炔基的羧基选择性交联剂增加交联覆盖率
    大家好,本周为大家分享一篇发表在Anal. Chem.上的文章,Alkynyl -Enrichable Carboxyl-Selective Crosslinkers to Increase the Crosslinking Coverage for Deciphering Protein Structures,该文章的通讯作者是中国科学院大连化学物理研究所的赵群和张丽华研究员。化学交联结合质谱技术 (CXMS) 的交联覆盖范围对于决定其破译蛋白质的结构的能力具有重要意义。目前,交联质谱技术中最常用的交联剂的类型为针对赖氨酸侧链的N-羟基琥珀酰亚胺 (NHS) 酯基交联剂。然而,此种交联剂存在一定的局限性,尤其是对于含有赖氨酸数目较少的蛋白质;其他类型的氨基酸残基,如羧基等,也可以进行交联反应,以补充赖氨酸残基的局限性并提高 CXMS 的交联覆盖率,然而,羧基的低固有化学反应活性损害了羧基选择性交联剂在复杂样品中的应用。鉴于此,本文开发了三种具有不同反应基团(如酰肼、氨基和氨氧基)的富含炔基的羧基选择性交联剂,以此提高针对酸性残基的交联效率并实现复杂样品的深入交联分析。文章要点:(1)本工作系统地评估了三种交联剂的交联效率,给出了氨基功能化交联剂 BAP 的最佳反应性。此外,结合BAP交联剂于高效的交联富集策略对大肠杆菌裂解物进行交联分析。在 ≤1% 的错误发现率 (FDR) 下,共鉴定出 392 种蛋白质中涉及到的 1291 个 D/E-D/E 交联。(2) 研究结果显示,BAP 与赖氨酸靶向交联剂具有明显的结构互补性,这提高了CXMS 进行蛋白质结构解析的能力。本工作是羧基选择性交联剂首次实现全细胞裂解物的全蛋白质组交联分析。总的来说,这项工作不仅扩展了一个针对酸性残基的十分具有前途的 CXMS 工具包,同时还为提高羧基选择性交联剂的性能提供了有价值的指导。图1 三种交联剂BHP、BAP和BOP的化学性质。(A) 三功能交联剂的化学结构:两个反应性基团用红色表示,一个可修饰的手柄用橙色表示。三种交联剂的Cα原子之间的最大距离约束利用软件Chem3D 19.0计算得出。(B) 利用软件pLink 2.0分析三种交联剂与蛋白质进行交联质谱实验的MS/MS谱。(C) 三种交联剂的反应效率直方图。(D) 酰胺化反应的机理。图2 三种交联剂BHP、BAP和BOP在BSA蛋白质、六蛋白混合物和E. coli 70S ribosome结构分析中的性能。(A) 三种交联剂与BSA的反应中鉴定出的交联的维恩图。(B) 交联的Cα−Cα 距离分布的直方图,通过映射到BSA的晶体结构来验证。(C) BSA中交联残基分布的二维 (2D) 热图。颜色插入表示交联的距离分布。(D) 六蛋白混合物的环形二维交联图。黑线表示蛋白质内的交联,红线表示蛋白质间的交联。(E) 将交联映射到TXN2 (UniProtID:Q99757,PDB:1W4V)、CA2 (UniProtID:P00921,PDB:6SKS)和E. coli 70S ribosome (PDB:5KCS)的X射线晶体结构上,由BAP(红线)和BSP(黄线)鉴定。图3 基于BAP的交联平台,用于大肠杆菌裂解液的全蛋白质组分析,包括蛋白质复合物交联、点击化学、链霉亲和素富集、分馏和LC-MS/MS分析。图4 通过BAP对大肠杆菌裂解液的全蛋白质组分析。(A)富集前后鉴定的谱图数目的比较。黑色和红色分别对应于常规肽和交联肽的谱图。(B)将由BAP(红线)和BSP(黄线)鉴定的交联映射到蛋白质的X射线晶体结构上。(C)将交联映射到由BAP专门鉴定的蛋白质的X射线晶体结构上。 (D)使用Xplor-NIH软件包对hns (UniProtID:P0ACFID) 和grcA (UniProtID:P68066) 的AF2预测结构进行细化。用BAP和BSP鉴定出的交联分别用红色和黄色标记。在本工作中,作者开发并表征了三种新的可富集的羧基选择性交联剂,它们具有不同的反应基团酰肼、氨基和氨基氧基。其中,氨基功能化交联剂 BAP 对于所有不同复杂度的蛋白质样品均表现出最佳的交联反应活性和鉴定覆盖率。此外,BAP扩展到大肠杆菌裂解液的交联分析与高效的交联富集相结合。本工作首次使用羧基选择性交联剂,以实现全细胞裂解液的全蛋白质组范围内的交联分析。因此,以上所有结果表明,本工作开发的 BAP 是一个很有前途的工具包,可以提高蛋白质结构分析的交联覆盖率。此外,本项工作还可以为提高羧基选择性交联剂的性能提供有价值的指导。参考文献:Gao H, Zhao Q, Gong Z, et al. Alkynyl-Enrichable Carboxyl-Selective Crosslinkers to Increase the Crosslinking Coverage for Deciphering Protein Structures [published online ahead of print, 2022 Aug 29]. Anal Chem.2022 10.1021/acs.analchem.2c02205. doi:10.1021/acs.analchem.2c02205
  • 蛋白质组学的前世今生与未来: 蛋白质存在形式 -- 记中南大学湘雅医院詹显全教授
    p style=" text-align: justify line-height: 1.75em "   詹显全,中南大学教授、博士研究生导师、博士后合作导师,英国皇家医学会会士(FRSM)、美国科学促进会(AAAS)会员、欧洲预测预防个体化医学协会(EPMA)的会士和国家代表、美国肿瘤学会(ASCO会士、欧洲科技合作组织(e-COST)的海外评审专家,中国抗癌药物国家地方联合工程实验室技术委员会委员、技术带头人和副主任,临床蛋白质组学与结构生物学学科学术带头人和学科负责人,国家临床重点专科建设项目重点实验室建设项目学科带头人,湖南省百人计划专家、湖南省高层次卫生人才“225”工程医学学的学科带头人、中南大学“531”人才工程专家。目前正致力于从多参数系统策略角度阐述肿瘤的分子机理、发现肿瘤分子标志物,研究并整合基因组、转录组、蛋白质组和代谢组的变异来实现肿瘤的预测、预防与个体化治疗及精准医学。已发表学术论文130 余篇,主编国际学术专著3 本,参编国际学术专著16 本,获得美国发明专利2 个。受邀在中科院1 区影响因子9.068 MassSpectrometry Reviews 和中科院2 区影响因子3.65 Frontiers in Endocrinology 的国际期刊上客座主编了3 个专刊。 /p p style=" text-align: justify line-height: 1.75em text-indent: 2em " 本篇文章仪器信息网获得授权转载,来源中国科技成果杂志。 /p p style=" text-align: center line-height: 1.75em "    span style=" color: rgb(0, 112, 192) " strong 深入剖析蛋白质组学技术最新进展与应用 /strong /span /p p style=" text-align: justify line-height: 1.75em "   詹显全:人类结构基因组测序接近尾声,人们就从结构基因组学研究转向功能基因组学研究,即对转录组和蛋白质组进行研究。1995 年正式提出了”蛋白质组”和”蛋白质组学”的概念,距今已有25 年历史了。 /p p style=" text-align: justify line-height: 1.75em text-indent: 2em " 蛋白质组学的主要技术包括蛋白质组的分离技术、鉴定技术和蛋白质组信息学技术。 span style=" text-indent: 2em " 蛋白质组的分离技术主要有双向凝胶电泳(2DE)和多维液相色谱(2DLC)。蛋白质组的鉴定技术主要是基于质谱(MS)的技术,主要分为肽质指纹(PMF)和串联质谱(MS/MS)分析技术,其用于蛋白质大分子分析的两大离子源主要有MALDI 和ESI。质谱技术发展很快,主要朝向高灵敏度、高通量和高精度方向发展。 /span /p p style=" text-align: justify line-height: 1.75em "   蛋白质组信息学技术主要是用来构建蛋白质相互用网络的相关技术。蛋白质组的分离技术和质谱技术的不同联合就形成了各种类型的蛋白质组学分析技术:如2DE-MS和2DLC-MS。2DE-MS 又有2DE-MALDI-PMF 和2DE-ESI-LC-MS/MS, 该技术在蛋白质组学研究的头10-15 年是其主要技术,然而常规概念认为2DE 的通量不高,即一个2D 胶点中一般仅含有1 ~ 2 个蛋白质,通常一次实验其通量仅能鉴定几十到一千个蛋白质,这样其在蛋白质组学中的地位逐渐被淡化。 /p p style=" text-align: justify line-height: 1.75em text-indent: 2em " 2DLC-MS 主要有iTRAQ or TMT-based SCX-LC-MS/MS and labelfree LC-LC-MS/MS, 这就是人们通常说的“Bottomup”蛋白质组学,该技术在最近10 ~ 15 年在蛋白质组学中起着核心技术的作用,因为其通量明显增加,一次实验其通量可达到几千到一万的蛋白质能被鉴定,但该法鉴定的结果是一个protein group, 实质上鉴定的是编码蛋白质的基因, 而并没有鉴定到真正意义上的蛋白质,即蛋白质存在形式(Proteoforms 或Protein species)。蛋白质存在形式(Proteoforms)是蛋白质组的基本单元。人类基因大约2 万个,人类转录本至少10 万个,每个转录本指导核糖体按三联密码子决定一个氨基酸残基来合成氨基酸序列,刚合成出来的蛋白质氨基酸序列是没有功能的,它必须到达其指定的位置如胞内、胞外,和不同的亚细胞器等,形成特定的三位空间结构,并与其周围的相关分子相互作用,形成一个复合物(complex)才能发挥其功能作用。从核糖体刚合成出来到其指定的位置过程中有很多的蛋白质翻译后修饰(PTMs 据估计人体有400 ~ 600 种PTMs)。我们最近对蛋白质存在形式的概念给出了最新最完整的定义:蛋白质的氨基酸序列+ 翻译后修饰+ 空间构型+ 辅助因子+ 结合伴侣分子+ 空间位置+ 特定的功能。而蛋白质的概念被定义为:由同一个基因编码的所有蛋白质存在形式的集合体。这样,人类蛋白质组中的蛋白质存在形式(Proteoforms)至少有100 万或甚至达10 亿 (图1)。 /p p style=" text-align: center" img style=" max-width: 100% max-height: 100% width: 600px height: 427px " src=" https://img1.17img.cn/17img/images/202008/uepic/1d18fad3-b010-4ea5-a812-432853ad4ec6.jpg" title=" 1111111.png" alt=" 1111111.png" width=" 600" height=" 427" border=" 0" vspace=" 0" / /p p style=" text-align: center line-height: 1.75em "   图1 :Proteoforms 的概念及形成模式 (Zhan et al,Med One, 2018 Zhan et al., Proteomes, 2019) /p p style=" text-align: justify line-height: 1.75em "   如此庞大数量的Proteoforms/Protein species, 如何对其进行大规模的探测、鉴定和定量,是一个至关重要的事情。目前关于Proteoforms 的研究有两套策略一是“Top-down”MS 技术, 二是“Top-down” 和“Bottom-up”相结合的技术即2DE-LC/MS 技术(图2)。 /p p style=" text-align: center" img style=" max-width: 100% max-height: 100% width: 600px height: 415px " src=" https://img1.17img.cn/17img/images/202008/uepic/94f48c94-fd0b-4959-90fb-dd399cebf074.jpg" title=" 2.png" alt=" 2.png" width=" 600" height=" 415" border=" 0" vspace=" 0" / /p p style=" text-align: center line-height: 1.75em "   图2 :Proteoforms 研究技术比较(Zhan et al., Med One, 2018 Zhan et al., Proteomes, 2019) /p p style=" text-align: justify line-height: 1.75em "   “Top-down”MS 技术能探测、鉴定和定量Proteoforms,获得蛋白质的氨基酸序列和PTMs 信息,然而该技术的通量较低,目前最大通量鉴定到5700 个Proteoforms, 对应到860 蛋白质。 /p p style=" text-align: justify line-height: 1.75em "   最近,詹显全教授团队发现2DE-LC/MS 技术是一超高通量的技术平台,在探测、鉴定和定量Proteoforms方面, 可以鉴定达几十万至上100 万的Proteoforms。随着质谱灵敏度的显著提高,自2015 年以来,詹显全教授团队就发现每个2D 胶点包含了平均至少50 个甚至达几百个Proteoforms,并且大多数是低丰度的 并在近1 ~ 2 年来发表了相关论文来全面阐述2DE-LC/MS 的新理念和实践,完全打破了40 多年来人们对双向电泳的传统认识 (即一个2D 胶点中一般仅含有1 ~ 2 蛋白质),为大规模的Proteoforms 研究提供了技术基础。Proteoforms/Protein species 概念的发展极大的丰富了蛋白质组的内涵,是蛋白质组学研究的更高层次,是国际科学发展的前沿,必将影响着整个生命科学和医学科学的研究和实践,有助于发现可靠而有效的疾病标志物,用于深度理解疾病分子机制和决定药物靶点,或者用于有效的预测、诊断、预后评估。另外,蛋白质组是表型组的重要成分,是基因组功能的最终执行者,是基因组和转录组研究所不能替代的,要实现真正的个性化医学和精准医学,蛋白质组学研究是不能绕过去的。 /p p style=" text-align: center line-height: 1.75em "    span style=" color: rgb(0, 112, 192) " strong 基于整合组学发现疾病标志物才是精准发展之重 /strong /span /p p style=" text-align: justify line-height: 1.75em "   1. 您一直专注于肿瘤蛋白质组学的研究,例如垂体瘤、卵巢癌等相关恶性肿瘤结合组学的研究,请谈谈在这方面的最新的研究成果,以及过程中的主要挑战和解决方案 /p p style=" text-align: justify line-height: 1.75em "   詹显全: 垂体瘤是颅内常见肿瘤,绝大多数是良性的,只有少数具有侵袭性和恶性,并能引起激素分泌紊乱和颅内压迫症状,出现严重的临床症状,危害人体健康。临床上分为功能性垂体瘤和非功能性垂体瘤,并且非功能性垂体瘤不表现血中激素水平增加,不易早期诊断,经常是当肿瘤体积增加到压迫周围组织器官产生压迫综合征时才被诊断,这时已经是中晚期了,且其分子 /p p style=" text-align: justify line-height: 1.75em "   机制并不清楚,缺乏早期诊断标志物和药物治疗靶标。因此,非功能性垂体瘤被选为主要研究对象。虽然垂体瘤是在颅内,但我们认为垂体瘤是一种多病因、多过程、多结果的全身性的慢性疾病,并且还具有肿瘤的异质性 它涉及到一系列的分子改变,包括发生在基因组、转录组、蛋白质组、代谢组和相互作用组水平上的改变,而这些不同水平改变的分子和信号通路又不是孤零零的起作用,而是相互间具有千丝万缕的联系。因此,我们很难用一种单一因素来解决其预测、预防、诊断、治疗和预后评估 而必须从单因素模式转向多参数系统思维模式。垂体瘤的多病因、多过程、多结果、全身性、慢性、分子网络系统性给其“同病同治”提出了严峻挑战,同时为实现其个性化的精准预测、精准预防、精准诊断和精准治疗提供了机遇和条件。多组学(基因组学、转录组学、蛋白质组学、代谢组学、影像组学)和系统生物学技术的发展驱动了这一多参数系统思维模式的转变、推进了其个性化医学和精准医学的研究和实践。因此,我们认为多参数系统策略观和多组学是进行垂体瘤个性化医学和精准医学的研究和实践的重要理念和技术方案。 /p p style=" text-align: justify line-height: 1.75em "   我们从2001 开始进行垂体瘤的蛋白质组学及其翻译后修饰组学研究,从2008 年开始进行多组学和分子网络研究,及预测预防个体化医学(PPPM)和精准医学(PM)研究。经过过去近20 年未间断的研究,我们在垂体瘤的蛋白质组学、翻译后修饰组学、多组学、分子网络和系统生物学研究方面在国际上处于了主导地位。 /p p style=" text-align: justify line-height: 1.75em "   在我们研究过程中,我深深体会到一个重大思转变就是从以前的单参数模式转向了多参数系统思维模式,这符合肿瘤的真实情况。另外,就是多组学技术促进了这一模式的转变,并是其主要的解决方案。 /p p style=" text-align: justify line-height: 1.75em "   2. 从您的研究方向及重点出发,您认为多组学研究在精准医学中接下来的研究应当侧重于哪些方面,以及如何才能比较好的实现从研究到临床的转化落地? /p p style=" text-align: justify line-height: 1.75em "   詹显全:我的研究对象是肿瘤(垂体瘤、卵巢癌、肺癌、胶质瘤),研究理念是肿瘤的多参数系统策略观,技术手段是多组学和系统生物学,研究的目标是要解决肿瘤的预测预防个体化医学(PPPM)和精准医学(PM)。 /p p style=" text-align: justify line-height: 1.75em "   我们认为多组学中的不同组学对PPPM/PM 的贡献是不平衡的,即个性化的表型组是基因组通向PPPM/PM 应用实践的桥梁,而蛋白质组和代谢组是表型组中两重要成分。蛋白质组的内涵包括蛋白质的拷贝数变化、剪切变化、翻译后修饰、转位、再分布、空间构型、与周围分子相互作用、及信号通路网络问题。代谢组的内涵涉及到体内所有物质(包括糖、脂、蛋白质、核酸)的代谢产物及其代谢网络问题。要真正实现PPPM 和PM,蛋白质组和代谢组的贡献是基因组所不能替代的是不能绕过去的。人们应从以基因组为中心的研究和实践转向以表型组为中心的研究和实践。其中蛋白质组的研究又应以翻译后修饰和蛋白质存在形式(Proteoforms)作为今后的研究方向。Proteoforms 的研究必将影响着整个生命科学和医学科学。从临床转化研究来看,基于多组学的整合生物标志物是发展方向。对于这里的生物标志物,我们将其分为两类:一类是解决疾病分子机制和药物靶点的生物标志物,这类生物标志物一定要有因果关系 一类是解决预测、诊断、预后评估的生物标志物,这类标志物不一定要求有因果关系,但必要要有量的变化。 /p p style=" text-align: justify line-height: 1.75em "   3. 作为EPMA(欧洲预测预防个体化医学协会)的中国代表,想请您分享下国际上对于组学研究在精准医疗中的应用现状、趋势以及发展规划 /p p style=" text-align: justify line-height: 1.75em "   詹显全:欧洲预测预防个体化医学协会(EPMA)是国际个体化医学领域领头的学术协会,由来自全球55 个国家和地区的专家学者组成,其创办的官方杂志EPMA Journal( 中科院2 区,ESI IF5.661) 涵盖了24 个专题内容,较全面地反映了预测预防个体化医学(PPPM)和精准医学(PM)的研究、实践与最新动态,还涉及到PPPM 和PM 的政策、伦理、卫生经济和社会保障等许多方面,为PPPM 和PM 的科研、实践提供了一个很好的交流平台。 /p p style=" text-align: justify line-height: 1.75em text-indent: 2em " 我本人作为EPMA 的中方代表(National Representative of EPMA in China) 和其官方杂志EPMA Journal 的副主编,参与了其经历的重要活动。我从2008 开始起在EPMA 中主要负责多组学和创新技术方面,在EPMA 白皮书中的“肿瘤预测预防个体化医学的多参数系统策略观”这部分最早就是我写的,之后我们写了一系列文章来论述基于多组学的多参数系统策略的研究和实践。因此,在EPMA,我们的基于多组学的多参数系统策略观还是比较早的,近五六年来多组学研究在EPMA 圈内(55 个国家和地区)发展得很快,已经深入到PPPM 的各个领域。 /p p style=" text-align: justify line-height: 1.75em "   另外,我认为,精准医学在理念上没错,严格意义上的精准医学是个理想化的概念,人们只能无限去逐步接近它。现阶段搞精准医学还是要回归到人类健康的保护过程,即预测、预防、诊断、治疗和预后评估,这里应该是针对个人来说而不是针对群体,严格说来应该是个性化的精准预测、精准预防、精准诊断、精准治疗和精准预后评估。对于人类健康保护过程来说,预测、预防还是上策,其次就是早诊断、早治疗。多组学研究已渗入到人类健康保护过程的每个环节,主要用来寻找基于多组学的生物标志物,当然这里的生物标志物应泛指前面说的两类:一类是解决疾病机制和治疗靶点的标志物,一类是解决预测、诊断、预后评估的标志物。 /p p style=" text-align: justify line-height: 1.75em text-indent: 2em " 因此,基于多组学的PPPM/PM 的研究和实践一定是今后发展的一个长远趋势。 /p p style=" text-align: center" img style=" max-width: 100% max-height: 100% width: 600px height: 802px " src=" https://img1.17img.cn/17img/images/202008/uepic/581ff7cf-5c3e-4fd6-8f5f-805989791ee5.jpg" title=" 詹.jpg" alt=" 詹.jpg" width=" 600" height=" 802" border=" 0" vspace=" 0" / /p p br/ /p
Instrument.com.cn Copyright©1999- 2023 ,All Rights Reserved版权所有,未经书面授权,页面内容不得以任何形式进行复制