质谱结构预测新闻_质谱结构预测行业动态

成果：AlphaFold2改进版与交联质谱技术预测蛋白质结构进展
大家好，本周为大家分享一篇发表在Nature Biotechnology上的文章，Protein structure prediction with in-cell photo-crosslinking mass spectrometry and deep learning，该文章的通讯作者是德国柏林工业大学的Juri Rappsilber教授和机器人与生物学实验室的Oliver Brock团队。　　由谷歌公司旗下的DeepMind团队所开发的AlphaFold2对于蛋白质结构的准确预测是一项巨大的成就，其对生命科学的影响仍然在显现。虽然AlphaFold2可以从一级序列预测准确的蛋白质结构，但对于发生构象变化或已知同源序列很少的蛋白质仍然存在挑战。　　本文介绍了AlphaLink，AlphaFold2算法的一个改进版本，它将实验距离约束信息合并到其网络架构中，通过使用稀疏的实验约束作为锚点，提高了AlphaFold2在预测具有挑战性的目标方面的性能。文章通过使用非典型氨基酸光亮氨酸(Photo-L)，通过交联质谱获得细胞内残基-残基接触的信息，并通过实验证实了这一点。　　AlphaLink可以根据所提供的距离约束来预测蛋白质的不同构象，证明了实验数据在推动蛋白质结构预测方面的价值。该研究提出的用于集成蛋白质结构预测数据的抗噪声框架为从细胞内数据准确表征蛋白质结构开辟了新道路。　　AlphaFold2基于静态输入数据预测静态模型，它在两个信息源上进行了训练，即蛋白质数据库(PDB)和多序列比对(MSA)中的蛋白质结构。这种方法受到了那些进化信息不足的目标的挑战，从而产生了不太可信或错误的预测。此外，X射线衍射分析的蛋白结构不能很好地反映结构的灵活性、多种构象和动态相互作用，而在溶液(理想状态下是在细胞内)中观察到的蛋白质的结构约束可以帮助解决这些问题。因此，在 AlphaFold2框架中添加这样的限制，可以引导预测在特定条件下发生的原位结构状态。　　交联质谱(XL-MS)能够提供距离约束，可用于蛋白质结构预测。特别是，光反应氨基酸(Photo-AA)很容易被原核细胞和真核细胞结合，这为探索蛋白质的原位构象提供了可能性。此外，Photo-AA交联产生了相对紧密的距离限制，与共同进化接触良好对齐，这是大多数蛋白质结构预测方法的基础，包括AlphaFold2。　　在本文中，作者介绍了AlphaLink，这是一种结构预测方法，它将Photo-AA交联的实验数据直接集成到AlphaFold2体系结构中(图1)。AlphaLink使用深度学习来合并共同进化关系的距离空间和交联数据，充分利用了数据的互补性。作者证明了AlphaLink可以利用嘈杂的实验接触来改善对模拟和真实实验数据上具有挑战性的目标的预测，从而将预测转向蛋白质的原位构象(图2)。为了测试AlphaLink，作者用光亮氨酸进行了大规模的交联质谱研究，文章表明，即使是稀疏交联的质谱数据也可以将预测锚定到特定的构象状态，从而打开了通过混合实验/深度学习方法探测动力学的可能性(图3)。该研究还进一步将 AlphaLink扩展到任意距离约束，引入了将距离约束编码为图表的二次表征(图4、5)。　　AlphaLink：通过OpenFold将交联技术集成到AlphaFold2中　　图 1. AlphaLink中的信息流程　　集成photo-AA交联实现对具有挑战性靶点的抗噪声预测　　　　图 2. AlphaLink与AlphaFold2的性能比较　　Photo-L作为原位结构探针　　图 3. 在大肠杆菌中的原位photo-L交联质谱　　利用原位photo-L数据进行构造预测　　图 4. 利用大肠杆菌膜部分的细胞内photo-L交联质谱数据的结构预测　　原位探测构象动力学　　图 5. Photo-AA数据，指导特定构象状态的预测　　综上所述，本文的研究结果表明，AlphaLink成功地通过深度学习、利用实验距离约束来改善蛋白质结构的预测。文章提出了一个基于Photo-AA交联质谱的工作流程，提供了类接触距离信息，并获得了细胞内第一个大规模的Photo-AA交联质谱数据集。然后，文章在AlphaLink中实现了基于Photo-AA的蛋白质结构预测。本文的方法利用一系列通用接触，以显式距离约束或双图表示，以引导OpenFold管道走向与实验数据一致的结构。因此，本文概述的工作流程为混合实验辅助人工智能预测蛋白质结构提供了一个总体框架，直接在原位研究蛋白质的结构与功能之间的关系，而不需要任何基因操作。　　撰稿：聂旻涵编辑：李惠琳　　原文：Protein structure prediction with in-cell photo-crosslinking mass spectrometry and deep learning　　李惠琳课题组网址www.x-mol.com/groups/li_huilin　　参考文献　　1. Stahl, Kolja et al. “Protein structure prediction with in-cell photo-crosslinking mass spectrometry and deep learning.” Nature biotechnology, 10.1038/s41587-023-01704-z. 20 Mar. 2023, doi:10.1038/s41587-023-01704-z.

时间： 2023-04-17

作者： ONE
颜宁等点评：AI 精准预测蛋白质结构，结构生物学何去何从？
p style=" text-indent: 2em " 12 月 1 日，谷歌旗下的 DeepMind 公司宣布，其 strong 新一代 AlphaFold 人工智能系统 /strong 在国际蛋白质结构预测竞赛（CASP）上击败了其余的参会选手， strong 精确预测了蛋白质的三维结构 /strong ， strong 准确性可与冷冻电子显微镜（cryo-EM）、核磁共振或 X 射线晶体学等实验技术相媲美。 /strong /p p br/ /p p style=" text-indent: 2em " （详见《解决生物学 50 年来的重大挑战！生物界「AlphaGo」精准预测蛋白质结构》）这一消息引发了全球媒体关注，前 Genentech 首席执行官 Arthur D. Levinson 博士盛赞这一成就是 strong 「划时代的进步」 /strong 。 /p p br/ /p p style=" text-indent: 2em " 人工智能的「进击」对生物学、对其他学科会有什么影响？网络上有人提出： strong AI 都能解蛋白质结构了，结构生物学家是不是该失业了？ /strong /p p br/ /p p style=" text-indent: 2em " 《返朴》总编、结构生物学家颜宁特邀几位同仁对这一新闻各抒己见，回答大家的疑问。 /p p style=" text-align: center text-indent: 2em " img style=" max-width: 100% max-height: 100% width: 558px height: 618px " src=" https://img1.17img.cn/17img/images/202012/uepic/73bb911a-86ca-490b-a90a-f01fb76aa418.jpg" title=" 微信图片_20201204191414.jpg" alt=" 微信图片_20201204191414.jpg" width=" 558" height=" 618" / /p p style=" text-align: center text-indent: 2em " span style=" font-size: 12px " by Asier Sanz | https://asiersanz.com/ /span /p p br/ /p p style=" text-align: center text-indent: 2em " strong AlphaFold2 是个大突破，但我们还有努力的方向 /strong /p p br/ /p p style=" text-align: center text-indent: 2em " 张阳 /p p style=" text-align: center text-indent: 2em " （ITASSER 创造者，美国密歇根大学教授） /p p br/ /p p style=" text-indent: 2em " AlphaFold2 显然是蛋白质结构预测领域的重大突破。这可能是从 1969 年第一篇& nbsp Journal of Molecular Biology& nbsp 用比较建模方法预测蛋白质结构发表& nbsp 51 年以来最大的突破。 /p p br/ /p p style=" text-indent: 2em " 这个领域过去 20 年来，进展一直比较缓慢，但最近几年，随着共同进化、接触图预测以及引入深度学习之后，很多软件，比如 I-TASSER 和 Rosetta 等，都有了很大进步。 /p p br/ /p p style=" text-indent: 2em " 就 I-TASSER 来讲，两年前在第 13 届 CASP（CASP13）时，它能够正确预测的非同源蛋白数目比其六年前在 CASP11 上提高了 5 倍。这次 CASP14 也比 CASP13 的预测能力提高了很多。但 AlphaFold2 这次比上次进步更大，和两年前的上一个版本相比，& nbsp AlphaFold2 的主要变化是直接训练蛋白质结构的原子坐标，而不是用以往常用的、简化了的原子间距或者接触图。 /p p br/ /p p style=" text-indent: 2em " 传统上，蛋白质结构预测可以分成基于模板和从头预测，但是 AlphaFold2 只用同一种方法 —— 机器学习，对几乎所有的蛋白质都预测出了正确的拓扑学的结构，其中有大约 2/3 的蛋白质预测精度达到了结构生物学实验的测量精度。这说明，至少是在单结构域的蛋白结构，他们接近解决了这个问题。 /p p br/ /p p style=" text-indent: 2em " 谷歌这次为什么能够取得如此大的成功？ /p p br/ /p p style=" text-indent: 2em " 这首先与它们拥有强大的人力和计算资源有关。 /p p br/ /p p style=" text-indent: 2em " 计算机上，他们使用 TPU（据他们的宣传是比 GPU 快 15 倍），学术界的实验室只有 CPU 或者 GPU，而很多实验室都还没有 GPU。他们对媒体宣传中说 Alphafold2 最后只用相当于 100 个 GPU 的资源训练了两周就产生了最后的模型，学界大多数实验室都可以做到，这是不客观的。因为产生一个新的想法，到训练成功的模型，中间起码要反复测试重复 100 次甚至 1000 次。这就像吃了十个馒头的饿汉一样，不能说吃了最后一个馒头吃饱了，就觉得只吃最后一个馒头就够了。 /p p br/ /p p style=" text-indent: 2em " 另外，他们可以高薪招聘大量专业人才，集中精力攻关一件事，不需要担心基金申请、教学和学生毕业论文等等。这些人力和计算资源上的差别是谷歌 DeepMind 这样的工业研究机构比起学术界在攻关科学或者工程问题上的最大优势。 /p p br/ /p p style=" text-indent: 2em " 当然，学术界在蛋白质结构预测这么多年的积累，也给 AlphaFold2 的成功奠定了基础。 /p p br/ /p p style=" text-indent: 2em " 我自己很高兴他们取得了这么大突破。这个工作首先证明了蛋白质结构预测问题是可以被解决的。这其实不是一个简单的问题，因为蛋白质结构和序列的复杂关系，常常让人们 —— 特别是做结构预测的人 —— 怀疑，蛋白质折叠这个问题是不是可解，或者有没有唯一解。 /p p br/ /p p style=" text-indent: 2em " 我们在 15 年前的一篇 PNAS 论文中提到，用 PDB 库中的模板，在理论上可以解决 “单结构域蛋白质结构预测” 这个问题，但那是一个基于模板的传统解法，难点是如何找到最好的模板。谷歌他们这次用「暴力」的机器学习，「暴力」地解决了这个问题。这个做法的成功会对很多相关领域都产生深远影响。 /p p br/ /p p style=" text-indent: 2em " 有人说这个 AlphaFold2 会让很多相关行业的人失业。我认为恰恰相反，它给很多领域提供了解决问题的新途径和新思维，因而会极大推动相关领域的发展，因此会产生更多更大的机会。即便是在蛋白质结构预测这个相对较小的领域，我们还有很多事情要做。 /p p br/ /p p style=" text-indent: 2em " AlphaFold2 这次只有 2/3 的蛋白预测做到实验精度，还有 1/3 做不到，是否还有更快更好的途径来产生更高精度结构的算法？基于商业或其它考虑，我相信谷歌可能不会公开代码或 Server。 /p p br/ /p p style=" text-indent: 2em " 所以，最终可能还得学术界的同行共同努力，完善和推广这一技术，让其真正惠及生物医学研究以及普通公众的健康需求。 /p p br/ /p p style=" text-align: center text-indent: 2em " strong 共赢大于竞争 /strong /p p br/ /p p style=" text-align: center text-indent: 2em " 龚新奇 /p p style=" text-align: center text-indent: 2em " （中国人民大学数学科学研究院教授，清华大学北京结构生物学高精尖中心合作研究员） /p p br/ /p p style=" text-indent: 2em " 2020 年第 14 届国际蛋白质结构预测竞赛（CASP14）共有 84 个常规（Regular）题目，其中有 14 个题目因为生物实验没给出确定结构等原因被取消或延缓，其他 70 个题目的单体和复合物蛋白质所含有的氨基酸个数从 73 到 2180 不等。 /p p br/ /p p style=" text-indent: 2em " 19 个国家的 215 个小组参加了 CASP14。最终，谷歌旗下 DeepMind 公司的人工智能系统 AlphaFold2 在 2018 年的 Alphafold 基础上迭代创新，超常发挥，一枝独秀，基本解决了「从氨基酸序列预测蛋白质结构」这个困扰人类 50 年的生物学第二遗传密码问题。 /p p br/ /p p style=" text-indent: 2em " AlphaFold2 的成功表现在三个方面： /p p style=" text-indent: 2em " 1.不少结构的预测精确度跟实验晶体结构相当，可以替代晶体结构； br/ /p p style=" text-indent: 2em " 2.一些含有多个结构域的复杂超长的单链结构也达到了可以跟实验结构比较的程度； /p p style=" text-indent: 2em " 3.帮助解析了竞赛中涉及到的、实验多年没拿到的 X 射线晶体和 cryo-EM 冷冻电镜结构，比如 T1058 的膜蛋白是用了 Alphafold2 的预测模型之后，才跟原有晶体学数据综合成功解析了结构。 br/ /p p style=" text-indent: 2em " AlphaFold2 团队的& nbsp John Jumper 报告表明，他们使用了基于注意机制的神经网络，动态调整网络中节点的顺序和链接；依靠的是端到端的优化整体构建结构，而不是氨基酸距离；网络中内置了大量的序列、结构和宏基因组等多重比较信息；还依赖分子模拟软件优化去掉了原子的堆积碰撞。 /p p br/ /p p style=" text-indent: 2em " 在 AlphaFold2 的摘要作者名单里，交叉团队的 30 位作者中有 19 位都被标记为相同贡献的第一作者。他们将近 8 分钟的宣介视频，记录了团队成员在新冠疫情期间精诚合作、攻坚克难的宝贵场景。 /p p br/ /p p style=" text-indent: 2em " CASP 组织者 John Moult 指出，计算下一步还有更困难的问题要解决：超大复合物结构、动态构象变化、蛋白质设计、药物设计等等。 /p p br/ /p p style=" text-indent: 2em " 除了我们蛋白质结构预测小同行对 AlphaFold2 的成功很欣喜之外，社会上还有多个不同方向的学术界、产业界和新闻界对它寄予了厚望。 /p p br/ /p p style=" text-indent: 2em " 在欣喜的同时，蛋白质结构预测小同行也有一些保留意见： /p p style=" text-indent: 2em " 1.工程化明显，依赖于强大的 GPU 计算资源和代码优化团队； br/ /p p style=" text-indent: 2em " 2.谷歌公司几乎可以收集全球所有网络信息，虽然看起来 AlphaFold2 的自动化程度很高，但他们在人工操作中使用了哪些信息值得关注； /p p style=" text-indent: 2em " 3.预测对了结构，但不等于明白了蛋白质折叠过程和原理。 /p p br/ /p p style=" text-indent: 2em " strong 生物实验科学家也有不少看法： /strong /p p style=" text-indent: 2em " 1.算出结构只是生物学规律发现的第一步； /p p style=" text-indent: 2em " 2.计算的多个 models 中，有时打分排序不准； /p p style=" text-indent: 2em " 3.开放 AlphaFold2 的 server 之后，使用效果不一定那么好； /p p style=" text-indent: 2em " 4.只是在已有蛋白质结构数据集上训练得到的模型，尚不能计算其它构象或其它类别的分子结构。 /p br/ p style=" text-indent: 2em " 还有关心这个领域的其他方向的专家也提出了问题：怎么理解这个算法成功的原理？怎么跟原有的热力学、物理学等基本原理相融相通？ /p p br/ /p p style=" text-align: center text-indent: 2em " 我认为 AlphaFold2 是个大突破，后续可能性很多，会替代一些简单的结构生物学实验，但对当下科学家追求的前沿生物学来说，共赢大于竞争；对生物学、数学和计算机学等学科而言，则会带来新的机遇。 br/ br/ strong 技术服务于科学探索，结构生物学早就进入新时代 /strong br/ 颜宁 /p p style=" text-align: center text-indent: 2em " （美国普林斯顿大学雪莉?蒂尔曼终身讲席教授，美国科学院外籍院士） /p p br/ /p p style=" text-indent: 2em " 首先，简单说一下，什么是生物学里的「结构」。 /p br/ p style=" text-indent: 2em " 用个不太恰当的类比：变形金刚。比如擎天柱是辆车还是个机器人，这就是不同的结构了，机器人能打架大车做运输，功能也不一样。而不同的汽车人组成成分可能差不多，都有合金、玻璃、橡胶，但是形态各异，特长也不一样。 br/ 生物分子的组成成分和基本单元就那么几种，但是组装起来，不同的序列不同的结构，于是功能各异、五花八门。这个结构不是静止的，每一个生物大分子基本都像个小机器，比变形金刚更复杂、更变化多端。 /p p br/ /p p style=" text-indent: 2em " 因为结构决定了生物大分子的功能，所以解析高分辨率结构在过去几十年一直是理解生物大分子工作机理最有力的工具。但是一直以来，因为技术局限，对于绝大多数生物大分子的结构解析困难重重。所以，一批科学家另辟蹊径，试图在已有的知识基础上，绕开劳心劳力又劳财的实验步骤，从蛋白质的序列直接通过计算预测出它们精准的三维结构。 /p p br/ /p p style=" text-indent: 2em " 蛋白结构预测并不是一个新鲜学科，一直以来就是结构生物学的一个分支，很多科学家不断开发算法，希望根据序列预测出来的结构越来越准确。 br/ 这个领域在过去十几年进步迅速，并且与实验结构生物学融合度越来越高。比如，自从进入电镜时代，看到一堆黑白灰的密度，如果其中某些部分没有同源结构，通过软件预测一个大致的结构模型，放到密度图里面做框架，再根据实验数据调整，已经是个常规操作。 /p p br/ /p p style=" text-indent: 2em " 这次人工智能赢得 CASP 的新闻亮点有两个，一是 AI，二是准确度高。这确实是突破，但是有了两年前的新闻（注：2018 年，DeepMind 开发的第一代 AlphaFold 首次参加 CASP 并且拔得头筹）做铺垫，现在这次委实是意料之中。 br/ 至于衍生出来的所谓「结构生物学家都要失业了」的调侃 —— 如果你对结构生物学的理解还停留在 20 年前，那这么说也不是不行。但是结构生物学自身一直在发展着，一场冷冻电镜的分辨率革命更是令结构生物学不同往日了。 br/ 我在 2015 年主持一个学术研讨会的时候曾经评论过：结构生物学的主语是生物学，是理解生命、是做出生物学发现。 br/ 但是，在 X - 射线晶体学为主要手段的时代，获得大多数研究对象的结构本身太难了，于是很多研究者把「获得结构」本身作为了目标，让外行误以为结构生物学就是解结构。但我从进入这个领域之初，就被教育得明明白白：结构本身只是手段，它们是为了回答问题、做出发现。而电镜使得「发现」二字尤为突出。 br/ br/ 看到结构本身、知道你的研究对象长啥样，倒也可以称之为发现，但我刚刚说的「发现」，特指那些超乎想象的、通过结构才揭示出来的、自然界里神奇的存在或者令人叹为观止的机理。 /p br/ p style=" text-indent: 2em " 我讲课最喜欢举的例子之一就是施一公组的剪接体结构。为啥呢？因为它集合了结构生物学发现里几乎所有的精彩要素和挑战。 br/ br/ 第一，在剪接体结构出来之前，有很多剪接体的组分甚至是未知的。不同于传统的结构生物学，先知道你要研究对象是啥，再吭哧吭哧地去把它们的结构解出来 —— 剪接体的电镜分析是看到了密度图之后，完全不晓得这是啥，需要通过质谱等手段去鉴定组分。我从 2015 年就预测：电镜与质谱组合，将会变成一个重要的生物学研究发现手段。在电镜时代，这样的例子越来越多。比如清华大学隋森芳老师组的那个巨大的藻胆体结构，靠质谱都不够了。为了搞明白组分，他们甚至先做了基因组测序。 br/ br/ 第二，几十上百个蛋白如何众星捧月地把那么几条貌似简单的 RNA 掰成与几个小小的金属离子配合的核酶反应中心，在茫茫碱基中，在正确的时间正确的地点牵线搭桥，剪掉 intron（内含子），连接 exon（外显子）？就为了这一「剪子」& nbsp 一「钩针」，为了几毫秒的过程，这么个庞然大物的几十上百个组成部件却要分分合合，这个过程是真神奇。 /p p br/ /p p style=" text-align: center text-indent: 2em " img style=" max-width:100% max-height:100% " src=" https://img1.17img.cn/17img/images/202012/uepic/72bc97e7-d254-461b-b199-1156f73a37c8.jpg" title=" 微信图片_20201204191624.jpg" alt=" 微信图片_20201204191624.jpg" / /p p style=" text-align: center text-indent: 2em " span style=" font-size: 12px " 施一公实验室报道的首个酵母剪接体的结构 /span /p p style=" text-align: center text-indent: 2em " span style=" font-size: 12px " （图源：生物化学经典教材 Lehninger Principles of Biochemistry（第七版）封面） /span /p p style=" text-align: center text-indent: 2em " span style=" font-size: 12px " br/ /span 结构生物学目前的实验手段只能获得静止的 3D 照片，为了揭示这部电影，就要不断获得中间态的 3D 照片，帧数越多，电影越精准。但即便如此，这个过程中的动力学问题，简单说，就是变化速度，依旧不是现在的结构生物学实验手段可以揭示的，需要借助更多生物物理技术、计算生物学手段去探索。 br/ 我自己的工作虽然没有剪接体那么酷炫，但是电压门控钠离子通道如何感受膜电势的变化，开门关门，就这么个过程，听着简单，我们死磕三年了，依旧束手无策。另外，我们今年发的两篇 PNAS 论文其实代表了结构生物学的另一个努力方向：在实验操作过程中对生物大分子施加外力（电场、磁场、各种长度的波......）。 br/ 也许是受到我自身专业领域的局限，AlphaFold 迄今带给我的震撼还赶不上冷冻电镜的革命，后者将我们从技术挣扎中解放出来，可以专注于结构带来的生物学发现本身。 br/ br/ AlphaFold 目前最成功的预测是针对单链分子，当然将来预测复合物的高精结构也应该不在话下。相比于对蛋白折叠的贡献，我倒是更希望 AI 能够助力 Molecular Dynamics Simulation（分子动力学模拟）。对结构生物学而言，这个领域才是亟需进步的。 br/ br/ 我个人认为生命是地球上最神奇的存在，那么多未知要探索，任何一次技术进步都是契机。该考虑的是如何把新技术为我所用，去问出、去探索更有意思的问题。 br/ 最后，当 AI 能够成功预测我们正在孜孜以求的生物大分子动态、原位高分辨率结构的时候，那失业的一定不止是结构生物学家、或者生物学家了 :p br/ br/ strong 各抒己见 /strong /p p style=" text-indent: 2em " strong br/ /strong 根据现在披露的结果，AlphaFold2 已经基本达到实验解析结构的精度。前天 AlphaFold2 团队的报告展示了新冠病毒 SARS-COV-2 的预测结果，说明 RNA 聚合酶这么大的蛋白也能基本预测准确。 /p br/ p style=" text-indent: 2em " 理论上，这会对结构生物学有很大冲击，尤其是以后单颗粒 cryo-EM 的实验方法上，是否还需要把分辨率做得那么高？低分辨率的电子密度图，甚至 SAXS 数据结合预测结果应该就能解决问题了。 br/ 但是，现实中的冲击不会那么大。这是因为，AlphaFold2 模型的创新性非常高，其中结合的 2D transformer 和 3D equivariant transformer 都是 AI 领域的前沿技术，模型的训练难度很大。 /p br/ p style=" text-indent: 2em " DeepMind 的训练方法在学术界很难复现，估计学术界要花几年的时间才能跟上，因此短期内 AlphaFold2 对结构生物学的影响会比较有限。DeepMind 可能会和个别实验室合作，预测蛋白质结构。 /p br/ p style=" text-align: right text-indent: 2em " ——& nbsp 龚海鹏（计算生物学家，清华大学结构生物学高精尖创新中心研究员） /p br/ br/ p style=" text-indent: 2em " AlphaFold 为结构生物学家提供了除晶体学、冷冻电镜、NMR 以外的另外一种手段，用于揭示生物大分子发挥作用的分子机制。 /p br/ p style=" text-align: right text-indent: 2em " —— 张鹏（结构生物学家，主要利用晶体学和冷冻电镜技术；中科院分子植物科学卓越创新中心研究员） /p br/ br/ p style=" text-indent: 2em " AlphaFold 目前还不能预测复杂的分子机器，主要是因为蛋白 - 蛋白相互作用非常复杂，存在极多的可能性。实验手段所揭示出来的蛋白 - 蛋白相互作用方式还只是冰山一角，更何况在不同生理条件和过程中的结构变化。因此，未来对有特定功能的、多个成分组成的、生物大分子复合体的结构解析，以及体内的结构分析，将成为结构生物学实验研究的主要内容。无论有没有 AlphaFold，结构生物学也正在朝这个方向发展。 /p p style=" text-indent: 2em " Rosetta（注：从头蛋白结构建模算法）也好，AI 也罢，结构预测都是基于已有的实验数据够大。没有足够的数据积累，这些基于统计和数据库的预测就无法实现。完全基于物理学和化学第一性原理的结构预测还没有出现。 br/ 实验科学永远是探索未知的必要手段。新的软件算法应该是成为实验科学家的更有力工具，而不是取代实验科学。 /p p br/ /p br/ p style=" text-align: left text-indent: 2em " —— 王宏伟（cryo-EM 专家，清华大学结构生物学高精尖创新中心执行主任，清华大学生命科学学院院长） br/ br/ br/ br/ & nbsp & nbsp & nbsp 最近两年，结构生物学领域经历了与围棋界类似的故事。Alphago Fan 版本时围棋界并不认为它能够战胜人类顶尖高手，可是 Alphago Lee 后整个围棋界甘拜下风，并且转向 AI 拜师学艺。2018 年 Alphafold 出现时，实验结构生物学领域认为被战胜的仅仅是传统的结构预测领域，2020 年 Alphafold2 之后，实验结构生物学领域应该开始思考如何与之共存以及如何「拜师学艺」了。 /p p style=" text-align: left text-indent: 2em " br/ & nbsp & nbsp & nbsp 目前阶段人工智能在围棋上已经远远超过人类顶尖棋手，但是人类围棋比赛并未因此取消，如同汽车发明后奥林匹克仍然在进行田径比赛一样。原因之一是人工智能虽然超越了人类，但并未解决围棋的最终解。同样的道理，对于复杂的结构生物学问题，预测手段本身还不能号称完全解决了问题。 /p p style=" text-align: left text-indent: 2em " br/ & nbsp & nbsp & nbsp 实验结构生物学领域接下来需要做的一个事情是要拥抱变化，更好地与预测方法结合以及共同发展。 /p br/ p style=" text-align: right text-indent: 2em " —— 周强（cryo-EM 专家，西湖大学生命科学学院特聘研究员） /p p br/ /p p br/ /p p style=" text-indent: 2em " 蛋白质体系越大，结构的解析越难仅依赖计算方法。Cryo-ET& nbsp (冷冻电镜断层成像)& nbsp 技术擅长解析体外难表达的大分子机器结构、细胞中的原位蛋白结构等复杂体系，因此很难被脱离实验手段的方法取代。目前，由于体系过于复杂，使用分子动力学模拟整颗病毒尚未实现，要模拟细菌、细胞、组织，还要很长的路要走。 /p p br/ /p

时间： 2020-12-04

作者：吴婕
Nature：成像质谱流式细胞术发现肿瘤微环境特征预测肺癌结果
来自麦吉尔大学和多伦多大学等研究人员已经开发出一种方法，可以仅通过一个微小肿瘤组织样本来预测肺癌患者在手术后的发展状况。研究人员将成像质谱流式细胞术与深度学习技术相结合，分析了400 多名来自肺腺癌患者的肺癌样本的肿瘤微环境。肿瘤微环境已被确定为影响治疗进展的异质性来源。通过在空间和单细胞水平上表征肿瘤微环境，研究人员揭示了与临床特征(如生存率)相关的不同细胞状态和特征。正如他们在Nature杂志上报道的那样，他们使用了人工智能来识别肿瘤微环境的某些特征来高精度地预测疾病进展。　　Fig. 1: IMC defines the spatial landscape of LUAD.　　“总的来说，这些数据表明空间分辨的单细胞转录组在未来可能具有非常大的价值，有助于为个性化的围手术期护理计划提供有价值的信息，以最大限度地减少那些能被治愈的人在治疗过程中产生的毒副作用，或提高那些会复发的人的治愈率”，麦吉尔大学的共同资深作者 Daniela Quail 和 Logan Walsh 以及拉瓦尔大学的 Philippe Joubert 领导的研究人员在论文中写道。研究人员使用 Fluidigm(现为 Standard BioTools)企业的成像质谱流式细胞技术系统，分析了 1996 年 2 月至 2020 年 7 月期间收集的 426 名肺腺癌患者的小组织核心样本。他们使用 35 重抗体组来识别各种细胞他们样本的成分，包括癌细胞本身以及基质细胞、适应性和先天性免疫细胞。研究人员总共检测到超过 160 万个细胞，并发现了 14 个不同的免疫细胞群。他们特别关注免疫细胞群与患者的临床数据之间的关联。例如，肥大细胞与延长生存期有关，虽然它们在非吸烟者和患有早期疾病的患者中更为常见。研究人员进一步注意到某些免疫细胞的频率与特定临床亚组之间的联系—例如，CD4 阳性辅助性 T 细胞在女性患者的样本中富集，她们往往会有更好的总体存活率，而老年患者的肿瘤内 CD8 较少- 阳性 T 细胞。与此同时，他们探索了肿瘤微环境中不同的细胞表型如何与生存相关，例如，发现 H1F1-α 阳性中性粒细胞将会产生不利于生存的环境。观察具有相似局部细胞类型组成的区域(邻近细胞)，研究人员进一步指出，不同的组织结构与生存差异有关。例如，富含 B 细胞的邻近细胞与存活显着相关，尤其是 CN-25 邻近细胞，它也富含 CD4 阳性辅助性 T 细胞。通过应用深度学习方法，研究人员发现他们生成的空间信息可以改善对临床结果的预测。他们报告说，创建的模型(包括空间信息)预测进展的准确率高达 95.9%，而基线评分的准确率为 75%，而且他们仅仅使用了一个 1 mm²的肿瘤样本。此外，研究人员使用成像质谱流式细胞术分析了 60 名原发性肺腺癌患者的单独验证队列，并在数据集中发现该模型以 94% 的准确度预测进展。研究人员将他们模型的预测能力追溯到六个标记的组合：CD14、CD16、CD94、αSMA、CD117 和 CD20。总体来讲，准确率为 93.3%，精密度和召回率为 95.6%。研究人员写道：“我们的研究结果代表了对使用临床和病理变量的现有预测工具的重要进步，并且可以更有效地利用不断增长的围术期辅助系统来改善癌症结果。”　　来源：　　1.Sorin, M., Rezanejad, M., Karimi, E. et al. Single-cell spatial landscapes of the lung tumour immune microenvironment. Nature (2023). https://doi.org/10.1038/s41586-022-05672-3.　　2.基因网

时间： 2023-03-06

作者： ONE
前沿应用∣岛津高分辨质谱助力合成多肽药物杂质结构鉴定
截至2020年，全球共有76个多肽类药物被批准上市，7000多个活性多肽被发现，约150个多肽药物进入临床试验，在过去20多年中，平均每年被批准的多肽药物约3个。微球、脂质体、聚乙二醇（PEG）修饰等方法的深入应用解决了多肽药物稳定性差、体内易降解、半衰期短等成药性差的问题，促进了多肽药物的开发利用。多肽药物药效广泛，临床上以慢性病治疗为主，例如罕见病、肿瘤、糖尿病、胃肠道、骨科、免疫、心血管疾病等。国内外药典将合成多肽类药物列入化药的范畴进行杂质的控制。欧洲药典规定合成多肽含量在0.5%以上的相关杂质需进行定性分析，对含量在1%以上的相关杂质进行定量分析并考察其毒副作用。2007年国家食品药品监督管理局发布了《合成多肽药物药学研究技术指导原则》，指出合成多肽原料药中工艺杂质的来源和一般化学药物有所不同，其可能的工艺杂质如：缺失肽、断裂肽、去酰胺多肽、氨基酸侧链的不完全脱保护所形成的副产物、氧化肽、二硫键交换的产物、非对映异构的多肽、低聚物和/或聚合物及合成中所用的毒性试剂和溶剂等。多肽含有二硫键、裸露的氨基和羧基，容易因分子间二硫键或氨基羧基间脱水形成共价聚合物。共价键形成的聚合物杂质可能存在较大免疫原性风险，在多肽类药物制剂质量研究和新药申报中应予以重点关注。质谱分析、氨基酸组成分析和氨基酸序列测定是合成多肽药物及杂质结构确证最常用的技术手段。岛津解决方案 ● 分析仪器岛津液相系统Nexera LC-40 +高分辨质谱仪LCMS-9030 ● 分析条件流动相为水：乙腈：TFA=60:40:0.2流速：0.5 mL/min等度洗脱柱温：25℃质谱：离子源：ESI（+）扫描范围：m/z 100 ~5000 多肽药物应用案例一STN聚合物杂质结构鉴定图1. 注射用STN破坏样品HPLC色谱图（UV 210 nm）图2. STN聚合物杂质可能的聚合方式通过STN聚合物杂质精确质量数预测其分子式，结合多肽的质谱峰归属对STN聚合物杂质进行结构推测（如图2）。STN结构中含有一对二硫键，综合判断其聚合位点为分子间二硫键。多肽药物应用案例二TJN聚合物杂质结构鉴定图3. 注射用TJN破坏样品HPLC色谱图（UV 214 nm）图4. TJN聚合物杂质MS2质谱图使用岛津精确分子式预测工具Formula Predictor对TJN聚合物杂质进行分子式预测，其分子式预测结果恰好相当于两分子TJN脱水，因此推测其聚合位点为两分子TJN的氨基端和羧基端缩合生成肽键。TJN为20肽，其游离氨基端为苯丙氨酸，游离羧基端为亮氨酸。结合TJN二聚体的推定氨基酸序列进行二级质谱碎片归属，TJN聚合物MS2质谱图中识别出多种特征碎片。特别是y19和b21碎片的存在证明聚合位点为亮氨酸（L）和苯丙氨酸（F）缩合而成的肽键。结论随着我国成为国际人用药品注册技术协调会（ICH）成员国，药品的技术标准逐步与国际接轨。同时随着我国药品一致性评价工作的全面开展，合成多肽药物杂质结构鉴定将面临巨大的技术挑战。岛津公司采用尺寸排阻色谱法建立合成多肽药物的聚合物分析方法，并通过高分辨质谱LCMS-9030测定聚合物的准确质量数推测其分子式，同时结合MS/MS特征碎片推测聚合物杂质的结构。本文展示LCMS-9030在多肽药物的两种主要聚合方式（二硫键和肽键）鉴定中的应用。岛津液相色谱四极杆飞行时间串联质谱LCMS-9030具有高质量准确度，高分辨率的性能优势，是合成多肽药物杂质一级结构鉴定的强有力工具。本文内容非商业广告，仅供专业人士参考。

时间： 2022-04-26

作者：岛津
中山大学李惠琳：非变性质谱技术推动蛋白质结构研究，助力新药研发
蛋白质是生命的物质基础，通过与不同生物分子间的相互作用在生物体内执行着各项重要工作，其功能与结构直接相关。因此，解析蛋白质及其复合物高阶结构对于深入理解蛋白质功能、生理现象及药物研发具有重要意义。过去的60余年，随着X-射线晶体衍射(X-ray)、核磁共振(NMR)以及冷冻电镜(cryoEM)等技术的出现和不断发展，蛋白质结构解析取得了长足发展。然而，如何在分析蛋白质时使其保持近似自然生理环境的非变性状态，对其动态、异质性、相互作用等属性的研究是结构生物学领域的热点和难点。　　质谱技术的不断发展使其在蛋白质结构表征领域发挥了越来越重要的作用。非变性质谱(native MS)兴起于20世纪90年代，是一种可以分析蛋白高阶结构的生物质谱方法。与传统的破坏蛋白质立体结构和弱相互作用力的方法不同，非变性质谱采用质谱兼容的近生理pH值的溶液体系(主要为醋酸铵)和更温和的电离方式，使生物大分子在气相中能够最大程度地保持自然折叠状态、非共价相互作用和相关的生物学功能。因此，非变性质谱可以提供分子质量、寡聚态、构象(折叠vs 去折叠)、异质性、配体结合、靶蛋白-小分子亲和力以及复合物中蛋白亚基的相互作用网络关系等更具生物学意义的重要信息，为蛋白质“序列-结构-功能”关系提供分子基础，已成为结构生物学不可或缺的互补工具,在生物制药、蛋白一配体、蛋白一蛋白复合物结构分析等诸多领域具有广泛应用。　　近年来,蛋白质结构研究领域经历着剧烈的技术迭代。2021年人工智能(AI) AlphaFol2横空出世,将蛋白质3D结构预测的精度从60%提升到90%以上,在给传统结构解析技术带来冲击的同时,也为结构质谱的发展提供了契机。　　未来,非变性质谱技术的发展需要简化样品处理,提升仪器的灵敏度、分析通量和鲁棒性,实现内源性蛋白复合物样本的直接或原位分析,推动其在生物医药表征、蛋白多聚态等领域的更广泛应用。非变性质谱技术与离子消度(MS)、自上而下串联解离(top-down)、电荷检测质谱(CDMsS)等创新联用技术和方法的不断开发及完善,将极大地提升结构信息的广度、丰富度及精确度,补充生物物理学方法缺失的结构信息。同时,非变性质谱与cryoEM1、氢完交换质谱(HDX-MS)、交联质谱等技术联用将更加常态化,这些实验数据与AI结构预测算法的进一步整合将有效解决蛋白及蛋白复合物结构预测存在的精度问题,推动结构生物学发展,助力新药研发。　　此外,非变性质谱技术的应用发展将更加关注:1)蛋白复合物结构一功能关系的研究,通过与计算机模拟(MD)、HDX-Ms、cryoEM等技术联用,揭示标志物蛋白在人类疾病发展过程中的作用,推动靶向药物设计和精淮医疗 2)通过研究小分子与靶蛋白的相互作用获取二者结合的亲和力信息,加速靶向药物筛选 3)翻译后修饰(PTMS)、突变等因素导致的蛋白高度异质性及其对蛋白或亚基折叠动力学、构象及构象变化、结合计量比等造成的结构和功能影响 4)蛋白与其他生物分子(配体、DNAA/RNA、金属离子等)之间的相互作用。　　李惠琳，中山大学药学院教授，博士生导师。主要从事生物大分子质谱新技术的开发及应用，其研究主要侧重于1)开发整合结构质谱技术，并对蛋白质机器结构、功能和动态变化及靶向药物作用分子机制进行深入研究2)开发middle-down/top-down蛋白质组学技术，探索蛋白翻译后修饰在生命过程中的调控机制。承担国家自然科学基金项目3项，荣获美国质谱学会颁发的Postdoctoral Career Development Award (2014) ，入选珠江人才计划(青年拔尖人才，2019)，其研究成果发表在Nature Chemistry, Analytical Chemistry, J. Am.Soc.Mass Spectrom.等杂志。　　"非变性质谱技术研究与应用"专栏共收录7篇论文,既介绍了非变性质谱技术的样品制备、离子源、质量分析器、联用技术等基础内容,也涵括了样品提取、样品引入、离子化及电荷操控等方式,以及在蛋白结构及构象解析、蛋白・蛋白相互作用等领域的应用,代表了国内非变性质谱技术的发展现状。希望本专栏能成为《质谱学报》广大读者颇有价值的科技文献,同时也希望更多的学者加入到非变性质谱研究领域,推动我国结构质谱技术的创新发展。

时间： 2022-12-07

作者： ONE
新算法助力质谱数据准确高效预测小分子助力新药研发
卡内基梅隆大学和俄罗斯圣彼得堡国立大学的研究人员提出一种算法——MolDiscovery，提高了小分子识别的效率和准确性。该算法使用分子的质谱数据来预测未知物质的「身份」，在研究早期告诉科学家他们是偶然发现了新事物，还是仅仅重新发现了已知事物，可节省发现新的天然医药产品的时间和金钱。　　该研究于6月17日以「MolDiscovery: learning mass spectrometry fragmentation of small molecules」为题发表在《自然通讯》（Nature Communications）杂志上。 MS 是一种电离化学物质并根据其质荷比（质量-电荷比）对其进行排序的分析技术。广泛应用于各个学科领域中通过制备、分离、检测气相离子来鉴定化合物。　　质谱图是小分子的指纹，可以用一组质量峰表示，但与指纹不同的是，没有庞大的数据库来匹配它们。尽管已经发现了数十万种天然分子，但科学家们无法获得他们的质谱数据。　　目前，已经出现了包含数万个小分子注释质谱的谱库，为开发基于机器学习的方法来提高计算机数据库搜索的灵敏度和特异性铺平了道路。然而，现有方法对于超小分子（1000 Da）在计算上不足。　　现在，该研究团队提出一种质谱数据库搜索方法—— MolDiscovery，通过学习概率模型来将小分子与其质谱相匹配，大大提高了小分子识别的准确性，同时使搜索效率提高了一个数量级。　　从全球天然产物社会分子网络（GNPS；http://gnps.ucsd.edu) 搜索了 800 万个串联质谱后，MolDiscovery 以 0% 的错误发现率 (FDR) 鉴定了 3185 个独特的小分子，与现有方法相比，增加了 6 倍。在具有已知基因组的 GNPS 存储库的一个子集上，MolDiscovery 正确地将 19 个已知和三个假定的生物合成基因簇与其分子产物联系起来。　　MolDiscovery 框架　　MolDiscovery 框架主要分两个过程：训练过程和评分过程。具体步骤：　　从构建代谢物图和生成碎片图开始。对于后者，MolDiscovery 使用一种新的高效算法来查找代谢物图中的桥接和 2-cuts；　　MolDiscovery 继续学习匹配碎裂图和质谱的概率模型；　　对小分子光谱对进行评分，计算 FDR。基准测试　　MolDiscovery 与其他五种最先进的方法进行了比较，数据库搜索结果显示，MolDiscovery识别效果最好，平均可以正确识别测试 GNPS 和 MoNA 数据中的 43.3% 和 64.3% 的小分子。所有测试方法的最高 K = 1、3、5 和 10 准确度。（来源：论文） MolDiscovery 也是针对 DNP 搜索 GNPS 的最快和最节省内存的方法之一。在预处理阶段，MolDiscovery 比其中一种方法快 300 倍以上。　　还根据正确分子匹配的质量范围评估了运行时间。对于质量 1000 Da 的分子光谱，相同质量范围内，MolDiscovery 平均只需 6 分钟和 24 秒。　　注释 8 倍多的光谱，识别出 6倍多的独特化合物　　从GNPS 搜索了 800 万个串联质谱，在严格的 0% FDR 水平下，MolDiscovery 注释了 8 倍多的光谱，并识别出比 Dereplicator+ （一种从MS中识别小分子的数据库搜索复制器）多6倍的独特化合物。　　MolDiscovery 搜索在 10 个线程上花费了 34 天，与单线程上的预测 329 天非常接近。值得注意的是，在搜索如此大规模的光谱数据集时，MolDiscovery 比其他方法要高效得多，只需要对分子数据库进行一次预处理，可以有效地搜索未来的光谱。　　节省新药研发时间、成本　　「科学家们浪费了大量时间来分离已知的分子。」研究团队成员 Hosein Mohimani 说。「早期检测分子是否已知，可以节省时间和数百万美元，并有望使制药公司和研究人员更好地寻找可能用于新药开发的新型天然产品。」　　Mohimani 解释说：「例如，科学家检测出一种在海洋或土壤样本中有望成为潜在药物的分子后，可能需要一年或更长时间才能识别出这种分子，而不能保证该物质是新的。MolDiscovery 使用质谱测量和预测机器学习模型快速准确地识别分子，且无需依赖质谱数据库进行匹配。」　　该团队希望 MolDiscovery 将成为实验室发现新型天然产物的有用工具。MolDiscovery 可以与 Mohimani 实验室开发的机器学习平台 NRPminer 协同工作，帮助科学家分离天然产物。

时间： 2021-08-10

作者：情绪波动
大连化物所利用原位化学交联—质谱技术解码细胞中蛋白质动态结构
近日，大连化学物理研究所生物技术研究部生物分子高效分离与表征研究组(1810组)赵群研究员和张丽华研究员等人与中国科学院精密测量科学技术创新研究院龚洲副研究员合作，提出了利用原位化学交联—质谱技术(in vivo XL-MS)，解码细胞中蛋白质动态结构的策略。该策略将AlphaFold2的结构作为先验信息，结合in vivo XL-MS数据与多种结构计算方法评估结构与交联信息的匹配度，重构了细胞内多种蛋白质，尤其是多结构域蛋白质和固有无序蛋白质(intrinsically disordered protein，IDP)的原位动态结构。为深入研究蛋白质在细胞微环境中发挥功能的分子机制提供技术支撑。活细胞内蛋白质的原位动态结构对于揭示其生物学功能至关重要。随着深度学习算法助力蛋白质结构预测的发展迭代，AlphaFold2实现了对蛋白质结构的全面预测，然而该方法对柔性区域的结构预测仍面临挑战。近年来，in vivo XL-MS以高通量、高灵敏，且对蛋白质纯度要求低等优势，在解析活细胞内蛋白质的原位动态结构方面展示出重要潜力。张丽华团队一直致力于in vivo XL-MS新技术研究，实现了蛋白质原位构象和相互作用的规模化解析(Anal. Chem.，2020；Anal. Chem.，2022；Anal. Chem.，2022；Anal. Chem.，2022；Anal. Chem.，2023；Angew. Chem. Int. Ed.，2023；Nat. Commun.，2023)。　　本工作中，针对多结构域蛋白质，研究团队提出了将结构域作为整体，利用结构域间的XL-MS数据对细胞内蛋白质动态结构建模，实现了三种多结构域蛋白质——钙调蛋白、hnRNP A1和hnRNP D0在细胞内的动态结构表征。此外，针对IDP，研究团队提出了两种互补的结构表征策略：一是将XL-MS信息直接转换为距离约束用于IDP的结构计算，二是首先使用全原子分子动力学模拟进行无偏采样，然后基于XL-MS数据对采样结构进行评估和筛选。利用这两种策略，研究团队解码了高迁移率组蛋白HMG-I/Y和HMG-17在细胞内的动态系综构象。　　上述成果以“Decoding Protein Dynamics in Cells Using Chemical Cross-Linking and Hierarchical Analysis”为题，于近日发表在《德国应用化学》(Angewandte Chemie International Edition)。该工作的第一作者是1810组博士研究生张蓓蓉。该工作得到了国家重点研发计划、国家自然科学基金、中国科学院青促会等项目的资助。

时间： 2023-07-26

作者：情绪波动
DeepMind遇上对手? Meta AI预测6亿蛋白质结构
ESM宏基因组图谱数据库包含6.17亿个蛋白质的结构预测。(图片来源：ESM宏基因组图谱)　　英国人工智能(AI)公司DeepMind今年公布了2.2亿个蛋白质的预测结构，几乎涵盖了DNA数据库中已知生物的所有蛋白质。现在，另一个科技巨头正在填补蛋白质宇宙中的暗物质。　　美国Meta公司(前身为Facebook)的研究人员使用人工智能预测了约6亿个蛋白质的结构，这些蛋白质来自细菌、病毒和其他尚未被表征的微生物。相关研究11月1日发表于预印本网站BioRxiv。　　“这些是非常神秘的蛋白质，为深入了解生物学提供了可能性。”Meta人工智能蛋白质团队研究负责人Alexander Rives说。　　该团队使用“大型语言模型”生成了这些预测。“大型语言模型”是一种人工智能，可作为通过几个字母或单词预测文本的工具的基础。　　通常语言模型是在大量文本的基础上进行训练的。为了将其应用于蛋白质，Rives团队将已知蛋白质序列“喂”给它们，这些蛋白质由20个不同的氨基酸链表示，每个氨基酸链由一个字母表示。然后，该模型学会了在氨基酸比例模糊的情况下“自动补全”蛋白质。　　Rives说，这种训练使模型对蛋白质序列有了直观的理解，蛋白质序列包含了蛋白质形状的信息。　　第二步，受DeepMind开创性蛋白质结构人工智能算法AlphaFold的启发，模型将这种洞察力与已知蛋白质结构和序列之间关系的信息相结合，从蛋白质序列中生成预测结构。　　今年夏天早些时候，Rives团队报告称，其模型算法名为ESMFold，虽准确性不如AlphaFold，但在预测结构方面要快60倍左右。“这意味着我们可以将结构预测扩展到更大的数据库中。”Rives说。　　作为一个测试案例，研究团队决定将模型应用于大规模测序的“宏基因组”DNA数据库，这些DNA来自环境，包括土壤、海水、人类肠道、皮肤和其他微生物栖息地。绝大多数编码潜在蛋白质的DNA条目来自从未被培养过的生物，也不为科学家所知。　　Meta团队总共预测了超过6.17亿个蛋白质的结构，这项工作只花了两周时间。Rives表示，预测是免费的，任何人都可以使用，就像模型的底层代码一样。　　在这6.17亿个蛋白质结构中，该模型认为超过1/3的预测是高质量的，因此研究人员可以确信蛋白质的整体形状是正确的，在某些情况下，模型可以识别更精细的原子级细节。值得一提的是，其中数以百万计的结构都是全新的，与实验确定的蛋白质结构数据库，或从已知生物体预测的AlphaFold数据库中的结构都不同。　　AlphaFold数据库的很大一部分是由几乎相同的结构组成，而宏基因组数据库则涵盖了以前从未见过的蛋白质宇宙的很大一部分。　　哈佛大学进化生物学家Sergey Ovchinnikov对ESMFold做出的数亿个预测表示怀疑。他认为，有些蛋白质可能缺乏确定的结构，而另一些可能是非编码DNA，被误认为是蛋白质编码材料。　　德国慕尼黑工业大学计算生物学家Burkhard Rost对Meta公司模型的速度和准确性的结合印象深刻。但他质疑，宏基因组数据库预测蛋白质是否真的比AlphaFold的精确度更高。基于语言模型的预测方法，更适合快速确定突变如何改变蛋白质结构，这是AlphaFold无法做到的。　　据DeepMind的一位代表说，该公司目前没有在其数据库中进行宏基因组结构预测的计划，但不排除在未来这样做的可能性。　　韩国首尔国立大学计算生物学家Martin Steinegger认为，利用这类工具的下一步，显然是研究生物学中的暗物质。“这些宏基因组结构的分析很快就会出现爆炸式增长。”　　相关论文信息：　　https://doi.org/10.1101/2022.07.20.500902

时间： 2022-11-07

作者： ONE
蛋白质结构预测哪家强？两大国际团队同日在顶刊开源代码
蛋白质是生命的物质基础，每个蛋白质的氨基酸链扭曲、折叠、缠绕成复杂的结构，想要破解这种结构通常需要花很长的时间，甚至难以完成。截至目前，约有10万个蛋白质的结构已经用实验方法得到了解析，但这在已经测序的数10亿计的蛋白质中只占了很小一部分。　　但“看清”蛋白的结构和人类的很多疾病机理、药物研发等等息息相关。在蛋白质结构解析的几十年历史中，X射线晶体学、核磁共振波谱学(NMR)、冷冻电镜(Cryo-SEM)技术纷纷发挥了巨大的贡献，但这些技术在科学界看来，都有着劳心劳力又价格高昂的缺点。　　如何简单地通过蛋白质的氨基酸序列来预测其形状?如何能解答这一问题，了解生命运作方式的将打开截然不同的一扇窗。这种设想提出的50多年后，谷歌旗下人工智能公司DeepMind在去年12月的国际蛋白质结构预测竞赛CASP上投下重磅，他们开发的基于神经网络的新模型AlphaFold2击败了其他选手，在预测准确性方面达到接近人类实验结果，让整个结构生物学界震惊。北京时间7月15日，DeepMind团队在顶级学术期刊《自然》(Nature)以“加快评审文章”(Accelerated Article Preview)形式在线发表了一篇题为“Highly accurate protein structure prediction with AlphaFold”的论文，全面详述了半年前造成轰动的这一模型，并首次对外分享开源代码。该论文于今年5月11日提交，7月12日被接收。　　DeepMind团队提供了一份声明，公司创始人兼首席执行官Demis Hassabis在声明中表示，去年在CASP14大会上我们揭晓了一个可以将蛋白质3D结构预测精确到原子水平的全新AlphaFold系统，此后我们承诺会分享我们的方法，并为科学共同体提供广泛、免费的获取途径。　　“今天我们迈出了承诺的第一步，在《自然》期刊上分享AlphaFold的开源代码，并发表了系统的完整方法论，详尽细致说明AlphaFold是如何做到精确预测蛋白质3D结构的。作为一家致力于推动科学进步的公司，我们期待看到我们的方法将为科学界启发出什么其他新的研究方法，也期待很快能和大家分享更多我们的新进展。”Hassabis表示。值得一提的是，就在同一天，另一顶级期刊《科学》(Science)也在线发表了另一预测蛋白质结构的研究文章，题为“Accurate prediction of protein structures and interactions using a three-track neural network”。　　来自华盛顿大学、哈佛大学、德克萨斯大学西南医学中心等团队的研究人员开发了新的深度学习工具RoseTTAFold，其拥有媲美AlphaFold2的蛋白质结构预测超高准确度，而且更快、所需计算机处理能力更低。同样，研究团队也对外分享了开源代码。该论文提交于6月7日，7月7日被接收。　　清华大学生命科学学院院长、高精尖中心执行主任王宏伟表示，“高质量结构预测的源代码开放对整个科学界尤其是结构生物学领域的促进作用必然是巨大的。”他评价道，对于DeepMind这样一家商业公司来说，“团队愿意向公众分享代码，是一个新型科研范式的突破，将整体上有利于人类更好地探索未知。”　　预测蛋白质结构，接近实验室测量　　50多年前，科学家们就设想用计算机预测蛋白质结构。近年来，共同演化、接触图预测、深度机器学习等技术的引入，一些实验室的算法精度有了很大程度的提高。　　曾经开发出Alphago、战胜人类顶尖棋手的DeepMind团队是其中的佼佼者，其团队的强大和资源雄厚是一般实验室无法企及的。2020年12月1日，他们在生物领域展现出实力，在两年一度的权威蛋白质结构预测评估竞赛(CASP)中用AlphaFold2击败其他参赛团队。　　CASP是由马里兰大学John Moult教授等人于1994年组织。竞赛使用的是最新解决且尚未在蛋白质数据库(PDB)中存放或公开披露的结构，结构生物学家们利用X射线晶体学、核磁共振波谱学、冷冻电镜的方法，把这些蛋白质的结构解析出来。做蛋白质结构预测的团队则利用计算机程序来预测它们的结构。最后由独立的科学家团队则把计算机预测的模型和实验室的结构对照，分析不同计算机算法的预测结果。这是一种“双盲”测试，长期以来一直是评价结构预测准确性的金标准。　　去年的CASP14共有84个常规题目，其中有14题因为生物实验没给出确定结构等原因被取消或延缓，其他70个题目的单体和复合物蛋白质所含有的氨基酸个数从73到2180不等。　　19个国家的215个小组参加了CASP14。DeepMind公司的AlphaFold2预测的大部分结构达到了空前的准确度，不仅与实验方法不相上下，还远超解析新蛋白质结构的其他方法。将实验方法得到的蛋白质结构叠加在AlphaFold2的结构上，组成蛋白质主链骨架的叠加原子之间的距离中位数(95%的覆盖率)为0.96埃(0.096纳米)。成绩排第二的方法只能达到2.8埃的准确度。　　AlphaFold2的神经网络能在几分钟内预测出一个典型蛋白质的结构，还能预测较大蛋白质(比如一个含有2180个氨基酸、无同源结构的蛋白质)的结构。该模型能根据每个氨基酸对其预测可靠性进行精确预估，方便研究人员使用其预测结果。　　AlphaFold2最终被Moult评价道，“在某种意义上，问题已经解决了”。　　值得一提的是，在最新发布的论文中，DeepMind还简化了AlphaFold2。AlphaFold的首席研究员John Jumper说，“这个网络需要几天的计算时间来生成CASP的一些蛋白质的结构，而开源版本的速度要快16倍。根据蛋白质的大小，它可以在几分钟到几小时内生成结构。”　　受AlphaFold2的启发，华盛顿大学医学院生物化学家、蛋白质设计研究所所长David Baker等人开发了RoseTTaFold。华盛顿大学医学院官网对该研究的介绍称，在高精度的蛋白质结构预测方面，Baker等人“在很大程度上重现了DeepMind团队的表现。”　　相较于AlphaFold2只解决了单个蛋白质的结构，RoseTTaFold不仅适用于简单的蛋白质，也适用于蛋白质复合物。据介绍，RoseTTaFold利用深度学习技术，根据有限信息准确、快速地预测蛋白质结构。从结构上来看，RoseTTAFold 是一个三轨(three-track)神经网络，它可以兼顾蛋白质序列的模式、氨基酸如何相互作用以及蛋白质可能的三维结构。在这种结构中，一维、二维、三维信息来回流动，使得网络能够集中推理蛋白质的化学部分与它的折叠结构。巴塞尔大学的计算结构生物学家Torsten Schwede对《科学》杂志说，许多生物功能依赖于蛋白质之间的相互作用。“直接从序列信息中处理蛋白质-蛋白质复合物的能力使其对生物医学研究中的许多问题极具吸引力。”　　Baker同时坦言，AlphaFold2的结构更加准确。但是根特大学的结构生物学家Savvas Savvides说，Bake实验室的方法更好地捕捉到了“蛋白质结构的本质和特性”，比如识别从蛋白质侧面伸出的原子串，这些特征是蛋白质之间相互作用的关键。　　纽约大学医学院的细胞和结构生物学家Gira Bhabha说，两种方法都很有效。她表示，“DeepMind和Baker实验室的进展都是惊人的，将改变我们利用蛋白质结构预测推进生物学的方式。”　　开源代码，如何促进整个科学界?　　相比于去年年底带来的震撼，这次外界更感兴趣的是上述两支团队开源代码这一动作。　　此前的6月中旬，在Baker实验室发布RoseTTAFold预印本三天之后，DeepMind的Hassabis在推特上表示，AlphaFold2的细节正在接受一份出版物的审查，公司将“为科学界提供广泛的免费访问”。　　而从6月1日开始，Baker等人已经开始挑战他们的方法，让研究人员发送来他们最令人困惑的蛋白质序列。加州大学旧金山分校的结构生物物理学家David Agard的研究小组发送了一组没有已知类似蛋白质的氨基酸序列，几个小时内，他的团队就得到了一个蛋白质模型，“这可能为我们节省了一年的工作。”Agard说。　　除了免费提供RoseTTaFold的代码外，Baker团队还建立了一个服务器，研究人员可以插入蛋白质序列并得到预测的结构。贝克说，自从上个月推出以来，该服务器已经预测了大约500人提交的5000多种蛋白质的结构。　　不过，上述两支团队的源代码都是免费的，但也有观点认为，对于没有技术专长的研究人员来说，它可能还不是特别有用。不过，DeepMind的科学人工智能负责人Pushmeet Kohli表示，DeepMind已经与一些选定的研究人员和组织合作，以预测特定的目标，其中包括总部位于瑞士日内瓦的非营利组织“Drugs for ignored Diseases”。“在这个领域，我们还有很多想做的事情。”　　Hassabis提到，去年在CASP14大会上我们揭晓了一个可以将蛋白质3D结构预测精确到原子水平的全新AlphaFold系统，此后我们承诺会分享我们的方法，并为科学共同体提供广泛、免费的获取途径。“今天我们迈出了承诺的第一步，在《自然》期刊上分享AlphaFold的开源代码，并发表了系统的完整方法论，详尽细致说明AlphaFold是如何做到精确预测蛋白质3D结构的。作为一家致力于推动科学进步的公司，我们期待看到我们的方法将为科学界启发出什么其他新的研究方法，也期待很快能和大家分享更多我们的新进展。”　　DeepMind团队认为，这一精准的预测算法可以让蛋白质结构解析技术跟上基因组革命的发展步伐。　　Baker团队也提到，“我们希望这个新工具将继续造福整个研究界。”　　中国科学院合肥物质科学研究院强磁场科学中心研究员谢灿对澎湃新闻(www.thepaper.cn)记者表示，“总的来说，对学术界来肯定是好事，肯定会促进结构生物学和相关领域的发展。在承认学术贡献的基础上的开放和共享，本来就应该是学术研究最基本的要求。”　　结构生物学是谢灿的“老本行”，“我当年花了8年的时间去解析一个蛋白的晶体结构，我能切身体会如果有一个精准预测蛋白结构的算法出现，对结构生物学家意味着什么。”　　但他认为，不必要担忧这些算法的出现会让结构生物学家失业，在技术迭代之下，结构生物学这些年受到的冲击太多了，“而事实上，只不过是某一个领域某一个技术在某一个历史阶段更容易出工作出成绩。”谢灿认为，无论再精准的预测，终究也只是预测，“AlphaFold2不是实验，同样也需要实验去证实。”　　王宏伟在AlphaFold2刚出现之时也曾评价道，对于复杂的结构生物学问题，预测手段本身还不能号称完全解决了问题。实验结构生物学领域接下来需要做的一个事情是要拥抱变化，更好地与预测方法结合以及共同发展。

时间： 2021-07-17

作者：刘杨
仅利用质谱，机器学习可预测未上市新型人造毒品
英国《自然机器智能》杂志15日发表一项计算生物学突破，包括加拿大英属哥伦比亚大学在内的研究团队研发了一种自动化、生成式的机器学习方法，可以仅利用质谱就确定未知的新型精神药物（又称人造毒品）的化学结构，了解这些结构能帮助法医实验室更快识别出疑似的人造毒品。　　每年有大量新型精神药物出现在非法市场上，这些药物会造成与已知非法药物相近的精神效果，但其合成方式使其在化学上与已知非法药物有所不同，这些药物规避了现有的毒品法规，甚至难以被侦测。法医实验室使用质谱分析法在查封药片或粉末中识别已知人造毒品。但是，要弄清一种全新人造毒品的结构，通常需要化学专家工作数周或数月，并且需要用到多种实验技术。　　加拿大英属哥伦比亚大学研究人员迈克尔斯金奈德及其同事，此次使用全球各地法医实验室众包的保密数据，训练了一个机器学习模型。他们所使用的算法也被称为深度神经网络，其灵感来自于人脑的结构和功能。机器学习产生了结构和性质都类似于近期人造毒品的分子。该模型随后产生了一个数据库，包含十亿种潜在新型精神药物的结构。用模型训练结束后新收集的数据测试该模型，发现这一方法可以仅用质谱就确定未知人造毒品。在准确结构难以精准确定的实例中，该模型建议的结构，与未知人造毒品非常相似。　　研究人员发现，该模型还可帮助人们了解到哪些分子更有可能出现在市场上，哪些不太可能。研究人员总结说，用其他数据集训练的类似的生成方法，也可以帮助识别其他特定领域未知分子的结构，例如识别新型兴奋剂或者环境污染物。　　研究资深作者、阿尔伯塔大学计算科学教授戴维维斯哈特表示，这一模型意义有点类似2002年的科幻电影《少数派报告》，其可以对即将发生的犯罪活动有所预知，从而帮助显著减少犯罪，“从本质上讲，这一新成果为执法机构和公共卫生计划提供了一个所谓‘先机’，让他们知道需注意什么。”　　斯金奈德表示，该模型仅仅通过精确的质谱测量就阐明整个化学结构，而将数十亿个结构的列表缩小到10个候选结构，大大加快了化学家识别新药物的速度。

时间： 2021-11-16

作者：情绪波动
北京妇产医院曹正临床质谱团队新成果：发现无症状分娩预测关键标志物
近日，首都医科大学附属北京妇产医院曹正临床质谱团队在JCR Q1区内科权威期刊《Annals of Medicine》在线发表题为“Delivery prediction by quantitative analysis of four steroid metabolites with liquid chromatography tandem mass spectrometry in asymptomatic pregnant women”的研究论文，第一作者为2020级检验专业研究生孟兰兰，该研究通过应用液相色谱串联质谱（LC-MS/MS）平台建立了四种类固醇代谢物（E3-16-Gluc、17-OHP、THDOC、A-3,17-Diol）的方法学并进行了一系列的方法验证，证实E3-16-Gluc 和 17-OHP 的类固醇代谢物组对于预测没有任何临产临床迹象的单胎妊娠妇女（简称无症状孕妇）一周内的分娩具有极大价值。早产机制尚不明确标志物发现推动早产预测根据世界卫生组织统计，全球每年出生的早产儿有1500多万，我国的早产儿出生率约为10%，早产是造成围产儿及5岁以下儿童死亡的最主要原因。但目前早产发病机制尚不明确，作为早产临床诊疗中的重要环节，此前临床亦无可靠的短期早产预测标志物。分娩预测对评估预产期、提供充分产前护理建议，以及早产和过期妊娠干预诊疗都具有重要意义。而随着三胎政策的落地，高龄、高危以及有妊娠并发症或合并症者孕妇比例逐渐增高，早产预测的临床意义和必要性也进一步提高。首都医科大学附属北京妇产医院曹正、翟燕红临床质谱团队，联合产科刘晓巍团队以及美国康纳尔大学医学院赵贞团队，利用自建LC-MS/MS方法，对招募的585名30孕周（GW）及以上无症状单胎自然分娩孕妇进行血浆中的四种类固醇代谢物的定量检测，评估其在分娩预测中的临床价值，在采集血浆后 7 天内分娩为阳性组，在采样后 7天内未分娩的为阴性组。实验结果表明，THDOC和A-3,17-Diol的浓度在阳性组和阴性组之间没有显著差异。相比之下，阳性组的血浆E3-16-Gluc 和 17-OHP水平显着高于阴性组，具有统计学差异。根据ROC分析确定的临界值，E3-16-Gluc和17-OHP组合测量的阴性预测值(NPV)高达95.7%。本论文对E3-16-Gluc 和 17-OHP 的类固醇代谢物在相对较短的窗口（即7天）内准确排除自然分娩能力的发现，对推动开发简单而准确的早产诊断检测手段有着重大意义，能够为无症状孕妇住院与门诊监测以及门诊强度的临床决策提供重要参考。主要作者介绍曹正，主任技师，副教授，硕士生导师，首都医科大学附属北京妇产医院临床质谱检验中心主任、检验科副主任。博士毕业于美国马里兰大学帕克分校，随后进入美国休斯敦卫理公会医院进行检验住院医师培训，并取得美国临床化学医师执照。主要社会任职：首都医科大学临床检验诊断学系青年委员会副主任委员，北京市临床检验中心临床质谱规范化应用专家委员会副主任委员，北京内分泌代谢病学会检验医学专业委员会副主任委员等。

时间： 2022-05-16

作者： ONE
AlphaFold的新对手？新AI预测微生物六亿多蛋白结构
Meta（前身为 Facebook，总部位于加利福尼亚州门洛帕克）的研究人员使用人工智能 (AI) 来预测来自细菌、病毒和其他尚未表征的微生物的约 6 亿种蛋白质的结构。负责人Alexander Rives说：“这些是我们最不了解的神秘蛋白质结构。我认为它们为深入了解生物学提供了潜力。”该团队使用“大型语言模型”生成了预测工具——人工智能AI，这是可以从几个字母或单词预测文本的工具的基础。通常，语言模型是在大量文本上进行训练的。为了将它们应用于蛋白质，Rives 和他的同事将它们输入已知蛋白质的序列，这些蛋白质可以由 20 种不同氨基酸组成的链表达，每一种都用一个字母表示。然后，该网络学会了“自动完成”蛋白质，其中一部分氨基酸被遮蔽。蛋白质“自动完成”Rives 说，“这种培训使网络对蛋白质序列有了直观的了解，这些蛋白质序列保存了有关其形状的信息。第二步，受到 DeepMind 开创性的蛋白质结构 AI AlphaFold 的启发，将这些见解与有关已知蛋白质结构和序列之间关系的信息结合起来，从蛋白质序列中生成预测结构。Meta 的网络，称为 ESMFold，不如 AlphaFold 准确，但它在预测结构方面快了大约 60 倍，这意味着我们可以将结构预测扩展到更大的数据库。”做一个测试案例，研究人员决定将他们的模型应用于来自环境（包括土壤、海水、人类肠道、皮肤和其他微生物栖息地）的批量测序“宏基因组”DNA 数据库。其中绝大多数编码潜在蛋白质的 DNA 条目来自从未被培养过且科学未知的生物体。Meta 团队总共预测了超过 6.17 亿种蛋白质的结构。这项工作只用了 2 周时间（AlphaFold 可能需要几分钟才能生成一个预测）。Rives 说：“任何人都可以免费使用这些预测，就像模型底层的代码一样。”AlphaFold 和 AI 蛋白质折叠革命的下一步是什么在这 6.17 亿个预测中，该模型认为超过三分之一是高质量的，因此研究人员可以确信整体蛋白质形状是正确的，并且在某些情况下可以辨别更精细的原子级细节。数以百万计的结构是全新的，与通过实验确定的蛋白质结构数据库或已知生物体预测的 AlphaFold 数据库中的内容不同。首尔国立大学的计算生物学家 Martin Steinegger 说：“AlphaFold 数据库的很大一部分是由彼此几乎相同的结构组成的，而“宏基因组”数据库应该涵盖了以前看不见的蛋白质宇宙的很大一部分，即现在有一个很大的机会来解开更多的谜底。”Sergey Ovchinnikov教授对 ESMFold 做出的数以亿计的预测感到疑惑：有些可能缺乏明确的结构，至少是孤立的，而另一些可能是非编码 DNA，被误认为是蛋白质编码材料。似乎我们对仍有一半以上的蛋白质空间一无所知。更精简、更简单、更便宜德国慕尼黑工业大学的计算生物学家 Burkhard Rost 对 Meta 模型的速度和准确性印象深刻。但他质疑在预测宏基因组数据库中的蛋白质时，它是否真的比 AlphaFold 的精确度更具优势。基于语言模型的预测方法，他的团队开发了一种更适合快速确定突变如何改变蛋白质结构的方法，显然AlphaFold 无法做到这一点。据称，DeepMind 目前没有将宏基因组结构预测纳入其数据库的计划，但并未排除未来发布的可能性。Steinegger 和他的合作者已经使用了一个 AlphaFold 版本来预测大约 3000 万个宏基因组蛋白的结构。他们希望通过寻找新形式的基因组复制酶来发现新型 RNA 病毒。他认为我们很快就会对这些宏基因组结构的分析产生爆炸式的兴趣。参考资料：https://doi.org/10.1038/d41586-022-03539-1

时间： 2022-11-03

作者： Ev
DeepMind重磅推出AlphaFold：人工智能预测基因序列蛋白形状结构
p 　　Alphabet(谷歌)旗下公司 DeepMind 的人工智能 AlphaGo 曾在国际象棋、围棋等项目中取得了超越人类的表现，其研究不仅震惊世界，也两次登上 Nature。如今，该公司已将人工智能技术应用到最具挑战性的科学研究问题中，其刚刚推出的 AlphaFold 可以仅根据基因“代码”预测生成蛋白质的 3D 形状。 /p p 　　DeepMind 表示，AlphaFold 是“该公司首个证明人工智能研究可以驱动和加速科学新发现的重要里程碑”。看来，人类医学研究要前进一步了。 /p p 　　 img src=" https://img1.17img.cn/17img/images/201812/uepic/fc4cf612-a444-4567-b697-76cdcdfc9dea.jpg" title=" 1.jpg" alt=" 1.jpg" style=" text-align: center " / /p p style=" text-align: center " 　　 span style=" color: rgb(127, 127, 127) " 2017 年 5 月，谷歌 DeepMind 人工智能项目 AlphaGo(执棋者：黄士杰博士)对战当时世界第一的围棋选手柯洁。 /span /p p style=" text-indent: 2em " 周日，在墨西哥坎昆举办的一场国际会议中，DeepMind 的最新 AI——AlphaFold 在一项极其困难的任务中击败了所有对手，成功地根据基因序列预测出蛋白质的 3D 形状。 /p p 　　“蛋白质折叠”是一种令人难以置信的分子折叠形式，科学界以外很少有人讨论，但却是一个非常重要的问题。生物由蛋白质构成，生物体功能由蛋白质形状决定。理解蛋白质的折叠方式可以帮助研究人员走进科学和医学研究的新纪元。 /p p 　　“对于我们来说，这真的是一个关键时刻，”DeepMind 联合创始人兼 CEO Demis Hassabis表示，“这个项目就像灯塔，这是我们关于人和资源的首次重大投资，用于解决一个根本性的、现实世界的重要问题。” /p p 　　在 2016 年 AlphaGo 击败李世乭后，DeepMind 就开始将目光转向蛋白质折叠。尽管实践证明，游戏是 DeepMind AI 项目的优秀试验场，但在游戏中取得高分并非他们的终极目标。“我们的目标从来就不是赢得围棋或雅达利比赛的胜利，而是开发能够解决蛋白质折叠这类问题的算法，”Hassabis 表示。 /p p 　　 strong 为什么要预测蛋白质结构 /strong /p p 　　人体能够产生数万甚至数百万的蛋白质。每个蛋白质都是一个氨基酸链，而后者的类型就有 20 种。蛋白质可以在氨基酸之间扭曲、折叠，因此一种含有数百个氨基酸的蛋白质有可能呈现出数量惊人(10 的 300 次方)的结构类型。 /p p 　　蛋白质的 3D 形状取决于其中包含的氨基酸数量和类型，而这一形状也决定了其在人体中的功能。例如，心脏细胞蛋白质的折叠方式可以使血流中的任何肾上腺素都粘在它们上面，以加速心率。免疫系统中的抗体是折叠成特定形状的蛋白质，以锁定入侵者。几乎身体的每一种功能——从收缩肌肉和感受光线到将食物转化为能量——都和蛋白质的形状及运动相关。 /p p 　　通常情况下，蛋白质会呈现出能量效率最高的任何形状，但它们可能会纠缠在一起或者折叠错误，导致糖尿病、帕金森和阿茨海默症等疾病。如果科学家可以根据蛋白质的化学构成来预测其形状，他们就能知道它是做什么的，会如何出错并造成伤害，并设计新的蛋白质来对抗疾病或履行其它职责，比如分解环境中的塑料污染。 /p p 　　 strong AI 如何改变研究方法? /strong /p p 　　正因为蛋白质的结构如此重要，在过去的五十年中，科学家已经能使用低温电子显微镜和核磁共振等实验技术确定蛋白质的形状，但是每一种方法都依赖大量的试验与误差反馈，每种结构可能需要花费数万美元、历时数年进行研究。因此生物学家转攻 AI 方法，以完成这一困难且单调的过程。 /p p 　　幸运的是，由于基因测序成本快速降低，基因组领域的数据非常丰富。因此在过去几年中，依赖于基因组数据的预测问题正越来越多地借助深度学习方法。DeepMind 非常关注这一问题，并提出了 AlphaFold，这一项工作目前已经提交到了Critical Assessment of Structure Prediction (CASP)。 /p p 　　DeepMind 用 AlphaFold 参加了 CASP，这是一年两次的蛋白质折叠奥运会，吸引了来自世界各地的研究小组。比赛的目的是根据氨基酸列表来预测蛋白质的结构，这些氨基酸列表会在几个月内每隔几天发送给参赛团队。这些蛋白质的结构最近已经通过费力又费钱的传统方法破解，但还没有公开。提交最准确预测的团队将获胜。 /p p 　　尽管是首次参加比赛，AlphaFold 就在 98 名参赛者中名列榜首，准确地从 43 种蛋白质中预测出了 25 种蛋白质的结构。而同组比赛中获得第二名的参赛者仅准确预测出了 3 种。值得一提的是，AlphaFold 关注从头开始建模目标形状，且并不使用先前已经解析的蛋白质作为模板。AlphaFold 在预测蛋白质结构的物理性质上达到了高度的准确性，然后基于这些预测可以使用两种不同的方法预测构建完整的蛋白质结构。 /p p 　　 strong 使用神经网络预测物理属性 /strong /p p 　　AlphaFold 构建的模型都依赖深度神经网络，这些经过训练的神经网络可以从基因序列中预测蛋白质的属性。DeepMind 的研究人员表示，神经网络预测的蛋白质属性主要有：(a)氨基酸对之间的距离 (b)连接这些氨基酸的化学键及它们之间的角度。这些方法的首要进步就是对常用技术的提升，它们可以估计氨基酸对是否彼此接近。 /p p style=" text-align: center" img src=" https://img1.17img.cn/17img/images/201812/noimg/d256b4f4-6189-437b-8ead-d45a99ae81de.gif" title=" 2.gif" alt=" 2.gif" width=" 375" height=" 375" style=" width: 375px height: 375px " / /p p style=" text-indent: 2em " 为了构建 AlphaFold，DeepMind 在数千已知的蛋白质上训练了一个神经网络，直到它可以仅凭氨基酸预测蛋白质的 3D 结构。给定一种新的蛋白质，AlphaFold 利用神经网络来预测氨基酸对之间的距离，以及连接它们的化学键之间的角度。接着，AlphaFold 调整初步结构以找到能效最高的排列。该项目花了两周时间来预测其第一个蛋白质结构，但现在几小时内就可以完成了。 /p p 　　根据神经网络预测的两种物理属性，DeepMind 还训练了一个神经网络以预测蛋白质成对残基(residues)之间距离的独立分布，这些概率能组合成估计蛋白质结构准确率的评分。此外，DeepMind 还训练了另一个独立的神经网络，该网络使用集群中的所有距离来估计预测的结构与实际结构之间的差距。 /p p style=" text-align: center" img src=" https://img1.17img.cn/17img/images/201812/uepic/b1b25d1b-42ba-454c-ae29-93402575df61.jpg" title=" 3.jpg" alt=" 3.jpg" / /p p style=" text-align: center " 　　 img src=" https://img1.17img.cn/17img/images/201812/noimg/3bbdee91-2067-417d-8e22-92b8a5543cc6.gif" title=" 4.gif" alt=" 4.gif" style=" text-align: center width: 533px height: 178px " width=" 533" height=" 178" / /p p 　　 strong 预测蛋白质结构的新方法 /strong /p p 　　这些评分函数可以用来探索蛋白质内部，以找到与预测匹配的结构。DeepMind 的第一种方法建立在结构生物学的常用技术上，用新的蛋白质片段反复替换蛋白质整体结构的某个部分。他们训练了一个生成神经网络来创造新的片段，这些片段被用来不断提高蛋白质结构的评分。 /p p style=" text-align: center" img src=" https://img1.17img.cn/17img/images/201812/uepic/e657a13d-1262-4040-8074-dda8e8ac5791.jpg" title=" 5.jpg" alt=" 5.jpg" width=" 492" height=" 315" style=" width: 492px height: 315px " / /p p 　　先通过神经网络预测氨基酸之间的距离和化学键角度，然后再根据两种物理属性对结构进行评分，最后通过梯度下降优化评分。 /p p 　　第二种方法是通过梯度下降来优化评分，得到的结构高度精确。梯度优化被用在整个蛋白质链，而不是组装前必须单独折叠的片段，这种做法降低了预测过程的复杂性。 /p p 　　 strong 未来可期 /strong /p p 　　首次涉足蛋白质折叠领域的成功表明，机器学习系统可以整合各种信息来源，帮助科学家快速找到各种复杂问题的创造性解决方案。人工智能已经通过 AlphaGo 和 AlphaZero 等系统掌握了复杂的游戏，与此类似，利用人工智能攻克基本科学问题的未来同样可期。 /p p 　　雷丁大学的研究人员 Liam McGuffin 在比赛中带领得分最高的英国学术团体。他表示，“DeepMind 今年似乎取得了更大的进展，我想进一步了解他们的方法。我们的资源并不充足，但我们仍然有很强的竞争力。” /p p 　　“预测蛋白质折叠形状非常重要，对解决很多世纪难题有重大影响。这种能力可以影响健康、生态、环境，基本上可以解决任何涉及生命系统的问题。” /p p 　　“包括我们在内的很多团队几年来一直都在使用基于机器学习的方法，而深度学习和人工智能的进步似乎也产生了越来越重要的影响。我对这个领域很乐观，我觉得我们会在 21 世纪 20 年代真正解决这个问题。”McGuffin 表示。 /p p 　　Hassabis 也表示还有很多工作要做。“我们还没有解决蛋白质折叠问题，目前只是迈出了第一步。这是一个极具有挑战性的问题，但我们有一个良好的体系，还有很多想法尚未付诸实践。” /p p 　　蛋白质折叠的早期进展令人兴奋，它证明了人工智能对科学发现的效用。尽管在能够对疾病治疗、环境管理等方面产生量化影响之前，我们还有很多工作要做，但我们知道人工智能的潜力是巨大的。在一个专注于研究机器学习如何推进科学发展的专业团队的努力下，我们期待看到技术能够有所作为。 /p

时间： 2018-12-04

作者：筱婕
汇集结构质谱尖兵，开拓蛋白质结构生物学的新天地——第十四届质谱网络会议报告推荐
随着生命科学研究的深入开展,科学界对解析复杂生物大分子结构以揭示生命现象的渴望日益增加。在各种结构生物学技术快速发展的背景下,结构质谱技术凭借其独特的优势,日益成为连接静态结构与动态功能、实现从分子到细胞的跨尺度研究的重要手段。在12月12-15日即将召开的“第十四届质谱网络会（iCMS 2023）”同期，特别新增了“结构质谱新方法”主题专场,来自全国的顶尖科学家团队将汇聚一堂,围绕氢/重氢交换质谱、化学交联质谱、原位质谱等前沿技术,报告他们在蛋白质结构生物学研究中的最新进展。本次主题会议的召开,恰逢结构质谱技术发展的重要机遇,必将推动该领域技术的重要突破及交叉创新,开启生命科学研究的新篇章。热忱欢迎质谱界的科技工作者报名参会交流、了解前沿动态、开拓合作视野。部分报告预告如下，点击报名》》》会议主持人：中山大学教授李惠琳中山大学药学院教授，博士生导师。主要从事生物质谱新技术的开发及应用，侧重于（1）开发整合结构质谱技术（包括native top-down MS, HDX-MS, CX-MS等），用于药物作用分子机制及蛋白复合物结构研究；（2）Middle-down/top-down蛋白质组学新技术的开发及应用。共发表SCI收录论文40篇，其中第一作者或通讯作者15篇，主要发表在Nat. Chem.、Anal. Chem.等期刊；2014年获得American Society of Mass Spectrometry Postdoctoral Career Development Award；2019年入选“珠江人才计划”青年拔尖人才；主持国家自然科学基金项目3项。报告人：香港理工大学教授姚钟平报告题目：氢氘交换质谱揭示β-内酰胺酶与抑制剂相互作用的动态构象复旦大学学士及硕士,香港科技大学博士,香港理工大学应用生物及化学科技学系教授。长期从事质谱、分析化学、化学生物学、组学的交叉学科研究，主要发展和应用质谱技术解决化学、生物、食品安全、信息科学等领域的基础和应用问题，在Nature Communications, PNAS, JACS等期刊发表论文100多篇。现任香港研究资助局专家委员会委员、深圳市中药药学及分子药理学重点实验室副主任、中国化学会有机分析专业委员会委员、Frontiers in Chemistry副主编以及Analytica Chimica Acta, Rapid Communications in Mass Spectrometry,《中国质谱学报》,《分析测试学报》等期刊编委。会上,姚钟平教授将作主题为《氢氘交换质谱揭示β-内酰胺酶与抑制剂相互作用的动态构象》的报告。利用氢氘交换质谱（HDX-MS）并结合原态离子迁移质谱（Native IM-MS）以及分子动态(MD)模拟，发现不同亚型的A型β-内酰胺酶在几个主要的结构域存在显著的动态构象差异。进一步研究了A型β-内酰胺酶与抑制蛋白结合界面的动态结构变化，结果揭示了H10区域是一个可调节β-内酰胺酶抑制作用的别构部位。报告人：浙江大学研究员周默为报告题目：非变性质谱剖析异质性蛋白复合体结构和功能信息浙江大学首位“求是实验岗”研究员，分析化学专业，长期从事前沿生物质谱技术和仪器的开发工作。2008年本科毕业于武汉大学，2013年博士毕业于美国俄亥俄州立大学，之后两站博士后分别在美国FDA和西北太平洋国家实验室PNNL。2018年成为PNNL的研究员开展独立研究，培养多名博士后和学生。2023年加入浙江大学。截至目前共发表60余篇学术论文，代表作包括在Angewandte Chemie, Nature Communications, Analytical Chemistry等期刊的论文。现任自上而下蛋白组协会（Consortium for Top Down Proteomics）的青年委员会主席，曾担任美国质谱协会（ASMS）的出版委员会委员、短课程讲师、评审委员等学术任职，努力推动新分析测试技术的开发和跨学科领域的应用研究。本次会议中，周默为研究员将为介绍题为《非变性质谱剖析异质性蛋白复合体结构和功能信息》的报告。精准表征生物大分子的微观结构对各类生物工程、生物医药领域的研究至关重要。由于大部分质谱检测到的分子量范围有限，在分析之前生物大分子需要先被剪切为分子量更小的片段。但是剪切和碎片化的过程中会丢失一些关键的结构信息。前沿质谱技术提高了仪器的分子量上限，使非变性条件“自上而下”研究完整的生物大分子更加容易。我将以具体案例，阐述自上而下非变性质谱技术在异质性蛋白质复合体结构和功能解析中的贡献，以及与其他方法的互补性。报告人：北京大学研究员王冠博报告题目：生物样本中蛋白高级结构的质谱分析北京大学生物医学前沿创新中心研究员。北京大学学士，美国马萨诸塞大学博士，曾于荷兰乌特勒支大学暨荷兰蛋白组学中心从事博士后研究；曾任南京师范大学教授、博士生导师。主要从事免疫反应相关蛋白质的高级结构及相互作用研究，以生物质谱为核心工具，结合新型分析设备研发，应用于生物物理学、蛋白质药物分析等领域。长年与国际药企合作研发新型药物表征技术并应用于新药研发。获国际国内授权专利，出版《Mass Spectrometry in Biopharmaceutical Analysis》等专著、译著、合著多部。任中国生物化学与分子生物学会蛋白质组学专业分会委员、国际学术组织Consortium for Top-Down Proteomics青委会委员。本次会议中，王冠博研究员将围绕生物样本中蛋白高级结构的质谱分析主题分享报告。生物质谱已成为蛋白质多次结构表征的重要工具。为将蛋白结构质谱技术的应用拓展至生物样本乃至临床样本中，我们针对背景基质复杂、糖基化等修饰异质性高、超大分子量颗粒结构层次多样等问题，以非变性质谱等质谱手段为核心工具开发了一系列组合策略，提供生物样本乃至临床样本中的蛋白高级结构和相互作用关系信息。报告人：中国科学院大连化学物理研究所研究员王方军报告题目：高能紫外激光解离-串联质谱仪器研发和应用2011年于中科院大连化物所获博士学位，师从邹汉法研究员。研究工作致力于生物大分子质谱新仪器、新方法及其在生命健康领域的应用研究，搭建了世界首台50-150 nm可调波长极紫外激光超快解离-串联质谱；提出了位点光解离碎片产率和原位化学标记效率定量表征蛋白质结构变化的两种质谱分析新原理，实现亚微克蛋白质复合物序列和结构变化单氨基酸位点分辨表征；发展了蛋白质-纳米材料界面相互作用精细结构的质谱分析新方法等。在Nat. Protoc.，J. Am. Chem. Soc.，Cell Chem. Biol.，Chem. Sci.，Anal. Chem.等期刊发表论文130余篇，他引5000余次。本次会议中，王方军研究员将分享题为《高能紫外激光解离-串联质谱仪器研发和应用》的报告。高能/真空紫外激光解离是表征生物大分子序列和动态结构的前沿结构质谱表征技术，但相关仪器和理论都亟待发展。报告人将介绍近年来自主研发的皮秒脉冲极紫外激光解离装置和蛋白质原位光化学标记仪器的原理、主要参数、与商品化质谱对比、及在蛋白质瞬态结构表征、蛋白-蛋白识别和相互作用机制分析等方面的应用情况。报告人：中国科学院大连化学物理研究所研究员赵群报告题目：活细胞内蛋白质原位构象和相互作用规模化解析新方法研究中国科学院大连化学物理研究所研究员，博士生导师。本科毕业于西北大学化学基地班。同年进入大连化学物理研究所攻读博士学位，师从张玉奎院士和张丽华研究员，2014年获得理学博士学位。毕业后留所工作至今，主要从事蛋白质组定性定量及相互作用分析新技术研究，共发表学术论文62篇，其中近五年以通讯/第一作者（含共同）在Nat. Commun., Angew. Chem. Int. Ed.，Anal. Chem.等SCI期刊发表论文23篇；已获20项发明专利授权。作为课题负责人承担国家重点研发计划，作为项目负责人承担国家自然科学基金面上基金等，2023年获国家自然科学基金优秀青年基金支持；2018年入选大连市科技之星，2020年入选中国科学院青年促进会会员，2023年获中国化学会菁青化学新锐奖；兼任《色谱》青年编委、中国化工学会理事、中国蛋白质组学会青年委员、中科院青促会沈阳分会委员等。本次会议中，赵群研究员将围绕题为《活细胞内蛋白质原位构象和相互作用规模化解析新方法研究》的报告。作为生命活动的执行者，蛋白质通过相互作用形成复合体等形式行使其特定的生物学功能。不同于细胞外的离体环境，细胞内的限域效应、拥挤效应和细胞器微环境等对于维持蛋白质复合体的结构和功能起着至关重要的作用。因此，实现细胞内蛋白质相互作用的精准解析对于深入研究其生物学功能，进而理解生命现象本质具有重要意义。近年来，化学交联质谱技术已逐渐成为蛋白质复合物解析的重要手段。它是利用化学交联剂将空间距离足够接近的蛋白质内/间的氨基酸以共价键连接起来，再利用质谱对交联肽段进行鉴定，进而实现蛋白质相互作用的组成、界面和位点的解析。现有化学交联技术主要用于解析体外表达纯化的或细胞裂解液中的蛋白质复合物，而在细胞内蛋白质复合物的原位构像解析方面仍处于起步阶段。针对上述问题，我们团队发展了一系列新型高生物兼容性的可透膜多功能化学交联剂，实现了活细胞内蛋白质复合物构像的原位交联捕获；建立了多种高选择性的低丰度交联肽段的富集方法和高可信度的交联肽段鉴定方法，显著提高了原位交联信息的鉴定灵敏度、覆盖度和准确度；进而，通过靶向富集特定亚细胞器内的交联蛋白质复合物，实现了亚细胞器空间分辨的蛋白质相互作用精准解析；在上述基础上，利用基于化学交联距离约束的分子动力学技术获得了蛋白质复合物的动态系综构像，实现了活细胞微环境下蛋白质复合物组成、相互作用界面及作用位点的规模化精准解析，为规模化地揭示蛋白质复合物功能状态下的结构调控机制提供了重要的技术支撑。为了分享质谱技术及应用的最新进展，促进各相关单位的交流与合作，仪器信息网与北美华人质谱学会（CASMS）将于2023年12月12-15日联合举办第十四届质谱网络会议（iCMS2023）。以上仅是部分报告嘉宾的分享预告，更多精彩内容请参加会议页面：https://www.instrument.com.cn/webinar/meetings/iCMS2023/ （点击下图去报名）》》》

时间： 2023-12-08

作者： ONE
解决生物学50年来的重大挑战！生物界“AlphaGo”精准预测蛋白质结构
p style=" text-indent: 2em " 提到DeepMind公司，我们首先想到的可能是几年前，它开发的人工智能AlphaGo“横扫”顶尖人类围棋职业选手，变革了围棋的思考方式。除了在棋类比赛中所向披靡以外，DeepMind也在加速科学发现上迈出了重要一步。今日，DeepMind宣布，其新一代AlphaFold人工智能系统，在国际蛋白质结构预测竞赛（CASP）上击败了其余的参会选手，能够精确地基于氨基酸序列，预测蛋白质的3D结构。其准确性可以与使用冷冻电子显微镜（CryoEM）、核磁共振或 X 射线晶体学等实验技术解析的3D结构相媲美。这一突破被多家媒体称为“变革生物科学和生物医学”的突破。前基因泰克（Genentech）首席执行官Arthur D. Levinson博士称这一成就为“划时代的进步”（once in a generation advance）。 /p p style=" text-align: center text-indent: 2em " img style=" max-width:100% max-height:100% " src=" https://img1.17img.cn/17img/images/202012/uepic/33325072-7059-48e8-b1d4-6321cae2e263.jpg" title=" 微信图片_20201201221037.png" alt=" 微信图片_20201201221037.png" / /p p style=" text-align: center text-indent: 2em " span style=" font-size: 12px " 图片来源：DeepMind Blog /span /p p br/ /p p style=" text-indent: 2em " strong 生物学50年来的重大挑战 /strong /p p br/ /p p style=" text-indent: 2em " 我们都知道，蛋白质对生命来说是不可或缺的，它们支持生物体的几乎所有功能。这些复杂的大分子由氨基酸链构成，而蛋白质的功能很大程度上决定于它的3D结构。生物医学领域的众多挑战，包括开发治疗疾病的创新疗法，依赖于对蛋白质结构和功能的理解。 /p p br/ /p p style=" text-indent: 2em " 在过去的五十年中，科学家们已经能够利用冷冻电子显微镜、核磁共振或 X 射线晶体学等实验手段在实验室中确定蛋白质的形状，但每种方法都依赖于大量的试错，耗时耗力，可能需要花上好几年时间。1972年，诺贝尔化学奖得主Christian Anfinsen博士表示，理论上，蛋白质的氨基酸序列应该能够完全决定它的3D结构。这一假说激发了50年来基于氨基酸序列，通过计算方法预测蛋白质3D结构的探索。 /p p br/ /p p style=" text-indent: 2em " 然而，这一领域面临的重大挑战是理论上，氨基酸链可能形成的蛋白质构象的数目是个非常庞大的天文数字。有学者估计，一个典型的蛋白质理论上可以形成10的300次方（1后面加300个0）个可能构象。然而在自然界，蛋白质能够自发地在几毫秒内，迅速折叠成其中一个构象。用什么样的计算方法，才能从10的300次方的可能构象中找到那个正确的构象？ /p p br/ /p p style=" text-indent: 2em " strong AlphaFold：生物界的“AlphaGo” /strong /p p br/ /p p style=" text-indent: 2em " DeepMind的研究人员把折叠好的蛋白质设想成一幅具有3D结构的“空间图画”（spatial graph），而氨基酸则是这副“空间图画”中节点和线条。基于神经网络系统，他们设计了AlphaFold系统来解析这一空间图画的结构。它使用了进化相关的氨基酸序列，多序列对比（multiple sequence alignment, MSA）以及对氨基酸对（amino acid pairs）的评估来优化“空间图画“的描绘。 /p p style=" text-align: center text-indent: 2em " img style=" max-width:100% max-height:100% " src=" https://img1.17img.cn/17img/images/202012/uepic/7ffebf8d-21e2-421e-bff5-adf328b90caf.jpg" title=" 微信图片_20201201221204.png" alt=" 微信图片_20201201221204.png" / /p p style=" text-align: center text-indent: 2em " ▲AlphaFold的神经网络模型构架（图片来源：DeepMind Blog） /p p br/ /p p style=" text-indent: 2em " 研究人员使用蛋白质数据库中接近17万个不同的蛋白质结构，以及包含未知结构的蛋白序列数据库对AlphaFold进行训练。通过不断地迭代，AlphaFold系统学习到了基于氨基酸序列，精确预测蛋白结构的能力。 /p p br/ /p p style=" text-indent: 2em " 与实验结果相差无几的蛋白质结构预测 /p p br/ /p p style=" text-indent: 2em " 国际蛋白质结构预测竞赛（CASP）是由马里兰大学的John Moult教授和加州大学戴维斯分校的Krzysztof Fidelis教授联合创建的国际性比赛，旨在评估、促进和确认最佳的蛋白质结构预测手段。CASP选择已经通过实验手段解析，但是尚未公布的蛋白质结构作为目标，让世界各地的研究团队运用自己的计算手段预测它们的结构。一个独立的团队会评估预测结构与通过实验手段解析的蛋白结构之间的差异。 /p p br/ /p p style=" text-indent: 2em " 2018年，DeepMind开发的第一代AlphaFold首次参加CASP并且拔得头筹。而今年，新一代的AlphaFold在CASP中的表现更为惊艳。CASP使用称为GDT的评分系统来评估预测蛋白结构的精确性。这个评分从0到100，如果评分达到90分以上，可以认为预测的结构与实验手段获得的结构相当。 /p p style=" text-align: center text-indent: 2em " img style=" max-width:100% max-height:100% " src=" https://img1.17img.cn/17img/images/202012/uepic/87def9e4-8753-401b-9fa9-3ada59e01d7b.jpg" title=" 微信图片_20201201221209.png" alt=" 微信图片_20201201221209.png" / /p p style=" text-align: center text-indent: 2em " strong ▲2006-2020年CASP比赛中最佳蛋白折叠预测系统的评分表现（图片来源：DeepMind Blog） /strong /p p br/ /p p style=" text-indent: 2em " 在今年的CASP中，AlphaFold系统对所有蛋白靶点3D结构预测的中位GDT评分为92.4分。即便是针对最难解析的蛋白靶点，AlphaFold的中位GDT评分也达到了87.0分。在接受检验的近100个蛋白靶点中，AlphaFold对三分之二的蛋白靶点给出的预测结构与实验手段获得的结构相差无几。CASP创始人Moult教授表示，在有些情况下，已经无法区分两者之间的区别是由于AlphaFold的预测出现错误，还是实验手段产生的假象。 /p p style=" text-align: center" br/ /p p style=" text-indent: 2em " img src=" https://img1.17img.cn/17img/images/202012/uepic/14003fd2-fbf1-4fc4-b34a-087e4fa5f63d.jpg" title=" 微信图片_20201201221209.png" alt=" 微信图片_20201201221209.png" style=" max-width: 100% max-height: 100% " / /p p style=" text-align: center text-indent: 2em " ▲AlphaFold根据氨基酸序列预测的蛋白结构与实验手段解析的结果几乎完全重合（绿色，实验结果；蓝色，计算预测结果；图片来源：DeepMind Blog） /p p br/ /p p style=" text-indent: 2em " strong 对真实世界的影响 /strong /p p br/ /p p style=" text-indent: 2em " 在今年早些时候，DeepMind已经利用这一系统预测了多种新冠病毒蛋白的结构。后续的实验显示， strong AlphaFold预测的新冠病毒Orf3a蛋白结构与冷冻电镜解析的结构非常相似。 /strong /p p br/ /p p style=" text-indent: 2em " 虽然，AlphaFold不见得会取代冷冻电子显微镜等其它实验手段，但是DeepMind的研究人员表示，这一令人兴奋的结果表明，生物学家们可以使用计算结构预测作为科学研究的核心工具之一。这一手段对于特定类型的蛋白来说可能尤为便利，例如膜蛋白一直非常难于结晶，因此很难用实验手段获得它们的结构。 /p p br/ /p p style=" text-indent: 2em " 而对于从事计算和机器学习研究的DeepMind团队来说，AlphaFold的表现证明了AI在辅助基础科学发现方面惊人的潜力。该团队在公司发布的博文中表示，他们相信，AI将成为人类拓展科学知识前沿最有力的工具之一！ /p p br/ /p

时间： 2020-12-01

作者：吴婕
新型蛋白质结构分析手段-氢氘交换质谱技术进展
贾伟、陈熙沃特世科技（上海）有限公司实验中心氢氘交换质谱法是一种研究蛋白质空间构象的质谱技术。它在蛋白质结构及动态变化研究、蛋白质相互作用位点发现、蛋白表位及活性位点鉴定方面有着广泛的应用。随着氢氘交换质谱技术的不断发展，它正在成为结构生物学家及生物药物研发的重要手段。氢氘交换质谱（HDX MS，hydrogen deuterium exchange mass spectrometry）是一种研究蛋白质空间构象的质谱技术。其原理是将蛋白浸入重水溶液中，蛋白的氢原子将于重水的氘原子发生交换，而且蛋白质表面与重水密切接触的氢比位于蛋白质内部的或参与氢键形成的氢的交换速率快，进而通过质谱检测确定蛋白质不同序列片段的氢氘交换速率，从而得出蛋白质空间结构信息[1]。这个过程就像将握着的拳头浸入水中，然后提出水面并张开手掌。这时，湿润的手背表明它在&ldquo 拳头&rdquo 的结构中处于外表面，而较为干燥的手心表明它是&ldquo 拳头&rdquo 的内部。除样品制备外，氢氘交换质谱法的主要过程包括：交换反应、终止反应、将蛋白快速酶切为多肽、液相分离、质谱检测、数据解析。其中交换步骤需要在多个反应时长下进行，如0s、10s、1min、10min、60min等，以绘制交换率曲线，得到准确全面的信息。氢氘交换质谱技术在蛋白质结构及其动态变化研究[1]、蛋白质相互作用位点发现[2]、蛋白表位及活性位点鉴定方面有着广泛的应用[3]。与经典的蛋白质结构研究方法相比，如X射线晶体衍射（X-Ray Crystallography）和核磁共振（NMR. Nuclear Magnetic Resonance）等方法，氢氘交换质谱不能够提供精确的蛋白空间结构，它直接提供的主要信息包括哪些氨基酸序列位于蛋白质空间结构的表面位置（包括动态变化中的）、可能的活性位点和蛋白-蛋白相互作用位点等。但是氢氘交换质谱技术有着其他经典方法不具备的优点：首先，可以进行蛋白质结构动态变化的研究是氢氘交换质谱的一个突出优点，包括变化中的活性位点及表位；其次，氢氘交换质谱在蛋白复合体构象的研究中也具有独到的优势；此外，氢氘交换质谱还具有对样品需求量小、纯度要求相对较低、研究对象为溶液环境下的蛋白质的天然构象而非晶体中构象等优势[1,4,5]。自1991年第一篇研究论文发表起，氢氘交换质谱技术不断发展，已经成为结构生物学及质谱技术中一个非常重要的应用领域[6]。但是氢氘交换质谱实验的复杂的实现过程在一定程度上影响了其应用的广泛度。主要的难点有：1、如何避免交换后氘代肽段的回交现象；2、实验控制的高精确性和重现性要求；3、交换后造成的叠加的质谱峰如何准确分辨；4、简易高效的分析软件需求；5、以氨基酸为单位的交换位点辨析。沃特世公司自2005年起，针对以上难点不断进行攻关，推出了目前唯一商业化的全自动氢氘交换质谱系统解决方案&mdash &mdash nanoACQUITY UPLC® HD-Exchange System(图1)。在全世界范围内，这套系统已经帮助科学家在包括Cell、Nature等顶级研究期刊中发表研究论文[7,8]。除科研需求外，沃特世氢氘交换质谱系统也受到众多国际领先制药公司的认可，并用于新药开发中蛋白药物活性位点及表位的研究工作中。氢氘交换实验中的回交现象将严重影响实验数据的可信度，甚至导致错误结果的产生。要避免回交需要做到两点：尽量缩短液质分析时间和保证液质分析中的温度和pH为最低回交反应系数所要求的环境。沃特世UPLC® 系统采用亚二纳米色谱颗粒填料，较HPLC使用的大颗粒填料，UPLC具有无与伦比的分离度。因此UPLC可以做到在不损失色谱分离效果的要求下，极大缩短液相分析时间的要求[9]。对于对温度和pH控制问题，在多年的工程学改进中，nanoACQUITY UPLC HD-Exchange System已经实现了对酶切、液相分离等步骤的全程控制[10]。对氢氘交换质谱实验精确性和重现性的要求是其应用的第二个主要难点。在实验中一般需要采集0s、10s、1min、10min、60min、240min等多个时间点的数据。如果进行人工手动实验，很难做到对10S-10min等几个时间点的精确操作。再考虑到重复实验的需求，人工手动操作会对最终数据可信度产生影响。而且实验过程重复繁琐，将给实验人员带来非常大的工作压力。nanoACQUITY UPLC HD-Exchange System完全通过智能机械臂，精确完成交换、终止交换、进样、酶切等一系列实验过程，而且始终保证各个步骤所需不同的温度环境。这些自动化过程不但保证了实验数据的可靠性，提高了实验效率，也将科学家从繁琐的重复实验中解放出来。氢氘交换实验的质谱数据中，随着交换时间的延长，发生了交换反应的多肽，由于质量变大，其质谱信号将逐渐向高质荷比方向移动。因此，这些质谱峰可能与哪些未发生交换反应的多肽质谱峰逐渐叠加、相互覆盖。相互叠加的质谱信号，不但影响对峰归属的判断，更会增加交换率数据的误差。因为交换率判断需要通过对发生交换的多肽进行定量，毫无疑问因叠加的而混乱的质谱数据将极大的影响对质谱峰的准确定量。这点对于单纯通过质荷比进行分析的质谱仪来说完全无能为力。但是，这个看似不可能完成的任务却被沃特世 nanoACQUITY UPLC HD-Exchange System攻克了。这是因为，不同于其它常见质谱，沃特世的SYNAPT® 质谱平台还具备根据离子大小及形态进行分离的功能（行波离子淌度分离）。在数据处理时，除多肽离子的质荷比信息外，还可以通过离子迁移时间（离子淌度维度参数）将不同离子区分。因此这种SYNPAT独有的被命名为HDMSE的质谱分析技术可以将因质荷比相同而重叠的多肽分离开，轻而易举地解决了质谱信号叠加的问题，得到准确的交换率数据[11,12]（图2）。SYNPAT质谱平台一经推出就夺得了2007年PITTCON金奖，目前已经推出了新一代的SYNAPT G2HDMS、SYNAPT G2-S HDMS等型号，并具备ESI、MALDI等多种离子源。除氢氘交换技术外，SYNAPT质谱系统在蛋白质复合体结构研究中也是独具特色，已有多篇高质量应用文献发表[13,14,15]。实现氢氘交换质谱技术的第四个关键点，是如何高效分析实验产生的多时间点及多次重复带来的大量数据。人工完成如此巨大的信息处理工作，将消耗科学家大量的时间。沃特世氢氘交换质谱解决方案所提供的DynamX软件可以为科学家提供简便直观的分析结果，并包含多种呈现方式。在某些特殊研究中，要求对蛋白氢氘交换位点做到精确到氨基酸的测量，这是氢氘交换质谱研究的又一个难点。在常规的研究中采用CID（碰撞诱导解离）碎裂模式，可能导致氘原子在多肽内重排，而致使不能对发生交换的具体氨基酸进行精确定位。SYNPAT质谱提供的ETD（电子转移解离）碎裂模式可以避免氘原子重排造成的信息混乱，并具有良好的碎裂信号[16]。沃特世的nanoACQUITY UPLC HD-Exchange System为氢氘交换质谱实验提供了前所未有的简易的解决方案，强有力地推动了氢氘交换技术在蛋白质结构及动态变化研究、蛋白质相互作用位点发现、蛋白表位以及活性位点鉴定方面的应用，正在成为众多结构生物学科学家和生物制药企业必不可少的工作平台。参考文献 (1) John R. Engen, Analysis of Protein Conformation and Dynamics by Hydrogen/Deuterium Exchange MS. Anal. Chem. 2009,81, 7870&ndash 7875 (2) Engen et al. probing protein interactions using HD exchange ms in ms of protein interactions. Edited by Downard, John Wiley & Sons, Inc. 2007, 45-61 (3) Tiyanont K, Wales TE, Aste-Amezaga M, et al. Evidence for increased exposure of the Notch1 metalloproteasecleavage site upon conversion to an activated conformation. Structure. 2011, 19, 546-554 (4) Heck AJ. Native mass spectrometry: a bridge between interactomics and structural biology. Nat Methods. 2008, 5, 927-933. (5) Esther van Duijn, Albert J.R. Heck. Mass spectrometric analysis of intact macromolecular chaperone complexes. Drug Discovery Today. Drug Discovery Today: Technologies Volume 3, 2006, 21-27 (6) Viswanat ham Katta, Brian T. C hait, Steven Ca r r. Conformational changes in proteins probed by hydrogen-exchange electrospray-ionization mass spectrometry. Rapid Commun. Mass Spectrom. 1991, 5, 214&ndash 217 (7) Chakraborty K, Chatila M, Sinha J, et al. Chaperonin-catalyzed rescue of kinetically trapped states in protein folding. Cell. 2010 Jul 9 142(1):112-22. (8) Zhang J, Adriá n FJ, Jahnke W, et al. Targeting Bcr-Abl by combining allosteric with AT P-binding-site inhibitors. Nature. 2010,463, 501-506 (9) Wu Y, Engen JR, Hobbins WB. Ultra performance liquid chromatography (UPLC) further improves hydrogen/deuterium exchange mass spectrometry. J Am Soc Mass Spectrom. 2006 , 17, 163-167 (10) Wales T E, Fadgen KE, Gerhardt GC, Engen JR. High-speed and high-resolution UPLC separation at zero degrees Celsius. Anal Chem. 2008, 80, 6815-6820 (11) Giles K, Pringle SD, Worthington KR, et al. Applications of a travelling wave-based radio-frequency-only stacked ring ion guide. Rapid Commun Mass Spectrom. 2004, 18, 2401-2414 (12) Olivova P, C hen W, C ha kra borty AB, Gebler JC. Determination of N-glycosylation sites and site heterogeneity in a monoclonal antibody by electrospray quadrupole ion-mobility time-offlight mass spectrometry. Rapid Commun Mass Spectrom. 2008, 22,29-40 (13) Ruotolo BT, Benesch JL, Sandercock AM, et al. Ion mobilitymass spectrometry analysis of large protein complexes. Nat Protoc.2008, 3, 1139-52. (14) Uetrecht C, Barbu IM, Shoemaker GK, et al. Interrogatingviral capsid assembly with ion mobility-mass spectrometry. Nat Chem.2011, 3,126-132 (15) Bleiholder C, Dupuis NF, Wyttenbac h T, Bowers MT. Ion mobility-mass spectrometry reveals a conformational conversion from random assembly to &beta -sheet in amyloid fibril formation. Nat Chem. 2011, 3, 172-177 (16) Kasper D. Rand, Steven D. Pringle, Michael Morris, John R., et al. ETD in a Traveling Wave Ion Guide at Tuned Z-Spray Ion Source Conditions Allows for Site-Specific Hydrogen/Deuterium Exchange Measurements. J Am Soc Mass Spectrom. 2011, in press

时间： 2012-03-13

作者： Waters
力学所在镁基室温热电材料Mg3Bi2-xSbx半无序微结构预测方面取得进展
热电材料是能够实现热能和电能直接相互转化的新型能源材料，在低品位废热发电、固态制冷、深空探测、局域空间精准温控等领域有重要应用。较低的转换效率是制约热电材料应用的瓶颈，Bi2Te3基化合物是目前唯一规模化应用的近室温热电材料，热电发电转换效率仅有~7% 。Mg基热电材料Mg3Bi2-xSbx具有低成本和在室温工作区的高热电性能，有望取代Bi2Te3基化合物成为下一代室温商用化材料。确定Mg基热电材料的微结构是认识和提升热电性能的前提。然而，Mg3Bi2-xSbx（0x（02-xSbx为题，发表在《计算材料学》（Computational Materials Science）上。研究工作得到国家重点研发计划和力学所力英计划等的支持。图1. （a）用于有限尺寸化学无序材料结构预测的流程图，（b）用于准无限尺寸化学无序材料结构预测的流程图图2. （a） “辣搜”方法在Mg3Bi2-xSbx（x=0.5，N=90）体系搜索过程中总能量随搜索代数的演化；（b）三种不同尺寸（N = 10、40和90）的搜索过程中第一性原理计算所需的时间；（c）三种不同尺寸（N = 10、40和90）下Mg3Bi2-xSbx（0xSbx（02-xSbx（x=0.5）中Mg-Sb和Sb-Sb的径向分布函数（RDF）

时间： 2023-08-22

作者：情绪波动
全球质谱市场分析及前景预测
质谱是一种被用于鉴别样品中各种化学成分的分析技术，同时也被用于样品中特定化学组分的定量。目前，质谱已成为分析实验室中研究化合物生物和化学性质的一种很常用技术，其中在生命科学领域，质谱主要用于蛋白质的测序和表征，如鉴定疾病中的关键蛋白并定量、改变表型及识别诊断标志物以便于治疗。　　得益于临床诊断的广泛应用，MALDI-TOF发展最快　　根据技术划分，目前的质谱技术包括气相色谱-质谱(GC-MS)、液相色谱-质谱(LC-MS)、基质辅助激光解吸电离飞行时间质谱(MALDI-TOF)、三重四极杆液相色谱-质谱，四极杆飞行时间液相色谱-质谱、电感耦合等离子体质谱等。其中，MALDI-TOF是全球质谱市场中发展速度最快的细分市场，这主要得益于该技术在临床诊断领域中日益广泛的应用。　　使用频繁&成本降低，制药成为质谱最大应用领域　　按照应用划分，质谱的应用领域包括制药、环境监测、食品和饮料检测、生物技术、工业化学等。其中，制药行业是全球质谱市场中最大的应用市场，这是因为质谱在药物安全方面使用日益频繁，同时还降低了药物发现相关过程中的成本。　　北美市场规模最大，亚洲市场增速最快　　从地理区域角度来看，北美地区占据了全球质谱市场的主导地位，这是因为该地区的生物技术和生物医学领域的政府投资不断增加，而且蛋白质组学领域研发力度加大也推动了该地区质谱技术的发展，美国是该地区最大的质谱技术市场，加拿大其次。法国、德国、意大利、西班牙和英国占据了欧洲地区的主要市场份额。然而，亚洲市场在未来五年预计将成为全球质谱市场中增速最高的地区，因为很多企业在该地区设立生产工厂和研究中心，并且质谱制造商为促进质谱技术参与发起的展会日渐增多，这也为亚洲质谱市场的快速发展做出了贡献；日本、中国和印度预计将成为亚洲地区增长最快的质谱市场。　　剖析：全球质谱市场中驱动力、制约因素　　近来，全球质谱市场的主要驱动力包括生命科学研究领域的政府投入加大、医药行业的研发投入提升，同时人们对食品和饮料安全问题的日益关注也推动了全球质谱市场的增长。此外，质谱技术不断进步也刺激了终端用户的采用。　　然而，仪器的高成本成为了全球质谱市场增长的关键制约因素，同时质谱操作技术人员的缺失也妨碍了全球质谱市场的增速。　　主流制造商兼并整合成全球质谱市场发展趋势　　全球质谱市场中的主要参与者包括丹纳赫、安捷伦、沃特世、赛默飞、布鲁克、珀金埃尔默、岛津、日本电子、日本理学、Bio-Rad等，这些主流质谱制造商之间的兼并整合日渐频繁，这将成为全球质谱市场的主要发展趋势。编译：刘玉兰

时间： 2014-11-14

作者：刘玉兰
共价标记质谱分析抗体药物高阶结构的细微变化
单克隆抗体(mAb)是制药行业增长最快的治疗方法之一，mAb的高阶结构(HOS)影响药物与靶标的结合特异性，从而影响治疗效果和副作用。若储存而导致HOS发生变化，例如蛋白质错误折叠和聚集，会导致稳定性降低、功效丧失或可能的免疫原性。因此，监测HOS对保证mAb疗法的有效性和安全性至关重要。X射线晶体学和核磁共振(NMR)光谱可以提供原子级分辨率，但存在费时费样品的缺点；生物物理技术，如差示扫描量热法(DSC)、动态光散射(DLS)、荧光光谱、红外(IR)光谱和圆二色(CD)光谱只能提供低分辨率的整体构象。焦碳酸二乙酯(DEPC)作为亲电子试剂能够修饰溶剂可接近的亲核侧链（Cys、His、Lys、Thr、Tyr、Ser）和蛋白质的N末端，这些残基产生的羧基化产物具有+72.021Da的质量转移，经过蛋白水解消化、液相色谱分离和串联质谱分析后，可以识别和半定量特定的蛋白质修饰位点。将一种条件（例如天然）与另一种条件（例如加热）进行比较时，特定残基处共价标记程度的变化可用于探测蛋白质的HOS变化（图1）。在这篇文章中，作者使用DEPC共价标记联用质谱，以利妥昔单抗作为单抗药物的模型，以期在远低于mAb治疗药物熔点的温度下能够特异性检测细微HOS变化，并通过活性测定进行验证。图1. DEPC 标记与质谱联用分析单抗药物结构的流程在通过共价标记研究热应力（heat stressed）利妥昔单抗之前，作者使用CD光谱、荧光光谱和动态光散射(DLS)来识别加热对蛋白质结构的干扰。发现当在低于其熔点的温度下加热利妥昔单抗4小时时，这三种技术在45°C或55°C时无法检测到显著的结构变化，而在65°C时仅显示出轻微的变化。随后作者团队使用DEPC CL-MS探测利妥昔单抗的细微结构变化。在45°C压力下的利妥昔单抗样品中发现DEPC标记水平的变化较少，大多数变化是由于蛋白质受热去折叠导致的标记增加（图2），且可变区的变化远少于恒定区。超过70%的标记变化发生在Tyr、Ser和Thr残基处，而发生在His和Lys残基处的标记变化始终小于20%。标记变化表明，45°C时的结构变化主要是局部微环境的变化，而非溶剂可及性差异显著的大结构变化，也就是说修饰位点分散在整个蛋白质结构中，而不是集中在蛋白质的某些区域。图2. 45°C 热应力 4 h 后 DEPC修饰程度的变化。饼图表示在利妥昔单抗的每个结构域内标记变化显著的修饰残基比例。红色代表标记增加，而蓝色代表减少。条形图表示共价标记变化程度低 (L)、中 (M) 和高 (H)的残基数量。活性测定能反映一定程度的结构变化对利妥昔单抗活性的影响，从而验证DEPC标记结果。桥接ELISA的结果表明，在预热至45°C后，利妥昔单抗的Fc结合活性没有显著变化（图3a），Fc区域的CDC活性估计在45°C热应激后保持不变（图3b），利妥昔单抗的Fab结合活性估计与对照样品没有差异（图3c）。活性测定结果表明蛋白质在45°C时没有发生显著的结构变化。在Fab和Fc区域中标记变化的残基数量相对较少，主要标记对局部微环境变化更敏感的Tyr、Ser和Thr残基。修饰位点分散在整个蛋白质中，对Fab和Fc区域的构象几乎没有影响，与共价标记质谱联用的测定结果相吻合。图3.使用单抗活性测定验证CL-MS实验揭示的结构变化。Fc区的结构完整性通过(a)测量Fc与捕获抗体结合的利妥昔单抗桥接ELISA和(b)测量补体依赖性细胞毒性的Alamarblue测定来评估。Fab区域的结构完整性通过(c)Raji细胞下拉试验评估，测量Fab与B细胞CD20抗原的结合。55°C加热4h后利妥昔单抗所有结构域的残基修饰程度都发生了显著的变化，尤其是Fab区域的VH和VL结构域。（图4）加热至55°C时，His和Lys残基处发生的标记变化几乎是45°C的两倍，表明蛋白质在这些区域展开；Fab区域标记水平发生显著变化，特别是在VH、VL和CL域。这表明利妥昔单抗的Fab区域存在局部结构变化，据报道这也是IgG1分子中对热应激最敏感的区域。Fc区域中没有观察到类似的发生标记变化的残基聚集，Tyr、Ser和Thr处的大多数标记变化为中度或高度变化，这些结果表明蛋白质拓扑结构可能发生变化。图4. 55°C 热应力 4 h 后 DEPC修饰程度的变化。饼图表示在利妥昔单抗的每个结构域内标记变化显著的修饰残基比例。红色代表标记增加，而蓝色代表减少。条形图表示共价标记变化程度低 (L)、中 (M) 和高 (H)的残基数量。尺寸排阻色谱(SEC)测量表明在65°C加热条件下存在高分子量物质。将DEPC CL-MS方法应用于65°C热应力的利妥昔单抗后，发现所有利妥昔单抗结构域的标记发生显著变化（图5），主要体现为标记的减少，这可能是因为蛋白质聚集。利妥昔单抗的Fab和Fc区均发现标记减少的残基簇，活性测定结果显示Fc结合和CDC活性的降低（图3），说明了Fc区特别是CH3结构域的标记变化，与DEPC标记结果一致。图5. 65°C 热应力 4 h 后 DEPC修饰程度的变化。饼图表示在利妥昔单抗的每个结构域内标记变化显著的修饰残基比例。红色代表标记增加，而蓝色代表减少。条形图表示共价标记变化程度低 (L)、中 (M) 和高 (H)的残基数量。总结DEPC标记技术的结构分辨率和灵敏度足以探测细微的蛋白质构象变化，该技术与质谱联用可在低于Tm的温度下揭示利妥昔单抗中的细微HOS变化，与经典的生物物理技术互补。总体而言，鉴于CL-MS简便、灵敏的特点，该方法将适用其他抗体药物的结构研究。

时间： 2022-07-15

作者： ONE
2023年科学突破奖公布，奖励蛋白结构预测、睡眠机制以及量子信息领域
“今天获奖的获奖者体现了基础科学的非凡力量，”尤里米尔纳说，“既揭示了宇宙的深刻真理，又改善了人类生活”。米尔纳是俄罗斯富商，是科学突破奖的创建者之一。“2023年科学突破奖”，主要奖励在蛋白结构预测、细胞组织机制以及量子信息领域做出开创性贡献的学者，他们将分享共计1575万美元的奖金。生命科学领域的三个突破性奖项被授予：克利福德布朗温（Clifford P. Brangwynne）和安东尼海曼（Anthony A. Hyman），以表彰他们发现了细胞组织的新机制；德米斯哈萨比斯（Demis Hassabis）和约翰乔普（John Jumper）开发AlphaFold，准确预测蛋白质的结构；以及伊曼纽尔米格诺特（Emmanuel Mignot）和柳泽正史（Masashi Yanagisawa ）发现嗜睡症的原因。数学突破奖授予丹尼尔斯皮尔曼（Daniel A. Spielman），以表彰他在理论计算机科学和数学方面的多项发现。基础物理学突破奖由查尔斯贝内特（Charles H. Bennett），吉尔布拉萨德（Gilles Brassard），大卫多伊奇（David Deutsch）和彼得肖尔（Peter Shor），以表彰他们在量子信息方面的基础工作。早期职业科学家的重要贡献也得到了认可，6个物理和数学新视野奖，以及3个Maryam Mirzakhani新前沿奖，它发给了刚完成博士学位的女性数学家。“神经退行性疾病的突破、量子计算、人工智能解决蛋白质结构等等......”Google创始人谢尔盖布林表示，“这些都是令人难以置信的进步，值得庆祝”。“祝贺所有突破奖获得者，他们令人难以置信的发现将为科学发现铺平道路并刺激创新，”CZI联合创始人兼联合首席执行官Priscilla Chan和Mark Zuckerberg表示，“这些获奖者和早期职业科学家正在推动研究和科学的极限，我们很高兴能够表彰他们的成就”。如下分别介绍今年的诺奖者及获奖理由：2023年生命科学突破奖普林斯顿大学、霍华德休斯医学研究所克利福德布兰格温以及来自德国马克斯普朗克分子细胞生物学与遗传学研究所的安东尼海曼获奖理由：发现了由蛋白质和RNA相分离成无膜液滴介导的细胞组织基本机制。德米斯哈萨比斯（Demis Hassabis）和约翰乔普（John Jumper）获奖理由：开发了一种深度学习算法，该方法可快速准确地从其氨基酸序列中预测蛋白质的三维结构。伊曼纽尔米格诺特（Emmanuel Mignot）和柳泽正史（Masashi Yanagisawa ）获奖理由：发现了嗜睡症是由一小群脑细胞的缺失引起的，这些脑细胞会释放促进觉醒物质，这为开发新的睡眠障碍治疗方法铺平了道路。022023年基础物理学突破奖2023年基础物理学突破奖获奖人为：IBM 托马斯沃森研究中心查尔斯贝内特、蒙特利尔大学吉尔布拉萨德、牛津大学大卫多伊奇以及麻省理工学院彼得肖尔。获奖理由：以表彰他们在量子信息方面的基础工作。032023年数学突破奖2023年数学突破奖获奖人为：耶鲁大学丹尼尔斯皮尔曼获奖理由：对理论计算机科学和数学的突破性贡献，包括对光谱图论、Kadison-Singer问题，数值线性代数的优化和编码理论。04科学突破奖简介科学突破奖(Breakthrough Prize) 创立于2012年，由俄罗斯亿万富翁尤里米尔纳夫妇、谷歌（google）联合创始人谢尔盖布林夫妇、阿里巴巴集团创建人马云和张瑛夫妇、脸书（Facebook）联合创始人马克扎克伯格夫妇、以及苹果公司董事长亚瑟莱文森等知名实业家共同设立，旨在表彰在生命科学、数学和基础物理学领域做出杰出贡献的人士。该奖项于2013年2月启动，下设“生命科学突破奖”、“基础物理学突破奖”和“数学突破奖”，并且面向年轻科学家设立“物理学新视野奖”、“数学新视野奖”和“青年挑战突破奖”，此外，2019年起开始设立“玛丽亚姆米尔扎哈尼新新前沿奖”（Maryam Mirzakhani New Frontiers Prize），颁发给在过去两年内获得博士学位并处于职业生涯早期的女数学家。科学突破奖的奖金十分丰厚，堪称科学界“第一巨奖”，并被誉为“科学界的奥斯卡”。其中，生命科学、基础物理学和数学突破奖三大奖项的获奖者，每人可获得300万美元奖金；新视野奖奖金为10万美元；“玛丽亚姆米尔扎哈尼新新前沿奖”的获奖者，可获得5万美元奖金。现在，科学突破奖由谢尔盖布林、马克扎克伯格夫妇、尤里米尔纳夫妇、基因技术公司23andMe联合创始人安妮沃西基、以及腾讯公司联合创始人马化腾赞助。科学突破奖近5年获奖情况2017年获奖情况：生命科学突破奖获得者：沙克生物学研究所、哈佛休夫医学研究所研究员乔安妮乔瑞（Joanne Chory）；加州大学圣迭戈分校路德维希癌症研究所科研人员唐克利夫兰（Don W. Cleveland）；日本京都大学科学研究院生物物理学教授森和俊（Kazutoshi Mori）；牛津大学科研人员金内史密斯（Kim Nasmyth）；加州大学旧金山分校彼得沃特（Peter Walter）。基础物理学突破奖获得者：由27名成员组成的WMAP实验团队，其中 5位获奖团队领导分别为：查尔斯贝内特（Charles L. Bennett），美国约翰-霍普金斯大学物理&天文学系教授；美国天文学家和天体物理学家加里欣肖（Gary F. Hinshaw），来自不列颠哥伦比亚大学；美国物理学家和天体物理学家诺曼雅罗西克（Norman C. Jarosik ），来自普林斯顿大学；普林斯顿大学詹姆斯麦克唐纳物理学杰出大学教授莱曼佩吉（Lyman Alexander Page, Jr）；美国理论天体物理学家，普林斯顿大学教授戴维斯佩格尔（David Nathaniel Spergel）。数学突破奖获得者：克里斯朵夫哈克（Christopher Hacon ），来自犹他大学；詹姆斯迈克凯南（James McKernan），来自加州大学圣迭戈分校。2018年获奖情况：生命科学突破奖获得者：哈佛大学科学家弗兰克本内特（Frank Bennett）；美国科学家艾德里安科内纳尔（Adrian Krainer）；麻省理工学院科学家安吉里卡阿蒙（Angelika Amon）；哈佛大学华裔科学家庄小威（Xiaowei Zhuang）；美国德州大学西南医学中心分子生物学教授陈志坚（Zhijian “James” Chen）。基础物理学突破奖获得者：宾夕法尼亚大学教授查尔斯凯恩（Charles Kane）；宾夕法尼亚大学科学家尤金迈乐（Eugene Mele）。基础物理学特别突破奖：英国天文学家乔瑟琳贝尔（Jocelyn Bell Burnell ）。数学突破奖获得者：法国国家科学研究中心和格勒诺布尔大学傅立叶研究所科学家文森特拉福格（Vincent Lafforgue）。 2019年获奖情况生命科学突破奖获得者：美国纽约洛克菲勒大学分子实验室、霍华德休斯医学研究所教授杰弗里M弗里德曼（Jeffrey M. Friedman）；马克斯普朗克生物化学研究所研究人员F乌尔里希哈特尔（F. Ulrich Hartl）；耶鲁医学院、霍华德休斯医学研究所科学家亚瑟L霍里奇（Arthur L. Horwich）；加州旧金山大学生理学及分子生物学教授戴维朱利叶斯（David Julius）；宾夕法尼亚大学研究人员弗吉尼娅曼仪李（Virginia Man-Yee Lee）。数学突破奖获得者：芝加哥大学的亚历克斯埃斯金（Alex Eskin）。 2020年获奖情况：生命科学突破奖获得者：华盛顿大学蛋白设计研究所和霍华德休斯医学院科研人员戴维贝克（David Baker）；哈佛大学和霍华德休斯医学研究所科研人员凯瑟琳杜拉克（Catherine Dulac）；香港中文大学医学院副院长卢煜明（Dennis Lo）；美国国家卫生院理查德J尤尔（Richard J. Youle）。基础物理学突破奖获得者：华盛顿大学科研人员埃里克阿德尔贝格尔（Eric Adelberger）、詹斯冈拉克（Jens H.Gundlach）和布莱尼赫克尔（Blayne Heckel）。数学突破奖获得者：帝国理工学院科研人员马丁海尔（Martin Hairer）。 2021年获奖情况：生命科学突破奖获得者：斯克里普斯研究所科学家杰弗里W凯利（Jeffery W. Kelly）；宾夕法尼亚大学科学家卡塔林考里科（Katalin Karikó）和德鲁韦斯曼（Drew Weissman）；剑桥大学科学家尚卡尔巴拉苏布拉尼亚安（Shankar Balasubramanian）、戴维克勒纳曼（David Klenerman）；生物技术公司AlphanososCEO帕斯卡尔迈耶（Pascal Mayer）。基础物理学突破奖获得者：日本东京大学科学家香取秀俊（Hidetoshi Katori）；中国科学院外籍院士叶军（RIKEN Jun Ye）。数学突破奖获得者：日本京都大学数学家望月拓郎（Takuro Mochizuki）。华裔科学家获奖情况自科学突破奖2013年2月正式启动以来，获得过“生命科学突破奖”、“基础物理学突破奖”和“数学突破奖”三大奖项的华裔科学家共有8位，分别为：美国加州大学洛杉矶分校澳籍华裔数学家陶哲轩，2015年数学突破奖获得者，表彰其对调和分析、组合数学、偏微分方程和解析数论做出的诸多贡献。美国加州大学洛杉矶分校澳籍华裔数学家陶哲轩美国国家科学院院士、美国德克萨斯大学西南医学中心分子生物学教授陈志坚，2019年生命科学突破奖获得者，表彰其发现负责感应胞质溶胶内DNA的环鸟苷酸-腺苷酸合成酶（cGAS），了解DNA在细胞中如何激发先天免疫系统。美国国家科学院院士、美国德克萨斯大学西南医学中心分子生物学教授陈志坚中国科学院外籍院士、哈佛大学化学与化学生物、物理学双聘教授庄小威，2019年生命科学突破奖获得者，表彰其发明随机光学重建显微法（Stochastic optical reconstruction microscopy或STORM），超高分辨率显微镜之一。中国科学院外籍院士、哈佛大学化学与化学生物、物理学双聘教授庄小威中国科学院院士、实验高能物理学家王贻芳、加州大学伯克利分校教授、香港大学教授陆锦标及大亚湾核反应堆中微子实验团队，2016年基础物理学突破奖获得者，表彰他们发现和探究中微子振荡，揭开超越标准模型的物理学新领域。中国科学院院士、实验高能物理学家王贻芳加州大学伯克利分校教授、香港大学教授陆锦标美国宾夕法尼亚大学科学家李文渝，2020年生命科学突破奖获得者，表彰其发现TDP43积聚会引致额颞叶痴呆症和肌萎缩性脊髓侧索硬化症，以及α-突触核蛋白在不同细胞中拥有不同形态，且会导致帕金森症和多发性系统萎缩症。美国宾夕法尼亚大学科学家李文渝美国国家科学院院士、中国科学院外籍院士、物理学家叶军，2022年基础物理学奖获得者，表彰其发明超精密的原子钟光晶格钟。美国国家科学院院士、中国科学院外籍院士、物理学家叶军美国国家科学院外籍院士、香港中文大学医学院副院长、分子生物学临床应用专家卢煜明，2021年生命科学突破奖获得者，致力于研究人体内血浆的DNA和RNA，被誉为无创DNA产前检测的奠基人。美国国家科学院外籍院士、香港中文大学医学院副院长、分子生物学临床应用专家卢煜明参考资料1.维基百科. https://zh.wikipedia.org/wiki/Wikipedia2.Breakthrough Prize: About3. https://breakthroughprize.org/News4. 刚刚！2022科学突破奖公布，两位mRNA技术先驱与其他23名学者分享1575万美元奖金.深究科学

时间： 2022-09-23

作者：兆堃
滨松新型三级结构MCP，解决小质谱仪低真空度难题
要说近年来被公认增长最快的分析仪器，毫无疑问非质谱仪莫属。据美国acs网站统计，目前国际上排名前十的仪器厂商中，有七家都在从事质谱仪的研发和生产。就中国而言，对质谱仪的需求也在快速增长。质谱分析是一种测量离子质荷比（质量-电荷比）的分析方法。首先通过电离源将样品中各组分电离成离子，接着在高真空的质量分析器中，在电磁场的作用下主要根据质荷比（带电离子质量/所带电荷的数量）将离子进行分离，使这些离子最后在探测器上产生可以被互相区分的信号。对于不同的组分，电离生成的离子不同——故而质谱可以被用于鉴定样品中的不同组分。质谱仪基本结构示意图质谱技术发展至今已逾百年，质谱工作者们站在彼此的肩头，将一个简单的物理现象在理论和实践上推到如今的高度，使其成为了分析领域最重要的方法之一。目前质谱已不仅是常规化学分析中的重要手段，逐渐也开始被用于生命科学、国土安全、食品安全、临床医学检测和空间技术等热门领域。质谱技术的应用领域越来越广泛但我们知道，传统的实验室台式质谱仪昂贵、耗能、连接气路管道、需要强力真空泵，并且经常需要前端的分离系统，机体往往庞大笨重。若要应用于临床、机场安检、食品安全等原位现场测量场景，仪器必须小型化。不过，说小型化就小型化，你问过真空系统的意见了吗？没错，在小型化质谱仪的设计中，最大的一个挑战在于真空系统。上面在简介质谱仪工作原理的时候，已经提到，“真空”是质谱仪内部工作的必要条件。保持高真空度可以防止分子、离子、电子之间发生碰撞，避免噪声的产生。也就是说，真空度越高，质谱仪的信噪比越好。遗憾的是，真空系统往往比较笨重，小型质谱仪也只能选择小型的真空泵，而泵速的下降，会直接导致系统真空度降低，这会严重影响质量分析器及探测器的正常运行。而从目前的研究结果来看，质谱的背景噪声主要来自探测器端，这源于一个叫离子反馈的作用。常见的质谱探测器（如mcp、电子倍增器/em）都是将离子转化为电子；电子被电场加速、倍增并最终检出。而加速的电子会和残余气体分子碰撞，产生正离子。这些正离子在电场中会反向运动，再次轰击产生电子，这个过程称为离子反馈（ion feedback，ifb）。由于正离子反向运动是需要时间的，所以离子反馈所产生的信号与真实信号本身并不会叠加，反而成为了噪声/杂峰的重要来源。离子反馈（ion feedback，ifb）过程示意图而低真空度下较高浓度的气体分子是客观存在的，因此相比于控制离子生成，更为明智的做法是控制生成离子的走向。但如今四级杆及离子阱质谱仪一般采用的电子倍增器（em），却并没有办法解决这一问题。新探测器技术的出现，成为了质谱仪小型化的一个关键。小质谱仪不要慌，滨松gen3 mcp来了微通道板（mcp）也是应用于质谱仪中的一种常用探测器，特别是tof-ms。但传统的两片结构的mcp（见下图a）和电子倍增器（em）等其他传统质谱探测器一样，残留的气体分子也会发生电离生成正离子，并返回mcp形成离子反馈。不过，滨松最新推出的拥有三级结构的mcp，通过实现控制离子走向的策略，成功解决了上面说到的问题。传统两片结构（bi-planer mode）和滨松最新三级结构（triode mode）mcp的结构和电位对比滨松最新推出的适用于小型质谱仪的gen3 mcp 滨松gen3 mcp采用了这样的结构设计：在mcp出口和打拿极之间加入栅网电极构成三级结构，栅网电极作为阳极（负高压模式下接地），后端打拿极和mcp入口则被设置为等电位，这样残留的气体分子电离生成的正离子会从栅网电极向打拿极运动，并被打拿极俘获。这种三级的创新结构设计可以避免电离正离子返回mcp，从而在源头上解决了暗电流的问题。下图是三级结构的滨松gen3 mcp和传统两级mcp电流输出结构在不同真空度下的实验数据对比。传统两片结构（bi-planer mode）和滨松最新三级结构（triode mode）mcp的实测噪声（暗电流）对比可以明显的看出，在105增益下，传统的2片mcp电流输出型组件在真空度高于10-3pa的情况下即会发生离子反馈。而对于三级结构的gen3 mcp，即使真空度降低到1pa，仍然不会发生离子反馈。凭借在低真空度下的优异表现，加上小巧的尺寸（有效面积直径：14mm），滨松gen3 mcp将会大大释放束缚在质谱仪真空系统上的缰绳，方便开发者开发更为灵活便携、功耗更低、更适合现场使用的小型质谱仪。滨松gen3 mcp有效面积直径：14mm滨松致力于光电技术探索60余年，在质谱探测器的研究也已有40余年的历史，可为质谱应提供mcp、em、离子化光源等产品。2018年我们推出了，并也将继续推出更多应用于质谱的新品（文章底部的小编传送门中，有部分新品链接）。希望通过探测技术的原始创新，从最底层技术出发，稳定而坚实地推动最终质谱应用的发展。

时间： 2018-07-20

作者：滨松中国
大咖领衔共话前沿！首届中国结构质谱前沿论坛线上盛大开幕！
2022年7月12日，由天津市色谱研究会主办，南开大学分析科学研究中心和中山大学药学院共同协办，仪器信息网承办的”首届中国结构质谱前沿论坛”在线上盛大开幕。会议旨在促进我国结构质谱领域科研人员的交流与合作，展示我国在结构质谱领域的最新研究成果，探讨为实现我国追赶全球发达国家结构质谱研究水平做出重点支持的方向。会议将举办5期分论坛，首日邀请了中国科学院大连化学物理研究所张玉奎院士、南开大学化学学院朱守非院长、南开大学邵学广教授、南开大学庞代文教授、威斯康星大学李灵军教授、清华大学瑕瑜教授、南开大学李功玉教授、香港理工大学姚钟平教授、中国科学院大连化学物理研究所李海洋研究员、中国科学技术大学黄光明教授、中山大学李惠琳教授、北京大学白玉副教授、宁波大学化学院唐科奇院长、南开大学张新星研究员等多位业内专家参与特邀讨论环节并进行学术进展报告分享。会议吸引了超过3000人次线上观看并参与互动。会议伊始，由中国科学院大连化学物理研究所张玉奎院士、南开大学化学学院朱守非院长分别致开幕辞，南开大学邵学广教授主持会议。学术报告分享前，威斯康星大学李灵军教授、清华大学瑕瑜教授主持了“中国结构质谱发展现状与未来探讨”的开放讨论环节。多位专家学者就“结构质谱定义”“仪器技术与结构质谱研究的关系”等前沿话题进行了热烈的讨论。接下来的学术报告环节，会议共邀请了香港理工大学姚钟平教授、中国科学院大连化学物理研究所李海洋研究员、中国科学技术大学黄光明教授、北京大学白玉副教授、宁波大学材料化学学院唐科奇教授等6位专家进行了精彩的报告分享。《Protein Mapping and Data Storage:When Peptides Meet Mass Spectrometry》香港理工大学姚钟平教授人类文明的发展史同时也是信息或数据存储技术发展的历史。而现在的时代是一个大数据的时代，每天产生大量的数据，数据增长的速度也越来越快。这些数据通常以数字的形式存储于光电磁装置，不仅需要较大的物理空间，还不能保存很长时间，因此需要开发耐久而且高密度的数据存储新方法。使用分子来存储数据，是解决此问题的一个方案。比起现在广为报道的利用DNA分子结构进行数据存储的DNA存储技术，多肽可供选择的单体更多，包括20种天然氨基酸及其他非天然氨基酸，因而其产生的序列可提供更高的存储密度；而且多肽比现有的存储媒介及DNA耐久性更好，例如在有数百万年历史的古生物样本中，DNA已经完全降解，而多肽及蛋白质仍可被检测到进而进行科学研究。多肽合成工业也已很成熟，可以以较低价格合成各种各样的多肽；过去二十多年蛋白质组学的迅猛发展，带动了相关硬件和软件的日趋完善，现有质谱技术已可在短时间内对很低量的成千上万条多肽进行测序，这些为利用多肽序列存储数据创造了条件。报告主要介绍了姚钟平与合作团队共同开发的新方法，使用多肽和串联质谱（MS/MS）来存储和读取数据。《高分辨离子迁移谱技术及应用》中国科学院大连化学物理研究所李海洋研究员近年来,随着大气压样品进样、离子源和离子操控等技术的发展,离子迁移谱已从化学战剂、爆炸物和毒品的专用检测技术迅速发展成为一种在分析领域广泛使用的技术。随着检测对象越来越复杂,对离子迁移谱的分析性能提出了更高要求,特别是对超高分辨能力的需求。报告围绕结构质谱学与离子迁移谱IMS、IMS仪器的研发及应用等方面的内容进行了深入介绍。《Direct Mass Technology 在超大分子结构分析中的应用》赛默飞黄敏博士电荷检测质谱（CDMS）通过同时测量单个离子的质荷比和电荷数，进而计算获得离子质量m。因此，相较于其他类型质谱，CDMS技术的关键是如何准确地测量单个离子的电荷。目前，电荷检测质谱技术多是能够自行开发质谱仪器硬件，或自行改编FTMS软件的专家才能进行这样的实验。基于此2022年的ASMS会议上，赛默飞重磅推出了直接分析质谱技术（DMT），并将其结合在了Orbitrap上，这使得超大分子量的复杂蛋白的直接质谱检测成为了可能。报告重点介绍了赛默飞直接分析质谱技术在超大分子结构分析中的应用情况。《单细胞代谢组：原位质谱新技术及其应用》中国科学技术大学黄光明教授近年随着分析手段的不断提高，人们越来越意识到细胞具有个体差异性。即使在相同条件下培养的同源细胞，其在形态、基因表达水平以及生长特性上都存在一定的差别。如果能够在细胞层面上对参与生理病理过程的一些关键生物化学成分进行描述，将有助于了解细胞实现可塑性和稳定性的特定机制。单细胞代谢组学为解答这些问题提供了很好的机会，但对于单细胞代谢组学来说，单细胞样品制备、鉴定细胞内代谢产物和数据分析都需要复杂的技术和模型来进行，相关分析方法也面临许多挑战。报告介绍了黄光明课题组针对分析方法面临的挑战，建立的单细胞质谱分析平台，具有可分析单细胞、高通量、可同时获得化学和生物信息等特点，并进一步介绍了其团队针对单细胞代谢物的质谱应用分析进展。《常压离子化质谱新技术及其生物检测新应用》北京大学白玉副教授常压质谱由于其高通量、敞开环境下取样、基质的耐受性强等特点，为复杂体系高通量、原位分析提供了可能和机遇。报告介绍了白玉课题组基于常压电离质谱开展的研究进展，包括构建了多种新型常压离子源仪器部件，解决了小分子化合物分析的离子源通用性难题，为生物标志物分析奠定基础。不仅如此，其团队也构建了多维度有机质谱流式分析平台，实现了单细胞中蛋白质和代谢物多维分子信息的同时获取，为肿瘤细胞精准分型及肿瘤耐药等研究提供创新性工具。《高分辨离子迁移谱质谱与分子结构解析应用的探究》宁波大学材料化学学院唐科奇院长/教授离子迁移谱根据其操作原理可分为弱电场离子迁移谱(IMS)和高场非对称离子迁移谱(FAIMS)两大类，它和质谱(MS)的联用有效的克服了单一质谱技术难以测定分子结构的问题。由于离子迁移谱质谱这项复合技术具有同时确定分子成分和结构的能力，目前已被各大国际质谱公司采用并开发出了相应的商用产品，在分析化学，生命科学等多个领域里得到了广泛应用。报告介绍了各类迁移谱技术的发展和机理，并探讨了如何实现超高分辨率离子迁移谱的技术和方法，包括将高场非对称离子迁移谱和弱电场离子迁移谱复合组成二维迁移谱的可行性。首届中国结构质谱系列线上会议的第一期分论坛成功举办，下一期分论坛将于7月19日（周二）13:30-17:30召开，届时敬请关注。点击下方链接报名参会！点击了解会议：https://www.instrument.com.cn/webinar/meetings/structuralmass2022.html

时间： 2022-07-12

作者： ONE
沃特世在京成功举办质谱技术在蛋白表征及高级结构中应用技术研讨会
沃特世公司（纽约证券交易所代码：WAT）近日在北京成功举办了以“质谱技术在蛋白表征及高级结构中应用”为主题的技术研讨会，吸引了60余位来自国家蛋白质组中心、中国食品药品检定研究院、中国科学院、清华大学、北京大学、军事医学科学院、中国农业科学院等知名高校、科研院所、分析测试平台及生物制药企业等相关领域的研究人员参加了会议。研讨会的主旨为 “提升国内蛋白表征领域对蛋白高级结构研究的认知”，涵盖三大议题：蛋白药物深度结构表征所需要的质谱技术与生物信息学软件、氢氘交换（HDX）技术及IMS在结构生物学特别是表位学研究、蛋白质相互作用研究领域的最新进展及SONAR技术在蛋白质鉴定和非标记定量蛋白质组学研究中的进展。会上国际知名学者、日本大阪大学副教授Susumu Uchiyama博士指出，氢氘交换质谱（HDX MS）逐渐成为蛋白质高级结构研究不可或缺的技术，并介绍了氢氘交换质谱技术及其在表位学和蛋白相互作用研究上的具体应用。同时对其最近发表在Nature Communication上的题为《Haem-dependent dimerization of PGRMC1/sigma-2 receptor facilitates cancer proliferation and chemoresistance》论文的研究成果进行了汇报，获得了与会科研学者的一致高度评价。日本大阪大学副教授Susumu Uchiyama博士做大会报告沃特世（Waters® ）总部制药业务部高级市场拓展经理Asish Chakraborty博士对生物制药行业普遍关注的宿主蛋白残余测定进行了报告演讲，并介绍了使用通用型UPLC/MS分析对生物治疗性蛋白质中的HCP进行全面鉴定和定量。此分析方法采用在线二维液相色谱法分离多肽，然后利用高分辨率、高质量准确度的质谱仪进行蛋白质鉴定和定量。另外，Chakraborty博士对当前氢氘交换质谱方案的新进展也作了更新介绍。沃特世公司总部Asish Chakraborty博士做大会报告来自沃特世亚太区的高级科学家陈熙博士作了题为“非变性质谱技术及IMS行波离子淌度质谱技术在蛋白质高级结构研究上的应用进展”的精彩报告，介绍了行波离子淌度高分辨质谱技术在生物药分析上的最新应用进展，成熟的行波离子淌度分离技术为常规高分辨质谱增加了更多一个维度的分离能力，在蛋白质药物常规结构表征如二硫键错配、氢-氘交换质谱技术进行蛋白质药物高级结构和动态变化研究以及HCP(宿主细胞蛋白)残留的鉴定和定量上发挥着重要作用。沃特世亚太区高级科学家陈熙博士做大会报告沃特世中国应用科学家殷薛飞博士作了 “最新DIA质谱技术-SONAR在非标记定量蛋白质组学研究中的应用”的报告。殷博士介绍的 SONAR数据采集模式于今年9月发布，科学家们只需执行一次进样即可完成更准确的定性和定量分析，对复杂样品中脂质、代谢物和蛋白质的定量和鉴定，可免去采用MS/MS方法分析时通常需要额外进行方法开发的麻烦。大会还邀请了来自美国Genentech的蛋白质化学部科学家甘雨田博士分享了她运用蛋白质组学思路进行生物药物研究开发的思路与实践，甘博士还介绍了她今年8月发表于Nature Biotechnology上的ISDetect快速自动蛋白末端质谱检测法，引起与会人员的强烈兴趣。会议最后，沃特世中国生物制药高级经理宋兰坤女士作了“LC/MS平台化方案助力生物药研究开发”的报告，并对会议进行了总结。宋经理说：“质谱技术是蛋白质研究中不可取代的工具，其在蛋白质常规表征及高级结构研究中均有很好的应用方案及研究文献, 为揭示生命科学的奥秘发挥着越来越重要的作用。作为全球生物制药领域解决方案顶尖供应商，沃特世公司为生物药物产业界及蛋白质研究相关科学领域提供先进的仪器和技术。希望本次会议的议题可以激发与启迪科研工作者的思路，为生物药物产业的从业人员搭建一个学术讨论与经验分享的平台。会议同期展出的蛋白科学研究先进生物技术墙报

时间： 2016-11-24

作者： Waters
李惠琳团队成果：非变性自上而下质谱用于蛋白及其复合物结构表征
大家好，本周为大家分享一篇李惠琳课题组最近发表在Mass Spectrometry Reviews上的综述，Native top‐down mass spectrometry for higher‐order structural characterization of proteins and complexes1。结构生物学的快速发展极大地促进了蛋白结构表征工具的开发。其中，基于质谱的分析方法凭借其快速、灵敏、高通量的优势从中脱颖而出。相比于原子水平的高分辨结构表征工具如X-射线晶体学、核磁共振（NMR）、冷冻电镜（Cryo-EM）等，基于质谱的分析方法能够有效地补充蛋白动力学结构变化的信息，并且不受蛋白纯度、分子量大小的限制。而相较于低分辨的蛋白表征工具如圆二色光谱、动态光散射等，基于质谱的分析方法能够提供更高的肽段或残基水平分辨率，获取额外的序列、翻译后修饰（post‐translational modifications, PTMs）、局部空间结构等信息。常见的结构质谱包括：氢氘交换质谱（hydrogen‐deuterium exchange MS, HDX-MS）、交联质谱（cross‐linking MS, CX-MS）、表面标记质谱（covalent labeling MS, CL-MS）等。已有相当多的文献对这些方法进行了详细的介绍2,3，在此不再赘述。而此篇综述将重点介绍非变性至上而下质谱（native top‐down MS, nTDMS）在蛋白及其复合物结构表征中的应用。在过去的十年，非变性质谱（native MS, nMS）特别是nTDMS发展迅速。nMS作为一个桥梁将蛋白质组学与结构生物学相连，其保留非共价相互作用的特性使其广泛用于蛋白复合物四级结构表征，如推断亚基组成、化学计量比、亚基排布等。然而，对于一些深层次的结构信息，如氨基酸序列、PTMs、配体结合位点、亚基结合界面等，仅靠单一的nMS是无法获取的。与之对应的，变性条件下的自上而下质谱（TDMS）能够在完整蛋白水平下直接获得序列以及PTMs信息，虽然有助于PTM的准确定位以及蛋白、蛋白异质体（Proteoform）的鉴别，但却丢失了涉及非共价相互作用的高级结构信息。受限于质谱仪器的发展，在早期，nMS与TDMS通常在两个独立的实验中进行，随着质量分析器以及多种活化/碎裂方式的开发，nMS与TDMS的能够有效的结合，充分发挥各自的优势，在实现多层次结构信息获取的同时，也在不断挑战更加复杂的生物体系，如核糖体、膜蛋白、内源蛋白混合物等。实验设计nTDMS已成为表征蛋白质和复合物的初级到高级结构的重要工具。随着蛋白质样品的大小和复杂性的增加，用于nTDMS的仪器不仅需要符合某些特定标准，还需要不断提高其性能以满足这些增加的需求。nTDMS分析中几个关键的步骤包括：样品前处理、ESI离子化、二级碎裂、质量检测以及数据处理。样品前处理为了维持蛋白的自然状态，通常需要在生理环境中进行nMS分析。然而，缓冲液中的非挥发性盐会产生大量盐簇并与蛋白离子形成非特异性加合物，从而抑制离子信号、降低检测的准确度和灵敏度。因此，样品前处理过程中最重要的环节就是除盐。然而适当的离子强度有助于维持蛋白的三维结构，所以通常的步骤是对蛋白进行缓冲液置换，将蛋白置换至醋酸铵或碳酸氢铵等挥发性盐溶液中。目前已开发了多种在线或离线的除盐方法，详细内容的可在综述原文中查看，此处不再赘述。除了使用非挥发性缓冲盐，减小ESI喷针孔径大小也可以提高系统耐盐能力。碎裂/活化方式二级碎裂方式是实现nMS到nTDMS的关键。常见的活化方式按照原理可分为三类：基于碰撞（CID, SID）、基于电子（ECD, ETD, EID等）以及基于光子（UVPD, IRMPD）的活化/碎裂方式。值得注意的是，CID与IRMPD都属于慢加热的活化方式，能量累积的非常慢，以至于在发生碎裂之前已经进行了能量重排，一些较弱的或者不稳定的键会优先发生断裂，最终导致非共价相互作用在活化的过程中被破坏。而SID、ExD与UVPD则属于快加热的活化方式，碎裂发生在能量重排之前，非共价相互作用得以在这一过程保留下来，碎片化程度受到非共价相互作用的限制，因此可被用于表征蛋白的空间结构。此外，将多种活化方式的结合或与离子淌度技术串联也是获取多层次结构信息的关键。质量检测与变性条件下的质谱分析相比，蛋白复合物在天然环境下通过电喷雾电离产生的电荷数相对较少，因此需要具有较大m/z 范围的质量分析仪（高达m/z = 20,000 Da甚至更高）。最初，nMS分析高度依赖基于飞行时间（time of fight, TOF）质量分析器，因为TOF具有理论上无限的m/z范围。近年来，高分辨质量分析器如轨道阱（Orbitrap）和傅里叶变换离子回旋共振（FTICR）为生物大分子的nTDMS分析带来了新的活力。在综述中，我们简要介绍了每种质量分析器的最新进展，并重点强调了FTICR和Orbitrap在nTDMS分析中的发展和应用。数据处理除了基本的硬件设施，配套的数据处理软件也十分重要。nTDMS数据处理流程通常包括以下4个步骤：同位素峰选取、去卷积、数据库搜索、验证和可视化。正文中，我们对每个步骤进行了简要描述，并重点介绍用于数据库搜索和异质体鉴别的软件。多层次结构信息的获取得益于多种活化/碎裂方式的开发，nTDMS分析可同时获得多层次的结构信息（图1）。主要有以下两种策略：第一种策略，完整蛋白复物（MS1）首先被CID或SID碎裂至亚基（MS2），亚基可进一步碎裂肽段（MS3），在MS1及MS2中可获蛋白复合物结合计量比、拓扑结构、蛋白异质性等信息，在MS3阶段则可获取蛋白序列、PTMs定位以及异质性来源等信息。第二种策略则是完整蛋白复合物（MS1）直接被UVPD或ExD碎裂成肽段（MS2），受益于UVPD以及ExD独特的碎裂方式，发生碎裂的区域主要位于蛋白复合物的表面可及区，而未发生碎裂的区域可能位于蛋白复合物的核心区域或参与亚基相互作用界面。不同的碎裂情况反映不同的空间结构，带有配体的肽段碎片可以用于配体结合位点的定位。综述中，我们详细阐述了如何利用nTDMS获得蛋白复合物的多层次结构信息以及如何将碎片信息与结构信息相关联。图1. nTDMS可提供的多维度结构信息复杂生物体系中的应用蛋白质的空间结构决定了其生物功能，而蛋白质-蛋白质/配体相互作用是大多数生物进程的基础。通过突变、翻译后修饰、或者与金属、小分子配体、蛋白质、DNA、RNA等分子发生共价或非共价的相互作用，蛋白质功能在活细胞中不断受到调节。随着MS仪器、方法的不断开发和数据处理软件的逐渐成熟，nTDMS已被广泛应用于各种生物系统，从小蛋白质、蛋白质-配体复合物到大分子组装体，如膜蛋白、蛋白酶体、核糖体、病毒衣壳，甚至是内源性蛋白混合物。它们中的许多都是极具挑战性的体系，即便是采用NMR、X-射线晶体学或Cryo-EM等生物物理方法分析也是非常困难的。因此，来自nTDMS的见解对于理解这些蛋白质和复合物至关重要。在这里，我们总结nTDMS在所有生物体系中的应用实例，旨在全面了解nTDMS在解决生物学问题方面的潜力。小蛋白的结构表征和区分最初，nTDMS主要用于50 kDa以下单体蛋白的结构表征，大部分的研究都是围绕蛋白质气相结构与溶液相结构对比展开的。根据nTDMS的碎裂情况，推断蛋白的气相空间结构，并与NRM获得的溶液结构进行对比。此外，如果在二级碎裂前增加离子预活化有助于蛋白分子的展开，以便研究蛋白气相展开路径以及获取蛋白质内部空间结构信息。得益于碎片离子对蛋白空间结构的高度敏感性，nTDMS还被用于区分不同蛋白亚型、蛋白突变体的结构差异。蛋白-小分子配体相互作用随后，nTDMS应用到了蛋白-配体复合物中，不同的配体类型适合不同的活化/碎裂方式，除了金属离子、RNA/DNA等以静电作用为主的蛋白配体能够在CID活化时存活，大部分复合物的碎裂都需要选择ECD或UVPD等方式。nTDMS可用于蛋白-配体结合计量比、亲和力、结合位点、作用机制、结构动力学/变构效应的研究。它是一种强大的结构表征工具，其在抑制剂筛选、酶催化监控、RNA-蛋白质互作机制的应用实例在正文中已有详细的介绍。蛋白-蛋白相互作用随着仪器设备的快速发展，nTDMS已应用到更大的体系如蛋白-蛋白复合物，通过组合不同的活化/碎片化技术，在一次实验中可以获得多层次的结构信息。nTDMS可以帮助区分不同的蛋白异质体，并在完整复合物、亚基、肽段三个水平上确定异质性的来源。蛋白的异质性与其生物学功能密切相关，通过调整蛋白的异质性可以实现蛋白功能的转变，具体的应用案例已在正文详细介绍。除此之外，nTDMS还可以用作蛋白-蛋白复合物结合界面、气相展开以及深层次结构探索。治疗性抗体和抗原-抗体复合物在过去的几十年中，治疗性抗体已成为最受欢迎的候选药物之一，它们的高特异性和低副作用促进了治疗性抗体的快速增长。在综述中，我们还详细地介绍了nTDMS在治疗性抗体和抗原-抗体复合物体系中的应用。nTDMS可用于抗体可变区的测序、具有不同药物计量比（DARs）的抗体耦联药物的结构表征、以及抗体-抗原复合物中互补决定区及抗原表位区的鉴别。膜蛋白无论是对于传统的结构表征工具如：X-射线晶体学、NMR还是nTDMS，膜蛋白的结构表征一直以来面临着诸多困难。膜蛋白具有低丰度以及低溶解性等特点，最常见的方法是利用与nMS兼容的膜模拟物如：去污剂胶束、纳米微盘等去溶解膜蛋白，在nTDMS分析时再将膜蛋白从胶束中释放出来，释放出的蛋白可在nTDMS中进一步碎裂获取结构信息。具体的实验流程和应用实例可在综述正文中查看。大分子组装体正文中，还介绍nTDMS在极具挑战性的大分子组装体如：核糖体、蛋白酶体、病毒衣壳中的应用实例，这些生物体系普遍存在的问题是分子量非常大（接近MDa），且具有较高的异质性。对这些大分子机器进行nTDMS分析要求仪器具有较高的质量范围以及分辨率。大分子机器的结构表征充分说明nTDMS方法无论在深度还是广度上都有极大的提升。Native top-down MS蛋白质组学值得注意的是，当质谱前端结合非变性分离技术，如native GELFrEE，尺寸排阻色谱，毛细管区带电泳，离子交换色谱等，nTDMS还可以在靶向模式或发现模式下用于复杂蛋白质组的高通量分析，如内源性蛋白混合物。nTDMS分析最大的优势在于它能区分不同的蛋白异质体，并对每种蛋白异质体进行结构表征，这是其他在肽段水平进行分析的结构质谱法如：HDX-MS, CL-MS所无法实现的。总结与展望总之，在这篇综述中我们重点介绍了nTDMS的最新进展和在不同生物体系中的应用，强调通过nMS与TDMS结合可以获得额外的多层次结构信息。新技术的出现以及仪器的进步使nTDMS能够应用于结构生物学中日益复杂的生物样本体系，包括蛋白质配体、多聚蛋白复合物、大分子组装体和内源性复合物。尽管这样，nTDMS分析仍面临着的挑战，包括但不限于前端的样品分离、离子化、去溶剂化、高质荷比分子传输、异质性样本的分析以及软件的开发。未来nTDMS将与其他的一些结构表征方法相结合以获取更加全面的结构信息。正文中对未来发展趋势进行了讨论并提到了其他一些令人兴奋的创新技术如：基于MALDI离子源的质谱成像技术用于蛋白原位分析、电荷检测质谱（CDMS）用于异质性样本分析，多重技术的结合将为蛋白质复合物的nTDMS研究开辟新的道路。我们希望这篇综述能让读者更好地理解nTDMS提供的独特结构信息，并推动该方法的广泛应用。撰稿：刘蕊洁编辑：李惠琳原文：Native top‐down mass spectrometry for higher‐order structural characterization of proteins and complexes. 参考文献1.Liu RJ, Xia SJ, Li HL. Native top‐down mass spectrometry for higher‐order structural characterization of proteins and complexes. Mass Spec Rev. 2022 e21793. https://doi.org/10.1002/mas.217932.Britt HM, Cragnolini T, Thalassinos K. Integration of mass spectrometry data for structural biology. Chem Rev. 2022 122(8):7952-7986. 3.Liu XR, Zhang MM, Gross ML. Mass spectrometry-based protein footprinting for higher-order structure analysis: fundamentals and applications. Chem Rev. 2020 120(10):4355-4454.

时间： 2022-07-04

作者： ONE
利用自上而下质谱对蛋白质高阶结构和动力学进行时间分辨表征的微流控平台
大家好，本周为大家分享一篇发表在Analytical Chemistry上的文章，Microfluidic Platform for Time-Resolved Characterization of Protein Higher-Order Structures and Dynamics Using Top-Down Mass Spectrometry [1]，文章的通讯作者是北京大学生物医学前沿创新中心的王冠博教授和中国科学院深圳先进技术研究院的门涌帆副研究员。　　蛋白质的高阶结构和动力学特性对理解蛋白质的生物学功能和揭示其潜在机制至关重要。自顶向下质谱法(Top-down MS)在完整蛋白水平和肽段碎片水平都能获得结构信息。非变性Top-down MS可以分析蛋白质复合体的结构以及完成亚基鉴定和修饰分析。自顶向下氢/氘交换质谱(Top-down HDX MS)为构象或结合界面分析提供了高空间分辨率，并实现了构象特异性表征。微流控芯片可以为这些质谱工作流程的前端反应提供优越的平台。然而，目前大多数质谱微芯片装置是为Bottom-up或Top-down蛋白质组学设计的。本文中，作者提出了一种用于蛋白质高阶结构和动态Top-down MS分析的芯片设计策略。它适用于时间分辨的非变性质谱和HDX质谱，该设计旨在有效电离完整的蛋白质复合物，灵活控制多种反应物流动，并在较大的流速范围内精确控制反应时间在亚微升/分钟。本文通过对单克隆抗体、抗体-抗原复合物和共存蛋白构象等体系的分析来验证该装置的性能。　　TDK-MS(Top-down and kinetic MS)芯片的结构如图1A所示，该方法可以有效电离完整的蛋白质，包括单克隆抗体(mAb)和抗体-抗原复合物(图1 B, C)。　　图1. 完整蛋白质和蛋白质复合体在非变性条件下的高效电离　　虽然分析蛋白质组合化学计量学和监测构象变化需要保持蛋白质高阶结构和非共价相互作用的完整性，然而为了推导结构信息或在串联MS中展开蛋白质以提高碎裂效率，往往需要不同程度的变性来产生亚复合体，因此变性剂的浓度和变性的时间对变性程度至关重要。本文中，作者采用交错人字微结构(Herringbone microstructure, HM)(图2A, B)，并对其性能进行了评估(图2C−E)。如此高的混合效率为进一步微型化芯片混合模块提供了可能。在监测Mb的变性时，作者使用TDK-MS芯片和商用混合三通管平行混合holo-Mb溶液(5 μM)与乙腈(ACN)，并比较它们在混合比例变化时的响应(图2F)。TDK-MS芯片在非变性和变性条件之间切换的快速响应通过NIST mAb的变性得到了证明，在向NIST mAb溶液中添加甲酸后，响应时间小于5分钟(图2G)。　　图2. 高效混合和快速响应的流体控制　　微芯片的灵活通道设计允许引入独立控制的溶液。例如，尽管酸和有机溶剂都能诱导变性，但这两种变性剂同时存在时，对变性途径的影响是不同的。Mb和Hb是血红素蛋白，其中血红素基团分别非共价连接在1条多肽链和4条非共价组装链上，因此这是研究共存复合体解离动力学和亚基构象变化的理想模型。将5 μM holo蛋白溶液与ACN和FA按一定的混合比例依次混合，可以通过解离产物的出现和蛋白质离子电荷态分布的变化来表征复杂的解离和蛋白质的展开。在固定ACN浓度下，随着FA浓度从0.01增加到0.3% (v/v)，依次观察到的主要现象是血红素丢失、apo-Mb展开以及折叠的holo-Mb转化为展开的apo-Mb(图3A)。相比之下，在FA浓度恒定的情况下，当ACN从1增加到50%时，Mb主要表现为血红素损失，只有中等程度的apo-Mb展开，这可能是由于展开的部分迅速聚集(图3B)。　　图3. (A)增加FA浓度，固定ACN浓度和(B)增加ACN浓度，固定FA浓度时获得的Mb和Hb的质谱图。　　在HDX MS检测中，TDK-MS芯片提供了快速和有效的氘代及淬灭，精确控制HDX反应时间，并在2H-标记形式下高效电离完整蛋白质(图4)。　　图4. 2H标记完整的(A)Mb、(B)Hb α亚基和(C)Hb β亚基在不同反应时间下的HDX质谱图　　由于过大的流速不利于电离效率，并且有可能会增加堵塞或流动中断的风险，因此流速应保持在最佳范围内，这又限制了混合通道中HDX时间的可调节范围，从而影响了HDX动力学分析的灵活性。为了解决这一问题，作者设计了一个具有多个不同长度反应通道的混合模块，在不更换芯片的情况下，除了改变流速外，还可以通过通道切换在更大范围内调整反应时间。在原型芯片中，5个不同长度的通道可以在对蛋白质电离和流动稳定性都最优的流速下，产生从几秒到几分钟不等有效的HDX时间(图5)。　　图5. Top-Down HDX MS 分析　　本文中作者开发的策略将有利于生物大分子结构的精细分析，并有助于质谱微芯片的方法开发。

时间： 2022-10-20

作者： ONE
探索界面相互作用：大连化物所发布结构质谱实验手册
近日，中国科学院大连化学物理研究所生物技术研究部生物分子结构表征新方法研究组研究员王方军团队发布了表征蛋白质-纳米材料界面相互作用精细结构的赖氨酸反应性分析-质谱（LRP-MS）实验手册。　　微/纳米材料在生命科学、医药健康、生物催化等领域广泛应用，探讨蛋白质与材料之间的界面相互作用分子机制对生物医用材料的安全性评价、纳米药物的毒性评估和理性设计、生物-无机功能杂合体的改性和催化活性提升等具有重要意义。然而，现有光谱学等方法只能表征材料引起的蛋白质结构整体变化情况，蛋白质-材料界面相互作用分子细节的探测面临挑战。　　赖氨酸残基通常定位于亲水性蛋白质表面，其侧链伯氨基的化学标记反应性取决于其溶剂可及性和微环境非共价相互作用。当蛋白质表面与微/纳米材料结合时，结合界面上赖氨酸的溶剂可及性和反应性均随之降低。因此，王方军等提出了赖氨酸的反应性变化是探测蛋白质-微/纳米材料复合体中蛋白质定位方向、相互作用序列区域、关键结合位点、材料结合引起蛋白质结构变化的有效指标。该团队发展了在蛋白质—微/纳米材料复合体活性和变性条件下的两步同位素二甲基化标记的标准化策略，结合质谱定量分析实现蛋白质上赖氨酸反应性的全面分析，研究通过材料结合前后赖氨酸标记反应性的显著性差异确定蛋白质-材料的界面序列区域和关键位点。　　王方军团队长期从事生物大分子结构质谱尖端仪器和创新方法研究，所发展的LRP-MS策略近年来已应用于蛋白质-蛋白质、蛋白质-小分子、蛋白质-微/纳米材料的界面相互作用分子机制解析，取得了系列研究进展。　　近日，相关研究成果以Structural Characterization of the Protein-Material Interfacial Interactions Using Lysine Reactivity Profiling-Mass Spectrometry为题，发表在《自然-实验手册》（Nature Protocols）上。研究工作得到国家重点研发计划、国家自然科学基金和大连化物所创新基金等的支持。大连化物所发布蛋白质-纳米材料界面相互作用的结构质谱表征实验手册

时间： 2023-08-14

作者：情绪波动
基于碰撞活化解离技术的非变性自上而下质谱用于蛋白复合物高级结构解析
大家好，本周为大家分享一篇最近发表在 Journal of the American Chemical Society上文章，Native Top-Down Mass Spectrometry with Collisionally Activated Dissociation Yields Higher-Order Structure Information for Protein Complexes1。该文章的通讯作者是美国加利福尼亚大学洛杉矶分校的Joseph A. Loo教授。非变性质谱(native MS，nMS)通常用于揭示蛋白及其复合物的分子量大小和化学结合计量比，但若要进一步阐明深层次的结构信息，则需要与串联质谱结合，即非变性自上而下质谱（nTDMS），通过对母离子进行二级甚至多级碎裂可获取额外的序列、翻译后修饰(PTMs)以及配体结合位点信息。此外，nTDMS能以构象敏感的方式断裂共价键，这样就可以从碎片模式推断出有关蛋白高级结构的信息。值得注意的是，使用的激活/解离方式会极大地影响得到的蛋白质高阶结构信息。电子捕获/转移解离(ECD、ETD或ExD)和紫外光解离(UVPD)等快加热的活化方式因其能够在保留蛋白整体结构的情况下先对共价键进行断裂而被广泛应用于nTDMS分析中。而慢加热的活化方式如碰撞活化解离(CAD)会在断键前进行能量重排，导致一些较弱的非共价相互作用先发生破坏，例如：亚基的释放和展开，因此对高阶结构表征没有帮助。而此次Joseph A. Loo课题组的研究结果显示使用基于orbitrap的高能C-trap解离(HCD)同样也可以从天然蛋白复合物的中直接获得序列信息，并且碎片模式可以提供有关其气相和溶液相高阶结构信息。此外，CAD还可以生成大量的内部碎片(即不包含N-/ C-端的片段)用于揭示蛋白质复合物的高阶结构。为了研究蛋白复合物HCD的碎裂化情况，作者比较了酵母来源的乙醇脱氢酶四聚体（ADH）在Complex-down MS (psedo-MS3)和nTDMS两种分析策略下的碎片模式。如图1所示，在Complex-down MS分析中，ADH经源内解离（ISD）释放出单个亚基，该亚基经HCD碎裂生成肽段b/y离子。而在nTDMS分析中，肽段离子则可以从复合物中直接获得。如图2（上）所示，在Complex-down MS分析中总共获得了24个b离子和18个y离子，能够实现11.8%的序列覆盖率。近乎相等数目的b、y离子表明Complex-down MS分析中释放的ADH亚基N-端和C-端均具有较高的表面可及性，即亚基发生去折叠。此外，碎片模式也揭示了N-端乙酰化、V58T突变体以及Zn2+结合位点等信息。相比之下，nTDMS分析则更反映ADH的高阶结构，如图2（下）所示，在nTDMS分析中主要检测到b离子，几乎没有亚基信号，说明b离子是直接由复合物中共价键断裂产生的。ADH的nTDMS分析共产生了60个N-端b离子和3个C-端y离子（17.6%序列覆盖率）。由HCD产生的大量N端碎片类似于ADH基于电子和光子解离技术产生的nTDMS产物。将这些片段映射到ADH的晶体结构上可以看出，N端区域比C端区域更容易暴露于溶剂，而C端区域主要形成复合物的亚基-亚基界面。ADH的碎片离子中来源亚基界面断裂的仅占8%，大部分碎裂都发生在溶剂可及的N-端。图1 Complex-down MS和nTDMS分析流程图1 Complex-down MS（上）和nTDMS（下）碎片模式比较ADH的nTDMS分析充分展现了CAD在蛋白复合物高阶结构表征上的潜力，为了进一步验证，作者还选择了其他的蛋白复合物进行实验，如醛缩酶同源四聚体、谷胱甘肽巯基转移酶A1二聚体、肌酸激酶二聚体等。这些蛋白复合物在n-CAD-TDMS分析中都产生了与结构对应的碎片离子，说明基于CAD的nTDMS分析是具有普适性。当然也会存在一些例外，膜蛋白水通道蛋白(AqpZ)同源四聚体在nTDMS分析过程中产生了高丰度的单体亚基、二聚体、三聚体信号，这应该归因于AqpZ四聚体亚基之间的弱疏水结合界面，导致亚基的释放发生在共价键断裂之前，因此产生的b/y离子无法反映蛋白复合物的空间结构。相较而言，以盐桥为主要稳定作用的蛋白复合物，如ADH、醛缩酶等则更容易在nTDMS分析中产生肽段碎片离子。此外，基于CAD的nTDMS分析中还发现了大量的内部碎片，ADH产生的大部分内部碎片来源于溶剂可及区。尽管内部碎片难以辨认，但可以大幅度提高序列覆盖率，提供更精细的结构信息。一个从小分子裂解衍生到大分子解离的假设是，在实验的时间尺度内，由碰撞引起的激活是完全随机化的，并以沿着最低能量途径引导碰撞诱导的解离。然而，这些假设没有考虑到熵的要求，缓慢重排可能是释放亚基所必须的，例如重新定位盐桥将一个亚基与其他亚基相连。在碰撞次数或每次碰撞能量不足以碰撞出能释放亚基的罕见构型的情况下，以释放出更小的多肽碎片(具有更少的约束) 代替重排可能具有更高的竞争性。总之，本文展示CAD在nTDMS分析中的应用，无需基于光子或电子的活化方式，CAD可直接从蛋白复合物中获得肽段离子，并且该碎裂离子能够反映蛋白复合物的空间结构。撰稿：刘蕊洁编辑：李惠琳原文：Native Top-Down Mass Spectrometry with Collisionally Activated Dissociation Yields Higher-Order Structure Information for Protein Complexes参考文献1. Lantz C, Wei B, Zhao B, et al. Native Top-Down Mass Spectrometry with Collisionally Activated Dissociation Yields Higher-Order Structure Information for Protein Complexes. J Am Chem Soc. 2022 144(48): 21826-21830.

时间： 2023-02-24

作者： ONE
盘点：超高效液相色谱应用案例及市场预测
p 　　在当前的中国超高效液相色谱仪市场上，主流厂商主要是沃特世、安捷伦、岛津、赛默飞、日立高新等外国品牌。国产品牌超高效液相色谱仪主要是上海伍丰的产品，但是市场占有率还比较低。 /p p 　　当前，超高效液相色谱在科研及工业领域都有着广泛的应用，第十七届北京分析测试学术报告会暨展览会(BCEIA2017)召开期间，仪器信息网邀约中国超高效液相色谱仪市场的部分主流厂商，汇总了各品牌超高效液相色谱仪主流产品的技术特点和应用案例，并请各厂商预测了未来一段时间内超高效液相色谱仪的市场热点及潜力。本文所归纳的是各产品的应用案例及市场预测情况( strong 下文按约稿回复先后排序 /strong )。 /p p 　　 strong span style=" color: rgb(0, 112, 192) " 一、各品牌超高效液相色谱仪应用案例 /span /strong /p p 　　 span style=" text-decoration: underline " strong 日立高新 /strong /span 与中科院大连化物所建立了合作应用实验室，主要使用日立超高液相系统进行水解蛋白的肽图法研究，研究的难点在于如何高分辨率地快速分离水解蛋白的各个肽段，通过日立ChromasterUltra Rs超高效液相色谱仪与日立新开发的色谱柱(LaChromUltra II ODS C18，填料粒径1.9 µ m，长250 mm)相配合，可在30min内实现对所有BSA水解肽段的分析，实现了高分辨率地快速分离分析，解决了客户难题。另外，还可用UHPLC对茶碱中的微量有关物质进行的高灵敏度分析的研究，使用日立ChromasterUltra Rs超高效液相色谱仪，配备65mm高灵敏度流通池，可对茶碱中0.001%的有关物质的进行痕量检测，进而实现高灵敏度分析检测。 /p p 　　 span style=" text-decoration: underline " strong 赛默飞 /strong /span 则主要涵盖制药(奈韦拉平0.008%的杂质与主成分一起分析)、食品(快速高效同时检测乳制品中的痕量维生素A/D/E)、环境(在线故相萃取检测环境水中的微囊藻毒素)、化工(电雾式检测器检测化工品中无紫外吸收、无荧光化合物)等领域在满足各种常规检测的基础上，还可完成定制化研发工作及高通量监测工作。特异型、针对性的检测手段及质谱兼容设计可满足各种检测需求。 /p p 　　 span style=" text-decoration: underline " strong 安捷伦 /strong /span 可帮助精细化工客户，通过方法转换和优化，缩短分析时间至原来的十分之一，大幅提升中控样品的检测速度，提高实验室效率。另外，针对食品和制药行业对仪器利用率较高的需求，安捷伦仪器还可在实验室无人值守的情况下自动切换色谱柱及流动相等，将仪器利用率大幅提高的同时，还获得高可靠性和重现性的数据。 /p p 　　 span style=" text-decoration: underline " strong Waters /strong /span 在制药领域内，其超高效液相色谱仪产品在药检所可用于建立药品的质量标准、基因毒性杂质、药物相关物质研究等在中药领域常用于复方丹参滴丸质量控制研究在生物制药企业可用于常规指标检测与辅料检查在医院、高校临床学院等药物代谢研究机构可用于体内体外活性指标检测。另外还可用于第三方检测机构、高校与科研院所的科研课题以及化工企业的检测当中。 /p p 　　 span style=" text-decoration: underline " strong 上海伍丰 /strong /span 的超高效液相色谱仪产品用于某军工厂火炸药中“四氮烯”成分含量分析。由于此物不溶于水，极微溶于有机溶剂，要在含有极其微量此成分的溶液中分析其含量，用超高效液相色谱仪，出峰快，效率更高。 /p p 　　 strong span style=" text-decoration: underline " 岛津 /span /strong 超高效液相色谱已经进入各个行业、各个领域的千余家实验室，比如在很多的政府实验室，如很多省部级的商、质、农检实验室，承担这非常多的、涉及到液相分析条件的标准起草和制定工作，很典型的是“国家食品安全风险评估中心”，利用超快速质谱LCMS-8050并配合前端的“方法开发系统”，快速的优化并建立了不同畜肉基质中十种兽药镇静剂液相色谱质谱联用分析方法。又如在药物分析领域，全二维液相色谱系统在某知名高校的国家中重点实验室承担着中药材中天然产物的超精细分离工作超高效液相色谱与超临界流体色谱切换系统在大赛璐、药明康德、康龙化成等企业帮助用户实现手性化合物方法的快速建立及日常分离工作。再比如在某大型的第三方医学检测机构，基于岛津超高效液相色谱的平行液相系统帮助用户实现分析速度提近一倍的提升，极大提升用户在同行业间的业务竞争能力。 /p p 　　 strong 由各品牌应用案例的归纳可以看出，当前超高效液相色谱仪主要用于复杂样品、痕量物质等的分析中。应用范围则覆盖了制药、食品与环境等重要领域，其应用优势主要在于提高分析效率、提高分辨率等方面。 /strong /p p 　　 strong span style=" color: rgb(0, 112, 192) " 二、超高效液相色谱仪市场预测 /span /strong /p p 　　 span style=" text-decoration: underline " strong 日立高新 /strong /span 认为：今年以及2018年，超高效液相色谱的市场重点仍然会在食品和制药行业。因为食品和药品安全一直是人们关注的热点问题，国标和药典中许多食品，药品的检测都采用的是高效液相色谱法，在食品，药品检测中实现高分辨率，高灵敏度的检测意义重大。超高效液相色谱在分辨率，灵敏度以及分析时间上都要优于常规液相，因此超高效液相色谱在食品和制药行业潜力巨大。 /p p 　　 span style=" text-decoration: underline " strong 赛默飞 /strong /span 认为：常规检测基础上更加倾向于超快速液相检测，更加灵活的研发需求及更加高通量的监测需求，更加无缝衔接的液质联用及数据的智能、合规化管理。与全球超快速液相发展趋势同步及日益增长的检测需求，驱使常规液相逐渐趋向超快速液相越来越多的监控领域对单独色谱检测提出极大的挑战，液质联用逐渐渗透至各个应用领域国内法规监测及大众舆论加强对数据的监测及控制，合规性将从制药行业逐步扩大至食品、环境、化工等领域。 /p p 　　 span style=" text-decoration: underline " strong 安捷伦 /strong /span 认为：对现有常规方法和标准方法的提升已经逐渐成为市场共识，而且也看到最近很多新标准中引入UHPLC，在未来的几年应该会有更多的标准跟进，对UHPLC的需求也会增加。制药和食品化工领域应该是受影响最大的市场。 /p p 　　 span style=" text-decoration: underline " strong Waters /strong /span 认为：UPLC未来将持续发展，尤其在USP收录152种UPLC方法、中国药典收录更多UPLC检测药品之后，各市场各行业对于提速增效的追求使得UPLC将继续成为热点：(1)药物分析方法开发：实时检测、快速方法开发结果 (2)食品检测：多种成分同时快速在线检测的需要(3)生物药分析：快速常规检测，以缩短产品生命周期 (4)中药配方颗粒：更高的峰容量、分离度及更快的速度，用于指纹图谱分析 (5)天然产物研究：基质复杂，需要更高效灵敏 (6)基因毒性杂质：低含量，需要更高灵敏度的检测手段 (7)农残筛查：提高分析速度、减少溶剂使用 (8)代谢组学分析：追求更快分离、更高峰容量及灵敏度。 /p p 　　 span style=" text-decoration: underline " strong 上海伍丰 /strong /span 认为未来超高效液相色谱仪的市场还将继续在食品、制药、化工等领域发展。 /p p 　　 strong span style=" text-decoration: underline " 岛津 /span /strong 认为：在诸多行业对分析效率、分析通量需求越来越高的大市场环境下，超高效液相必将越来越受到重视。就目前来看，食品安全领域、药物分析领域、环境保护领域等诸多关系到大众安全、健康的相关行业都会越来越多启用超高效液相色谱方法来提升效率。 /p p 　　由 strong 各品牌超高效液相色谱仪厂商对未来市场的预测可以看出，大家普遍认同随着标准的驱严、对分析工作效率要求的不断提高，未来一段时间内，超高效液相液相色谱仪将在制药、食品等领域继续得到广泛的应用，同时也将有更多应用超高效液相色谱法的标准问世。另外，数据合规性也是各家厂商非常重视的问题。随着超高效液相色谱法越来越普遍的应用趋势，其与质谱等的联用也将更频繁。 /strong /p p 　　 strong (注：内容若有所欠缺，欢迎读者补充。) /strong /p p br/ /p

时间： 2017-10-16

作者：王明煜
ASD | ASD FieldSpec光谱仪在预测土壤水力特性上的应用
土壤水力参数，如田间持水量（FC）和永久萎蔫点（PWP），在灌溉管理、干旱风险评估和土地利用规划等方面发挥着重要作用。这些水力特性是动态的，随土壤类型、作物类型和生长季而变化。传统方法估算大尺度水力特性费时费力，而土壤传递函数（PTF）作为一种替代方法，已被用于使用易测量的土壤特性（如土壤粒级、有机碳和容重）来估计土壤水力特性。这些预测参数在很大程度上受各种内在土壤特性如土壤质地、结构、有机质、容重和孔隙度的影响。随着光谱技术的不断发展，因其快速、低成本和无损测量，许多研究者已经利用可见近红外（Vis-NIR）光谱预测了土壤特性，而使用光谱数据绘制印度土壤类型水力特性的研究非常有限。基于此，在本研究中，一组研究团队在印度卡纳塔克邦高原北部地区收集了558个土壤样本，在实验室中测量了其FC， PWP和土壤含水量，并利用ASD FieldSpec光谱仪测量土壤光谱反射率。通过支持向量机、随机森林和偏最小二乘回归三个模型预测FC和PWP。其中，2/3的数据集用于校准（368个样品），1/3的数据集用于验证（190个样品）。本研究目标为通过不同统计技术检验实验室Vis-NIR光谱数据估算水力参数的有用性。研究区域图【结果】卡纳塔克邦高原北部土壤光谱反射率分布（平均值和标准偏差）（N = 558）。FC和PWP预测模型的性能（50 次迭代）验证集FC和PWP预测值和观测值散点图（RF方法）（变性土-绿点，淋溶土-红点，弱育土-蓝点，新成土-黄点）。传统PTF方法预测验证集FC和PWP含水量的性能。【结论】验证结果表明，与PLSR模型相比，RF和SVM性能较好。与田间持水量（R2=0.66-0.69和RMSE=7.25-7.51%）相比，永久萎蔫点预测良好（R2=0.70-0.74，RMSE=5.44-5.74%）。在土纲中，Vis-NIR光谱（R2=0.34&0.42）对变性土FC和PWP的预测不佳，对淋溶土（0.44&0.52）和弱育土（0.55&0.65）的预测结果一般，而对新成土（0.83&0.76）预测结果较好。总体而言，结果与传统PTF方法相当。目前结果表明，可见近红外光谱有助于快速准确地估计该国半干旱地区的水力特性。

时间： 2022-11-18

作者：理加联合
欧盟采用高精度质谱分析毒蛇毒液生物结构开发各类新药
以毒攻毒，充分利用自然界天然的复杂合成毒素，一直是世界医学界研制开发新药物的有效路径。为开发高效、负担得起的糖尿病或肥胖新药，欧盟第七研发框架计划(FP7)提供600万欧元资助，总研发投入940万欧元，由欧盟5个成员国法国(总协调)、西班牙、葡萄牙、比利时和丹麦，以及跨学科生物化学科研人员和联合制药工业组成了欧洲VENOMICS研发团队。从2011年11月开始，该团队致力于毒蛇毒素新药的研制开发，并取得了积极进展。　　研发团队首先在全球范围内成功优化筛选出“高效毒素”的200余种毒蛇，进行人工培育。采用最新开发的高精度质谱仪技术和其它先进技术，对203种最具活力的毒蛇毒液样本、复杂的生物化合物分子结构开展研究分析，成功分类出4000余种毒素“微蛋白”。根据毒性的峰值，将其应用于各类新药的开发。　　目前，该团队的大部分研发创新活动已转向糖尿病、肥胖症、心血管疾病、人体过敏和癌症等靶向药物开发，其中收集的各项研究数据已证实，毒蛇毒素对抑制和治疗糖尿病或肥胖具有明显疗效。新药物的发现和定性定量通常需要2-3年时间，尚需10年或15年时间进行临床试验、产品认证和商业开发，最终才能进入市场。

时间： 2016-07-12

作者： guohn

质谱结构预测

质谱结构预测相关的资讯

相关专题

厂商最新资讯

相关方案