仪器信息网APP
选仪器、听讲座、看资讯

智能数据采集FLASHIda应用于自上而下蛋白质组学分析

导读:这项研究展示了IDA在TDP研究中的应用,目前作者依然在开发该算法的不同变体,用于靶向proteoform分析,深度表征,甚至从头测序。

  大家好,本周为大家分享一篇发表在Nature communications上的文章,FLASHIda enables intelligent data acquisition for top–down proteomics to boost proteoform identification counts [1],文章的通讯作者是德国图宾根大学的Oliver Kohlbacher教授。

自上而下蛋白质组学(TDP)能够对完整的proteoform进行全面和深入的分析,目前已广泛应用于生物医学研究领域。proteoform在不同的生物系统中具有高度异质性,proteoform水平的信息可以为了解生物生化功能或疾病表型提供重要的信息。近年来,随着TDP样品处理方法、分离技术、碎裂技术和生物信息学方法的进步,proteoform变得更容易被检测和表征。在复杂样本的大规模研究,如微生物或人类细胞裂解液中,proteoform的鉴定数量已达到4000-6000(对应500-1000个蛋白质)。在单次TDP实验中,在大肠杆菌裂解液中可以鉴定出约800种proteoform,在人脑样本中可以鉴定出约1800种proteoform。由于proteoform的多样性和复杂性,完整蛋白质的DDA采集是非常重要的。然而目前的仪器软件在DDA采集中实施的碎裂技术优化主要针对自下而上蛋白质组学(BUP),而不是TDP。尽管这些方案在BUP研究中有效地捕获了各种高质量的肽段离子,但这些选择标准对于TDP中的proteoform离子选择并不是最优的。与BUP中的肽段离子相比,单个proteoform由于其高质量和高电荷会产生许多峰,Top-N采集往往会导致从一个丰度较高的proteoform中选择多个峰,而不是从多个不同的proteoform中进行选择,这会导致proteoform的覆盖率较低。此外,基于强度进行选择可能不会选到能产生多种独特片段的高质量前体。目前,大多数大规模TDP研究使用具有特定调优参数的DDA采集,例如,Top-N采用相对较低的N值(3-5)和相对较高的隔离窗口(1.2-15 Th,超宽隔离)。然而对所选前体离子的分析表明,对proteoform的选择依然不理想。因此,采用更智能的数据采集方式(Intelligent data acquisition,IDAs)是非常有必要的。本文中作者提出了一种用于TDP的基于机器学习的智能在线数据采集算法FLASHIda,该算法可以确保实时选择不同proteoform的高质量前体,最大化TDP中的proteoform覆盖。FLASHIda通过iAPI与tribrid Thermo Scientific质谱仪连接,允许对MS数据进行实时访问。在LC-MS运行期间,将实时去卷积算法和评估前体同位素质量的机器学习技术结合,非冗余选择高质量前体离子,从而提高蛋白质的覆盖率。FLASHIda流程如图1所示,该算法能在20毫秒内处理每个MS全扫描,并优化下一个采集周期,以最大限度地提高采集中的异型多样性。FLASHIda包括以下3个关键步骤,第一步是将输入的m/z-强度谱转换为mass-quality谱图,第二步是在转换谱图中选择前体离子,最大化唯一识别的proteoform离子数量,最后,动态确定每个选定质量的电荷态和隔离窗口大小,以尽量减少噪声或共洗脱的干扰。确定的隔离窗口m/z范围通过Thermo iAPI连接提供给仪器。

智能数据采集FLASHIda应用于自上而下蛋白质组学分析


  图1.FLASHIda总览

  在对大肠杆菌裂解液的分析中,与标准DDA模式相比,FLASHIda在三分之一的仪器时间内将proteoform鉴定数量从800增加到1500,或产生几乎相同的鉴定数量。此外,FLASHIda能够灵敏地绘制翻译后修饰和检测化学加合物。作为仪器的软件扩展模块,FLASHIda可以方便地用于复杂样品的TDP研究,以提高proteoform的鉴定率。

智能数据采集FLASHIda应用于自上而下蛋白质组学分析

  图2. Proteoform分析

  这项研究展示了IDA在TDP研究中的应用,目前作者依然在开发该算法的不同变体,用于靶向proteoform分析,深度表征,甚至从头测序。此外,由于FLASHIda能够选择无干扰的前体离子,因此它可以用于提高proteoform定量准确性。作者预计,未来在FLASHIda内开发的高级数据采集方法将有助于通过TDP探索proteoform的异质性。

  撰稿:张颖编辑:李惠琳

  原文:FLASHIda enables intelligent data acquisition for top–down proteomics to boost proteoform identification counts

  李惠琳课题组网址www.x-mol.com/groups/li_huilin


  参考文献

  Jeong K, Babović M, Gorshkov V, Kim J, Jensen ON, Kohlbacher O. FLASHIda enables intelligent data acquisition for top-down proteomics to boost proteoform identification counts. Nat Commun. 2022 Jul 29;13(1):4407.


来源于:仪器信息网

打开APP,掌握第一手行业动态
打赏
点赞

相关会议

更多

热门评论

新闻专题

更多推荐

写评论…
0

  大家好,本周为大家分享一篇发表在Nature communications上的文章,FLASHIda enables intelligent data acquisition for top–down proteomics to boost proteoform identification counts [1],文章的通讯作者是德国图宾根大学的Oliver Kohlbacher教授。

自上而下蛋白质组学(TDP)能够对完整的proteoform进行全面和深入的分析,目前已广泛应用于生物医学研究领域。proteoform在不同的生物系统中具有高度异质性,proteoform水平的信息可以为了解生物生化功能或疾病表型提供重要的信息。近年来,随着TDP样品处理方法、分离技术、碎裂技术和生物信息学方法的进步,proteoform变得更容易被检测和表征。在复杂样本的大规模研究,如微生物或人类细胞裂解液中,proteoform的鉴定数量已达到4000-6000(对应500-1000个蛋白质)。在单次TDP实验中,在大肠杆菌裂解液中可以鉴定出约800种proteoform,在人脑样本中可以鉴定出约1800种proteoform。由于proteoform的多样性和复杂性,完整蛋白质的DDA采集是非常重要的。然而目前的仪器软件在DDA采集中实施的碎裂技术优化主要针对自下而上蛋白质组学(BUP),而不是TDP。尽管这些方案在BUP研究中有效地捕获了各种高质量的肽段离子,但这些选择标准对于TDP中的proteoform离子选择并不是最优的。与BUP中的肽段离子相比,单个proteoform由于其高质量和高电荷会产生许多峰,Top-N采集往往会导致从一个丰度较高的proteoform中选择多个峰,而不是从多个不同的proteoform中进行选择,这会导致proteoform的覆盖率较低。此外,基于强度进行选择可能不会选到能产生多种独特片段的高质量前体。目前,大多数大规模TDP研究使用具有特定调优参数的DDA采集,例如,Top-N采用相对较低的N值(3-5)和相对较高的隔离窗口(1.2-15 Th,超宽隔离)。然而对所选前体离子的分析表明,对proteoform的选择依然不理想。因此,采用更智能的数据采集方式(Intelligent data acquisition,IDAs)是非常有必要的。本文中作者提出了一种用于TDP的基于机器学习的智能在线数据采集算法FLASHIda,该算法可以确保实时选择不同proteoform的高质量前体,最大化TDP中的proteoform覆盖。FLASHIda通过iAPI与tribrid Thermo Scientific质谱仪连接,允许对MS数据进行实时访问。在LC-MS运行期间,将实时去卷积算法和评估前体同位素质量的机器学习技术结合,非冗余选择高质量前体离子,从而提高蛋白质的覆盖率。FLASHIda流程如图1所示,该算法能在20毫秒内处理每个MS全扫描,并优化下一个采集周期,以最大限度地提高采集中的异型多样性。FLASHIda包括以下3个关键步骤,第一步是将输入的m/z-强度谱转换为mass-quality谱图,第二步是在转换谱图中选择前体离子,最大化唯一识别的proteoform离子数量,最后,动态确定每个选定质量的电荷态和隔离窗口大小,以尽量减少噪声或共洗脱的干扰。确定的隔离窗口m/z范围通过Thermo iAPI连接提供给仪器。

智能数据采集FLASHIda应用于自上而下蛋白质组学分析


  图1.FLASHIda总览

  在对大肠杆菌裂解液的分析中,与标准DDA模式相比,FLASHIda在三分之一的仪器时间内将proteoform鉴定数量从800增加到1500,或产生几乎相同的鉴定数量。此外,FLASHIda能够灵敏地绘制翻译后修饰和检测化学加合物。作为仪器的软件扩展模块,FLASHIda可以方便地用于复杂样品的TDP研究,以提高proteoform的鉴定率。

智能数据采集FLASHIda应用于自上而下蛋白质组学分析

  图2. Proteoform分析

  这项研究展示了IDA在TDP研究中的应用,目前作者依然在开发该算法的不同变体,用于靶向proteoform分析,深度表征,甚至从头测序。此外,由于FLASHIda能够选择无干扰的前体离子,因此它可以用于提高proteoform定量准确性。作者预计,未来在FLASHIda内开发的高级数据采集方法将有助于通过TDP探索proteoform的异质性。

  撰稿:张颖编辑:李惠琳

  原文:FLASHIda enables intelligent data acquisition for top–down proteomics to boost proteoform identification counts

  李惠琳课题组网址www.x-mol.com/groups/li_huilin


  参考文献

  Jeong K, Babović M, Gorshkov V, Kim J, Jensen ON, Kohlbacher O. FLASHIda enables intelligent data acquisition for top-down proteomics to boost proteoform identification counts. Nat Commun. 2022 Jul 29;13(1):4407.