蛋白质编码器

仪器信息网蛋白质编码器专题为您提供2024年最新蛋白质编码器价格报价、厂家品牌的相关信息, 包括蛋白质编码器参数、型号等,不管是国产,还是进口品牌的蛋白质编码器您都可以在这里找到。 除此之外,仪器信息网还免费为您整合蛋白质编码器相关的耗材配件、试剂标物,还有蛋白质编码器相关的最新资讯、资料,以及蛋白质编码器相关的解决方案。
当前位置: 仪器信息网 > 行业主题 > >

蛋白质编码器相关的厂商

  • 北京天时佳业贸易有限公司是一家专业提供实验室仪器的公司,主要经营国内外各专业生产厂家的先进实验室仪器。主要经营:瑞士梅特勒-托利多(Mettler-Toledo)系列产品:电子天平、卡尔费休水分仪、电位滴定仪、PH计/电导率仪/离子计、溶氧仪、密度计、折光率仪、卤素/红外水分仪、移液器、熔点仪、台秤。美国PMS:空气粒子计数器、微生物测量仪。美国博勒飞(Brookrield):粘度计、质构仪、流变仪、粉体流动测试仪、搅拌器、旋转蒸发仪、纯水机、生物/体视显微镜、鼓风干燥箱、恒温恒湿箱、分光光度计、气相/液相色谱仪、离心机、培养箱、真空泵、总有机碳分析仪(TOC)、摇床、旋涡混合气、凯氏定氮仪土壤/植物/水质监测仪、加热制冷循环系统、超声波清洗器、冷却水循环泵、发酵罐、大型干燥机/干燥制粒机、安德森-耐格(Anderson-Negele)编码器、旋转编码器、光电编码器、绝对值编码器、增量编码器、安全继电器、压力开关、液位开关、流量开关、温度开关、接近开关、液位传感器、流量传感器、压力变送器、液位变送器、微型电磁阀、压力传感器、差压传感器、微差压传感器、压力计、数字压力计、温湿度传感器、温度变送器、电流传感器、加速度计、卫生型温度计、卫生型压力表、卫生型流量计、卫生型液位计、EHEDG仪表、温控器、温度控制器、温控表、调功器、温控模块、真空接触器等及各种DOW、Merck、Serva试剂及Hampton、Research蛋白质结晶)等耗材。 主要应用于制药、烟草、科研、石油、化工、电力、环保、电子行业等领域。北京天时佳业有限公司主要为广大客户提供完善的售前售后服务(技术咨询、新产品的推荐及如何选型、使用及保养)等。我公司所售出产品均保证一年维修,终身维护。在追求用户满意的同时,公司还非常重视商业规范和技术服务对于用户的重要性,“一次引进高质量产品,终生提供最优质服务”是我公司的宗旨和目标。
    留言咨询
  • 北京青莲百奥生物科技有限公司是一家基于蛋白质组学研究的创新性、平台型CRO企业,致力于临床样本的蛋白质标志物发现和检测,聚焦于低丰度、超微量的血液、外泌体、显微切割等样品类型。全力打造新一代蛋白质组学平台,拥有独特纳米磁珠富集低丰度蛋白技术及蛋白质组学全流程全自动样本处理智能机器人及全自动大数据分析软件,不仅提供上游工具标准化解决方案,还提供临床质谱的诊疗Biomarker开发服务,从临床需求到诊疗产品落地,提供一站式闭环研发服务。 新一代蛋白质组学平台以临床问题为导向、以源头创新为核心驱动力,为诊、疗蛋白质生物标志物在临床端和药企端落地转化,提供完整的解决方案。
    留言咨询
  • ProteinSimple 金牌12年
    400-860-5168转2472
    ProteinSimple是美国纳斯达克上市公司Bio-Techne集团(NASDAQ:TECH)旗下行业领先的蛋白质分析品牌,致力于研发和生产更精准、更快速、更灵敏的创新性蛋白质分析工具,包括蛋白质电荷表征、蛋白质纯度分析、蛋白质翻译后修饰定量检测、蛋白质免疫实验如Western和ELISA定量检测蛋白质表达等技术,帮助生物制药、细胞治疗、生物医学和生命科学等领域科学家解决蛋白质分析问题,深度解析蛋白质和疾病相互关系。联系方式地址:上海市长宁路1193号来福士广场3号办公楼19层2001室热线:021-52293200 接通后请直接按 631邮箱:jing.li@bio-techne.com网址:www.bio-techne.com

蛋白质编码器相关的仪器

  • 仪器简介:作为全球最大的实验室过滤及超滤产品供应商,Millipore 可为您提供l. 0.5mL至1000L处理量的实验室除菌过滤装置,可用于血 清、组织培养基及其他溶液的除菌过滤。高通量,低吸附的除菌滤膜,使蛋白质损失最少。可选择即用式过滤器或可更换膜的过滤装置。2. 0.5mL至3000mL处理量的实验室超滤装置,用于蛋白质,核酸的分离、纯化、浓缩和脱盐,专利 的结构设计和新型的超滤膜,使超滤速度更快,产物回收率更高。单片超滤膜和膜包可清洗并反复使用。3. 高通量纯化系统,特别适合大规模样品纯化实验室的应用,可快速有效地同时处理多达96个样品,大大减轻了实验室的负担。主要产品包括:* Amicon 系列超滤离心装置: 浓缩,脱盐一部到位,* DNA Extraction Kit: 从琼脂糖凝胶中回收DNA,只需10分钟即可回收100bp-10,000kb DNA* Micropure -EZ:从DNA中去除常用的42种限制性内切酶,可与Amicon超滤离心装置连用,一步离心即可完成去酶,浓缩及脱盐。* Immobilon 系列转印膜: Ny+ 用于Southern和Northern Blotting PVDF 用于Western Blotting* ZipTip 微量固相萃取吸嘴:只需数秒即可纯化fmol至pmol的蛋白质样品,提高质谱分析的灵敏度* Montage Plasmid kit:用于质粒DNA纯化2 Montage BAC kit:用于BAC DNA纯化2 Montage SEQ kit:用于测序反应后PCR纯化* Montage In-Gel Digest Kit: 同时处理96个1-D或2-D胶中的蛋白质样品* Millex GP33: 超大面积,超高流速的针头式除菌过滤器。技术参数:1.96孔PCR 纯化板---纯化96个样品只需10分钟2.无须离心,只需真空抽干3.不需要使用任何有机试剂及任何盐溶液,也无须洗涤步骤4.纯化后的PCR样品回收率90%(500bp以上)5.纯化后的DNA纯度极佳--Primer的去除率98%主要特点:1.Albumin Deplete Kit--有效去除人血清中65%以上的白蛋2.预装好亲和层析小柱,只需15分钟离心,洗脱操作3.非特异性蛋白吸附极低4.提高低峰度蛋白质在电泳,层析及质谱分析中的解析度5.此Kit同样可适合于其他多种哺乳动物
    留言咨询
  • 最新款 Qubit Flex 八通道核酸/蛋白定量荧光计 已上市!Qubit 4 荧光计采用专门研制的荧光检测技术和Invitrogen™ Molecular Probes™ 染料。这些染料荧光只有与特异性的靶分子结合时,才能发射荧光信号,即使有游离核苷酸或降解核酸存在,这些染料仍能发挥作用。Qubit 4 荧光定量即便在低浓度下亦具有目前最高的DNA 和RNA 定量特异性和灵敏度。? 选择性 — Qubit 荧光定量采用Qubit 分析试剂盒,其包括专利的染料,只有与DNA、RNA或蛋白质结合时方可发出荧光。由于Qubit 技术只报告靶分子( 而不是杂质) 的浓度,因此这种特异性可以使您获得十分精确的结果? 灵敏性 — 最低仅需1 uL 样品,能精确可靠地定量浓度仅为10pg/L 的DNA 和12.5μg/mL 的蛋白质样本? 简单直观 — 反应灵敏的5.7 英寸彩色触摸屏,直观的导航按钮? 迅速 — 全新的双核处理器,5 秒内快速计算样品浓度,最多存储1000 个结果? 个性化 — 个性化设置常规应用,可通过MyQubit 软件和网络工具创建个性化assay,六国操作语言可供选择上市12 年来,Qubit 荧光计一直以其极高的准确度和灵敏性,受到全球上万个实验室的青睐。迄今为止,已经有17,500 篇有关Qubit 的文献引述。最新推出的Qubit 4 荧光计秉承上一代仪器的高准确性,不仅仅可精确测量样品DNA,RNA 和蛋白质含量,还拥有全新的功能,包括:? 适用全新RNA IQ assay — 快速可靠地检测RNA 完整性和质量? 数据导出 — 除U 盘和USB 连接电脑导出数据,还拥有WiFi 功能? 内置试剂计算器 — 快速计算配置工作溶液所需的染料和缓冲液Qubit 操作简单直观ubit RNA IQ Assay快速、准确地检测RNA 完整性和质量RNA 样品的质量评估对于下游的实验的成功尤为重要。全新上市的InvitrogenTM Qubit RNA IQ(Integrity & Quality )试剂盒和Qubit 4 荧光计配套使用,只需两步就可以准确区分完整和降解RNA,快速评估RNA 质量或降解程度。无需特殊的处理步骤,繁杂的样本制备或漫长的等待过程——最少仅需1 uL,浓度为0.5-1.5 ug/uL 的待测样品,即可在4 秒内获得RNA IQ 结果。Qubit RNA IQ 试剂盒采用两种独特的荧光染料——一种与大RNA,完整和/ 或结构RNA 结合,另一种选择性地结合较小、降解的RNA(图5),两种染料结合使用,可快速地评估RNA样品的完整性和质量。使用时,您只需将样本加入RNA IQ 工作液,然后在Qubit 4 荧光计上完成检测。检测结果会提供RNA 样品完整性和质量的总数值或RNA IQ#,以及样本中大小RNA 的百分比值(图6)。与其他RNA 质量分数类似,RNAIQ# 评分范围为1 到10,数值越大,说明RNA 的质量越高,完整性越好。 与电泳法相比,RNA IQ 检测法有何优势?Qubit RNA IQ 为检测RNA 样本是否降解提供一种快速简单的方法。与基于微流体芯片法比较,RNA IQ 法需要的设备便宜,操作简单,更重要的是检测所需的时间大大缩短。通常来说,完成12 个样品的检测,RNA IQ 法约需要10 分钟,而使用微流体法,约需要75 分钟。如果您只是需要简单评估RNA 样品是否降解,可以使用RNA IQ 法快速完成检测,但如果您需要获取具体的RNA 片段大小及分布信息,我们依然推荐您使用基于凝胶或微流体的电泳方法。RNA IQ 检测结果反映样本中大RNA 和/ 或结构RNA 和小RNA的百分比,其数值与电泳法结果正相关(图7)。然而,需要注意的是IQ# 值反映的是样本中大小RNA 的比值,由于计算原理不同,IQ# 值与其他质量评估方法得到的结果之间存在一些差异(图8)。对特定样本或下游应用,我们推荐您最开始同时使用RNA IQ 试剂盒和传统电泳法来确定测量值的相关性。官方渠道购买 — 品质保证,售后无忧从现在起,通过赛默飞世尔科技官方渠道购买全新Qubit 4 荧光计,即享三年免费退换。
    留言咨询
  • Biolot蛋白质纯化系统/蛋白质层系统是为蛋白等生物样品的纯化制备而专门设计的全自动蛋白质层析纯化系统,其系统稳定性能高而且软件易用,配备酸度/电导检测器可准确即时监测分离时的梯度环境,专为进行单次和多次纯化的科学家设计。Biolot蛋白质纯化系统旨在满足您的不同应用需求:不论您是每天只需处理少量样品,还是您的工作量要求仪器能实现更大通量,我们的蛋白质纯化系统统使您可快速制备宝贵且复杂的混合物并获得高纯度、高回收率的完全可信结果。高效的模块化制备色谱系统,广泛应用于天然产物、和蛋白质生物高分子的分离纯化。 Biolot蛋白质纯化系统可用于: ● 多肽纯化 ● 单抗纯化 ● 重组蛋白纯化 ● 天然药物和多糖的纯化 ● 疫苗纯化 ● 血液制品分离纯化 ● 基因治疗药物纯化Biolot蛋白质纯化系统产品性能: 可快速分离蛋白质、多肽等生物大分子化合物 高度灵活的模块化配置,让科研过程更直观 采用高精度柱塞泵、高稳定性、低脉冲 高灵敏度在线检测,可选配UV、PH、电导、示差折光等多种检测器 流路为PEEK材料,生物兼容性好 泵头具有自动清洗功能,避免缓冲液残留、结晶析出 全自动馏分收集器,具有多种收集模式,可配置多种规格收集管 标配梯度程序、客户可根据实验需要进行重新设置 存储和执行色谱分离方法 高度智能化操作系统,使用简单方便 控制软件符合“FDA 21 CFR Part 11 认证”认证要求Biolot100蛋白质纯化系统技术参数:型号Biolot 100系统泵PEEK柱塞泵(高精度、低脉冲)流速范围0.01-100ml/min流速精度± 0.5% 压力范围0—20Mpa压力脉动≤0.2MPa梯度类型台阶、线性变化梯度、可在线修改梯度最小梯度调节±0.5%ABS(双泵)检测器光源进口氘灯+钨灯(系统自动切换灯源)检测波长190~800nm(两波长同时检测)波长精度±1nm吸光度范围-3--3AU (线性 0--2 AU)电导范围0—999.9ms/cmPH范围0—14收集器全自动馏分收集器收集管架2×60支试管(高度150mm,直径15mm)收集模式普通模式、顺序收集、循环收集手动上样阀标配1ml定量环(可选配各种规格定量环)电源85 ~ 264VAC,50Hz控制软件通过RS-232(USB),采用基于Windows XP/Windows7/ Windows8/ Windows10/的PC软件工作站,多模块系统控制、设计符合“FDA 21 CFR Part 11 认证”参考尺寸输液泵:370×240×152mm3 紫外检测器:370×240×152mm3 电导/PH:370×240×100mm3 自动馏分收集器:355×241×320mm3
    留言咨询

蛋白质编码器相关的资讯

  • 专题 | 机器学习方法预测蛋白质-配体结合构象
    引言准确预测蛋白质-配体(在本文的语境中,配体意指小分子有机化合物)的结合构象是计算生物学中的一项重要任务。一方面,它有助于人们理解蛋白质与内源小分子或药物分子的互作机制。另一方面,在药物设计或药物筛选(无论是单个蛋白-多个配体的正向筛选,还是单个配体-多个蛋白的逆向筛选)的过程中,也离不开对复合物构象的准确预测:这是准确计算蛋白质-配体结合稳定性(亲和力)的必要条件。对于给定蛋白和给定配体分子,依据是否已知结合口袋(也称配体结合位点)可以将复合物构象预测任务分为两类:口袋未知的盲对接(blind docking)任务和口袋已知的局部对接(local docking)任务。其中,盲对接任务是更普遍的、更富有挑战性的任务。在传统的对接流程中,这一任务又被划分为几个子任务:先借助口袋搜索算法确定可能的结合位点(即,转化为局部对接任务) 再利用构象生成(采样)方法生成大量可能的复合物构象,并依据打分函数评价各个构象(即,进一步确定配体的位置、朝向,以及各个键对应的扭转角) 挑选出打分值最优者作为最终结果。但是,对接过程面临着打分函数不够准确、构象搜索空间巨大导致计算耗时过长等挑战。比如,对于后者,文献[1]计算结果表明:对于单个配体复合物的盲对接任务而言,借助GNINA和Glide这两款传统的对接软件,生成百万量级的复合物构象并从中挑选最优者,平均耗时分别约为150 s和1500 s。在巨型分子库的(如ZINC 15数据库,含有约数十亿个化合物分子[2])虚拟筛选过程中,使用传统方法逐一对接每个分子在计算速度上是不可接受的。而数据驱动的机器学习方法为优化各个子任务的准确性和计算效率带来希望。此外,同样基于机器学习方法,部分研究者发展出“端到端”的、更为直接的对接流程:训练一个拟合自由能面(free energy landscape)的模型,无需将原有的对接任务划分为多个子任务,以蛋白质与配体的三维结构为输入,输出即为可能的复合物构象。参照Anfinsen提出的蛋白质折叠热力学假说,可以设想:如果存在一个能量函数,能够将复合物在三维空间下的所有状态映射到它对应的自由能,那么可以将复合物构象预测问题转化为该能量函数的最优化问题[3]。这是机器学习拟合自由能面的出发点。与传统的对接方法相比,这样的方法也同样可能在准确性和计算效率等指标上得到提升。本文将针对口袋搜索、构象生成、打分函数、自由能面建模这四个方向:整理相应的评价体系,包括常用的评价指标或测试集 挑选并简要介绍部分具有代表性的机器学习模型 结合模型评估实验讨论当前模型或评价体系存在的不足以及未来可能的发展方向。1.机器学习口袋搜索 1.1 评价体系目前存在两种描述蛋白质-配体结合口袋的方式。其中一种方法借助蛋白质表面的点云(surface points)来描述。这种方法被称作以配体为中心(ligand-centric)的方法。另一种方法则借助蛋白质上的原子来描述,那些蛋白质上的、与配体重原子距离小于一定阈值的重原子被定义为配体结合原子。这种方法被称作以蛋白质为中心(protein-centric)的方法。这两种描述方法相应地衍生出两类评价指标。对于前者,通常以配体原子中心距(预测的口袋中心与配体任意原子的距离,distance between the center of the predicted site to any atom of the ligand,DCA)、配体中心距(预测的口袋中心与配体中心的距离,distance between the center of the predicted site to the center of the ligand,DCC)、体素交并比(预测的口袋体积与配体所占据的空间体积的交并比,discretized volume overlap,DVO)等指标来衡量[4][5]。直观上,在这三个指标中:DCA最为宽松(只需大致判断配体位置),DCC更为严格(额外考察了配体大小),DVO最为严格(额外考察了配体构象)。但在多数文献中,常使用DCA和DCC这两个指标,并以4 Å作为预测成功与否的阈值[4]。对于后者,Yan等人以原子水平的交并比(Intersection over Union)来衡量[6]。具体地,计算预测的配体结合原子与标注的配体结合原子的交集与并集的比值。这也是机器学习目标检测任务中的常用指标。1.2 模型方法目前发展的大多数口袋搜索算法,都是以搜索蛋白质表面点云为目标。例如Krivák等人于2015年提出的P2Rank[7]:刻画蛋白质Connolly点云中各个点的物化特征,并使用随机森林模型对每个点进行可靶性预测,最后对点聚类得到口袋预测结果。以DCA为评价标准,P2Rank在多个数据集上表现优于传统方法Fpocket。Krivák等人后续还提供了P2Rank的网络服务[8],并对多种方法口袋搜索方法进行了更加全面的总结和比较,其中包括Jiménez等人于2017年开发的、使用3D网格(体素)刻画结合位点的DeepSite[9]。值得一提的是,在Krivák等人的结果中(测试数据集为COACH420、HOLO4K,评价指标DCC),DeepSite表现不及Fpocket 而在Jiménez等人的结果中(测试数据集CHEN251,评价指标DCC、DVO),DeepSite表现显著优于Fpocket。最近,Yan等人另辟蹊径,以鉴定蛋白质上的配体结合原子为目标,发表了PointSite方法[6],并声称其在多个数据集上(包括COACH420、HOLO4K、CHEN251等等,以原子水平的交并比为评价指标)取得了SOTA。Yan等人将口袋搜索问题转化为计算机视觉领域的点云分割问题 此处的点以蛋白质上的原子表示,以充分挖掘原子之间的键连特征。此外,作者还指出:将PointSite方法引入到其它口袋搜索方法如FPocket、P2Rank中(具体而言,使用点云分割的结果对后者的预测结果进行过滤),可以进一步提升配体结合位点的鉴定效果。1.3 讨论从以上几种方法的评估实验中可看出,模型在不同测试数据集上的相对表现可能存在差异,因此需要建立一套统一的、合适的数据集进行测试。另外,在训练数据集的准备过程中,将未鉴定到配体结合的位点直接划分为负样本也值得考量。2.2在具体使用建议上,最近有研究将口袋搜索方法引入到完整的对接流程中[10][11],相较于FPocket、P2Rank等方法,PointSite表现最优。  2. 机器学习构象生成 2.1 评价指标对于构象生成模型而言,需要考察所生成构象的多样性和准确性,由此分别衍生出两类指标:覆盖率(COV,coverage)和匹配程度(MAT,matching metrics)。针对测试集中的每一个构象:查看是否能够在生成的构象集合里找到RMSD值小于给定阈值的构象(如果能,则表示该模型能够覆盖当前测试构象),可以计算得到覆盖率 计算生成的构象集合与当前测试构象的最小RMSD值,取平均可以得到匹配程度的值。以上是从测试集的角度衡量模型表现(召回率) 相应地,将测试集构象与生成集构象在计算中对调,则可判断模型的准确率。目前常见的测试数据集包括GEOM-QM9和GEOM-Drugs[12]。2.2 模型方法构象生成模型沿着两个思路发展:直接生成各个原子的3D坐标 先生成原子对距离、二面角等中间参数,再将分子3D坐标还原。对于前者,技术难点在于保证模型对于输入分子的旋转-平移不变性(整体改变分子坐标,得到的构象是相同的,也即对齐过程)。对于后者,则可能生成不合法的中间参数(比如违反三角几何关系),或者中间参数的误差在训练过程中不断累积,影响分子3D坐标重构,需要进行后续的力场优化 但这是目前大多数方法所选取的道路。此处简要介绍最近发展的GeoDiff模型[13]和DMCG模型(Direct Molecular Conformation Generation)[14]。Xu等人于2022年提出GeoDiff,使用扩散模型直接生成原子坐标。GeoDiff在GEOM-Drugs数据集上测试集覆盖率可达约89%、匹配程度约0.86 Å,并且经过力场优化之后可以进一步提升模型表现。作者指出:在逆向扩散过程中(生成过程),如果某一时刻T的密度函数具有旋转-平移不变性,且逆向生成的条件概率函数具有旋转-平移不变性,则T时刻以前任意时刻的密度函数也具有旋转-平移不变性。同年, Zhu等人提出基于变分自编码器的DMCG模型,在GEOM-QM9和GEOM-Drugs数据集上均取得最优(对于后者,覆盖率约96%,匹配程度约0.70 Å)。作者指出:模型除了满足旋转-平移不变性外,对于对称结构还应当满足置换不变性(交换对称原子的坐标,得到的构象是相同的)。为此,计算任意旋转-平移操作以及对称原子置换操作下的两个结构的距离最小值,并将其引入损失函数中,以满足以上两种不变性。消融实验表明,如果不考虑这一项损失,则覆盖率将下降约20个百分点,匹配程度将提高约0.3 Å。2.3 讨论今年3月,Zhou等人[15]基于RDKit设计了一种简单的生成算法:使用RDKit分别采样二面角、采样几何片段、采样能量并生成相应的构象,随后按照能量大小进行聚类。在GEOM-QM9和GEOM-Drugs两个数据集上,与GeoDiff、DMCG等深度学习方法相比,该算法几乎在所有指标上取得SOTA。作者认为,目前的测试基准不足以覆盖实际应用中(如分子对接中)涉及的构象生成任务。  事实上,生成足够的分子构象不会降低测试构象集上的匹配程度和覆盖率(召回率),但可能降低生成构象集的相应指标(查准率)。而Zhou等人(包括Zhu等人的DMCG)并未在文中给出关于后者的模型评价,因此模型的实用性仍有待考察。另外,目前的构象生成方法均以单个配体的势能极小值作为优化目标,针对(已知口袋的)复合物中配体的构象生成模型仍有待开发。最后,GeoDiff模型与DMCG模型的发展也启示我们挖掘任务目标中蕴含的性质(对称性、不变性),在模型训练中引入合适的归纳偏置。  3. 机器学习打分函数3.1 评价指标Su等人[16]于2019年建立了一套打分函数的基准测试数据集CASF-2016。CASF-2016及其前身CASF-2013已被广泛用于评估打分函数的表现。同时,Su等人设计了四类指标分别考察打分函数的打分能力、排名能力、对接能力和筛选能力。打分能力通常以Pearson相关系数来衡量:考察天然蛋白复合物的计算打分值与实验结合常数的对数之间的线性相关性。排名能力通常以Spearman等级相关系数或Kendall等级相关系数来衡量:对于同一蛋白、不同配体的多个天然蛋白复合物结构,考察计算打分值给出的排名与实验结合常数给出的排名之间的匹配程度。对接能力以对接成功率衡量:对于单个复合物,在天然配体结合构象和一系列计算生成的诱饵分子构象(decoy)中,若计算打分最高者与真实结合构象的RMSD小于2 Å,则认为对接成功 对于多个复合物,进一步计算对接成功率。筛选能力以筛选成功率衡量:在天然配体和一系列其它配体分子中,计算打分前1%(5%、10%)结果里包含天然配体的比例。由此可见,打分能力直接以实验数据作为参考,是评估打分函数是否可靠的基本测试。排名能力是对打分能力的补充。打分能力越好,排名能力通常也越好 反之则未必成立(存在对实验结合常数进行非线性拟合的打分函数)。对接能力测试将计算生成的构象引入测试集中,因此更贴近实际对接操作、对于打分函数的选择更具参考意义。需要指出的是,对接能力测试给出的结果通常只能代表该打分函数的对接能力上限,在CASF-2016的测试中可能呈现分数虚高的情形(在测试中能够以90%的成功率在top-1中挑选出天然配体构象,但在实际应用中却不能达到这一表现)。这主要归结于实际应用中计算生成的构象不够充分。筛选能力涉及多种配体的对接,因此可视为对排名能力和对接能力的综合考察。3.2 模型方法针对打分函数的机器学习方法,前人已给出详尽的综述[17][18][19]。本文将展开介绍经典的ΔVinaRF20打分函数[20],以及最近发展的DeepDock[21]和RTMScore[22]。ΔVinaRF20由Wang等人于2016年提出,在CASF-2013、CASF-2016测试集上的各指标中均排名靠前[16][20]。具体地,在CASF-2016测试集上,ΔVinaRF20在打分能力和排名能力两个指标上分别以0.82和0.75取得最优,在对接能力上以89.1%(top1)仅次于Autodock Vina(90.2%),在正向筛选能力以42.1%(top1)取得最优、逆向筛选能力以15.1%(top1)位居第五(次于最优方法ChemPLP@GOLD约2.4%)。Wang等人指出:机器学习打分函数与经典的打分函数在这些指标中各有所长,前者长于打分,后者长于对接和筛选。因此作者拟结合二者优点:一方面对训练集进行数据增强,将计算生成的诱饵结构引入训练集中(同时计算估计亲和力作为标签),以提高机器学习打分函数的对接和筛选能力 另一方面使用随机森林方法对AutoDock Vina中的打分函数进行参数化修正(使用Δ-machine learning方法,类似残差拟合)。Méndez-Lucio等人于2021年提出的DeepDock方法在CASF-2016的正向筛选和逆向筛选能力评估中分别以43.9%和23.9%取得SOTA,但DeepDock给出的打分值与实验结合常数的对数之间不存在相关性(在训练过程中未引入实验结合常数的相关信息)。DeepDock方法使用二维分子图刻画配体、多面体网格点刻画蛋白质口袋(参考了MaSIF的编码框架[23]),分别学习蛋白质口袋与配体原子的节点表示 随后两两组合配体和靶蛋白的节点形成节点对,使用混合密度函数拟合节点对的距离分布(概率密度函数)。作者指出:相较于通过最小化距离误差来学习节点对距离的平均值,混合密度函数能够学习训练集中节点对多个可能的距离,从而更好地刻画构象预测任务中的多值特性。在DeepDock的基础上,Shen等人从两方面进行改进得到RTMScore:一方面,使用无向图编码蛋白质口袋残基,在编码过程中满足对于输入复合物坐标的旋转不变性 另一方面使用Graph Transformer模型以学习更深层次的特征。作者声称RTMScore在CASF-2016测试集上的对接能力和筛选能力达到SOTA,相较DeepDock得到大幅提升:对接成功率达到98.6%,正向筛选成功率达73.7%,逆向筛选成功率达38.9%。3.3 讨论DeepDock等方法的发展展现了图模型在捕获蛋白质-配体互作的潜力,以及直接拟合蛋白残基-配体原子距离似然函数的有效性。事实上,距离似然函数不仅能作为打分函数评估当前构象,还能够作为某种“势能面曲线”指导构象优化。此外,这些新近提出的DeepDock等方法有待更广泛的测试验证。在其它论文的评估实验中[24],RTMScore在对接能力中依旧表现最优。但考虑到缺少打分能力、排名能力等测试数据,后续仍需要更多的测试评估(尤其是将打分函数整合到完整的对接流程中)以验证这些方法的可靠性。  4. 机器学习自由能面4.1 评价体系拟合自由能面的模型直接处理盲对接任务,生成复合物构象。其中存在两类评价指标。一类指标评估计算准确性。通常以预测复合物(如果模型给出多个可能的构象,则选取打分值top-1者)中配体重原子RMSD小于2 Å所占的比例来衡量模型对接能力。一般以2 Å作为对接成功与否的判断阈值[10]。还有通过配体质心距离小于2 Å(或5 Å)所占的比例来考察模型是否能够找到正确的结合口袋。此外,为判断生成的配体构象在化学上是否合理,Corso等人额外考察了配体构象中存在位阻冲突(steric clash,配体内部重原子之间的距离是否小于0.4 Å)的比例。另一类指标评估计算效率 这在大型分子数据库的虚拟筛选过程中同样不可忽视。以对接一个分子所需的平均CPU(如果可能,使用并行加速)或GPU时间来衡量。4.2 模型方法拟合蛋白质-配体自由能面的机器学习方法最近得到逐步发展,代表性的方法包括EquiBind[1]、TANKBind[25]、DiffDock[10]。Stärk等人于2022年提出基于图几何深度学习的EquiBind方法,在机器学习方法直接预测蛋白质-配体结合构象这一问题中做出开创性贡献。该方法以随机的配体分子构象(比如使用RDKit生成的构象)作为输入,无需经过大规模的构象采样即可在约0.1 s的时间内给出复合物结构。由此给出的结构在寻找结合口袋的能力上与传统方法(如QuickVina-W)相当(配体质心距小于2 Å的比例均约40%),但在配体结合构象的预测上却表现不佳(配体RMSD小于2 Å的比例约6%,不及QuickVina、GLIDE等方法所达到的约20%)。虽然可以在该结构的基础上结合传统方法进一步微调配体位置和构象,但将增加预测所需的时间成本至数十秒或数百秒。同年,Lu等人提出TANKBind。相较于EquiBind,在保留推理速度(约0.5秒)的同时,TANKBind在配体构象预测上取得和传统方法相当的结果(配体RMSD小于2 Å的比例约19%),口袋预测能力则获得较大提升(配体质心距小于2 Å的比例约56%)。不同于EquiBind对整个蛋白质进行编码的方法,TANKBind采用P2Rank寻找口袋位置,随后针对该位置的蛋白质区块(由半径20 Å内的残基构成),拟合蛋白质残基与配体原子的距离。此外,受AlphaFold2的启发,TANKBind将三角几何约束引入残基与配体原子的距离建模中。消融实验表明,三角几何约束可以显著提升模型表现:配体RMSD小于2 Å的比例提升约15%,配体质心距小于2 Å的比例提升约12%。同年十月, Corso、Stärk等人提出DiffDock模型。该模型在对接准确性上首次实现了对传统对接模型的大幅超越。在holo态的蛋白晶体对接结果中,配体重原子RMSD小于2 Å所占的比例可达到38.2%,约为传统方法的两倍。这一结果对应于40次采样,消耗计算时间约40秒。与DeepDock想法类似,DiffDock使用生成模型来学习构象的概率分布并建立了一套相应的“扩散”方法(构象采样方法)。4.3 讨论今年2月,Yu等人[11]重新设计实验,考察了DiffDock等机器学习模型在盲对接任务中的哪一阶段领先传统方法、领先到何种程度。作者将盲对接任务拆分为口袋搜索和局部对接两个子任务,设计了三组实验:完全使用DiffDock等模型完成盲对接 使用其它方法搜索口袋(如前文所述的PointSite、P2Rank),使用Uni-dock[26](一种基于AutoDock Vina 1.2的GPU加速对接方法)局部对接 使用DiffDock搜索口袋,使用Uni-dock局部对接。结果表明:DiffDock方法在口袋搜索中效果更佳(相较于PointSite等方法而言,引入了配体分子的结构信息),但与ground truth、即表中的GT pocket相比仍存在提升空间 口袋确定,传统对接手段得到的结果优于DiffDock等机器学习模型。作者进一步指出:给定口袋下预测蛋白质-配体构象的机器学习方法是后续发展的方向(正如机器学习构象生成中所讨论的) 对于端到端的模型比较实验中,需要更审慎地评估传统方法的表现。另外,随着蛋白质结构预测方法的发展,评估模型在apo态蛋白质上的对接表现是有必要的,也是更符合实际情形的。事实上,目前几种模型所使用的训练集均为holo态蛋白(缺乏足够数量的与holo态对应的apo态蛋白结构)。为泛化模型的对接能力至apo态蛋白结构,通常采取折中方案:假定apo态与holo态的主链变动不大,而在模型编码过程中只使用主链碳原子的信息。DiffDock论文中首次评估了各种方法在ESMFold给出的蛋白质结构上的对接能力。结果显示,各模型的对接表现均显著下降(对于DiffDock而言,配体重原子RMSD小于2 Å所占的比例从38.2%下降至20.3%)。机器学习方法建模对接过程中蛋白质的结构变化仍然道阻且长。将分子动力学模拟过程中产生的动态信息引入模型中也许是一种可能的突破方向[27]。最后,正如AlphaFold2可作为打分函数评估蛋白质结构是否合理[3],DiffDock等拟合自由能面的模型,其在打分函数的各项评价指标中表现如何也值得进一步探究。  参考文献  [1] Equibind: Geometric deep learning for drug binding structure prediction  [2] Artificial intelligence–enabled virtual screening of ultra-large chemical libraries with deep docking  [3] State-of-the-Art Estimation of Protein Model Accuracy Using AlphaFold  [4] A Critical Comparative Assessment of Predictions of Protein-Binding Sites for Biologically Relevant Organic Compounds  [5] Improving detection of protein-ligand binding sites with 3D segmentation  [6] PointSite: A Point Cloud Segmentation Tool for Identification of Protein Ligand Binding Atoms  [7] P2RANK: Knowledge-Based Ligand Binding Site Prediction Using Aggregated Local Features  [8] P2Rank: machine learning based tool for rapid and accurate prediction of ligand binding sites from protein structure  [9] DeepSite: protein-binding site predictor using 3D-convolutional neural networks  [10] DiffDock: Diffusion Steps, Twists, and Turns for Molecular Docking  [11] Do Deep Learning Models Really Outperform Traditional Approaches in Molecular Docking?  [12] GEOM, energy-annotated molecular conformations for property prediction and molecular generation  [13] GeoDiff: a Geometric Diffusion Model for Molecular Conformation Generation  [14] Direct Molecular Conformation Generation  [15] Do Deep Learning Methods Really Perform Better in Molecular Conformation Generation?  [16] Comparative Assessment of Scoring Functions: The CASF-2016 Update  [17] Machine-learning methods for ligand-protein molecular docking  [18] Protein–Ligand Docking in the Machine-Learning Era  [19] From machine learning to deep learning: Advances in scoring functions for protein–ligand docking  [20] Improving scoring-docking-screening powers of protein–ligand scoring functions using random forest  [21] A geometric deep learning approach to predict binding conformations of bioactive molecules  [22] Boosting Protein–Ligand Binding Pose Prediction and Virtual Screening Based on Residue–Atom Distance Likelihood Potential and Graph Transformer  [23] Deciphering interaction fingerprints from protein molecular surfaces using geometric deep learning  [24]: A fully differentiable ligand pose optimization framework guided by deep learning and a traditional scoring function  [25] TANKBind: Trigonometry-Aware Neural NetworKs for Drug-Protein Binding Structure Prediction  [26] Uni-Dock: GPU-Accelerated Docking Enables Ultralarge Virtual Screening  [27] Pre-Training of Equivariant Graph Matching Networks with Conformation Flexibility for Drug Binding  本文作者:ZF责任编辑:WFZ
  • 解析人类蛋白质组草图公布
    1 人类蛋白质组草图公布   之前,尽管不少大型的蛋白质组数据集,已经收集约上万个蛋白数据,然而覆盖80%的人类蛋白质组的草图却并未绘制。此次的研究,则突破了这一局限。   该图谱由德国慕尼黑工业大学、约翰霍普金斯大学/印度生物信息研究所等机构的两个团队独立完成。其中,在印度生物信息研究所和美国约翰霍普金斯大学等机构绘制了17 924个基因编码的蛋白质草图,其总数约占人类基因总数的84% 而慕尼黑理工大学领衔的团队,则对19 629个基因编码的蛋白质绘制草图,其总数约占人类基因总数的92%。不过,印度和美国团队,与德国团队所采用的实验数据来源略有不同,印度和美国的研究者从30个人体组织的许多不同的样品及细胞系(包括7种胎儿组织和6种血细胞类型)中提取、纯化所有蛋白质,并用质谱技术揭示组成各蛋白片段的氨基酸序列,因而两种数据的分析方法相对统一 德国的团队所采用的数据从公共数据库收集获得,而后与实验室生成的数据合并完成分析。在德国的研究中,慕尼黑工业大学的Bernhard Kü ster等人建立了搜索性公共数据库ProteomicsDB,而公共数据库收集获得的质谱分析数据约占ProteomicsDB数据的60%,其他的数据来自于60个人类组织体液,13个体液,147个癌细胞系。   这些蛋白大多为健康人群中组织和器官中表达的蛋白,对于理解疾病状态下发生的变化,具有现实的意义,如德国团队完成的数据能用于识别数百个翻译的基因间非编码RNAs(lincRNAs),比较分析通过蛋白质对癌症药物的敏感性,发现mRNA和组织中蛋白的定量关系等。同时,这两项研究也发现了许多新蛋白,而编码这些蛋白的基因之前被认为位于基因组的非编码区域,因而也丰富了对于遗传学研究的认识。   2 研究团队的基本背景   此次研究的美国和印度团队,由约翰霍普金斯大学的副教授Akhilesh Pandey领衔,而他也是印度生物信息学研究所首席科学顾问。此前,印度生物信息学研究所和约翰霍普金斯大学的生物信息学团队就有广泛的合作,例如两个机构的26名科学家经过18个月的努力,排列出了人类的X染色体顺序,并将其与黑猩猩、老鼠的基因组相比较,发现了新基因。   慕尼黑工业大学的化学和功能蛋白质组学分析者Bernhard Kü ster,其研究的主要领域是探索蛋白质的相互作用及其与活性药物成分的相互作用,分析癌症发生发展的分子机制,以及开发相应的临床治疗方法。作为研究者,Bernhard Kü ster也曾参与了蛋白质组技术平台上具有雄厚基础的Cellzome公司的发明(新的酶相互作用化合物的方法)。而Cellzome公司的药物研发平台,可对于特定蛋白相互作用的药物进行筛选,其具有高度的灵敏性,而葛兰素史克(GSK)公司也正在看中了这一点已将其并购。   3 中国人类蛋白质组计划(CNHPP)   在人类蛋白质组草图公布的同时,&ldquo 中国人类蛋白质组计划(CNHPP)&rdquo 已经由科技部正式批准启动实施。此前,中国科学家已倡导并领衔人类第一个器官(肝脏)国际蛋白质组计划(HLPP)。   在&ldquo 中国人类蛋白质组计划&rdquo 中,&ldquo 激光解析基体辅助离子源-蛋白测序仪器&rdquo 课题是重点研究方向之一,致力于蛋白质测序仪器和试剂国产化,从而加速蛋白质组学和生物质谱技术在临床领域的研究与应用。   4 蛋白质组测序技术的开发   蛋白质组是一个细胞、组织、有机体在一定时间内表达的所有蛋白质(总蛋白质)。对蛋白质组进行系统的、全面的研究,而快速、准确、低成本的蛋白质分离纯化技术(如双向电泳、计算机图像分析与大规模数据处理技术以及质谱技术等)的发展,则是系统、全面研究的基础。有了基因组计划和基因组测序技术的发展经验,人类在蛋白质组草图公布的前后,也就有了对低成本、高效率的蛋白质组测序技术的格外重视。例如,亚利桑纳州立大学的Stuart Lindsay团队正在致力于研究让单链肽段穿过纳米孔的技术,从而将纳米孔单分子DNA测序技术(第三代基因测序技术,采用纳米孔的单分子读取,与之前的测序技术测序时间长、价格比较昂贵、测序分子需要大量扩增、还需要进行荧光标记等相比,第三代测序技术读取数据更快,测序成本明显降低)的设计理念应用于蛋白质组的测序,开发蛋白质单分子测序技术。   5 蛋白质组学与个性化医疗   人类蛋白质组草图的成果表明,有数百种蛋白质是由此前认为不具备相关功能的DNA片段(脱氧核糖核酸)及&ldquo 假基因&rdquo 形成。这也说明了基因组和蛋白质组之间的巨大差别。例如,表观遗传研究的核心内容即是基因的拼接和翻译后修饰,而蛋白质随时间和空间的动态变化等,使得蛋白质组的研究远比基因组研究复杂。   尽管目前的个性化医疗以基因解析为特征,然而真正衔接基因型与疾病表型的还是蛋白质。随着蛋白质组测序技术的快速发展,也许蛋白质组学的研究会带动个性化医疗新的发展阶段。   本文作者:中国科学院上海生命科学信息中心 于建荣 江洪波。
  • Science:人类蛋白质图谱分析大进展
    2015年1月23日一期的Science公布了基于人类蛋白质图谱的大分析结果,包括与癌症相关的详细蛋白质图片,血液中蛋白质种类和数量,以及市场上被批准的所有药物所作用的目标蛋白质。 人类蛋白质图谱(The Human Protein Atlas),是由Knut and Alice Wallenberg基金会于2014年11月支持的一个大型跨国研究项目。近期他们又开放了一个以人器官组织为基础的蛋白质图谱数据库。基于1300万个注释的图像,整个数据库涵盖了人体中的所有主要组织和器官的蛋白质分布,也标注了仅表达在特定组织,如脑,心脏或肝脏的蛋白。作为一个开放的数据资源,这个数据库提高了对人类生物学的基本见解,更有望帮助推动新的诊断和药物的开发。 在Science的这篇文章里,"基于组织的人类蛋白质组图谱" 结合基因组学,转录组学,蛋白质组学,以及基于抗体的分析,详细分析了大约20,000个蛋白质编码基因。分析结果表明,蛋白编码基因几乎一半都是普遍表达在所有分析的组织。而有大概的15%的蛋白质编码基因大量表达在一个或几个特定的组织或器官,包括众所周知的组织特异性蛋白质,如胰岛素和肌钙蛋白。睾丸是含有最丰富种类蛋白质的器官,其后是大脑和肝脏。分析结果还表明,大约3000种蛋白质是从细胞中分泌释放的,另有5500种蛋白位于细胞膜结构。 这一蛋白质图分析结果为制药行业的提供了重要信息。研究小组的Uhlé n表示,他们发现了市场上使用的药品有70%的作用目标是分泌或膜结合蛋白。有趣的是,另外30%被发现是作用其他组织和器官,这可能有助于解释药物的一些副作用,并且对未来药物开发提供一定的参考价值。 该数据库已经免费对外开放,网址是www.proteinatlas.org.

蛋白质编码器相关的方案

蛋白质编码器相关的资料

蛋白质编码器相关的试剂

蛋白质编码器相关的论坛

  • 蛋白质与多肽蛋白质粉

    蛋白质与多肽蛋白质粉 人类的营养物质有许多种类,最为重要的为蛋白质,碳水化合物和脂肪,其它则是微量营养物质,如维生素、电解质和微量元素等。虽然每一种营养物质对人体来说都是不可或缺的,但绝大多数的营养学家都会有充分的理由认为,真正最重要的营养物质是蛋白质。一、蛋白质是构成人体的基本物质。 蛋白质是由氨基酸通过肽链相连而构成的,它是人体包括骨骼、肌肉、皮肤和脑的重要物质基础,同时氨基酸也是生成核酸的基本物质。我们知道,核酸既形成遗传密码,也是体内储存能量的基本物质。因而从根本上说,人体是由蛋白质组成的。构成人体蛋白质的生理功能概括有如下三个方面:1)人体组织的主要构成成份:如肌肉、骨骼、血液、皮肤、神经、肝、心等等。2)具有特殊生理功能:可以这样说,人类的一切生理活动都与蛋白质有关。如酶蛋白能催化机体的一切化学反应,包括蛋白质、脂肪、碳水化合物的消化等;载脂蛋白运送脂肪;血红蛋白运送氧;激素蛋白调节代谢与生理活动包括情感;血浆白蛋白调节渗透压、运输金属离子、胆红素和抗生素等。3)供给机体能量:成年人每日约需要更新400g蛋白质,每克蛋白质彻底分解能释放出约4 Kcal的热量。4)为机体提供氮原料:人体内所必需的嘧啶、嘌呤、肌酸、胆碱、肾上腺素、肉碱、牛磺酸等,都是以多肽、氨基酸为原料的。表1. 世界粮食组织(FAD)和世界卫生组织(WHO)根据中国人的体质和膳食结构推荐的中国人蛋白质的摄入量(RNLs)。年 龄蛋白质RNL(g/d) 初生—6个月 1.5-3 1岁 35 3岁 45 5岁 55 7岁 60 9岁 65 10-16岁 75-85 成年女性 65 成年男性 75 妊娠 +15 乳母 +20 根据统计资料:由于贫困、工作紧张、精神压力、减肥节食、以及肠胃疾病、癌症、贫血、肾病、各种结核病、肝硬化、腹水、烧伤、失血等,以及老龄人均不同程度地存在着蛋白质的摄入不足。 上世纪80年代以来,我国营养学家对7个省18个贫困地区,1万名学龄前儿童进行了为期4年的连续调查,发现营养不良现象非常严重,其中蛋白质的摄入量不足WHO规定的60%。近年社会医学工作调查,在发达地区由于生活节奏加快,精神压力异常增加,以及办公室白领阶层的减肥节食,也导致蛋白质摄入不足,代谢异常的人群增加。二、蛋白质缺乏的体征和临床症状 单纯的蛋白质营养不良又叫加西长病,这或许是来源于非洲的单词,单纯的能量不足时叫消瘦;临床上通常把这两种现象叫单纯性蛋白质能量营养不良症或PEM。单纯的PEM症在临床上较少见到,但在慢性消耗性疾病患者中则常见,尤其是在癌症患者和艾滋病的患者中几乎占到90%以上。 现代都市和贫困地区存在着相当数量的蛋白质营养不良族群,他们的临床表现主要是能量损失或不足,如体力不支、睡眠不安、怕冷、怕热、性冷淡、无法进行正常的体力劳动和运动,其次为肌肉组织萎缩、皮肤松驰;腿部、脸部易水肿、脂肪肝、无名皮疹、伤口愈合不良、记忆力下降、视力减弱等。再者免疫力低下易感冒、感染。在做血检时通常会发现这些族群的血浆蛋白处于正常值的下限,其中白蛋白、转铁蛋白、甲状腺素结合前体蛋白和视轴蛋白(retinol-binding protein)均处于低水平时,患者易于感染各种疾病并且出现早衰症状,如果是儿童则感染后死亡率增加30%-40%,对于这类人群WHO的专家最好的建议就是迅速补充优质(或全价)的蛋白质。三、优质蛋白质和劣质蛋白质的区别。 要弄清楚何为优质蛋白质?何为劣质蛋白质?我们要引入什么是必需氨基酸的概念。营养生理学家、生化学家发现构成人体蛋白质的氨基酸共有21种,而这些氨基酸中其中有4种是可以由体内含碳和含氮底物自己合成的,被称为非必需氨基酸,还有10个必需的氨基酸,是人类机体无法制造需要从饮食中摄取的,另有7个是介于这两者之间的被称为条件必需氨基酸。表2. 必需、条件必需和非必需氨基酸 必需氨基酸条件必需氨基酸 非必需氨基酸 亮氨酸牛黄酸 丙氨酸 异亮氨酸酪氨酸 谷氨酸 缬氨酸甘氨酸 天冬氨酸 赖氨酸丝氨酸 天冬酰胺 苯丙氨酸(酪氨酸)脯氨酸 蛋氨酸(半胱氨酸)谷氨酰酸 苏氨酸 胱氨酸 色氨酸 组氨酸 精氨酸 虽然蛋白质广泛存在于许多动物性和植物性食物中,但是必需氨基酸的构成异差很大,WHO把“蛋白质其组成恰好符合人体需要”的蛋白质称为理想蛋白质,在自然界这种理想的蛋白质普遍认为是鸡蛋蛋白,因此就把鸡蛋蛋白作为衡量蛋白质优劣的参照蛋白,科学家把它作为一把尺子来衡量各种蛋白质,并制定出标准,以4种必需氨基酸为最低限来决定其优劣,即色氨酸、苏氨酸、赖氨酸或者蛋氨酸(半胱氨酸)。 通过比较科学发现,肉、鱼、蛋、牛奶、乳酪含有优质蛋白,大豆、花生、豌豆也含有较多的高质量蛋白。进一步研究发现它们都不够完美,因而要求大家对优质的动物性蛋白和植物性蛋白进行了科学搭配才是最完美的全价蛋白质(complete protein)。表3. 部分高质量蛋白

  • 蛋白质数据库介绍

    蛋白质数据库1.PIR和PSDPIR国际蛋白质序列数据库(PSD)是由蛋白质信息资源(PIR)、慕尼黑蛋白质序列信息中心(MIPS)和日本国际蛋白质序列数据库(JIPID)共同维护的国际上最大的公共蛋白质序列数据库。这是一个全面的、经过注释的、非冗余的蛋白质序列数据库,包含超过142,000条蛋白质序列(至99年9月),其中包括来自几十个完整基因组的蛋白质序列。所有序列数据都经过整理,超过99%的序列已按蛋白质家族分类,一半以上还按蛋白质超家族进行了分类。PSD的注释中还包括对许多序列、结构、基因组和文献数据库的交叉索引,以及数据库内部条目之间的索引,这些内部索引帮助用户在包括复合物、酶-底物相互作用、活化和调控级联和具有共同特征的条目之间方便的检索。每季度都发行一次完整的数据库,每周可以得到更新部分。PSD数据库有几个辅助数据库,如基于超家族的非冗余库等。PIR提供三类序列搜索服务:基于文本的交互式检索;标准的序列相似性搜索,包括BLAST、FASTA等;结合序列相似性、注释信息和蛋白质家族信息的高级搜索,包括按注释分类的相似性搜索、结构域搜索GeneFIND等。PIR和PSD的网址是:http://pir.georgetown.edu/。数据库下载地址是:ftp://nbrfa.georgetown.edu/pir/。2. SWISS-PROT SWISS-PROT是经过注释的蛋白质序列数据库,由欧洲生物信息学研究所(EBI)维护。数据库由蛋白质序列条目构成,每个条目包含蛋白质序列、引用文献信息、分类学信息、注释等,注释中包括蛋白质的功能、转录后修饰、特殊位点和区域、二级结构、四级结构、与其它序列的相似性、序列残缺与疾病的关系、序列变异体和冲突等信息。SWISS-PROT中尽可能减少了冗余序列,并与其它30多个数据建立了交叉引用,其中包括核酸序列库、蛋白质序列库和蛋白质结构库等。利用序列提取系统(SRS)可以方便地检索SWISS-PROT和其它EBI的数据库。SWISS-PROT只接受直接测序获得的蛋白质序列,序列提交可以在其Web页面上完成。SWISS-PROT的网址是:http://www.ebi.ac.uk/swissprot/。3. PROSITEPROSITE数据库收集了生物学有显著意义的蛋白质位点和序列模式,并能根据这些位点和模式快速和可靠地鉴别一个未知功能的蛋白质序列应该属于哪一个蛋白质家族。有的情况下,某个蛋白质与已知功能蛋白质的整体序列相似性很低,但由于功能的需要保留了与功能密切相关的序列模式,这样就可能通过PROSITE的搜索找到隐含的功能motif,因此是序列分析的有效工具。PROSITE中涉及的序列模式包括酶的催化位点、配体结合位点、与金属离子结合的残基、二硫键的半胱氨酸、与小分子或其它蛋白质结合的区域等;除了序列模式之外,PROSITE还包括由多序列比对构建的profile,能更敏感地发现序列与profile的相似性。PROSITE的主页上提供各种相关检索服务。PROSITE的网址是:http://www.expasy.ch/prosite/。4. PDB蛋白质数据仓库(PDB)是国际上唯一的生物大分子结构数据档案库,由美国Brookhaven国家实验室建立。PDB收集的数据来源于X光晶体衍射和核磁共振(NMR)的数据,经过整理和确认后存档而成。目前PDB数据库的维护由结构生物信息学研究合作组织(RCSB)负责。RCSB的主服务器和世界各地的镜像服务器提供数据库的检索和下载服务,以及关于PDB数据文件格式和其它文档的说明,PDB数据还可以从发行的光盘获得。使用Rasmol等软件可以在计算机上按PDB文件显示生物大分子的三维结构。RCSB的PDB数据库网址是:http://www.rcsb.org/pdb/。5. SCOP蛋白质结构分类(SCOP)数据库详细描述了已知的蛋白质结构之间的关系。分类基于若干层次:家族,描述相近的进化关系;超家族,描述远源的进化关系;折叠子(fold),描述空间几何结构的关系;折叠类,所有折叠子被归于全α、全β、α/β、α+β和多结构域等几个大类。SCOP还提供一个非冗余的ASTRAIL序列库,这个库通常被用来评估各种序列比对算法。此外,SCOP还提供一个PDB-ISL中介序列库,通过与这个库中序列的两两比对,可以找到与未知结构序列远缘的已知结构序列。SCOP的网址是:http://scop.mrc-lmb.cam.ac.uk/scop/。6. COG蛋白质直系同源簇(COGs)数据库是对细菌、藻类和真核生物的21个完整基因组的编码蛋白,根据系统进化关系分类构建而成。COG库对于预测单个蛋白质的功能和整个新基因组中蛋白质的功能都很有用。利用COGNITOR程序,可以把某个蛋白质与所有COGs中的蛋白质进行比对,并把它归入适当的COG簇。COG库提供了对COG分类数据的检索和查询,基于Web的COGNITOR服务,系统进化模式的查询服务等。蛋白质直系同源簇(COGs)数据库是对细菌、藻类和真核生物的21个完整基因组的编码蛋白,根据系统进化关系分类构建而成。COG库对于预测单个蛋白质的功能和整个新基因组中蛋白质的功能都很有用。利用COGNITOR程序,可以把某个蛋白质与所有COGs中的蛋白质进行比对,并把它归入适当的COG簇。COG库提供了对COG分类数据的检索和查询,基于Web的COGNITOR服务,系统进化模式的查询服务等。COG库的网址是:http://www.ncbi.nlm.nih.gov/COG。下载COG库和COGNITOR程序在:ftp://ncbi.nlm.nih.gov/pub/COG

  • 蛋白质化学与蛋白质组学(推荐)

    蛋白质化学与蛋白质组学夏其昌 曾嵘 等编著2004年4月出版ISBN 7-03-012401-4/Q.133116开,平装,580页定价: 75.00元 本书系统论述了蛋白质化学基础理论和实验技巧,也反映了蛋白质组学研究的最新成果。内容包括:蛋白质的表征,蛋白质的组成分析和序列测定,与此相关的实验方法,包括各种色谱、电泳、质谱技术等,以及应用在蛋白质表征研究和基因工程产品的质检方面的实际范例。在蛋白质组学领域介绍了基本概念、样品制备、双向凝胶电泳的图像分析和定量分析、质谱等常规方法,并介绍了国际上最新的多维技术在研究中的应用;同时充分体现了生物信息学在蛋白质组研究中的重要性。 本书可作为生物学、医学、化学专业大学生,研究生和教学人员的参考书,也是从事生物化学、分子生物学、医学等领域中分离分析工作人员的参考书。

蛋白质编码器相关的耗材

  • 蛋白质组学级胰蛋白酶
    用于LC/MS 分析的蛋白质组学试剂安捷伦复杂的蛋白质组学标准品是含有1500 种蛋白的Pfu 蛋白提取物。与我们的TPCK-处理的蛋白质组学级胰蛋白酶一起使用,为LC/MS 生物标志物发现和其它蛋白质组学研究提供了理想的工作流程验证组合。订货信息:
  • 蛋白质标记试剂盒
    蛋白质标记试剂盒Protein Labeling kit 包含荧光染料,试剂和纯化柱,用于蛋白质微阵列的高品质以及产生直接标记蛋白质。简单,易于使用,灵活的实验方案可以与抗体,第二免疫球蛋白,酶和其它蛋白质一起使用。蛋白质标记试剂盒Protein Labeling kit 提供的胺染料是绝佳的Cy3和Cy5染料替代品,可以用于最普及的微阵列扫描仪。染料的吸收和发射波长都适用于扫描器过滤器,无需购买新的过滤设置。 编号 名称 蛋白质2颜色荧光标记试剂盒
  • 安捷伦蛋白质 230 试剂
    使用 2100 生物分析仪系统进行蛋白质电泳是快速、自动进行蛋白质和肽谱表征、质量控制和杂质检测的一种客观、灵活的解决方案。Agilent Protein 80 和 Protein 230 分析可提供与考马斯亮蓝染色法相当的灵敏度。该系统无需 SDS-PAGE 平板凝胶处理、染色或成像步骤,使工作流程更加高效。使用生物分析仪系统评估的样品类型包括蛋白质裂解物、纯化蛋白质和多肽、还原态和非还原态抗体以及蛋白质的稳定性检测。 可根据分子量测定范围灵活选择合适的试剂盒。样品消耗量极少,仅需 4 µL 样品即可完成准确分析。可在约 30 分钟内自动分析 10 个样品,快速得到分析结果。可在一次分析中进行完整的数据分析,提供分子量、定量和纯度信息。可在整个宽线性动态范围内提供与考马斯亮蓝染色法相当的灵敏度。可利用安全包满足 GMP 和 GLP 要求,安全包是一款可选的附带软件,满足 21 CFR Part 11 法规认证的要求。
Instrument.com.cn Copyright©1999- 2023 ,All Rights Reserved版权所有,未经书面授权,页面内容不得以任何形式进行复制