当前位置: 仪器信息网 > 行业主题 > >

基因组重排

仪器信息网基因组重排专题为您整合基因组重排相关的最新文章,在基因组重排专题,您不仅可以免费浏览基因组重排的资讯, 同时您还可以浏览基因组重排的相关资料、解决方案,参与社区基因组重排话题讨论。

基因组重排相关的资讯

  • 基因组重排再造出超级酵母
    p style=" text-indent: 2em " 天津大学元英进教授带领的合成生物学团队,继人工合成酵母染色体打破非生命物质和生命物质界限后,日前首次利用精确控制基因组重排技术,培养出了能几何级生长的“超级酵母菌”。该成果填补了国内基因组结构变异的技术空白,提高了细胞工厂生产效率。该研究成果的三篇相关论文在《自然通讯》期刊同期发表。 /p p style=" text-indent: 2em " 据介绍,以前的DNA变异技术大多只针对基因层面进行小规模改造,在更加复杂的基因组结构变异层面的人工构建技术仍具有挑战。& nbsp & nbsp & nbsp & nbsp /p p style=" text-indent: 2em " 天津大学科研团队正是瞄准这一难题,研究出能够精准控制基因重排的方法,使作为研究对象的合成型酵母菌,在有限时间内产生几何级增长的基因组变异,驱动其快速进化生长。 /p p style=" text-indent: 2em " 为了能够精准调控合成型酵母基因组重排过程,天地大的科研人员特意为细胞设计了一把“入门锁”,打开这把“锁”要用两把“钥匙”,只有两把“钥匙”同时转动的状态下,细胞内的基因组重排才会开启。而这两把“钥匙”就是添加到菌株培养基中的两种物质——半乳糖和雌激素。在它们的互相作用下,通过使用这一精准控制技术对合成型酵母基因组进行多轮迭代重排,酵母种类多样性得到了极大丰富。科研人员从中筛选出大量高产β-胡萝卜素的菌株,经过5轮迭代基因组重排,合成型酵母菌中β-胡萝卜素产量提升了38.8倍。 /p p style=" text-indent: 2em " 在此基础上,研究人员还分别通过杂合二倍体基因组重排和跨物种基因组重排,获得了可以在摄氏42度温度下生长加快的菌株和咖啡因耐受性明显增强的酵母菌株。英国帝国理工大学的研究者们也利用天津大学合成型5号染色体的酵母菌进行基因组重排,实现底盘细胞的快速进化,显著提升了酵母紫色杆菌素合成能力和五碳糖代谢利用能力。 /p p style=" text-indent: 2em " 这一研究未来对提升能源医药化学品的生产合成,对于工业菌株进化和功能知识发现具有重要意义。上述研究还得到国家自然科学基金委、科技部973计划以及国际合作项目的支持。 /p
  • 从人类基因组草图到完全图谱 ——论基因组重复片段研究
    从人类基因组草图到完全图谱——论基因组重复片段研究作者:李东卫,张玉波(中国农业科学院农业基因组研究所,“岭南现代农业”广东省实验室,深圳 518120)2001年发表的人类基因组草图并没有包含全部的基因组序列,直到二十年后,科学家们才正式宣布完成了人类全序列基因组图谱,这其中主要的技术障碍就是重复片段的测序工作。重复片段(segmental duplications,SDs)是指广泛存在于基因组中的大于1 kb且序列相似性超过90%以上的大片段。它们可以通过基因组重排及拷贝数变异产生新基因和驱动进化,其大量存在于子端粒中,并与哺乳动物细胞复制性衰老以及癌症等重要生物学过程密切相关,一直以来备受科学家关注。但是其序列特点使得常规的测序技术难以完全准确测出全部序列,是基因组组装工作的一个难点。人类基因组全图谱的完成将重复片段在生物体进化、延缓衰老、疾病治疗等方面的研究提供基础。本文将就重复片段的重要性,研究的技术难点,研究现状以及未来展望等方面展开论述。重复片段的重要性重复片段是基因组中序列高度相同的大片段,具有广泛的结构多样性。它们占人类参考基因组(T2T-CHM13)中的7.0%,长度为218 Mbp[2 ],在中心体及子端粒区域富集高达10倍。中心体所包含的5个典型重复为:α卫星,β卫星,CER卫星,γ卫星,CAGGG重复,以及重复子4。子端粒所包含的典型重复为:端粒相关重复(TAR)以及传统的(TTAGGG)n重复[4 ]。重复片段可以介导染色体重排,使常染色体和异染色体之间通过同源重组产生镶嵌类型的重复的染色质[5 ]。在最近新鉴定的人类重复片段中,Mitchell R等预测了182个新的候选蛋白编码基因,并使用T2T-CHM13基因组重构了重复基因(TBC1D3,SRGAP2C,ARHGAP11B),这些基因在人额皮质增生中具有重要作用,揭示了重复片段结构在人和他们近亲物种之间的巨大进化差异[6 ]。大量的染色体子端粒区含有重复片段[8 ]。复制性衰老被认为是一种抗癌机制,限制细胞增殖。长寿的有机体经历更多的细胞分裂,因此具有更高的产生肿瘤的风险。端粒酶能够增加端粒的长度,促进癌细胞不断增殖,因此长寿动物体细胞倾向于抑制端粒酶的活性,从而抑制肿瘤发生的风险[10 ]研究难点:大片段长度、多拷贝数、序列高度相似 重复片段的大的片段长度,多拷贝数以及序列的高度相似是长期以来其研究的难点。各种测序技术的发展致力于解决这个问题。重复片段长度范围是1到400 kb [12 ]。而且,标准的长读段校正工具,例如MUMmer 或Minimap2不能够有效的捕捉低相似的重复片段,也经常将重复片段与其它调控元件混淆[14 ],为重复片段的研究带来机遇。尤其是PacBio的HiFi读段,具有长读段的同时还具有较高的准确度。但是,很多重复片段的长度要比HiFi读段的平均长度要长,因此很难完全准确的进行组装[3 ]。染色体重排,尤其是染色质断裂常发生在高GC区域[16 ]。同时,在T2T-CHM13基因组基础上,Mitchell R等首次进行了全基因组重复片段的研究。与当前人类参考基因组(GRCh38)鉴定的167 Mbp复制片段相比,鉴定了更多的(218 Mbp)非冗余重复片段(图2 a, b)。新发现91%的重复片段能更好地代表人的拷贝数,通过与非人灵长类基因组相比,前所未有的揭示了人类和其它近亲在重复片段结构中的杂合性以及广泛的进化差异[17 ]。图2 T2T-CHM13中新鉴定的染色体内(a)与染色间(b)的重复片段[1 ]。利用重复片段解析衰老机制未来可期新组装的T2T-CHM13的拷贝数比GRCh38高9倍,因此它能更好的呈现人类拷贝数变异。通过鉴定新基因的拷贝数变异,可筛选相应的药物治疗靶点。例如,CHM13鉴定到LPA、MUC3A、FCGR2基因的拷贝数变异与疾病相关[1]。此外,对于尚具争议的疾病标志基因,例如乳腺癌中ESR1 基因[18],可以通过CHM13对其进行分子进化分析,进而鉴定其突变和扩增,确定其在乳腺癌中的作用。尽管端粒作为抗衰老靶标已研究多年,但是端粒长短变化与复制性衰老的关系仍不清楚。细胞减数分裂过程中端粒变短的机制是什么?重复片段拷贝数变异与端粒变短有无相关性?很多研究已证明端粒酶具有延长端粒长度的作用,具体的机制是什么?这些问题因此前端粒不能被准确测序而长期未解决。现在,人类基因组完全图谱已基本实现,相信这些谜团会很快解开。未来可以根据人类年龄增长过程中端粒重复片段的拷贝数变异,解析其抗衰老的机制。通过人为干预其拷贝数,可能用于探索生命的极限。1. Vollger MR, Guitart X, Dishuck PC, Mercuri L, Harvey WT, Gershman A, Diekhans M, Sulovari A, Munson KM, Lewis AM et al.Segmental duplications and their variation in a complete human genome. bioRxiv.2021:2021.2005.2026.445678.2. Prodanov T, Bansal V.Sensitive alignment using paralogous sequence variants improves long-read mapping and variant calling in segmental duplications. Nucleic Acids Research.2020 48(19).3. Bailey JA, Yavor AM, Massa HF, Trask BJ, Eichler EE.Segmental duplications: Organization and impact within the current Human Genome Project assembly. Genome research.2001 11(6):1005-1017.4. Courseaux A, Richard F, Grosgeorge J, Ortola C, Viale A, Turc-Carel C, Dutrillaux B, Gaudray P, Nahon JL.Segmental duplications in euchromatic regions of human chromosome 5: a source of evolutionary instability and transcriptional innovation. Genome research.2003 13(3):369-381.5. Giannuzzi G, Pazienza M, Huddleston J, Antonacci F, Malig M, Vives L, Eichler EE, Ventura M.Hominoid fission of chromosome 14/15 and the role of segmental duplications. Genome research.2013 23(11):1763-1773.6. Young E, Abid HZ, Kwok PY, Riethman H, Xiao M.Comprehensive Analysis of Human Subtelomeres by Whole Genome Mapping. PLoS genetics.2020 16(1):e1008347.7. Lander ES, Linton LM, Birren B, Nusbaum C, Zody MC, Baldwin J, Devon K, Dewar K, Doyle M, FitzHugh W et al.Initial sequencing and analysis of the human genome. Nature.2001 409(6822):860-921.8. Seluanov A, Chen ZX, Hine C, Sasahara THC, Ribeiro AACM, Catania KC, Presgraves DC, Gorbunova V.Telomerase activity coevolves with body mass not lifespan. Aging Cell.2007 6(1):45-52.9. Bromham L.The genome as a life-history character: why rate of molecular evolution varies between mammal species. Philos T R Soc B.2011 366(1577):2503-2513.10. Shay JW.Role of Telomeres and Telomerase in Aging and Cancer. Cancer discovery.2016 6(6):584-593.11. Sharp AJ, Locke DP, McGrath SD, Cheng Z, Bailey JA, Vallente RU, Pertz LM, Clark RA, Schwartz S, Segraves R et al.Segmental duplications and copy-number variation in the human genome. American journal of human genetics.2005 77(1):78-88.12. Hartasanchez DA, Braso-Vives M, Heredia-Genestar JM, Pybus M, Navarro A.Effect of Collapsed Duplications on Diversity Estimates: What to Expect. Genome Biol Evol.2018 10(11):2899-2905.13. Numanagic I, Gokkaya AS, Zhang L, Berger B, Alkan C, Hach F.Fast characterization of segmental duplications in genome assemblies. Bioinformatics.2018 34(17):i706-i714.14. Vollger MR, Dishuck PC, Sorensen M, Welch AE, Dang V, Dougherty ML, Graves-Lindsay TA, Wilson RK, Chaisson MJP, Eichler EE.Long-read sequence and assembly of segmental duplications. Nature methods.2019 16(1):88-94.15. Rhie A, McCarthy SA, Fedrigo O, Damas J, Formenti G, Koren S, Uliano-Silva M, Chow W, Fungtammasan A, Kim J et al.Towards complete and error-free genome assemblies of all vertebrate species. Nature.2021 592(7856):737-+.16. Nurk S, Koren S, Rhie A, Rautiainen M, Bzikadze AV, Mikheenko A, Vollger MR, AltemoseN, Uralsky L, Gershman A et al.The complete sequence of a human genome. bioRxiv.2021:2021.2005.2026.445798.17. Zhu Y, Liu X, Ding X, Wang F, Geng X.Telomere and its role in the aging pathways: telomere shortening, cell senescence and mitochondria dysfunction. Biogerontology.2019 20(1):1-16.18. Tabarestani S, Motallebi M, Akbari ME.Are Estrogen Receptor Genomic Aberrations Predictive of Hormone Therapy Response in Breast Cancer? Iranian journal of cancer prevention.2016 9(4):e6565.
  • 趋势:未来癌症研究将走向全基因组测序
    癌症是由遗传因素、环境因素等多因素导致的复杂疾病。因其个性化的特点-每个人/甚至不同细胞都具有独特的遗传突变,从而加大了癌症治疗及监测的难度。而高通量测序技术的发展为我们带来了契机,不仅可以加速揭开癌症的病因及机制,更进一步使个性化医疗成为现实。   2014年之前由于全基因组重测序价格仍然高昂,科研人员不得不舍弃部分遗传信息(如基因融合、染色体重排等),而选择外显子组测序&mdash &mdash 仅针对编码区的SNP/InDel进行检测。随着全基因组测序成本不断下降,尤其是诺禾致源公司引进的X-Ten平台,率先推出&ldquo 万元基因组&rdquo 测序活动,使得国内的全基因组测序变得更便宜更快捷,因此,全基因组重测序已成为癌症研究的最佳选择。   全基因组重测序的必要性   2011年,Chapman等人在Nature上利用多发性骨髓瘤样本对全基因组与全外显子组测序进行了比较,结果表明多发性骨髓瘤中一半的蛋白质编码突变都是通过染色体畸变(如易位)发生的,故大部分突变都无法通过外显子组测序发现。相对于全外显子组测序,人类基因组重测序已在检测基因融合,基因组突变,染色体碎裂和染色体重排等研究中屡建奇功。   癌症研究中重要的遗传信息   基因组突变   所有癌症在发展过程中都会积累大量体细胞突变,其中司机突变(Driver mutations)是对癌症发展很关键的体细胞突变,而剩下的就被称为乘客突变(Passenger mutations)。2011年Berger等人在Nature上发表了原发性人类前列腺癌及其配对正常组织的完整基因组序列研究。一些肿瘤包含复杂的平衡重排链(拷贝数中性),它们通常发生在已知癌症基因中或附近。而一些断裂点发生在基因间区域,可能会因外显子组测序错过,因此,这篇文章例证了有些突变(如文章中类似于基因间区域的非编码区)只有也只能通过全基因组测序才能检测出来。   基因融合   基因融合在基因组中非常普遍,也是一些类型癌症的标志。基因融合是由两个不相关的基因发生融合形成的一种基因产物,该产物具有全新的功能或与两个融合基因不同的功能。配合末端配对(Paired end, PE)测序技术使用的全基因组测序是目前检测所有基因融合的最准确、最全面的工具,对这些基因融合的检测包括了重复、倒位、覆盖和单碱基插入缺失各种类型。2014年,癌症基因组图谱(TCGA)联盟采用全基因组重测序和全外显子组测序结合的方式对131例膀胱泌尿上皮癌进行了研究,研究者发现了FGFR3与TACC3的融合现象,7例肿瘤样本中检测到病毒整合位点,相关研究结果发表在Nature上。而类似这样的基因融合和病毒整合位点是全外显子组测序做不到的,仍然只能通过全基因组测序的方式进行研究。   染色体碎裂   该现象是一个一次性的细胞危机,该过程中成百上千个基因组重排在单次事件中发生。这种灾难性事件的后果是复杂的局部重排和拷贝数变异,其范围限制在0-2个拷贝。据估计,染色体碎裂发生在2-3%的癌症的多个亚型中,以及约25%的骨髓中。染色体重排需借助DNA双链断裂和一定方式的排列连接,这种重排破坏了基因组的完整性,继而参与形成白血病、淋巴瘤和肉瘤。它的复杂性和随机性使得它成为一种很难研究的现象,目前的解决策略是使用末端配对和长距离末端配对(mate-pair)技术建库的全基因组深度测序方法进行研究。   基因组改变和拷贝数变异(CNV)   目前的研究结果告诉我们,若分析中只关注SNP势必将错过大部分重要的基因组重排。据估计,每个人类基因组中&ldquo 非SNP变异&rdquo 总共约有50Mb。Morrison等人选用膀胱移行细胞癌(TCC-UB)的5例样本进行全基因组重测序,结果发现,其中3例样本具有较多SNP和SV变异,并且都具有P53基因的突变 在另外2例肿瘤样本中,研究者发现谷氨酸受体N-methyl-D-aspertate receptor基因发生易位和扩增,该研究结果对后期的肿瘤药物靶点鉴定与疾病治疗具有重要作用。由于覆盖深度变化太大,导致对原拷贝数的变异不敏感,全外显子组测序不容易检测到CNV,对于大片段的基因组改变更是无能为力。   全基因组测序与全外显子组测序比较   正是基于以上的优势,近年来采用全基因组重测序作为研究手段发表的高水平文章越来越多,这也会是将来人类基因组学研究的趋势,预测相关科研成果将呈现井喷式增长。
  • 发现98%基因组中的隐藏癌基因
    《Nature Genetics》杂志详细介绍了这种称为Cis表达或cis-X的方法,这是一种创新的分析方法,在患者肿瘤的调控非编码DNA中识别新的致病性变体和由这种变体激活的癌基因。cis-X通过识别肿瘤RNA的异常表达发挥作用。研究人员分析了白血病和实体瘤,并证明了这种方法的有效性。不编码基因的非编码DNA占人类基因组的98%。越来越多的证据表明,超过80%的非编码基因组是功能性的,可能调节基因表达。大量人群研究已经确定了非编码DNA中与癌症风险升高相关的变异。但是,在肿瘤基因组中,只有少量的非编码变异导致了肿瘤的发生。发现这些变异需要对大量肿瘤样本进行全基因组测序分析。“cis-X是一个根本性的改变,现有的方法需要数千个肿瘤样本,只识别反复发生的非编码变体,”St.Jude计算生物学系主任Jinghui Zhang博士说。她和上海儿童医学中心的Yu Liu博士是本文的通讯作者。刘博士也是第1作者。“通过使用异常的基因转录来揭示非编码变体的功能,我们开发了cis-X,从而能够在单个肿瘤基因组中发现驱动癌症的非编码变体,”张博士说。“识别导致癌基因失调的变异可以将精-确医学的范围扩大到非编码区域,以确定抑制肿瘤中异常激活癌基因的治疗方案。”cis-X的灵感来源于2014年Dana Farber癌症研究所的Thomas Look医学博士及其同事的一篇科学论文。Look也是这篇论文的合著者。Look的研究小组在细胞系中发现了导致癌基因(TAL1)异常激活导致T细胞急性淋巴细胞白血病(T-ALL)的非编码DNA变体。这项研究促使张博士继续她长期以来的兴趣,即研究基因每个拷贝的表达变化。cis-X通过两种方式寻找表达改变的基因。研究人员利用全基因组和RNA测序来寻找只在一条染色体上表达并在异常高水平表达的基因。“当分析等位基因之间基因表达的不平衡时,可能会产生噪音,”刘博士说。“这项分析使用了一种新颖的数学模型,使cis-X成为一种强大的发现工具。”然后cis-X通过在3D基因组结构中寻找非编码DNA调控区域的变化来寻找异常表达的原因。“这种方法模仿了变种在活细胞中的工作方式。这些变化包括染色体重排和点突变等变化。“如果不确定非编码变体,我们可能无法全面了解导致癌症的原因。”研究人员使用cis-X分析了13例T-ALL患者的癌症基因组,这些数据是由圣裘德和上海儿童医学中心合作收集的。该算法识别已知和新的癌基因激活非编码变体,以及可能的新的T-ALL癌基因PRLR。研究人员还表明,这种方法在成人和儿童实体瘤中有效,包括神经母细胞瘤。实体瘤对分析提出了更大的挑战。与白血病不同的是,实体瘤分布在肿瘤内的染色体数目往往不均匀。“cis-X为研究非编码变体在癌症中的功能作用提供了一种强有力的新方法,这可能会扩大精-确药物治疗由此类变体引起的癌症的范围,”张博士说。
  • 罗氏454测序参与棉花基因组进化研究工作
    棉花是全球重要的经济作物之一。它的纤维,俗称皮棉,是纺织工业主要的天然原料。全世界棉花种植面积约5亿亩,我国常年种植面积近8千万亩。棉花不但是重要的纤维和油料植物,而且是重要的植物蛋白来源。在食用油中,棉籽油的亚油酸含量最高,达到55.6%。除此以外,棉花种子中还含有极为丰富的蛋白质和脂肪等物质,棉籽榨油后的棉籽粉蛋白质高达45%&mdash 50%,远胜过大米、小麦,甚至超过花生、大豆的蛋白质含量。然而,由于一般栽培棉品种的种子和植株具有色素腺体,而色素腺体中含有的棉酚及其衍生物对人和单胃动物有毒,棉酚是棉属植物特有的化合物,这直接制约了棉籽作为食物资源的开发和利用。 近日,来自8个国家的70多名科学家共同参与的国际合作项目----棉花基因组测序完成。该研究的学术文章《棉花基因组的多倍化及纤维的发育》发表在《自然》杂志上。研究中,科学家们结合传统的Sanger测序与新一代454测序技术对雷蒙德氏棉基因组进行了组装工作,获得了其87.7%的全基因组序列,通过比较基因组以及进化分析发现,雷蒙德氏棉约在1300&mdash 2000万年前经历了一次全基因组复制事件。这次复制事件很可能不是雷蒙德氏棉的第一次基因复制,早在约1亿多年前,雷蒙德氏棉就可能经历了一次基因组复制事件。这些研究结果有利于人类认识古双子叶植物基因组的复制机制。经过雷蒙德氏棉基因组自身比对后,科研人员共鉴定出了2355个共性区域,并发现约有40%的旁系同源基因出现在不止一个共性区域,这表明了雷蒙德氏棉基因组在进化过程中可能经历过大量的染色体重排事件。 自2008年以来,棉花全基因组测序成为棉花基础研究领域的热点问题。下一步要在该成果基础上开发出快捷分子育种工具,实现基因组水平上的棉花分子设计育种,培育出高产、高质、抗病抗旱的棉花优良新品种。分子辅助设计育种和常规育种相结合是未来作物育种研究的必然发展方向,建立在基因组学研究基础上的分子辅助设计育种,因分子标记数量巨大、且不受基因表达时间、显隐性关系和环境条件的影响,大大提高了育种选择的准确性,缩短了育种周期,提高了选择效率。 参考文献:Repeated polyploidization of Gossypium genomes and the evolution of spinnable cotton fibres. NatureVolume:492,Pages:423&ndash 427Date published:(20 December 2012)DOI:doi:10.1038/nature11798
  • 国内首次利用Sanger测序法解码棘颚口线虫线粒体基因组
    近日,中国农业科学院兰州兽医研究所研究员朱兴全领导的家畜寄生虫病创新团队最新研究,在世界上首次解码了颚口下目线虫的线粒体基因组,为颚口线虫的分子流行病学、群体遗传学和系统分类学研究奠定基础。  据悉,颚口线虫是重要的人兽共患寄生线虫,但对其分子生物学研究甚少。该团队利用传统的Sanger测序法解码了棘颚口线虫的线粒体基因组。棘颚口线虫的线粒体基因组呈环状,长度为14079 bp。与其他线虫相比,棘颚口线虫的线粒体基因排序发生了显著的重排。此外,该研究还基于12个线粒体蛋白质编码基因构建了多种动植物线虫的系统发育树。基于所构建的系统树,本研究还探讨了颚口下目在线虫纲中的位置,发现颚口下目与蛔虫下目亲缘关系最近。  该团队在澳大利亚墨尔本大学、深圳华大基因(BGI)等国内外有关单位的支持、合作下,还成功解析了犬弓首蛔虫全基因组及转录组,为深入研究犬弓首蛔虫及其他相关寄生虫的基因功能及生物学特性、研制新的防控制剂提供丰富的基础数据及资源。
  • 《基因组生物学》:基因融合被证明是 水稻新基因产生的重要机制
    科技日报讯 (记者赵汉斌)新基因是生物表型进化和物种形成的动力和源泉。记者近日从中国科学院昆明植物研究所获悉,研究人员近期研究发现,基因融合是水稻及其近缘种新基因产生的重要机制,这意味着新基因研究取得了又一项重要进展。相关研究结果发表在著名国际期刊《基因组生物学》上。  “由两个或两个以上基因形成的融合基因,不仅可以绕过漫长而又低效的位点突变带来的有害步骤,又可以通过序列重排而将远源相关或者不相关的功能结构域进行组合,极易产生新的结构特征和新的功能,从而助推物种的适应性演化。”论文通讯作者之一、中国科学院昆明植物研究所研究员章成君介绍,基于此,由他领衔的专题攻关组自主开发了基于系统发育框架的动态鉴定融合新基因的流程。  此次研究中,章成君、周艳丽等人利用我国最主要的粮食作物中稻属的多个基因组数据,在最年轻的分支上选取了4个目标物种,共鉴定到310个融合基因。其中粳稻、籼稻、非洲栽培稻和短舌野生稻分别含有80、62、67和43个物种特异的基因。通过基因组重测序分析,他们发现这些物种特异基因在群体中的固定频率分别为31.8%、15.4%、21.5%和93.3%,这可能对物种的适应性演化起着至关重要的作用。  研究人员进一步以粳稻为例,分析发现约有三分之一的融合新基因与其母基因有相似的表达模式,约三分之一的融合新基因具有分化的新表达模式。用基因编辑技术CRISPR/Cas9敲除实验表明,无论表达模式分化与否,融合基因都能介导表型效应,从而影响物种的适应性。  此项工作有望在大数据时代为融合基因的研究奠定方法和理论基础,并对未来优质水稻育种产生重要影响。
  • Science:生命密码!冷冻电镜助力揭示从头构建基因组的设计原则
    著名物理学家Richard Feynman有一句名言:“我不能创造的东西,我就不了解。”这句话不仅为Feynman的理论物理学方法提供了参考,也很好地描述了合成生物学家的动机,因为后者有兴趣从头开始构建基因组。通过设计和构建合成基因组,他们希望能更好地理解生命的密码。合成生物学一直是围绕着将DNA序列作为具有可复制功能的“部件(parts)”这一概念来组装的。如今,在一项新的研究中,通过成功的合作和对前沿工具的使用,欧洲分子生物学实验室(EMBL)的Lars M. Steinmetz团队对基因表达的变化有了重要的认识,这种变化是由这些DNA部件在基因组中的位置或背景造成的。相关研究结果发表在2022年3月4日的Science期刊上,论文标题为“Transcriptional neighborhoods regulate transcript isoform lengths and expression levels”。(doi:10.1126/science.abg0162)通过低温电镜观察到两个转录因子(黄色和红色)与包裹在核小体中的DNA结合。图片来自Friedrich Miescher Institute for Biomedical Research。论文共同第一作者、Steinmetz团队博士后研究员Amanda Hughes在解释激励这项研究的基本问题时说道,“在合成生物学中,你倾向于将事物分解成模块化的、‘即插即用’的部件。这些部件是启动子、编码区和终止子。我们想测试这些部件是否真地是‘即插即用’,在任何情况下都以同样的方式运作,或者它们的位置是否会影响其功能。我们想更好地了解基因的线性分布如何影响其功能,并确定可用于构建基因组的一般设计原则。”这篇论文显示背景---特别是转录背景(transcriptional context)---改变了基因的RNA输出。通过使用长读直接RNA测序,他们能够观察到从合成酵母 基因组中发生随机重排的DNA序列表达的全长RNA分子的起点、终点和数量的变化。基因的重新定位会影响其RNA输出的长度和丰度;然而,这些变化并不总是由新的相邻DNA序列来解释。似乎是发生在基因周围的转录,而不是它的序列本身,改变了它编码的RNA输出。
  • 精准基因编辑时代到来!华人科学家重排原子精准编辑基因!
    p   当我们在谈论生命时,我们谈论的都是化学分子。DNA也好,蛋白质也罢,正是这些生物大分子发生的原子重排,才催生出无数生化反应,为地球带来生命。 /p p style=" text-align: center " img title=" 001.JPEG" src=" http://img1.17img.cn/17img/images/201710/insimg/c0bbe2b5-3415-4594-bc51-72b794f474de.jpg" / /p p style=" text-align: center " strong   本研究的主要负责人David Liu教授(图片来源:Broad研究所) /strong /p p   今日,Broad研究所的华人学者David Liu教授公布了一项了不起的研究!他的团队开发了一种“碱基编辑器”,能在细胞内用简单的化学反应,使DNA的一种碱基进行原子重排,让它变成另一种碱基。与CRISPR-Cas9等流行的基因编辑手段不同,这种技术无需使DNA断裂,就能完成基因的精准编辑。这项研究发表在了顶尖学术期刊《自然》上。 /p p style=" text-align: center " img title=" 002.JPEG" src=" http://img1.17img.cn/17img/images/201710/insimg/25395cd0-f659-4486-b95c-07cbee1c729a.jpg" / /p p style=" text-align: center "   strong  将近一半的致病变异来源于C-G组合到A-T组合的改变(图片来源:《自然》) /strong /p p   要看懂这项研究,我们先来看看DNA本身。我们知道,DNA的双螺旋结构由4种碱基:腺嘌呤(A)、胸腺嘧啶(T)、胞嘧啶(C)与鸟嘌呤(G)组成。它们A和T配对,C和G配对,就像字母一样,编写了人类的遗传信息。然而由于化学结构的问题,C这个字母不大稳定,容易出现自发的脱氨突变,把原本的好好的C-G组合,变成A-T组合。据估计,每天人类的每个细胞里都会出现100-500次这样的突变。而人类已知的致病单碱基变异,高达一半属于这种突变。 /p p style=" text-align: center " img title=" 003.JPEG" src=" http://img1.17img.cn/17img/images/201710/insimg/3079c9ad-aff8-4c2e-b7ab-54dc17de1cbe.jpg" / /p p style=" text-align: center " strong   合适的脱氨反应能将腺嘌呤转变为结构类似于鸟嘌呤的肌苷(图片来源:《自然》) /strong /p p   换句话说,如果我们能定点修复这些基因突变,把A-T变回C-G,就有望从根源上纠正人类的许多遗传疾病。这正是Liu教授团队的研究思路。在实验室中,他们观察到了一个很有意思的现象——腺嘌呤(A)在出现脱氨反应后,会变成一种叫做肌苷的分子,而它与鸟嘌呤(G)的结构非常接近,也能成功骗过细胞里的DNA聚合酶。简单的几轮DNA复制后,A-T组合就能变回C-G。 /p p   但科学家们遇到一个棘手的问题——自然界中并没有能够在DNA中催化腺嘌呤进行脱氨反应的酶。 /p p   如果没有现成的道路,那就开辟一条!在人体中,科学家们发现了一种叫做TadA的酶,它能催化转运RNA上的腺嘌呤(A),使它脱氨。尽管催化的对象不同,但Liu教授的团队认为它有足够的应用潜力。于是,利用演化的力量,科学家们对TadA进行了改造。他们将编码TadA的基因引入大肠杆菌内,并寄希望于这种酶能在大肠杆菌快速的繁衍中,突变出催化DNA腺嘌呤的能力。 /p p style=" text-align: center " img title=" 004.JPEG" src=" http://img1.17img.cn/17img/images/201710/insimg/77d2e2cb-4181-4432-b16c-f701f36c851b.jpg" / /p p style=" text-align: center "   strong  本研究中,碱基编辑器的作用机理(图片来源:《自然》) /strong /p p   同时,科学家们也想到,DNA上的腺嘌呤特别多,总不能把他们全都转化为鸟嘌呤吧。因此,特异性地对某个碱基进行催化,是这套系统迈入实际应用的关键。Liu教授想到了自己的实验室邻居张锋教授,这名华人学者以CRISPR基因编辑技术而闻名于世。如果我们借助CRISPR-Cas9系统的精准,但不让它切开双链DNA,或许就能定点对腺嘌呤进行原子重排,让它变成另一种碱基。为此,科学家们在筛选TadA酶的过程中,也同样引入了一套切不动DNA的特殊CRISPR-Cas9系统,用于精准定位。 /p p   功夫不负有心人!这套系统虽然极为复杂,但在经历了漫长的7代筛选后,Liu教授团队终于开发出了一款全新的“碱基编辑器”,其核心正是能有效针对DNA的TadA酶。无论是在细菌里,还是在人类细胞中,这款编辑器都能顺利发挥作用。在人类细胞里,它的编辑效率超过了50%! /p p style=" text-align: center " img title=" 005.JPEG" src=" http://img1.17img.cn/17img/images/201710/insimg/e1500d56-ca99-4809-932c-2bd6c898751f.jpg" / /p p style=" text-align: center "   strong  这套系统能有效用于人类细胞(图片来源:《自然》) /strong /p p   尽管这套系统利用了CRISPR-Cas9系统,但科学家们在这篇论文里指出,他们开发的技术与CRISPR-Cas9系统各有千秋。在矫正单碱基突变方面,它比CRISPR-Cas9系统更为有效,也更“干净”。它几乎没有引起任何随机插入和删除等突变,在全基因组里的脱靶效应也要好于CRISPR-Cas9技术。要知道,这可是人们对CRISPR-Cas9技术安全性的最大担忧之一。 /p p   先前,研究人员们也同样开发了编辑其他碱基的方法。目前,Liu教授的团队已经有了把C变成T,把A变成G,把T变成C,以及把G变成A的工具。诚然,这些工具目前距离人类临床应用还有不小的距离。但要知道,它只涉及碱基的原子重排,无需让DNA双链断裂,从而降低了基因治疗过程中的风险。此外,许多遗传病都是单基因突变,用这些工具进行治疗也显得更为有的放矢。 /p p   我们感谢Liu教授的团队为我们带来如此令人兴奋的基因编辑新工具。毫无疑问,基因编辑的时代已经到来,你准备好迎接冲击了吗? /p p   参考资料:[1] Programmable base editing of AT to GC in genomic DNA without DNA cleavage /p p & nbsp /p
  • Nature:儿童癌症基因组研究迎来大突破
    p   Hopp-Children癌症中心的Gr?bner等人对961名癌症患者进行泛癌症基因组分析,这些患患有24种不同的肿瘤。另外,St.Jude儿童研究医院的Ma教授等人在1699名儿童癌症患者中取得了肿瘤样本与健康组织的样本,并使用了多种下一代测序技术,寻找两者基因组中存在的不同。这些儿童患者患有6种不同的癌症,具有很好的代表性。这两项研究详细地指出了儿童和成人癌症基因组间的关键性差异。 /p p style=" text-align: center " img title=" 1.jpg" src=" http://img1.17img.cn/17img/images/201803/insimg/8ce5ff8c-b17f-40be-9620-65f896c82b51.jpg" / /p p style=" text-align: center " img title=" 2.jpg" src=" http://img1.17img.cn/17img/images/201803/insimg/c490b828-3089-4a23-958b-f7dc41209dc0.jpg" / /p p style=" text-align: left text-indent: 2em " strong 儿童癌症突变率少于成人 /strong /p p   首先,研究人员发现儿童癌症的基因突变和结构变异少于成人癌症。Gr?bner等人的报告中指出了未成年的突变率比成人癌症低14倍。Gr?bner等人与Ma等人均发现儿童癌症基因组中的突变总数与年龄有显著相关性,这与细胞会随着年龄增长而积累突变的观点一致。 /p p style=" text-align: center " img title=" 3.jpg" src=" http://img1.17img.cn/17img/images/201803/insimg/5b3772e7-72d1-49fd-b335-3b73831ebd93.jpg" / /p p style=" text-align: center " Ma等人的研究中儿童癌症体细胞的突变率 /p p style=" text-align: center " img title=" 4.jpg" src=" http://img1.17img.cn/17img/images/201803/insimg/b1687dd9-179a-4e51-95da-4d23d87c07d9.jpg" / /p p style=" text-align: center " Grö bner等人的研究中儿童癌症体细胞的突变率 /p p    strong 儿童癌症由单个驱动基因引起 /strong /p p   其次,研究人员指出儿童通常由单个驱动基因引起。Gr?bner及其同事分析的癌症基因组中57%携带单个驱动突变,而且,父母遗传并存在于身体所有细胞中的种系突变是儿童癌症的致病因素,7.6%的癌症与可检测的种系突变相关。 /p p   此外,儿童癌症基因组中多含有突变或结构变体之一,而非二者的混合物。Ma和他的同事从结果中也注意到,儿童患者的主要致癌因素是拷贝数异常,或是DNA结构的改变。这些因素占到了62%,高于大家普遍认为的DNA点突变。从机理上看,拷贝数异常会让患者产生过多或过少的特定基因,而DNA结构改变则会造成基因的重排。 /p p   在针对结构变体表征的癌症研究中,研究人员还观察到了DNA修复途径的种系突变。这些差异突出了儿童与成人不同的癌症发生的潜在机制。 /p p style=" text-align: center " img title=" 5.jpg" src=" http://img1.17img.cn/17img/images/201803/insimg/c436bdf5-0883-4d0a-a3a2-07e223d0768b.jpg" / /p p style=" text-align: center " Grö bner等人的研究中儿童癌症的种系突变 /p p    strong 儿童癌症基因更易突变 /strong /p p   再者,与成人癌症基因相比,儿童基因更容易发生突变。Gr?bner及其同事发现成人癌细胞内只有30%与成人癌症重叠的突变基因,Ma和他的同事在癌细胞中也只发现了45%。这就提示,儿童癌症基因组中存在驱动突变的因子,导致儿童基因更易发生突变。 /p p style=" text-align: center " img title=" 6.jpg" src=" http://img1.17img.cn/17img/images/201803/insimg/594b6295-7b52-4e48-be39-d162dbb9b132.jpg" / /p p style=" text-align: center " strong Grö bner等人的研究中儿童癌症与成人癌症类型相比显着突变的基因 /strong /p p   从这些分析中收集到的数据对儿童癌症精确医学的发展具有启示意义。 /p p   另外,Gr?bner等人发现约50%的肿瘤可以通过临床或正在开发的药物进行靶向基因组改变,同时还提供了特异性改变儿童肿瘤的设计方案。此外,这些研究还提高了儿科肿瘤学家对生殖突变的重视。尽管这些研究提供了有价值的见解,但仍需大量工作才能有更精确更令人满意的结果诞生。 /p p   目前,Gr?bner及其同事还无法确定其研究的部分肿瘤是否存在驱动突变,而且也没有足够的样本来检测罕见突变,因此需要持续的协作和数据共享来收集足够的肿瘤信息。此外,两各研究组都鉴定出了结构变异,因而需要全基因组测序来检测编码区域外的驱动,才能为大型儿童肿瘤的进一步分析工作铺平道路。 /p p   参考资料: /p p   1.Susanne N. Gr?bner,et al.The landscape of genomic alterations across childhood cancers.Nature.28 February 2018 /p p   2. Xiaotu Ma, et al.Pan-cancer genome and transcriptome analyses of 1,699 paediatric leukaemias and solid tumours..Nature.28 February 2018 /p p   3. Landscapes of childhood tumours /p p   4.Genome studies unlock childhood-cancer clues /p
  • 汤富酬课题组实现基于单细胞测序数据的人类基因组从头组装
    随着三代测序技术(TGS,也即单分子测序技术)的发展,基于大量细胞的三代基因组测序数据被广泛应用于各种复杂大型基因组的组装,由于其读长相比于二代测序(NGS)技术有数百倍的增加,因此基因组中重复序列区域以及染色体重排等复杂结构变异区域都能被更好地组装出来。对于人类基因组的组装研究,端粒到端粒(T2T)联盟在2022年3月,使用纯合二倍体细胞系CHM13率先发布了首个完整的端粒到端粒的人类基因组参考序列CHM13v1.1。2022年3月,人类泛基因组联盟(HPRC)在预印本平台bioRxiv上发布了首个高质量人类杂合二倍体细胞系HG002的单倍型组装结果。目前,高质量的基因组组装通常依赖于大量细胞混合样本的三代测序数据,需要大量的基因组DNA(通常需要从数百万个细胞中提取几十微克基因组DNA),然而在基因组组装的实际应用中常常要面对两个困难:1、细胞群体中存在遗传异质性。基于大量细胞三代测序数据的基因组组装需要确保测序的样本中每个细胞的遗传背景高度一致,否则组装结果将很难区分同一个细胞内的不同单倍型基因组之间的差异和不同细胞亚群之间的基因组差异。只有降低或者消除细胞间的遗传异质性才能确保单倍型组装的准确性。但是,在人体正常组织样本中也常常广泛存在体细胞拷贝数变异(CNA)。与此同时,正常的人类细胞也会不断积累突变,同一块人体组织常常是由很多包含不同突变的细胞克隆组成。在癌症研究中,同一个肿瘤样本中不同癌细胞亚克隆之间的基因组异质性就更为明显。2、细胞数量稀少。在很多情况下,很难获取上百万个细胞以提取大量(几微克)基因组DNA。例如,在早期胚胎发育研究、司法检验、特别是在癌症基因组研究中(如循环肿瘤细胞、肿瘤活检样本、脑脊液中的肿瘤细胞、以及腹水中的肿瘤细胞等),能够获取的细胞数量常常很稀少,而且这些细胞很难在体外培养和扩增;即使偶尔可以培养扩增,也不能保证在体外培养扩增过程中其基因组不会进一步产生新的遗传变异。基于二代测序(NGS)平台的单细胞基因测序技术被广泛应用于微生物等简单小型基因组的组装。许多种类的细菌无法在实验室中培养,单细胞基因组测序可以与宏基因组学方法结合起来完成微生物的基因组组装。由于人类基因组结构、大小、以及复杂程度远超细菌等微生物,单纯使用基于二代测序平台的大量细胞基因组测序数据也无法组装出高质量的人类基因组参考序列(NG50很难达到Mb(百万碱基对)级别),那么使用少量DNA甚至单细胞基因组测序数据组装人类基因组则更具挑战性,它不仅需要基于三代测序平台的单细胞基因组长读长测序技术的支持,还需要合适的组装软件以及良好的生物信息学分析策略。2022年7月12日,北京大学生物医学前沿创新中心(BIOPIC)汤富酬课题组在Nucleic Acids Research发表了题为De novo assembly of human genome at single-cell levels的研究论文。该研究使用优化的SMOOTH-seq单细胞基因组三代测序技术,基于Pacific Biosciences(PacBio)HiFi和Oxford Nanopore Technologies(ONT)两种三代测序平台首次在单细胞水平上完成了Mb级连续性的人类基因组组装,并使用多种评价指标,充分探索了不同测序策略和组装工具对基因组组装结果的影响。1、全面优化了SMOOTH-seq单细胞基因组三代测序技术,使其同时适用于PacBio和ONT两种主流单分子测序平台。此前的SMOOTH-seq技术只适用于PacBio单分子测序平台,使用场景有较大的局限性。优化后的SMOOTH-seq技术既可以用于PacBio单分子测序平台,也可以用于ONT单分子测序平台,使用场景更加灵活,可以兼顾测序数据准确性和测序成本。2、使用hifiasm,Hicanu,wtdbg2等主流组装工具和95个单细胞的三代基因组测序数据(Pacbio HiFi平台),对人类慢性粒细胞性白血病(CML)细胞系K562进行了高质量基因组组装。组装出的主要叠连群(primary contig)的NG50(可覆盖50%的已知基因组区域的最短叠连群的长度)可达2.11Mb,也就是说在这个组装出的参考序列中,人类基因组中一半(15亿碱基对)以上的区域都被至少2.11Mb以上的叠连群覆盖了。最长叠连群可达14.12Mb,完整的通用单拷贝同源基因基准(Complete BUSCOs)比例接近95%,且大部分组织相容性复合体(MHC)位点(基因组上的一个有代表性的复杂区域,全长约6Mb)被成功组装出来(如图1所示)。图1. 95个K562细胞的基因组组装结果(Pacbio HiFi)3、使用hifiasm,Hicanu,wtdbg2等主流组装工具和人类正常二倍体细胞系HG002的157个单细胞的基因组三代测序数据(Pacbio HiFi平台)对人类基因组进行了高质量组装。组装出的主要叠连群(primary contig)的NG50可达0.65Mb,最长的叠连群可达6.82Mb,完整的通用单拷贝同源基因基准(Complete BUSCOs)比例接近91%。在使用此数据进行HG002的单倍型组装的过程中该研究发现经过指数扩增的基因组数据的k-mer分布会发生偏移,因此使用有双亲二代测序数据作为辅助的Trio-binning模式进行基因组单倍型组装结果更为准确。因此该研究分别使用Trio hifiasm和Trio Hicanu两种组织工具进行单倍型组装,得到的亲本叠连群的NG50可达0.3Mb左右,完整的通用单拷贝同源基因基准(Complete BUSCOs)比例均超过84%。通过比较HG002亲本六种经典人类白细胞抗原(HLA)位点的组装分型结果,Trio Hicanu能够正确组装出HLA区域的两个亲本的大部分基因位点(如图2所示)。图2. 157个HG002细胞的基因组组装结果(Pacbio HiFi)4、使用Flye,Necat,wtdbg2等主流组装工具和人类正常二倍体细胞系HG002的192个单细胞的三代基因组测序数据(ONT平台,低测序深度)对人类基因组进行高质量组装。研究发现,不同的组装工具对最终组装结果有很大影响,Flye展现出更为适合单细胞ONT三代测序数据的特性,组装出的叠连群的NG50可达1.38Mb,最长叠连群可达11.42Mb,完整的通用单拷贝同源基因基准(Complete BUSCOs)比例超过93%,多项指标都远超另外两个组装工具。同时组装结果能够补齐39个hg38版本的人类参考基因组中未组装出的缺口(gap)区域,其中14个区域在hg38中注释的长度超过50Kb(如图3所示)。图3. 192个HG002细胞以及30个HG002细胞的基因组组装结果(ONT)5、使用Flye,wtdbg2等组装工具和人类正常二倍体细胞系HG002的30个单细胞的三代基因组测序数据(ONT平台,高测序深度)对人类基因组进行高质量组装。为了探究仅使用极少量单细胞的基因组测序数据进行人类基因组组装的极限情况,该研究分别使用1个、10个、20个和30个单细胞尝试进行人类基因组组装,发现仅需要高测序深度的30个单细胞的基因组测序数据(平均基因组覆盖度~41.7%)就能完成叠连群 NG50高达1.34Mb连续性的组装。同时组装结果能够补齐38个hg38版本的人类参考基因组未组装出的gap区域,其中15个区域在hg38注释的长度超过50Kb(如图4所示)。图4. 30个基因组高覆盖度HG002细胞的基因组组装结果(ONT)6、通过对K562细胞系基因组的从头组装,该研究相比于使用原始单细胞基因组三代测序数据能更精准地鉴定出更多的基因组插入事件和复杂结构变异事件。对于K562这样的白血病细胞系,基因组从头组装之后是否能更好地鉴定出基因组结构变异(SV)事件是癌症研究中的重要问题。该研究分别使用hifiasm和Hicanu组装出的主要(primary)叠连群和替代(alternate) 叠连群来进行结构变异鉴定。发现组装后的叠连群比起原始单细胞数据直接比对能更准确地鉴定出基因组插入事件,召回率达到70%以上,精确度达到90%以上。同时,K562中的三对经典融合基因:CDC25A-GRID1、BCR-ABL1和NUP214-XKR3都能被精准地鉴定出来,而CDC25A-GRID1融合在原始单细胞基因组数据直接比对到参考基因组时是无法被发现的 (如图5所示) 。为了进一步验证基因组从头组装后找到的结构变异事件的准确性,该研究挑选了20个(14个插入事件,6个缺失事件)在组装后的叠连群中被鉴定到、但是在单细胞基因组原始测序数据直接比对到参考基因组时没有被鉴定出来的结构变异事件进行了PCR验证,准确率高达80%,证明了组装后的叠连群对结构变异事件的鉴定是精准可靠的(如图6所示)。图5. 组装后叠连群(contig)中结构变异事件检测的准确性 图6. PCR验证基因组结构变异事件的结果综上,为了解决基因组从头组装在实际应用中遇到的细胞遗传异质性和细胞稀缺性的问题,该研究使用优化的SMOOTH-seq技术在两种不同的主流三代测序平台上,采用不同的测序策略(高通量、低深度测序策略(multi-cells with low sequencing depth)和低通量、高深度测序策略(few-cells with high sequencing depth)),使用多种不同组装软件(hifiasm,Hicanu,wtdbg2, Flye,Necat等)、多个评价指标、以及不同组装策略,探讨了利用单细胞测序数据从头组装人类基因组的可行性,并确定了影响组装结果的主要因素,将基因组组装的分辨率提高到单细胞水平(少至30个单细胞)。未来随着单细胞测序技术和基因组组装策略的进一步发展,最终必将实现只用一个单细胞的测序数据就能组装出Mb级连续性的人类参考基因组的梦想。北京大学生命科学学院博士生谢昊伶以及北京大学前沿交叉学科研究院博士生李文为该论文的并列第一作者。北京大学生物医学前沿创新中心汤富酬教授为该论文的通讯作者。该研究项目得到了北大-清华生命科学联合中心、国家自然科学基金委、北京市科技委和北京未来基因诊断高精尖创新中心的支持。论文链接:https://doi.org/10.1093/nar/gkac586汤富酬研究员简介:汤富酬,博士,北京大学BIOPIC/ICG研究员,国家“优青”(2013)、“杰青”(2016)。1998年本科毕业于北京大学,2003年在北大获得细胞生物学博士学位,2004-2010年间在英国剑桥大学Gurdon研究所从事博士后研究, 2010年回到北京大学组建实验室,主要从事人类早期胚胎发育的单细胞功能基因组学研究。在国际上率先系统发展了单细胞功能基因组学研究体系,并利用一系列技术体系对人类早期胚胎发育进行了深入、系统的研究,揭示了人类早期胚胎DNA去甲基化过程的异质性以及其他表观遗传学关键特征,发现了人类早期胚胎中基因表达网络的重要表观遗传学调控机理,为人们提供了一个全面分析人类早期胚胎表观遗传调控网络的研究框架,加深了对人类原始生殖细胞的发育以及表观遗传重编程过程的认识。
  • 对话诺奖得主Gilbert:我所理解的大数据和全基因组测序
    Knowing your DNA will is not a panacea.-by Walter Gilbert   沃特· 吉尔伯特(Walter Gilbert)是一位美国物理学家与生物化学家,分子生物学的早期研究者之一。   1980年与弗雷德里克· 桑格因为发展了测定DNA序列的方法,而与保罗· 伯格(Paul Berg)共同获得诺贝尔化学奖。他运用桑格直读法原理,独立地提出更简便的测定核苷酸顺序的方法&mdash &mdash 化学降解法。他用化学反应将DNA裁剪成一系列不同长度的核苷酸片断,它们的一端相同,并标有放射性同位素,测定各片断的长度和另一端最后一个核苷酸,就能决定DNA相应位置上的排列顺序。   2014年在德国巴伐利亚州林道召开的&ldquo The Lindau Nobel Laureate Meetings&rdquo (林道的诺贝尔奖得主会议)上,来自美国Rice University(莱斯大学)的Mohit Kumar Jolly采访了这位开创了测定DNA序列的方法的诺贝尔奖得主。 Walter Gilbert和Mohit Kumar Jolly2014年在林道   Mohit Kumar Jolly (MKJ): 看来您的介绍,您曾获得在剑桥大学拿到数学博士后,很快成为哈佛大学的理论物理教授,后来又从事分子生物学工作,并在诺贝尔化学奖领域取得成就。您能跟我们谈谈是如何做到在这3个不同的领域跨界的吗?   Walter Gilbert (WG):其实,在我的人生中,已经多次改变研究领域,因为我一直想探索新事物。我在大学里,是学习化学和物理的科班出身,但却发现化学无聊,于是我专注于高能量的量子场论。   在取得我的博士学位后,我在哈佛大学从事物理教学,主要研究量子力学和电磁学。   后来,我在英国剑桥的一次聚会上遇到了詹姆斯· 沃森(James Watson)。他给了我六篇文章,让我了解他们在做的分子生物学实验。我参观了他们的实验室后,觉得他们的工作很有趣。   因此,在送走了我带的即将毕业的理论物理学毕业生后,我成为了一名分子生物学家。   在那个时间点上,我甚至还开了一家名叫"Biogen"的生物公司,并且在上世纪80年代担任了该公司5年的CEO。这对于一个搞科研的人来说,真是一个完全不同的体验。   在2002年,我关闭了我的实验室 现在我成为了一个当代艺术品的生产商和消费者。   Walter Gilbert :&ldquo I have always found it very easy to change fields. In this process, I have realized that the purpose of education is to make you think about all different kinds of things in the world.&rdquo   &mdash &mdash 我一直认为跨界并不是一件很难的事,在这个过程中,我认为教育的最终目的是&ldquo 让你思考世界上不同的人和事&rdquo ! Gilbert向另一个诺奖得主Brian Kobilka展示其作品   Mohit Kumar Jolly (MKJ): 我们知道您曾因发现DNA测序而获得诺贝尔奖,那您是从什么时候意识到全基因组测序会越来越便宜的呢?   Walter Gilbert (WG):DNA测序费用会不断下降,这是意料之中的事情。在1985年的时候,个人的全基因组测序费用高达30亿美元 而在今天,完成一个人的全基因组测序仅需5万美金。我希望:到2020年,无论是医院还是第三方检测,个人全基因组测序的费用可以下降到几百美金。   但是大家需要注意的是,全基因组测序并不意味着一定是&ldquo 精准医疗&rdquo ,我曾经对我自己的全基因组进行了测序,但是它忽略了局部的基因组重排,因此这算不上是绝对的&ldquo 精准医疗&rdquo 。   或许在普通人看来,只要我们进行了全基因组测序后,就可以通过编辑我们的基因来设计高智商的后代,但是我只能说这是个&ldquo 神话&rdquo ,因为在生物学上,并不是一个基因就对应唯一属性。 Walter Gilbert talking to a Young scientist at #LNLM14   Mohit Kumar Jolly (MKJ):目前有关&ldquo 个性化医疗&rdquo 的主题讨论得相对火热,您怎么看待&ldquo 个性化医疗&rdquo 的前景?   Walter Gilbert (WG):站在我个人角度,我是很看好&ldquo 个性化医疗&rdquo 的发展的。然而现在市场上对&ldquo 个性化医疗&rdquo 存在2大对立的观点。   站在患者的角度,每一个患者都有不同的新陈代谢机制,即使是患了同一种疾病也会有不同的临床表现。同样的癌症,在不同人的身上表现亦不同。目前唯一的办法就是将它们分类成有限的亚型,然而开发针对这些亚型的药物,但是它们的有效率并不是很高。   另一种观点是站在大药厂、药物研发商的角度,他们并不喜欢&ldquo 个性化医疗&rdquo ,他们更喜欢标准化的方式 否则,他们大批量生产的&ldquo 仿制药&rdquo 怎么卖?   让我很困惑的是:药企为什么没有意识到&ldquo 当基因测序越来越深入,其病例的亚型就将分类的越来越细,这将进一步有助于药物的临床试验&rdquo 。因此我认为,制药大亨们想要占领&ldquo 基因测序&rdquo 市场的制高点,他们得首先转变下自己的观念。   Mohit Kumar Jolly (MKJ):当下在生命健康领域的另一个热门话题是&ldquo 大数据&rdquo ,您怎么看?   Walter Gilbert (WG):&ldquo 大数据&rdquo 即是要收集大量的数据集,发现基因和疾病之间的相关性。毫无疑问的是,我们收集的数据是有作用的,但是问题是,很多时候我们不知道如何解释它。   另外,你必须记住,所有的统计学上的显著性并不意味着生物学上的显著。所以说,大数据绝对不是万能的。   Mohit Kumar Jolly (MKJ):最近还有一个争议性较多的问题,是关于&ldquo 基因专利&rdquo 申请的,您怎么看待&ldquo 基因专利&rdquo 申请的?   Walter Gilbert (WG):我同意最高法院的决定,即我们不能申请任何自然存在的物种的专利。由于基因是个体的一部分,因此我认为它不应该被允许申请专利。   不过,我认为有些公司申请基于某个特定基因会产生某些疾病的基础上的诊断方法(基因测试)是可以授予专利的。   并且我认为,专利完全是一种伦理道德上的行为。它属于一种社会上层建筑,给做出了某项发明的作者提供回报的垄断行为。因此,专利只能控制商业行为,而不是用来独霸学术研究的,科学研究更应该是开发的与共享的。
  • 英国推进十万人基因组计划,众企业踊跃投标
    p   英国计划在2017年完成10万人的基因测序工作,但筛选疾病基因需要创新的软件。 /p p   一对加利福利亚双胞胎出生后,他们的父母日益忧心:宝宝们发育缓慢,而且肌张力低。脑部扫描发现,男宝宝可能有大脑麻痹,但女宝宝却有癫痫和震颤。医生们百思不解。多种测试结果都无法确诊两个宝宝究竟出了什么问题。等到孩子们5岁的时候,使用左旋多巴胺——一种帕金森病药物,疗效也非常短暂。 /p p   2010年,这对双胞胎14岁了,全基因组筛查终于揭开了谜题。双胞胎编码墨蝶呤还原酶(sepiapterin reductase,一种在神经递质多巴胺和5-羟色胺合成中起作用的酶)的基因存在缺陷。医生因此改变了治疗方案,增加了5-羟色胺的服用。男孩子的行动能力有所加强,女孩也不再出现突发性抽搐了。 /p p   这样的故事激起了学界人士使用基因筛查作为诊断工具的兴趣。确实,如果检查能筛出疾病相关的基因突变,这样治疗就更加有的放矢。 /p p   但这样的基因测试通常不能为诊断提供多少依据,因为目前的基因测试聚焦于在特定染色体上的特定基因。在类似于双胞胎的案例中,研究者们不得不筛查所有基因,来寻找致病基因。就目前来说,这种检验非常稀少。但一些大规模的研究项目正准备把全基因组筛查加入到常规医学诊断中。 /p p   英国对于基因组医学壮志满怀,启动了10万人基因组计划。该计划由12年开始,赢得了英国首相David Cameron的个人支持。该计划投资3亿英镑,对英国国民健康服务中心(National Health Service, NHS)的癌症、少见疾病和传染性疾病病人进行测序。该计划旨在寻找疾病的致病基因,为临床提供更好的诊断工具,为病人提供个性化治疗,最终促进英国基因产业。 /p p   John Bell认为,英国卫生医疗系统是国家资金支持的,因此非常适合执行这种大规模的基因组医学实验。Bell是牛津大学(University of Oxford)的医学研究者,同时也是Genomic England公司的董事。Genomic England是英国国民健康服务中心附属的一家公司,是10万人基因组计划的主要实施公司。NHS有非常详细的病人信息,将这些与基因筛查结果联系起来,能更清楚地认识到疾病和基因之间的联系。Bell指出,多种证据表明,全基因组筛查能够帮助诊断和治疗多种疾病,NHS希望能把全基因组筛查作为常规医学手段。 /p p   但在这个目标实现以前,10万人基因组计划必须克服几个问题。从这么多人身上提取DNA样本本身就是一件繁琐的事情,除此之外,确定哪些基因突变是致病的,哪些是无害的也是一件棘手的事情。这需要大量的数据、时间,还需要专门的软件来干这些事情。 /p p    strong 支持者众多 /strong /p p   冰岛是第一个启动大规模全基因组分析计划的国家。很多国家也抱着将疾病和基因联系在一起的美好愿景,加入到了基因组筛查的队伍中。在美国,精准医疗计划打算测试100万志愿者的基因组,而百万老兵项目则计划对百万名老兵进行基因测序。而其他多个国家,包括加拿大、澳大利亚、日本、韩国、新加坡、泰国、以色列、科威特、卡塔尔、比利时、爱森堡和爱沙尼亚也纷纷开展基因筛查项目。 /p p   但英国的10万人基因组计划看起来最有希望:它已经成功募集了3500名罕见疾病患者和2000个癌症病人,未来只需要找到75000名志愿者(其实基本都是这些患者的亲属)就够了。罕见疾病患者和他们的家人最后会有5万人。80%的罕见疾病是家族遗传的,因此受影响者(通常是儿童)的基因可以和他血缘最近的亲属的结果进行对比。癌症病人及其家属会组成另外的25000名志愿者。癌症病人的基因组会测两次,和父母的正常细胞进行对比。因此,英国基本已经找齐了他们所需的志愿者。 /p p   志愿者们希望,基因筛查结果能让他们更清楚地了解自己的状况。这些信息对于整个病人群体都有重要意义。一个前列腺癌患者的基因组,经过与数据库的对比,可以提供前列腺癌相关的基因信息。医生从这个患者的治疗中,了解到对于具有类似基因的患者采用哪种治疗最为有效。 /p p   strong  企业合作者 /strong /p p   Genomics England现在正在挑选每一步(从提取DNA到解读基因组)的企业合作者。总部在圣地亚哥的测序仪器生产商Illumina负责测序工作,同时也负责鉴别基因突变。这由Illumina在英国小切斯特福德的分公司进行。但在未来几个月里,计划开始扩大范围时,Illumina计划把测序仪器搬到英国斯顿的维康信托基因组园区(Wellcome Trust Genome Campus)。 /p p   Illumina通过高通量测序仪器处理提取的DNA样本,获得小段的碱基片段。这些片段通过电脑计算,重组成连续的序列,然后通过生物信息学,科学家们会把生成的结果和人类参照基因组(由国际基因组参照协会(Genome Reference Consortium)不断更新的人类代表性基因组)进行对比,目的是发现和参照基因组不同的序列片段,也就是突变。 /p p   为了鉴别这些突变,Illumina团队使用该公司的Isacc工作流程(一种开源的计算基因组排布和识别变体的工具)。然后,为了鉴别每个基因组的几百个变异中哪一个致病,Genomics England公司会在数据中心收集10万人的基因信息,然后进行分析。但Genomics England还没有决定选择哪个软件来实施这一工作:需要和Illumina和学界一起检验各个软件的可靠性,然后改善现有的识别变体的算法,最后再确定选择哪个软件。 /p p   Illumina已经对3000多个样本进行了测序,但每天有更多的样本涌入。Peter Formen,Illumna10万人基因组计划的管理主任表示,针对突变分析,他们打算收集和上报生殖细胞和体细胞NDA中特定位点的的多种变体。变体包括增加或缺少几个核苷酸,或是以一种核苷酸替代了另一种。也可能有结构性的变体,例如一个基因拷贝数变异。 /p p   紧接着,每个变体和已有的变体数据库,例如dbSNP库(一个由美国国立卫生研究院(NIH)建立的,针对短基因突变的数据库)进行对比。类似的数据库还有很多,包括:全球千人基因组计划也建立了全球人类基因变异的目录 Exome Aggregation Consortium (ExAC),一个外显子测序数据库(外显子是负责编码蛋白的全部DNA序列) 以及ClinVar,NIH建立的变异与相关生理状况的数据库。发现这些变体的作用是下个阶段的任务,各个公司都踊跃申请承担这项任务。2014年春天,Genomics England对全球的基因组阶段专家进行了评价。28家参评公司需要对15个罕见疾病患者和两个健康人的基因,以及同一个病人的10个肿瘤DNA和正常DNA进行分析,然后给出变异注解(确定基因和其蛋白产物)和解读(把基因、蛋白和功能联系在一起)。 /p p   表现最佳的公司可以接受一个测试,为8000个志愿者进行基因组解读的工作。Genomics England从28家公司中挑出了表现最佳的4家,这4家需要通过这个测试,并签订协议。这四家公司分别是英国剑桥的Congenica和美国加利福利亚的Omicia,他们会分析罕见疾病患者的基因组 加利福利亚的Nanthealth,他们会分析癌症基因 麻省的Wuxi NextCode公司,他们既要分析罕见疾病又要分析癌症。圣地亚哥的Cypher Genomics公司及其合作伙伴高级技术和防卫公司Lockheed Martin则是候选公司。这些公司此前都有相关领域的从业经验。 /p p   所有公司都会使用高效能计算来解读基因数据,并且工作场所都是Genomics England的安全数据中心。目的是提供几乎全自动的服务——解读下一代测序数据目前主要是人工操作,需要花费数小时到数周的时间。据Genomics England生物信息部门的领导Augusto Rendon表示,最忙的时候,每天有200多个基因组的数据需要处理。如果要按时地、不超预算地完成计划,如果想把全基因组测序作为常规诊疗手段,那么人工解读必然无法达到要求。 /p p    strong 花落谁家 /strong /p p   每个公司都带来了自己的专家团队来完成基因组解读任务。Congenica,是维康信托桑格研究所(Wellcome Trust Sanger Institute)和英国卫生部(Wellcome Trust Sanger Institute)的下属公司,之前一直为NHS提供测序服务。它会分析疾病相关的遗传性和获得性的稀有基因突变。它开发的Sapientia平台已经在“解密发育疾病项目”(Deciphering Developmental Disorders, DDD)中投入使用,对12000名儿童进行基因测序。DDD是迄今为止全世界最大规模的、全国性的、罕见疾病测序项目。Congenicad 首席运营官Tom Weaver表示,这项研究对30%-40%的参与儿童做出了诊断,这些儿童患有无法确诊的出生缺陷或认知缺陷。 /p p /p p   美国的Omicia公司在基因组的临床解读上也有很多经验,但它之前使用的是开放源码、开放获取的工具。在10万人基因组计划中,它将会使用Opal的基因解读软件,来预测哪个变体可能导致疾病。该公司的Phevor算法(表型驱动编译本体论重排序工具)能把突变可能与疾病相关的概率,与基因功能现行和信息的数据库相结合。Omicia可利用这一工具将病人的表型(也就是病理表现)也结合起来。Omicia的首席科学家Martin Reese表示,这些高度自动化的工具意味着,Omicia可以避免人工解读信息。这些算法能够把变体归类到已知的致病基因中,这些基因与疾病的联系部分已知,部分仍待证实。随后Opal会把这些结果整合在一起,汇总成报告,帮助医生形成治疗意见。 /p p   Cypher Genomics是斯克里普斯研究所(Scripps Research Institute)的下属公司,开发过Mantis基因解读软件。Mantis能够根据变体致病的概率进行排序。Cypher Genomics的首席运营官Adam Simpson表示,根据Mantis的分析结果,科学家们可以优先选择研究的变体对象。 /p p   最后要谈到Wuxi NextCode公司了。Wuxi NextCode是冰岛基因公司deCODE的衍生公司。deCODE由Kari Stefansson于1996年创立。Kari Stefansson率先提出,获取全国人民的基因信息,来寻找致病基因的理念。后来deCODE被制药公司Amgen收购时,一帮生信学家和deCODE的前职工创立了Wuxi NextCode。Wuxi NextCODE在2015年1月被中国上海药明康德公司收购。 /p p   Wuxi NextCode的结果并不是一张可能引起疾病的突变清单。Wuxi NextCode的首席科学家Jeff Gulcher表示,全球的临床医生和研究人员都可以通过任何网络浏览器,在单个碱基分辨率上实时存储、查看和分析基因数据,并且软件不断更新最新的变异信息。 /p p   Gulcher表示,一个典型的问题可能是“我想知道,这到底是不是变异”。这意味着,需要寻找患有相同罕见疾病的个体,看看他是否也有相同的突变体。总有一天,医生可能想知道癌症病人是否有类似的变体和病程发展,同时想了解过去十年的此类病人采用的治疗。Gulcher表示,Wuxi NextCODE的Genomically Ordered Rela -tional Database数据库可以完美地实现这类需求。 /p p   另一方面,基因学家可能需要比较20个基因组,每个有一百万个变体。他需要知道的是,哪个是致病变体。Wuxi NextCODE的数据库根据基因位置来显示变体,从而不需要对所有基因从头到尾进行比较分析,提高处理效率。Wuxi NextCode的首席运营官Hannes Smarason表示,该平台非常适应处理大量信息,例如30万冰岛人的基因组信息。 /p p   Nanthealth是私营企业,主攻癌症基因组信息的计算分析,为临床治疗提供指导。Nanthealth拒绝提供信息,但它的主页上显示,该公司分析了超过2万个基因样本。该公司由医生和生物医学研究者Patrick Soon-Shiong创立。Patrick Soon-Shiong还是一个基金会的主席,该基金会致力于消除医疗资源不平等,并支持研究。同时他还是一个非营利性研究机构的负责人,该研究结构致力于促进电子分子诊断。他研发了抗癌药物Abraxane,该药物能够治疗多种癌症。 /p p   对于Genomics England来说,整个项目旨在为临床提供指导。但在把结果反馈给医生和家属之前,科学家和医生们需要先仔细研究这些数据。Genomics England 募集了2000名专攻13种罕见疾病和10种癌症的医生和科学家,来完成质量检验工作。同时他们也需要研究项目成果,特别是审查基因和疾病的联系是否明确。他们会通过细胞检验和小鼠实验来研究变体是如何影响和诱发疾病的,这些信息都会汇总到10万人基因组计划。一些结果可通过数据库很快证实,而另一些结果则需要通过文献、软件和实验来谨慎验证。 /p p   Bell表示,NHS并不以技术创新出名,但Genomics England可能会改变这一形象。10万人基因组计划对整个基因领域造成了重大影响。它将提供很多商业和学术机会,甚至有可能实现将基因组运用到临床上,从而造福全人类的伟大目标。 /p p   原文检索: /p p   Vivien Marx. (2015) The DNA of a nation. Nature, 524(7565): 503-505. /p p br/ /p
  • 基因组所完成鲤鱼基因组初步测定分析
    近日,中国科学院北京基因组研究所运用新一代高通量测序技术以及高性能的生物信息分析,完成了鲤鱼基因组初步测定与分析工作,获得了鲤鱼基因组高覆盖的基因组数据。&ldquo 鲤鱼基因组计划&rdquo 是基因组所与水产生物应用基因组研究中心和黑龙江水产研究所联合开展的研究项目,目前项目进展顺利,是我国鱼类第一个全基因组测序计划,也是世界上第一个鲤科经济鱼类基因组计划。   本项目主要依托于基因组所基因组及生物信息学平台第二代高通量测序仪进行测序分析工作,该平台拥有13台新一代高通量测序仪(SOLiD、Solexa和 454测序仪)、3台3730xl,1台3130xl的测序规模,拥有超过10万亿次/秒的计算能力和大于1000TB的存储。目前已经完成部分454shotgun文库段测序,总体数据已经达到4乘的覆盖度,完成部分组织转录组的工作,为基因组注释提供参考。目前该项目正在加紧进行生物信息学的分析,预计将比计划提前完成鲤鱼基因组框架图的工作。   科学家希望通过鲤鱼基因组测序及其序列分析,为研究养殖鱼类的生长、发育、繁殖、遗传变异、疾病、与环境的相互用(包括抗逆能力)及其遗传改良提供重要的参考甚至指导信息。通过鲤鱼基因组的研究,可以获得与经济性状相关的基因,与疾病的发生及免疫相关的基因等,为鲤鱼的遗传育种提供基础。   随着人和其它主要动植物基因组的破译,模式动物和经济动物基因组计划方兴未艾,越来越多的鱼类被提上议程,世界各国的科学家相继完成了一些鱼类的基因组测序和分析工作,大都以本区域或者本国的鱼类产品为主,例如日本完成的青鳉鱼,挪威和加拿大共同完成的大西洋鲑等。作为我国鱼类中分布最广、品种最多、产量最高的鲤鱼基因组计划的开展,是我国水产科研步入现代科学先进行列的标志性事件,将对我国乃至世界水产业的发展产生重要的影响。
  • 英国基因组计划完成:目标为5500万公民提供基因组医疗服务!
    p strong   医疗保健的下一次重大转型很可能始于基因组计划! /strong /p p style=" text-align: justify text-indent: 2em " 早在2013年夏天,Genomics England就开始为100,000 基因组计划项目进行紧锣密鼓的筹备。 /p p style=" text-align: center" img src=" https://img1.17img.cn/17img/images/201902/uepic/6918dc05-7bd5-49a3-b542-b9f4b72542e2.jpg" title=" 微信图片_20190201134555.jpg" alt=" 微信图片_20190201134555.jpg" width=" 532" height=" 266" style=" width: 532px height: 266px " / /p p   该试点项目在启动时的目标可谓是雄心勃勃:完成100,000人全基因组序列的患者测序。英格兰国家卫生服务局(NHS)招募的参与者获取的基因序列将用于建立罕见病和癌症的研究队列,同时未来还将使用这些数据为诊断提供信息并指导临床护理。 /p p   当时的总理大卫卡梅伦是这次项目启动背后的强大后盾,他的长子伊万患有罕见的遗传病大田原综合症,这种病的体征是无数次严重的癫痫发作。不幸的是,2009年伊万在他六岁时死于此病。 /p p   2017年BIO会议的一个人头攒动的大厅里,卡梅伦这样表示:“这让我觉得我们可以做更多的工作来帮助研究遗传学和基因组学的药物,所以我通过了100,000人基因组计划项目,第一个测序的基因组至今仍旧放在我的桌子上,我认为可以将基因组数据库与我们的国家卫生服务部门结合起来。” /p p    strong 这项庞大的基因组计划绝不仅仅是一个梦想,它的最终目的旨在为所有5500万公民提供基因组医疗服务。 /strong /p p   Genomics England首席商务官Joanne Hackett表示:“由于当时全基因组测序的成本非常高,所以并没有人大规模地做这件事。“而就在其成立一年多后,Genomics England宣布与测序巨头Illumina合作,继而耗资3亿英镑,建成了剑桥外的Wellcome Trust Sanger研究所Genome校区的测序中心。 /p p   根据Illumina副总裁兼首席科学家David Bentley的说法,英国基因组学在项目结构方面的远见卓识绝对不容小觑,而他们认为这便是医学遗传学的未来。 /p p   尽管这项任务面临庞大的挑战,但这一切最终还是得到了回报。去年10月,NHS宣布将从该试点过渡,并将开始为任何疑似患有罕见病和某些癌症的人提供全基因组测序,而迄今为止最大规模的基因组医学服务将部署于世界上每一个角落。 /p p   就在去年12月初,英格兰基因组计划领导人宣布:已完成在2018年底测序100,000个基因组的宏伟目标,而要知道,截止去年2月他们才刚刚对50,000个基因组进行了测序,这无疑是一个巨大飞跃。 /p p   目前测序中心的试验步伐依旧迅速,现在每个月的检测速度在6,000到7,000个全基因组之间。而如果服务需求增加,数量上仍有足够的空间上涨,因为其测序操作已从目前正在使用的HiSeq仪器转换到Illumina新的,更快的测序平台NovaSeq。 /p p    strong 临床基因组的挑战 /strong /p p   虽然100,000基因组计划的第一个任务是帮助开发通过NHS提供基因组医学的工作模型,但它还包括运行一个平行的研究机构来利用测序数据供学术和商业实体使用,数据和相关发现将使NHS能够不断改善其对患者的服务。 /p p    strong 如何实现研究到临床护理的转化 /strong /p p   该组织与该项目的NHS关键联络人福勒表示:“我作为一名区域流行病学家目前正在调查传染病的暴发,而100,000基因组项目能够促进医疗保健转型,我坚信,而这势必会将研究和临床实践紧密结合在一起。” /p p   该计划的目的是将罕见病和癌症序列分离为50%和50%。但是,在开始收集癌症样本后不久,福勒和他的团队发现,对于大多数研究环境而言依靠FFPE组织样本是无效的。虽然FFPE样本长期被临床医生和研究人员使用,在存储人体组织有优势,通常有助于比较在不同时间采集的样本以跟踪疾病的进展。但是这些样品的测序通常是针对少数基因的,这些活动通常不受组织固定过程中已知的DNA降解和片段化的影响,而这时新鲜冷冻变成了唯一可行的选择。 /p p   放弃FFPE组织样本的决定使该项目的癌症患者招募工作停滞了大约一年,最终分离的结果为60%的罕见疾病基因组和40%的癌症基因组。英国基因组学研究人员正在试验不同的冷冻方法,以确定它是否影响测序质量以及样品使用不同的运输方法保持其完整性的时间。 /p p   福勒表示:“我不确定具体的数字是怎样的,但我们每周收到400份新冷冻样品,而这种数量是我们始料未及的。” /p p    strong 教育和培训 /strong /p p   NHS在接下来的18个月内会让所有国家医院信托基金的工作人员得到培训,计划在10年内培养出一支训练有素的基因组医学工作者队伍。 /p p   Chandratillake表示:雄心壮志很重要,100,000人测序看似是一座不可攀登的山峰,而我们现在已经登上山顶。现在我们要攀登一座更大的山。 /p p   Pope表示:由于NHS的目的是继续从基因组医学服务的患者那里收集研究数据,患者必须经过一个知情同意过程。因此,临床医生需要与患者就临床决策达成共识。” /p p   对于Chandratillake来说,全国范围内的基因组医学也是NHS的一个具体例子,它关注的是跨越种族,区域和社会经济方面的护理公平。通过100,000个基因组计划,NHS跟踪了患者招募和人口覆盖情况。 /p p   然而,除了护理公平,除了迄今为止最大规模的基因组医学部署,NHS和Genomics England的努力也正在迈入一个新的领域。 /p p   也许医疗保健领域的数字革命才刚刚开始。 /p p    strong 参考文献: /strong /p p   Genomic Medicine for the Masses England’s National Health Service launches genomic medicine service for all 55 million citizens /p
  • 北京基因组所开发国际领先基因组序列变异库
    p   近日,中国科学院北京基因组研究所生命与健康大数据中心开发了国际领先、国内首个规模最大的基因组序列变异库——GVM(Genome Variation Map)。该库基于人工审编整合了多个物种的大量基因组序列单核苷酸多态位点和小的插入与删除变异信息,是基因组序列变异信息汇交、管理与检索的资源库。研究成果以Genome Variation Map: a data repository of genome variations in BIG Data Center为题,在线发表在Nucleic Acids Research上。 /p p   基因组序列变异是基因组DNA水平发生的可遗传变异,是生物多样性的基础,是物种进化、分子育种、优良性状选育、人类疾病等研究最为宝贵的遗传资源。近年来,随着测序技术发展,越来越多物种的基因组被精细解析 物种内遗传多态变异位点也通过大规模的群体测序获得,并广泛应用于复杂性状的关联解析。国际两大数据中心NCBI和EBI旗下的dbSNP和EVA是主要的基因组序列变异资源库。今年5月,NCBI宣布自2017年9月1日起,dbSNP和dbVar两大数据库停止接收非人物种的SNP提交信息,自2017年11月1日起停止非人物种的SNP在线查询与提交。这对基于序列变异研究的科研人员造成了不便。 /p p   为此,GVM作为生命与健康大数据中心的核心数据资源库之一,搜集了以二代测序和芯片技术为主要检测手段的全基因组序列变异检测的原始数据,通过标准化的变异位点鉴定与注释,获得包括人、畜牧动物、主要农作物和其他资源物种在内的19个物种共约50亿的变异信息,8,884个个体的基因型数据,并通过人工审编收录了13,262条高质量非人物种的基因型与表型知识数据,整合了180,911条人变异位点的知识信息。其中,大熊猫、虎鲸、毛竹、橡胶、小麦是GVM数据库所特有的物种。 /p p   GVM开发了友好的数据提交、浏览、搜索和可视化功能。用户可通过基因组位置、变异影响、基因名称和基因功能等检索变异位点信息,并下载数据 可通过ftp服务下载VCF和FASTA文件格式的全基因变异信息 可在线或离线方式向系统提交数据,这方便了科研人员的数据共享。 /p p   研究工作得到了中科院战略性先导科技专项、中科院国际大科学计划、国家科技攻关计划、国家高技术研究发展计划(863计划)、国家自然基金项目、中科院百人计划、中科院青年创新促进会等的资助。 /p p 论文标题:Genome Variation Map: a data repository of genome variations in BIG Data Center /p p style=" text-align: center " img title=" W020171027507396378092.png" src=" http://img1.17img.cn/17img/images/201710/insimg/a8ee4d25-d8cb-4e86-a1de-06e90d767ff5.jpg" / /p p style=" text-align: center " strong GVM数据库物种变异信息统计表 /strong /p
  • 人类基因组计划完成15周年——从个人基因组到精准医疗
    本文作者基因组学科技工作者田埂,原文题目&ldquo 写给人类基因组计划完成十五周年:从一个人的基因组计划到精准医疗&rdquo 。   &ldquo 美国总统克林顿于当地时间26日上午10时在白宫举行的记者招待会上郑重宣布,由一批国际科学家组成的人类基因组研究计划已经完成人类基因组草图。英国首相布莱尔以卫星电视的形式参与了这个发布会。克林顿在评价这一历经10年时间完成的科学成果的深远意义时说,&lsquo 人们将世世代代记住这一天&rsquo 。他感谢美国、英国、德国、日本、中国和法国的上千名科学家为取得将这一开辟新纪元的成果所作出的贡献。&rdquo   田埂教授   刚刚看到这个2000年6月26日的新闻,突然发现不知不觉时间已经过去了15年。那个时候人们对刚刚完成的人类基因组草图充满了期盼:通过人类基因组信息帮助人们克服疾病,达到人们的终极健康长寿的需求。   在人类基因组计划完成的这15年里,那些主要参与国美国、英国、中国都发生了什么?   15年后的今天人们所能感受到的人类基因组计划的影响究竟是个什么样子?   未来的人类基因组研究和应用在往哪个方向发展?   15年后的今天,人们依然充满了期望。   美国在人类基因组计划完成后的变化   人类基因组计划组织和塞雷拉基因组公司兵分两路   在美国,人类基因组计划完成以后,原先竞争的两大阵营:人类基因组计划组织和塞雷拉基因组(Celera Genomics)公司,分别走向了两个方向:人类基因组计划原先的参与Whitehead Institute(后来的著名的Broad Institute)、美国能源部基因组中心、华盛顿大学医学基因组测序中心、贝勒大学医学基因组测序中心等11个基因组中心继续开展各类大型的基因组研究计划 塞雷拉基因组公司,则转向了心血管病和个体化医疗管理等商业方向。   可以说美国的人类基因组研究有一个贯穿始终的目的,就是将人类遗传和基因组信息应用到医疗和健康领域。因为科学家们认识到从第一个人类遗传病亨廷顿氏舞蹈症(Huntington&rsquo s Disease,又称为慢性遗传舞蹈病)的基因被定位,这种通过家系研究定位遗传病的方式,在没有对人类基因组序列的深刻认识,没有对人类遗传规律深刻的了解情况下,医学遗传学研究的速度将无法从本质上提高。   在这个认识的基础上,美国先后启动了&ldquo 国际人类基因组单体型图计划&rdquo (The International HapMap Project,HapMap计划) &ldquo 癌症基因组图集&rdquo (The Cancer Genome Atlas,TCGA)计划 &ldquo DNA元件百科全书&rdquo 计划(Encyclopedia of DNA Elements,简称ENCODE) 千人基因组计划(1000 Genome Project),以及最近炒的火热的&ldquo 精准医疗计划&rdquo (The Precision Medicine Initiative)。这些计划投资规模以百亿美元计,参与科学家以数万人计。可以说美国人在朝着既定的目标一步一步向前发展,脉络清晰,步骤明确,并且从人才培养到技术支撑,从领导科学家选拔到商业运行模式上的探索,都走在世界的前面。   在这15年的时间里,参与人类基因组计划的几位领导科学家也有了各自的发展:当时的领导科学家Francis Collins已经是现任NIH的主任 Whitehead Institute研究所的主任Eric Lander完成了将Whitehead Institute从MIT和Harvard的独立出来的工作,已经成为美国最大的基因组研究中心,他本人也是奥巴马总统的科技参赞,可以参与美国的科技政策决策 &ldquo 科学狂人&rdquo 塞雷拉基因组公司创始人Craig Venter则独辟蹊径,虽然塞雷拉基因组公司已经不再复当年风光,但是Craig Venter却先后成为第一个合成原核生物基因组的人,第一个用计算机模拟生物整个代谢途径的人,第一个提出海洋基因组学研究并实施的人。   与此同时,美国在基因组研究技术上也领先于世界,从人类基因组计划所使用的ABI和Amersham的第一代测序仪,到HapMap计划使用的Affymetrix和Illumina公司的芯片,再到千人基因组和TCGA以及Encode计划使用的Illimina公司的第二代测序系统,以及Pacbio的第三代测序系统,美国人在测序和基因组技术上的创新和积累,依然领先于世界。   英国在人类基因组计划完成后,率先启动十万人基因组项目   再看看英国:英国人对基因组研究的热情始终如一,从Frederick Sanger先生发明第一代测序系统,到首先参与美国提出的&ldquo 人类基因组计划&rdquo ,贡献仅次于美国,英国有欧洲大陆最大的基因组研究中心&ldquo Sanger Institute&rdquo ,是第二代测序技术的参与发明国,共同提出和启动了&ldquo 千人基因组计划&rdquo ,共同提出并启动和领导了&ldquo 国际肿瘤基因组计划&rdquo ,率先启动了Genome England的十万人基因组项目,间接影响到美国的&ldquo 精准医疗计划&rdquo 的提出。   英国人在人类遗传学上的投入也不遗余力,英国有全世界研究人类遗传病最好的研究团队,并且英国有政府引导,科学家和企业共同参与的举国基因组研究体制,可以说虽不及美国人在人类基因组研究上的布局深刻,但是英国总能在某些领域里有独特的见解和布局,通过自己的方式影响着世界,并且不得不说的是,英国在基因组研究领域对中国科学家毫无保留的帮助的无私情怀,从捐赠中国华大基因研究中心测序仪,到在各种国际合作中为中国提供便利和帮助,以及帮助中国培养基因组学研究人才,可以说中国的基因组学发展处处都有英国的帮助。   中国在人类基因组计划完成后,积极探讨&ldquo 中国版的精准医疗计划&rdquo   再看看中国这15年人类基因组学的研究进展。首先看看当时的报道&ldquo 1999年的日历翻开了。杨焕明说,要干就要干大,再难也要干大。于是,杨焕明、汪建、于军凑出了自己积蓄的200多万元。他们用这笔钱,购买了一台&ldquo 377&rdquo 型测序仪和一台美国产的毛细管测序仪。在不到半年的时间里,他们递交了人类基因组序列70万个碱基的测序结果,并做了热泉菌测序。这些成果,引来了国际同行的瞩目。&rdquo   6月29日,记者来到了中科院遗传所人类基因组中心。在实验室,记者看到,工作平台是用集装箱搭成的。在平台上,有三根玉米棒,旁边有一行字:穷棒子精神永放光芒!据介绍,深居京郊的这些科研人员,收入不高,也没有娱乐,在&lsquo 1%&rsquo 测序中,他们测序精确,但相应的测序成本却只有美国等国家测序成本的四分之一。&rdquo &ldquo &lsquo 中心&rsquo (作者注:北京华大基因研究中心)执行主任汪建对记者说:&ldquo 中国虽然只做了1%,但意义重大。中国科研人员在测序过程中,不仅增加了设备,而且培养了技术。21世纪生物产业发展的机遇,中国没有失去。&rdquo 他意味深长地说。&rdquo   随后,中国科学院成立了&ldquo 中国科学院北京基因组研究所&rdquo ,专注基因组研究,中国也参与了HapMap计划,同时发表了一系列植物和动物的基因组学研究成果,但从那以后中国的基因组学研究一度遭到寒冬,在大约三年的时间里,鲜有大型研究项目启动,研究成果也较少。   2007年6月华大基因南下深圳,成立了&ldquo 深圳华大基因研究院&rdquo ,深圳华大抓住了二代测序发展的关键时期,用独特的运行模式,先后完成了&ldquo 炎黄一号&rdquo 第一个黄种人基因组测序研究,发起并实施了&ldquo 炎黄九九基因组研究项目&rdquo ,共同参与设计和启动&ldquo 千人基因组计划&ldquo ,共同参与和发起&ldquo 国际肿瘤基因组计划&rdquo ,共同发起&ldquo 中国肿瘤基因组协作组&rdquo ,上个月华大发表了&ldquo 炎黄一号&rdquo 单倍型图的研究成果,将黄种人的基因组组装成了最完整的人类基因组单倍型图。   这些研究计划开展和研究成果陆续发表的同时,华大还培养了大批基因组科技人才,这些人才活跃在国内外基因组研究和产业化的各个领域。在有感于产业链上游测序仪的限制后,深圳华大于2012年完成了对美国Complete Genomics公司的收购,打通了产业链上下游。当然,这些大型的研究计划,都得到了深圳市政府和国家科技部等的支持。   展望:把握住基因组学发展的脉络,真正实现精准医疗的设想   在英国和美国相继提出自己的大型基因组研究计划后,中国也在积极讨论&ldquo 中国版的精准医疗计划&rdquo ,作为基因组学科技工作者我们也期望中国的&ldquo 精准医疗计划&rdquo 把握住基因组学发展的脉络,顺应人类基因组学研究发展的规律,真正实现精准医疗的设想。   回顾人类基因组计划完成这15年历史,我们会发现,在当年人类基因组计划的基础上,已经逐步建立起来的人们使用基因组和遗传信息来指导健康生活和医疗的路线图,相信在下一个15年,我们再笑谈15年里人类基因组研究和应用的发展时,我们可以欣慰的告诉自己,我为人类了解自己的基因组并应用做出了贡献。最后,由衷感谢参与人类基因组计划的所有科学家和科技工作和的工作,更加感谢中国参与过人类基因组计划的科学家和科技工作者们,是你们的辛苦工作让国人有机会更早的享受到基因组学进展为我们的健康生活和医疗带来的好处。   备注:作者田埂系基因组学科技工作者。
  • 北京基因组所等开发出叶绿体基因组综合数据库
    叶绿体是植物将光能转化为化学能的重要细胞器,具有独立的基因组。自植物叶绿体基因组被发现以来,被广泛应用于植物系统进化关系研究、光合作用调控机制研究、叶绿体基因工程等方面。随着基因测序技术的发展,尽管已发布了海量的植物叶绿体基因组序列,但如何整合应用这些数据目前仍面临数据命名标准不统一、数据信息不全以及较高经济价值的物种尚未进行测序等问题。  近日,中国科学院北京基因组研究所(国家生物信息中心)国家基因组科学数据中心章张、宋述慧团队,联合中国中医科学院中药资源中心袁媛、黄璐琦团队,开发了迄今为止物种数量最多的叶绿体基因组综合数据库Chloroplast Genome Information Resource(CGIR )。CGIR收录了来自11,946个物种的19,388条叶绿体基因组序列,包括利用全国第四次中药资源普查标本自测的718种未发表的叶绿体基因组序列,按照基因组(Genomes)、基因(Genes)、微卫星序列(SSRs)、DNA条形码(Barcodes)、DNA特征序列(DSSs)五个功能模块对数据进行组织与管理。相关研究成果以Towards comprehensive integration and curation of chloroplast genomes为题,发表在Plant Biotechnology Journal上。  根据生物物种名录(The Catalogue of Life),经过大规模人工审编,CGIR对所收录叶绿体基因组的物种分类信息进行审编,按照纲、目、科、属、种不同分类层级进行整理,并依据权威植物研究机构邱园发布的世界功能植物名录(World Checklist of Useful Plant Species)对药用植物、食用植物、环境植物、能源植物、有毒植物、能源植物等进行标注。同时,CGIR审编修正基因名的不规范命名、异名、错误注释等情况。在此基础上,CGIR系统整理各基因组的基因注释信息,为用户检索、浏览和信息获取提供便利。  针对分子标记开发这一叶绿体基因组最为常见的应用情景,CGIR使用生物信息学方法计算了所收录叶绿体基因组的微卫星序列、DNA条形码和DNA特征序列三种不同类型分子标记信息,同时,开发了相应的树型视图方便用户根据分类层级信息快速寻找目标标记,简化了科研人员开发分子标记的流程。  CGIR通过自主测序、整合公开基因组资源和人工数据审编向用户提供了目前最全面、物种数量最多的叶绿体基因组数据。经审编的物种分类、物种功能、基因名称与序列、分子标记等保证了数据的高度可靠,对植物系统发育、物种鉴定、叶绿体基因工程的发展均具有重要意义。  研究工作得到科技基础资源调查专项、中国中医科学院科技创新工程项目、中央本级重大增减支项目“名贵中药资源可持续利用能力建设项目”的支持。  论文链接 CGIR数据处理示意图及主要功能模块的数据统计
  • 中国启动十万人基因组计划:绘制国人精细基因组图谱
    p style=" text-align: center " img title=" 001.jpg" src=" http://img1.17img.cn/17img/images/201712/insimg/4ff2dbe1-e196-45d3-8e15-c70b870d0740.jpg" / /p p   科学家们希望通过绘制中国人精细基因组图谱,来研究疾病健康和基因遗传的关系。 /p p   此次启动的“中国十万人基因组计划”覆盖地域包含我国主要地区,涉及人群除汉族外,还将选择人口数量在500万以上的壮族、回族等9个少数民族。 /p p   基因是DNA上有遗传效应的片断,人类的生、老、病、死等都与基因有关。而基因组和基因是整体与部分的关系,人类基因约有25000个,基因组研究的目的就是要把人体内这25000个基因的密码解开,从而破译人类的遗传信息。此次基因组计划,就是要绘制我们民族的基因图谱。 /p p   项目首席科学家 王亚东教授:主要目标是研究中国人从健康到疾病是怎么转化的,为中国的医学研究或者是临床诊断、治疗疾病提供参考。 /p p style=" text-align: center " img width=" 500" height=" 352" title=" 002.png" style=" width: 500px height: 352px " src=" http://img1.17img.cn/17img/images/201712/insimg/779230ba-5597-4007-94f3-8ae2367a7247.jpg" border=" 0" vspace=" 0" hspace=" 0" / /p p   中科院院士 国家人类基因组南方研究中心主任赵国屏:那么这一点做下来以后,实际上是为我们中国人,包括汉族和各个少数民族在内,今后做中国人的疾病健康相关的遗传背景的认识,会有极大的好处。 /p p   按照计划,整个项目将在四年内完成全部的测序与分析任务,这也将是当前世界上推进速度最快的基因组工程。 /p p /p
  • 北京基因组所等解析NK细胞白血病功能基因组
    style type=" text/css" .TRS_Editor P{margin-top:0px margin-bottom:12px line-height:1.8 font-family:宋体 font-size:10.5pt }.TRS_Editor DIV{margin-top:0px margin-bottom:12px line-height:1.8 font-family:宋体 font-size:10.5pt }.TRS_Editor TD{margin-top:0px margin-bottom:12px line-height:1.8 font-family:宋体 font-size:10.5pt }.TRS_Editor TH{margin-top:0px margin-bottom:12px line-height:1.8 font-family:宋体 font-size:10.5pt }.TRS_Editor SPAN{margin-top:0px margin-bottom:12px line-height:1.8 font-family:宋体 font-size:10.5pt }.TRS_Editor FONT{margin-top:0px margin-bottom:12px line-height:1.8 font-family:宋体 font-size:10.5pt }.TRS_Editor UL{margin-top:0px margin-bottom:12px line-height:1.8 font-family:宋体 font-size:10.5pt }.TRS_Editor LI{margin-top:0px margin-bottom:12px line-height:1.8 font-family:宋体 font-size:10.5pt }.TRS_Editor A{margin-top:0px margin-bottom:12px line-height:1.8 font-family:宋体 font-size:10.5pt } /style p   侵袭性NK细胞白血病(ANKL)起源于NK细胞异常增殖,病情进展迅速,多数患者在极短的时间内发生多器官衰竭,部分患者还会出现吞噬血细胞的现象,病情凶险。ANKL患者即使积极接受正规治疗,平均生存时间也仅有几个月。目前,临床上ANKL的治疗面临两大问题:患者对传统化疗方案不敏感,医学界没有统一的治疗标准和指南;NK细胞白血病发病具有明显的地域差异,在亚洲(报道病例多以中国、日本、韩国为主)和中南美洲更常见,国际上以往只有少数病例的零散研究。NK细胞白血病发生发展的分子生物改变不明确,这制约着临床医生选择和制定有效的治疗方案。 /p p   NK细胞白血病患者的基因组发生了哪些改变?分子水平的变化是否能提供新的治疗策略?中国科学院北京基因组研究所王前飞研究组,联合华中科技大学附属武汉同济医院周剑锋团队,首次运用多种组学测序技术和功能试验结合的方式回答了上述问题。11月17日,相关研究成果以 em Integrated Genomic Analysis Identifies Deregulated JAK/STAT-MYC-biosynthesis Axis in Aggressive NK-cell Leukemia /em 为题,在线发表在 em Cell Research /em 上。 /p p   研究团队对近50例中国ANKL患病人群进行基因组、转录组以及代谢组的整合分析,结果显示,JAK/STAT信号转导通路的基因在NK细胞白血病中频繁发生突变。突变增强了JAK/STAT的信号传递功能,促使下游能够控制细胞代谢水平的MYC基因活化,进而一批参与代谢功能的基因过量的表达,NK白血病细胞呈现了代谢极其旺盛的特点(核苷酸和糖的代谢最突出);研究人员进一步通过疾病模型的一系列功能研究,证实了上述发现。此外,研究人员发现了在NK细胞白血病中携带能够修改遗传物质的表观修饰基因的突变,如TET2等基因。 /p p   该项研究揭示,NK细胞白血病存在代谢活跃的特征,这提示传统化疗方案联合抗代谢药物如左旋门冬酰胺酶可以有效缓解疾病进展;研究发现的JAK/STAT通路以及高度活化的MYC基因,也是开展新型治疗的靶点。依据该成果,周剑锋团队已启动相应的临床试验,致力于寻找能够治疗NK细胞白血病的有效方案。该原创性研究成果彰显了我国在NK细胞白血病研究和治疗领域实现自主创新的能力和信心,将引起更多科研人员和临床医生对恶性NK细胞白血病的关注。 /p p   研究工作获得自然科学基金委、科技部、中科院重点部署等的资助。 /p p style=" text-align:center " img alt=" " oldsrc=" W020171122411423608568.png" src=" http://img1.17img.cn/17img/images/201711/uepic/b47a2669-8dcd-4cdd-b0f7-a100fe072802.jpg" uploadpic=" W020171122411423608568.png" / /p p style=" text-align: center " img alt=" " oldsrc=" W020171120490093627118.gif" src=" http://img1.17img.cn/17img/images/201711/uepic/13c03bae-3fbe-434f-9205-5b4e1f8ca4b1.jpg" / ANKL发病机理模型及潜在的治疗新靶标 /p
  • 2015技术展望之基因组编辑
    规律成簇的间隔短回文重复CRISPR与内切酶Cas9的组合,原本是细菌抵御病毒的重要武器,现在这一组合已经成为了最热门的基因组编辑利器。   2014年基因组编辑热潮在持续发酵,CRISPR/Cas9仍旧是最引人注目的话题之一,相关论文被大量下载和引用。纵观CRISPR/Cas9的发展我们可以看到,科学家们仍在追求最理想的基因组工程技术,而2015很有可能会成为基因组工程年。   这里我们不妨大胆预测一下,明年基因组工程领域会起那些波澜:   1. 大规模CRISPR/Cas9。2013年,麻省理工的CRISPR技术先驱张锋(Feng Zhang)和同事为我们展示了CRISPR/Cas9进行多重基因组编辑的能力。相信在2015年大规模CRISPR/Cas9全基因组操作将越来越多,同时新多重基因组编辑法会大量涌现,还很可能会出现大型的引导RNA数据库。在这样的趋势下,每个人都能在自己的基因组工程研究中用上CRISPR/Cas9。   2. CRISPR对簿公堂。2015年将有更多公司提供以CRISPR为基础的实验工具,基于CRISPR的药物也将离我们越来越近。在这种情况下,基础研究领域可能会迎来历史上最大的专利诉讼。目前有三个团队都宣称自己享有CRISPR/Cas9技术的部分专利权,他们很可能最终会对簿公堂,而专利权的归属将决定CRISPR/Cas9日后的命运。   3.用细胞来记录生命。假如细胞能将自己发生的所有事情记录下来,我们将会读到些什么呢?2014年Timothy K. Lu和Fahim Farzadfard在Science杂志上发表了一项令人振奋的成果。他们通过合成生物学技术,将细胞事件的模拟记忆编码在活细胞DNA中。虽然这类研究还处于早期阶段,但随着研究者们不断突破细胞工程的极限,我们期待在2015年看到更多的进展和应用。   当然了以上都只是我们的推测,基因组工程领域其实是很难预测的,因为相关技术发展得非常之快。你看,短短两三年CRISPR/Cas9系统就走了这么远。这些基因工程领域的预测是否过于保守,就让我们拭目以待吧。
  • 首个毒蛙基因组被成功解析
    p style=" text-indent: 2em text-align: justify " 近日,中国科学院昆明动物研究所联合美国北卡莱罗纳大学、加利福尼亚大学和丹麦哥本哈根大学的研究人员成功“破译”草莓箭毒蛙(Oophaga pumilio)基因组,揭示了其基因组演化特征。该成果发表在国际期刊Molecular Biology AND Evolution上。美国加利福尼亚大学教授Rasmus Nielsen、昆明动物所研究员张国捷和美国匹兹堡大学教授Corinne L. Richards-Zawacki为文章的共同通讯作者。团队成员周龙和美国北卡莱罗纳大学博士Rebekah L. Rogers为文章的共同第一作者。 /p p style=" text-indent: 2em text-align: justify " 箭毒蛙是生活在中美洲及南美洲加勒比海沿岸的低地森林中的一种小型陆地蛙,当地部族将它们分泌的毒素涂在箭上,故得此名。强烈的毒性、绚丽斑斓的色彩以及独特的生活习性使得箭毒蛙不同寻常。一些箭毒蛙身上所携带的毒素,其强度是吗啡的200倍。虽然毒素是对付天敌的致命武器,但毒素对箭毒蛙本身却没有影响。箭毒蛙是如何从食物中获得毒素,箭毒蛙的神经系统又是如何演化出抗毒能力,目前还不清楚。 /p p style=" text-indent: 2em text-align: justify " 研究人员对草莓箭毒蛙进行了基因组测序和组装分析,发现草莓箭毒蛙的基因组的大部分区域是由高度重复序列组成的。进一步的比较基因组学研究发现,草莓箭毒蛙的重复元件在鱼和蛙类之间存在着大量的水平转移(Horizontal Transfer,HT)。这些水平转移元件表现出很高的重复性以及很高的转录表达水平,表明水平转移过后这些元件的扩增还在继续。 /p p style=" text-indent: 2em text-align: justify " 草莓箭毒蛙的基因组大小为6.76–9Gb,相比于四足动物要大很多。研究表明这些两栖动物基因组之所以很大,某种程度上可以解释为其基因组的变化是一个转座子(Transposable Elements,TE)不断入侵的过程,并且这些转座子尚未在生殖系中被抑制。转座子的不断扩增导致其基因组逐渐增大。 /p p style=" text-indent: 2em text-align: justify " 此外,研究人员还发现在草莓箭毒蛙SCNA基因家族发生了核苷酸替换,已有研究表明基因SCNA参与了神经毒性生物碱毒素的毒性抵抗作用。其中氨基酸替换M777L在5个SCNA旁系同源基因中同时发生了替换,结果表明这些氨基酸替换在抵抗神经毒性生物碱的毒性中可能发挥着潜在的作用。研究人员还发现了第一个基因组测序毒蛙中的离子通道,并讨论了其与皮肤对隔离毒素的自耐受演化关系。 /p
  • 2017: 基因组学的突破之年
    p style=" text-align: center" img src=" http://img1.17img.cn/17img/images/201712/insimg/6d24d129-b200-4ee0-805e-22b518688387.jpg" title=" 1.jpg" style=" width: 599px height: 322px " width=" 599" vspace=" 0" hspace=" 0" height=" 322" border=" 0" / /p p style=" text-align: center " span style=" color: rgb(0, 112, 192) " strong Francis deSouza br/ /strong /span /p p style=" text-align: center " span style=" color: rgb(0, 112, 192) " strong & nbsp Illumina公司总裁兼CEO /strong /span br/ /p p style=" text-align: left " br/   Evelyn Villareal出生时患有1型脊肌萎缩症(SMA1),这是一种遗传病,患病的婴儿会逐渐瘫痪。诊断结果让她的父母心碎不已,因为他们的第一个女儿也被这种疾病夺去了生命,当时她只有15个月大。大多数患病的儿童活不过两岁。 br/   不过这一次,这个家庭发现了一种临床试验。八周时,Evelyn接受了一种实验性治疗,具体方案是让携带健康基因的病毒穿过血脑屏障,提供一种关键的缺失蛋白。试验获得了惊人的成功:所有15个婴儿都取得了良好的反应,Evelyn现在已经三岁了。 br/   SMA1并不是个例。经过20年的紧张工作,我们突然发现一系列的基因治疗都取得了成功。Spark Therapeutics公司的Luxturna有望成为第一个被批准用于遗传性失明的药物。另一种针对大疱性表皮松解的实验性治疗也在开发当中。这些患病的孩子常被称为“蝴蝶儿童”,因为他们的皮肤如蝴蝶翅膀一般脆弱。 br/ /p p style=" text-align: center " span style=" color: rgb(255, 192, 0) " strong 对抗癌症 /strong /span /p p   癌症是一种遗传病,所以基因组测序可以在癌症诊断和治疗中发挥重大作用。Foundation Medicine的综合性实体瘤遗传检测FoundationOne CDx& #8482 近日获得了美国食品药物管理局(FDA)的批准,这一事件具有里程碑式的意义。 br/   利用新一代测序,这种检测寻找324个基因中与黑色素瘤、乳腺癌、结直肠癌、卵巢癌以及非小细胞肺癌相关的变异。肿瘤医生根据检测的结果,将每位患者与获批的靶向疗法、免疫疗法或临床试验相匹配。 br/   这一成功案例并不是孤证。今年,美国FDA简化了肿瘤分析检测的批准程序。更多产品即将获批。 br/   FDA也创造了历史,批准了美国第一个基因治疗:诺华(Novartis)的Kymriah,适用于治疗患晚期白血病的儿童。FDA很快又批准了吉利德(Gilead)旗下Kite Pharma的Yescarta,它适用于一种成人淋巴瘤。这些疗法从人体中提取出T细胞,对其进行遗传改造,使其对抗患者的特定癌症。 br/   默克(Merck)的免疫治疗药物Keytruda则是另一个监管上的里程碑,它是第一个获批的癌症治疗药物,适用于带特定基因组生物标记的实体瘤,而无论其在身体中的何处。 br/ /p p style=" text-align: center " span style=" color: rgb(255, 192, 0) " strong 基因编辑的进展 /strong /span /p p   作为近年来最激动人心的发现之一,CRISPR-Cas9基因编辑能够确保稳定的食物供应,让生物燃料更经济,并治愈许多遗传病。此外,一种新的CRISPR变体Cas13让研究人员能够编辑RNA,而不仅仅是DNA,这打开了许多治疗应用的大门。 br/   2017年,一名患者首次接受了一种意在精确编辑体内细胞DNA的疗法,该临床试验利用基因编辑工具来治疗亨特综合征,这是一种遗传代谢疾病,可导致严重残疾。 br/   另外,研究人员还利用CRISPR来校正胚胎的遗传性疾病。研究小组修复了MYBPC3基因中的突变,这些突变可能导致心源性猝死及其他心血管疾病。如今,我们拥有了工具,有望消除亨廷顿舞蹈症、囊性纤维化及其他遗传病。不过,生殖系的编辑也引发了伦理问题。研究需要开展下去,而法律、监管和伦理的讨论也必须跟进。 br/ /p p style=" text-align: center " span style=" color: rgb(255, 192, 0) " strong 患者权益的改善 /strong /span /p p   基因组测序已经推动了医疗保健的各种进步,但如果患者享受不到,便毫无意义。今年,精准医疗在付费者接纳方面迈出了重要的一步。 br/   FoundationOne Cdx实体瘤检测除了获得FDA的监管批准,还获得了美国联邦医疗保险(Medicare)的初步覆盖,这意味着最容易患癌症的老年患者将有更多的机会使用这种检测。 br/   其他付费者也正参与其中。11月,美国最大的私营保险公司联合健康保险(United Healthcare)开始报销罕见病患儿的全外显子组测序。 /p p br/ /p p style=" text-align: center " span style=" color: rgb(255, 192, 0) " strong 更多的群体基因组学 /strong /span /p p   全世界的多个国家在群体基因组学上继续取得进展,希望更好地了解遗传学与疾病之间的关联。丹麦和印度也加入英国、美国、中国、卡塔尔、沙特阿拉伯、土耳其和爱沙尼亚的行列,开展群体基因组学计划。截至本月,全球首个也是最大的群体基因组学行动Genomics England的十万人基因组计划已经对癌症或罕见遗传病患者的41,000多个基因组进行了测序。英国国民保健署(NHS)正准备将全基因组测序作为某些罕见病和癌症患者的常规诊断检测。 br/   同时,法国也首次指定了2个测序点,而最终将有12个测序点分布在该国的大学医院,作为法国2025年基因组医疗计划的一部分。该计划旨在将基因组医疗整合到法国的临床保健行动中,其目标是在2020年之前,每年对23.5万个基因组进行测序。 br/   在美国,国立卫生研究院的All of Us研究计划开始招募参与者,而美国退伍军人事务部也签订了一份合同,对百万退伍军人计划(MVP)的首批34,000个基因组进行测序。最终,All of Us和MVP计划将分别收集超过百万名美国人的健康数据,包括基因组信息。 br/ /p p style=" text-align: center " span style=" color: rgb(255, 192, 0) " strong 基因组学无处不在 /strong /span /p p   2017年,基因组学生态系统以多种方式扩大,包括直接面向消费者的市场。Helix推出了在线消费者市场,提供基于DNA的产品。23andMe的客户超过了200万。单就今年来看,AncestryDNA的客户就翻了一番,超过600万,也创造出世界上最大的DNA数据库。 br/   这一势头将逐步强劲,而周密的监管将起到重要作用。FDA宣布,它正在简化消费者检测公司的审查程序。 br/   以基因组学为重点的创业公司也呈爆炸式增长,包括Illumina加速器资助的那些。例如,Checkerspot正利用先进的生物技术和化学来设计高性能的材料,而Mantra Bio正利用外泌体(exosomes)这种天然存在的细胞结构来输送新一代的靶向治疗药物。 br/ /p p style=" text-align: center " span style=" color: rgb(255, 192, 0) " strong 临床基因组学 /strong /span /p p   研究人员和临床医生正为充分利用基因组学而另辟蹊径。基因组测序技术让新境界触手可及:更大规模的研究,以全基因组而不是外显子组为对象的更广范围应用,以及超深度测序。这将让“大海捞针”的应用成为现实,比如开展深度的肿瘤分析,或通过一滴血来寻找单个癌症分子。 br/   麻省理工学院和哈佛大学旗下Broad研究所的研究人员表明,他们能够检测患者血液中几乎90%的肿瘤遗传特征,而Illumina子公司Grail也推进了其液体活检项目。 br/   Illumina的NovaSeq架构也支持这些及其他方面的工作,而这种技术才刚刚开始在患者中发挥作用。 br/   保健革命的潜力是惊人的。目前,只有少数实体瘤得到了测序。科学家已经开始揭示ApoE4基因变异如何增加阿茨海默病的风险。同时,人类细胞图谱(Human Cell Atlas)计划正在绘制人体中全部37万亿个细胞。通过描绘和定义健康与疾病的细胞基础,这项大胆的举措将影响生物学和医学的方方面面。 br/   测序有望彻底改变癌症、未确诊的罕见遗传病及进行性疾病(如阿茨海默病)的治疗方式。对于Evelyn等孩子来说,生活从此变得不同,他们如今也有机会过上健康长寿的生活。而作为Illumina的一份子,我们很荣幸能够推动这些进步,让全世界的广大民众受益。 /p p style=" text-align: center " img src=" http://img1.17img.cn/17img/images/201712/insimg/6322412a-1eff-448c-9715-2532ee6f71f3.jpg" title=" 2.jpg" style=" width: 600px height: 400px " width=" 600" vspace=" 0" hspace=" 0" height=" 400" border=" 0" / /p
  • 对10万患者基因测序,以色列将建基因组数据库
    p style=" text-indent: 2em " 今年早些时候,为确立自己在精准医学和数字健康领域的世界领先地位,以色列提出了一项开发基因组和临床数据研究平台的国家倡议。 strong 近日,以色列宣布将开启一项大型人口基因组计划,计划到2023年,对超过10万名患者进行基因组测序,以改善患者的个体化医疗服务。该计划还将于2019年初开始与以色列健康管理组织(HMO)合作并收集患者样本。 /strong span id=" _baidu_bookmark_start_25" style=" line-height: 0px display: none " ? /span /p p style=" text-align: center " img width=" 598" height=" 240" title=" 311.jpg" style=" width: 529px height: 218px " alt=" 311.jpg" src=" https://img1.17img.cn/17img/images/201812/uepic/7f38dd31-6fc6-4abb-998b-cd6924afd51f.jpg" / /p p style=" text-align: center " strong 凭借独特优势 建立国家健康数据库 /strong /p p   据悉,以色列政府计划花费约10亿新谢克尔(约2.66亿美元)来支持这项基因组和个性化医疗计划。该计划的共同组织者、以色列创新管理局技术基础设施部门高级专家Ora Dar表示,该计划的 strong 最初动机就是改进数字医疗健康技术和基础设施,使以色列人民受益。 /strong 除创新管理局外,以色列总理办公室、财政部、卫生部、社会平等部、经济部、科学技术部以及高等教育委员会的领导人也在牵头开展这项计划。据他透露,领导该计划的CEO已经被选举出来,将负责政府以外的资金筹集工作,详细信息目前尚未公布。 /p p   Dar介绍道,工作团队将专注于整合医学、学术科研和工业转化,以便为患有多种疾病患者提供个性化的解决方案。作为该计划的一部分,研究团队还将开展Mosaic Project,招募可代表以色列流行病和种族特征的志愿者, strong 在保证隐私安全和匿名的前提下,收集其临床和基因组信息,最终建立一个可用于研究遗传学和医学信息的国家健康数据库 /strong 。研究团队将在常规医院收集志愿者的生物样本,包括血液、唾液、尿液、粪便以及其他类型的样本,以收集全面的生物信息。志愿者还可以预约进行特定样本收集。 /p p   在Mosaic数据库中,研究人员可以通过识别不同患者的信息,选择性进行NGS测序和其他检测。同时,该研究团队也将开发数据分析技术,尤其是肿瘤的个性化治疗研究领域,但患者样本采集收集工作流程仍需要详细的验证。此外,该计划也将建立科学和伦理委员会,负责研究项目批准和测序资金分配。人们需要申请以获得数据可的访问权。 /p p   Mosaic数据库将借助以色列的独特“竞争优势”得到充实,包括国家获取的患者医疗数据,多样化的遗传人群、先进的科学研究项目以及日益增长的创业环境等。 strong 因为在过去的20年中,98%的以色列人口已经完全被电子医疗记录体系覆盖 /strong ,包括以色列人、贝都因人以及来自世界各地的人,而且大部分人都获得了两个大型HMOS的投保。Dar相信,借助近20年的医疗健康信息,Mosaic Project能够展示以色列公民患有的长期疾病和发病趋势。 /p p   尽管有政府支持,但不可否认的是,该计划的实施仍存在一些障碍。首先就是进一步加强数据系统和数据标准化。为方便人工智能检查患者的数据,要对患者的电子医疗记录、医学影像和样本进行实时监测。同时,还要改善和扩大研究人员获取临床数据的机会,以及加强数据分析人员的培训和资格认证。在道德伦理审查、知情同意和隐私安全方面也要投入大量精力。 /p p style=" text-align: center " strong 大人群基因组计划的兴起 /strong /p p   除了以色列的基因测序计划,也有多个国家先后宣布启动大型人口基因组测序计划,夯实以基因数据为基础的精准医学,为疾病诊疗、药物研发提供更多的数据基础。近日,英国方面宣布,其“十万人基因组计划”工作已经完成。该计划于2012年启动,历经5年半,耗资超5亿美元。计划收集的10万人的基因组测序信息可以帮助科学家和医生更好的了解罕见病和癌症,创造新型“基因组医学服务”框架。此外,2018年10月,英国政府宣布将在未来5年内开展500万人基因组计划,这是迄今为止全球最大规模的人群基因组计划。 /p p   2017年12月,中国正式启动“十万人基因组计划”。这是我国在人类基因组研究领域实施的首个重大国家计划。该计划将绘制中国人精细基因组图谱,研究疾病健康和基因遗传的关系。其覆盖地域包含我国主要地区,涉及人群除汉族外,还将选择人口数量在500万以上的壮族、回族等9个少数民族。 /p p   2018年5月,美国国立卫生研究院正式启动All of Us 研究项目,以加速精准医学研究、改善健康状况。All of Us是NIH近年来资助规模最大的项目之一,也是一项全民参与的健康研究项目。该项目预计纳入100万人的队列研究,参与者包括各种族、不同年龄和性别的人群,也包括病人和健康人。 /p p   此外,法国、澳大利亚、日本等国家都启动了大型的人口基因组测序计划。所有这些计划都指定了多个公司作为合作伙伴,为研究的开展提供特定测序技术服务,帮助分析基因组数据。以以色列的基因组计划为例,目前有500多家以色列公司在数字健康处理方面为该计划提供服务,同时将有更多技术型企业加入合作,某些公司还可以开发网络技术保护患者的个人数据和隐私。具体信息将在2019年年初公布。 /p p   基因组医学为医学研究带来了一场革命。随着世界各国万人级别基因组测序计划的逐渐兴起,以基因组学为基础的精准医学也迅猛发展,大数据竞备赛的帷幕已经拉开。大量基因测序计划的实施为为开发医疗解决方案和创建大数据分析平台提供了数据基础,为癌症、罕见病等疾病的研究提供了数据支持。同时,从事医疗设备、药品、医疗人工智能和数据分析的科学公司也能从中获得临床、基因组和其他相关数据,并最终造福患者。 /p p   参考资料: /p ol class=" list-paddingleft-2" style=" list-style-type: decimal " li p Israel to Sequence 100K People, Create Genomic Database to Support & #39 Digital Health& #39 /p /li /ol
  • Nature子刊!多种测序技术联合 助力高质量豌豆参考基因组和泛基因组发布
    2022年9月22日,中国农业科学院作物科学研究所联合中国科学院微生物所、山东省农业科学院农作物种质资源研究所、国际半干旱热带作物研究所和澳大利亚默多克大学等国内外多家单位在Nature Genetics上以长文的形式发表了题为Improved pea reference genome and pan-genome highlight genomic features and evolutionary characteristics的研究论文。研究团队完成了中国豌豆主栽品种“中豌6号”的基因组组装和解析,解决了长期以来悬而未决的豌豆基因组精细物理图谱组装难题,揭示了豌豆基因组结构和进化的独特特征,发掘了一批与粒型、株高和荚型等孟德尔性状和重要农艺性状相关的位点和基因,同时构建了栽培和野生豌豆泛基因组,展示了豌豆近缘野生种和地方品种作为未来豌豆育种改良资源的巨大潜力。高质量的参考基因组、注释和泛基因组对豌豆种质资源挖掘利用和育种改良的基础与应用研究具有重要参考价值和指导作用,同时也为其他豆科作物基因组和泛基因组研究提供了重要借鉴。自孟德尔发现遗传定律以来,豌豆作为遗传研究的“明星”植物,受到了学界和公众的广泛关注。豌豆 (Pisum sativum L., 2n=2x=14) 是一年生冷季食用豆类,属于豆科(Leguminosae)、蝶形花亚科(Papilionoideae)、野豌豆族(Viceae)、豌豆属(Pisum L.)。豌豆富含蛋白质、淀粉、纤维素和多种矿物质,是粮菜饲兼用的食用豆类作物,在世界范围内广泛种植。据FAO统计资料显示(http://www.fao.org/faostat/),世界豌豆的总产量和种植面积逐年增加,中国豌豆特别是鲜豌豆的总产量与种植面积也增长迅速。同时,豌豆的生物固氮能力可以减少氮肥使用,有效改善土壤结构,还可作为倒茬作物减少病虫害,促进农业和自然生态系统的可持续发展。作物种质资源是支撑农业发展创新和作物遗传改良的物质基础,目前国家作物种质库保存豌豆种质资源达到7000余份,蕴藏着丰富的遗传多样性,亟待深入挖掘和利用【1】。图1 中豌6号形态特征及豌豆种质资源多样性豌豆基因组大小约为4.28 Gb,远大于大豆(4倍)、鹰嘴豆(6倍)、普通菜豆(7倍)、绿豆和小豆(8倍)等其他豆科作物基因组,其基因组中有超过80%的重复序列。由于豌豆基因组的复杂性,直到2019年,国际上才公布了第一版以二代测序技术(Next Generation Sequencing, NGS)为主的豌豆参考基因组,为豆科植物基因组进化提供了新的见解【2】。然而,由于NGS技术的短板,这一版基因组组装得到的218,010个contigs的 N50 值仅为37.9 Kb,组装结果碎片化严重,尤其是在复杂的重复区域,与高质量参考基因组的标准相去甚远【2】。此外,研究表明,与国外豌豆种质资源相比,中国豌豆具有独特的遗传背景和丰富的遗传变异【3】。由于缺乏豌豆高质量基因组和精细物理图谱,严重滞后了豌豆重要农艺性状的遗传解析和种质资源挖掘利用进展,尤其阻碍了对国内外不同豌豆种质资源的综合利用。为了解决上述科学难题,研究团队利用中国豌豆主栽品种“中豌6号(ZW6)”,以PacBio 单分子实时 (SMRT) 测序为基础,结合 10x 长片段测序、Bionano 光学图谱和染色质三维构象捕获 (Hi-C),以及 Illumina NGS 技术,联合优化多种组装策略,完成了迄今为止最高质量的豌豆基因组精细图谱和基因注释(图2)。该基因组组装大小约为3.8 Gb,序列对总共7条染色体的定位率达到97.96%,组装的contig水平N50达到了8.98Mb。通过遗传图谱一致性评估、BUSCO分析、Merqury分析以及LAI分析在内的综合基因组组装评估方法,均表明该组装在连续性、准确性和完整性方面表现优异。此外,该组装共注释出47,526个编码基因,并且在基因完整性、调控区完整性、转座子组装完整性和注释完整性方面均得到了明显改善。豌豆基因组高质量精细物理图谱的获得,拓宽了我们对豌豆巨大基因组背后遗传学的了解,为豌豆重要农艺性状的遗传解析和种质资源的挖掘利用提供了宝贵基因组资源。图2. 豌豆基因组的重要特征。豌豆大约在10,000 年前被驯化,被认为是最早驯化的豆类作物之一。然而,尽管它在推进植物遗传学方面发挥了关键作用,但豌豆属内的物种划分长期存在争议,其驯化过程仍不清楚【4】。研究团队基于118个栽培和野生豌豆的全基因组重测序数据,不仅揭示了栽培和野生豌豆SNP、InDel和SV等不同变异类型的基因组多态性特征,同时基于SNP和SV多态性变异信息的群体遗传结构和系统发育分析,阐明了栽培和野生豌豆的群体遗传结构,支持豌豆属内包含3个物种P. fulvum、P. sativum 和 P. abyssinicum的结论。同时在 P. sativum中鉴定出了三个遗传分组,其中 P. sativum II (PSII) 和 P. sativum III (PSIII) 主要对应于代表亚洲和欧洲不同地理区域栽培豌豆的两个遗传分组,可能与豌豆驯化后的传播途径有关(图3)。以上结果解决了长期以来关于豌豆属物种划分的争议,为豌豆起源驯化提供了新的基因组学证据,也为豌豆种质资源的综合开发利用提供了科学依据。图3 基于SNP (a, b, e)和SV (c, d, f)的118份栽培和野生豌豆的群体遗传结构。孟德尔通过研究豌豆的七个性状发现了遗传规律,开创了遗传学研究的先河。在过去的几十年中,孟德尔研究的四个性状包括粒型(R/r)、株高(Le/le)、子叶颜色(I/i)以及种皮和花色(A/ a)的四个基因位点已经被克隆并进行了功能分析;而其他三个孟德尔性状,果荚颜色 (GP/gp)、荚型 (V/v) 和花的位置 (Fa/fa)相关的基因位点尚未解析【5】。为了探索豌豆重要农艺性状的遗传基础,研究团队利用GBS测序对WJ×ZW6杂交构建的300个F2群体中的12个农艺性状进行了QTL分析(图4),鉴定出了25 个与12个农艺性状相关的QTLs,其中有三个为孟德尔性状相关位点和基因,包括控制粒型(圆粒/皱粒,R/r)和株高(高/矮,Le/le)的孟德尔基因,以及与荚型(硬荚/软荚,V/v)相关的候选基因。图4 豌豆12个农艺性状QTL分析结果以及与孟德尔性状相关的3个QTL位点和基因【5】。越来越多的研究表明,单一的参考基因组不足以代表一个物种,特别是对于豌豆这类经历过长期驯化的物种,而泛基因组分析为作物种质资源变异解析和挖掘利用提供了有效手段。为了更深入地了解栽培和野生豌豆的多样性,研究团队构建了基于116个栽培和野生豌豆全基因组测序的泛基因组(图5),发现栽培和野生豌豆种质资源大部分泛基因组多样性主要存在于不同物种和遗传分组之间,并且以特有基因组序列的形式存在。对豌豆泛基因的存在/缺失变异模式(PAV)分析发现,随着新基因组数目的增加,核心基因的数量减少,而泛基因的数量增加,并逐渐趋于饱和(图5a)。同时,在多个豌豆基因型中存在的核心基因在其他27 个植物基因组中也更保守(图5b),表明它们具备通用的核心功能。基于跨基因组同源基因系统发育分类方法(HOG),研究人员将116个泛基因组的基因聚类生成 112,776个泛基因簇,在不同物种之间显示出差异显著的PAV模式(图5c)。对不同泛基因分组中特有泛基因的 GO 分析显示出保守基因和可变基因之间的不同功能富集。值得注意的是,P. abyssinicum独特的泛基因在刺激和化学反应方面富集,而P. fulvum的泛基因在发育、生长、繁殖、细胞骨架等方面富集,进一步证实了豌豆野生近缘种和地方种质资源作为育种材料在未来提高豌豆品种抗性和产量方面的潜在价值。图5 116个代表性栽培和野生豌豆的泛基因组分析结果(包括 ZW6)。总之,研究人员克服了复杂基因组组装的多重障碍,成功绘制了中国豌豆基因组高质量精细物理图谱,还构建了栽培和野生豌豆泛基因组,揭示了豌豆基因组进化特征、群体遗传结构与重要性状的分子基础,为豌豆起源驯化、基因挖掘、种质创新和育种改良以及豆科植物比较基因组学研究提供了重要借鉴和宝贵资源。这项研究邀请了澳大利亚默多克大学Rajeev K Varshney教授共同开展国际合作研究,他认为这次研究成果为公众提供了高质量的豌豆参考基因组,产生的基因组资源不仅有助于豌豆的遗传基础研究,以应对气候变化带来的挑战,还将促进豌豆优异基因的挖掘和优良品种的开发。此外,宗绪晓课题组及其合作团队还建立了豌豆遗传转化体系,利用CRISPR/Cas9基因编辑体系成功实现对豌豆PDS基因的编辑【6】。恰逢孟德尔诞辰200周年,豌豆高质量基因组和泛基因组的发布,以及豌豆基因编辑技术体系的建立将为豌豆重要农艺性状的遗传解析和种质资源的挖掘利用提供有力的技术支撑。中国农业科学院作物科学研究所杨涛副研究员和刘荣助理研究员、中国科学院微生物研究所骆迎峰副研究员和胡松年研究员以及山东省农业科学院农作物种质资源研究所王栋助理研究员为论文的共同第一作者。中国农业科学院作物科学研究所宗绪晓研究员、中国科学院微生物所高胜寒特别研究助理、山东省农业科学院农作物种质资源研究所丁汉凤研究员、国际半干旱热带作物研究所和澳大利亚默多克大学Rajeev K Varshney教授为论文的共同通讯作者。中国科学院植物研究所葛颂研究员,西北农林科技大学徐全乐副教授、山东省农业科学院作物种质资源研究所李娜娜副研究员、云南省农业科学院何玉华研究员、青海大学刘玉皎研究员、江苏沿江地区农业科学研究所王学军研究员、四川省农业科学院项超副研究员以及中国农业科学院作物科学研究所研究生王晨瑜、李冠、黄宇宁、季一山、李孟伟,国际半干旱热带作物研究所Manish K Pandey和Rachit K Saxena博士,也参与了该项研究。辽宁省农业科学院李玲研究员,澳大利亚谷物种质库Bob Redden教授和美国农业部农业研究中心、华盛顿州立大学胡锦国教授对项目开展提供了重要帮助。豌豆基因组研究得到了科技部国家重点研发计划(2018YFD1000701/2018YFD1000700)、中国科学院青年创新促进会(2017140)、山东省农业品种改良项目(2019LZGC017)、中国农业农村部食用豆现代产业技术体系(CARS-08)、国家自然科学基金(31371695和31801428)、山东省农业科学院科技创新项目(CXGC2018E15)、作物种质资源保护(2130135)、山东省农科院科技创新项目产业团队农业科学(CXGC2016A02)、山东省现代农业产业技术体系粗粮创新团队(SDAIT-15-01)、中国农业科学院创新工程(ASTIP)和山东省农业科学院青年研究基金(2016YQN19)等项目的支持。
  • 功能基因组学高峰论坛---基因大数据时代
    p & nbsp /p p & nbsp & nbsp & nbsp & nbsp & nbsp & nbsp strong 仪器信息网讯 /strong 第四届全国功能基因组学高峰论坛共设基因与大数据、基因组与功能基因组学、基因科技与精准医疗三个分会场有近七十位学术专家带来了精彩报告。报告内容涉及基因组学在各领域内的前沿及研究进展,可谓百花齐放,百家争鸣,与会专家积极提问交流,现场反响热烈。 /p p & nbsp /p p strong 基因大数据时代的关键是数据分析 /strong /p p style=" text-align: center " img title=" IMG_6778_副本.jpg" src=" http://img1.17img.cn/17img/images/201710/insimg/7f5c106c-ac3e-492a-a21d-318f0cce4688.jpg" / /p p style=" text-align: center " 中国科学院生物物理研究所院士陈润生 /p p & nbsp /p p & nbsp & nbsp & nbsp & nbsp & nbsp 中国科学院生物物理研究所的陈润生院士是中国最早从事理论生物学和生物信息学研究的科研人员之一,他站在开拓者的高度上为大家带来了报告:大数据· 精准医疗。 /p p & nbsp & nbsp & nbsp & nbsp & nbsp 陈润生院士介绍:在美国的牵头下,精准医疗已被各国列入战略规划,因其有着直接解决当前医疗行业面临的诸多困难的潜力,预计接下来的几年将会爆发式的增长,到2018年全球市场规模会到达2238亿美元。随着技术的发展,测序已不再是难题,现在制约发展的关键是大量测序数据如何到高效的解读。陈院士打了一个有趣的比喻说,一个人的基因数据写成每本100页的书要10000本书才能写完,数据量如此大,并且生物个体间的测序数据又呈现异质化。故大量并且高度异质化的数据如何与表型正确关联,解决这一难题才是真正的挑战。 /p p & nbsp & nbsp & nbsp & nbsp & nbsp & nbsp 挑战往往伴随着机遇,数据解读大有可为,同时陈院士指出:基因中只有3%符合中心法则,而97%的非编码RNA存在着大量的遗传密码暗信息。对这一领域的探究也孕育着颠覆性的发现,甚至我们认可的中心法则都有可能被改写。本次会议中有多位专家带来了其在非编码RNA领域的研究成果,其中北京大学高歌研究员建立了非编码RNA数据库并在会上与大家做了分享。期待该领域研究的重大发现! /p p & nbsp /p p strong 基因测序离不开技术的支持 /strong /p p style=" text-align: center " img title=" IMG_6775_副本.jpg" src=" http://img1.17img.cn/17img/images/201710/insimg/1b758035-9f85-4e17-82af-4bb2e646723e.jpg" / /p p style=" text-align: center " 中国科学院北京基因组研究所研究员于军 /p p & nbsp & nbsp & nbsp & nbsp & nbsp 中国科学院北京基因组研究所于军研究员在会上分析了二代测序的优势,突破及局限并展望了三代、四代测序仪未来体外诊断技术方面应用的发展前景。于军研究员还带来了他纳米孔在测序仪方面应用的研究进展,纳米孔技术在分析研究DNA,RNA的变化行为,如共价修饰方面的应用有着巨大的潜力。 /p p & nbsp /p p style=" text-align: center " img title=" 腾讯云,百迈克.jpg" src=" http://img1.17img.cn/17img/images/201710/insimg/b01749bb-a38c-4e51-819c-f5ecc4ff20c1.jpg" / /p p & nbsp & nbsp & nbsp & nbsp & nbsp & nbsp 数据处理就离不开计算机技术平台的配合支持,大会中百迈克公司与腾讯达成了合作。计算机技术显示出其在大数据领域的前景,腾讯开发了服务基因行业的PAAS平台—腾讯双螺旋,浪潮公司会上报告分享了其开发的在基因测序数据的整合和分析平台。 /p p & nbsp /p p strong 基因组学助力各领域科研 /strong /p p img title=" 辛业芸.JPG" src=" http://img1.17img.cn/17img/images/201710/insimg/263b29a2-456a-4d5e-813a-d5e2d86a31fa.jpg" / /p p style=" text-align: center " 湖南杂交水稻研究中心袁隆平团队中心研究员辛业芸 /p p & nbsp & nbsp & nbsp & nbsp & nbsp 湖南杂交水稻研究中心袁隆平团队中心辛业芸研究员的报告中指出:其利用基于表型组、基因组和转录组综合分析杂交水稻产量优势相关的基因和QTLs对推动杂交稻的分子设计育种实践有重要的意义。其团队对水稻杂种优势的表型及分子基础进行了综合分析找出了小花数与有效穗数两种造成水稻产量优势的两个重要原因。 /p p & nbsp /p p img title=" 康.JPG" src=" http://img1.17img.cn/17img/images/201710/insimg/cda305f5-0beb-49e4-ae7d-ff76b70af471.jpg" / /p p style=" text-align: center " 首都医科大学附属天坛医院教授康熙雄 /p p & nbsp & nbsp & nbsp & nbsp & nbsp 首都医科大学附属天坛医院的康熙雄教授在报告中指出临床个体化系统的建立与应用生物治疗给临床带来了崭新的治疗领域。分子检测技术的发展为实现精准医疗提供了巨大的支撑。康教授为大家带来了其在建立免疫检测点评价体系方面的研究进展,目前正在尝试新的功能辨识平台,也在寻找实验室评价体系依赖的治疗方法和抗体药物。 /p p & nbsp & nbsp & nbsp & nbsp & nbsp 基因组学研究,基因大数据分析,精准医疗等领域专家都报告了可喜的研究进展,但也可见:生物大数据时代,科研路漫漫其修远兮,任重而道远。每处研究进展都是为了让世界更明了更美好,向科研人员致敬! /p p & nbsp /p
  • 华大基因参与全球最大微生物基因组研究项目
    华大基因3月22日宣布将参与全球最大微生物基因组研究项目EarthMicrobiomeProject(简称&ldquo EMP&rdquo ),将负责EMP亚洲地区所有样本的收集和鉴定,并对整个项目提供DNA提取、扩增、建库、宏基因组测序,以及研发生物信息学分析流程所需的计算资源。   EMP将对来自全球的20万个样本进行环境DNA测序或者宏基因组测序,从而建立一个全球性的基因图谱,旨在全方位、系统性地研究全球范围内的微生物群落的功能及进化多样性,以便更好地造福社会及人类。参与该项目的主要单位有华大基因(BGI)、阿拉贡国立实验室、芝加哥大学、科罗拉多大学、劳伦斯· 伯克利国立实验室和美国基因能源联合研究所。   据介绍,与以往的微生物研究有所不同,该项目的研究对象不仅集中于海洋和人体环境中微生物群落,还包括土壤、空气、淡水生态系统等整个地球表面的绝大多数的微生物群落。   华大基因理事长、中国科学院院士杨焕明表示,&ldquo 我们非常荣幸能够作为主要参与者参加如此重要的研究项目。微生物对地球上所有的生命具有至关重要的作用,而我们对微生物的复杂性和多样性认识不足,征服这个未知的领域是非常有必要的。华大基因拥有国际先进水平的测序平台和强大的生物信息学分析能力,我们相信可以为促进人类对微生物群落重要性的了解贡献出价值和力量&rdquo 。   据悉,今年6月13日至15日,华大基因将联合EMP联盟在深圳共同举办第一届EMP大会。作为本次大会的主办方,华大基因将与来自各地的学者分享微生物学、微生物基因组学及相关生态、健康、医学、工业、农业等各领域最新的学术成果及应用前景。
  • 药物基因组学致力于人类基因组与现代药物安全性和有效性
    根据美国疾病控制和预防中心(CDC)的数据,每年有130多万美国人因药物不良反应(ADR)而住院。每年有超过10万人死于药物不良反应(ADR),这使其超过肺病、糖尿病、艾滋病、意外和车祸成为第四大死因,并且已经成为CDC、NIH和制药公司开始通过药物基因组学来解决的一个关键性的患者安全问题。药物基因组学——一个专注于人类基因组与现代药物安全性和有效性之间相互作用的新科学研究领域,可以为所有患者营造更为公平的环境。药物基因组学致力于帮助医生选择最适合每位患者的药物和剂量。虽然目前的大多数研究都集中于针对诸如心血管疾病、阿尔茨海默病、癌症、艾滋病和哮喘等疾病的药物反应上,但对于患有神经精神疾病(如抑郁症、精神分裂症和躁郁症)的患者来说,也带来了曙光,这些患者即使在停药后也常常会受到药物严重的副作用影响。 据肯恩大学(Kean university)新泽西科学、技术与数学中心的副院长Mike Tocci博士介绍:“每个人都有一套独特的基因,因此疾病在每个个体身上的表现方式以及个体身体对特定药物治疗的反应都是不同的。” Part 1医学的未来Tocci是一位资深的分子生物学家、免疫学家,也是赛诺菲公司(Sanofi)基因组科学和生物制品的前负责人,在其职业生涯的大部分时间里都在从事药物发现和临床前开发方面的工作,他认为药物基因组学是“个性化医学”的一个主要组成部分。“我们正在研究药物在个体体内代谢和实现疗效的方式,以及通过基因了解药物的疗效是如何因患者个体或患者群体的不良反应而受到限制。医生和药物研究人员正在快速了解患者对某些化合物的反应,以便更好地治疗疾病。”“我们没有针对所有类型癌细胞的生物标记物,也还没有很好地了解哪些类型的细胞对不同类型的药物有反应,但我们正在更多地研究不同类型的细胞在人体中的功能,因此最终我们将更好地了解我们的基因组如何影响特定药物的作用,”Tocci博士解释道。 与这项研究相关的范围和成本引出了一个合理的问题,即无论从短期还是长期来看,谁将从这种方法中受益最多。接受癌症治疗的患者是一个主要的受益群体,但自身免疫性疾病(包括糖尿病和心血管疾病)患者也已有一定的受益。随着对如何使用更有效的药物更好地治疗患者和降低不良反应的风险有更深刻的理解,医生也将是一个主要的受益群体。 虽然在早期阶段患者的治疗费用可能很高,但随着时间的推移,药物基因组学将通过增加生物标记物、基因表达谱分析和细胞图谱研究来降低成本,从而彰显在医疗保健和药物开发方面的益处。假以时日,药物的疗效和安全性都将得到改善,到时候患者的治疗费用也就降低了。 消费者已经从美国食品药品监督管理局(FDA)批准的关于药物安全性的药物基因组学研究中受益。已有超过200种药物被标记有新的基因组生物标记物信息,这些信息还描述了药物使用和临床反应的差异性、不良反应的风险、特定基因型的个体化剂量、药物作用的机制和试验设计的特征。这项新的研究已被纳入临床试验,并对参与化合物开发的公司产生了影响。药物基因组学严重依赖分子生物学,且涉及许多过程,包括PCR、蛋白质鉴定(蛋白质印迹法、ELISA)、确定基因表达、基因和蛋白质图谱分析技术、细胞分选方法、细胞分离技术(离心)、细胞成像方法,以及在人和动物模型中分析和描绘疾病组织中细胞的能力。Part 2前进的障碍 虽然几乎所有关于药物基因组学的消息都令人鼓舞,但仍有一些因素阻碍着该领域的发展。在动物模型中进行的试验并不总是能够预测人类的反应,获得足够数量的患者样本,以及对患者隐私有关的社会和伦理考量可能会限制某些群体的参与。与药物基因组学研究相关的风险和成本是两个很重要的因素,它们会限制哪些人可以进行研究或负担得起实施此类治疗的费用。 “药物基因组学的长期效益将是巨大的。未来的工作将能为患者提供更有效和更安全的药物进行个性化治疗,有望通过限制副作用和不良反应来延长寿命、或改善生活质量。我们最关心的是确保我们从伦理的角度推进科学的发展,并保证所有人都能从中受益并负担得起,”Tocci博士说道。Tocci博士担任肯恩大学新泽西科学、技术和数学中心的研究副院长,协助监督STEM学位教育,在这些学位教育过程中,他们采用多学科方法教授科学,将生物、化学、物理、数学和计算机科学整合入课程。STEM项目为学生提供通过在实验室体验科学而不是仅仅通过教科书来学习解决问题的机会。STEM学生可以与教职员工一起研究我们不知道答案的问题。目前的研究包括对癌症生物学的研究,以更好地了解生物标记物;对药物化学的研究,以了解如何阻止癌细胞转移;以及对基因组学的研究,以了解药物如何与基因产物相互作用。 全球视角,行业分析,处处是机遇! 您可联系奥豪斯 400-891-5989,我们竭诚为您服务!▼
  • 人类基因组研究又一重大里程碑!迄今为止最完整的人类基因组测序结果公布
    近日,《科学》杂志连发6篇论文,公布迄今为止最完整的人类基因组测序结果,这也是第一个完整无间隙的人类基因组序列。该系列研究主要由国际科学团队端粒到端粒联盟(T2T,Telomere-to-Telomere)完成,联盟成员包括美国国家人类基因组研究所、加州大学圣克鲁兹分校、华盛顿大学等。2003年科学家宣布人类基因组的完整序列时,其实并不准确,当时使用的测序方法是“短读长测序”技术,一次只能读取很短的一段基因序列,有大约8%的基因组从未被完全测序。新完成的基因组被称为T2T-CHM13,代表着当前参考基因组GRCh38的重大升级,科学家在研究人类基因变异的进化时会使用GRCh38。此外,新的DNA序列揭示了着丝粒周围区域的细节,这一区域的变化或能为人类祖先的进化提供新的证据。T2T的成功得益于一次测序长片段DNA的技术改进,这有助于确定DNA高度重复片段的顺序。其中包括PacBio的HiFi测序和牛津纳米孔测序,PacBio的HiFi测序可高精度读取超过2万个碱基的长度,而牛津纳米孔测序技术一次读取高达100万个碱基的长度,但准确度相对较弱,从2019年初开始,科学家们将这两种新技术结合起来,致力于攻克这些重复序列,填补缺失的空白。
  • 华大基因OpGen联手合作 探寻“完美”全基因组序列
    近日,深圳华大基因研究院(BGI)与基因组光学图谱技术的独家供应机构OpGen公司共同宣布,双方将致力于推广基因组光学图谱技术在人类和动植物全基因组测序组装中的应用。   华大基因和OpGen公司已经成功地合作完成了对人类基因组现有的序列中&ldquo 漏洞&rdquo 的填补工作。双方的研发团队将继续合作完成更多人类及动物全基因组序列。   随着DNA测序技术的发展,研究人员可以花费更低的成本得到更多有效的数据,但是,测序获得的基因组中仍然有许多无法定位和无法鉴别的基因序列存在。OpGen公司的光学图谱技术与新一代测序技术相结合将有助于高效、精确地将组装的基因组序列定位到染色体上,获得高质量的全基因组序列图谱。   华大基因拥有一流的测序能力和强大的计算能力,每年可完成千万个基因组序列。在全基因组测序组装技术的基础上,配合基因组光学图谱技术,该合作项目将会为全基因组测序及基因组学研究的飞速发展提供一个卓越的平台。   OpGen公司开发的基因组光学图谱技术,不依赖序列信息,可以快速生成基于单个DNA分子的高分辨率、有序、全基因组的限制性内切酶酶切图谱。该技术已经被广泛应用于微生物基因组学研究,如比较基因组学研究,菌株分类,全基因组序列组装等。   华大基因研发部门的副总裁徐讯说:&ldquo 通过基因组光学图谱技术与新一代测序技术相结合,我们可以获得更多高质量的具有代表性的参考基因组序列。这将有助于对不同的人群进行更加精确且有针对性的基因组学研究。此外,这两种技术的结合可以改进微生物基因组序列组装结果,在人类元基因组研究领域有巨大潜力,将会极大地促进人类疾病研究的发展和应用。&rdquo   OpGen公司的执行总裁道格· 怀特(Doug White)说:&ldquo 我们很高兴能够与华大基因一起合作,实现基因组光学图谱技术在微生物研究以外领域的应用。我们相信,基因组光学图谱技术与新一代测序技术相结合将为完成复杂的大基因组的全基因组序列带来很大的帮助,能够有效的降低这些基因组学项目的总体研究经费和时间。&rdquo
Instrument.com.cn Copyright©1999- 2023 ,All Rights Reserved版权所有,未经书面授权,页面内容不得以任何形式进行复制