当前位置: 仪器信息网 > 行业主题 > >

基因组图谱

仪器信息网基因组图谱专题为您整合基因组图谱相关的最新文章,在基因组图谱专题,您不仅可以免费浏览基因组图谱的资讯, 同时您还可以浏览基因组图谱的相关资料、解决方案,参与社区基因组图谱话题讨论。

基因组图谱相关的资讯

  • 从人类基因组草图到完全图谱 ——论基因组重复片段研究
    从人类基因组草图到完全图谱——论基因组重复片段研究作者:李东卫,张玉波(中国农业科学院农业基因组研究所,“岭南现代农业”广东省实验室,深圳 518120)2001年发表的人类基因组草图并没有包含全部的基因组序列,直到二十年后,科学家们才正式宣布完成了人类全序列基因组图谱,这其中主要的技术障碍就是重复片段的测序工作。重复片段(segmental duplications,SDs)是指广泛存在于基因组中的大于1 kb且序列相似性超过90%以上的大片段。它们可以通过基因组重排及拷贝数变异产生新基因和驱动进化,其大量存在于子端粒中,并与哺乳动物细胞复制性衰老以及癌症等重要生物学过程密切相关,一直以来备受科学家关注。但是其序列特点使得常规的测序技术难以完全准确测出全部序列,是基因组组装工作的一个难点。人类基因组全图谱的完成将重复片段在生物体进化、延缓衰老、疾病治疗等方面的研究提供基础。本文将就重复片段的重要性,研究的技术难点,研究现状以及未来展望等方面展开论述。重复片段的重要性重复片段是基因组中序列高度相同的大片段,具有广泛的结构多样性。它们占人类参考基因组(T2T-CHM13)中的7.0%,长度为218 Mbp[2 ],在中心体及子端粒区域富集高达10倍。中心体所包含的5个典型重复为:α卫星,β卫星,CER卫星,γ卫星,CAGGG重复,以及重复子4。子端粒所包含的典型重复为:端粒相关重复(TAR)以及传统的(TTAGGG)n重复[4 ]。重复片段可以介导染色体重排,使常染色体和异染色体之间通过同源重组产生镶嵌类型的重复的染色质[5 ]。在最近新鉴定的人类重复片段中,Mitchell R等预测了182个新的候选蛋白编码基因,并使用T2T-CHM13基因组重构了重复基因(TBC1D3,SRGAP2C,ARHGAP11B),这些基因在人额皮质增生中具有重要作用,揭示了重复片段结构在人和他们近亲物种之间的巨大进化差异[6 ]。大量的染色体子端粒区含有重复片段[8 ]。复制性衰老被认为是一种抗癌机制,限制细胞增殖。长寿的有机体经历更多的细胞分裂,因此具有更高的产生肿瘤的风险。端粒酶能够增加端粒的长度,促进癌细胞不断增殖,因此长寿动物体细胞倾向于抑制端粒酶的活性,从而抑制肿瘤发生的风险[10 ]研究难点:大片段长度、多拷贝数、序列高度相似 重复片段的大的片段长度,多拷贝数以及序列的高度相似是长期以来其研究的难点。各种测序技术的发展致力于解决这个问题。重复片段长度范围是1到400 kb [12 ]。而且,标准的长读段校正工具,例如MUMmer 或Minimap2不能够有效的捕捉低相似的重复片段,也经常将重复片段与其它调控元件混淆[14 ],为重复片段的研究带来机遇。尤其是PacBio的HiFi读段,具有长读段的同时还具有较高的准确度。但是,很多重复片段的长度要比HiFi读段的平均长度要长,因此很难完全准确的进行组装[3 ]。染色体重排,尤其是染色质断裂常发生在高GC区域[16 ]。同时,在T2T-CHM13基因组基础上,Mitchell R等首次进行了全基因组重复片段的研究。与当前人类参考基因组(GRCh38)鉴定的167 Mbp复制片段相比,鉴定了更多的(218 Mbp)非冗余重复片段(图2 a, b)。新发现91%的重复片段能更好地代表人的拷贝数,通过与非人灵长类基因组相比,前所未有的揭示了人类和其它近亲在重复片段结构中的杂合性以及广泛的进化差异[17 ]。图2 T2T-CHM13中新鉴定的染色体内(a)与染色间(b)的重复片段[1 ]。利用重复片段解析衰老机制未来可期新组装的T2T-CHM13的拷贝数比GRCh38高9倍,因此它能更好的呈现人类拷贝数变异。通过鉴定新基因的拷贝数变异,可筛选相应的药物治疗靶点。例如,CHM13鉴定到LPA、MUC3A、FCGR2基因的拷贝数变异与疾病相关[1]。此外,对于尚具争议的疾病标志基因,例如乳腺癌中ESR1 基因[18],可以通过CHM13对其进行分子进化分析,进而鉴定其突变和扩增,确定其在乳腺癌中的作用。尽管端粒作为抗衰老靶标已研究多年,但是端粒长短变化与复制性衰老的关系仍不清楚。细胞减数分裂过程中端粒变短的机制是什么?重复片段拷贝数变异与端粒变短有无相关性?很多研究已证明端粒酶具有延长端粒长度的作用,具体的机制是什么?这些问题因此前端粒不能被准确测序而长期未解决。现在,人类基因组完全图谱已基本实现,相信这些谜团会很快解开。未来可以根据人类年龄增长过程中端粒重复片段的拷贝数变异,解析其抗衰老的机制。通过人为干预其拷贝数,可能用于探索生命的极限。1. Vollger MR, Guitart X, Dishuck PC, Mercuri L, Harvey WT, Gershman A, Diekhans M, Sulovari A, Munson KM, Lewis AM et al.Segmental duplications and their variation in a complete human genome. bioRxiv.2021:2021.2005.2026.445678.2. Prodanov T, Bansal V.Sensitive alignment using paralogous sequence variants improves long-read mapping and variant calling in segmental duplications. Nucleic Acids Research.2020 48(19).3. Bailey JA, Yavor AM, Massa HF, Trask BJ, Eichler EE.Segmental duplications: Organization and impact within the current Human Genome Project assembly. Genome research.2001 11(6):1005-1017.4. Courseaux A, Richard F, Grosgeorge J, Ortola C, Viale A, Turc-Carel C, Dutrillaux B, Gaudray P, Nahon JL.Segmental duplications in euchromatic regions of human chromosome 5: a source of evolutionary instability and transcriptional innovation. Genome research.2003 13(3):369-381.5. Giannuzzi G, Pazienza M, Huddleston J, Antonacci F, Malig M, Vives L, Eichler EE, Ventura M.Hominoid fission of chromosome 14/15 and the role of segmental duplications. Genome research.2013 23(11):1763-1773.6. Young E, Abid HZ, Kwok PY, Riethman H, Xiao M.Comprehensive Analysis of Human Subtelomeres by Whole Genome Mapping. PLoS genetics.2020 16(1):e1008347.7. Lander ES, Linton LM, Birren B, Nusbaum C, Zody MC, Baldwin J, Devon K, Dewar K, Doyle M, FitzHugh W et al.Initial sequencing and analysis of the human genome. Nature.2001 409(6822):860-921.8. Seluanov A, Chen ZX, Hine C, Sasahara THC, Ribeiro AACM, Catania KC, Presgraves DC, Gorbunova V.Telomerase activity coevolves with body mass not lifespan. Aging Cell.2007 6(1):45-52.9. Bromham L.The genome as a life-history character: why rate of molecular evolution varies between mammal species. Philos T R Soc B.2011 366(1577):2503-2513.10. Shay JW.Role of Telomeres and Telomerase in Aging and Cancer. Cancer discovery.2016 6(6):584-593.11. Sharp AJ, Locke DP, McGrath SD, Cheng Z, Bailey JA, Vallente RU, Pertz LM, Clark RA, Schwartz S, Segraves R et al.Segmental duplications and copy-number variation in the human genome. American journal of human genetics.2005 77(1):78-88.12. Hartasanchez DA, Braso-Vives M, Heredia-Genestar JM, Pybus M, Navarro A.Effect of Collapsed Duplications on Diversity Estimates: What to Expect. Genome Biol Evol.2018 10(11):2899-2905.13. Numanagic I, Gokkaya AS, Zhang L, Berger B, Alkan C, Hach F.Fast characterization of segmental duplications in genome assemblies. Bioinformatics.2018 34(17):i706-i714.14. Vollger MR, Dishuck PC, Sorensen M, Welch AE, Dang V, Dougherty ML, Graves-Lindsay TA, Wilson RK, Chaisson MJP, Eichler EE.Long-read sequence and assembly of segmental duplications. Nature methods.2019 16(1):88-94.15. Rhie A, McCarthy SA, Fedrigo O, Damas J, Formenti G, Koren S, Uliano-Silva M, Chow W, Fungtammasan A, Kim J et al.Towards complete and error-free genome assemblies of all vertebrate species. Nature.2021 592(7856):737-+.16. Nurk S, Koren S, Rhie A, Rautiainen M, Bzikadze AV, Mikheenko A, Vollger MR, AltemoseN, Uralsky L, Gershman A et al.The complete sequence of a human genome. bioRxiv.2021:2021.2005.2026.445798.17. Zhu Y, Liu X, Ding X, Wang F, Geng X.Telomere and its role in the aging pathways: telomere shortening, cell senescence and mitochondria dysfunction. Biogerontology.2019 20(1):1-16.18. Tabarestani S, Motallebi M, Akbari ME.Are Estrogen Receptor Genomic Aberrations Predictive of Hormone Therapy Response in Breast Cancer? Iranian journal of cancer prevention.2016 9(4):e6565.
  • 中国启动十万人基因组计划:绘制国人精细基因组图谱
    p style=" text-align: center " img title=" 001.jpg" src=" http://img1.17img.cn/17img/images/201712/insimg/4ff2dbe1-e196-45d3-8e15-c70b870d0740.jpg" / /p p   科学家们希望通过绘制中国人精细基因组图谱,来研究疾病健康和基因遗传的关系。 /p p   此次启动的“中国十万人基因组计划”覆盖地域包含我国主要地区,涉及人群除汉族外,还将选择人口数量在500万以上的壮族、回族等9个少数民族。 /p p   基因是DNA上有遗传效应的片断,人类的生、老、病、死等都与基因有关。而基因组和基因是整体与部分的关系,人类基因约有25000个,基因组研究的目的就是要把人体内这25000个基因的密码解开,从而破译人类的遗传信息。此次基因组计划,就是要绘制我们民族的基因图谱。 /p p   项目首席科学家 王亚东教授:主要目标是研究中国人从健康到疾病是怎么转化的,为中国的医学研究或者是临床诊断、治疗疾病提供参考。 /p p style=" text-align: center " img width=" 500" height=" 352" title=" 002.png" style=" width: 500px height: 352px " src=" http://img1.17img.cn/17img/images/201712/insimg/779230ba-5597-4007-94f3-8ae2367a7247.jpg" border=" 0" vspace=" 0" hspace=" 0" / /p p   中科院院士 国家人类基因组南方研究中心主任赵国屏:那么这一点做下来以后,实际上是为我们中国人,包括汉族和各个少数民族在内,今后做中国人的疾病健康相关的遗传背景的认识,会有极大的好处。 /p p   按照计划,整个项目将在四年内完成全部的测序与分析任务,这也将是当前世界上推进速度最快的基因组工程。 /p p /p
  • 全球第一套烟草全基因组序列图谱完成
    12月9日,由中国农业科学院烟草研究所参与规划设计与实施的全球第一套烟草全基因组序列图谱&mdash &mdash 绒毛状烟草和林烟草全基因组序列图谱完成,这是继马铃薯和番茄基因组之后,全球完成的第三种茄科植物全基因组序列图谱。   烟草是重要的科研模式植物,绒毛状烟草和林烟草是栽培烟草的两个祖先种。这两个品种的全基因组序列图谱是目前已知植物基因组序列图谱中基因组最大、组装精度最高、组装结果最好的2个图谱。此项工作的完成标志着烟草研究从此全面进入基因组时代。   绒毛状烟草和林烟草全基因组序列图谱测序是中国烟草基因组计划的一部分。中国烟草基因组计划于2010年12月启动,由国家烟草基因研究中心、中国农业科学院烟草研究所等单位承担。目前,重大专项已在多个领域取得突破性进展,烟草突变体库创制已达27万份并正在进行大规模鉴定和分析,烟草分子遗传图谱构建和重要突变基因定位克隆也取得了突破。在此基础上,科研人员将有序开展绒毛状烟草和林烟草的遗传图谱和物理图谱绘制,并启动大量四倍体栽培烟草的基因组测序工作。
  • 中国发布首个海洋生物全基因组序列图谱
    中国科学家31日在青岛宣布,他们绘制完成了牡蛎全基因组序列图谱,这是中国首次发布海洋生物的全基因组序列,也是世界上首张贝类全基因组序列图谱。   牡蛎全基因组序列图谱项目首席科学家张国范介绍说,根据绘制成功的牡蛎基因组序列图谱,发现牡蛎基因组由8亿个碱基对组成,大约包含2万个基因,基因组数据支持了海洋低等生物具有高度遗传多样性的结论。   据张国范介绍,牡蛎全基因组序列的完成对牡蛎养殖和减少牡蛎所带来的海洋生物污损具有重要应用价值,而且也标志着基于短序列的高杂合基因组拼接和组装技术获得重大突破。   牡蛎隶属软体动物门,共100余种,除极地地区的各大洲沿海均有分布,是目前人类世界上产量最大的海水养殖品种,年产值达到35亿美元,中国牡蛎年产量超过海水养殖产量的四分之一。   山东省科技厅副厅长李乃胜说,牡蛎全基因组序列图谱的绘制完成,使科研工作者可以在分子水平对生物的目标性状进行预先设计,有效解决常规育种方式中周期长和准确性低的问题,具有里程碑式的意义。同时,随着牡蛎基因组数据的深入挖掘,有可能改变牡蛎生活习性,使其更好地为人类所利用。   牡蛎全基因组序列图谱的完成也为研制和生产新材料奠定了基础。科研人员介绍说,牡蛎附着在礁石或者船舶上时的粘度很大,可能是世界上粘度最大的胶体,在牡蛎基因组中找到相关基因后,就可制成粘度很强的新材料。   基因组测序项目科技合作伙伴深圳华大基因研究院总监倪培相说,牡蛎全基因组序列图谱的完成也为高杂合物种的基因组测序奠定了基础。   张国范说,牡蛎全基因组序列图的绘制完成还可解答一系列科学之谜。&ldquo 例如,为何牡蛎具有极强的繁殖能力,但是绝大部分后代却都在出生后不久就死亡?这可从基因图中找到答案。&rdquo 他说。   牡蛎全基因组序列图谱绘制由中国科学院海洋研究所研究员张国范和美国新泽西州立大学教授郭希明于2008年5月发起,并成立了牡蛎基因组计划,历时两年,于今年7月底完成了绘制工作。   基因组是生物所携带遗传信息的总和,包括单倍体细胞核、细胞器或病毒粒子所包含的全部DNA分子或RNA分子。   人类基因组序列草图于2000年6月完成,发现人类基因由30亿个碱基对组成。从2000年至2009年,完成全基因组测序的物种从42个上升至1100个,每年平均增加118个。   目前,中国已完成了水稻、家蚕和家鸡等重要经济种类物种和大熊猫及藏羚羊等濒危物种的基因组测序。
  • 解读“生命之书” 新发现填补人类基因组图谱空白
    美国加州大学圣地亚哥分校(UCSD)的研究人员制作了一份人类基因组的单细胞染色质图谱,确定了240种多基因特征和与疾病特征相关的细胞类型,并注释了非编码DNA变异的风险,有利于更好地理解遗传学与疾病之间的联系。这一发现发表在12日的《细胞》杂志在线版上。  此前,科学家在公布最新的被称为“生命之书”的人类基因组图谱时称,更为精确的计算表明,人类基因数量实际在2万到2.5万之间。然而,这个估计并不能真正解释蛋白质编码基因构建过程的确切工作方式,或者不适用于患有疾病的情况。  UCSD细胞和分子医学教授、路德维希癌症研究所成员、表观基因组学中心主任任兵(音译)博士是DNA元素百科全书项目成员之一。他表示,人类基因组在20年前就已被测序,但解读这本“生命之书”的意义仍然很有挑战性。一个主要原因是,人类DNA序列中超过98%是非蛋白质编码的,我们还没有遗传密码来“解锁”这些序列中嵌入的信息。  DNA携带细胞的遗传指令。染色质中的主要蛋白质,称为组蛋白,有助于将DNA紧密包装成适合细胞核的紧凑形式。染色质捆绑DNA方式的变化与DNA复制和基因表达有关。  在对小鼠进行研究后,任兵及其合作者将注意力转向人类基因组中染色质的单细胞图谱。他们对来自多个供体的30种成人组织类型中取样的60多万个人类细胞进行了分析,然后将这些信息与来自15种胎儿组织类型的类似数据结合,揭示了222种不同细胞类型中约120万个候选顺式调控元件的染色质状态。  顺式调控元件是非编码DNA区域,调节相邻基因的转录。过去十年的研究已经证实,非编码DNA的序列变异是人类群体中多基因特征和疾病的关键驱动因素,如糖尿病、阿尔茨海默氏症和自身免疫性疾病。然而,解锁非编码DNA变异功能的一个主要障碍是缺乏人类基因组中转录调控元件的细胞类型特异性图谱,而新图谱填补了这一空白。  总编辑圈点  人类基因组图谱,被称为生命之书。那些关于人类生长、发育、衰老、遗传病变的秘密,随着基因组图谱的绘制,得以展现。人类不知道的很多事,基因都知道。但是,它是“生命之书”,也是“生命天书”,写出书很难,读懂书同样难。这本书的字里行间暗藏玄机。读者需要对基因这门语言足够了解,才能破译“天机”。此次,科研人员制作了一份人类基因组的单细胞染色质图谱,算是“天书”的辅导读本,有利于更好地理解遗传学与疾病之间的联系。
  • 我国绘制完成首个蒙古族人全基因组序列图谱
    记者18日在内蒙古自治区呼和浩特市召开的&ldquo 世界首例蒙古族人全基因组序列图谱绘制完成成果发布会&rdquo 上获悉,我国科学家绘制完成了全世界首个蒙古族人全基因组序列图谱。   据项目总负责人、内蒙古农业大学生命科学学院动物生物技术重点实验室主任周欢敏介绍,这一研究成果是我国科学家首次独立完成的、具有自主知识产权的蒙古族人全基因组序列图谱,标志着我国的人类学、民族学、人类遗传学及医学健康研究进入了基因组水平。   项目核心研究人员之一、内蒙古民族大学教授白海花说,在这个项目中,科研人员首先对苏尼特王爷家系后代&mdash &mdash 成吉思汗的第三十四代、健康蒙古族男性进行了全基因组测序,并绘制出一个较为完整的蒙古族人全基因组图谱,测序深度和水平达到世界领先水准。   据介绍,项目组还将进行更多样本的蒙古族人全基因组测序分析,构建蒙古族人遗传信息数据库,为今后的医学及其他相关研究提供坚实的基础数据支持。
  • 再精一点!3000+脑细胞基因组高清图谱来了
    哺乳动物的大脑各不相同,脑细胞数量也有差别:人约有1千亿个脑神经细胞,狗约有5.3亿个,而小鼠约有7千万个… … 那么,单个脑细胞的基因长什么样?它们的形状和功能之间又有何关联?1月22日,一项刊发在《细胞》上的研究带来了超过3000个哺乳动物脑细胞的转录组图集和三维基因组图集。根据这些数据,研究者可为神经发育及相关疾病的诊疗提供帮助。该研究由北京大学生物医学前沿创新中心主任谢晓亮带领团队完成。大脑细胞里关键基因的高清三维结构。左侧为来自父亲的基因,右侧为来自母亲的基因。(图片来源:《细胞》)结构决定功能人类对生命的探索不止不休。1953年,世界首个DNA模型问世,双螺旋结构深入人心。2001年,人类基因组工作草图问世,人类遗传密码的破译程度前所未有。在基因组学成为生物学一大子领域的今天,科学家对“结构决定功能”这句话的理解愈发深刻:不止是基因组序列,DNA分子本身的三维结构对单个细胞的功能也有重要影响。每个细胞的基因组结构都不尽相同。得益于不断更新的技术手段,科学家已经能构建出哺乳动物单细胞基因组的三维结构——这项2018年发表在《科学》上的研究,作者之一正是谢晓亮。该成果的发表得益于一系列技术,其中一项新技术——单细胞染色质构象捕获技术(diploid chromatin conformation capture,Dip-C)起到了关键作用。在当时,谢晓亮团队的博士后成员谭隆志参与了相关技术的开发工作。本次发表在《细胞》上的新成果,就是凭借Dip-C等技术获得的。“过去的技术无法测量单细胞的三维基因组结构,此前也没有哺乳动物大脑产后发育的单细胞数据”,论文第一作者、斯坦福大学生物工程系博士后谭隆志告诉《中国科学报》。大脑皮层单个神经细胞的结构图,分辨率20kb。(图片来源:谢晓亮课题组)不断精进的单细胞测序技术全职加入北大前,谢晓亮曾在美国哈佛大学从事单分子生物研究多年。2012年,谢晓亮课题组推出的单细胞全基因组均匀扩增的新方法—多重退火循环扩增法(MALBAC),大幅提高了单细胞测序的通量和精准度。“MALBAC是一项非常独特、创新的单细胞测序技术”,谭隆志表示,该技术从设计层面入手,注重提升扩增均一性,能够灵敏、准确地测量单细胞中含量极少的DNA和RNA。这之后,该课题组一直致力于开发高精度的单细胞测序方法。2017年,谢晓亮和同组的陈崇毅、邢栋、谭隆志、李恒等人采用RNA而非DNA拷贝来扩增基因组,推出的单细胞基因组线性扩增(linear amplification via transposon insertion,LIANTI)进一步提升测序的均一性和准确性。从生物体角度来看,人类、相当一部分高等动物都是二倍体。但基因组学诞生后的很长一段时间里,单个二倍体细胞的结构测量无法实现。2018年,为了将研究范围从单倍体拓展到二倍体,课题组开发了Dip-C技术。人类的46条染色体平分为2套,套内的23条染色体分别来源于父母,这之中的序列相似度高达99.9%,差异非常细微,但通过Dip-C技术,研究者可以对两套染色体进行区分。“迄今为止,Dip-C仍然是测量单个二倍体细胞高分辨率3D全基因组结构的唯一方法。”谭隆志表示。随着测序技术的不断精进,相关的研究发现也越来越多。比如作为细胞“大脑”的细胞核,其内部的染色质在细胞特异性基因表达中发挥着重要作用——视觉和嗅觉都与高度专门化的功能神经元密切相关,而这些神经元的基因组有着独特的三维结构,很可能决定着相应的功能。本次新发表的研究中,谢晓亮等人用到了MALBAC技术的升级版:MALBAC-DT(数字转录组学)。进一步提高灵敏度和准确度后,课题组首次得到了哺乳动物大脑在产后发育过程中的单细胞转录组图谱,具体数量为3517个。而借助Dip-C方法,他们完成了3646个三维基因组结构图集。根据这些数据,他们又得到不少有趣的发现。向理解脑内神经发育更进一步根据转录组图谱的数据,课题组发现小鼠出生后,大量基因被动态表达,从而形成初生、成年两个基因表达模组。“这说明初生与成年大脑在基因表达上有巨大差异、并可能影响大脑认知功能的形成。”谭隆志表示。而将三维基因组图集和转录组图集结合起来看,谭隆志等人发现小鼠出生后一个月内,其大脑在三维结构和转录组层面都有变动,这意味着大脑的确在分子层面发生了转化。“这一转化恰好发生在大脑开始接收外界感官刺激的时期,即小鼠出生后第一个月。”谭隆志说。那么,这些这些分子层面的变化是由外界感官刺激引起的吗?针对这一问题,课题组从视觉研究入手,将出生的小鼠饲养于黑暗环境中,避免其受到视觉刺激。但他们发现,这些“暗中饲养”的小鼠视觉皮层的三维基因组和转录组转化几乎都不受后天影响,因此答案是否定的。另一个有趣的发现是,先前研究中,谭隆志与谢晓亮等人发现嗅觉细胞的基因组内有独特的内移现象:很多平时处在细胞核表面的基因区域,会在神经细胞分化时大幅移向细胞核内部。而这种现象对嗅觉受体调控有重要作用。而在本次发表的研究中,课题组发现这种内移现象同样存在于大脑的各种神经细胞中,大约发生在小鼠出生后的一个月内。“这一发现表明,中枢与周围神经细胞系在三维基因组结构方面可能共享某些特殊通路,未来可以深入研究。”谭隆志说。接下来,课题组还会拓展现有技术的应用范围,并继续开发测序新方法。谭隆志表示,他们将进一步测量单个细胞的三维基因组结构、转录组或其他组,“生物方面,我们将测量更多器官、更多年龄的更多细胞,更全面地解释哺乳动物发育的分子原理。”单个海马体神经细胞结构图,分辨率20kb。(图片来源:谢晓亮课题组)相关论文信息:https://doi.org/10.1016/j.cell.2020.12.032
  • 美国研究人员利用新一代测序技术得到玉米基因组更详细图谱
    p   美国研究人员6月12日在《自然》杂志网络版上发表论文称,他们利用新一代测序技术对玉米自交系B73进行测序,得到了新的、更详细的基因组图谱。研究显示,玉米具有良好的表型可塑性,不同品系玉米的基因组差异明显。这意味着在全球气候环境变化不断加剧的情况下,玉米仍有巨大的发展空间。 /p p   玉米是生物学研究中的重要模式植物。2009年,美国冷泉港实验室研究人员和爱荷华州立大学等机构研究人员合作,完成了对玉米自交系B73的基因组序列的测定,轰动一时。但当时使用的测序技术并不完备,无法解决玉米基因组中大量的重复序列,错过了基因间的大量区域,也无法准确捕捉到诸多细节。 /p p   此次,冷泉港实验室研究人员和加州门洛帕克太平洋生物科学公司等机构合作,使用单分子实时测序和高分辨率光学制图技术,通过解读长测序,构建了新的、更详细的B73基因组图谱。新技术让研究人员能对玉米基因间区域进行详细的观察,从而了解这些基因是如何受调控的。而新的基因组图谱也显示出前所未有的细节,让研究人员对玉米基因表达的变异性有了更深刻的认识。 /p p   通过比较新的B73系基因组图谱与在不同气侯条件下生长的W22系和Ki11系基因组图谱,研究人员发现,后两个品系的基因组与B73的基因组差异巨大,平均只有35%的部分匹配一致。这种差异不仅表现在基因序列变化方面,还表现在基因表达的时间、位点以及表达水平方面。这表明,玉米基因组具有良好的表型可塑性,也意味着其环境适应能力极强。 /p p   研究人员指出,卓越的表型可塑性意味着玉米可以使用更多的组合来适应环境变化,这是育种者的福音。在全球人口不断增加、气候变化问题不断加剧的背景下,玉米作为主要粮食作物,仍有巨大的潜力可挖。 /p
  • 重磅!我国首绘中国人泛基因组参考图谱 成果于《Nature》发布
    我国在基因研究方面的新突破日前由复旦大学西安交通大学等国内26个科研单位联合开展研究绘制出了基于36个族群的中国人泛基因族参考图谱。相关成果于北京时间6月14日23点在国际权威学术期刊Nature发表,这也是我国科学家首次自主进行本国人群全景图谱式泛基因组研究所取得的第一个重大成果。基因研究是当代生物学领域的重要方向。人类的基因组包含了3万个以上基因在内的30多亿碱基对,其纷繁复杂的作用关系我们目前还知之甚少。从上个世纪末开始科学家联合开展人类基因组研究,但鉴于当时的技术条件只能依据极少个体绘制出一种简单化基因组草图。复旦大学教授 徐书华随着科学进步,泛基因组研究目前成为生命科学的新方向,相比过去片段化、单一维度的局限,它相当于要绘制一幅包含人类全部遗传信息的全景式多维度图谱。我国科学家组团公关力争使中国在这一前沿领域不再落后于人。这次独立进行的本土人群泛基因组参考图谱绘制科研进度基本与国外持平,有利于建立自主可控的人类基因组资源培养自己的核心技术力量。在第一期参考图谱绘制中,我国科学家通过引入新技术新算法选取有代表性和覆盖性的样本,在原有人类基因组的基础上新获取了1.9亿个简基对新序列,包含近600万个变异。对于探究中国人群基因组核心特征具有重大意义。据介绍这项研究有助于更加清晰地揭示中华民族的历史发展脉络,对于华夏文明探源族群遗传演进等研究都有重要价值。而进一步掌握本国人群的遗传密码,则在发展精准医学和前沿生物技术保障人民健康维护国家安全等各个方面都有着基础作用和远景意义。
  • 科学家绘出首张“甜橙基因组图谱” 揭开甜橙“身世之谜”
    11月26日,在国家自然科学基金等项目的资助下,华中农业大学邓秀新院士领衔的柑橘团队在国际著名学术刊物《Nature Genetics》在线发表了题为“甜橙基因组图谱”(The draft genome of sweet orange)的研究论http://www.nature.com/ng/journal/vaop/ncurrent/full/ng.2472.html。甜橙基因组的完成将在理论上为柑橘基因功能研究提供框架,也将在应用上为果实品质包括色、香、味等重要性状基因的遗传选育发掘及品种改良提供重要平台。这也是世界上第一例芸香科植物基因组图谱,对柑橘基因及重要农艺性状的解析具有里程碑的作用。   我国是世界上重要的柑橘原生中心,我国栽培柑橘的历史悠久,4000年前已有经济栽培。甜橙品种"伏令夏橙"即可鲜食,同时也是全球最大的加工橙汁品种。华中农业大学的甜橙基因组研究团队对这一甜橙品种采用最先进的全基因组鸟枪测序法(WGS)及远程配对末端标记策略, 拼接组装所获得的基因组序列覆盖率近90%,获得注释的基因约3万个。通过结合遗传标记和染色体原位杂交分析,甜橙基因组序列被进一步整合到已知的9条染色体, 因此完成了对甜橙基因组接近完全的解码和基因定位。   通过对基因组数据的分析,该团队发现甜橙基因组中约有一半的基因处于杂合状态,并有显著的橘和柚的遗传特征,其中橘的遗传成分约占3/4,柚的遗传成分占1/4,据此提出了甜橙起源的新理论,即甜橙来源于柚做为母本和橘杂交,其后代再与橘杂交而形成的杂种。通过基因表达以及基因组比较分析,发现了一个可能在甜橙果实内大量合成维生素C的关键基因。该基因家族的扩增、快速进化、功能分化以及组织特异表达等可能与甜橙果实大量合成维生素C有关。
  • 我科学家绘制成世界首张大熊猫基因组序列图谱
    10月11日,深圳华大基因研究院宣布,大熊猫&ldquo 晶晶&rdquo 基因组框架图绘制完成,大熊猫基因组与狗的基因组最接近。这是我国科学家继完成第一个黄种人基因组后又一生命科学里程碑式的贡献,对其在分子水平上的保护具有重要意义。   自今年3月初启动至今,该项目的科研合作团队已经完成了大熊猫&ldquo 晶晶&rdquo 基因组框架图的测序工作。其染色体21对,基因组与人的大小相似,约为30亿个碱基对,包含2&mdash 3万个基因;在已经进行全基因组测序的物种中,大熊猫基因组与狗的基因组最接近;数据分析结果同时还进一步支持了大多数科学家所持的&ldquo 大熊猫是熊科的一个亚种&rdquo 这种观点,证明了熊科内部各类群的分类情况。该研究成果填补了大熊猫基因组及分子生物学研究的空白,将从基因组学的层面上为大熊猫这种濒危物种的保护、疾病的监控及其人工繁殖提供了科学依据,并为保护我国其它一级保护动物提供范例。   自1999年正式加入&ldquo 国际人类基因组计划&rdquo 以来,华大基因的研究团队一直致力于重要动植物基因组图谱的绘制,曾成功完成了水稻、家蚕、家鸡、家猪等重要基因组计划,在基因组学研究领域一直跻身国际前列。大熊猫基因组只是深圳华大基因研究院&ldquo 生命之树&rdquo 计划的启动项目。该计划将对动物、植物、微生物三个生命学领域的所有具有经济、社会、科学价值的主要物种进行基因组序列的解读与分析。
  • Cancer Cell | 通过单细胞基因组测序绘制肿瘤抗原图谱
    一个世纪之前,诺贝尔奖得主、德国化学家Paul Ehrlich 曾经说过:如果我们可以设计出特异性靶向某个病原体的化合物,那么,我们就可以在不伤害宿主的基础上杀死这一病原体【1】。多年过去了,尽管Ehrlich尝试了多种方法来寻找特异性肿瘤靶点,但精准抗癌,也就是在不伤害机体的情况下靶向杀伤肿瘤细胞这一概念,似乎仍停留在概念阶段【2】。时隔多年,以免疫细胞修饰为基础的免疫治疗,包括抗体-药物偶联物(antibody-drug conjugates,简称ADCs)、双特异性T细胞衔接器(bispecific T cell engagers,简称BiTEs)和嵌合抗原受体T细胞(chimeric antigen receptor T cells,简称CAR-T)似乎是现今的新方向。有报道指出,靶向CD19的CAR-T疗法,可以将一些B细胞淋巴瘤的治愈率提高至43%~71%【3】,但是,有40%患者出现一定程度的神经损伤。这一“脱靶效应”很可能是由其他表达CD19的细胞类型引起的【4】。事实上,作者通过提取数目稀少的血脑屏障壁细胞,并进行全基因组单细胞测序确定,上述CAR-T疗法靶向B细胞淋巴肿瘤的同时,也会靶向这些壁细胞。这也说明,单细胞全基因组测序这一方法,不但可以预测免疫治疗的脱靶效应,还可以以数据为基础分析出特异的靶标。2021年12月13日,来自美国斯坦福大学Caleb A. Lareau,Ansuman T. Satpathy和来自Cartography 公司的Kevin R. Parker 在Cancer cell上发表题为Charting the tumor antigen maps drawn by single-cell genomics的评论性文章,全面展示了这一研究方法。在概念上,作者认为,寻找和确定免疫治疗的靶点应该基于数据。下图展示了通过结合大尺度但细胞图谱和特定肿瘤分析来确定抗原靶点。高通量的单细胞全基因组测序数据库可以提供肿瘤细胞抗原的潜在靶点以及这些靶点是否存在于其他细胞上。接下来,作者阐述了目前精准抗癌的现状和存在的问题。首先,目前在临床上精准抗癌的靶点主要有三类:一是在肿瘤细胞和正常体细胞上同时表达的细胞特异性标签,比如上述针对B细胞的CD19。这一类目前应用最为广泛,并且,如果其对应的体细胞不算十分重要的话,这一诊疗方案可以说是行之有效;二是与正常体细胞相比,在肿瘤细胞上过表达的分子,比如HER2。靶向这类分子可以使得杀伤作用更为精准和强大,并且,其过表达程度,还可以表征肿瘤发展水平;三是特异性表达在肿瘤细胞上的分子,比如1997年发现的NY-ESO-1【5】。当然,高通量基因组学数据库显示这一分子还表达在免疫豁免器官和组织,比如睾丸和胎盘。这也就是说,仅通过传统手段来确定表达靶标分子的细胞类型不够精确,还需要高通量单细胞基因组数据库来进行有力补充。其次,上述数据库可以用来预测和减低免疫治疗的脱靶效应所带来的细胞毒性。如上述靶向CD19治疗B细胞淋巴瘤案例所示,免疫治疗常常会出现脱靶效应。虽然研究脱靶效应对病人的副作用这方面至关重要,但是从单细胞基因组学分析来确定特定免疫疗法对正常体细胞的影响也十分必要。接下来,作者表明,单细胞全基因组测序这一方法也适用于表达量十分稀少的细胞类型,比如CD4+T细胞,CD4的RNA水平很低,但是蛋白质水平却很高,这一类分子需要高通量数据库进行修正。最后,作者提出了单细胞全基因组测序所面临的挑战:一是如何界定某一类型细胞重要与否,并且,随年龄、性别等影响,其重要性是否有所区别。二是如何确定一标准,使得某分子在肿瘤细胞与体细胞的表达量超过这一标准,才可以认定为是潜在靶标。三是影响抗原表达水平的因素都有什么。最后,理论上可行的靶标在临床上也可能出现各类未知问题。综上所述,作者给出了有别于组织学水平和单一突变水平研究肿瘤以及肿瘤治疗的方法,也就是基于高通量单细胞全基因组测序和图谱数据分析方法。并预测,这一方法可以在预测免疫治疗靶标和临床精准抗癌方面发挥重要作用。原文链接:https://doi.org/10.1016/j.ccell.2021.11.005
  • 北京基因组所发布癌症单细胞表达图谱数据库CancerSCEM
    近日,中国科学院北京基因组研究所(国家生物信息中心)国家基因组科学数据中心开发的癌症单细胞表达图谱数据库CancerSCEM上线。该研究成果以CancerSCEM: a database of single-cell expression map across various human cancers为题在国际学术期刊Nucleic Acid Research在线发表。  单细胞分辨率的全转录组测序技术(scRNA-seq)具有研究细胞异质性的显著优势,已成为研究肿瘤微环境、癌症发病机制、转移与侵袭以及各类癌症治疗与诊断不可或缺的手段。截至2021年11月,PubMed已有超过1300个癌症相关的单细胞转录组学研究,极大提升了人们对人类癌症发生发展的理解,推动了癌症临床诊断与治疗的进程。大规模癌症scRNA-seq数据在过去十年中呈现爆炸式增长,迫切需要对这些数据进行规范化整合与处理,对各类癌症的肿瘤微环境进行深入挖掘与比较分析。为应对这一需求,该研究团队开发了CancerSCEM数据库。  CancerSCEM 1.0版本整合分析了208个癌症scRNA-seq数据集,涵盖肺腺癌(LUAD)、结肠直肠癌(CRC)、恶性胶质瘤(GBM)等在内的20种人类癌症类型。通过标准化分析流程处理,获得了精确的细胞类型注释信息。在此基础上,团队还开展了一系列附加分析,包括不同细胞类型间基因差异表达分析(可为新型标志物筛选提供参考)、细胞表面受体-配体基因对表达谱、样本内细胞互作网络构建等,可为用户提供更加丰富的肿瘤微环境相关信息,并开展了基于TCGA表达数据与临床信息的生存分析。  数据库为用户提供浏览、多重检索、在线分析及下载等服务功能,用户可采用首页快速检索、词云及精确检索等途径查询感兴趣的癌症单细胞数据集或样本。如点击词云里的基因名“HLA-A”或通过搜索框输入,均可触发数据库查询功能,并实时获得目标基因的详细信息及其在单细胞层面与细胞群体(组织)层面的表达分布信息。为方便临床相关用户的使用,团队共审编获得36个常用免疫检查点分子(如PDCD1、CTLA4、LAG3、HMGB1),并提供专门的搜索列表,以帮助各类癌症的临床免疫治疗研究寻找更优的治疗靶点。  数据库还配备了一个交互式综合在线分析平台,共集成2个分析模块与7个分析功能。通过基因分析模块,用户可开展4个方面的实时分析及可视化展示:样本内目标基因的整体表达概况;样本内基因在不同细胞类型间的表达比较;基因表达相关性计算及筛选;208个样本中单细胞或bulk层面的基因表达比较。通过样本分析模块,用户可进行样本间细胞组成比较、样本内细胞互作网络构建以及基于TCGA的生存分析。该分析平台将为用户开展个性化的癌症scRNA-seq数据挖掘提供友好的增值服务。  该研究工作得到中科院战略性先导科技专项、国家自然科学基金、国家重点研发计划等项目资助。  论文链接
  • 基于Perturb-seq技术,绘制首个全基因组范围的人类细胞基因型-表型综合图谱
    近日,美国加州大学旧金山分校与纪念斯隆凯特琳癌症中心等单位的研究人团队合作Cell期刊发表了题为“Mapping information-rich genotype-phenotype landscapes with genome-scale Perturb-seq”的研究性文章。研究团队利用一种紧凑的、多路CRISPR干扰文库(CRISPRi),结合单细胞转录组测序、Perturb-seq技术等分析了数千个功能缺失的基因扰动在不同细胞类型中的作用,揭示了细胞表型、基因功能和调控网络的多维信息,绘制了第一个全面的人类细胞基因型-表型综合图谱。文章发表在Cell研究概要图,来源:Cell新基因功能数据可供其他科学家使用。图片来源:Jen Cook-Chrysos/Whitehead Institute建立遗传变化和表型之间的关联对于理解基因和细胞功能至关重要。经典的研究方式主要包括以表型为中心的“正向遗传”,即揭示驱动表型的基因变化;以及以基因为中心的“反向遗传”,即对确定的遗传变化引起的不同表型进行解析。近年来,基因技术的革新也推动了表观遗传遗传研究的进展。其中,CRISPR-Cas9基因编辑技术可以轻松地对基因进行编辑,进而抑制或激活基因,在揭示基本细胞机制、分化因子和遗传疾病相关基因以及识别癌症驱动基因等层面提供了有力工具。单细胞技术的发展也使在单细胞层面读取表观遗传学、转录组学、蛋白质组学和成像信息等成为可能,同时单细胞维度的研究也可以深入分析选择性遗传扰动影响的具体细胞类型和细胞状态。因此,单细胞CRISPR筛选可以同时分析单细胞的遗传干扰和高维表型,从而将正向遗传学的基因与反向遗传学丰富的表型相结合。虽然单细胞CRISPR筛选技术前景广阔,但其应用仅限于最多几百个基因扰动研究,并且这些基因扰动研究也通常被用来解决预先确定的生物学问题。目前,高通量、无偏颇的单细胞CRISPR筛选研究仍然缺失。主要研究内容全基因组Perturb-seq的多路CRISPRi策略Perturb-seq是指利用CRISPR-Cas9技术将基因变化引入细胞内,然后使用单细胞转录组测序捕获特定基因变化导致的转录组信息变化,能够研究给定细胞类型的全面遗传扰动影响,可以以前所未有的深度跟踪打开或关闭基因的影响。基于Perturb-seq,研究团队探究了可以提高可扩展性和数据质量的关键参数,例如遗传扰动模式和sgRNA库,并最终设计了一种包含多个时间点和细胞类型的Perturb-seq筛选方法,并可利用10x Genomics的液滴法单细胞转录组测序技术对所有筛选策略下的细胞状态进行解析。图1. 基因组尺度Perturb-seq的多路CRISPRi策略示意图,来源:Cell为了揭示基因扰动的功能后果和基因型-表型关系,研究团队使用人类血癌细胞系以及来自视网膜的非癌细胞,对超过250万个细胞进行了Perturb-seq,并使用这些数据构建了一个基因型-表型综合图谱。研究团队根据基因的共同调控将其聚类到特定表达程序中,并计算每个扰动簇中每个基因表达程序的平均活性。分析结果包含多个与基因干扰相关的已知表达程序,包括蛋白酶体功能障碍导致的蛋白酶体亚基上调、 ESCRT蛋白缺失时NF-kB信号通路的激活,以及胆固醇生物合成上调对囊泡运输缺陷的反应等。有趣的是,聚类分析发现了许多驱动红系或髓系分化的基因扰动,与K562细胞的多系潜能也是一致的。正如预期的那样,红细胞生成的关键调控因子(GATA1、LDB1、LMO2和KDM1A)的缺失导致了髓系分化增强,BCR-ABL及其适配体GAB2的抑制则促进了红细胞的分化。接下来,研究团队分析了选择性必需基因的分化作用,因为这些基因可能是颇具前景的治疗靶点。研究发现,在K562细胞中必需的酪氨酸磷酸酶PTPN1的缺失驱动了髓细胞分化。此外,在靶向实验中,联合敲除PTPN1和KDM1与单独敲除任意一个基因相比,导致分化和生长缺陷的表型会显著增加,表明这些靶点是通过不同的细胞机制发挥作用。以上结果强调了表型在了解细胞分化和治疗靶点方面的效用。图2. 基于Perturb-seq的基因型与表型关系汇总,来源:Cell单细胞中非整倍体的基因驱动和影响探索单细胞异质性可以揭示在整体或平均检测中被遗漏的机制。为了评估基因扰动诱导表型的外显率,研究团队采用SVD评分作为单细胞表型大小的衡量标准,通过单细胞SVD分数的变化对基因扰动进行表型影响评估。SVD评分是量化每个受扰动细胞的转录组相对于对照细胞的离群程度。分析结果表明,许多与染色体分离有关的基因都是细胞异质性的主要驱动因素,包括TTK、SPC25、DSN1,这些遗传干扰导致的极端转录变化可能是由于有丝分裂错误分离导致的染色体拷贝数的急性变化。为了探究这一点,研究人员使用inferCNV估算了基因组中单细胞DNA拷贝数变异。与预期一致,干扰纺锤体装配检查点的核心组成部分TTK,可以导致非整倍体和近整倍体细胞的染色体拷贝数发生显著变化。此外,干扰TTK的细胞中有76%发生了核型改变,未受干扰的细胞中只有2%发生了核型改变。值得注意的是,由于染色体的随机增加或减少,TTK敲除细胞具有高度可变的核型,这也是其表型异质性的原因。同时,该分析还揭示了单细胞CRISPR筛选可以用来解析表型,而不是预先定义的实验终点。图3. 单细胞中非整倍体的基因驱动和后果,来源:Cell发现线粒体基因组的应激特异性调控因子当前,领域内一个关键的科学问题是如何理解细胞核和线粒体基因组的表达来应对线粒体压力。该最新研究的实验设计为探究这一问题提供了可能。为了确定基因扰动引起的差异表达模式,研究团队检测了单细胞转录组测序数据在线粒体基因组中的分布。为了验证这种基于位置的分析的有效性,首先证实了已知线粒体转录调控因子(TEFM)和RNA降解(PNPT1) 的敲除会导致线粒体基因组位置发生重大变化。相比之下,研究发现许多基因扰动似乎导致了mRNA相对丰度的变化,而不是位置排列的总体变化。鉴于观察到的反应的复杂性,研究人员提出可能有多种机制影响不同线粒体编码转录本的水平,以应对不同的压力。图4. 解析压力应激下线粒体基因组的调控机制,来源:Cell结 语 单细胞CRISPR筛选代表了一种新兴的工具,可用于生成丰富的基因型-表现型图谱。但目前单细胞CRISPR筛选研究仅限于预先选择的基因,研究重点也是预先确定的生物学问题。在该最新研究中,研究团队进行了全基因组规模的单细胞CRISPR筛选,并展示了这些筛选策略是如何使用数据驱动的分析来解剖广泛的生物学现象,强调了关键的基因功能和衍生原则,同时绘制了丰富的基因型-表型图谱以指导未来的研究。该研究为系统探索遗传和细胞功能提供了源动力,同时也为领域提供了宝贵的数据资源。在未来,研究人员希望将Perturb-seq用于癌细胞系之外的不同类型细胞研究,也希望继续探索基因功能图谱。文章共同通讯作者Thomas M. Norman博士表示:“该研究是多个科研团队多年合作工作的结晶,很高兴看到它继续取得成功和扩展,我认为这个数据集甚至将使来自生物医学以外领域的研究团队进行各种分析成为可能。”参考文献:1. Replogle et al., Mapping information-rich genotype-phenotype landscapes with genome-scale Perturb-seq, Cell (2022).2. Fianu, I., et al., (2021). Structural basis of Integrator-mediated transcription regulation. Science 374, 883–887.3. Kummer, E., and Ban, N. (2021). Mechanisms and regulation of protein synthesis in mitochondria. Nat. Rev. Mol. Cell Biol. 22, 307–325.
  • 来自8个国家的科学家完成食管鳞癌全基因组测序图谱
    食管鳞癌的发病率在不同地区间差异巨大【1】 ,过去认为不同地区间的生活习惯特征及环境因素差异可能是食管鳞癌的相关风险因素【2】 ,但这些因素均不足以解释食管鳞癌的发病率差异【3】 ,亟需探索其背后的机制及原因。2021年10月18日,英国Wellcome Sanger Institute的Michael R. Stratton教授研究组在Nature Genetics上发表题为Mutational signatures in esophageal squamous cell carcinoma from eight countries with varying incidence的研究论文,基于来自8个国家的552例大队列食管鳞癌患者的血液样本,采用全基因组测序系统揭示了食管鳞癌的突变谱。结果表明,食管鳞癌突变谱在多个国家中较为相似。有趣的是,虽然吸烟、酒精等危险因素表现出特异的突变指纹,但对整体突变负荷影响较小。相反,作者发现APOBEC相关突变约占整体突变负荷的四分之一,可能是食管鳞癌发生发展的潜在重要因素。在这项研究中,研究者采集了来自巴西、中国、伊朗、日本、肯尼亚、马拉维、坦桑尼亚、英国的552例食管鳞癌患者的血液样本,并利用全基因组测序全面表征其突变谱。整体上来说,突变负荷存在一定异质性,其中单碱基突变(single-base substitution,SBS)范围为1191至62240(中位:10709),双碱基突变(doublet-base substitutions,DBS)范围为2至260(中位:35),插入/缺失(indel, ID)突变范围为27至64358(中位:753)。重要的是,排除超突变等离群值后,不同国家之间的突变特征差异较小。研究者进一步利用SigProfilerExtractor算法提取了de novo突变指纹,其中大部分可在Catalogue of Somatic Mutations in Cancer (COSMIC) 【4】 中找到参考。有趣的是,6条COSMIC参考指纹可解释80%的食管鳞癌突变负荷(包括SBS1、SBS2、SBS5、SBS13、SBS18、SBS40)。其中,SBS2和SBS13可能与APOBEC胞嘧啶脱氨酶家族活性有关,并存在于大多数样本中(88%和91%),且约占整体突变负荷的25%,表明APOBEC可能与食管鳞癌的发生发展密切相关。研究者深入探索了APOBEC相关突变是否是克隆性的,发现APOBEC更常见于亚克隆。为了探索食管鳞癌的驱动突变,研究者共鉴定了38个基因,包括已知的食管鳞癌驱动程序(例如TP53、CDKN2A、PIK3CA、NFE2L2、NOTCH1)。其中,最常见的突变基因是TP53(占比91%)。在饮酒者及对照的TP53精细分析表明,饮酒与SBS16特征谱的突变富集有关。研究者进一步探索了突变负荷和已知食管鳞癌风险因素的关联。回归分析表明,吸烟与DBS2、ID3和de novo单碱基突变SBS288I有关,饮酒和SBS16 和 ID11相关。研究者进一步分析了APOBEC和食管鳞癌风险因素之间的关联。结果表明,常见风险因素如吸烟、酒精等与APOBEC无显著关联。此外,研究者还分析了食管鳞癌和胚系突变的关联,发现APOBEC3区域的30-kb缺失、酒精代谢酶ALDH2胚系突变、BRCA2胚系突变有一定相关性。综上,这项工作基于大样本、多队列的全基因组测序,相对全面地覆盖了不同发病率、不同危险因素偏好的食管鳞癌人群,揭示了APOBEC 驱动突变是大多数食管鳞癌发生发展的重要因素。重要的是,这项工作表明,不同地区间的食管鳞癌发病率差异不能被吸烟饮酒等危险因素相关的基因突变所解释,而APOBEC的突变情况才是关键因素。原文链接:https://www.nature.com/articles/s41588-021-00928-6
  • 光滑双脐螺免疫细胞基因组图谱完成 为防治世界第二大传染性寄生虫病奠定理论基础
    施普林格自然出版社旗下《免疫遗传学》杂志近日公布了世界上第一份曼氏血吸虫中间宿主免疫细胞的单细胞RNA测序(scRNA-seq)的比较基因组学和转录组学科学成果,该成果是由中国北部湾大学和加拿大阿尔伯塔大学共同主持。  光滑双脐螺是世界上排名第二的最重大最常见的传染性寄生虫病——曼氏血吸虫病的中间宿主,根据世界卫生组织(WHO)2018年的估计,全世界被曼氏血吸虫感染需要治疗的人群达到2.3亿人,目前WHO呼吁采取更加综合的控制曼氏血吸虫病的健康方针,就是要对寄生于人体和中间宿主体内的寄生虫-宿主相互作用的界面分子进行研究。  这项科学成果从2018年启动到论文发表经过了四年多的时间,首次采用世界最前沿的单细胞RNA测序技术,并应用在重大寄生虫病病原宿主免疫细胞领域,从整体上全面揭示了曼氏血吸虫中间宿主的免疫细胞的免疫分子系统,包括对曼氏血吸虫中间宿主的免疫细胞两个群体的单个颗粒细胞和透明细胞进行的比较基因组学和转录组学的科学研究、分析,获得了海量的单个细胞的比较基因组学和转录组学数据信息库,在曼氏血吸虫中间宿主抵抗株,共计获得了48.98亿条免疫细胞单细胞测序序列,在曼氏血吸虫中间宿主易感柱共计获得48.07亿条免疫细胞单细胞测序序列。  论文共同通讯作者、北部湾大学吴信忠教授介绍称,该成果筛选获得了有重要科学意义的完整全基因数目超过3万多个,首次揭示了两大免疫细胞群体,在免疫遗传上具有明显的免疫功能分工差异,透明免疫细胞群体在免疫遗传上更倾向于负责产生大量的杀灭曼氏血吸虫的免疫效应子蛋白分子,而颗粒免疫细胞群体在免疫遗传上更倾向于负责产生抗曼氏血吸虫的许多种纤维蛋白原相关蛋白分子和许多种类的免疫模式识别受体分子。  曼氏血吸虫中间宿主免疫细胞scRNA-seq基因组和转录组图谱的完成,为洞察光滑双脐螺的免疫分子系统,筛选抗性抵抗株螺蛳用于控制曼氏血吸虫感染,防治曼氏血吸虫病奠定了重要的理论基础,亦为全球进行曼氏血吸虫与宿主界面分子相互作用的理论研究提供了重要的参考数据库。
  • 华大基因OpGen联手合作 探寻“完美”全基因组序列
    近日,深圳华大基因研究院(BGI)与基因组光学图谱技术的独家供应机构OpGen公司共同宣布,双方将致力于推广基因组光学图谱技术在人类和动植物全基因组测序组装中的应用。   华大基因和OpGen公司已经成功地合作完成了对人类基因组现有的序列中&ldquo 漏洞&rdquo 的填补工作。双方的研发团队将继续合作完成更多人类及动物全基因组序列。   随着DNA测序技术的发展,研究人员可以花费更低的成本得到更多有效的数据,但是,测序获得的基因组中仍然有许多无法定位和无法鉴别的基因序列存在。OpGen公司的光学图谱技术与新一代测序技术相结合将有助于高效、精确地将组装的基因组序列定位到染色体上,获得高质量的全基因组序列图谱。   华大基因拥有一流的测序能力和强大的计算能力,每年可完成千万个基因组序列。在全基因组测序组装技术的基础上,配合基因组光学图谱技术,该合作项目将会为全基因组测序及基因组学研究的飞速发展提供一个卓越的平台。   OpGen公司开发的基因组光学图谱技术,不依赖序列信息,可以快速生成基于单个DNA分子的高分辨率、有序、全基因组的限制性内切酶酶切图谱。该技术已经被广泛应用于微生物基因组学研究,如比较基因组学研究,菌株分类,全基因组序列组装等。   华大基因研发部门的副总裁徐讯说:&ldquo 通过基因组光学图谱技术与新一代测序技术相结合,我们可以获得更多高质量的具有代表性的参考基因组序列。这将有助于对不同的人群进行更加精确且有针对性的基因组学研究。此外,这两种技术的结合可以改进微生物基因组序列组装结果,在人类元基因组研究领域有巨大潜力,将会极大地促进人类疾病研究的发展和应用。&rdquo   OpGen公司的执行总裁道格· 怀特(Doug White)说:&ldquo 我们很高兴能够与华大基因一起合作,实现基因组光学图谱技术在微生物研究以外领域的应用。我们相信,基因组光学图谱技术与新一代测序技术相结合将为完成复杂的大基因组的全基因组序列带来很大的帮助,能够有效的降低这些基因组学项目的总体研究经费和时间。&rdquo
  • Nature子刊!多种测序技术联合 助力高质量豌豆参考基因组和泛基因组发布
    2022年9月22日,中国农业科学院作物科学研究所联合中国科学院微生物所、山东省农业科学院农作物种质资源研究所、国际半干旱热带作物研究所和澳大利亚默多克大学等国内外多家单位在Nature Genetics上以长文的形式发表了题为Improved pea reference genome and pan-genome highlight genomic features and evolutionary characteristics的研究论文。研究团队完成了中国豌豆主栽品种“中豌6号”的基因组组装和解析,解决了长期以来悬而未决的豌豆基因组精细物理图谱组装难题,揭示了豌豆基因组结构和进化的独特特征,发掘了一批与粒型、株高和荚型等孟德尔性状和重要农艺性状相关的位点和基因,同时构建了栽培和野生豌豆泛基因组,展示了豌豆近缘野生种和地方品种作为未来豌豆育种改良资源的巨大潜力。高质量的参考基因组、注释和泛基因组对豌豆种质资源挖掘利用和育种改良的基础与应用研究具有重要参考价值和指导作用,同时也为其他豆科作物基因组和泛基因组研究提供了重要借鉴。自孟德尔发现遗传定律以来,豌豆作为遗传研究的“明星”植物,受到了学界和公众的广泛关注。豌豆 (Pisum sativum L., 2n=2x=14) 是一年生冷季食用豆类,属于豆科(Leguminosae)、蝶形花亚科(Papilionoideae)、野豌豆族(Viceae)、豌豆属(Pisum L.)。豌豆富含蛋白质、淀粉、纤维素和多种矿物质,是粮菜饲兼用的食用豆类作物,在世界范围内广泛种植。据FAO统计资料显示(http://www.fao.org/faostat/),世界豌豆的总产量和种植面积逐年增加,中国豌豆特别是鲜豌豆的总产量与种植面积也增长迅速。同时,豌豆的生物固氮能力可以减少氮肥使用,有效改善土壤结构,还可作为倒茬作物减少病虫害,促进农业和自然生态系统的可持续发展。作物种质资源是支撑农业发展创新和作物遗传改良的物质基础,目前国家作物种质库保存豌豆种质资源达到7000余份,蕴藏着丰富的遗传多样性,亟待深入挖掘和利用【1】。图1 中豌6号形态特征及豌豆种质资源多样性豌豆基因组大小约为4.28 Gb,远大于大豆(4倍)、鹰嘴豆(6倍)、普通菜豆(7倍)、绿豆和小豆(8倍)等其他豆科作物基因组,其基因组中有超过80%的重复序列。由于豌豆基因组的复杂性,直到2019年,国际上才公布了第一版以二代测序技术(Next Generation Sequencing, NGS)为主的豌豆参考基因组,为豆科植物基因组进化提供了新的见解【2】。然而,由于NGS技术的短板,这一版基因组组装得到的218,010个contigs的 N50 值仅为37.9 Kb,组装结果碎片化严重,尤其是在复杂的重复区域,与高质量参考基因组的标准相去甚远【2】。此外,研究表明,与国外豌豆种质资源相比,中国豌豆具有独特的遗传背景和丰富的遗传变异【3】。由于缺乏豌豆高质量基因组和精细物理图谱,严重滞后了豌豆重要农艺性状的遗传解析和种质资源挖掘利用进展,尤其阻碍了对国内外不同豌豆种质资源的综合利用。为了解决上述科学难题,研究团队利用中国豌豆主栽品种“中豌6号(ZW6)”,以PacBio 单分子实时 (SMRT) 测序为基础,结合 10x 长片段测序、Bionano 光学图谱和染色质三维构象捕获 (Hi-C),以及 Illumina NGS 技术,联合优化多种组装策略,完成了迄今为止最高质量的豌豆基因组精细图谱和基因注释(图2)。该基因组组装大小约为3.8 Gb,序列对总共7条染色体的定位率达到97.96%,组装的contig水平N50达到了8.98Mb。通过遗传图谱一致性评估、BUSCO分析、Merqury分析以及LAI分析在内的综合基因组组装评估方法,均表明该组装在连续性、准确性和完整性方面表现优异。此外,该组装共注释出47,526个编码基因,并且在基因完整性、调控区完整性、转座子组装完整性和注释完整性方面均得到了明显改善。豌豆基因组高质量精细物理图谱的获得,拓宽了我们对豌豆巨大基因组背后遗传学的了解,为豌豆重要农艺性状的遗传解析和种质资源的挖掘利用提供了宝贵基因组资源。图2. 豌豆基因组的重要特征。豌豆大约在10,000 年前被驯化,被认为是最早驯化的豆类作物之一。然而,尽管它在推进植物遗传学方面发挥了关键作用,但豌豆属内的物种划分长期存在争议,其驯化过程仍不清楚【4】。研究团队基于118个栽培和野生豌豆的全基因组重测序数据,不仅揭示了栽培和野生豌豆SNP、InDel和SV等不同变异类型的基因组多态性特征,同时基于SNP和SV多态性变异信息的群体遗传结构和系统发育分析,阐明了栽培和野生豌豆的群体遗传结构,支持豌豆属内包含3个物种P. fulvum、P. sativum 和 P. abyssinicum的结论。同时在 P. sativum中鉴定出了三个遗传分组,其中 P. sativum II (PSII) 和 P. sativum III (PSIII) 主要对应于代表亚洲和欧洲不同地理区域栽培豌豆的两个遗传分组,可能与豌豆驯化后的传播途径有关(图3)。以上结果解决了长期以来关于豌豆属物种划分的争议,为豌豆起源驯化提供了新的基因组学证据,也为豌豆种质资源的综合开发利用提供了科学依据。图3 基于SNP (a, b, e)和SV (c, d, f)的118份栽培和野生豌豆的群体遗传结构。孟德尔通过研究豌豆的七个性状发现了遗传规律,开创了遗传学研究的先河。在过去的几十年中,孟德尔研究的四个性状包括粒型(R/r)、株高(Le/le)、子叶颜色(I/i)以及种皮和花色(A/ a)的四个基因位点已经被克隆并进行了功能分析;而其他三个孟德尔性状,果荚颜色 (GP/gp)、荚型 (V/v) 和花的位置 (Fa/fa)相关的基因位点尚未解析【5】。为了探索豌豆重要农艺性状的遗传基础,研究团队利用GBS测序对WJ×ZW6杂交构建的300个F2群体中的12个农艺性状进行了QTL分析(图4),鉴定出了25 个与12个农艺性状相关的QTLs,其中有三个为孟德尔性状相关位点和基因,包括控制粒型(圆粒/皱粒,R/r)和株高(高/矮,Le/le)的孟德尔基因,以及与荚型(硬荚/软荚,V/v)相关的候选基因。图4 豌豆12个农艺性状QTL分析结果以及与孟德尔性状相关的3个QTL位点和基因【5】。越来越多的研究表明,单一的参考基因组不足以代表一个物种,特别是对于豌豆这类经历过长期驯化的物种,而泛基因组分析为作物种质资源变异解析和挖掘利用提供了有效手段。为了更深入地了解栽培和野生豌豆的多样性,研究团队构建了基于116个栽培和野生豌豆全基因组测序的泛基因组(图5),发现栽培和野生豌豆种质资源大部分泛基因组多样性主要存在于不同物种和遗传分组之间,并且以特有基因组序列的形式存在。对豌豆泛基因的存在/缺失变异模式(PAV)分析发现,随着新基因组数目的增加,核心基因的数量减少,而泛基因的数量增加,并逐渐趋于饱和(图5a)。同时,在多个豌豆基因型中存在的核心基因在其他27 个植物基因组中也更保守(图5b),表明它们具备通用的核心功能。基于跨基因组同源基因系统发育分类方法(HOG),研究人员将116个泛基因组的基因聚类生成 112,776个泛基因簇,在不同物种之间显示出差异显著的PAV模式(图5c)。对不同泛基因分组中特有泛基因的 GO 分析显示出保守基因和可变基因之间的不同功能富集。值得注意的是,P. abyssinicum独特的泛基因在刺激和化学反应方面富集,而P. fulvum的泛基因在发育、生长、繁殖、细胞骨架等方面富集,进一步证实了豌豆野生近缘种和地方种质资源作为育种材料在未来提高豌豆品种抗性和产量方面的潜在价值。图5 116个代表性栽培和野生豌豆的泛基因组分析结果(包括 ZW6)。总之,研究人员克服了复杂基因组组装的多重障碍,成功绘制了中国豌豆基因组高质量精细物理图谱,还构建了栽培和野生豌豆泛基因组,揭示了豌豆基因组进化特征、群体遗传结构与重要性状的分子基础,为豌豆起源驯化、基因挖掘、种质创新和育种改良以及豆科植物比较基因组学研究提供了重要借鉴和宝贵资源。这项研究邀请了澳大利亚默多克大学Rajeev K Varshney教授共同开展国际合作研究,他认为这次研究成果为公众提供了高质量的豌豆参考基因组,产生的基因组资源不仅有助于豌豆的遗传基础研究,以应对气候变化带来的挑战,还将促进豌豆优异基因的挖掘和优良品种的开发。此外,宗绪晓课题组及其合作团队还建立了豌豆遗传转化体系,利用CRISPR/Cas9基因编辑体系成功实现对豌豆PDS基因的编辑【6】。恰逢孟德尔诞辰200周年,豌豆高质量基因组和泛基因组的发布,以及豌豆基因编辑技术体系的建立将为豌豆重要农艺性状的遗传解析和种质资源的挖掘利用提供有力的技术支撑。中国农业科学院作物科学研究所杨涛副研究员和刘荣助理研究员、中国科学院微生物研究所骆迎峰副研究员和胡松年研究员以及山东省农业科学院农作物种质资源研究所王栋助理研究员为论文的共同第一作者。中国农业科学院作物科学研究所宗绪晓研究员、中国科学院微生物所高胜寒特别研究助理、山东省农业科学院农作物种质资源研究所丁汉凤研究员、国际半干旱热带作物研究所和澳大利亚默多克大学Rajeev K Varshney教授为论文的共同通讯作者。中国科学院植物研究所葛颂研究员,西北农林科技大学徐全乐副教授、山东省农业科学院作物种质资源研究所李娜娜副研究员、云南省农业科学院何玉华研究员、青海大学刘玉皎研究员、江苏沿江地区农业科学研究所王学军研究员、四川省农业科学院项超副研究员以及中国农业科学院作物科学研究所研究生王晨瑜、李冠、黄宇宁、季一山、李孟伟,国际半干旱热带作物研究所Manish K Pandey和Rachit K Saxena博士,也参与了该项研究。辽宁省农业科学院李玲研究员,澳大利亚谷物种质库Bob Redden教授和美国农业部农业研究中心、华盛顿州立大学胡锦国教授对项目开展提供了重要帮助。豌豆基因组研究得到了科技部国家重点研发计划(2018YFD1000701/2018YFD1000700)、中国科学院青年创新促进会(2017140)、山东省农业品种改良项目(2019LZGC017)、中国农业农村部食用豆现代产业技术体系(CARS-08)、国家自然科学基金(31371695和31801428)、山东省农业科学院科技创新项目(CXGC2018E15)、作物种质资源保护(2130135)、山东省农科院科技创新项目产业团队农业科学(CXGC2016A02)、山东省现代农业产业技术体系粗粮创新团队(SDAIT-15-01)、中国农业科学院创新工程(ASTIP)和山东省农业科学院青年研究基金(2016YQN19)等项目的支持。
  • 2010:基因组学推动生命科学大步向前
    2010年下旬,河南安阳曹操墓真伪之辩正酣。而一则来自上海的重磅消息更是引发了多方关注。复旦大学现代人类学教育部重点实验室宣布,向全国征集曹姓男性DNA样本,拟用基因组科学的手段验证出土的头骨是否为曹操本人。   一下子,基因组科学成为热门,这一话题&ldquo 落入寻常百姓家&rdquo 。   事实上,伴随着2000年人类基因组框架图和2003年人类基因组完成图的发表,近十年来,DNA测序技术继续高速发展,基因组科学极大地推动了生命科学的发展,并一直受到各国政府和学术组织高度重视。   2010年,基因组科学研究更是取得了重大进展。在美国《科学》杂志评出的当年十大科学进展中,涉及基因组科学的共有3项&mdash &mdash 尼安德特人基因组、外显子组测序、下一世代的基因组学。这也从一个侧面反映了该项科学在2010年的蓬勃发展。   多个重要物种基因组图谱完成   2010年,期待已久的大豆基因组序列终于测通。   当年1月,来自美国农业部、美国能源部联合基因组研究所等单位的研究人员联合在《自然》宣布,该研究团队利用&ldquo 全基因组鸟枪测序法&rdquo 对大豆基因组的11亿个碱基进行测序,公布了第一张豆科植物完整基因组序列图谱。这也是目前利用全基因组鸟枪测序完成的最大植物基因组。   &ldquo 这是大豆研究一个重要的里程碑。&rdquo 美国能源部大豆生物技术国家中心主任Gary Stacey博士认为。   伴随着该图谱的绘制完成,作为世界上主要油料来源的大豆,其基因组科学研究进展又获新突破。   2010年11月,由香港中文大学、华大基因研究院、农业部基因组重点实验室、农业科学研究院等单位宣布,他们对17株野生大豆和14株栽培大豆进行了全基因组&ldquo 重测序&rdquo ,总共发现了630多万个SNP(单核苷酸多态性位点),建立了高密度的分子标记图谱,并作为封面故事刊登于《自然&mdash 遗传学》杂志。   &ldquo 这是世界上首次大规模获得野生和栽培大豆群体基因组数据。&rdquo 华大基因研究院徐讯博士告诉《科学时报》记者。   精确的大豆基因组序列图谱和其全基因组大规模遗传多态性分析,为大豆遗传性状的鉴定提供了便利,而有关其他物种基因组的研究也不遑多让。   最牵动国人神经的基因组图谱绘制,莫过于国宝大熊猫。   由深圳华大基因研究院、中国科学院昆明动物研究所、中国科学院动物研究所、成都大熊猫繁育研究基地和中国保护大熊猫研究中心等单位共同完成的《大熊猫基因组测序和组装》,于1月21日以封面故事形式在国际权威杂志《自然》上发表,并获评2010年中国十大科技进展。   该项研究表明,大熊猫有21对染色体和2.4亿对碱基,包含基因2万多个,并且其基因组仍然具备很高的杂合率。&ldquo 这同时也标志着基于短序列的基因组测序、拼接和组装技术获得了重大突破。&rdquo 徐讯指出。或许,这项研究进展将让人类更早地知道大熊猫的&ldquo 黑眼圈&rdquo 之谜。   此外,在过去的12个月里,先后有包括中国在内的多国研究人员在《自然》《科学》等杂志上报告完成了苹果、青蒿、黄瓜、寄生性金小蜂、蚂蚁、蚜虫、珍珠鸟等多个重要物种的基因组图谱。   今后,基因组测序规模将越来越大。记者从华大基因研究院获知,仅仅2011年,就可能有土豆、绵羊、牦牛、几种鸟类等多项物种的基因组图谱陆续绘制完成。   基因组科学揭示人类变迁   本文开头提到的&ldquo 利用曹姓DNA鉴定曹操头骨&rdquo 并非国人专利。据英国《每日邮报》报道,比利时学者曾对希特勒家族的39位亲属进行DNA检测,来证明希特勒的族裔。   这些工作的开展,借助的正是&ldquo 基因留有祖先深刻烙印&rdquo 这一事实。   而以基因为研究目的的基因组科学,恰恰使描述人类及动物变迁等地理基因组学和人类学研究成为可能。   2010年,世界各地的科研人员在该方面研究均有较大进展,我国科学家的研究也同样呈现多点开花局面。   2009年12月15日,美国《国家科学院院刊》刊载的中国科学院院士、中科院昆明动物研究所研究员张亚平等人的文章称,通过对680份藏族人群线粒体DNA样本分析表明,现代藏族人的绝大部分母系遗传组分,可能追溯至新石器时期以来迁入青藏高原的中国北方人群。   2010年,来自复旦大学的研究人员也对西藏地区居民进行了&ldquo 基因普查&rdquo 。研究人员推测,西藏居民可能最早来自北亚人群,接近蒙古和贝加尔湖区域等地区的北方人群。而国家计划生育研究所和北京基因组研究所的最新研究结果则进一步揭示,藏族先民可能是经横断山脉向上游迁徙,最后抵达青藏高原。   发现还不止于此。同样是2010年,华大基因研究院对我国藏族、汉族人群常染色体EPAS1基因进行分析,研究结果刊于美国《科学》杂志。这项研究初步推测出该基因在青藏高原世居藏族人和平原汉族人中出现分离的年代。   除了在藏族人类学领域取得了重要成就,科学家在2010年仍大有收获。如果佐以社会学的相关研究,基因组科学或将在人类学研究领域获得更大的空间。   另一项关于古人类的基因组学研究更在2010年震惊世界,并同时位列多个不同机构评选的世界十大科学新闻。   2010年5月6日,多家国际著名机构在《科学》杂志上发文表示,研究人员通过DNA两轮靶向序列捕获的测序新技术,实现了分别对3个古代尼安德特人头骨化石片段DNA的测序。   尼安德特人在进化学上是与我们最为接近的亲族。它们出现在大约40万年前,分布遍及欧洲和西亚,并于3万年前灭绝。   研究表明,所获得的基因组序列图占其整个基因组中的60%之多,而现代人具有约1%~4%尼安德特人的基因。   来自马普研究所的Svante Paabo兴奋地表示:&ldquo 尼安德特人基因组序列首个版本的获得,完成了人类长期以来的一个梦想。我们首次发现了将我们与其他所有生物区别开来的基因特征,包括那些在进化过程中距离我们最近的亲族。&rdquo   中国的发现也同样令人振奋。中国科学院院士、中国农业大学教授李宁等成功提取出距今已有9000年历史的猪骨化石DNA,通过测序研究发现,其是经过驯化的家猪,这将中华民族的家畜驯化史推到万年层面。   或许,在今后的基因组科学研究中,有关人类历史学的观点将不断更新。   下一世代测序技术令人翘首   古DNA的成功测序和组装依赖于测序技术的进步。同样,有别于前两代的下一世代测序技术也在2010年的基因组科学研究中&ldquo 小荷已露尖尖角&rdquo ,并入选世界十大科学进展。   下一世代测序技术,是基于纳米孔的单分子读取技术,可以直接读取序列信息,简便快捷 反观之前的两代技术,则需要荧光或化学发光物质的协助, 通过读取整合到DNA链上的光学信号而间接确定。   虽然该测序方法仍有基因组覆盖不完整等缺陷,但并不影响其风生水起。   例如,斯坦福大学的生物工程师Stephen Quake等研究人员在《自然&mdash 生物技术》发文称,他们利用一台新开发的单分子测序仪,对其本人的基因组进行了测序,仅耗时4个星期,试剂费约48000美元。   与此同时,离子激流公司的下一代硅芯片测序仪也获得突破。利用该技术,科学家们于2010年在《科学》杂志上公布了3个低成本的完整人类基因组序列。   就此,英国纳米孔公司总裁发表评论说,这一技术预示了基因测序领域的跳跃变化,或许今后不超过1000美元就可以完成一个基因组测序。   中科院基因组研究所副所长于军告诉《科学时报》记者,基于现在的经验曲线,即使目前广泛运用的第二代测序技术,也可能在一两年内实现&ldquo 千美元基因组&rdquo 的设想 但是对于&ldquo 百美元基因组&rdquo 的设想可能还有一段路要走,急需革命性技术的出现。   然而,我们已然看到了希望。2010年4月6日,日本大阪大学产业科学研究所的川合知二和谷口正辉宣布,新一代DNA测序技术的可行性首次通过验证。   这篇发表在《自然&mdash 纳米技术》上的文章显示,研究者通过电测方法,利用只有1纳米的超短距离电极,成功地测量出构成DNA的1个核酸碱基分子中流动的电流,成功识别了核苷酸。   令人欣喜的是,科学家们并没有&ldquo 喜新厌旧&rdquo 。&ldquo 不同代的测序技术并不互相排斥,尤其是化学原理不同的基本技术,它们在具体应用方面存在功能上的互补性,将长期共存。&rdquo 于军强调。   在测序技术快速发展的2010年,中国科学家同样不甘落后。   据了解,中科院的基因组研究所及半导体所联合开发、具有部分自主知识产权的第二代测序仪预计在今年3月下线,这不但能打破国外测序仪公司的垄断,还将大大降低我国基因组测序的成本。   此外,中科院基因组研究所已和浪潮集团成立了联合实验室,将共同研发第三代基因测序仪,预计第一台样机于2013年问世。   毫无疑问,新一代的测序技术必将对人类的未来生活产生深远影响。   测序分析理念迎来突破   随着新一代测序技术的广泛使用,测序速度将越来越快,成本则大大降低。但是,测序产生的大量数据却会给后期的生物信息分析带来巨大压力。   &ldquo 我认为生物信息分析是在基因组测定过程中最关键的一项技术。&rdquo 华大基因研究院副院长王俊曾这样表示。   不过,就在2010年,基于基因组的生物信息学分析研究也取得了丰硕成果。   当年10月, 中科院基因组研究所、中科院上海生科院植物生理生态研究所等单位在《自然&mdash 遗传学》杂志发表文章。研究人员结合第二代测序技术和自主开发的基因型分析方法,构建了高密度的水稻单体型图谱,并对籼稻品种的14个重要农艺性状进行全基因组关联分析, 确定了这些农艺性状相关的候选基因位点。   同样来自《自然&mdash 遗传学》等杂志的文章还显示,伦敦帝国理工学院的研究人员也通过多次全基因组关联分析,发现了多个包括糖尿病、冠心病在内的与现代热点疾病相关的基因。   事实上,研究人员还表示,对两个毫不相干的人进行&ldquo 全基因组关联分析&rdquo 对比,或许能够得出许多有用的研究信息,但如果辅以家庭遗传关系,那么测序数据会更加准确。   《科学》杂志在2010年3月发表文章称,美国首次为一个四口之家进行了全基因组测序。由于有家庭遗传背景关联,研究人员更精确地锁定了与米勒综合征相关的4个基因。   &ldquo 家庭测序将成为今后基因研究和疾病治疗方面的一个新工具。&rdquo 于军表示。   随着研究的深入,一项世界最大的表观遗传学研究项目也已启动。据了解,华大基因研究院与伦敦国王学院TwinsUK团队将通力合作,对5000对双胞胎的基因组的化学修饰进行深入研究。   除了对测序结果分析方法及样本选择的拓展,2010年,研究人员还对测序理念和方式进行了全新尝试。   2010年5月,刊于《自然&mdash 遗传学》的一篇杂志文章称,科学家们使用基因组定向捕获工具&mdash &mdash 安捷伦的SOLiD,成功捕获了4个患病婴儿的外显子组并测序成功 而华盛顿大学医学院的研究人员也在《科学》上表示,他们利用外显子测序,找到了一种恶性眼疾的关键基因。   毫无疑问,这项备受各方关注、位列世界十大科学进展的技术将会越来越多地应用于更多疾病研究,用来寻找包括癌症在内的多重疾病的致病基因和易感基因。   于军评论说,与全基因组重测序相比,外显子组测序相对经济、高效。它只需针对外显子区域的DNA即可,覆盖度更深、准确性更高。   而公共数据库提供的大量外显子组数据,更是为科学家更好地解释研究结果提供了便利。   显而易见,在未来,基因组测序分析理念将随着测序技术的升级而不断变革。   各方眼中的基因组科学   正如上文所述,在已经过去的2010年里,全世界每个月几乎都有两到三个家族全基因组和外显子组测序被用于检测疾病的基因突变。   由此可以看出,基因组科学离人们的生活越来越近。英国医学研究临床科学中心的分子遗传学家Tim Aitman表示,基因组测序在未来的10年到20年内将更加普及。   在美国,尽管其食品与药品管理局严格控制私人基因组公司的产品,但随着基因组测序费用的不断降低,越来越多的医生开始利用全基因组或外显子组测序技术进行诊断。   基因组科学带给普通患者治愈疾病的希望,那么对科学研究又会有怎样深远的影响?   《自然》杂志对超过1000名生物学家的一项调查显示,几乎所有生物学家都在一定程度上受到人类基因组计划的影响。   绝大部分人认为自身的研究获益于人类基因组的测序, 其中46%的人认为影响巨大 同时,有接近1/3的人几乎天天都使用到基因组 甚至有69%的受访者表示,是人类基因组计划改变了他们的职业和研究方向。   &ldquo 对于像我这样的年轻研究者,没有基因组,很难想象将如何工作。&rdquo 一位受访者如此表示。   除了能够对生命科学领域的研究快速推进,各国政府都在期待基因组科学的进一步发展。   2008年初,一项被称为&ldquo 千人基因组&rdquo 的计划由来自英国桑格研究所、美国国立人类基因组研究所、中国华大基因研究院等多家机构共同启动。据称,科学家们将对全球至少2000个人类个体的基因组进行测序,从而生成一个庞大的、公开的人类基因变异目录,来寻找基因与人类疾病间的秘密关系。   在2010年,非洲也宣布加入基因组革命。同年,世界各国政府和组织纷纷推出了最新的基因组计划,其中就包括基因地理计划、英国10K计划等。此前,中国对人和水稻基因组研究计划的实施也引起世界瞩目。   &ldquo 近来中科院基因组研究所与沙特王国阿卜杜拉阿齐兹国王科技城合作开展的椰枣相关基因组研究计划,也标志着中国基因组科学在国际上的重要地位。&rdquo 于军非常自豪。   过去的一年,基因组科学的发展一日千里。人们有理由相信,在DNA测序技术飞速发展的引领下,中国和世界基因组科学将走向更加辉煌的未来。
  • 人类基因组研究进入规模化时代
    十年前,&ldquo 人类基因组计划&rdquo 绘制了首幅人类基因组草图,人类基因组研究收获了第一个完整的产品。直到去年,全世界这样的&ldquo 产品&rdquo 也不过十来个。但在28日《自然》杂志刊登的&ldquo 千人基因组计划&rdquo 研究报告中,一下子就使用了约180人的全基因组测序数据,基因组研究&ldquo 产品&rdquo 数量呈爆发性增长,这标志着人类基因组研究进入了规模化时代。   和其他产业一样,规模化首先要归功于技术的进步。&ldquo 人类基因组计划&rdquo 使用的是第一代DNA测序法,也称作&ldquo 自动化桑格测序法&rdquo ,其原理由两度获得诺贝尔化学奖的英国科学家桑格在上世纪70年代提出。在英国剑桥还成立了以他名字命名的桑格研究所。   桑格研究所的薛雅丽博士介绍说,现在普遍使用的已经是新一代DNA测序技术,如果对两代技术的特点进行比较,第一代技术可以说是&ldquo 线性的&rdquo ,仪器每次运行只能读取有限几个&ldquo 道&rdquo 上的测量数据 新一代技术则是&ldquo 平面的&rdquo ,仪器每次运行可以读取整个平面上成千上万个测量点的数据。这一技术的升级换代,犹如汽车生产用上了流水线,是一个划时代的进步。   其次,科学界的雄心是人类基因组研究进入规模化时代的重要动力。桑格研究所、中国深圳华大基因研究院、美国国立人类基因组研究所等机构于2008年联合启动了&ldquo 千人基因组计划&rdquo ,其目的是通过测量各大洲不同人群2500人的基因数据,绘制迄今最详尽、最有医学应用价值的人类基因多态性图谱。   &ldquo 千人基因组计划&rdquo 共同主席理查德· 德宾就此表示,最新成果不仅是获得了迄今最详尽的人类基因多态性图谱,还在于验证了更新的测序方法的可行性。如果说新一代DNA测序技术是硬件能力的提升,那么这里验证的新测序方法更多属于&ldquo 软件&rdquo 层面,旨在更高效地利用新一代技术来大规模测量基因序列。   《自然》杂志的调查显示,由于技术和方法上的进步,以及科学家的测序热情,在本月底之前科学界至少将完成至少2700份基因组图谱,而到2011年年底前,这一数量会超过3万份。美国加利福尼亚大学基因专家拉斯穆斯· 尼尔森在《自然》上撰文表示:&ldquo 欢迎进入基因研究的新阶段!&rdquo 欧洲分子生物学实验室的专家保罗· 弗利切克认为,这项报告的意义已经超出了&ldquo 千人基因组计划&rdquo 本身,&ldquo 标志着人类基因组研究中一个新时代的来临&rdquo 。   在基因组研究规模化的时代,对个人基因组的分析将更快,在不同种族间进行基因组对比也不再只是梦想。科学家还可以针对某种致病基因,进行大规模的人口筛查。随着基因组测序这种&ldquo 产品&rdquo 像汽车一样批量下线,生物医学研究领域将发生深远的变化。
  • 华大基因加盟“万种脊椎动物基因组计划”
    深圳华大基因研究院与&ldquo 万种脊椎动物基因组计划&rdquo 联盟(G10KCOS)的科学家联合宣布启动万种脊椎动物基因组一期计划。该计划将依托华大基因先进的新一代测序技术平台、前沿的信息分析和数据处理能力,在未来两年内完成对101种脊椎动物的全基因组测序,解析其遗传密码。   &ldquo 万种脊椎动物基因组计划&rdquo 拟绘制万种脊椎动物基因组图谱,建立哺乳类、鸟类、爬行类、两栖类和鱼类等10000种脊椎动物的遗传信息数据库,研究生物多样性和动物进化的机制,为生命科学和全球动物保护提供前所未有的基础资源。该计划现有来自全球的43个研究机构和68位科学家参与其中。   据介绍,全球已公布的正在测序的脊椎动物物种已达120种。华大基因与G10KCOS的各物种的研究委员会(哺乳类、鸟类、爬行类、两栖类和鱼类)选择并启动了101种新物种的测序工作。筛选这些物种所依据的重要因素包括物种的特殊进化地位及其系统发育的多样性、是否具有与人类有密切相关的生物学特性、该物种研究团队的综合实力和是否可以得到高质量样品等。华大基因将采用新一代高通量测序技术对这101种脊椎动物进行测序,并构建不同物种间的系统进化树。   华大基因与G10KCOS将共同致力于构建高质量的基因组图谱,提供便于数据浏览的信息平台并促进与基因组学相关各物种的研究。完成对全球221种脊椎动物的全基因组测序将成为向破译1万种脊椎动物基因组宏伟目标迈出的第一步,该项目列表中的物种也将随着收集到的新物种材料及获得的资金支持而不断更新。科学家们将对计划列表中新物种的全基因组序列进行高效的组装、注释和分析,并于全基因组序列完成后的18个月内在线公布相关数据。华大基因与G10KCOS欢迎全球更多的科学家加入,启动更多有价值的新物种的全基因组测序工作,一起实现这个伟大的计划。
  • 个人基因组测序收费将大幅降价
    新华社伦敦2月9日电针对个人的基因组测序服务刚出现时,测序费用高达上百万美元,普通人望尘莫及。不过,美国一家公司计划从今年6月开始,推出低价个人基因组测序业务,顾客只需支付5000美元,就可向这家公司预约基因组测序服务。   据英国《新科学家》杂志网站报道,这家名为&ldquo 完全基因组&rdquo 的公司位于美国加利福尼亚州。这家公司称,其测序技术最关键的一点是将放大后的DNA(脱氧核糖核酸)片段固定在硅阵列上,从而实现快速、高效测序。   世界首份&ldquo 个人版&rdquo 基因组图谱数据的拥有者是DNA双螺旋结构的发现者之一詹姆斯&bull 沃森。2007年,美国贝勒医学院和&ldquo 454生命科学公司&rdquo 共同完成了沃森个人基因组的测序工作,并将图谱数据免费赠予沃森,当时这一测序的费用总计约100万美元。沃森当时在接受媒体采访时预测说,将来一旦个人基因组测序的费用&ldquo 降到一辆雪佛兰汽车的价格&rdquo ,那么人类基因变异研究领域将迎来一场变革。   此后,几家生物公司相继利用更为快速、成本更低的测序技术推出了&ldquo 个人版&rdquo 基因组测序服务。例如,加州一家名为&ldquo 应用生物系统&rdquo 的公司去年就曾宣布,他们为一名尼日利亚男子测序了基因组,花费不到6万美元。   如今,&ldquo 完全基因组&rdquo 公司的报价甚至比许多二手汽车的价格还要低。2月5日,该公司在美国举行的一个基因组生物学会议上公布了他们完成的第一份个人基因组测序数据,并将相关数据刊登在公司网站上。据悉,他们的目标是2009年完成1000个客户的基因组测序,2010年完成2万个客户的测序。
  • 我国桑蚕大规模基因组重测序完成
    日前,由深圳华大基因研究院与西南大学合作的研究成果《40个基因组的重测序揭示了蚕的驯化事件及驯化相关基因》在国际学术期刊《科学》上发表,这是两家单位自2003年以来在家蚕基因组研究领域取得的又一项重要成果。   据悉,这项研究共获得40个家蚕突变品系和中国野桑蚕的全基因组序列,是多细胞真核生物大规模重测序研究的首次报道,共获得632.5亿对碱基序列,覆盖了99.8%的基因组区域 绘制完成了世界上第一张基因组水平上的蚕类单碱基遗传变异图谱,是世界上首次报道的昆虫基因组变异图 从全基因组水平上揭示了家蚕的起源进化 发现了驯化对家蚕生物学影响的基因组印记。   华大基因的专家表示,桑蚕大规模基因组重测序和遗传变异图谱构建的完成,有助于从全基因组范围研究驯化和人工选择对家蚕生物学的影响,阐释家蚕及野桑蚕之间生物学差异的遗传基础。更为重要的是,与野桑蚕相比,家蚕具有更优良的经济性状,本研究所发现的全基因组选择印记,特别是那些受到强烈选择的具体基因,对家蚕重要优势经济性状相关基因克隆及其形成机理的研究至关重要。   在不到两个月的时间里,研究团队即完成了该项目的全部实验和测序工作。海量数据产出之后,深圳华大基因研究院自主搭建的超算中心及自主开发的生物信息软件发挥了重要作用,利用超大规模计算能力,研究团队完成了庞大的数据处理,迅速完成了数据分析和成果发表。而本次研究的40个代表性的家蚕和中国野桑蚕品系全部来自于西南大学蚕学与基因组学重点实验室。   团队负责人表示,该计划后续所有的目标都将集中在&ldquo 发现基因、研究基因和利用基因&rdquo 上,利用转基因技术制作的新型蚕品种和相关产品将于近期进入人们的视野。
  • 首个完整无间隙人类基因组序列公布
    被誉为生命科学“登月计划”的人类基因组测序再次取得重大进展:国际科学团队端粒到端粒联盟(T2T)发表了第一个完整的、无间隙的人类基因组序列,首次揭示了高度相同的节段重复基因组区域及其在人类基因组中的变异。这是对标准人类参考基因组,即2013年发布的参考基因组序列(GRCh38)的“重大升级”。当地时间31日,《科学》杂志连发6篇论文报告这一成就。2001年2月12日,由6国科学家共同参与的国际人类基因组计划首次公布人类基因组图谱及初步分析结果;2003年4月15日,公布了人类基因组序列草图。然而由于技术限制,当初的人类基因组计划留下了大约8%的“空白”间隙。这部分很难被测序,由高度重复、复杂的DNA块组成,其中包含功能基因以及位于染色体中间和末端的着丝粒和端粒。新的无间隙版本被称为T2T-CHM13,由30.55亿个碱基对和19969个蛋白质编码基因组成。增加了近2亿个碱基对的新DNA序列,包括99个可能编码蛋白质的基因和其中近2000个需要进一步研究的候选基因。这些候选基因大多数是失活的,但其中115个仍然可能表达。团队还在人类基因组中发现了大约200万个额外的变异,其中622个出现在与医学相关的基因中。此外,新序列还纠正了GRCh38中的数千个结构错误。具体而言,新序列填补的空白包括人类5条染色体的整个短臂,并覆盖了基因组中一些最复杂的区域。其中包括在重要的染色体结构中及其周围发现的高度重复的DNA序列,如染色体末端的端粒和在细胞分裂过程中协调复制染色体分离的着丝粒。新序列还揭示了以前未被发现的节段重复,即在基因组中复制的长DNA片段,已知其在进化和疾病中发挥重要作用。新序列还在识别和解释遗传变异方面具有重要改进,并揭示了关于着丝粒周围区域的前所未见的细节。这一区域内的变异性可能为人类祖先如何进化提供新证据。研究人员称,这一完整的、无间隙的序列对于了解人类基因组变异的全谱和了解某些疾病的遗传贡献至关重要。研究人员表示,下一阶段的研究将对不同人的基因组进行测序,以充分掌握人类基因的多样性、作用以及我们与近亲、其它灵长类动物的关系。【总编辑圈点】基因组的某些区域,其实是一遍又一遍的重复,这些重复区域包括细胞分裂中一些极其关键的部分,也包括可能帮助物种适应的新基因。在过去,所有这些重复使得科学家无法以正确的顺序“组装碎片”——就像高难度的、几乎每一块都相同的拼图,而人们不知道其中哪一块该放在哪,就在基因组图谱上留下了巨大空白。现在的最新成果不再有任何隐藏或未知的部分,或者也可以说,一个全新的基因宝库正在全人类面前徐徐打开。
  • 药物基因组学致力于人类基因组与现代药物安全性和有效性
    根据美国疾病控制和预防中心(CDC)的数据,每年有130多万美国人因药物不良反应(ADR)而住院。每年有超过10万人死于药物不良反应(ADR),这使其超过肺病、糖尿病、艾滋病、意外和车祸成为第四大死因,并且已经成为CDC、NIH和制药公司开始通过药物基因组学来解决的一个关键性的患者安全问题。药物基因组学——一个专注于人类基因组与现代药物安全性和有效性之间相互作用的新科学研究领域,可以为所有患者营造更为公平的环境。药物基因组学致力于帮助医生选择最适合每位患者的药物和剂量。虽然目前的大多数研究都集中于针对诸如心血管疾病、阿尔茨海默病、癌症、艾滋病和哮喘等疾病的药物反应上,但对于患有神经精神疾病(如抑郁症、精神分裂症和躁郁症)的患者来说,也带来了曙光,这些患者即使在停药后也常常会受到药物严重的副作用影响。 据肯恩大学(Kean university)新泽西科学、技术与数学中心的副院长Mike Tocci博士介绍:“每个人都有一套独特的基因,因此疾病在每个个体身上的表现方式以及个体身体对特定药物治疗的反应都是不同的。” Part 1医学的未来Tocci是一位资深的分子生物学家、免疫学家,也是赛诺菲公司(Sanofi)基因组科学和生物制品的前负责人,在其职业生涯的大部分时间里都在从事药物发现和临床前开发方面的工作,他认为药物基因组学是“个性化医学”的一个主要组成部分。“我们正在研究药物在个体体内代谢和实现疗效的方式,以及通过基因了解药物的疗效是如何因患者个体或患者群体的不良反应而受到限制。医生和药物研究人员正在快速了解患者对某些化合物的反应,以便更好地治疗疾病。”“我们没有针对所有类型癌细胞的生物标记物,也还没有很好地了解哪些类型的细胞对不同类型的药物有反应,但我们正在更多地研究不同类型的细胞在人体中的功能,因此最终我们将更好地了解我们的基因组如何影响特定药物的作用,”Tocci博士解释道。 与这项研究相关的范围和成本引出了一个合理的问题,即无论从短期还是长期来看,谁将从这种方法中受益最多。接受癌症治疗的患者是一个主要的受益群体,但自身免疫性疾病(包括糖尿病和心血管疾病)患者也已有一定的受益。随着对如何使用更有效的药物更好地治疗患者和降低不良反应的风险有更深刻的理解,医生也将是一个主要的受益群体。 虽然在早期阶段患者的治疗费用可能很高,但随着时间的推移,药物基因组学将通过增加生物标记物、基因表达谱分析和细胞图谱研究来降低成本,从而彰显在医疗保健和药物开发方面的益处。假以时日,药物的疗效和安全性都将得到改善,到时候患者的治疗费用也就降低了。 消费者已经从美国食品药品监督管理局(FDA)批准的关于药物安全性的药物基因组学研究中受益。已有超过200种药物被标记有新的基因组生物标记物信息,这些信息还描述了药物使用和临床反应的差异性、不良反应的风险、特定基因型的个体化剂量、药物作用的机制和试验设计的特征。这项新的研究已被纳入临床试验,并对参与化合物开发的公司产生了影响。药物基因组学严重依赖分子生物学,且涉及许多过程,包括PCR、蛋白质鉴定(蛋白质印迹法、ELISA)、确定基因表达、基因和蛋白质图谱分析技术、细胞分选方法、细胞分离技术(离心)、细胞成像方法,以及在人和动物模型中分析和描绘疾病组织中细胞的能力。Part 2前进的障碍 虽然几乎所有关于药物基因组学的消息都令人鼓舞,但仍有一些因素阻碍着该领域的发展。在动物模型中进行的试验并不总是能够预测人类的反应,获得足够数量的患者样本,以及对患者隐私有关的社会和伦理考量可能会限制某些群体的参与。与药物基因组学研究相关的风险和成本是两个很重要的因素,它们会限制哪些人可以进行研究或负担得起实施此类治疗的费用。 “药物基因组学的长期效益将是巨大的。未来的工作将能为患者提供更有效和更安全的药物进行个性化治疗,有望通过限制副作用和不良反应来延长寿命、或改善生活质量。我们最关心的是确保我们从伦理的角度推进科学的发展,并保证所有人都能从中受益并负担得起,”Tocci博士说道。Tocci博士担任肯恩大学新泽西科学、技术和数学中心的研究副院长,协助监督STEM学位教育,在这些学位教育过程中,他们采用多学科方法教授科学,将生物、化学、物理、数学和计算机科学整合入课程。STEM项目为学生提供通过在实验室体验科学而不是仅仅通过教科书来学习解决问题的机会。STEM学生可以与教职员工一起研究我们不知道答案的问题。目前的研究包括对癌症生物学的研究,以更好地了解生物标记物;对药物化学的研究,以了解如何阻止癌细胞转移;以及对基因组学的研究,以了解药物如何与基因产物相互作用。 全球视角,行业分析,处处是机遇! 您可联系奥豪斯 400-891-5989,我们竭诚为您服务!▼
  • 李瑞强:我和基因组有个约会
    北京市海淀区金码大厦的21层是一个与生命有关的"魔法现场",在这个2500多平方米的空间里,"生命魔法师"和他的200余名"魔法学徒"操弄着一系列神奇的"魔法器件",探寻着玄妙的生命奥秘。   "魔法器件"各司其职:Agilent2100用于文库的检验和RNA质检,Qubit用于DNA质检,脉冲场电泳仪用于大片段文库构建检测DNA片段的完整性&hellip &hellip 这个"魔法现场"就是北京诺禾致源生物信息科技有限公司,负责"魔法现场"的"生命魔法师"就是董事长李瑞强。   在大学期间攻读应用物理学的李瑞强,2002年毕业后就与生命科学结下了不解之缘。他先在全球最大的基因组研究中心--华大基因工作了8年,2011年开始担任北京大学生物动态光学成像中心、北大-清华生命科学联合中心、北京大学生命科学学院的研究员。在生物信息学与基因组学研究领域,李瑞强硕果颇丰,他先后参与主持了多项基因组研究计划的生物信息分析工作,从水稻基因组完成图、玉米核心种质测序,到大熊猫基因组、第一个中国人基因组图谱和国际千人基因组,凭借自己在业界的丰富经验,李瑞强成功入选"中关村高聚人才工程"和北京市第八批"海聚人才工程"。   "这是一个每天都会让人充满好奇心并且投入到忘我的行业,每天都在与生命打交道啊!"李瑞强就像一个拆解生命的魔法师,乐在其中地洞悉着生命的瞬息万变。   他在华大的8年,从生物信息研究部组长做到了主任,又变成副总裁,当人们都艳羡着他这份管理层美差的时候,他却毅然决定创业。"基因组学的发展非常迅速,并且越来越多地应用到其他领域。这样的背景下大有可为,错过了太可惜。"李瑞强坚持着自己的前瞻理念,不顾自己在华大基因的高层地位,于2011年3月在北京成立了诺禾致源生物信息科技有限公司。   公司成立初期,面临的局面比预想中还要困难。"刚成立的时候,公司团队只有5个人,每个人都身兼数职,吃住都在公司。大家每天都为办理公司的各项手续和联系客户奔波不停。"李瑞强回忆说。   经过不懈的努力,李瑞强和诺禾致源的团队终于争取到了公司的第一个大项目--藏猪基因组测序研究。"其实接下这个项目的时候,有些犹豫。因为公司刚刚成立,人手不够,实验平台也没有建立完全。在这样的条件下开展实验,会有一定的风险。但是,大家一起努力了那么久,好不容易有了项目,所有人都不想失去这个机会。"李瑞强说,"团队当时完全是' 背水一战' ,为了完成好这个项目,大家都准备全力以赴。"   为了保证项目质量,李瑞强决定找一个条件更好的地方开展实验。公司团队开始东奔西跑地寻找实验室。这其间,接洽的实验室有的条件合格,但协调起来时间不合适 有的协调顺利,但是实验条件又不过关。一番碰壁后,公司最终找到了中国农业科学院作物研究所的实验室来开展实验。   "由于占用别人的资源,我们只能利用周末的时间工作,经常加班加点,熬着通宵做实验。"这来之不易的第一个项目最终得到客户的高度认可。   这一研究利用高通量测序技术及生物信息分析策略,完成了一张精确完整的藏猪基因组序列图谱,从基因组水平揭示了藏猪特有的高原环境适应性的分子机理,通过重测序,首次对驯养猪和野生猪基因组进行了大规模的遗传变异分析,解析出四川盆地家猪在几千年的人工驯化过程中,基因组中重要经济性状相关基因的进化方向。不仅对保护我国地方优良猪种,促进生猪产业发展有重要的推动作用,更为研究人类高原缺氧性肺动脉高压、充血性心力衰竭、糖尿病和抗"光衰老"等提供了具有重要价值的线索。   李瑞强以这个项目的研究结果,发表了题为《比较基因组学鉴定藏猪和家猪的自然和人工选择》的论文,并最终刊登在了国际著名学术杂志《自然》的子刊《自然-遗传》上。   公司发展逐渐步入正轨,与其他研究机构的合作也日趋频繁。   李瑞强告诉记者,为了探讨地山雀的分类问题,诺禾致源的研究团队与中国科学院动物研究所的研究人员一起,对地山雀进行全基因组测序。研究人员利用Illumina深度测序,组装出了长度为1.08Gb的地山雀基因组序列图谱,并对其近缘物种大山雀、黄颊山雀及黑尾地鸦进行重测序,从全基因组水平明确了地山雀的分类问题。这一研究,填补了高原鸟类基因组及分子生物学研究的空白,不仅为人们了解高原鸟类这一特殊种群提供了重要的遗传学和生物学基础,也为地山雀这种独有物种的保护提供了科学依据。   在一次次的研究中,诺禾致源更加明确自己的研究方向,开始专注于开拓生物学、计算机科学和信息技术在动植物研究和人类健康领域的应用,完成了多个大型基因组项目研究。公司也被评为中关村国家自主创新示范区金种子企业、中关村高新技术企业等,获得了软件企业资质和北京市企事业专利试点单位资质。   "公司在中关村生命科学园区注册以后,先是获得了' 留学人员创办企业开办费' 的10万元资助,后来的科研项目又得到了' 留学人员科技活动项目择优资助' 的14万元补助。但其实当初创业的时候选择中关村,我更看重的是它的平台优势。正是在这里,公司开始越来越多地与外界接触,让大家逐渐认识了诺禾致源。"李瑞强说。   现在,李瑞强的目光又看到了更远的未来:"虽然,目前高通量测序技术还大都用于科研领域,但测序技术的飞速发展和成本的进一步降低,会大大推动个体化医学和个人基因组时代的到来。到那时,基因组学技术在人类健康领域的应用将深刻改变现有的临床诊断和医疗健康模式乃至人们的生活方式。"
  • 国际千人基因组计划完成三个先导项目
    6月21日,由中国深圳华大基因研究院、英国桑格研究所和美国国立人类基因组研究所等共同发起并主导的&ldquo 国际千人基因组计划&rdquo 协作组对外宣布:该计划第一阶段的3个先导项目已圆满完成,全部数据已存储于该计划所设立的公共数据库,公众可免费获取和浏览第一阶段产生的全部数据。   该数据库最终将包含来自全球27个族群的2500个人的全部基因组信息。目前产生的数据量已达到50TB(5万GB),包含8万亿个DNA碱基对。这一数据资源是一个开放的公共资源,为各种疾病的关联分析提供详细的基础数据 为解释人类重大疾病发病机理、开展个性化预测、预防和治疗打下基础。此外,该项目还加深了人们对人类群体遗传学的理解,促进人类进化史的研究。   目前已完成的3个先导项目是为了验证多种测序方法对于东亚、欧洲和非洲人群中遗传多态性频率不低于1%的鉴别能力,这将大大高于之前完成的国际单倍体型计划(HapMap计划)5%~10%的遗传多态性的检出能力。   第一个先导项目运用多种下一代高通量测序技术平台,完成了两个核心家庭共6人的高覆盖度全基因组测序,每个基因组的测序深度在20~60倍。通过此项目,可以评价多种主要测序方法的优缺点,为&ldquo 国际千人基因组计划&rdquo 的后续项目扫清技术障碍。   第二个先导项目完成了179人的低覆盖度全基因组测序,平均测序深度在3倍。数据表明,大样本低覆盖度测序在降低成本的同时,仍然能有效识别人群中的基因多样性。   第三个先导项目通过对700人的1000个基因外显子的测序,获得了占人类基因组全部序列2%的蛋白质编码基因名录。前所未有的大样本量有助于研究人群罕见变异的表达图谱。   第一阶段3个先导项目的完成具有重大应用价值。科学家可在下列方面大有可为:在更大的人群范围内定位人群突变基因 检测导致人类遗传疾病的相关基因 鉴定特定遗传病人群中含有的罕见致病基因。   &ldquo 国际千人基因组计划&rdquo 自2008年启动,旨在绘制迄今为止最详尽、最有医学应用价值的人类基因组遗传多态性图谱。深圳华大基因研究院作为发起单位之一,不仅承担了400个黄种人全基因组样本的测序和分析工作,而且还帮助完成了非洲人群的全部测序和分析任务。该计划的中方协调人、深圳华大基因研究院副院长王俊说:&ldquo 我们将开放全部数据供科研机构使用,以更好地理解人类生老病死的秘密。我们正全力以赴与国际同仁紧密合作,解读导致癌症和糖尿病等疾病的基因密码。千人基因组计划为未来个体化医学时代的到来奠定了坚实的科学基础。&rdquo   美方协调人展望了此计划的美好前景:&ldquo 先导项目完成的意义重大,为下一阶段更大样本量的研究打下了坚实的技术基础。我们的最终目标是完成2500个人的全基因组数据,我非常希望如此海量的数据能更精确地定位已发现的遗传风险因子、挖掘出更多未知的致病遗传因子,为人类健康造福。&rdquo
  • 总结人类基因组计划的经验教训
    p   人类基因组测序,在今天看来是小菜一碟,但放在25年前,实在是一个大胆的计划。人类基因组计划(HGP)在1990年启动,并在13年的时间内完成了人类基因组测序的创举。近日,三位顶级科学家在《Nature》杂志上撰文,谈论了人类基因组计划的经验和教训。 /p p   这三位科学家分别是:Eric Green,美国国家人类基因组研究所的所长 James Watson,冷泉港实验室的名誉主席 以及Francis Collins,美国国立卫生研究院的院长。想当年,这三个机构联合国际上多个机构开展了人类基因组计划。他们在文中总结了HGP的六个经验教训。 /p p   首先,这种工作鼓励研究人员去接受伙伴关系,而打破了研究人员单独工作的常态。HGP汇集了来自不同国家、不同学科的2000多名研究人员。Green、Watson和Collins指出,成功来源于强大的领导、对任务重要性的认知,以及研究人员愿意放弃个人成就而实现集体利益。 /p p   人类基因组计划也最大限度地提高了数据共享。在大量的基因组图谱和序列数据生成之后,势必要迅速建立政策,以缩短数据生成和发布之间的时间。这些努力最终促成了1996年百慕大原则的通过。不过,他们认为,广泛的数据共享也面临一些新的挑战,包括分析和移动大量数据的困难,以及如何保护参与者的隐私等。 /p p   与此相关,三位科学家认为HGP的一个缺陷在于对数据分析的计划不够。第一个人类基因组序列是零零碎碎地产生的,需要拼在一起。在项目后期,这种计算过程的需求就变得愈加明显。对于千人基因组计划和癌症基因组图谱等近期项目,他们吸取教训,尽早计划。 /p p   Green、Watson和Collins指出,HGP强调了技术开发。事实上,这个项目催化了众多关键基因组技术的开发,也带来了分子生物学、化学、物理学等学科的创新。多个改进相结合,实现了革命性的进步,如基于毛细管的DNA测序仪。从一开始就培育技术创新,这对今天的大型项目同样重要。 /p p   HGP计划也考虑了科学进步的社会影响。它的发起人认为,绘制和测序人类基因组所获得的信息可能对社会产生深远的影响。因此,HGP成为首个大型研究项目,包含了专门研究社会问题的部分,比如怎么保护人们的隐私以及防止歧视。 /p p   最后,Green、Watson和Collins表示,HGP的成功在于领导者开明的态度和定期的调整。他们认为,那些有着大胆目标的大型项目也能获得成功,只要整体目标是建立在明确的阶段性目标、质量指标和评估之上的。 /p p   在90年代初期,人们根据没有预料到,HGP的主要遗产是以一种全新的方式来开展科学研究。“人类基因组计划的故事带来了一些宝贵的提醒,其中一些进展无疑会触发研究方式的根本改变,”这三位科学家写道。 /p
  • 知名华人专家云集北京 共话基因组学研究热点
    7月16日,为期四天的2015基因组学前沿研讨会在北京亚奥国际酒店召开。本次会议由中国科学院北京基因组研究所主办,Genomics Proteomics & Bioinformatics (GPB)和北京路思达生物信息科技有限公司承办。共有大约100余位代表出席本次研讨会,其中多为华人学者,包括中科院生物物理所陈润生院士,美国哈佛大学谢晓亮院士、中科院北京基因所于军博士、新加坡国立基因组研究院阮一骏博士等。本次会议共设有三个主题:基因组高级结构、单细胞组学和RNA修饰,充分反映了当前基因组学领域的研究热点。 会议第一天的报告主要聚焦在了第一个主题,即基因组高级结构。虽然十几年前人们就获得了人类基因组序列的线性图谱,但却忽略了基因组的一个关键要素,即基因组的空间结构。基因组的空间结构一直以来被公认是基因表达的一个重要调控因素。远程基因组元件,如增强子和启动子,可通过染色质相互作用来调控与其相距数千个碱基对的目标,这充分说明了三维染色质结构的重要性。本次会议首日的报告也表明建立基因组的三维结构并研究其功能已成为遗传学当下的研究前沿之一。 同时,为了帮助解析基因组三维结构,相关技术也在不断发展。从最初的3C(染色质构象捕获)技术到更高通量的衍生技术4C、5C等。而2009年,两种新方法(即Hi-C图谱和ChIA-PET图谱技术)的出现,则有望帮助人们绘出全基因组范围的染色质相互作用图谱。本次会议上,也有科学家报告了如何对现有技术做进一步提升,以期获得更好的分辨率和更高的灵敏度。另外一项在会议首日报告中被提及的重要技术,就是最近几年开始成熟起来的冷冻电镜技术,它已开始在诸如染色质的三维重构研究中发挥重要的作用。
  • 华大基因参与全球最大微生物基因组研究项目
    华大基因3月22日宣布将参与全球最大微生物基因组研究项目EarthMicrobiomeProject(简称&ldquo EMP&rdquo ),将负责EMP亚洲地区所有样本的收集和鉴定,并对整个项目提供DNA提取、扩增、建库、宏基因组测序,以及研发生物信息学分析流程所需的计算资源。   EMP将对来自全球的20万个样本进行环境DNA测序或者宏基因组测序,从而建立一个全球性的基因图谱,旨在全方位、系统性地研究全球范围内的微生物群落的功能及进化多样性,以便更好地造福社会及人类。参与该项目的主要单位有华大基因(BGI)、阿拉贡国立实验室、芝加哥大学、科罗拉多大学、劳伦斯· 伯克利国立实验室和美国基因能源联合研究所。   据介绍,与以往的微生物研究有所不同,该项目的研究对象不仅集中于海洋和人体环境中微生物群落,还包括土壤、空气、淡水生态系统等整个地球表面的绝大多数的微生物群落。   华大基因理事长、中国科学院院士杨焕明表示,&ldquo 我们非常荣幸能够作为主要参与者参加如此重要的研究项目。微生物对地球上所有的生命具有至关重要的作用,而我们对微生物的复杂性和多样性认识不足,征服这个未知的领域是非常有必要的。华大基因拥有国际先进水平的测序平台和强大的生物信息学分析能力,我们相信可以为促进人类对微生物群落重要性的了解贡献出价值和力量&rdquo 。   据悉,今年6月13日至15日,华大基因将联合EMP联盟在深圳共同举办第一届EMP大会。作为本次大会的主办方,华大基因将与来自各地的学者分享微生物学、微生物基因组学及相关生态、健康、医学、工业、农业等各领域最新的学术成果及应用前景。
Instrument.com.cn Copyright©1999- 2023 ,All Rights Reserved版权所有,未经书面授权,页面内容不得以任何形式进行复制