Nature子刊!多种测序技术联合 助力高质量豌豆参考基因组和泛基因组发布
2022年9月22日,中国农业科学院作物科学研究所联合中国科学院微生物所、山东省农业科学院农作物种质资源研究所、国际半干旱热带作物研究所和澳大利亚默多克大学等国内外多家单位在Nature Genetics上以长文的形式发表了题为Improved pea reference genome and pan-genome highlight genomic features and evolutionary characteristics的研究论文。研究团队完成了中国豌豆主栽品种“中豌6号”的基因组组装和解析,解决了长期以来悬而未决的豌豆基因组精细物理图谱组装难题,揭示了豌豆基因组结构和进化的独特特征,发掘了一批与粒型、株高和荚型等孟德尔性状和重要农艺性状相关的位点和基因,同时构建了栽培和野生豌豆泛基因组,展示了豌豆近缘野生种和地方品种作为未来豌豆育种改良资源的巨大潜力。高质量的参考基因组、注释和泛基因组对豌豆种质资源挖掘利用和育种改良的基础与应用研究具有重要参考价值和指导作用,同时也为其他豆科作物基因组和泛基因组研究提供了重要借鉴。自孟德尔发现遗传定律以来,豌豆作为遗传研究的“明星”植物,受到了学界和公众的广泛关注。豌豆 (Pisum sativum L., 2n=2x=14) 是一年生冷季食用豆类,属于豆科(Leguminosae)、蝶形花亚科(Papilionoideae)、野豌豆族(Viceae)、豌豆属(Pisum L.)。豌豆富含蛋白质、淀粉、纤维素和多种矿物质,是粮菜饲兼用的食用豆类作物,在世界范围内广泛种植。据FAO统计资料显示(http://www.fao.org/faostat/),世界豌豆的总产量和种植面积逐年增加,中国豌豆特别是鲜豌豆的总产量与种植面积也增长迅速。同时,豌豆的生物固氮能力可以减少氮肥使用,有效改善土壤结构,还可作为倒茬作物减少病虫害,促进农业和自然生态系统的可持续发展。作物种质资源是支撑农业发展创新和作物遗传改良的物质基础,目前国家作物种质库保存豌豆种质资源达到7000余份,蕴藏着丰富的遗传多样性,亟待深入挖掘和利用【1】。图1 中豌6号形态特征及豌豆种质资源多样性豌豆基因组大小约为4.28 Gb,远大于大豆(4倍)、鹰嘴豆(6倍)、普通菜豆(7倍)、绿豆和小豆(8倍)等其他豆科作物基因组,其基因组中有超过80%的重复序列。由于豌豆基因组的复杂性,直到2019年,国际上才公布了第一版以二代测序技术(Next Generation Sequencing, NGS)为主的豌豆参考基因组,为豆科植物基因组进化提供了新的见解【2】。然而,由于NGS技术的短板,这一版基因组组装得到的218,010个contigs的 N50 值仅为37.9 Kb,组装结果碎片化严重,尤其是在复杂的重复区域,与高质量参考基因组的标准相去甚远【2】。此外,研究表明,与国外豌豆种质资源相比,中国豌豆具有独特的遗传背景和丰富的遗传变异【3】。由于缺乏豌豆高质量基因组和精细物理图谱,严重滞后了豌豆重要农艺性状的遗传解析和种质资源挖掘利用进展,尤其阻碍了对国内外不同豌豆种质资源的综合利用。为了解决上述科学难题,研究团队利用中国豌豆主栽品种“中豌6号(ZW6)”,以PacBio 单分子实时 (SMRT) 测序为基础,结合 10x 长片段测序、Bionano 光学图谱和染色质三维构象捕获 (Hi-C),以及 Illumina NGS 技术,联合优化多种组装策略,完成了迄今为止最高质量的豌豆基因组精细图谱和基因注释(图2)。该基因组组装大小约为3.8 Gb,序列对总共7条染色体的定位率达到97.96%,组装的contig水平N50达到了8.98Mb。通过遗传图谱一致性评估、BUSCO分析、Merqury分析以及LAI分析在内的综合基因组组装评估方法,均表明该组装在连续性、准确性和完整性方面表现优异。此外,该组装共注释出47,526个编码基因,并且在基因完整性、调控区完整性、转座子组装完整性和注释完整性方面均得到了明显改善。豌豆基因组高质量精细物理图谱的获得,拓宽了我们对豌豆巨大基因组背后遗传学的了解,为豌豆重要农艺性状的遗传解析和种质资源的挖掘利用提供了宝贵基因组资源。图2. 豌豆基因组的重要特征。豌豆大约在10,000 年前被驯化,被认为是最早驯化的豆类作物之一。然而,尽管它在推进植物遗传学方面发挥了关键作用,但豌豆属内的物种划分长期存在争议,其驯化过程仍不清楚【4】。研究团队基于118个栽培和野生豌豆的全基因组重测序数据,不仅揭示了栽培和野生豌豆SNP、InDel和SV等不同变异类型的基因组多态性特征,同时基于SNP和SV多态性变异信息的群体遗传结构和系统发育分析,阐明了栽培和野生豌豆的群体遗传结构,支持豌豆属内包含3个物种P. fulvum、P. sativum 和 P. abyssinicum的结论。同时在 P. sativum中鉴定出了三个遗传分组,其中 P. sativum II (PSII) 和 P. sativum III (PSIII) 主要对应于代表亚洲和欧洲不同地理区域栽培豌豆的两个遗传分组,可能与豌豆驯化后的传播途径有关(图3)。以上结果解决了长期以来关于豌豆属物种划分的争议,为豌豆起源驯化提供了新的基因组学证据,也为豌豆种质资源的综合开发利用提供了科学依据。图3 基于SNP (a, b, e)和SV (c, d, f)的118份栽培和野生豌豆的群体遗传结构。孟德尔通过研究豌豆的七个性状发现了遗传规律,开创了遗传学研究的先河。在过去的几十年中,孟德尔研究的四个性状包括粒型(R/r)、株高(Le/le)、子叶颜色(I/i)以及种皮和花色(A/ a)的四个基因位点已经被克隆并进行了功能分析;而其他三个孟德尔性状,果荚颜色 (GP/gp)、荚型 (V/v) 和花的位置 (Fa/fa)相关的基因位点尚未解析【5】。为了探索豌豆重要农艺性状的遗传基础,研究团队利用GBS测序对WJ×ZW6杂交构建的300个F2群体中的12个农艺性状进行了QTL分析(图4),鉴定出了25 个与12个农艺性状相关的QTLs,其中有三个为孟德尔性状相关位点和基因,包括控制粒型(圆粒/皱粒,R/r)和株高(高/矮,Le/le)的孟德尔基因,以及与荚型(硬荚/软荚,V/v)相关的候选基因。图4 豌豆12个农艺性状QTL分析结果以及与孟德尔性状相关的3个QTL位点和基因【5】。越来越多的研究表明,单一的参考基因组不足以代表一个物种,特别是对于豌豆这类经历过长期驯化的物种,而泛基因组分析为作物种质资源变异解析和挖掘利用提供了有效手段。为了更深入地了解栽培和野生豌豆的多样性,研究团队构建了基于116个栽培和野生豌豆全基因组测序的泛基因组(图5),发现栽培和野生豌豆种质资源大部分泛基因组多样性主要存在于不同物种和遗传分组之间,并且以特有基因组序列的形式存在。对豌豆泛基因的存在/缺失变异模式(PAV)分析发现,随着新基因组数目的增加,核心基因的数量减少,而泛基因的数量增加,并逐渐趋于饱和(图5a)。同时,在多个豌豆基因型中存在的核心基因在其他27 个植物基因组中也更保守(图5b),表明它们具备通用的核心功能。基于跨基因组同源基因系统发育分类方法(HOG),研究人员将116个泛基因组的基因聚类生成 112,776个泛基因簇,在不同物种之间显示出差异显著的PAV模式(图5c)。对不同泛基因分组中特有泛基因的 GO 分析显示出保守基因和可变基因之间的不同功能富集。值得注意的是,P. abyssinicum独特的泛基因在刺激和化学反应方面富集,而P. fulvum的泛基因在发育、生长、繁殖、细胞骨架等方面富集,进一步证实了豌豆野生近缘种和地方种质资源作为育种材料在未来提高豌豆品种抗性和产量方面的潜在价值。图5 116个代表性栽培和野生豌豆的泛基因组分析结果(包括 ZW6)。总之,研究人员克服了复杂基因组组装的多重障碍,成功绘制了中国豌豆基因组高质量精细物理图谱,还构建了栽培和野生豌豆泛基因组,揭示了豌豆基因组进化特征、群体遗传结构与重要性状的分子基础,为豌豆起源驯化、基因挖掘、种质创新和育种改良以及豆科植物比较基因组学研究提供了重要借鉴和宝贵资源。这项研究邀请了澳大利亚默多克大学Rajeev K Varshney教授共同开展国际合作研究,他认为这次研究成果为公众提供了高质量的豌豆参考基因组,产生的基因组资源不仅有助于豌豆的遗传基础研究,以应对气候变化带来的挑战,还将促进豌豆优异基因的挖掘和优良品种的开发。此外,宗绪晓课题组及其合作团队还建立了豌豆遗传转化体系,利用CRISPR/Cas9基因编辑体系成功实现对豌豆PDS基因的编辑【6】。恰逢孟德尔诞辰200周年,豌豆高质量基因组和泛基因组的发布,以及豌豆基因编辑技术体系的建立将为豌豆重要农艺性状的遗传解析和种质资源的挖掘利用提供有力的技术支撑。中国农业科学院作物科学研究所杨涛副研究员和刘荣助理研究员、中国科学院微生物研究所骆迎峰副研究员和胡松年研究员以及山东省农业科学院农作物种质资源研究所王栋助理研究员为论文的共同第一作者。中国农业科学院作物科学研究所宗绪晓研究员、中国科学院微生物所高胜寒特别研究助理、山东省农业科学院农作物种质资源研究所丁汉凤研究员、国际半干旱热带作物研究所和澳大利亚默多克大学Rajeev K Varshney教授为论文的共同通讯作者。中国科学院植物研究所葛颂研究员,西北农林科技大学徐全乐副教授、山东省农业科学院作物种质资源研究所李娜娜副研究员、云南省农业科学院何玉华研究员、青海大学刘玉皎研究员、江苏沿江地区农业科学研究所王学军研究员、四川省农业科学院项超副研究员以及中国农业科学院作物科学研究所研究生王晨瑜、李冠、黄宇宁、季一山、李孟伟,国际半干旱热带作物研究所Manish K Pandey和Rachit K Saxena博士,也参与了该项研究。辽宁省农业科学院李玲研究员,澳大利亚谷物种质库Bob Redden教授和美国农业部农业研究中心、华盛顿州立大学胡锦国教授对项目开展提供了重要帮助。豌豆基因组研究得到了科技部国家重点研发计划(2018YFD1000701/2018YFD1000700)、中国科学院青年创新促进会(2017140)、山东省农业品种改良项目(2019LZGC017)、中国农业农村部食用豆现代产业技术体系(CARS-08)、国家自然科学基金(31371695和31801428)、山东省农业科学院科技创新项目(CXGC2018E15)、作物种质资源保护(2130135)、山东省农科院科技创新项目产业团队农业科学(CXGC2016A02)、山东省现代农业产业技术体系粗粮创新团队(SDAIT-15-01)、中国农业科学院创新工程(ASTIP)和山东省农业科学院青年研究基金(2016YQN19)等项目的支持。