TEL:18327076163

NP重磅 | 滇重楼52.75Gb巨型基因组发表

华命生物目前已成功完成70+物种的T2T基因组组装,物种涵盖动物、植物、昆虫及同源和异源多倍体等疑难物种,已有多个合作项目在顶级期刊发表和接收,欢迎有需要的老师垂询。联系方式:18371456025。

基因组大小是陆地植物进化中的一个重要方面,因为它影响着许多生物过程。到目前为止,研究人员已经对植物系统发育树上大多数科的物种进行了测序,然而大多数植物基因组研究都集中在基因组较小的物种上。因此,需要对具有巨大基因组的物种进行更多研究,以阐明基因组扩展的机制。

2025年6月25日,西北工业大学的蔡晶教授及其科研团队在《Nature Plant》上发表了一篇名为“Two Melanthiaceae genomes with dramatic size difference provide insights into giant genome evolution and maintenance”的重要论文,首次组装了藜芦科的滇重楼Paris polyphylla var. yunnanensis及兴安藜芦Veratrum dahuricum的巨型基因组,其大小分别达到54.58 Gb及3.93 Gb。


一、两个藜芦科植物基因组的染色体水平组装

对滇重楼采用PacbioHiFi、PromethION和MGISEQ-2000平台的HiFi、ONT和Hi-C数据进行组装,最终得到大小为52.75Gb的基因组,组装的基因组重复序列占96.8%,主要由Ty3/Gypsy和Helitron转座子组成。大部分基因组(90.5%)已锚定到5条染色体上,其中最长的染色体为14.14Gb。在1,614个BUSCO基因中,97.77%的基因为完整,而Merqury的基础质量值(QV)为46.01,表明准确率超过99.99%。兴安藜芦的基因组约为3.55Gb,使用HiFi数据和Hi-C数据将其锚定至16条染色体。组装中重复序列占85.78%,其中Ty3/Gypsy转座子占39.74%。基因注释结果共识别出104,721个蛋白编码基因,且99.3%具有功能注释。

表1:基因组和注释基因的组装度量和完整性总结

 

二、滇重楼巨染色体的螺旋染色质结构

在滇重楼的基因组中,Hi-C数据揭示了一种独特的高级染色质螺旋结构。在Hi-C互动热图中,除了主对角线外,还观察到次对角线,显示出基因组不同区域之间的强烈相互作用。研究者认为,这种螺旋结构可能源自基因组中序列在三维空间中的紧密排列,特别是在染色体压缩时,螺旋结构形成多个平行对角线。与其他物种相比,滇重楼的次对角线间距较大,突显了其特有的染色体结构特征。

图1:滇重楼染色体和高级结构概述

 

三、滇重楼及兴安藜芦多倍体化历史的比较

研究进一步探讨了滇重楼和兴安藜芦的多倍体化历史,发现滇重楼的基因组未经历最近的多倍体化事件,而兴安藜芦则在其较小的基因组中发生了两次多倍体化。基因组协同性分析揭示,滇重楼和兴安藜芦与无油樟的基因组协同性存在显著差异,表明滇重楼经历了两个古老的全基因组重复事件,而兴安藜芦则经历了更多的全基因组重复(WGD)事件。

Ks分布分析进一步确认了两物种共同祖先中的一个WGD事件(M-φ),并显示兴安藜芦发生了两次后代多倍体化,而滇重楼未发生新的多倍体化。研究指出,滇重楼的基因组扩展可能并非由WGD引起,为物种间基因数量差异提供了解释。

图2:滇重楼和兴安藜芦之间的基因组同源及其对比WGD历史

 

四、重复序列对基因组扩增的贡献

研究探讨了转座子(TEs)对滇重楼基因组巨大扩展的贡献。滇重楼的基因组中约96.8%为重复序列,主要由LTRTy3/gypsy转座子组成,大多数TE插入发生在约4500万年前,表明古老的TE爆发在基因组扩展中发挥了主导作用。

相比之下,兴安藜芦的TE插入较为年轻,主要集中在过去500万年内。TE插入对基因结构产生了显著影响,尤其是增加了基因长度,导致基因长度呈双峰分布。研究发现,滇重楼的基因组扩展不仅受到古老TE爆发的推动,还包括了近期TE扩增的作用。此外,Helitron等特定类型的TE积累较快,进一步促进了基因组扩展,表明滇重楼的基因组扩展与TE积累的效率及DNA去除机制的低效性密切相关。

图3:两种藜芦科物种的不同转座元件(TE)插入史

 

五、伴随基因组扩增的遗传和表观遗传变化

滇重楼和兴安藜芦在DNA甲基化方面存在显著差异。滇重楼的CpG位点上的5mC比例(94.24%)高于兴安藜芦(90.72%),且两者均高于玉米的86%。滇重楼表现出较高的总体甲基化水平,尤其是在高甲基化(71%-99%)的位点上更为突出。相比之下,兴安藜芦则具有更多完全甲基化的位点(100%甲基化),这一现象可能与其转座子的低分化及RNA指导的DNA甲基化途径的严格调控有关。与玉米相比,滇重楼的转座子比例较高,而兴安藜芦的转座子比例与玉米相似,且序列相似度较低。此外,滇重楼基因组中较低的GC含量可能是转座子甲基化过程中C到T突变的结果。

此外,滇重楼的组蛋白基因,特别是H2A.W亚家族,经历了显著的扩张,共鉴定出19个H2A.W基因,显著超过兴安藜芦的9个。H2A.W基因的扩展源自多次基因复制,尤其是不均衡的串联重复。值得注意的是,这些基因具有独特的C端基序KSPKKA,该基序在异染色质的形成中起着关键作用,有效地维持转座子沉默。进一步分析表明,滇重楼中的H2A.W基因在核心组蛋白结构域的环区存在物种特异性变异,这可能增强H2A二聚体的稳定性,从而促进染色质结构的稳固。此外,在基因组扩展过程中,DNA修复通路基因和高CpG甲基化水平的变化可能有助于基因组稳定性维持。综上所述,这些遗传和表观遗传变化共同作用,可能是滇重楼在应对基因组扩展和转座子压力时的进化适应。

图4:滇重楼基因组中对抗转座元件(TE)活性的基因组特征

 

结语

这项研究探讨了藜芦科(Melanthiaceae)中两种植物,滇重楼和兴安藜芦的基因组演化,重点分析了基因组大小扩展的机制。通过高质量的基因组组装,研究发现滇重楼拥有着罕见的巨型染色体,其基因组扩展主要源于转座子插入和基因家族扩展,尤其是在DNA修复和H2A.W组蛋白基因家族方面。同时,研究揭示了转座子在基因组扩展中的核心作用,并指出全基因组复制(WGD)对基因组大小的贡献较小。通过Hi-C数据,还发现了滇重楼的染色体具有高阶螺旋结构,有助于保持基因组稳定性。此外,DNA甲基化水平较高也有助于转座子的沉默和基因组稳定。该研究为理解植物巨型基因组的演化提供了重要视角,并为其他类似植物的基因组学研究提供了有价值的参考。

 

 

华命生物产品服务一览

 

华命生物目前已开通微信公众号、抖音、知乎、B站、小红书等线上平台,欢迎感兴趣的老师扫码关注了解更多内容!