着丝粒是染色体上非常复杂但又具有特殊功能的区域,尽管功能保守,但相比较基因组其他区域,着丝粒有着更快的进化速率,在不同物种中表现出显著的多样性。由于着丝粒及其周围存在大量重复序列,完整的着丝粒组装一直存在巨大挑战。本氏烟草的基因组于2012年首次测序,近年来虽有多次更新,但基因组仍然存在多个gap,其着丝粒和端粒序列也不完整。
近日,顶级学术期刊《Nature Plants》发表了北京大学现代农业研究院郭立团队题为“The complete genome assembly of Nicotiana benthamiana reveals genetic and epigenetic landscape of centromeres”的研究论文,团队利用最新的长读长测序,首次完成了异源四倍体模式植物本氏烟草的完整T2T基因组组装,标志着多倍体基因组T2T组装的重大进展,同时提供了关于着丝粒遗传和表观遗传修饰的深入见解,极大地丰富了对多倍体着丝粒多样性和进化的认识。
一、T2T基因组组装与评估
作者结合116.7 × PacBio HiFi测序、47.9 × ONT ultra-long测序、Hi-C测序和Bionano光学图谱技术,完成了本氏烟草的完整T2T基因组(NB.T2T)组装。总大小为2,849.3Mb,contig N50为146.41 Mb。
NB.T2T相较于之前的组装版本有显著改进,是首个多倍体烟草植物的完整基因组。与最近发布的NB.PCP和广泛使用的NB.261版本相比,分别新增了50.47 Mb和144.42 Mb的染色体序列。
作者采用了多种策略评估NB.T2T组装的准确性和完整性。使用Merqury评估了NB.T2T的质量值(QV)为69.65,完整性值为99.14%,LAI为17.84,BUSCO评估达到了98.81%。最后,所有端粒均检测到“AAACCCT”,亚端粒区域也检测到181-bp卫星重复序列。这些验证表明NB.T2T是目前本氏烟草最高质量参考基因组。
图1:本氏烟草完整T2T基因组组装和注释
图2:NB.T2T组装质量评估
二、着丝粒结构和表观遗传解析
本研究通过CENH3的CHIP-seq数据定位在NB.T2T基因组中鉴定出19个着丝粒,长度介于0.30-5.04 Mb。染色体类型包含14个近端着丝粒、2个亚端着丝粒及3个亚中着丝粒。ONT/HiFi/Bionano多种数据验证证实了着丝粒结构的完整性。
根据重复元件组成,本氏烟草着丝粒可以分成三类:卫星型(CEN04/08/16/17)具有高GC含量与卫星串联重复序列;Gypsy型(CEN06/07/11-13/15/19)以Ty3/Gypsy转座子为主;而NUMTs型(CEN02)富集NUMT序列。而CEN01/05/10/14呈现双CENH3峰,分别富集卫星与转座元件;CEN03/09/18则显示了卫星型和Gypsy型着丝粒的混合模式。这种结构多样性显示本氏烟草着丝粒正处于快速进化阶段,为研究着丝粒演化机制提供重要模型。
茄科植物着丝粒以Ty3/Gypsy转座子为主,但本氏烟草兼具卫星型与Gypsy型特征。卫星重复序列与45S/5S rDNA同源,暗示其可能通过rDNA演化而来。
75个Gypsy亚家族嵌入卫星阵列,Galadriel(65%)在50-300万年间经历三次爆发性插入。卫星型与Gypsy型着丝粒分别富集CRM/Galadriel和Ogre/Tekay元件,驱动了四倍体分化。
另外发现线粒体DNA(NUMTs)在近着丝粒区域显著富集,且B亚基因组显著富含更多NUMTs,暗示B亚基因组可能为母本来源。CEN02中NUMTs直接承担CENH3着丝粒功能,揭示了mtDNA的插入可形成功能性着丝粒。这些结果表明,NUMTs在着丝粒结构的多样化和塑造中发挥了重要作用。
本氏烟草着丝粒区域的组蛋白主要包含H3K4me3和H3K9me2修饰,缺失H3K27me3,而H3K4me3在着丝粒卫星序列上富集。NUMTs和LTR反转录转座子未显示出明显的组蛋白修饰富集。组蛋白ChIP-seq分析表明,H3K4me3、H3K9me2和H3K27me3在着丝粒NUMTs上均无富集峰,表现出与着丝粒卫星序列不同的表观遗传模式。这些发现揭示了本氏烟草着丝粒的独特表观遗传调控机制。
图3:本氏烟草着丝粒遗传和表观遗传特征
图4:卫星序列驱动了本氏烟草新着丝粒形成
三、亚基因组和演化历史解析
本氏烟草亚基因组来源一直存在争议。作者使用多种研究方法,最终的研究结果支持A亚基因组与N. sylvestris聚类,而B亚基因组与N. glauca和N. attenuata为姐妹群。两个亚基因组与N. sylvestris和N. attenuata之间也显示了显著的共线性。
基于亚基因组分析结果及先前研究,作者总结了本氏烟草基因组演化历史。烟草属和茄属曾经历全基因组三倍化(WGT)事件,后于23–44百万年前分化。本氏烟草的两个亚基因组分型显示,其父系和母系祖先分别与N. sylvestris和N. attenuata近缘,对应Sylvestres分支和Noctiflorae/Petunioides分支。两分支分化时间约为6–10百万年前。5–6百万年前,一次杂交事件形成Suaveolentes组。随后,异源多倍体经历亚基因组间广泛重排,最终通过染色体数目减少、基因组缩小等着丝粒变化,形成现今本氏烟草。
图5:本氏烟草亚基因组溯源
图6:本氏烟草基因组演化历史
结语
作者利用最新的长读长测序技术,首次完成了异源四倍体模式植物本氏烟草的全基因组组装,分析揭示了本氏烟草的进化历史,并深入探索了着丝粒的遗传和表观遗传信息,完整的基因组组装和注释为将本氏烟草作为植物生物学和生物技术中的模式生物提供了宝贵的资源,将进一步推动其应用。
参考文献
Chen, W., Yan, M., Chen, S. et al. The complete genome assembly of Nicotiana benthamiana reveals the genetic and epigenetic landscape of centromeres. Nat. Plants 10, 1928–1943 (2024). https://doi.org/10.1038/s41477-024-01849-y
华命生物产品服务一览
华命生物目前已开通微信公众号、抖音、知乎、B站、小红书等线上平台,欢迎感兴趣的老师扫码关注了解更多内容!