TEL:18371456025

New Phy项目文章|沙棘单倍型基因组解码性染色体起源

在动植物中,性染色体曾多次由常染色体独立演化而来,其典型特征是重组抑制、基因组成分化以及染色体形态差异的逐步形成。但在开花植物中,具有明显异形XY染色体的类群并不多见。沙棘属正是其中少数代表,为理解植物性染色体的起源与演化提供了重要材料。

兰州大学刘建全教授团队于2026年3月7日在期刊New Phytologist上发表标题为“Heteromorphic XY chromosomes with pericentromeric recombination suppression in Hippophae (Elaeagnaceae)”的研究性论文,基于高质量单倍型基因组,本研究揭示了沙棘属异形XY性染色体起源于近着丝粒低重组区,并经历分层扩展与Y染色体退化,同时在花组织中存在剂量补偿机制,从而阐明其性染色体的形成与演化规律。华命生物参与了本研究的基因组测序与组装分析工作。

 

 

一、两种沙棘属物种的单倍型基因组组装

本研究结合 PacBio HiFi测序(约43.5 Gb 和 31.9 Gb,覆盖度约36.3×和22.8×)与 Hi-C 数据(约157.9 Gb 和 124.9 Gb,覆盖度约131.6×和89.2×),对两种沙棘属植物欧洲沙棘H. rhamnoides 和西藏沙棘 H. tibetana 的雄株进行了单倍型高质量基因组组装,共获得4套高质量基因组。组装基因组大小约为 1.03-1.27 Gb,每个单倍型均成功锚定至 12条伪染色体,组装 N50达71.1-110.9 Mb,BUSCO完整度超过 97%,并检测到 16-21个端粒位点,表明基因组组装具有较高的连续性、完整性和准确性。进一步整合多组织转录组数据完成基因预测与功能注释,共鉴定约4万余个蛋白编码基因,且大部分基因获得功能注释。重复序列分析显示,两种沙棘基因组中重复序列占比较高(约58.6%–62.8%),其中以 LTR逆转座子为主。此外,研究基于重复序列分布特征预测了着丝粒位置。进化分析方面,基于分子钟、共线性及Ks分布推断,沙棘属与翅果油树 Elaeagnus mollis 约在 2280万年前分化,而欧洲沙棘与西藏沙棘约在 450万年前分化,并且两者至少共享两次近期的全基因组加倍事件。

图1:两种沙棘基因组特征与演化

 

 

、欧洲沙棘和西藏沙棘的1号染色体上的性连锁区域

本研究通过比较两种沙棘属植物的单倍型基因组,发现其1号染色体是性连锁区域(SLR)的所在位置,并且在两个物种中均表现出最显著的单倍型长度差异和复杂的倒位重排。结合群体重测序、GWAS、测序深度分析及性别特异分子标记,作者进一步确认了欧洲沙棘和西藏沙棘的X连锁区与Y连锁区范围。其中,较短的B单倍型对应Y染色体,较长的A单倍型对应X染色体,说明两个物种均具有明显分化的XY性染色体系统。综合比较结果表明,两种沙棘的性连锁区域均位于1号染色体中央,并集中在着丝粒及近着丝粒区域,说明它们可能具有共同起源,也说明低重组、易发生结构重排的着丝粒附近区域,可能是沙棘性染色体演化和分化的关键位置。

图2:沙棘1号染色体性连锁区鉴定

 

 

三、胡颓子科染色体演化与性染色体起源

本研究通过重建胡颓子科Elaeagnaceae祖先核型,推断沙棘属现今核型由18条原始染色体经两次全基因组加倍和3次嵌套染色体融合形成,其中一次融合直接产生了沙棘的性染色体。插入染色体的着丝粒成为新的功能性着丝粒,并显著扩大了受体染色体的近着丝粒区域,为后续性连锁区域的形成提供了结构基础。随后,两种沙棘的SLR均经历了广泛重排,且Y连锁区重排程度高于X连锁区。与Y-LR相比,X-LR更大,主要源于特定LTR逆转座子的大量积累。两类SLR还共同表现出重复序列富集、基因密度降低和明显基因丢失,且在欧洲沙棘中Y-LR的基因退化更为显著。

图3:沙棘性染色体的起源与演化

 

 

四、性连锁区域的演化分层与基因组成

本研究通过同源性分析和Ks变点分析发现,两种沙棘的性连锁区域均包含两个演化层:较老的S1形成于约630-760万年前,早于两物种分化,且共享倒位事件;较新的S2形成于约190-250万年前,推测在物种分化过程中或之后进一步扩展。系统发育结果也支持这一模式:S1中基因更按X/Y连锁区聚类,而S2中基因更多按物种聚类。作者还发现,Y连锁区保守基因数量少于X连锁区,并发生更明显的基因丢失,且不少丢失基因仍保留残遗序列或假基因,表明沙棘Y染色体已出现一定程度退化。

图4:两种沙棘性连锁区的基因组特征

 

 

五、欧洲沙棘中组织特异性的剂量补偿

本研究对欧洲沙棘不同组织中的性连锁基因表达进行了分析,发现大多数X、Y单倍型特异基因在各组织中并不表达,少数具有性别限制性表达的基因主要集中在Y连锁区。等位基因特异性表达分析表明,雄株中Y连锁等位基因在多数组织中相对X连锁等位基因显著下调,说明Y染色体已发生一定程度退化。进一步比较发现,X单倍型特异基因在根、茎、叶等营养组织中表现出明显的雌性偏高表达,符合XX与XY之间的剂量差异;而在花组织中,这种雌雄表达差异明显减弱,说明花器官中存在转录水平的剂量补偿。总体来看,沙棘的剂量补偿具有明显的组织特异性,主要发生在花组织中,并可能通过调节X连锁基因表达来缓解Y染色体退化带来的表达失衡。

图5:沙棘性连锁区基因表达与剂量补偿

 

 

结语

本研究组装了高质量单倍型基因组,并进一步解析沙棘属异形XY性染色体的起源与演化。结果表明,性连锁区域位于近着丝粒低重组区,经历了分层扩展,并伴随重复序列积累、基因丢失及Y染色体退化。研究还发现,沙棘在花组织中存在一定程度的剂量补偿。总体而言,该研究揭示了沙棘性染色体的形成与演化特征,并为理解植物性染色体在近着丝粒区域的演化提供了新的证据。