TEL:18371456025

GB精选 | 茄科群体着丝粒演化研究

茄科是重要的经济作物类群,包含番茄、马铃薯和辣椒等多种模式与作物植物,具有丰富的基因组资源和显著的进化多样性。其着丝粒在序列组成和结构上表现出显著差异,为研究基因组结构与演化提供了理想体系。随着长读长测序的发展,完整基因组组装成为可能,使系统解析茄科着丝粒特征及其进化动态成为现实。

华南农业大学廖毅教授团队和合作者一起于2026年3月11日在期刊Genome Biology上发表了标题为“Comparative centromere genomics of major crop species in the Solanaceae genomes”的研究性论文,本研究系统揭示了茄科作物着丝粒在结构、位置和序列组成上的高度动态性,其通过重定位、染色体倒位及LTR逆转座子驱动的序列变化不断演化,并在物种间及种内均表现出显著多样性,是基因组结构重塑与进化的重要热点区域。

 

 

一、茄科作物基因组组装

本研究以茄科作物着丝粒的比较分析为核心,整合了番茄、辣椒、茄子、非洲茄子、马铃薯和烟草等六种主要作物及其野生祖先的基因组资源。在已有高质量基因组基础上,进一步利用PacBio HiFi测序结合Hi-C技术,构建了非洲茄子、茄子和野生辣椒的高连续性基因组组装,组装完整性较高(BUSCO约97%-98%),且序列缺口极少。对新组装基因组进行了系统的基因及转座元件注释,结果与既往研究基本一致。这些近完整基因组为开展跨物种着丝粒比较及多尺度共线性分析提供了重要基础。此外,本研究还鉴定出两处染色体间易位事件,分别发生在茄子与非洲茄子(4号与7号染色体)以及辣椒与其野生祖先(1号与8号染色体)之间。

图1:用于着丝粒比较的茄科基因组组装

 

 

二、茄科着丝粒大小与基因组大小

本研究通过开发针对辣椒CENH3的特异性抗体并结合ChIP-seq,在六个茄科物种中系统鉴定了功能性着丝粒区域。结果显示,各物种所有染色体上均存在明确的CENH3富集峰,且跨物种抗体结果高度一致,表明CENH3在茄科中具有较高保守性。基于全基因组信号分布,精确定义了着丝粒边界并量化其大小,发现不同物种平均着丝粒长度约为1.4-3.0 Mb。功能区内唯一比对序列比例差异显著,说明物种间重复序列组成存在差异,同时也表明相当部分着丝粒由低拷贝序列构成。进一步比较分析表明,研究物种中各染色体着丝粒大小相对均一,而在富含卫星重复的马铃薯和烟草中则差异较大。综合八个茄科基因组数据发现,着丝粒大小与染色体长度及基因组大小均呈正相关关系,表明茄科着丝粒结构与基因组尺度协同演化的特征。

图2:基于CENH3 ChIP-seq鉴定茄科功能性着丝粒

 

 

三、茄科着丝粒位置的动态演化

本研究进一步系统解析茄科物种中着丝粒位置的进化动态,结果表明,着丝粒位置变化在植物基因组中普遍存在,主要通过着丝粒重定位和着丝粒周围倒位两种机制实现。远缘物种间着丝粒区域共线性严重破坏,难以追溯其演化轨迹;而在近缘物种中,着丝粒位置仍表现出明显差异。如茄子与非洲茄子间保守性较低;在番茄及其野生祖先中,多条染色体分别经历了重定位或倒位驱动的位移,辣椒中亦呈现类似模式。进一步归纳发现,着丝粒演化主要包括四种模式:位置保守伴随序列丢失、重定位、单次倒位驱动移动以及多次倒位累积效应。研究结果表明,茄科着丝粒位置在短期内快速演化,主要受倒位与重定位驱动。

图3:茄科作物间的着丝粒共线性分析

 

 

四、共线性断裂在CENH3结合区的富集

本研究系统分析了茄科基因组中共线性断裂的分布及其与着丝粒的关系。结果显示,共线性断裂在着丝粒及其邻近区域明显富集,表明这些区域是基因组结构变异的高发区域。进一步跨不同进化尺度比较发现,在分化较近的群体中,断裂主要集中于CENH3结合区域;随着进化距离增加,其分布逐渐扩展至更广泛的着丝粒周边,反映出断裂随时间不断累积并向外扩散的趋势;而在远缘物种中未观察到明显富集,可能与着丝粒区域序列快速演化导致比对困难有关。此外,番茄群体分析表明,共线性断裂的等位基因频率与全基因组水平相近,且未出现高频断裂的富集。结果表明,共线性断裂主要起源于着丝粒功能区域,并在进化过程中向周围扩展,其驱动因素为结构不稳定性。

图4:茄属(Solanum)基因组中共线性断裂的进化模式

 

 

五、茄科作物功能性着丝粒的快速序列演化

茄科作物功能性着丝粒主要由Ty3/Gypsy类LTR逆转座子构成,不同物种间含量差异显著,并呈现谱系特异性扩增。与马铃薯和烟草不同,多数茄科物种着丝粒缺乏卫星DNA,仅番茄第3号染色体具有典型卫星结构。LTR-RT活性在物种间存在差异:番茄和辣椒中完整元件较少,而茄子和非洲茄子中更多,且年轻LTR插入位置呈现不同分布模式,反映出不同演化路径。此外,着丝粒区域内基因主要位于CENH3缺失区,并普遍低表达。

图5:主要茄科作物功能性着丝粒区域的序列组成及比较分析

 

 

六、茄科作物种内着丝粒多样性

研究分析了科作物种内着丝粒的多样性,发现在辣椒中,多条染色体出现大规模插入/缺失及着丝粒周围倒位;在茄子中,整体结构较为保守,但部分染色体表现出向邻近区域的扩展;在番茄中,则检测到着丝粒重定位及区域扩张或收缩等变化。进一步对非洲茄子多个基因型的分析表明,大多数染色体较为稳定,但部分染色体存在明显的CENH3分布差异,并识别出多个着丝粒单倍型,其中3号染色体发生了约1 Mb的重定位。其他变异可能由插入缺失、多态性倒位或额外重定位事件引起。茄科作物在种内层面存在广泛的着丝粒结构和位置多态性,且这些变化在不同染色体之间相对独立,体现出较高的动态性与复杂性。

图6:仅基于七个非洲茄子个体揭示的广泛着丝粒单倍型多样性

 

 

结语

本研究基于多种茄科作物的高质量基因组及CENH3 ChIP-seq数据,系统解析了功能性着丝粒的结构、位置及序列演化特征。结果表明,着丝粒在物种间及种内均表现出显著动态性,其大小与基因组规模呈正相关,位置可通过重定位和染色体倒位频繁变化。同时,着丝粒区域是基因组结构断裂的热点,相关变异主要起源于CENH3结合区域。在序列层面,着丝粒以Ty3/Gypsy类LTR逆转座子为主,普遍缺乏卫星DNA,不同物种间组成差异明显。此外,着丝粒区域内基因多位于CENH3缺失区且表达受抑。总体来看,茄科着丝粒在结构、位置和序列层面均快速演化。