TEL:18371456025

NG重磅|白菜泛基因组解析亚基因组演化

文章导读:

白菜Brassica rapa 是十字花科重要的蔬菜和油料作物,也是异源四倍体作物 油菜B. napus 和 芥菜B. juncea 的 A亚基因组供体,在作物驯化与多倍体演化研究中具有重要地位。尽管考古和遗传学证据表明其自新石器时代以来已广泛栽培并传播于欧亚大陆,但其起源中心、驯化历程及全球扩散路径仍存在较大争议。

中国农业科学院王晓武研究团队于2026年6月8日在国际著名期刊Nature Genetics上发表标题为“Genomic analysis of 3,330 accessions provides insights into the evolutionary history and self-incompatibility locus of the Brassica A genome”的研究性论文,通过构建芸薹属A基因组泛区块,系统揭示了白菜的起源扩散、A亚基因组演化分化及S位点“基因组保险箱”对自交不亲和系统稳定性的维持作用。

 

 

主要研究成果

1.基于3,330份材料的BrassicaA基因组变异分析

本研究整合了3330份携带A亚基因组的芸薹属材料(包括白菜B. rapa、油菜B. napus和芥菜B. juncea),构建了目前规模较大的A基因组变异图谱。通过与Chiifu v4参考基因组比对,共鉴定出约 468 万个 SNP 和 70 万个 InDel。进一步结合来自欧洲、中西亚、南亚和东亚的21个高质量白菜基因组组装,构建了A基因组的泛区块(pan-blocks)图谱。研究显示,单一参考基因组难以完整呈现A基因组的遗传组成,存在大量序列缺失。最终获得的泛区块资源长度达978.36 Mb,包含超过7万个基因,BUSCO评估达98.3%,展现出较高的完整性。

图1:A亚基因组泛区块构建方法

 

 

2.A基因组在欧亚大陆的起源与传播

变异图谱和系统发育分析表明,A亚基因组起源于中亚-西亚(Central and West Asia, CWA)地区,该区域的芜菁和油菜类型位于系统树基部,代表最古老的祖先谱系。在此基础上,研究重建了A亚基因组在欧亚大陆的扩散历史,并提出三条主要传播路线:

(1)欧洲传播路线(Route EUR):A亚基因组由中亚—西亚向西扩散至地中海及欧洲地区,逐渐形成欧洲芜菁、菜心等欧洲类群;

(2)南亚传播路线(Route SA):A亚基因组由中亚—西亚向南传播,形成以油菜和芥菜类型为代表的南亚类群;

(3)东亚传播路线(Route EA):A亚基因组经古代丝绸之路向东扩散至中国西北地区,并进一步分化形成华北、华南和日本三个区域谱系。

 

进一步分析表明,油菜的A亚基因组来源于与欧洲和中亚祖先群体相关的古老谱系,而非单一起源于欧洲油菜;芥菜的A亚基因组则表现出多重起源特征,可能经历了二倍体向四倍体的渐渗杂交过程。此外,白菜和芥菜的群体聚类均主要反映地理来源而非形态特征,表明其遗传分化主要受地理扩散历史驱动。

图2:白菜在欧亚大陆的起源与传播

图3:芸薹属A基因组材料的系统发育分析

 

 

3.东亚白菜倒位与A亚基因组起源差异

在白菜A03染色体末端发现一个古老倒位,形成HapECD04和HapCFv4两个单倍型。HapECD04主要分布于CWA、欧洲和南亚材料中,而东亚白菜和所有芥菜材料均携带HapCFv4。油菜的A亚基因组主要保留HapECD04,少量 HapCFv4可能通过二倍体-四倍体渐渗杂交引入。核苷酸多样性分析显示,白菜中 HapCFv4 群体多样性降低,而油菜HapECD04 群体存在形成四倍体时的遗传瓶颈;相比之下,白菜与芥菜的 HapCFv4群体则未出现类似瓶颈。系统发育树和倒位相关 SNP 分析进一步证实,HapECD04 和 HapCFv4 分别代表不同演化谱系。上述结果表明,东亚白菜古老倒位在纯化选择下塑造了两种A亚基因组的不同演化轨迹,这为理解芸薹属作物多倍体形成和遗传分化提供了关键证据。

图4:HapCFv4和HapECD04单倍型的特征分析

 

 

4.白菜的S位点的泛区块分析

S位点(S-locus)是十字花科植物自交不亲和(self-incompatibility, SI)系统的核心遗传区域,其中包含决定花粉识别与拒绝反应的关键基因SCR和SRK。而S单倍型(S-haplotype)是指由特定SCR、SRK及其周围连锁序列共同构成的遗传单元,不同S单倍型决定不同的自我识别特异性。

研究基于1,475份白菜重测序材料和36个高质量基因组系统分析了S位点的结构变异与进化特征。结果显示,不同S单倍型存在明显频率差异,但少数优势单倍型占据主要比例。泛区块分析表明,相同单倍型的S位点区块在不同遗传背景中高度一致,而不同单倍型间几乎无共线性。S位点区块中富集大量转座元件,其组成和排列模式具有明显的单倍型特异性,形成类似“条形码”的结构特征。这些TE介导的结构变异有效抑制了不同S单倍型之间的重组,使SCR和SRK始终作为完整遗传单元共同遗传。

图5:白菜中S位点的分析

 

 

文章小结

本研究基于21个白菜基因组构建A基因组泛区块,并整合3,330份芸薹属材料系统解析其遗传变异与演化历史。结果表明,白菜可能起源于中亚和西亚,并沿南亚、欧洲和东亚三条主要路线向外扩散。而A03染色体上的古老倒位有助于解释油菜和芥菜中A亚基因组的不同来源。此外,S位点中的转座元件形成单倍型特异的“条形码”结构,从而维持SCR-SRK识别系统的稳定性。本研究为理解芸薹属的起源演化、自交不亲和机制及遗传育种提供了重要基因组资源。