TEL:18371456025

NC重磅 | 苜蓿超级泛基因组解码多倍化适应性

多倍化(WGD)是植物进化的重要驱动力,广泛存在于被子植物中,促进了适应性演化。与二倍体相比,多倍体通常具备更强的适应性和更广的生态位,机制包括掩盖有害突变、提高适应效率和基因功能分化等。然而,适应优势与有害突变累积之间的权衡仍不清楚。现有研究多集中于异源多倍体,而同源多倍体则为揭示 WGD 对适应性直接影响提供了理想模型。

中国农业科学院杨青川研究团队于2025年12月15日在国际著名期刊Nature Communication上发表标题为“Medicago super-pangenome reveals adaptive advantages and evolutionary constraints in autotetraploid alfalfa”的研究性论文,构建了苜蓿的超级泛基因组,发现苜蓿基因组中存在显著的基因变异,并鉴定出富集于气候适应和应激响应的四拷贝核心基因。

 

 

 

一、苜蓿基因组的基因组组装与注释

基于PacBio、Oxford Nanopore与Hi-C测序技术,成功构建了两个苜蓿亚种的高质量基因组资源,包括同源四倍体苜蓿sativa和二倍体亚种caerulea。以中国高产耐盐苜蓿品种“中苜4号”为材料,共测得Hifi数据(109.84 Gb ,~137×)、(18.25 Gb ,~23×)ONT数据以及(285 Gb,~356×)Hi-C数据,构建了完整分型的参考基因组ZM4_V2.0,基因组总大小为3.13Gb,锚定至32条染色体,contigN50达5.45Mb。组装结果表现出极高的准确性与完整性,HiFi和Nanopore数据的比对率均超过99.9%,BUSCO分析显示基因组完整性达到99.5%,Merqury评估表明碱基质量和整体完整性处于领先水平。四个单倍型基因组大小介于751-809Mb之间,表现出高度的基因共线性,并与模式植物蒺藜苜蓿Medicagotruncatula显示出显著的共线性关系。基因注释共预测20.2万余个基因,其中92.4%获得功能注释。此外,还完成了二倍体caerulea亚种及M.lupulina、M.arabica的基因组注释。

 

 

二、苜蓿超泛基因组揭示的基因组进化与基因保守性

基于13个苜蓿属基因组(19个单倍型),作者构建了苜蓿图示超泛基因组Alfalfapan-V1.0,覆盖7个类群,总规模达7.70Gb,是单个苜蓿基因组的2.46倍。分析显示,苜蓿属基因组大小与转座元件含量高度相关,其中LTR中Gypsy和Copia占比约50%,是驱动基因组扩张与分化的关键因素。系统发育与共线性分析表明,蒺藜苜蓿A17中的染色体易位为材料特异事件,而非物种差异;四倍体苜蓿呈现多系起源特征,可能多次独立起源于遗传分化的二倍体caerulea祖先。超泛基因组共鉴定69,767个基因家族,核心基因主要分布于染色体末端,结构更为稳定。群体水平共检测到近50万个结构变异,清晰区分不同物种与单倍型,表明结构变异是解析苜蓿复杂进化历史的重要遗传标记。

图1:苜蓿属物种的超级泛基因组与进化基因组学

图2:13个苜蓿基因组的超级泛基因组景观

 

 

三、与苜蓿气候适应相关的核心基因保留

与其二倍体祖先相比,同源四倍体苜蓿具有更广的气候分布范围和生态位占据,表明多倍化在其气候适应中发挥了重要作用。在全基因组加倍后等位拷贝尚未发生显著分化的前提下,本研究系统鉴定了苜蓿基因的等位拷贝数变异,发现超过一半的基因可归为非冗余基因。进一步的基因保守性分析显示,具有四个等位拷贝的基因显著富集于核心基因集合,且 Ka/Ks 值最低,表明其在苜蓿属内高度保守;相反,单拷贝基因多分布于可缺失基因中,进化速率较高,可能参与对新环境压力的快速响应。基于等位拷贝数与进化保守性,本研究构建了六类基因分类框架,为后续适应性分析提供了可靠的基因组背景基线。

通过 LFMM 和 PBS 方法共鉴定出 2,429 个气候适应相关基因,其在六类基因中呈现显著不均分布,四拷贝核心基因表现出明显富集,凸显其在局地气候适应中的关键作用。进一步整合 124 种生物和非生物胁迫条件下的 RNA-seq 数据发现,尽管不同处理间差异表达基因数量变化较大,但四拷贝核心基因在差异表达基因及高表达基因中始终保持稳定的过度代表性。表达机制分析进一步表明,该类基因整体表达水平最高,且通常通过单一等位基因的偏向性高表达来维持较高的基因剂量。

图3:等位基因拷贝数变异的概念及基因群体的分类

图4:四倍体核心基因对气候适应的重要贡献

 

 

四、四拷贝核心基因的遗传负担与苜蓿进化

基于 GERP 评分的进化约束评估显示,苜蓿基因组中存在大量受约束位点,有害变异在基因区域中明显累积。进一步比较不同等位拷贝类型发现,随着拷贝数增加,单个基因携带的有害变异数量持续上升,其中四拷贝核心基因的遗传负担最高,且大部分有害变异集中于编码序列区域,反映出其较强的功能约束。空间分布分析表明,四拷贝核心基因在四个单倍型中的位置高度一致,并在染色体末端显著聚集,说明这些有害变异可能难以通过重组与自然选择被有效清除。在单倍型层面,相当比例的非冗余基因在四个等位拷贝中均携带有害等位基因,这类基因主要富集于胁迫响应、生殖发育及蛋白泛素化等关键生物学过程。群体比较进一步显示,自四倍体苜蓿相比其二倍体祖先累积了更多有害变异,且这一趋势在四拷贝核心基因中尤为显著。整体而言,这些结果揭示了全基因组复制在增强适应能力的同时,也可能通过掩盖有害突变效应,加速遗传负担在关键功能基因中的长期积累。

图5:四倍体核心基因中遗传负担的主要积累

 

 

五、过表达的四拷贝核心基因提高了苜蓿的适应性

本研究通过过表达四拷贝核心基因MsGDC,探讨了其在苜蓿中的适应性作用。MsGDC参与光呼吸,能够有效利用CO₂和NH₃。基因组分析表明,MsGDC在苜蓿中有四个等位拷贝,其中只有一个等位拷贝表现出显著的高表达,尤其在高CO₂环境下反应最为强烈。实验结果显示,过表达MsGDC可显著提高苜蓿的生物量,并在不同启动子的调控下展现增产潜力。转基因苜蓿在无氮处理条件下表现出较强的存活能力,增强了对氮胁迫的耐受性,并提高了氮利用效率。然而,MsGDC也承载较高的遗传负担,尤其集中在基因编码区。因此,尽管该基因在提升苜蓿产量和气候适应性方面具有巨大潜力,但在育种应用时,仍需权衡其遗传负担对品种改良的影响。

图6:四拷贝核心基因MsGDC的适应性与遗传负担

 

 

结语

本研究构建了苜蓿的超级泛基因组,揭示了同源四倍体苜蓿在气候适应中的关键基因和遗传负担。同源四倍体苜蓿相比二倍体祖先,具有更广的气候分布和生态位,四拷贝核心基因在气候适应中发挥了重要作用。全基因组加倍后,苜蓿基因组中发现大量基因变异,其中超过一半为非冗余基因,四拷贝核心基因在基因保守性分析中显著富集,表明其在苜蓿适应性中具有重要作用。这些基因也承载较高的遗传负担,主要集中在编码序列区域。过表达MsGDC基因显著提高苜蓿的生物量和氮利用效率,增强氮胁迫耐受性。研究表明,多倍化在增强适应性的同时,也加速了遗传负担的积累,育种时需要平衡适应优势与遗传负担。苜蓿的基因组资源和超级泛基因组为后续的适应性基因研究和育种提供了重要的参考依据。