TEL:18371456025

Nature重磅 | 高粱泛基因组解析适应与驯化机制

高粱是适应性强、表型多样的重要作物,广泛分布于不同生态环境。传统品种具有显著地域适应性,但现代育种依赖同质化种质,难以兼顾全球与地方需求,影响推广效果。单一地方育种亦存在局限,因此需整合全球多样性资源。构建高粱泛基因组有助于解析遗传变异、促进性状挖掘,并为高效育种提供基础。

美国科罗拉多州立大学研究团队于2026年3月11日在国际著名期刊Nautre上发表了标题为“A sorghum pangenome reference improves global crop trait discovery”的研究性论文,通过构建高粱泛基因组并结合群体与景观基因组分析,揭示了结构变异、基因流动与气候适应在驯化及复杂性状形成中的协同作用。

 

 

一、高粱参考基因组改进

本研究对高粱参考基因组BTx623进行了系统升级。相较于存在大量缺口和结构错误的V3版本,基于长读长测序构建的V5组装显著提升了基因组连续性,仅用34个contig即可覆盖10条染色体。同时,V5在重复序列区域的解析更加完整,整体基因组完整性进一步提高,并有效修正了V3中的结构拼接错误。此外,V5更准确地定位了Maturity1和POR等关键功能基因,从而提升了连锁分析与性状挖掘的精度,为高粱遗传研究与分子育种提供了更加可靠的基础。

 

 

二、参考基因组与多样性重测序群体

以高粱参考基因型BTx623为基础,对1,984个独特基因型(共2,145份材料)进行了高覆盖度全基因组重测序,构建了一个涵盖广泛表型变异的多样性群体,包括生长速率、生物量积累、开花时间及抗逆性等性状。该群体整合了育种材料、地方品种及多个重要种质资源,覆盖五大植物学类型,体现出显著的遗传与表型差异。鉴于单一参考基因组难以全面解析复杂遗传变异,研究进一步构建了包含33个基因组的高粱泛基因组参考,整合多种代表性基因型和重要栽培品种。基于该资源,系统分析了多环境条件下的农艺与生理性状,包括田间性状、无人机遥感指标及温室表型数据。结果显示,不同材料在水分利用效率及抗旱性等方面存在显著差异,部分优良材料表现出广泛适应性。

图1:高粱多样性群体的地理与遗传分布

 

 

三、泛基因组序列特征与基因组成

本研究基于33个基因组构建了高粱泛基因组参考,并系统鉴定出大量结构变异,包括325个大型SV和26个大尺度倒位。高粱基因组结构较为稳定,具有良好的共线性。通过整合685个样本的RNA测序数据进行高质量基因注释,并筛选可靠基因模型,最终构建了涵盖约98.9万个基因模型、54,959个基因家族的泛基因组。多数基因属于核心或近核心类别,但部分关键驯化和改良基因存在明显结构变异,如抗独脚金寄生的LGS1基因,体现出基因组层面的重要功能差异。

图2:泛基因组共线性图谱与基因存在/缺失变异(PAV)

 

 

四、复杂SVs分型

在泛基因组基础上,作者引入基于k-mer的分型策略,对复杂结构变异进行高效检测,并以SHATTERING1(SH1)基因为例开展分析。该基因与籽粒不脱落性及高粱驯化密切相关。研究识别出三种主要单倍型(sh1-1、sh1-2、sh1-3),并发现sh1-3中存在此前未报道的大规模插入变异。基于诊断性k-mer,对重测序群体进行分型后,进一步分析了不同单倍型在地理来源、遗传亚群及植物学类型中的分布格局,发现其具有显著结构分化特征,不同单倍型在Kafir、Durra、Guinea和Caudatum等类型中呈现特异性富集。结合已有研究,这一分布模式支持高粱在不同地区发生多次独立驯化的假说。同时,单倍型分布与气候因子密切相关,但并非完全对应,说明基因渗入或谱系未完全分化在不同基因库间普遍存在,反映了高粱进化过程中基因流动与环境适应的共同作用。

图3:驯化位点单倍型的深度分化

 

 

五、气候适应与迁移平衡

泛基因组分析表明,SH1单倍型之间存在古老分化,并为高粱多次独立驯化提供了证据。尽管整体群体分化程度较低,其遗传格局仍受到自然选择、人类偏好及基因流动等多因素共同塑造。基于433份地理来源明确的材料开展景观遗传分析发现,人类活动显著促进了高粱的长距离基因流动,同时在埃塞俄比亚高地和萨赫勒等区域形成局部基因流受限格局。进一步研究显示,干旱是驱动高粱适应演化的重要因素,高干旱地区材料间等位基因差异较低,表明干旱环境有助于促进跨区域基因交流。全基因组选择分析进一步表明,干旱适应相关等位基因在大尺度范围内共享,并富集于与渗透胁迫响应、次生代谢及结构性状相关的基因区域。这些结果共同揭示了环境适应与基因流动在塑造高粱遗传多样性中的协同作用。

图4 :基因流动的空间与气候背景

 

 

六、泛基因组变异中的蜀黍苷生物合成

本研究基于泛基因组系统解析了高粱中蜀黍苷(dhurrin)的生物合成及其遗传调控机制。结果表明,蜀黍苷不仅参与抗虫防御,还与抗旱适应及水分利用效率等关键农艺性状密切相关,在生理与表型层面起到重要连接作用。通过对多样性群体开展表型测定与GWAS分析发现,蜀黍苷含量与氢氰酸潜力在不同发育阶段相关性较弱,提示其功能具有多重调控特性。进一步研究表明,蜀黍苷的合成主要受染色体1上的生物合成基因簇(BGC)控制,其中多种结构与调控变异显著影响其积累水平。该区域存在明显的连锁不平衡及非线性效应,不同等位基因组合可导致蜀黍苷含量显著差异。基于泛基因组的k-mer分型与单倍型聚类进一步揭示,高蜀黍苷类型多分布于低降水区域,表明该代谢途径与干旱适应密切相关。

图5:蜀黍苷生物合成基因簇(BGC)的表型关联与结构变异(SV)

 

 

结语

该研究构建了高粱泛基因组并整合大规模重测序数据,系统解析了遗传多样性及其在性状形成中的作用。通过升级参考基因组并建立包含33个基因组的泛基因组框架,揭示了丰富的结构变异与基因内容差异。在此基础上,对关键驯化基因进行群体分析,阐明了多次独立驯化及基因流动对遗传结构的影响。景观基因组分析进一步表明,气候因素,尤其是干旱,与人类介导的基因流共同驱动了高粱的适应性分布。最后,通过解析蜀黍苷生物合成基因簇的遗传变异及其与环境和表型的关联,揭示了代谢通路在抗逆性与农艺性状形成中的关键作用。