TEL:18371456025

Plant Com重磅|中国南瓜T2T基因组

胡桃南瓜富含营养且味道鲜美,但遗传资源有限,产量不高。长期栽培导致部分抗逆性状丧失,因此亟需挖掘和利用其遗传多样性,以培育高产、优质、耐环境胁迫的新品种。EMS 化学诱变和高质量基因组组装为基因功能研究提供了新工具,但在南瓜上相关研究仍较少。

北京大学农研院张兴平研究团队于2026年3月25日在期刊Plant Communications上发表标题为“Telomere-to-telomere genome and mutant library empower functional genomics anogenetic improvement in Cucurbita moschata”的研究性论文,本研究构建了中国南瓜T2T基因组,系统解析了其基因组结构与演化特征,建立了高覆盖 EMS 突变体库并定位关键突变基因,同时搭建了多组学数据库,为基因挖掘和分子育种提供了重要资源。

 

 

一、中国南瓜T2T无缺口参考基因组

本研究以优良中国南瓜自交系PKUMo为材料,成功构建了T2T无缺口的Cucurbita moschata高质量参考基因组。该基因组总长314.34Mb,组装到20条染色体水平序列,contigN50达16.62Mb,并精确解析了全部着丝粒及40个端粒区域。多维度评估结果表明,该组装具有极高的完整性和准确性:原始读段比对率及基因组覆盖度均接近100%,BUSCO完整度达到98.5%。与已发表的Rifu基因组相比,PKUMo在基因组总长度和染色体锚定序列长度上均显著提升,展现出更优的连续性和完整性。此外,研究共注释到28,594个蛋白编码基因,其中95.06%获得了功能注释。

图1:奶油南瓜(PKUMo)端粒到端粒T2T基因组概览

 

 

、PKUMo基因组TE注释与进化特征

PKUMo基因组中重复序列占 43.65%,其中转座元件(TE)占比达 40.58%,其中Copia 和 Gypsy是最丰富的两类LTR反转座子。插入时间分析显示,这两类元件在最近约0.27百万年内经历了明显扩增,系统发育分析进一步表明其扩张具有近期且谱系特异性的特征。与此同时,45S rDNA分布于多个染色体,而5S rDNA主要集中定位于Chr20。对18,024对重复基因的进一步分析显示,全基因组复制(WGD)仍是重复基因形成的主要来源;相比之下,转座型、串联型和近邻型重复的Ks值更低,说明其形成时间更晚,可能主要由TE介导的转座作用或局部复制机制所驱动。

 

 

三、PKUMo与HZAU基因组差异

进一步比较 PKUMo 与印度南瓜(Cucurbita maxima)HZAU 的基因组后发现,两者在序列组成和染色体结构上存在显著分化。除保留较大范围的共线区域外,二者之间还检测到大量倒位、易位、未比对片段以及约 449 万个 SNP,表明其基因组在进化过程中经历了广泛重塑。对 PKUMo 特有未比对区域的功能分析显示,其中基因主要富集于萜类代谢、次生代谢、生殖发育和转座活性等过程,说明这些区域可能与其特异性状形成密切相关。此外,PKUMo 中鉴定出的 171 个倒位区间共涉及 1,645 个基因,这些基因显著富集于酶活性、激素活性及信号调控等功能。

图2:印度南瓜与中国南瓜之间的基因组差异

 

 

四、着丝粒区域的特征解析与进化

在PKUMo基因组的20条染色体上,着丝粒区域均得到了准确界定,比较分析表明,PKUMo与HZAU的着丝粒序列几乎不存在明显保守性,说明两者在着丝粒重复序列组成及其演化过程中已发生显著分化。PKUMo着丝粒主要由CEN90、CEN168和CEN197三类串联重复构成。此外,在着丝粒区域共鉴定到124个完整LTR-RT,其插入时间整体较非着丝粒区域更近,说明近期反转座元件在着丝粒区域发生了偏向性积累,PKUMo着丝粒在重复序列组成和转座元件积累动态上均呈现出快速演化特征。

 

 

五、PKUMo EMS 突变体库的表型与遗传学评价

对 PKUMo EMS突变体库的系统评价表明,该群体具有较高的诱变效率和丰富的表型变异。在800个M₂家系中,共有124个家系出现显著性状改变,涉及株型、叶形、叶色、育性及果实形态等多个方面,其中多数变异在中国南瓜中尚未见报道。遗传分析进一步表明,部分突变符合典型的单基因隐性遗传规律,且部分家系中可能同时携带多个彼此独立的突变位点。全基因组测序结果显示,M₁和M₂植株均具有较高密度的SNP变异,说明该突变体库具备较高的突变负荷。基于已测序突变体的编码区变异数量推算,约1200个突变体即可实现对全基因组功能基因的近饱和覆盖。

图3:PKUMo EMS突变体库的表型与基因型变异

 

 

六、黄色突变体的基因发掘与分子标记开发

m15是EMS突变体库中获得的一个可稳定遗传的非致死性黄叶突变体,其叶色性状表现为单基因隐性遗传。结合BSA-Seq和遗传定位,研究将候选基因定位于Cmos16G0077000,该基因编码叶绿体定位蛋白LTD。重测序分析发现,该基因发生G到A的点突变,导致提前终止密码子形成并引起蛋白失活,最终造成叶片黄化。基于这一突变位点开发的KASP分子标记与叶色表型稳定共分离,可用于后代材料的快速鉴定和分子辅助选择。

图4:黄叶突变体 m15 的基因定位

 

 

七、矮化小株突变体的基因发掘与分子标记开发

mSq(m27)是从M₂群体中鉴定获得的矮化突变体,表现为显著的矮生和偏雄花特征,雌花极少且发育异常,因而难以正常自交结实;但其雄花花粉活力和萌发能力基本正常。遗传分析表明,该突变表型在F₂群体中符合3:1的分离比例,说明其受单个隐性核基因控制。结合BSA分析和全基因组重测序,研究将候选基因定位为Cmos14G0126400,该基因编码参与细胞壁生物合成的β-1,4-木糖基转移酶IRX10。进一步分析发现,该基因发生G到A的点突变,导致提前终止翻译,进而可能引起植株矮化和雌花败育。

图5:矮化突变体mSq的基因定位

 

 

八、南瓜综合资源数据库的构建

本研究构建了中国南瓜综合资源数据库PumpkinDB,整合了本研究产生的基因组、转录组及EMS突变体相关数据。该平台包含Download、Search和Mutant三大模块,支持参考基因组、注释文件、变异位点及原始测序数据下载,并提供基因检索、注释浏览以及突变体表型信息查询等功能。

 

 

结语

本研究以中国南瓜自交系PKUMo为材料,构建了端粒到端粒T2T参考基因组,具有较高的完整性和准确性,其着丝粒和端粒区域得到精细解析,转座元件扩增在基因组演化和新近基因重复形成中发挥了重要作用。基于EMS突变体库,进一步鉴定了黄叶和矮化突变体的候选基因,并开发了可用于分子辅助选择的标记。同时,研究整合多组学数据构建了PumpkinDB数据库,为中国南瓜基因挖掘、功能研究和分子育种提供了重要资源。