现代玫瑰是兼具观赏价值与经济价值的重要园艺作物,广泛应用于切花、园林和香料化妆品等领域。由于长期种间与种内杂交,现代玫瑰形成了丰富的花色、花型和香气等性状,但其复杂遗传基础仍未被充分解析。
中国农科院联合华中农大研究团队在国际著名期刊Nature Genetics上发表了标题为“Pangenomic analyses of rose uncover widespread structure variation and empower genomics-directed breeding”的研究性论文,构建了涵盖多类群材料的蔷薇亚属泛基因组,揭示了与持续开花、花瓣数量和褪色等观赏性状的重要遗传变异与调控因子,并解析了部分重要栽培种的杂交起源。

一、23个玫瑰品种的新基因组组装与注释
针对23份来自亚洲和欧洲、覆盖蔷薇属9个组的代表性材料,研究开展了从头基因组组装与注释,结合HiFi与Hi-C测序共获得51个单倍型解析基因组,单倍型大小为355.9-639.7 Mb,平均contig N50达29.2 Mb。通过整合转录组、同源预测和从头注释方法,鉴定出约2.4万至4.1万个蛋白编码基因,平均约3.09万个;转座子占基因组近一半以上。多项评估结果表明组装和分相质量很高,BUSCO完整度平均超过97%,重复区域解析和单倍型分辨能力良好。

表1:蔷薇属基因组组装统计
二、系统发育演化
通过组装11个新蔷薇属物种基因组,并结合草莓、苹果和桃等代表物种,研究构建了系统发育树,解析了蔷薇科及蔷薇亚属的演化关系。结果表明,桃和苹果分化较早,蔷薇属与草莓亲缘关系更近;在蔷薇亚属中,黄刺玫Rosa xanthina较早分化。不同物种间基因家族扩张与收缩差异明显,功能富集分析进一步表明,香味和抗旱等性状可能与特定基因家族扩张有关。基因渗入分析显示,组间基因交流普遍强于组内,尤其是与中国月季组Chinenses之间存在更广泛的基因流动。群体历史推断还表明,中国月季组在约2000至5000年前经历了明显扩张,而其他组总体呈下降趋势。

图1:蔷薇属系统发育基因组分析
三、亚基因组特征
单倍型水平系统发育分析显示,四倍体法国蔷薇R. gallica 由两个不同来源的亚基因组组成,其中亚基因组A与腓尼基蔷薇R. phoenicia亲缘更近,亚基因组B更接近玫瑰R. rugosa,其基因组结构被进一步确认为 AABB。不同单倍型间基因密度和整体表达模式总体相近,但部分共线四联体表现出亚基因组表达优势。对三倍体杂交种La France的分析表明,其基因组结构为 AAB。进一步比较二倍体材料两个单倍型发现,它们之间存在大量倒位、易位、SNP 及插入缺失变异,同时在等位基因特异性表达和组蛋白修饰水平上也存在明显差异,显示出不同单倍型之间复杂的遗传分化特征。
四、核心基因与可变基因
基于26份蔷薇材料构建的泛基因组共鉴定55689个基因簇,其中包括16844个核心基因簇、4030个软核心基因簇、30714个可变基因簇和4101个特有基因簇。核心基因和软核心基因的dN/dS值较低,进化上更保守,且注释比例更高、表达量也更强,主要参与细胞代谢等基本生命活动;可变基因则更多与遗传信息处理、信号传导、细胞骨架动态及细胞结构稳态等功能相关。

图2:蔷薇亚属泛基因组
五、泛变异信息统计
基于55套单倍型的泛变异分析,研究共鉴定出1,738,269个PAV、1,567个倒位和61,701个易位,说明蔷薇亚属基因组中存在丰富的结构变异。不同材料间变异数量和类型差异明显,其中杂交种及中国月季组相关材料的变异更丰富,而月季R. chinensis OB及其近缘材料之间变异较少。PAV广泛分布于全基因组,部分区域形成了PAV、倒位和易位热点,且不同热点涉及的基因功能存在差异。进一步鉴定出79个大于1 Mb的大型倒位,其中最大的几个仅见于杂交种和中国月季组相关材料,并与根发育基因MIZU-KUSSEI和连续开花基因KSN相邻或断点重合。多数变异还与转座元件插入相关,表明蔷薇亚属基因组具有较高的结构复杂性。

图3:蔷薇属泛变异图谱
六、结构变异对观赏性状的功能影响
持续开花:围绕持续开花性状,研究重点分析了KSN位点的结构变异与等位基因差异。结果显示,中国月季组材料普遍携带与持续开花相关的RcKSN变异类型,而其他组的一次开花材料则稳定保留野生型基因型。研究还发现,一个倒位事件与RcKSN基因高度共分离,说明其与持续开花性状紧密连锁。进一步筛选得到多个候选变异,包括 SNP、indel 和 TE 插入,其中部分已通过测序和 PCR 验证,支持KSN表达调控与持续开花形成密切相关。

图4:蔷薇属中与持续开花(CF)相关基因的等位变异
重瓣形成:围绕重瓣性状,研究系统分析了AP2L位点在不同类群中的变异模式。结果证实,中国月季组重瓣材料中存在一个约10kb的TE插入,位于AP2L第8内含子内,并在现代重瓣品种中得到验证,可作为追踪该类重瓣玫瑰来源的重要标记。进一步比较发现,不同蔷薇类群虽都涉及AP2L同源基因变异,但具体形式并不相同,如提前终止、miR172靶位点缺失、内含子SNP和启动子变异等,说明不同物种可能通过不同分子机制形成重瓣。

图5:蔷薇中与重瓣花相关的AP2L 同源基因等位变异
花瓣变色:围绕花瓣变色性状,研究以木芙蓉Mutabilis为材料,从代谢变化、基因表达和功能验证三个层面进行了分析。结果表明,花瓣由橙转红过程中,花青素持续积累,而β-胡萝卜素逐渐下降;同时,促进花青素稳定的3GT_1高表达,参与β-胡萝卜素合成的相关基因表达下调。进一步分析发现,CCD4是影响该过程的关键基因,其在不同材料中的表达时序存在明显差异,并被证实具有降解β-胡萝卜素的能力。启动子差异也可能通过影响CCD4表达而参与花瓣变色。

图6:A19中花瓣变色的潜在调控机制
结语
本研究构建了涵盖26份材料的蔷薇亚属泛基因组和55套单倍型的泛变异图谱。研究系统解析了蔷薇亚属的系统发育关系、亚基因组组成及复杂的组间基因渗入历史,同时揭示了核心基因、可变基因及大量结构变异的分布特征。在性状解析方面,研究进一步锁定了与持续开花、重瓣形成和花瓣变色相关的关键变异与候选基因,明确了KSN、AP2L和CCD4等位点在这些性状形成中的重要作用,并解析了部分重要栽培材料的杂交起源。