西兰花富含维生素、膳食纤维和萝卜硫素,兼具营养与健康价值。花蕾颜色是影响其商品价值的重要性状,其中紫色主要由花青素积累形成。由于现有西兰花基因组资源仍不完善,花青素调控机制尚未完全解析,亟需高质量基因组支撑相关基因挖掘与分子育种。
上海农科院研究团队于2026年4月21日在著名期刊Horticulture Research上发表标题为“T2T reference genome assembly provides insights into anthocyanin accumulation in broccoli”的研究性论文,团队构建了西兰花高质量端粒到端粒无缺口参考基因组,并基于该基因组鉴定出调控花青素积累和花蕾紫色形成的关键基因BoF3'H。

主要研究成果
1.西兰花T2T基因组组装及注释
本研究以早熟、高产且高度纯合的西兰花自交系 SN60 为材料,结合 Illumina、PacBio HiFi、ONT 超长读长和 Hi-C 技术进行全基因组测序与组装。K-mer 分析估算其基因组大小约 566 Mb,重复序列比例为 67.2%。最终获得 633.61 Mb 的无缺口基因组,contig N50 达 60.36 Mb,组装质量显著优于已发表参考基因组BOP04-28-6和HDEM,并填补了HDEM中的97个缺口,为西兰花基因功能解析和遗传改良提供了高质量基因组资源。

表1:西兰花基因组组装特征比较

图1:SN60基因组的端粒到端粒(T2T)组装
2.染色体端粒和着丝粒位置的鉴定
研究基于T2T组装结果,对西兰花SN60基因组的端粒和着丝粒进行了系统鉴定,共获得18个完整端粒并构建了9条端粒到端粒染色体。进一步利用TRF鉴定出各染色体着丝粒区域,其长度范围为1.09-5.72 Mb。在着丝粒区域共发现132个候选基因,KEGG分析表明这些基因主要参与基础转录调控、糖代谢、信号转导及自噬等生物学过程。

图2:SN60基因组着丝粒区域的界定与鉴定
3.基因组注释分析
研究对西兰花T2T基因组进行了系统注释,结果显示重复序列占基因组的58.19%,其中LTR转座元件占比最高(32.74%)。结合从头预测、同源比对和RNA测序数据,共预测并注释58,044个蛋白编码基因。进一步鉴定出27,663个转录因子,隶属于54个家族,其中MYB、ERF、bHLH、C2H2、Dof和WRKY家族成员数量较多,MYB家族最为丰富。此外,还鉴定出大量非编码RNA,包括miRNA、tRNA、rRNA和snRNA。
4.比较基因组学与基因组进化分析
通过对13个十字花科物种开展比较基因组学分析,研究发现白菜和甘蓝约于400万年前从拟南芥分化,西兰花中共有14,885个基因家族发生扩张、800个基因家族发生收缩。同时鉴定到682个西兰花特异基因,主要富集于刺激响应、逆境响应和防御反应等生物过程。进一步将SN60与BOP04-28-6和HDEM基因组进行比较,共检测到超过200万个SNP/InDel和2万余个结构变异,涉及大量与物质运输、代谢过程及渗透胁迫响应相关的基因。

图3:比较基因组学分析
5.利用SN60基因组鉴定紫色花蕾相关基因表达
研究以紫色花蕾材料BT126和绿色花蕾材料SN60构建F₂群体,结合BSA和精细定位,将控制紫色花蕾性状的 BoPur 位点定位至C09染色体73 kb区间,并鉴定出唯一候选基因 BoF3′H。序列分析发现,SN60中BoF3′H第二外显子存在43 bp缺失,导致基因提前终止并显著降低表达。CRISPR/Cas9敲除BoF3′H后,植株均表现为绿色花蕾,总花青素含量下降81.4%,其中矢车菊素和飞燕草素含量分别下降64.1%和97.2%。同时,多个花青素合成相关基因表达显著下调。结果表明,BoF3′H是调控西兰花花青素积累和紫色花蕾形成的关键基因。

图4:紫色表型植株的QTL定位分析

图5:BT126和SN60中BoF3'H的亚细胞定位及qRT-PCR表达分析

图6:CRISPR/Cas9介导的BoF3'H基因突变体及其表型分析

图7:转录组与代谢组分析揭示BoF3'H在野生型和bof3'h突变体中的关键作用
文章小结
本研究构建了西兰花首个高质量T2T参考基因组,系统解析了其基因组结构、功能注释及进化特征。在此基础上,结合遗传定位、转录组、代谢组和CRISPR/Cas9基因编辑等技术,鉴定并验证了调控西兰花紫色花蕾形成的关键基因 BoF3′H。研究揭示了该基因在花青素生物合成和积累过程中的重要作用,为解析西兰花花蕾着色分子机制提供了新的认识。