TEL:18327076163

Molecular Horticulture精选丨两个蕨麻gap-free基因组发表

华命生物目前已成功完成60+物种的T2T基因组组装,物种涵盖动物、植物、昆虫及同源和异源多倍体等疑难物种,已有多个合作项目在顶级期刊发表和接收,欢迎有需要的老师垂询。联系方式:18371456025

蔷薇科委陵菜族(Potentilleae)是北半球物种多样性最丰富的类群之一。该族植物染色体倍性复杂,杂交与多倍化现象的协同作用,显著加剧了该类群的分类学复杂性。蕨麻属(Argentina)是委陵菜族中最古老的支系,主要分布于青藏高原。四倍体的蕨麻(A. anserina)与二倍体的西南蕨麻(A. lineata)是青藏高原广布的近缘物种,二者形态特征相似且分布区重叠。两种蕨麻都是中国部分少数民族传统重要药物,尽管其基因组数据已部分公开,高质量的T2T基因组组装仍将为进一步解析活性化合物生物合成的分子机制及物种演化历史提供关键依据。

为阐明蕨麻与西南蕨麻独特性状的起源、演化及遗传机制,近日,中国科学院昆明植物研究所张体操研究员团队和合作者一起,在著名期刊《Molecular Horticulture》上发表了“Two gap-free genomes of Argentina provide insights into their genetic relationships”的研究论文,作者成功组装了四倍体蕨麻和二倍体西南蕨麻的T2T基因组。基于这两个参考基因组,通过与蔷薇科近缘物种的比较基因组学及系统发育分析,揭示了二者的演化历史。

 

 

主要研究内容

作者通过NGS数据和24.93 GB的HiFi数据对西南蕨麻进行了初步组装,组装获得基因组为187.88 Mb,contig N50为26.06 Mb,进一步利用Hi-C测序数据,成功将其染色体级别基因组锚定到7条染色体上并获得了gap-free基因组。

对于蕨麻,作者通过35.73 GB的HiFi数据(约90×)结合NGS数据和Hi-C数据,成功获得了其gap-free的基因组,基因组大小为431.96 Mb,contig N50为30.08 Mb,基因组锚定到14条染色体,并可进一步分为A和B两个亚基因组。两个gap-free基因组的组装代表了当前物种最高质量的基因组组装结果。

作者进一步对两个物种的基因组进行注释,分别在西南蕨麻和蕨麻基因组中预测到24,261和43,542个蛋白质编码基因。基于GO、KEGG和SwissProt数据库的基因注释表明,西南蕨麻97.64%的基因和蕨麻98.28%的基因至少在其中一个数据库中获得注释。

作者以西南蕨麻为参考基因组,对蕨麻的A、B亚基因组以及蕨麻进行了共线性分析。结果显示西南蕨麻与蕨麻的两个亚基因组均表现出高度同线性。4dtv分析结果显示蕨麻在0.1附近出现一个额外显著峰,支持了蕨麻近期发生的四倍化事件。LTR-RTs插入时间分析显示,蕨麻两个亚基因组的LTR-RTs插入时间高度同步,表明其扩增可能发生在该物种四倍化事件之后。

作者基于单拷贝同源基因,构建了蔷薇科11个属16个物种的系统发育基因组树。结果显示蕨麻与西南蕨麻形成单系分支,表明二者具有较近的亲缘关系。

蕨麻和西南蕨麻均在中国西南及青藏高原地区具有高度重叠的地理分布。形态学上,两物种也非常相似。基于这些特征及系统发育证据,作者推测西南蕨麻可能是蕨麻的二倍体祖先种之一。

为验证这一假说,作者基于全基因组数据构建系统发育树并估算分化时间。结果显示,蕨麻B亚基因组与西南蕨麻最先聚类。进一步对7条染色体分别构建系统发育树发现,发现蕨麻B亚基因组的所有染色体均与西南蕨麻表现出紧密亲缘关系,这为蕨麻的异源多倍体起源提供了新证据,并支持西南蕨麻作为潜在祖先二倍体的假说。

考虑到系统发育方法的局限性,作者进一步采用sppIDer分析方法将西南蕨麻的短读长测序数据比对至蕨麻A/B亚基因组构建的复合参考基因组。结果显示B亚基因组的平均覆盖深度(45.36×)显著高于A亚基因组(33.46×),表明西南蕨麻与B亚基因组具有更高序列相似性。覆盖区间分析显示,B亚基因组中41.55%的区间超过最低覆盖阈值,而A亚基因组仅9.95%。这些结果提示蕨麻超过半数的基因组区间可能源自西南蕨麻,且西南蕨麻对B亚基因组的贡献更为显著。

综上,多维度证据支持西南蕨麻作为蕨麻潜在二倍体祖先的假说。但由于委陵菜族现有基因组数据有限,该结论仍需要更多物种数据进一步验证。

作者进一步利用CAFE(v.4.2.1)对西南蕨麻和蕨麻及蔷薇亚科其他7个物种进行基因家族聚类分析。西南蕨麻呈现更多扩张基因家族,而蕨麻亚基因组则以收缩基因家族为主,这可能与其经历的全基因组复制(WGD)事件有关。

随后,作者对这些收缩与扩张的基因家族进行了KEGG富集分析。西南蕨麻中,扩张基因显著富集于倍半萜和三萜类生物合成途径,以及单萜类生物合成途径。在蕨麻中,A、B亚基因组的扩张基因均富集于黄酮类和萜类合成通路,这些化合物对植物的药用价值和抗逆性具有重要意义。特别是黄酮类物质积累在植物表皮细胞中可以抵御UV-B损伤,这可能是蕨麻适应青藏高原强紫外线环境的关键机制,与西南蕨麻相比,蕨麻扩张基因涉及更多黄酮相关通路。因此,相较于西南蕨麻,蕨麻可能具有更强的极端环境适应能力,这解释了其更广的海拔分布范围。

 

图1:蕨麻和西南蕨麻基因组及相关分析

 

结语

本研究首次报道了青藏高原分布的重要藏药植物蕨麻和西南蕨麻的gap-free基因组。通过系统发育基因组学分析,现在西南蕨麻可能是蕨麻的潜在二倍体祖先种。比较基因组分析表明,蕨麻中受正选择基因显著富集于高原极端环境适应相关通路,而西南蕨麻的扩张基因主要关联药用价值,这些发现为理解高海拔环境下的物种分化与基因组进化提供了新视角。