文章导读:
稻属(Oryza)包含27个物种,分为11种基因组类型。其中,澳洲野生稻(O.australiensis)是EE基因组的唯一代表,也是现存与DD基因组亲缘关系最近的物种。由于DD二倍体祖先已灭绝,其起源和与EE的进化关系长期存在争议。尽管单拷贝基因研究提供了初步证据,但受多倍体进化影响,其结论仍有限。
扬州大学团队于2026年5月27日在国际著名期刊Nature Commuinications上发表了标题为“Telomere-to-telomere genome assembly of Oryza australiensis reveals transposon-driven centromere repositioning and shared EE–DD ancestry”的研究性论文,研究完成了澳洲野生稻高质量T2T基因组组装与注释,并基于比较基因组学、着丝粒图谱和转座子分析,系统阐明了其着丝粒的动态演化规律,并证实了其与稻属DD亚基因组间的共同祖先起源。

主要研究成果
1.澳洲稻T2T基因组组装及注释
本研究采用ONT长读长、超长读长及Illumina短读长数据,成功构建了澳洲野生稻(Oryza australiensis)的端粒到端粒(T2T)基因组。组装结果包含12条完整染色体,基因组大小约901 Mb,scaffold N50为76.6 Mb。评估显示该基因组具有较高的覆盖度与读长比对率,BUSCO完整度为99.8%,LAI值为23.79,QV值达41.76,证明组装质量高且完整。
在基因组注释中,共预测到36,742个蛋白质编码基因,主要分布于染色体远端区域,约占基因组总长度的12%。重复序列构成基因组的主要部分,其中LTR反转座子占主导,DNA转座子比例较低。端粒序列分析显示其具有多样性:除经典TTTAGGG重复阵列外,亦存在CCCAGG和TTTAAAA等非经典阵列,分布于多个染色体末端。卫星重复序列包括45S和5S rDNA,未检测到Os48重复。

图1:澳洲野生稻的基因组特征
2.澳洲野生稻着丝粒重定位与新着丝粒形成
基于CENH3 ChIP-seq数据,本研究绘制了澳洲野生稻的着丝粒图谱,鉴定出与水稻CentO同源的155 bp着丝粒卫星重复序列。比较基因组分析表明,该序列在EE基因组与CCDD基因组间高度相似,支持二者拥有共同祖先的假说。研究发现多个染色体发生着丝粒重定位及新着丝粒形成,部分新着丝粒区域缺乏卫星重复序列,说明CENH3结合足以维持着丝粒功能。着丝粒区域约69.7%由转座子构成,且活性着丝粒富集年轻LTR元件,表明转座子插入可能驱动新着丝粒的形成与演化。此外,着丝粒区域内仍存在具转录活性的基因,反映了该物种着丝粒的动态进化特征。

图2:澳洲野生稻着丝粒定位与演化分析
3.着丝粒重定位重塑澳洲野生稻染色体臂比例
基于稻属18个基因组的1,460个单拷贝基因构建的系统发育树,研究解析出六个高度分化的单系群(AA、BB、CC、DD/EE、FF、GG)。分析结果显示CC亚基因组与O. rhizomatis聚为一支,DD亚基因组与EE基因组关系密切。分化时间估算表明,CC亚基因组与O. rhizomatis的分化时间约为3.9 Mya,DD亚基因组与EE的分化时间约为5.13 Mya,该结果位于既往估计范围之内,为厘清稻属各亚基因组的分化时序与进化关系提供了清晰的时间框架。

图3:着丝粒动态重定位改变稻属染色体臂比例

图4:稻属着丝粒的演化历程
4.转座子揭示 DD 与 EE 共同祖先
通过比较转座子组成、扩增历史及LTR序列相似性,本研究探讨了EE基因组与DD亚基因组的进化联系。结果表明,LTR为稻属基因组中主要的转座子类型,EE基因组历史上曾经历两次显著的转座子扩增事件。基于LTR相似性的分析推测CCDD多倍体形成于约1.73–1.92 Mya,并显示EE谱系与DD亚基因组在CCDD形成前已存在密切的进化关联,支持DD亚基因组供体与EE类祖先共享共同起源的假说。

图5:EE与DD基因组经历相似的转座子扩增历史
5.DD 亚基因组的 EE 类起源
重复序列比较与LTR注释分析发现,Copia/Angela家族LTR在EE基因组与DD亚基因组中特异富集,而在其他稻属基因组中较少或缺失。插入时间分析显示,Angela LTR在CCDD形成前已在EE与DD中同步扩增,暗示二者具有相近的转座子演化历史。系统发育与共线性分析进一步揭示,EE与DD中古老Angela LTR序列相似性高,部分插入位点及侧翼序列保持保守,说明这些插入事件可能发生于二者分化之前。此外,本研究鉴定到一个275 bp的Angela特异重复单元Angela-Rep-DDEE,该序列主要富集于EE基因组与DD亚基因组。上述证据共同支持DD亚基因组供体在CCDD形成前与EE类祖先具有共同祖先关系。

图6:Angela LTR修正EE与DD的分化时间
文章小结
本研究构建了澳洲野生稻的高质量T2T基因组。通过解析着丝粒图谱,发现了广泛存在的着丝粒重定位现象,部分新着丝粒区域仅依赖CENH3结合。系统发育与比较基因组学分析理清了稻属主要分支的分化时序,同时,深入的转座子分析揭示了EE基因组与CCDD多倍体中DD亚基因组在转座子扩增历史上高度同源。二者特异共有的Angela家族LTR序列及其保守的古老插入位点,强有力地支持了DD亚基因组供体起源于EE类祖先这一共同祖先假说。