TEL:18371456025

Genome Biology精选 | 流苏马兜铃T2T基因组

马兜铃科植物以其独特的花部形态和复杂的传粉策略而闻名。其中,流苏马兜铃(Aristolochia fimbriata)因生命周期短、易于栽培且基因组规模较小,被认为是研究被子植物进化与发育的潜在模式物种。该物种在进化过程中未经历额外的谱系特异性全基因组复制事件,因而保留了较为接近祖先状态的基因组结构,这一特性使其成为探索被子植物早期基因组演化及基因调控网络变化的重要研究材料。

中国科学院植物研究所焦远年老师团队于2026年2月27日在著名期刊Genome Biology上发表了标题为“Centromere organization and epigenetic regulation in Aristolochia fimbriata”的研究性论文,本研究通过构建流苏马兜铃T2T基因组并解析其三维基因组结构与AP3调控网络,揭示了其独特着丝粒特征及特化花形态形成的潜在分子基础。

 

一、流苏马兜铃的高质量 T2T 基因组组装

本研究构建了流苏马兜铃的T2T完整基因组,整合了20 Gb(约70×)PacBio HiFi高精度长读长数据、13 Gb(约45×)Oxford Nanopore超长读长数据以及200 Gb Hi-C数据,最终获得一个无gap的高质量基因组组装。该基因组由7条染色体组成,总长度约320 Mb。组装结果成功解析了全部7个着丝粒区域、两个45S rDNA核仁组织区、染色体7上的5S rDNA位点以及完整的端粒重复序列。基因组注释结果显示,重复序列占基因组的38.2%,其中LTR逆转座子为主要类型,同时共鉴定出20,733个高可信度蛋白编码基因。此外,转录组分析共检测到14,029个可变剪接事件。

图1:流苏马兜铃T2T基因组组装及其验证

 

 

二、流苏马兜铃34 bp超短着丝粒卫星结构

研究进一步关注着丝粒的结构特征,通过鉴定着丝粒特异性组蛋白CENH3并结合CENH3 ChIP-seq数据确定其功能性着丝粒区域。分析发现,该物种着丝粒由长度仅34 bp的卫星重复单元(CEN34)组成,并形成大规模串联重复阵列。除第4号染色体呈双向排列外,其余着丝粒均为单向结构。这些重复序列具有明显的CpG、CHG和CHH高甲基化特征,并存在一定程度的序列变异,不同CEN34变体在不同染色体着丝粒中呈现特异性分布。进一步分析共鉴定出265,449个高阶重复单元(HORs),平均每个HOR包含4.5个CEN34单体。跨物种比较表明,流苏马兜铃的34 bp单体是目前已知最短的着丝粒重复序列,且约95%的着丝粒序列由高度均一化的单体组成,并伴随极少的转座子插入,显示出高度简化且特化的着丝粒结构。

图2:流苏马兜铃着丝粒结构及与其他T2T基因组的比较分析

 

 

三、流苏马兜铃基因组的三维结构

为解析流苏马兜铃的三维基因组结构,作者在幼叶和花组织中构建Hi-C文库并获得高质量Hi-C测序数据。分析发现,全基因组存在明显的A/B染色质区室,其中A区室多分布于端粒附近,并具有更活跃的表观遗传特征。约10%的区室在花与叶之间发生组织特异性转换,并伴随相关基因表达变化。在更高分辨率下,研究鉴定出约1000个TAD-like结构域,覆盖约一半基因组,其边界富集活跃染色质标记、低DNA甲基化并缺乏LTR逆转座子。此外,基因组中普遍存在基因环结构,高表达基因表现出更强的TSS-TES互作,表明转录活动与染色质三维结构密切相关。

图3:流苏马兜铃的三维基因组结构

 

 

四、流苏马兜铃开放染色质区域及其调控基因

研究利用ATAC-seq在流苏马兜铃中鉴定出23,852个开放染色质区域(ACRs),其中多数位于基因附近并具有DNA低甲基化和H3K27ac富集等活跃表观遗传特征。进一步鉴定出花和叶组织特异的ACRs,并分别富集于与花发育、激素响应以及生长和胁迫相关的转录因子结合基序。结合Hi-C数据分析发现,大量ACRs通过染色质环参与基因调控,其中超过一半形成跨越中间基因的远距离互作,表明远端调控在基因表达中广泛存在。以AGAMOUS基因为例,花组织中特异的染色质环将远端调控区域与该基因连接,表明染色质可及性变化及三维基因组结构共同影响组织特异性的基因表达。

图4:流苏马兜铃开放染色质区域(ACRs)及染色质互作特征分析

 

 

五、AP3 下游基因扩展与流苏马兜铃花特化

为探究流苏马兜铃独特花结构的遗传基础,研究利用CUT&Tag技术解析了B类MADS-box基因AP3的结合位点,共鉴定出5,662个AfAP3结合峰,其中多数位于开放染色质区域并富集CArG-box基序。结合基因位置和染色质互作关系,共预测4192个潜在AP3调控基因,其中包括多种花发育调控因子,并发现部分远端结合位点可通过染色质环实现长距离调控,例如在花组织中远程调控花粉发育基因GELP77。跨物种比较表明,AP3在流苏马兜铃中的调控网络明显扩展,显著富集于花色素苷、类胡萝卜素和萜类合成等次生代谢通路。功能实验进一步验证AfAP3可直接激活相关代谢基因,表明AP3调控网络的扩展可能促进了流苏马兜铃独特花色和气味特征的形成。

图5:AfAP3结合位点的鉴定及跨物种潜在AP3调控基因的比较分析

 

结语

本文以流苏马兜铃为研究对象,构建了高质量端粒到端粒基因组,获得7条无缺口染色体,并解析了着丝粒、rDNA位点及端粒重复结构。研究发现,其着丝粒由超短34bp卫星重复构成,具有高度均一化且转座子插入极少的结构特征。结合Hi-C和ATAC-seq数据,系统揭示了流苏马兜铃的三维基因组结构、开放染色质区域及广泛存在的染色质互作,表明远距离调控在基因表达中具有重要作用。进一步以花发育B类基因AP3为例,发现其下游调控网络在该物种中明显扩展至花色和香味相关的次生代谢通路,说明调控网络的演化可能促进了流苏马兜铃高度特化花部性状的形成。