华命生物目前已成功完成60+物种的T2T基因组组装,物种涵盖动物、植物、昆虫及同源和异源多倍体等疑难物种,已有多个合作项目在顶级期刊发表和接收,欢迎有需要的老师垂询。联系方式:18371456025。
异源四倍体陆地棉(Gossypium hirsutum L.)是重要的可再生纺织纤维和棉籽油来源。但在驯化和育种过程中经历了显著的遗传多样性降低及有害突变积累。基因组编辑技术通过引入有益变异、消除有害突变及实现靶向性状改良,为解决这些问题提供了潜在方案。然而,目前仅有Coker18、ZM24、YZ1和Jin668等少数基因型能成功实现棉花再生。其中,YZ1与Jin668因其极高的再生能力被公认为优良基因型,在棉花研究中被广泛应用。
7月22日,华中农业大学金双侠、张献龙和王茂军等团队合作在国际著名期刊《Nature Genetics》上面,发表了题为“Genome assembly of two allotetraploid cotton germplasms reveals mechanisms of somatic embryogenesis and enables precise genome editing”的研究论文,本研究完成了陆地棉高再生基因型Jin668的端粒到端粒(T2T)全基因组组装及YZ1的高质量基因组测序。并通过比较基因组学、染色质可及性及基因表达分析揭示了Jin668实现高效再生的关键基因调控网络。
一、Jin668与YZ1基因组组装
作者采用多种测序策略对陆地棉(2n=4x=52,AADD)近交系Jin668进行了基因组测序,通过结合387.02 Gb ONT超长数据(169×)和124.88 Gb PacBio HiFi数据(54×),初步组装和Hi-C数据辅助组装后,整个基因组仅有14个缺口。随后综合运用多种补洞策略、端粒修复及重复序列校正,最终获得完整的Jin668 T2T基因组。在26条染色体末端成功鉴定出全部52个端粒,并通过FISH验证。另外作者采用与Jin668相同的组装流程(未使用ONT超长数据),最终获得高质量的YZ1基因组(N50=108.2 Mb),共鉴定出45个端粒,仅存在72个gaps。
作者通过CenH3 ChIP-seq数据比对,在26条染色体上均鉴定出由大量串联重复单体构成的着丝粒区域。各染色体CenH3信号峰区间为1.0-1.8 Mb,且在YZ1中呈现保守的染色体定位。基于ONT数据的特异性k-mer聚类分析及HiFi数据主/次等位基因变异比率检测证实了着丝粒组装的准确性。
作者最终获得的Jin668包含At和Dt亚基因组全部26条染色体的T2T组装,基因组大小为2.37 Gb,注释获得74,457个蛋白质编码基因,染色体A09和D09分别鉴定出5.1 Mb(15,167个重复单元)和3.0 Mb(10,023个重复单元)的5S rDNA序列,而A09、D07和D09染色体存在主要45S rDNA位点(37.1 Mb/4,021单元、25.8 Mb/2,799单元和12.1 Mb/1,311单元)。FISH实验证Jin668具有2个5S rDNA和3个45S rDNA位点。采用相同方法完成YZ1基因组的高质量组装验证与注释。
图1:棉花遗传转化体系与Jin668/YZ1基因组全景解析
图2:Jin668基因组染色体臂与着丝粒的完整性和准确性验证
二、着丝粒结构的全局解析
Jin668 T2T基因组组装为着丝粒结构研究提供了新视角。通过10 kb窗口的平均比对率分析,作者发现特定区域存在比对率骤降现象,该特征与CENH3的log2(ChIP/input)信号峰高度吻合。除Ghjin_D08外,所有染色体着丝粒区均鉴定出Ty3/Gypsy类反转座子(CRG1/CRG2)及着丝粒周缘反转座子(GhCR1-GhCR4)。
Ghjin_D08染色体着丝粒区存在194 bp重复单元,并演化出4种变体。FISH实验证实这些单元特异地定位于同源染色体的初级缢痕处。着丝粒核心区含3,543拷贝(总长691 kb),而着丝粒周缘区含3,384拷贝(总长682 kb),两区域间隔约4 Mb。基因组分析与FISH结果共同表明,194 bp高阶重复(HOR)同时跨越Ghjin_D08的着丝粒核心区与周缘区。
Jin668着丝粒区共鉴定2,298个I类反转座子和136个II类DNA转座子。结构域注释显示玉米着丝粒特异性反转座子(CRM)占主导,其次为Tekay家族,而且CRM元件较Tekay更年轻,且着丝粒区CRM显著年轻于非着丝粒区。此外,着丝粒区还鉴定出70个可能参与基础生物学功能的基因。
图3:Jin668着丝粒结构特征
三、体细胞胚胎发生(SE)的再生基因组学机制
为解析棉花体细胞再生的分子机制,作者对高再生基因型(Jin668、YZ1)、中等再生基因型(ZM24)及非再生标准系(TM-1)进行了比较基因组分析。研究发现At亚基因组(尤其是A1-A5和A10染色体)的倒位/易位比例显著高于Dt亚基因组。排除基因注释差异及TM-1直系同源基因后,在三个再生基因型中共同鉴定出560个特异基因,主要富集于生长素极性运输与响应,胞质分裂正向调控和生长素稳态维持。
基因组共线性分析显示再生基因型间平均共线性区块比例达99.0%,显著高于非再生型(96.0%)。另外TM-1在启动子区的TE插入数量(2,088)显著高于其他再生基因型。再生特异型中,作者发现27个启动子区+17个编码区的关键基因中的TE插入,而非再生特异型发现5个启动子区+28个编码区关键基因中的TE插入,结合转录组数据,作者发现TE插入模式差异与SE过程中的基因表达变化显著相关。
图4:Jin668与TM-1、YZ1、ZM24的深度比较基因组分析
四、SE初期染色质动态与转录组特征
为解析SE过程,作者对高再生型(Jin668、YZ1)与非再生型(TM-1、ZB1092)的下胚轴外植体进行ATAC-seq和RNA-seq时序分析(诱导后0/0.5/1/6/12小时)。ATAC数据分析显示,再生型随时间推移呈现渐进性开放,而非再生型可及性逐渐降低。
关键基因表达结果显示,早期阶段Jin668中胚胎细胞标志基因(LECs、AGL15、SERK1、LBDs)显著上调,但在TM-1中均未检测到表达。而中后期Jin668持续高表达生长素响应基因(IAA),生长素外排载体(PIN),愈伤组织诱导基因(WOX13)和胚胎发生调控基因(AGL15),而TM-1同样无法检测到这些基因的表达。
作者进一步通过分析染色质开放区内688个非冗余TF结合基序,发现早期Jin668特异性富集形态建成相关TF,中期生长素极性调控因子KAN2显著富集,而后期Jin668特异性激活形态建成、生长素极性与分生组织维持相关TF(WOX11、AP2、RIN等)。
图5:Jin668与TM-1在体细胞胚胎发生(SE)过程中的染色质可及性与转录组动态比较
五、AGL15(而非AUX1)是SE介导再生的关键因子
尽管Jin668与TM-1均能诱导愈伤组织形成,但二者表现出显著差异,Jin668形成松散、亮黄色的胚性愈伤,而TM-1产生致密、球状、绿色的非胚性愈伤。为解析其遗传机制,作者通过基因组突变、TE多态性及Jin668 SE过程的动态表达谱分析,筛选出再生基因型(Jin668/YZ1/ZM24)特异性候选基因。其中,生长素内运载体基因AUX1和形态建成基因AGL15因在再生型中持续高表达而引起关注。
作者通过CRISPR/Cas9基因编辑和过表达转化(受体:Jin668/YZ1/TM-1),发现AGL15/AUX1突变体胚胎形成率在Jin668/YZ1/TM-1中均显著降低,诱导20天后,YZ1中AGL15/AUX1突变体的CPR显著下降,而TM-1中AUX1过表达未能提升CPR。
另外AGL15过表达显示YZ1/TM-1的CPR显著增加,诱导60天后,所有基因型CPR均显著提升。石蜡切片观测显示,突变体的维管组织细胞增殖明显减少,而AGL15过表达诱导显著的增殖增强。
最后作者得出结论,在特定遗传背景下,AGL15(而非AUX1)通过调控细胞增殖与分化平衡,成为SE介导再生过程的关键决定因子。这一发现为棉花遗传转化体系的优化提供了新靶点。
图6:再生相关基因的功能验证
六、Jin668 T2T基因组提升棉花基因编辑精准度
既往研究中,由于缺乏Jin668参考基因组,sgRNA设计不得不依赖TM-1基因组。然而TM-1与晋668间显著的遗传变异导致sgRNA设计准确性受限。为此,作者系统评估了晋668、ZM24和TM-1的遗传变异对sgRNA设计的影响。
使用CRISPOR工具(标准参数)筛选Cas9(PAM: 5′-NGG-3′)和Cas12a(PAM: 5′-TTTN-3′)的潜在靶点,发现各基因组PAM位点总数存在显著差异,鉴定出Cas9高质量sgRNA靶点640-660万个,Cas12a靶点320-340万个,遗传变异导致靶点数量呈现无规律波动。
另外SNP和InDel显著改变sgRNA的靶向与非靶向位点数量,以Jin668为参考基因组,可识别更精确的sgRNA及新潜在脱靶位点,Jin668参考基因组可提升sgRNA设计精度。
作者进一步选择Jin668特有而TM-1缺失的sgRNA靶点进行转化实验显示,Jin668愈伤组织中突变 reads 占比达23.6%,而TM-1对照中未检测到有效突变。
最后,作者构建了T2TCotton-Hub数据库平台,该平台整合了基因组数据、CRISPR设计工具、基因表达谱和交互式分析模块,为棉花功能基因组学研究提供了精准编辑新标准,显著降低CRISPR实验的脱靶风险。
图7:棉花遗传变异对CRISPR基因组编辑效率的显著影响
结语
本研究完成了陆地棉高再生基因型Jin668的T2T完整基因组组装及YZ1的near-T2T基因组组装。通过比较基因组学、染色质可及性及基因表达分析,揭示了Jin668实现高效再生的关键基因调控网络。此外,本研究系统评估了基因型间遗传变异对CRISPR基因组编辑精准度的影响,表明针对特定基因型的高质量基因组组装对确保功能基因研究和分子育种中基因组编辑的准确性具有重要作用。
华命生物全面汇总了动植物T2T基因组文章,上一期我们分享130+已发表的植物T2T基因组文献合集和30+已发表动物T2T基因组文献合集,我们不仅有按照时间顺序排列好的所有文献原文资料包,也贴心的整理了每篇文章的研究物种、测序策略、组装水平、基因组大小等内容,关注华命生物,后台回复关键词:华命交流群,扫码添加工作人员微信,发送单位+名字,管理员验证通过后拉入群聊获取文本全部资料~
华命生物产品服务一览
华命生物目前已开通微信公众号、抖音、知乎、B站、小红书等线上平台,欢迎感兴趣的老师扫码关注了解更多内容!