TEL:18371456025

NG重磅 | 五指山猪T2T基因组揭示群体结构与体型选择

家猪是重要的农业与生物医学模式动物,其中中国本土五指山猪因体型小、饲养成本低、易管理而具有独特研究优势。尽管已有多个猪基因组版本,但多数仍存在缺口,限制了精细解析。中国农业大学草业科学与技术学院贾善刚研究团队于2025年12月12日在国际著名期刊Nature Genetics上发表标题为“Telomere-to-telomere genome assembly of a male pig provides insight into population structure and selection for body stature”的研究性论文,构建了五指山猪端粒到端粒(T2T)无缺口参考基因组,并据此解析了猪群体结构演化及体型形成的遗传基础。

 

 

一、五指山猪基因组组装及注释

本研究以雄性五指山猪为材料,构建了覆盖全部 20 条染色体的端粒到端粒无缺口基因组。研究整合多平台高深度测序数据,包括 169.8 Gb 超长 Oxford Nanopore 数据、192.4 Gb PacBio HiFi 长读长数据、267 Gb Hi-C 数据以及 133.7 Gb 二代测序数据,成功实现 18 条常染色体及 X、Y 染色体的完整组装,并精确定位了全部 40 个端粒序列,最终获得大小为 2.63 Gb 的无缺口基因组 T2T-pig1.0。通过读段比对、Hi-C 接触图谱、光学图谱和 BUSCO 等多种评估手段,研究系统验证了该基因组在完整性和准确性上的显著提升,为猪基因组精细结构研究提供了高质量参考。

进一步注释结果显示,重复序列占基因组近一半,显著提升了对复杂重复区域和片段重复的解析能力,并新鉴定出大量此前未识别的片段重复区域。全基因组共注释到38306个基因,其中蛋白编码基因整体质量高、完整性强。与现有参考相比,有1189个蛋白编码基因首次定位于先前未解析区域(PURs),且在多种组织中呈现多样化表达特征,尤其在下丘脑和垂体中更为显著。进一步分析表明,PUR区域基因整体承受较低的进化压力。此外,T2T-pig1.0成功解析了chr8和chr10上完整的45S rDNA阵列,并已通过多种实验手段加以验证。

图1:完整的T2T-pig1.0猪基因组组装概要

 

 

二、着丝粒的完整基因组结构

基于T2T-pig1.0无缺口基因组,本研究系统解析了猪全部染色体的着丝粒结构,首次在基因组尺度上精确界定了猪着丝粒区域,其总长度约占基因组的4%。通过多重证据的联合分析,研究明确了不同类型染色体的着丝粒位置,并揭示这些区域普遍呈现显著的DNA高甲基化特征,仅在核心区域存在低甲基化的着丝粒凹陷区(centromericdipregion,CDR)。

进一步分析表明,猪着丝粒主要由多类卫星重复序列构成,并在不同染色体类型中表现出明显的分布偏好。值得注意的是,端着丝粒染色体中存在特有的微卫星序列富集模式,这一结构特征此前尚未在人类、山羊和绵羊等哺乳动物的T2T基因组中观察到。此外,着丝粒区域显著富集年轻的LTR转座元件,说明其可能参与猪着丝粒的形成与演化。

图2:T2T-pig1.0猪基因组组装中的着丝粒结构

 

 

三、Y染色体结构

研究系统解析了猪Y染色体的结构与组成,清晰划分了假常染色体区和雄性特异区,并注释到111个蛋白编码基因,其中包括42个新鉴定基因。结果显示,Y染色体中重复序列占比高达84.9%,与人类Y染色体高度相似:其长臂主要由大规模卫星重复序列构成,而短臂则富集多种转座元件。通过整合ChIP-seq、甲基化分析和FISH成像数据,作者进一步定位并验证了一个潜在的功能性着丝粒区域,揭示了猪Y染色体复杂而高度特化的结构特征。

图3:Y染色体的结构与特征

 

 

四、跨物种比较基因组分析

在此基础上,作者对六种哺乳动物的基因组开展了比较基因组分析,共鉴定出18789个基因家族。基于单拷贝直系同源基因构建的系统发育结果显示,五指山猪与杜洛克猪约在210万年前发生分化。与既有参考相比,T2T-pig1.0中表现出更显著的基因家族扩增,这些扩增基因主要富集于细胞大小和器官生长负调控等生物学通路,提示其可能与体型差异相关。

在人、猪、绵羊和山羊的T2T基因组中,尽管染色体结构经历了多次断裂与重排,整体基因共线性仍然较高。进一步比较发现,chrY的q臂末端普遍存在由串联重复构成的异染色质区域,可能在减数分裂过程中抑制X-Y重组;同时,MSY区域中的多种雄性特异基因在不同物种间保持高度保守。PAR区域在不同物种间表现出明显的长度差异,其中人类的PAR显著缩短。这些结果共同支持大型哺乳动物chrX与chrY具有共同的进化起源。

图4:T2T-pig1.0与其他三种T2T基因组组装中chrY的比较分析

 

 

五、基于T2T参考的结构变异与群体遗传解析

本研究基于10个样本的ONT长读长数据,共鉴定出83106个大型结构变异。与以Sscrofa11.1为参考的结果相比,欧洲家猪和野猪中的SV检测数量分别提高了46.92%和55.84%,表明T2T-pig1.0在解析复杂结构变异方面具有显著优势。其中有27055个SV位于以往难以准确解析的PUR区域,主要由缺失和插入构成。

在群体遗传层面,作者整合了来自亚洲、欧洲和北美的407个猪样本全基因组数据。相较于旧参考,T2T-pig1.0显著提升了序列比对的准确性,并识别出更多可靠的SNP变异。系统发育分析、主成分分析和群体结构推断结果高度一致,将样本清晰划分为六大类群,并揭示了亚洲猪群体中明确的祖源分化格局及区域性遗传渗入现象。

图5:变异检测能力的提升与全球群体结构

 

 

六、与体型相关的选择信号

体型是猪生产中最重要的经济性状之一,不同品种间成年体重差异可超过两倍。围绕这一显著表型差异,作者进一步比较小型地方猪与大型商业猪,系统识别了与体型相关的选择信号。分析显示,数千个受选择区域涉及657个候选基因,其中大量信号高度集中于chrX的40–135Mb区段,提示该区域可能在体型形成中发挥关键作用,可能与其较低的重组率密切相关。

在此基础上,作者进一步鉴定出133个此前难以识别的受选择基因,并揭示其在多种组织中的差异表达特征,尤其在垂体和下丘脑等生长调控相关组织中表现突出。多种候选基因(如PLAG1和NR6A1)已被证实参与体型调控。值得注意的是,BRCA1、CORIN和GALNT13在不同体型比较中持续呈现强烈的选择信号,其关键位点在大小体型猪群间表现出显著的等位基因频率差异。整体来看,本研究为解析猪体型演化的遗传基础提供了清晰线索,也凸显了T2T参考在复杂选择信号解析中的独特优势。

 

 

七、GALNT13基因的选择信号与功能探索

基于显著的选择信号,本研究系统解析了GALNT13在猪体型调控中的潜在作用。群体遗传分析显示,小型猪与大型猪在GALNT13区域存在明显的单倍型分化,其中一个差异单倍型覆盖该基因第四内含子内的PUR区域,提示该位点可能受到选择作用。进一步分析中,作者发现GALNT13在多种骨相关组织中高表达,尤其富集于胸椎软骨的肥大软骨细胞。与大型猪相比,小型五指山猪在多个发育阶段的胸椎软骨中GALNT13表达水平显著降低。

在功能层面,本研究通过体外实验表明,GALNT13在软骨细胞分化过程中持续上调,其过表达可促进分化相关标志基因的表达,同时抑制细胞增殖。综合遗传与功能证据,作者提出GALNT13可能通过调控软骨细胞的增殖与分化,参与影响猪的骨发育和体型形成。

图6:GALNT13与猪软骨细胞发育的关联

 

 

结语

本文以我国地方猪种五指山猪为研究对象,构建了端粒到端粒(T2T)水平的高质量无缺口参考基因组。该基因组在连续性、完整性和准确性方面显著优于现有参考版本,系统填补了长期缺失的复杂重复区域,并实现了包括Y染色体在内的全面注释。在此基础上,研究解析了猪染色体着丝粒和端粒等关键结构特征,完善了对猪基因组整体构架的认识。结合新增的遗传变异信息,作者重建了全球猪群体的遗传结构与演化关系,揭示了地方猪种形成及跨区域基因交流的遗传证据,并鉴定和验证了与体型等重要性状相关的候选基因。该研究为猪的进化生物学研究和分子育种提供了重要的基因组资源。