华命生物目前已成功完成60+物种的T2T基因组组装,物种涵盖动物、植物、昆虫及同源和异源多倍体等疑难物种,已有多个合作项目在顶级期刊发表和接收,欢迎有需要的老师垂询。联系方式:18371456025。
1.兰科
PMhub整合了来自实验研究、文献和公共数据库的188837种植物代谢物数据,并整合了部分代谢物相应正离子模式和负离子模式的标准HRMS/MS谱图便于研究者比对,重新注释未知代谢物。同时,数据库自带10种典型植物物种(拟南芥、水稻、小麦、玉米、甘蓝型油菜、甘氨酸、石松、毛棉、花椒、人参)的144366种代谢物信息,便于研究者比较这些物种中目标代谢物的相对含量。网站中代谢物遗传分析,可帮助研究者挖掘不同物种中任何遗传位点的mGWAS结果。
网页链接:https://cosbi.ee.ncku.edu.tw/orchidbase5
2.菊科
菊科植物的多组学数据库——Asteraceae Multi-omics Information Resource(AMIR)集数据整合、分析和可视化为一体。AMIR数据库整合了菊科74种个物种的多组学数据,涵盖132个基因组、3897个转录组样本、超过4276万个变异数据及1.5万多个代谢物基因注释,所有的数据资源经统一处理,标准化进行整合。旨在为植物科学家和育种专家提供全面的基因组、转录组、变异组和代谢组数据资源,结合多种创新功能,助力菊科植物的功能基因研究与育种策略优化。
网页链接:https://cosbi.ee.ncku.edu.tw/orchidbase5
3.菊属
菊属数据库提供了迄今为止最新和全面的菊属植物多组学数据集,集成了多种生物信息学分析和可视化工具,如交互式基因检索与序列提取工具、BLAST工具、共线性分析工具、表达量可视化工具和GO/KEGG/基因家族功能富集分析工具等。此外,针对栽培菊花(六倍体)基因拷贝数多、功能冗余的问题,开发了适用于栽培菊花的靶点设计软件,一次分析即可设计多个同源基因的共同敲除靶点与特异敲除靶点。上线一年,受到来自60余个国家(地区)20000余次访问,促进了菊花及近缘种(重要亲本和育种材料)的基础研究,进而推动菊花的种质创新与产业的繁荣发展。
网页链接:https://cgd.njau.edu.cn/
4.桂花
桂花 (Osmanthus fragrans Lour)。是一种众所周知的芳香植物,由于其独特的花香和生物活性化合物而被广泛用作食品成分。OfIR 是一个方便、全面的多组学数据库,可有效整合 127 个 O. fragrans 品种的表型和遗传变异,并提供许多易于使用的分析工具,包括引物设计、序列提取、多序列比对、GO 和 KEGG 富集分析、变异注释和电子 PCR。使用两个案例研究来证明其挖掘候选遗传变异位点或与特定性状或调控网络相关的基因的能力。综上所述,多组学数据库 OfIR 为研究人员挖掘功能基因提供了一个方便且用户友好的平台,并为 O. fragrans 的遗传育种做出了贡献。
网页链接:http://yanglab.hzau.edu.cn/OfIR/home
5.百合
百合属植物线上基因资源数据库由韩国百合种质资源库、转录组序列、分子标记、转录因子(TF)和DEGs数据组成。共挖掘了用于基因鉴定、标记开发和基因表达分析的约0.23 GB的RNA-sequences数据;包括47,863个SSR、20,929个SNP和1213个COS标记;此外,还鉴定了1327个TF基因。这是第一个独特的,用户友好的,百合属植物的基因组资源数据库。它是一个基于“三层架构”的关系数据库,在MySQL中编目所有的信息和用户友好的查询界面和数据可视化页面,使用JavaScript, PHP和HTML代码开发。搜索参数具有高度的灵活性,用户可以通过使用单个或多个搜索参数来检索数据。该数据库的数据可用于种质鉴定、基因发现、群体结构分析、QTL定位和加快百合品种改良。
网页链接:http://www.genomicsres.org/lilidb
6.杜鹃花
杜鹃花属数据库RPGD整合了来自杜鹃花属已测序发表的三个基因组数据,马缨杜鹃、圆叶杜鹃(R. williamsianum)和映山红(R. simsii)若干转录组数据和叶绿体基因组数据,并使用多种软件流程对这些数据进行详尽的分析。得到了包括功能注释,基因表达谱,基因家族,转录因子,同源基因,简单序列重复等数据。该数据库平台基于LAMP框架和已分析得到的众多数据,构建了搜索引擎和许多实用的工具,包括 BLAST、JBrowse、同源基因、基因组共线性浏览器、两侧序列浏览器、表达量热图绘制、富集分析和批量下载等。这些工具将会为那些缺乏生物信息经验的课题组提供一个有效的分析手段。未来RPGD还会不断的更新数据,并且发新的功能模块,将为所有从事杜鹃花研究的人员提供了一个全面的、有极大帮助的平台。
网页链接:http://bioinfor.kib.ac.cn/RPGD
7.莲
NGD部署了中国古代莲最新基于HI-C技术的染色体水平基因组组装序列,收录了注释到的150,589个mRNA转录本异构体和34,481 个具有完整开放阅读框的基因,为破解莲分子遗传机理提供“关键钥匙”。同时,该数据库整合了公共数据库中莲的11个组织不同时期的共63个转录组基因表达数据,并构建了加权基因共表达网络,涵盖了不同器官(组织)类型发育调控以及同一组织不同发育调控过程中的协同表达的基因模块(module),为了解莲的基因表达调控规律提供重要的公共分析平台。此外,该数据库对荷花中具有代表性的88个栽培种表型性状进行了数字化,并基于实验室内部以及先前发表的基因组重测序数据相应鉴定了26,939,834个高质量单核苷酸多态性变异位点和4,177,974个插入缺失变异位点,丰富了莲的遗传变异信息。该数据库部署了包含Blast、Gbrowse、Primer Design和Expression Visualization在内的多个生物信息学工具,使得莲的基因序列、功能及表达的相关信息更易获取,该公共数据平台为展开莲的基因组进化、分子遗传以及分子育种等领域的研究及实验设计提供了有价值的参考信息。
网页链接:http://nelumbo.biocloud.net
8.大豆
SoyMD可以快速查询感兴趣基因的所有多组学信息,包括功能注释、同源性、表达模式、遗传变异和表观遗传信号。此外,作者开发并提供了多种在线分析工具,用于挖掘和分析基因位点和候选基因。SoyMD是今后大豆功能基因组学和遗传育种研究的宝贵数据库。通过整合多组学数据和提供有用的分析工具,SoyMD旨在促进大豆的研究进展,并为改进大豆育种实践做出贡献。
网页链接:https://yanglab.hzau.edu.cn/SoyMD/#/
9.油菜
BnIR数据库共包含6种组学数据,整合了29个油菜以及近缘物种的基因组、2791个油菜组织样本的转录组、2311个样本的群体遗传变异数据、118个表型、266个代谢物含量以及多种表观基因组学数据(包括DNA甲基化、组蛋白修饰、染色质可及性和染色质交互强度等)组成的公共多组学数据。此外,基于群体多组学数据,利用全基因组关联分析、表达数量性状位点定位、孟德尔随机化和共定位分析等多种分析策略,对不同组学数据进行了关联与整合。相关数据及结果储存在数据库的多组学模块,以方便用户进行快速检索、分析和利用。
网页链接:https://yanglab.hzau.edu.cn/BnIR
10.十字花科
TBGR数据库包含大量重要的功能基因,其中硫代葡萄糖苷基因4096个,生长素基因6625个,开花基因13805个,抗病基因36632个,花青素基因1939个和m6A基因1231个。在这些十字花科作物中共检测到1174049个CRISPR特异性指导序列和5856479个转座子。TBGR数据库还提供了27个十字花科物种的共线性、重复基因和直系同源基因的信息。同时,该数据库使用TrEMBL、Swiss-Prot、Nr、GO和Pfam等数据库获得的1183851个基因的功能注释。最后,数据库还提供了BLAST、Synteny、Primer Design、Seq_fetch和JBrowse等工具来帮助用户进行数据查询检索及比较基因组分析等。所有物种的基因组序列、基因信息、注释和该研究获得的生物信息分析结果都可以从TBGR数据库轻松下载,供科研人员免费使用。
网页链接:http://www.tbgr.org.cn/index.html
甘蓝数据库(BRAD)最初是为了帮助用户高效应用甘蓝(Brassica rapa)和拟南芥(Arabidopsis thaliana)的基因组数据而建立的。然而,在其建成后,许多十字花科(Brassicaceae)物种的基因组已经完成测序并发布。这些基因组为甘蓝属作物的比较基因组学、基因注释和功能进化研究提供了丰富的资源。因此,BRAD更新至2.0版本(V2.0)。在BRAD V2.0中,新增了11个十字花科物种的基因组数据,包括拟南芥(Arabidopsis lyrata)、阿拉伯芥(Aethionema arabicum)、甘蓝(Brassica oleracea)、油菜(Brassica napus)、山茶籽(Camelina sativa)、剪叶苔(Capsella rubella)、阿拉巴马草(Leavenworthia alabamica)、独行菜(Sisymbrium irio)和三种极端环境植物——小花碱蓬(Schrenkiella parvula)、盐芥(Thellungiella halophila)和盐芥(Thellungiella salsuginea)。BRAD V2.0提供了从染色体到基因组片段水平的十字花科物种之间的同源基因组片段图谱。通用同源性浏览器(GBrowse_syn)模块用于展示多个基因组之间的同源关系。此外,还提供了检索同源和非同源直系同源基因及其注释和序列的搜索功能。此外,基因组和注释信息已导入GBrowse,以便在同一个框架中可视化所有功能元件。
网页链接:http://www.brassicadb.cn/#/
11.棉花
研究者通过整合25个棉花基因组、76个组织样本的转录组、5个物种的表观遗传学、4180个样本的群体遗传变异数据、20个表型和768个代谢物含量等公共多组学数据,构建了目前最为系统和全面的棉花多组学数据库-CottonMD。该数据库包含大量来自不同组学的信息,用户可以通过输入基因ID或物理位置信息来检索基因相关的多组学信息。以ATAF1基因为例,用户可以利用基因组模块获取4个同源基因的结构和功能信息,并通过转录组模块查询同源基因在不同组织、时期以及胁迫环境下的表达特征(图2)。这些功能为用户快速准确地理解基因的功能提供了快速方便的工具。在该数据库中,研究者利用全基因组关联分析(GWAS)、表达数量性状位点定位(eQTL)、孟德尔随机化(SMR)和共定位分析等多组学关联分析方法对不同组学的棉花数据进行关联,并将分析结果和工具整合到数据库中以方便用户查询、分析和利用。
网页链接:https://yanglab.hzau.edu.cn/CottonMD/
12.葡萄
包括葡萄种质资源、转录组信息、基因组注释及信息挖掘、葡萄进化分析等数据。
网页链接:https://grapedia.org/genomes/
13.茄科
SGN是一个专注于茄科植物基因组学研究的在线数据库和资源平台。该数据集包含了多种茄科植物的基因组信息、遗传图谱、分子标记、序列数据以及相关的生物信息学工具。SGN 旨在促进茄科植物的遗传学和基因组学研究,支持育种和生物技术应用。
网页链接:https://grapedia.org/genomes/
14.马铃薯
网页链接:http://spuddb.uga.edu/
15.小麦
Wheat Proteome数据库的核心是以不同器官和不同发育阶段(24种样本类型)进行蛋白质组研究,在主页上可直接点击相应图像进行查看。此外,还提供了带有注释并与整个细胞代谢网络相关的五个RNA-seq数据集,可作为靶向蛋白质组学分析的检索工具。
网页链接:https://www.wheatgenome.org/
16.水稻
水稻基因索引数据库RGI(https://riceome.hzau.edu.cn/),收录了16个主要亚洲水稻材料的参考基因组,并统一处理多个基因组和注释信息。共确定了119,783个非冗余基因组来代表整个亚洲水稻基因集,此外还建立了统一的数字正交基因指数(OGI),表明其在所有材料中的代表性。RGI提供丰富的模块和工具,帮助研究人员查询和可视化水稻基因及其同源关系。每个基因都有一张“综合图文信息卡片”,包含同源基因索引、序列和功能信息,并展示转录本结构和系统发育树等内容。
网页链接:https://riceome.hzau.edu.cn/
17.蔷薇科
蔷薇科基因组数据库GDR(Genome Database for Rosaceae)是致力于蔷薇科研究数据库,用于蔷薇科的数据资源挖掘和作物改良。网站支持浏览和下载草莓属(Fragaria)、苹果属(Malus)、李属(Prunus)、梨属(Pyrus)、蔷薇属(Rosa)和悬钩子属(Rubus)的全基因组序列、注释信息,其中包括基因模型预测、多态性、遗传标记映射、基因同源染色体、蛋白质和代谢途径等内容。截止2021.01.04,该网站一共收录1973类品种。GDR数据库也包含有育种项目和遗传多样性项目的表型和基因型数据以及相应的工具,可辅助育种工作者进行研究。
网页链接:https://www.rosaceae.org/
18.药用植物数据库
MPOD是一个从基因组到代谢物水平最为全面的药用植物多组学整合数据库。MPOD数据库收集了已发表154个基因组,200个转录组及85个代谢途径;还添加本项目测的6个基因组,28个转录组及5个代谢组数据。MPOD拥有很庞大的药用植物多组学信息,为研究者分子育种与开发基因元件提供丰富遗传信息。该数据库还提供了85个典型化合物代谢途径详细信息,包括分子式、功效、基源植物、前体、宿主、合成方式、下游基因、合成途径及参考文献。MPOD添加生物合成工具,46种微生物底盘菌株,来自8大关键酶家族629个基因及196个微生物调控元件。这个模块可以使用户快速检索感兴趣的代谢物、酶及生物合成元件信息。该数据库提供序列比对、系统发育分析、表达谱、基因共表达网络分析等工具。
网页链接:http://medicinalplants.ynau.edu.cn/
19.蓝莓
莓基因组数据库已整合至CoGe(Comparative Genomics)多物种基因组比较平台。该平台提供多品种蓝莓基因组(包括栽培种_Vaccinium corymbosum_与野生近缘种)的比对分析工具、共线性可视化与基因组重排检测模块、基于BLUEBERRY RNA-seq数据的表达模式分析。包含USDA蓝莓育种计划发布的染色体级别参考基因组和整合SSR标记与SNP变异数据集(来自NCBI-SRA)。
网页链接:https://genomevolution.org/coge/
20.萝卜
萝卜基因组数据库(Radish Genome Database, http://radish-genome.org/)包括染色体级别参考基因组(包括不同栽培品种的组装版本)、全基因组注释信息(蛋白编码基因、ncRNA、重复序列等)、变异数据集(SNP、InDel)及表型-基因型关联数据。该数据库提供在线BLAST序列比对、基因组浏览器(JBrowse)可视化、基因家族与同源基因分析模块分析工具。
网页链接:http://radish-genome.org/
21.柑橘类
CGD柑橘基因组数据库 (https://www.citrusgenomedb. org) 包含了大量的柑橘基因组序列数据,以及丰富的标记、柑橘物种表型和农艺性状的数量性状位点。
网页链接:https://www.citrusgenomedb.org/
22.千种本草基因组数据库
plantGIR( http://plantgir.cn/)包括全面的基因组文件,例如coding sequences、protein sequences、general feature format等文件。作者也全面地鉴定了这些植物基因组中的转录因子、生长素、花青素、开花相关基因等功能基因,并存储在该数据库中。作者还提供了两种下载基因组数据的方式:普通和FTP。作者还提供了Blast、Primer design、Hmmsearch和Sequence alignment等生信工具的界面使用。
网页链接:http://plantgir.cn/
23.昆虫
InsectBase 2.0昆虫综合基因数据库,共包含Organism,Chromosome,Genome,Transcriptome,Gene,Gene family,HGT gene,KEGG pathway,Insect virus,Tools,Links和Service共11个模块。网站提供了物种信息查询、不同类型基因、病毒数据的搜索与下载功能。除此之外,InsectBase 2.0集成了BLAST,JBrowse2工具,提供了七百余种物种的基因BLAST与基因组浏览器功能。同时基于MCScanX共线性分析,提供了155个染色体级别基因组之间的共线性可视化分析,为昆虫染色体进化提供了有力的工具。
网页链接:http://v2.insect-genome.com/
24.黄瓜
Cucumber-DB是一个多组学数据库,集成了广泛的基因组学和转录组学数据。该综合数据库包括三个主要数据集和工具:
(1)黄瓜基因组组装和注释:除CLv4.0组装外,Cucumber- db还提供了11个具有代表性的黄瓜基因组组装,包括3个野生物种和8个栽培品种。这些数据集提供了基因组序列、基因结构和功能注释,并且可以通过JBrowse浏览器访问,以便于可视化。
(2)黄瓜变异:以CLv4.0基因组为参照,从115份核心种质的公开重测序数据中鉴定出863万个SNP和180万个InDels。此外,通过将11个代表性基因组与CLv4.0基因组比对,我们检测到13,551个SV。这些变异可以查询和显示用户定义的目的,帮助开发新的标记遗传精细定位。该数据库还确定了在黄瓜驯化和分化过程中选择的重要基因组区域进行系统发育分析。
(3)黄瓜转录组:利用CsRTD1和广泛的ssRNA-seq数据,建立了全面的基因表达图谱。此外,该数据库还包括一个用户友好的eFP查看器来显示空间和应激反应基因表达模式,这有助于缩小候选基因的位置克隆。
网页链接:http://v2.insect-genome.com/
25.瓜类
葫芦科基因组学数据库(Cucurbit Genomics Database,http://cucurbitgenomics.org)是一个国际权威的葫芦科作物基因组学综合平台,专注于黄瓜、西瓜、甜瓜、南瓜等重要经济作物的基因组学研究。该数据库整合了多种葫芦科作物的高质量参考基因组、基因注释信息、变异数据(SNP/InDel)和表达谱(RNA-seq)资源,并提供BLAST序列比对、基因组浏览器可视化、共线性分析等实用工具。特别值得一提的是,该平台还收录了丰富的分子标记和QTL定位数据,为葫芦科作物的功能基因组学研究、分子育种和遗传改良提供了重要支撑。数据库由国际葫芦科基因组研究联盟维护,定期更新数据资源,是葫芦科作物基础研究和应用研究不可或缺的专业平台。
网页链接:http://cucurbitgenomics.org/
26.茶类
山茶属基因组学信息平台(TPIA2;http://tpia.teaplants.cn),该平台整合了更多新型大规模基因组、转录组、代谢组和遗传变异数据集,以及多种实用工具。具体而言,TPIA2收录了目前所有已组装的10个山茶属基因组及其全面注释,涵盖山茶属三大主要类群。平台新增了来自350个不同茶树品种大规模基因组重测序的1500万个SNP和95万个小片段插入缺失变异数据,并开发了全新的"变异"模块以促进功能注释变异组的数据检索和分析。此外,平台新增了116个山茶属转录组数据,将山茶属基因表达谱扩展至13个发育阶段和8种非生物/生物胁迫处理。升级的"表达"功能提供了全面的山茶属基因表达图谱。平台还专门设计了两个新型分析工具(如基因ID转换和群体遗传分析),以促进山茶属数据交流和群体基因组学研究。总体而言,TPIA2提供了多样化的更新基因组资源和强大功能,将继续作为山茶属功能基因组学和群体遗传学研究的重要门户。
网页链接:https://tpia.teaplants.cn/download.html
27.芸薹属
网页链接:https://yanglab.hzau.edu.cn/BnIR/download?module=transcriptomics
28.植物已发表基因组统计数据库
数据库里面记录了已测序了的植物以及发表的文章。根据植物分类来查找具体发表的文献。
网页链接:https://www.plabipd.de/index.html
一键获取全部数据库地址:关注华命生物公众号,后台回复关键词:数据库,即可获取本文所有数据库链接。
华命生物产品服务一览
华命生物目前已开通微信公众号、抖音、知乎、B站、小红书等线上平台,欢迎感兴趣的老师扫码关注了解更多内容!