经Horticulture Research 编委会专家评审,华北理工大学生命科学学院宋小明课题组题为TVIR: a comprehensive vegetable information resource database for comparative and functional genomic studies 的研究论文当选Horticulture Research 2022年12月封面文章。
蔬菜是一种重要的经济作物,富含丰富的膳食纤维、矿物质、维生素等多种营养元素,在人们日常生活和健康饮食平衡中发挥着非常重要的作用。蔬菜种类繁多,涉及多个科属,如十字花科、葫芦科、茄科、豆科、伞形科、菊科和百合科等。随着基因组测序技术和生物信息学的不断发展,近十年来大量的蔬菜基因组完成了测序解析。这些基因组为蔬菜作物的比较和功能基因组学研究提供了丰富的数据资源。但是这些庞大且复杂的数据需要专门的数据库存储和管理。目前已经有部分蔬菜建立了自身基因组数据库。此外还有一些在属或科级别建立了数据库。但目前仍缺乏一个系统、全面而综合的蔬菜组学数据共享及分析平台。
本研究基于59种蔬菜的高质量基因组和深入的信息分析,搭建了一个用户友好的蔬菜组学数据共享及分平台—“蔬菜信息资源”数据库(TVIR,http://tvir.bio2db.com)(Fig. 1)。
Fig. 1 Overview of vegetable genome sequencing and TVIR database.
TVIR数据库提供了2,346,850个基因注释信息的检索,利用Swiss-Prot、TrEMBL、GO、Pfam和Nr对59个物种全基因组基因进行了注释。同时对59种蔬菜基因组的基因共线性、重复类型和同源信息进行了全面的鉴定分析。此外,研究还检测到2,101,501个CRISPR指导序列和17,377个miRNAs,并存储在TVIR数据库中供相关研究人员使用(Fig. 3)。
Fig. 3 Bar plots of the number of gene functional annotations, gene duplication types, and CRISPR guide sequences in 59 vegetable species.
TVIR数据库整合了从59种蔬菜基因组中鉴定到的来自63个家族的172,493个转录因子。同时,研究对蔬菜作物重要农艺性状相关功能基因进行了鉴定分析,包括59种蔬菜的5,215生长素相关基因、2,437个花青素相关基因、15,002个开花相关基因、79,830个抗病相关基因和2,639个硫苷相关基因。此外,还鉴定了2,597个N6甲基腺苷(m6A)基因(Fig. 5)。这些基因资源为蔬菜作物的功能基因组学和分子育种研究提供了丰富的数据资源。
Fig. 5 Plot of the number of members of several functional gene families, including auxin, anthocyanin, flowering, glucosinolate, resistance, and m6A genes in the 59 vegetable crops.
最后,TVIR数据库还收集和整理了98种蔬菜的转录组数据,可以按物种、组织或不同生长阶段进行搜索。同时,TVIR数据库还提供了Synteny、Primer Design、Blast和JBrowse等常用的生物信息分析工具,以方便用户进行蔬菜基因组的查询、检索和比较基因组学分析。
总之,这是第一次大规模收集蔬菜基因组数据并进行系统的生物信息分析。所有序列、注释和分析结果都可以从TVIR数据库下载并供科研人员使用。该数据库平台的搭建将极大的推进蔬菜作物比较基因组学和功能基因组学的研究进程。希望TVIR为全球蔬菜相关研究人员提供丰富的数据资源和信息分析技术支持。未来,该数据库将持续关注并更新新解析的蔬菜基因组和相关研究成果。
华北理工大学生命科学学院宋小明教授为通讯作者,硕士研究生于彤、刘卓、青年教师马晓和美国内布拉斯加大学林肯分校冯学环博士为共同第一作者。团队及国内外多家合作单位的教师和学生也参与了该项研究。该工作得到了河北省杰青、国家自然科学基金、河北省自然科学基金和中国博士后科学基金特别资助等项目的支持。
文章链接:
https://doi.org/10.1093/hr/uhac213
转自:“园艺研究”微信公众号
如有侵权,请联系本站删除!