中国标志性树木-木棉的首次基因组测序完成

发表于 讨论求助 2023-05-10 14:56:27

今日,中国科学家首次完成了木棉(Bombax ceiba L.)基因组测序工作。木棉因其华丽的红色花朵而闻名,花大而美,树姿巍峨,被高雄市和广州市选为市花。它具有重要的经济价值,是南亚东南亚原住民纤维、食物和木材的来源。近日发表在国际知名期刊《GigaScience》上的木棉基因组数据将帮助科学家更好地理解木棉对干热河谷这一极端生境的适应机制。

春季,木棉花盛开,花瓣鲜艳似火,装点了许多公园和广场。广州早在20世纪30年代就曾定木棉花为市花,1982年再次选定它为市花。除花朵美丽外,高达40米的树木还有许多用途:蒴果内的木棉纤维可用于填充枕头和床垫,干花常用于泡茶或煮汤。传统中医甚至认为木棉对健康有益。虽然木棉在华南地区广泛栽培,但在长江上游的干热河谷中有一座以这种植物命名的城市-攀枝花,这种原生生境代表了它对极端干旱和高温的耐受性。

在唐利洲教授、田斌副教授带领下,由曲靖师范学院、西南林业大学等单位组成的研究小组,近日对该标志性树种进行了基因组测序和组装。曲靖师范学院的高永、王海波和刘潮为本篇论文的共同一作。他们结合多种基因组测序手段获得了优质的基因组数据。最终的基因组大小为895M bp,包含约52,000个基因。

唐利洲教授指出了该项目存在的挑战:“木棉的高基因组杂合性为基因组组装过程带来了一定的困难。幸运的是,在第三代测序技术的帮助下,我们已经得到了一个相对完整的基因组草图。”

当科学家测定生物体的基因组时,不能从头到尾“读取”整个染色体的DNA序列,而是由生物信息学家用大量小片段来重建基因组。几年前,“短读长”测序是主要的基因组测序技术;该方法节约成本,但有一个主要缺点:片段长度非常短,每个片段不超过几百个碱基。基于短片段的基因组组装存在大量的缺失序列。最近,一种新技术-单分子实时测序(Single Molecule Real Time Sequencing, SMRT)得到了更广泛地应用。该技术可以产生更长的连续读长;作者就是利用这一方法获取的高质量数据减少了重建木棉基因组时的缺失序列数量。

为进一步提高基因组数据的质量和实用性,他们将序列数据与“光学图谱”技术相结合。该方法通过用荧光标记物标记不同大小的DNA片段,从而对片段进行分类和定向,以给出染色体的真实光学图像。这项技术已经在多种植物和动物物种中进行过尝试和验证,这次也帮助生成了高质量的木棉基因组组装结果。

唐利洲教授说,“未来,我们打算利用新的基因组数据帮助我们进行木棉育种项目”。木棉基因组还将有助于更好地理解对其原生生境-干旱河谷的适应性,作者已经发现了一些可能与木棉极端生境适应性相关的基因。

木棉的基因组数据储存在GigaDB,研究论文和数据可在GigaScience网站及数据库免费开放获取。


本期刊旨在提供已发表研究中所有数据和分析免费开放获取;为了这一目标的持续性,在CC0豁免条件下,本篇文章的所有数据均可在GigaDB中以以下方式获取和引用:

Gao, Y; Wang, H; Liu, C; Chu, H; Dai, D;Song, S; Yu, L; Han, L; Fu, Y; Tian, B; Tang, L (2018): Supporting data for"De novo genome assembly of the red silk cotton tree (Bombax ceiba)".GigaScience Database. http://dx.doi.org/10.5524/100445

原文出处

Gao, Y et al. (2018): De novo genome assembly of the red silk cotton tree(Bombax ceiba). GigaScience. doi:10.1093/gigascience/giy051 

可点击页面最下方阅读原文获取文章

 

GigaScience由牛津大学出版社和华大集团共同出版。该期刊荣获2018PROSE期刊出版创新奖(多学科),涵盖整个生命科学领域中使用或产生大数据的研究。已成为讨论生命科学领域内处理大量数据所面临的困难和独特需求的平台。该期刊具有全新的出版模式 - 将文章发表与完整的数据存储和分析工具并行。为保证科学研究的透明以及未来的可获取和分析,向GigaScience投稿的基本要求是:所有支持性数据和源代码均应在GigaScience数据库-GigaDB以及国际认可数据库中存储。GigaScience将为用户提供在线访问相关工具和工作流的权限。并已建立数据分析平台,可最大限度地发挥数据的潜在价值,充分实现数据再利用。


发表
26906人 签到看排名