1 20 50 150 500
欢迎来到瑞博软件站,找素材,搜软件,就上瑞博软件站!
当前位置 >首页 >软件下载 >电脑软件 >应用软件 >办公软件

植物DNA条形码管理系统客户端 官方版

软件信息
  • 分类:办公软件
  • 大小:194KB
  • 语言: 中文
  • 环境: WinAll
  • 更新:2024-11-12
  • 评级:
  • 系统: Windows Linux Mac Ubuntu
  • 软件类别: 国产软件 / 免费软件 / 办公软件
  • 插件情况:
  • 相关链接: http://www.iflora.cn/Default.aspx

植物DNA条形码管理系统客户端是一个针对植物的遗传基因DNA条形码进行综合管理的辅助工具,该工具可对项目信息、样本信息、序列信息、测试图谱、处理文件、图片信息等以FTP的形式进行数据提交和文件上传,方便后台管理系统的管理。 植物DNA条形码研究是近10年来进展最迅速的学科之一, 其通用序列的筛选一直是该领域研究的热点问题。

DNA条形码

DNA条形码(DNA barcode)是指生物体内能够代表该物种的、标准的、有足够变异的、易扩增且相对较短的DNA片段。DNA条形码已经成为生态学研究的重要工具,不仅用于物种鉴定,同时也帮助生物学家进一步了解生态系统内发生的相互作用。在发现一种未知物种或者物种的一部分时,研究人员便描绘其组织的DNA条形码,而后与国际数据库内的其他条形码进行比对。如果与其中一个相匹配,研究人员便可确认这种物种的身份。 DNA条形码技术是利用生物体DNA中一段保守片段对物种进行快速准确鉴定的新兴技术。

相关说明

1 植物DNA条形码

植物DNA条形码研究稍滞后于动物学相关的工作。编码细胞色素C氧化酶I的线粒体基因COI(或cox1)被选作动物DNA条形码, 在一些昆虫、鱼类和鸟类的研究中取得了较好结果(Hebert et al., 2004; Smith et al., 2005; Hajibabaei et al., 2006; Yoo et al., 2006)。而对于陆地植物, 由于线粒体基因的进化速率相对较慢, COI并不适合。因此, 从叶绿体基因组和核基因组中寻找通用性高、序列质量好、物种分辨率高的DNA条形码候选片段是问题的关键。2009年, 国际生命条形码联盟植物工作组(Consortium for the Barcode of Life, Plant Working Group, 2009)根据已往研究和该研究组数据的分析结果, 建议将rbcL + matK组合作为陆地植物的核心DNA条形码, 用于构建植物物种鉴定的统一框图。在第三届国际生命条形码大会上, ITS和trnH-psbA被作为植物的辅助条形码(Hollingsworthet al., 2011)。2011年, 中国植物条形码研究团队建议将ITS(或ITS2)作为种子植物的核心条形码之一(Liet al., 2011)。

植物核心条形码的确定, 实现了植物标本鉴定过程的自动化和标准化, 突破了对经验的过度依赖, 并可在较短时间内建立易于利用的应用系统。因此, 植物DNA条形码技术作为传统分类的有效补充, 在生物多样性研究领域显示出强大的生命力。利用DNA条形码可以解决缺乏有效形态学证据的已知或未知物种的鉴定, 有助于新种或者隐存种的发现。例如, Pei等(2011)以及裴男才(2012)从叶片或树皮中提取DNA, 对热带雨林或亚热带常绿阔叶林中一些林冠层物种快速鉴定到科、属甚至种。Liu等(2011)对欧亚分布的红豆杉属(Taxus)植物的DNA条形码研究中, 发现4个物种(类群)可能是新种或隐存种, 并得到了居群遗传学(Liu et al., 2013)和形态学(Mö lleret al., 2013)证据的支持。

DNA条形码在群落生态学研究中作为一种快速识别物种的方法, 还可以用于群落系统发育关系的构建, 成为生物多样性或者物种丰富度快速评估的新工具。例如, Kress等(2009)在对巴拿马Barro Colorado Island (BCI)样地的群落系统发育结构的研究中, 利用rbcL +matK + trnH-psbA片段组合, 使物种鉴定的准确率提高至98%。

生物多样性的形成和维持机制已有较多假说, 但仍然没有形成广为接受的理论。DNA条形码在群落物种间网络(尤其是植食网络和传粉网络)关系等的研究中, 得到了较为成功的应用。例如借助DNA条形码技术分析动物消化道中食物残渣, 鉴定其取食的植物, 进而研究野生动物的取食习性(Passmoreet al., 2006; Huleret al., 2007; Bourlatet al., 2008)。Garcí a-Robledo等(2013)在构建美国中部热带雨林中植物与昆虫之间的网络关系时, 证实DNA条形码是一种行之有效的办法。Ramí rez等(2011)通过DNA条形码探讨特化的兰花类群与其传粉昆虫之间的拓扑网状结构, 以及它们的分化时间和多样化式样, 表明兰花的多样化与传粉昆虫的分化相一致, 同时与新热带森林中化学环境的变化密切相关。此外, Roy和Lawson(2012)借助DNA条形码, 研究了寄主与寄生网络的关系。可见, DNA条形码为生物多样性的形成和维持机制的研究开辟了新的途径。

随着第二代测序技术的出现, 开发出通过高通量技术获得多物种(样品)的DNA条形码序列的方法, 即DNA metabarcoding技术(Pompanonet al., 2011; Riazet al., 2011)。该方法结合生物信息学手段, 可以获取复杂混合样品甚至是大尺度范围样品的DNA条形码序列, 自动识别多个物种, 具有快速、可重复、高效及综合性的特点, 可以对当前生物多样性和古生物多样性进行评估。Yoccoz等(2012)从环境土壤提取了混合DNA, 获得其中叶绿体trnL(UAA)内含子P6环序列, 利用metabarcoding技术进行物种鉴定, 结果能够较好地反映地上植物的分布。Hiiesalu等(2012)利用metabarcoding技术不仅分析了地上植物物种的分布及丰度, 还发现对地下土壤的取样可以获得传统分析中容易忽视的信息, 如物种共存分布等, 能更全面地反映植被生态及其影响因素。借助于metabarcoding技术也可以更好地重现古植物多样性。例如Murray等(2012)分析了植食性动物的粪堆遗存, 发现了之前没有报道的动植物物种。此外, 利用metabarcoding技术对冻土DNA样品进行分析, DNA鉴定结果可以与花粉鉴定和大化石鉴定结果相互印证, 已成为传统古植物学研究的辅助手段(Jø rgensen et al., 2012)。

2 植物DNA条形码参考数据库

为了实现对物种的快速鉴定, 构建了DNA条形码参考数据库(Reference Library), 包括实物库(植物标本库、植物分子材料库和植物总DNA库)、植物DNA条形码数据库、物种信息库和计算分析共享系统(曾春霞等, 2012)。这些数据库需要统一规范化的工作流程, 才能够在数据展示系统(应用平台)中, 实现对物种的简单快捷的鉴定并获取相关信息。生命条形码联盟(CBOL)建立了生命条形码数据库系统BOLD, 是专门收集和分析DNA条形码数据的平台。与目前常用的核苷酸数据库(例如GenBank、EMBL和DDBJ)不同, BOLD数据库除了要求提交DNA条形码序列外, 还要求使用者提交以下信息: 物种名称、标本图片、凭证标本信息(目录号和馆藏号)、采集号(采集人、采集日期和GPS定位地点)、标本鉴定人、用于PCR扩增的引物、测序原始峰图。这样, 研究人员在对核苷酸序列进行比对的同时, 还能够结合其他信息, 完成对物种的鉴定。据BOLD数据库最新统计, 约21万个物种已经完成DNA条形码信息的描绘, 同时具DNA条形码序列信息的标本也有290万份(http://www.barcodinglife.com/index.php/TaxBrowser_Home)。该数据库以鱼类、鸟类和昆虫类为主, 而真菌和植物DNA条形码信息相对较少。

由于植物物种中存在广泛的多倍化、杂交或基因渐渗等事件, 同时近缘(姐妹)或者近期分化类群普遍存在, 这就给植物DNA条形码参考数据库的构建提出了更高的要求。为了能够实现种级水平的快速鉴定, 如何统一物种界定标准和居群取样标准等是当务之急(陈之端和李德铢, 2013)。然而要构建一个全面的、准确的植物DNA条形码参考数据库, 需要保证数据库中的DNA序列均来自经分类学家可靠鉴定的标本、这些凭证标本具有详尽的注释和可靠的保藏、DNA序列正确, 以保证分子鉴定的可靠性。可见, 植物DNA条形码标准数据库的构建将是长期而艰巨的任务。

近年来, 中国科学院昆明植物研究所联合国内相关科研院校开展了中国重要植物类群的采集、DNA条形码的测定与分析等工作, 在此基础上, 进一步融入现代植物学、新一代测序技术、地理信息数据和计算机信息技术等新元素, 提出了新一代植物志(iFlora)的研究计划(李德铢等, 2012)。iFlora不但包含传统植物志的检索表、物种描述等信息, 还包括物种详细分布信息、图片或图像、DNA条形码数据库和系统发育等信息, 同时建立了高效的电子化比对和搜索工具。通过系列关键技术的集成和研发, iFlora将构建一个便捷、准确识别植物和掌握相关数字化信息的智能植物志(或智能装备)(王红等, 2013)。目前, iFlora研究计划已经积累了中国维管束植物约230科1, 665属6, 800种约67, 000条DNA条形码序列, 同时构建的植物DNA条形码参考数据库已初具雏形。

3 植物DNA条形码数据共享平台构建

随着数据的爆炸性增长, 人们正进入一个“ 大数据” 的时代。大数据可概括为4V特征, 即数据量大(volume)、类型繁多(variety)、价值密度低(value)和速度快时效高(velocity)。在这样的背景下, 如何管理和使用好海量的信息, 是一个值得探讨的问题。

现今关于植物DNA条形码数据不再是单一的、一个维度上的数据, 而是丰富的、多维度的数据。 构建中国植物DNA条形码数据共享平台, 需要充分考虑到大数据的特征, 整合和管理好海量的数据资源, 并思考如何使用植物学大数据。以往的DNA条形码数据共享平台多是通过序列比对算法(如BLAST)来鉴定物种, 可当大数据的概念引入之后, 通过加入GPS信息与以往的标本分布进行比对作为佐证, 以及植物图片识别作为辅助手段, 物种将得到更准确的鉴定。这种使用多维度的植物学数据“ 交叉复现” 准确鉴定物种, 将使得植物学信息“ 全息可见” 。下面就中国植物DNA条形码数据共享平台的构建提出一些思考。

3.1 植物DNA条形码数据

3.1.1 数据的内容

在大数据时代, 植物DNA条形码数据不再限于其获取过程中产生的信息, 如样本采集、标本鉴定、标本凭证、标本图片、测序图谱、处理文件、序列等信息, 还应加入更加丰富的内容。如BOLD SYSTEMS(http://www.boldsystems.org/)的页面加入了来源、出版信息等内容; Tree of Life Web Project(http://tolweb.org/tree/)的详细页面加入了物种名称(包括图片、生命之树)、简介、特征、亲缘关系、异名、参考文献、互联网上的信息、标题插图等内容; iFlora系列的“ 国家重点保护野生植物鉴定信息平台” (http://www.iflora.cn/)的详细页面结合了昆明植物研究所的优势资源, 加入了《中国植物志》关于物种的信息、种质资源、民族植物学、植物照片等内容。

以下有价值的DNA条形码相关植物学数据可供整合参考:

(1)《中国植物志》、Flora of China以及地方植物志书等关于物种的描述。

(2)《中华本草》、《中国民族药志要》、《中国中药资源志要》中关于物种药用价值的介绍。

(3) “ 物种2000” (http://www.sp2000.cn/joaen/)的异俗名数据。

(4)中国植物图像库(http://www.plantphoto.cn/)的海量植物照片。

(5)国家标本资源共享平台(http://www.nsii.org. cn/)的标本分布信息。

(6)中国西南野生生物种质资源库(http://www. genobank.org/)的种质资源信息等。

(7)生物技术信息中心(http://www.ncbi.nlm. nih.gov)的GenBank条形码数据等。

3.1.2 数据的标准化

在平台建设之前, 不同单位和部门的数据库对于检索系统设计的技术方案、技术与信息组织规划选择、相关技术标准的采用, 基本上是各行其是, 数据标准的不统一常常给使用者带来一些不必要的麻烦, 造成数据共享的壁垒。因此有必要建立一套统一的DNA条形码数据标准。基于这样的需求, 基础科学数据共享网重要生物类群DNA条码数据库(http://www.pbl.csdb.cn/page/index.vpage)、BOLD Mirror(http://www.boldmirror.net/)等网站在建站时就提出了植物DNA条形码研究技术规范(高连明等, 2012)。中国植物DNA条形码数据共享平台在建立时应进一步完善此类规范, 供以后数据库建设者及科研工作者参考。

3.2 数据共享平台的界面设计

数据共享平台是目前国际上普遍采用的数据共享方式, 通过集中数据储存, 建立数据服务机制, 实现数据的共享。以下从界面设计入手, 提出“ 中国植物DNA条形码数据共享平台” 的建设思路。

3.2.1 门户模块

现有的一些知名DNA条形码网站可以给我们提供参考。BOLD SYSTEMS(http://www.boldsystems. org/)使用了数据门户、条形码集群数据库、教育门户、数据收集工作站这4个模块来实现数据的共享。中国生命条形码数据门户(http://www.barcodeoflife.cn/)主要提供新闻、资源的文字信息; 中国生命条形码信息管理系统和BOLD Mirror两个模块实现管理及数据共享的任务。其中中国生命条形码信息管理系统(http://data.barcodeoflife.cn/index.php)必须注册才能进行数据的提交及管理; BOLD Mirror模块(http://www.boldmirror.net/)主要采用BLAST查询方式实现DNA条形码数据的共享; iFlora系列— — 国家重点保护野生植物鉴定信息平台(http://www.iflora.cn/)采用了多种智能化查询方式获得DNA条形码 数据。

因此, 中国植物DNA条形码数据共享平台至少包括3个门户:

(1)数据门户: 采用多种方式的智能化查询并提供一定的下载方式。

(2)交流门户: 除了基本的个人信息管理, 用户还可以进行学术交流, 提交DNA条形码相关的数据信息, 实现更大程度的共享。

(3)管理门户: 主要针对管理员级别的可视化数据管理, 包括数据查询、导入、增删改、用户角色管理以及日志维护等操作。管理员还兼具对于交流门户提交的信息审核的责任, 将通过审核的数据归入数据门户的表中。

3.2.2 数据门户的鉴定入口

数据门户能让用户通过智能表检索、DNA条形码鉴定、图像识别三个检索入口获取物种详细的信息。其中, 智能表检索是指在优化数据结构的基础上进行常规检索, 如名录索引、分等级检索、志书式检索、模糊搜索等方式。DNA条形码鉴定是通过本地BLAST(local BLAST)集成在网页中, 实现序列比对的功能, 鉴定得出可能的物种, 从而获得鉴定物种的详细信息。图像识别是利用计算机对图像进行处理和解析, 以识别各种不同模式的目标。对于植物来说, 就是用植物的某部位如叶片、花、果实、整体形貌等的照片, 通过一定的算法与图像库内的图片进行比对, 鉴定出可能的物种列表, 从而获得相应物种的详细信息。现在“ 百度识图” 以及“ Google识图” 已发展到一定水平, 越来越多的科研工作者也开始关注这种方式。2013年9月在上海辰山植物园召开的“ 第三届全国生物多样性信息学研讨会” 上, 很多学者报告了图像识别技术并进行了深入的讨论, 中国科学院植物研究所也正与“ 百度识图” 合作开发进行“ 拍花识植物” 的工作。“ 图像识图” 正成为一种新的热点(庄会富和王雨华, 2012)。

3.2.3 平台框架的设计

通过以上分析, 可以得出以下平台框架架构, 即基于一定的数据标准规范体系以及安全保障体系, 采用“ 瘦” 客户端、“ 胖” 服务器端的浏览器/服务器(B/S)结构, 以表现层(View)、业务逻辑层(Business Logic Layer, BLL)、数据访问层(Data Acess Layer, DAL)、数据库(Database)多层架构的设计模式进行开发。中国植物DNA条形码数据共享平台应该提供一个智能化的物种鉴定引擎, 高效化的合作交流平台以及人性化的管理门户。具体的架构如图1所示。

中国植物DNA条形码数据共享平台应具备以下的特点:

(1)方便、迅速、多元的数据查询入口。用户可以通过多种查询入口, 方便快捷地找到并下载所需数据。

(2)详实、丰富、准确、多关联的数据页面及元数据。元数据不仅仅包括样本的采集信息和鉴定信息以及DNA条形码的序列信息等, 还应包括如物种信息、图片信息、药用植物信息和标本分布信息等, 同时保证数据的详细、准确、权威。多关联性表现在能展示物种更多的相关信息。

(3)便于合作、交流。为了实现更好的数据共享以及全球化的合作交流, 需要提供便利的交流合作平台, 不仅提供日常的学术交流及讨论, 还能提供数据的提交乃至定制服务。

(4)易于管理。有强大的可视化后台管理界面, 实现数据的查询、导入、管理、用户角色管理、日志维护等功能, 对已有数据实现增、删、改和检索的操作, 并对提交的数据进行审核和更新。

4 展望

近年来, 随着网络化和信息化的飞速发展, 各种移动互联网设备迅速普及, “ 云计算” 、“ 云服务” 等概念已形成一种趋势。中国植物DNA条形码数据共享平台最初的设计可能只是集成BLAST序列比对进行物种鉴定, 随着工作的深入, 将会集成越来越多的生物信息学软件, 可能涉及到一些复杂的算法, 计算量较大, 加之遗传信息的海量性和生物信息的多样性, 采用“ 瘦” 客户端、“ 胖” 服务器端的结构就要求高效的计算服务环境。基于科学计算需求的共享平台的设计势必是一个满足多平台客户端、立足科研工作者核心用户群、采用“ 客户端-云服务端” 构架的云服务平台。

下载地址

热门软件

Top