
- 帮助文档
- FAQ
工具概述
基于基因组序列文件、GFF基因组注释文件(可选),与参考数据库进行比对获得物种信息。
操作方法
1. 根据需要分析的样本数选择文件类型,分析多个样本,文件类型选择多个基因组,文件以文件夹形式上传。
2. 输入基因组序列文件:fasta的基因组文件,格式如下:
fasta格式首先以大于号“>”开头,接着是序列的名称“sequence1”。换行后是序列信息,序列中不允许有空格和空行。
3. 输入基因组注释文件(选填):GFF格式。格式如下:
gff是文本文件,由9列组成,每列数据之间务必用制表符(tab符)隔开,不能用空格,各列含义可参考http://m.ensembl.org/info/website/upload/gff.html。
注:GFF文件必须严格按照示例文件进行整理,否则容易运行报错。
4. 选择参考数据库:可以选择公共数据库GTDB,也可以指定物种(直接输入NCBI登录号,数量范围为5~20)作为参考。
结果解读
样本信息表
给出输入样本及自定义参考基因组(若选择)的基因信息,包括16S和看家基因的个数。若16S序列个数为0或参考基因组文件下载失败,则该基因组不进行后续分析。
注:(1)Sample Name:样本名称;(2)16S序列:输入样本中预测的16S rRNA个数;(3)看家基因:输入样本中预测的看家基因个数。
物种分类结果表
根据数据库的比对结果获得输入样本的物种信息。
注:1)Sample Name:样本名称;(2)Most Similar taxonomy(GTDB):与数据库相似度最高的的物种信息,若无最相似物种,则为新物种。
比对结果详情表
输入样本与参考基因组的比对详情,包括16S比对相似度,ANI值以及参考基因组GTDB物种信息及对应的NCBI物种信息。
注:(1)Sample Name:样本名称;(2)Reference ID:参考基因组ID,可链接到NCBI。(3)16SrRNA gene sequence similarity(%):16S比对相似度,值越高,物种越相似;(4)ANI(%):样本间的核苷酸相似性,一般同物种间的ANI/AAI值在95%以上;(5)GTDB taxonomy:GTDB数据库中参考基因组的物种信息;(6)NCBI Taxonomy:参考基因组NCBI的物种信息。
系统进化树
通过16S和看家基因进化树判断样本的进化地位。
注:基于16S rRNA序列选择在种属水平上最接近的菌(≤20株),通过MEGA软件选择NJ(Neighbor-Joining)法构建系统进化树。
注:基于31个看家基因(dnaG, frr, infC, nusA, pgk, pyrG, rplA, rplB,rplC, rplD, rplE, rplF, rplK, rplL, rplM, rplN, rplP, rplS, rplT, rpmA, rpoB, rpsB, rpsC,rpsE, rpsI, rpsJ, rpsK, rpsM, rpsS, smpB, tsf)选择在种属水平上最接近的19株菌,通过MEGA软件选择NJ(Neighbor-Joining)法构建系统进化树。
Q1:文件如何上传和删除?
①通过云工具页面上的选择文件按钮可以上传本地文件到云工具文件夹中,上传成功后可以直接选择目的文件进行分析。
②可以在项目中心——工具数据——我的云工具文档 文件夹中查看、上传和删除云工具文件。
Q2:运行成功的任务在哪里查看结果?
投递运行的任务可以在项目中心——我的工具任务 中查看运行状态和结果,点击“结果”可查看页面运行结果,点击“文件”可查看结果文件夹,如果运行失败可以点击“排查”查看报错原因。部分工具没有结果按钮只有文件按钮。
Q3:云工具任务如何删除?
运行失败或不需要的任务可以在项目中心——我的工具任务中勾选后删除,删除的文件会在回收站保存30天,期间可随时复原。