VIP专享

根据基因组和gff提取基因的CDS/Protein/mRNA

基于物种的基因组序列文件(FASTA)和注释文件(GTF或GTF),批量提取或者剔除序列中的CDS区/蛋白/转录本
文章引用说明:如果您使用美吉生物云工具完成了数据分析,我们期望您在文章发表时,在方法学部分或致谢部分引用或提及美吉生物云工具以及我们发表的文章。
可参考示例:The data were analyzed on the online tool of Majorbio Cloud Platform (https://cloud.majorbio.com/page/tools/)
可参考文献:Han, Jichen. et al. 2024. Majorbio Cloud 2024: Update single-cell and multiomics workflows. iMeta, e217, doi:10.1002/imt2.217
  • 帮助文档
  • FAQ

工具概述

基于基因组序列文件、GFF或GTF基因组注释文件,批量提取CDS区/蛋白/转录本

操作方法

输入:

1.参考基因组:fasta格式,可以到公共数据中找对应物种,选择合适组装版本后,指定*.genome.fa作为输入文件即可。

2.基因组注释文件:GFF或GTF格式,可以到公共数据中找对应物种,选择合适组装版本后,指定*.gff3或*.gtf作为输入文件即可。文件格式说明:格式如下,数据与数据之间务必用制表符(tab符)隔开,不能用空格。

image.png

注:基因组文件和基因组序列文件必须配套,否则结果会是空。

参数:

1.序列类型:包括CDS,Protein,mRNA三类序列,根据选择的序列类型输出相应序列,选择all时结果将同时给出这三种类型的序列信息。

2.当序列类型选择mRNA,选择是否过滤掉含有 'pseudo' 的mRNA,默认不进行过滤。

3.当序列类型选择mRNA,选择是否丢弃掉无CDS的mRNA,默认不丢掉。

可选参数:当选中提取特定染色体指定位置序列时,需对以下参数进行设置

1.染色体名称

2.链方向,选择正义链或反义链

3.染色体起始位置

4.染色体终止位置

5.选择提取指定位置序列时,运行结果将给出指定位置的序列;当选中剔除指定位置序列时,运行结果将给出剔除特定位置的基因组其它序列信息。

结果解读

程序将根据输入的基因组序列文件提取出提取CDS区/蛋白/转录本的序列文件,并提供相关表格数据下载

Q1:文件如何上传和删除?

①通过云工具页面上的选择文件按钮可以上传本地文件到云工具文件夹中,上传成功后可以直接选择目的文件进行分析。

图片1.png

②可以在项目中心——工具数据——我的云工具文档 文件夹中查看、上传和删除云工具文件。

图片2.png

图片3.png

Q2:运行成功的任务在哪里查看结果?

投递运行的任务可以在项目中心——我的工具任务 中查看运行状态和结果,点击“结果”可查看页面运行结果,点击“文件”可查看结果文件夹,如果运行失败可以点击“排查”查看报错原因。部分工具没有结果按钮只有文件按钮。

图片4.pngQ3:云工具任务如何删除?

运行失败或不需要的任务可以在项目中心——我的工具任务中勾选后删除,删除的文件会在回收站保存30天,期间可随时复原。

图片5.png

在线咨询