
- 帮助文档
- FAQ
1.工具概述:
Integrative Genomics Viewer (IGV)是一种探索大型综合基因组数据的高性能交互式可视化工具。IGV可以同时查看关于基因表达信息的其他层次,以及遗传密码中的序列变化或突变。其他的基因组细节,如拷贝数变化、染色质沉淀数据和表观遗传学修饰,也可以在IGV中查看。此外,所有这些数据类型都可以被覆盖或叠加,来判定某个水平的变化是如何影响其他水平。IGV可以选择多种显示模式,以Heatmap、柱状图、散点图或其他形式查看数据。
使用IGV进行比对结果文件的可视化时,可以将*.tdf文件导入IGV中,得到下图示意的可视化结果,在选择感兴趣的区域时,可以选择要查看的染色体,并在染色体区域选择要查看的感兴趣的区域即可。该款云工具采用Integrative Genomics Viewer (IGV)工具,将sort处理过的bam文件转换成相应的*.tdf文件,方便进行IGV的数据可视化展示。
2.操作方法:
①任务名称:对本次小工具运行任务进行命名,方便后续任务查找及分析结果查看。
②比对的Bam文件:输入sort处理后得到的bam文件,bam文件的基因组信息要与基因组gtf文件保持一致。BAM是目前基因数据分析中最通用的比对数据存储格式,它既适合于短read也适合于长read,最长可以支持128Mbp的超大read!BAM文件分为两个部分:header和record。许多NGS组学数据的存储格式都是由header和record两部分组成的。
header内容不多,也不会太复杂,每一行都用‘@’符号开头,里面主要包含了版本信息,序列比对的参考序列信息,如果是标准工具(bwa,bowtie,picard)生成的BAM,一般还会包含生成该份文件的参数信息(如下图),@PG标签开头的那些。这里需要重点提一下的是header中的@RG也就是Read group信息,这是在做后续数据分析时专门用于区分不同样本的重要信息。它的重要性还体现在,如果原来样本的测序深度比较深,一般会按照不同的lane分开比对,最后再合并在一起,那么这个时候你会在这个BAM文件中看到有多个RG,里面记录了不同的lane,甚至测序文库的信息,唯一不变的一定是SM的sample信息,这样合并后才能正确处理。
接下来重点要说的是BAM的核心:record(有时候也叫alignment section,即,比对信息)。这是我们通常所说的序列比对内容,每一行都是一条read比对信息,它的记录看起来是这样的:
示例文件:bam文件示例
③基因组gtf文件:需要上传与Bam文件相匹配的基因组gtf文件。基因组gtf文件为标准的gtf格式文件,示例如下:
3. 结果解读:
将结果文件输出的.tdf文件输入到IGV工具中进行结果查看,详细使用说明请在参数设置页面点击“IGV使用说明”按钮下载文档进行使用操作!
4. 参考文献:
Helga Thorvaldsdóttir, Robinson J T , Mesirov J P . Integrative Genomics Viewer (Igv): High-Performance Genomics Data Visualization and Exploration[J]. Briefings in Bioinformatics, 2012, 14(2).
Q1:文件如何上传和删除?
①通过云工具页面上的选择文件按钮可以上传本地文件到云工具文件夹中,上传成功后可以直接选择目的文件进行分析。
②可以在项目中心——工具数据——我的云工具文档 文件夹中查看、上传和删除云工具文件。
Q2:运行成功的任务在哪里查看结果?
投递运行的任务可以在项目中心——我的工具任务 中查看运行状态和结果,点击“结果”可查看页面运行结果,点击“文件”可查看结果文件夹,如果运行失败可以点击“排查”查看报错原因。部分工具没有结果按钮只有文件按钮。
Q3:云工具任务如何删除?
运行失败或不需要的任务可以在项目中心——我的工具任务中勾选后删除,删除的文件会在回收站保存30天,期间可随时复原。