- 帮助文档
- FAQ
工具概述
差异分析就是计算两组样本之间差异表达的基因。通常我们定义基因/转录本表达量差异倍数>2、并且P值(或Q值)小于0.05为显著差异表达的基因/转录本,具有统计学意义。这个阈值可以自己调整。该差异分析是利用limma对两组样本间的基因/转录本差异显著性进行分析的,该软件支持配对差异分析。
操作方法
基础参数设置:
1.设置任务名,便于您查询后续的文件结果。
2.选择基因数据表:文件必须为txt格式。可以选择在excel中将数据打开,然后另存为"文本文件(制表符分隔)(*.txt)"。输入的文件第一行为样本ID,第一列为基因ID,表中的数值为每个样本的基因count数(即reads数目)。
3.选择分组文件:定义分组信息。文件必须为txt格式。第一列为样本名,第二例为所在的组名。注意:即使没有实验重复,依然需要填写这个文件(1个样本为1组)。
4.选择组间比较文件:列出要进行差异分析的比较组的文件。文件必须为txt格式。有两列,在进行差异分析时是第二列比上第一列。如第一列是A(组),第二列是B(组),则为B组比上A组。一行为一个比较组。
5.选择显著性水平:判定样本间基因/转录本表达是否显著差异的筛选阈值,默认p-adjust<0.05。若差异基因/转录本过少,可使用p-value进行筛选,或者调高阈值,如0.1;若差异基因/转录本过多,可调低阈值,如0.01;若不以该条件筛选,请填写“1”。p-adjust/p-value填写范围[0,1]。
6.选择多重校正方法:为了控制整体推断结果发生错误的概率或频次, 对统计检验获得的pvalue进行矫正,即进行多重检验矫正。小工具提供了BY、BH、Holm、Bonferroni四种,其中Bonferroni最为严格,其次是Holm,再次之是BY和BH,BY和BH严格性相当,默认选择BH。
7.填写差异倍数:默认为2,表示样本间基因/转录本表达上调2倍和下调2倍以上(即FC≥2和FC≤2),可根据差异基因/转录本数目,适当调整该值;若不以该条件筛选,请填写“1”;该值范围≥1。
高级参数设置:
8.选择样本配对文件:文件必须是txt格式。文件填写样本名称,对列数没有限制,每一行为具有配对关系的样本。若上传,则按照上传的样本配对关系进行配对差异分析。
9.选择标准化方法:提供四种标准化方法(TMM、TMMwzp、RLE、uqua),默认TMM。
10选择是否对数据进行voom转换,默认True
11.运行后可在结果页面,使用图表插件对图标题内容,字体,字号,配色等进行调整。
结果解读
火山图
注:横坐标为基因/转录本在两个样本间的表达差异倍数,即处理样的表达量除以对照样的表达量得到的数值,纵坐标为基因表达量变化差异的统计学检验值即p值。-log10(p值)越大则表达差异越显著,横纵坐标的数值都做了对数化处理。图中每个点代表一个特定的基因,红色点表示显著上调的基因,蓝色点表示显著下调的基因,灰色点为非显著差异基因。将所有基因映射上去之后,可以获知,在左边的点为表达差异下调的基因,右边的点为表达差异上调的基因,越靠近两边和上边的点表达差异越显著。
柱形图
注:横坐标为两两组比较标签,纵坐标为基因/转录本上调/下调的数量;up代表上调的基因/转录本;down代表下调的基因/转录本。
参考文献
Noble W S. How does multiple testing correction work?[J]. Nature biotechnology, 2009, 27(12): 1135-1137.
Q1:文件如何上传?
①工具数据可上传至我的数据→工具数据→personal文件夹。
②点击右上方“上传文件”即可上传本地文件至平台,在personal文件夹下也可新建文件夹。
Q2:上传的文件如何删除?
勾选文件/文件夹,点击右上方的文件操作,选择删除文件,文件也可移动或复制。
Q3:运行工具时选择好上传的文件后,无法进入下一步?
由于显示器分辨率的不同,弹出框展示可能不全,正常展示如下图所示,选择文件后,弹出框右下角为【确定】按钮,您可以按住ctrl键向下滑动鼠标缩小页面至窗口显示完全。
Q4:云工具的运行结果怎么查找?
我的分析→工具总览可查看所有运行的工具任务。点击【结果】查看分析结果报告,点击【下载文件】可下载结果文件至本地保存。