
- 帮助文档
- FAQ
工具概述
通过将多维数据的差异反映在二维坐标图上,坐标轴取能够反映方差贡献的最大特征,样本数量越多,分析意义越大。如样本的组成越相似,则它们在PCA图中的距离越接近。PCA分析能够反映样本间分散或聚集的分布情况,从而判断样本组成是否具有相似性。
分析软件:R语言(vegan) 包
操作方法
1.1输入需要进行分析的数据表,文件应为txt格式,数据表必须包含行头和列头,首行为样本名,首列为基因/物种等特征名称。如图1。数据与数据之间务必用制表符隔开(tab符),不能用空格。
1.2输入分组文件,分组文件应为txt格式,如图2。
1.3选择样本名,选择数据表中第一行数据(列标签)代表样本还是第一列数据(行标签)代表样本,默认列标签。
1.4选择Z-score 标准化,选择是否对数据做标准化处理。
结果解读
PCA点图
样本通过降维分析后,在主成分上有相对坐标点,各个点的距离代表了样本的距离,平面上同一区域的样本表明其具有相似性。PC1和PC2代表影响样本功能组成的前两个主成分因素。
箱线图
表示不同分组条件下的样本在PC1轴上的分布离散情况。
主成分解释表
第一列为各主成分,第二列为主成分所占比例,数值越大代表该主成分越能区分样本。
主成分贡献度表
行标签为不同的功能,列标签为不同的主成分,表格表示不同功能在主成分上的贡献度。
PCA分析结果表
行标签为不同的样本,列标签为不同的主成分,表格表示样本在各维度的相对位置。
参考文献
[1] Derrick E. Fouts, Michael A. Matthias, Haritha Adhikarla, et al. What Makes a Bacterial Species Pathogenic?:Comparative Genomic Analysis of the Genus Leptospira. 2016, 10(2)
[2] Sood Utkarsh,Hira Princy,Kumar Roshan,, et al. Comparative Genomic Analyses Reveal Core-Genome-Wide Genes Under Positive Selection and Major Regulatory Hubs in Outlier Strains of Pseudomonas aeruginosa .[J]. Frontiers in microbiology,2019,10.
Q1:文件如何上传和删除?
①通过云工具页面上的选择文件按钮可以上传本地文件到云工具文件夹中,上传成功后可以直接选择目的文件进行分析。
②可以在项目中心——工具数据——我的云工具文档 文件夹中查看、上传和删除云工具文件。
Q2:运行成功的任务在哪里查看结果?
投递运行的任务可以在项目中心——我的工具任务 中查看运行状态和结果,点击“结果”可查看页面运行结果,点击“文件”可查看结果文件夹,如果运行失败可以点击“排查”查看报错原因。部分工具没有结果按钮只有文件按钮。
Q3:云工具任务如何删除?
运行失败或不需要的任务可以在项目中心——我的工具任务中勾选后删除,删除的文件会在回收站保存30天,期间可随时复原。