会员专享
PCA分析(Principal Component Analysis),是一种对数据集进行简化分析的技术。PCA运用了方差分解,对多维数据进行降维,去除噪音和冗余,揭示隐藏在复杂数据背后的最主要的元素和结构。
文章引用说明:如果您使用美吉生物云工具完成了数据分析,我们期望您在文章发表时,在方法学部分或致谢部分引用或提及美吉生物云工具以及我们发表的文章。
可参考示例:The data were analyzed on the online tool of Majorbio Cloud Platform (https://cloud.majorbio.com/page/tools/)
可参考文献:Han, Jichen. et al. 2024. Majorbio Cloud 2024: Update single-cell and multiomics workflows. iMeta, e217, doi:10.1002/imt2.217
  • 帮助文档
  • FAQ

工具概述

通过将多维数据的差异反映在二维坐标图上,坐标轴取能够反映方差贡献的最大特征,样本数量越多,分析意义越大。如样本的组成越相似,则它们在PCA图中的距离越接近。PCA分析能够反映样本间分散或聚集的分布情况,从而判断样本组成是否具有相似性。

分析软件:R语言(vegan) 包

操作方法

1.1输入需要进行分析的数据表,文件应为txt格式,数据表必须包含行头和列头,首行为样本名,首列为基因/物种等特征名称。如图1。数据与数据之间务必用制表符隔开(tab符),不能用空格。

image.png

1.2输入分组文件,分组文件应为txt格式,如图2。

image.png

1.3选择样本名,选择数据表中第一行数据(列标签)代表样本还是第一列数据(行标签)代表样本,默认列标签。

1.4选择Z-score 标准化,选择是否对数据做标准化处理。

结果解读

PCA点图

image.png

样本通过降维分析后,在主成分上有相对坐标点,各个点的距离代表了样本的距离,平面上同一区域的样本表明其具有相似性。PC1和PC2代表影响样本功能组成的前两个主成分因素。


箱线图

image.png

表示不同分组条件下的样本在PC1轴上的分布离散情况。


主成分解释表

image.png

第一列为各主成分,第二列为主成分所占比例,数值越大代表该主成分越能区分样本。


主成分贡献度表

image.png

行标签为不同的功能,列标签为不同的主成分,表格表示不同功能在主成分上的贡献度。


PCA分析结果表

image.png

行标签为不同的样本,列标签为不同的主成分,表格表示样本在各维度的相对位置。

参考文献


[1] Derrick E. Fouts, Michael A. Matthias, Haritha Adhikarla, et al. What Makes a Bacterial Species Pathogenic?:Comparative Genomic Analysis of the Genus Leptospira. 2016, 10(2)

[2] Sood Utkarsh,Hira Princy,Kumar Roshan,, et al. Comparative Genomic Analyses Reveal Core-Genome-Wide Genes Under Positive Selection and Major Regulatory Hubs in Outlier Strains of Pseudomonas aeruginosa .[J]. Frontiers in microbiology,2019,10.

Q1:文件如何上传和删除?

①通过云工具页面上的选择文件按钮可以上传本地文件到云工具文件夹中,上传成功后可以直接选择目的文件进行分析。

图片1.png

②可以在项目中心——工具数据——我的云工具文档 文件夹中查看、上传和删除云工具文件。

图片2.png

图片3.png

Q2:运行成功的任务在哪里查看结果?

投递运行的任务可以在项目中心——我的工具任务 中查看运行状态和结果,点击“结果”可查看页面运行结果,点击“文件”可查看结果文件夹,如果运行失败可以点击“排查”查看报错原因。部分工具没有结果按钮只有文件按钮。

图片4.pngQ3:云工具任务如何删除?

运行失败或不需要的任务可以在项目中心——我的工具任务中勾选后删除,删除的文件会在回收站保存30天,期间可随时复原。

图片5.png

在线咨询