
- 帮助文档
- FAQ
工具概述
偏最小二乘法判别分析是一种用于判别分析的多变量统计分析方法。使用偏最小二乘回归建立代谢物表达量与样本类别之间的关系模型,实现对样品类别的预测。
OPLS-DA分析中使用的置换检验为100次。
操作方法
1.1选择需要进行分析的数据表,数据表必须包含行头和列头,首行为样本名,首列为代谢物等特征名称。文件为txt格式纯文本文件,数据与数据之间务必用制表符隔开(tab符),不能用空格,如图1。
1.2选择分组文件:点击选择文件按钮,从数据中心选择对应的分组数据表。
1.3分析方法:单选,PLS-DA或者OPLS-DA。PLS-DA方法支持选择两组或多组,OPLS-DA方法只支持选择两组进行分析。
1.4样本组名称:根据上传的分组文件,输入需要比较的组名称。样本组之间用英文逗号,或|隔开。
结果解读
(O)PLS-DA分析图
X axis表示每个点的PC1坐标,Y axis表示每个点的PC2坐标,不同颜色和形状代表不同分组。
样本Score矩阵
name为样本名称,comp1和comp2分别为变量的第一主成分、第二主成分的解释度。
变量载荷矩阵
name为变量名称,comp1和comp2分别为变量的第一主成分、第二主成分的解释度。
(O)PLS-DA模型排序验证图
X axis表示置换检验的置换保留度(与原模型Y变量顺序一致的比例,置换保留度为1的点即为原模型的R2和Q2值),Y axis表示R2(红色圆点)和Q2(蓝色三角)置换检验的取值,两条虚线分别表示R2和Q2的回归线。不同颜色和形状代表不同分组。
模型参数表
R2X和R2Y分别表示所建模型对X和Y矩阵的解释率,R2X(cum)和R2Y(cum)表示累积解释率;Q2表示模型的预测能力,这3个指标越接近于1时表示模型越稳定可靠,Q2 > 0.5表示模型的预测能力较好,Q2 < 0.5表示模型的预测能力较差。p1,p2分别表示第一,第二主成分。
VIP值结果表
Name为表示变量的名称,Variable Importance for the Projection (VIP),变量投影重要度,衡量每行变量对每列变量分类判别的影响强度和解释能力,辅助标志物的筛选。通常以VIP值>1作为筛选标准。
参考文献
[1] Szymanska, E., E. Saccenti, AK. Smilde, and JA. Westerhuis. 2012. “Double-Check: Validation of Diagnostic Statistics for PLS-DA Models in Metabolomics Studies.” Metabolomics 8 (1, 1):3–16.
[2] Chailurkit LO, Paiyabhroma N, Sritara P, et al. Independent and Opposite Associations Between Branched-Chain Amino Acids and Lysophosphatidylcholines With Incident Diabetes in Thais. Metabolites. 2020;10(2):76.
Q1:文件如何上传和删除?
①通过云工具页面上的选择文件按钮可以上传本地文件到云工具文件夹中,上传成功后可以直接选择目的文件进行分析。
②可以在项目中心——工具数据——我的云工具文档 文件夹中查看、上传和删除云工具文件。
Q2:运行成功的任务在哪里查看结果?
投递运行的任务可以在项目中心——我的工具任务 中查看运行状态和结果,点击“结果”可查看页面运行结果,点击“文件”可查看结果文件夹,如果运行失败可以点击“排查”查看报错原因。部分工具没有结果按钮只有文件按钮。
Q3:云工具任务如何删除?
运行失败或不需要的任务可以在项目中心——我的工具任务中勾选后删除,删除的文件会在回收站保存30天,期间可随时复原。