
- 帮助文档
- FAQ
工具概述
偏最小二乘法判别分析是一种用于判别分析的多变量统计分析方法。使用偏最小二乘回归建立代谢物表达量与样本类别之间的关系模型,实现对样品类别的预测。
OPLS-DA分析中使用的置换检验为100次。
操作方法
1.1选择需要进行分析的数据表,数据表必须包含行头和列头,首行为样本名,首列为代谢物等特征名称。文件为txt格式纯文本文件,数据与数据之间务必用制表符隔开(tab符),不能用空格,如图1。
1.2选择分组文件:点击选择文件按钮,从数据中心选择对应的分组数据表。
1.3分析方法:单选,PLS-DA或者OPLS-DA。PLS-DA方法支持选择两组或多组,OPLS-DA方法只支持选择两组进行分析。
1.4样本组名称:根据上传的分组文件,输入需要比较的组名称。样本组之间用英文逗号,或|隔开。
结果解读
(O)PLS-DA分析图
X axis表示每个点的PC1坐标,Y axis表示每个点的PC2坐标,不同颜色和形状代表不同分组。
样本Score矩阵
name为样本名称,comp1和comp2分别为变量的第一主成分、第二主成分的解释度。
变量载荷矩阵
name为变量名称,comp1和comp2分别为变量的第一主成分、第二主成分的解释度。
(O)PLS-DA模型排序验证图
X axis表示置换检验的置换保留度(与原模型Y变量顺序一致的比例,置换保留度为1的点即为原模型的R2和Q2值),Y axis表示R2(红色圆点)和Q2(蓝色三角)置换检验的取值,两条虚线分别表示R2和Q2的回归线。不同颜色和形状代表不同分组。
模型参数表
R2X和R2Y分别表示所建模型对X和Y矩阵的解释率,R2X(cum)和R2Y(cum)表示累积解释率;Q2表示模型的预测能力,这3个指标越接近于1时表示模型越稳定可靠,Q2 > 0.5表示模型的预测能力较好,Q2 < 0.5表示模型的预测能力较差。p1,p2分别表示第一,第二主成分。
VIP值结果表
Name为表示变量的名称,Variable Importance for the Projection (VIP),变量投影重要度,衡量每行变量对每列变量分类判别的影响强度和解释能力,辅助标志物的筛选。通常以VIP值>1作为筛选标准。
参考文献
[1] Szymanska, E., E. Saccenti, AK. Smilde, and JA. Westerhuis. 2012. “Double-Check: Validation of Diagnostic Statistics for PLS-DA Models in Metabolomics Studies.” Metabolomics 8 (1, 1):3–16.
[2] Chailurkit LO, Paiyabhroma N, Sritara P, et al. Independent and Opposite Associations Between Branched-Chain Amino Acids and Lysophosphatidylcholines With Incident Diabetes in Thais. Metabolites. 2020;10(2):76.
Q1:文件如何上传?
①工具数据可上传至我的数据→工具数据→personal文件夹。
②点击右上方“上传文件”即可上传本地文件至平台,在personal文件夹下也可新建文件夹。
Q2:上传的文件如何删除?
勾选文件/文件夹,点击右上方的文件操作,选择删除文件,文件也可移动或复制。
Q3:运行工具时选择好上传的文件后,无法进入下一步?
由于显示器分辨率的不同,弹出框展示可能不全,正常展示如下图所示,选择文件后,弹出框右下角为【确定】按钮,您可以按住ctrl键向下滑动鼠标缩小页面至窗口显示完全。
Q4:云工具的运行结果怎么查找?
我的分析→工具总览可查看所有运行的工具任务。点击【结果】查看分析结果报告,点击【下载文件】可下载结果文件至本地保存。