活动专享

多因素生存分析-COX

生存分析常用于临床分析,用于死亡、疾病的发生、复发和痊愈的研究。Cox回归模型原理是采用半参数法,即不需要生存时间的分布,但最终是通过模型来评估影响生存率的因素,能够进行多因素的生存分析,使用率非常广泛。
文章引用说明:如果您使用美吉生物云工具完成了数据分析,我们期望您在文章发表时,在方法学部分或致谢部分引用或提及美吉生物云工具以及我们发表的文章。
可参考示例:The data were analyzed on the online tool of Majorbio Cloud Platform (https://www.majorbio.com/tools)
可参考文献:Han, Jichen. et al. 2024. Majorbio Cloud 2024: Update single-cell and multiomics workflows. iMeta, e217, doi:10.1002/imt2.217
  • 帮助文档
  • FAQ

Cox多因素生存分析

描述说明

生存分析常用于临床分析,用于死亡、疾病的发生、复发和痊愈的研究。Cox回归模型原理是采用半参数法,即不需要生存时间的分布,但最终是通过模型来评估影响生存率的因素,能够进行多因素的生存分析,使用率非常广泛。

 

帮助文档

一、工具概述:比例风险回归模型(proportional hazards model,简称Cox模型。用Cox风险比例模型来分析变量对生存的影响,可以分析两个及两个以上的因素,在生存分析中应用广泛。

 

二、操作方法:

输入

1. 生存统计表(必填):生存统计表文件格式说明如下,必须是txt格式的文本文件,数据与数据之间务必用制表符(tab符)隔开,不能用空格。

图片1.png 

注:生存统计表包含以下几列信息,第一列为样本id;中间几列为变量名称以及变量赋值情况;time表示生存时间;status表示结局,死亡或者观测变量终止点即为2,截尾数据即为1Timestatus这两列为必填,其他根据具体变量情况选填。以本示例为例,其他变量具体如下:

因素

变量名

赋值说明

年龄

age

病人实际年龄(年)

性别

sex

=1,女=0

ECOG从患者的体力来了解其一般健康状况和对治疗耐受能力的指标)得分

ph.ecog

具体见补充信息

医生对Karnofsky功能状态评分标准

ph.karno

具体见补充信息

Karnofsky表现评分,按患者评分

pat.karno

具体见补充信息

用餐时消耗的卡路里

meal.cal

卡路里消耗量(cal

最近六个月的体重减轻量

wt.loss

kg

 

补充信息:

体力状况ECOG评分标准 Zubrod-ECOG-WHO (ZPS5分法)

级别

体 力 状 态

0

活动能力完全正常,与起病前活动能力无任何差异。

1

能自由走动及从事轻体力活动,包括一般家务或办公室工作,但不能从事较重的体力活动。

2

能自由走动及生活自理,但已丧失工作能力,日间不少于一半时间可以起床活动。

3

生活仅能部分自理,日间一半以上时间卧床或坐轮椅。

4

卧床不起,生活不能自理。

5

死亡

②Karnofsky(卡氏,KPS,百分法)功能状态评分标准

体力状况

评分

正常,无症状和体征

100

能进行正常活动,有轻微症状和体征

90

勉强进行正常活动,有一些症状或体征

80

生活能自理,但不能维持正常生活和工作

70

生活能大部分自理,但偶尔需要别人帮助

60

常需要人照料

50

生活不能自理,需要特别照顾和帮助

40

生活严重不能自理

30

病重,需要住院和积极的支持治疗

20

重危,临近死亡

10

死亡

0

得分越低,健康状况越差,若低于60分,许多有效的抗肿瘤治疗就无法实施。

 

2. 临床数据选择(选填):临床数据选择指的是在生存统计表中选择需要作图的生存变量信息,如年龄性别等。文件格式说明如下,必须是txt格式的文本文件,只能存在一列,无需表头,直接写需要作图的变量信息。

图片2.png 


3. 基因选择(选填):基因选择指的是用于cox生存分析的基因ID或者名称。该基因可以是miRNAlncRNA或者mRNARNA类型对应的基因信息。文件格式说明如下,必须是txt格式的文本文件,只能存在一列,第一行为seq_ID,表示需要作图的变量信息。



1608948356164549.png

4. 表达量矩阵:选择基因选择这一变量条件时,会对应出现表达量矩阵这一参数设置框。该处表示测得的基因/转录本表达量信息。表达量可以是原始count矩阵表也可以是经过FPKM/TPM/RPKM等计算的矩阵表。但请注意,此处不支持经过log转换的矩阵表信息。文件格式说明如下,必须是txt格式的文本文件,第一列为基因/转录本ID/名称,其他列为各样本的具体表达量数值。具体见下:

图片4.png 

备注:临床数据选择和基因选择二者可同时填写,也可只填其一。二者皆不填写则不支持运行。

三、结果解读:

程序将根据生存统计表和参数输出COX生存分析结果表和森林图,并提供表格下载与PDF格式的图片下载。

1. COX生存分析结果表:

1608948378650724.png 

注释:图中展示了影响某一事件生存时间多因素分析。第一列代表各个因素;

a. β值表示回归系数标准化的回归系数代表自变量也就是预测变量和因变量的相关,至于为什么要标准化,因为标准化的时候各个自变量以及因变量的单位才能统一,使结果更精确,减少因为单位不同而造成的误差

b. HR95% CI for HR):HR: HAZARD RATIO风险比;95% CI:置信区间为95%。指的是指的是风险比(95%置信区间的上下限)

c. Wald.testWald检验,计量经济学里面最常用的检验方法之一。其方法要估计非受限的模型。具体解释Wald检验,我们可以假设有一个模型,参数为β,我们要检验的原假设是:H0: f(β)=0那么构建Wald检验的方法是,首先根据估计的β计算出β的协方差矩阵,然后使用Delta method 计算出f(β)的(协)方差,Wald统计量可以构造为:

图片6.png 

其中q为限制的个数(即f的维数)。Wald test可以用来判断变量的联合显著性,两个或多个变量的系数是否相等等

d. P_value表示未经校正的p值,p值代表富集出来的结果是否具有统计学上的显著意义,p值越小,在统计学上就越有显著意义;

e. COX生存分析森林图:

1638339013329443.png 

注:图中展示了各个因素的森林图。Hazard Ratio(95% Cl)指的是风险比(95%置信区间的上下限)P_value:表示未经校正的p值,p值代表富集出来的结果是否具有统计学上的显著意义,p值越小,在统计学上就越有显著意义。一般认为P_value<0.05的变量为此疾病条件下的重要影响变量。

 


Q1:文件如何上传和删除?

①通过云工具页面上的选择文件按钮可以上传本地文件到云工具文件夹中,上传成功后可以直接选择目的文件进行分析。

图片1.png

②可以在项目中心——工具数据——我的云工具文档 文件夹中查看、上传和删除云工具文件。

图片2.png

图片3.png

Q2:运行成功的任务在哪里查看结果?

投递运行的任务可以在项目中心——我的工具任务 中查看运行状态和结果,点击“结果”可查看页面运行结果,点击“文件”可查看结果文件夹,如果运行失败可以点击“排查”查看报错原因。部分工具没有结果按钮只有文件按钮。

图片4.pngQ3:云工具任务如何删除?

运行失败或不需要的任务可以在项目中心——我的工具任务中勾选后删除,删除的文件会在回收站保存30天,期间可随时复原。

图片5.png

在线咨询