R 生存分析3:Cox等比例风险回归及等比例风险检验

06-11 1816阅读

虽然Kaplan-Meier分析方法目前应用很广,但是该方法存在一下局限:

  1. 对于一些连续型变量,必须分类下可以进行生存率对比

  2. 是一种单变量分析,无法同时对多组变量进行分析

  3. 是一种非参数分析方法,必须有患者个体数据才能进行分析

英国统计学家David Cox在1972年进一步拓展了Kaplan-Meier,将性别和年龄等因素包含在内,也就是Cox Proportional Hazard Model(Cox回归),该方法可以用来预测一个或多个不同变量在某一时间对死亡率的影响。它同时适用于数值变量和类别变量,可以同时评估几种风险因素对生存时间的影响,检验特定因素如何影响特定时间点特定事件(例如,感染,死亡)的发生率因此广泛应用于生物医学的统计和分析。

R 生存分析3:Cox等比例风险回归及等比例风险检验

   (Remembering Sir David Cox, 1924–2022)

值得注意的是Cox回归的是一种半参数法,其分布本身同样也不含参数假设,只是性别、年龄等影响因素对生存概率的影响是用参数来表达的。本文主要内容是对COX回归及该方法使用前提等比例风险假设进行介绍,具体包括以下内容:

  • COX回归的原理及假设

  • 如何在R语言中实现单变量COX回归

  • 如何在R语言中实现多变量COX回归

  • 绘制森林图展示多变量COX回归结果

  • 如何在R语言中对生存数据进行等比例风险检验

    2.原理及假设

    在生存分析文献中,预测变量(或因子)通常称为协变量,发生率被称为风险率。Cox 模型核心是由h(t)表示的危险函数,可理解为在时间 t 死亡的风险,其模型算法如下:

    在上述模型中称为基线风险函数,与其他形式的回归一样存在β项乘以每个预测变量。由于基线风险表示协变量值均为 0 或处于参考水平的个体的风险,所以类似于线性回归模型中的截距。另外由于基线风险函数不依赖于任何参数,并且在估计模型参数时完全消失,因此,Cox 回归输出不包括截距。在上述模型中, β 表示风险比 (hazard ratio,HR),HR> 1的协变量被称为不良预后因素;HR%    filter(start == 0)

    1.   单变量COX回归

    使用coxph函数对干预措施进行单变量COX回归:

    bladder1.cox.1 |z|)
    treatmentpyridoxine    0.270
    treatmentthiotepa      0.205
                        exp(coef) exp(-coef) lower .95
    treatmentpyridoxine    0.7024      1.424    0.3750
    treatmentthiotepa      0.6818      1.467    0.3769
                        upper .95
    treatmentpyridoxine     1.316
    treatmentthiotepa       1.234
    Concordance= 0.533  (se = 0.038 )
    Likelihood ratio test= 2.05  on 2 df,   p=0.4
    Wald test            = 2.07  on 2 df,   p=0.4
    Score (logrank) test = 2.09  on 2 df,   p=0.4
    

    通过HR的置信区间和P值可以看出三种干预措施对减少患者转移风险上没有统计学差异。

    2. 多变量COX回归 

    使用coxph函数对所有变量进行多变量COX回归

    bladder1.cox.2 |z|)    
    treatmentpyridoxine 0.289585    
    treatmentthiotepa   0.077904 .  
    number              0.000102 ***
    size                0.426761    
    ---
    Signif. codes:  
    0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
                        exp(coef) exp(-coef) lower .95
    treatmentpyridoxine    0.7108     1.4068    0.3780
    treatmentthiotepa      0.5763     1.7351    0.3123
    number                 1.2872     0.7769    1.1333
    size                   1.0607     0.9428    0.9172
                        upper .95
    treatmentpyridoxine     1.337
    treatmentthiotepa       1.064
    number                  1.462
    size                    1.227
    Concordance= 0.642  (se = 0.038 )
    Likelihood ratio test= 14.94  on 4 df,   p=0.005
    Wald test            = 16.55  on 4 df,   p=0.002
    Score (logrank) test = 17.75  on 4 df,   p=0.001
    

    多变量COX回归结果显示,初始肿瘤数量增加了风险,因此预后更差。

    3. 森林图(forest plot)绘制

    使用ggforest函数对回归结果进行森林图绘制

    ggforest(bladder1.cox.2, data = bladder1)
    

    R 生存分析3:Cox等比例风险回归及等比例风险检验

    4. 等比例风险检验R语言实现

    等比例风险(PH):在任意一个时间点,两组人群发生时间的风险比例是恒定的;或者说其危险曲线应该是成比例而且是不能交叉的;也就是如果一个体在某个时间点的死亡风险是另外一个体的两倍,那么在其他任意时间点的死亡风险也同样是2倍 ,但是有时在研究过程中会遇到延迟反应、假性进展,从而导致生存曲线(如PFS)早期就纠缠在一起,几个月后才分开,这时Cox模型的假设就不成立了。

    在进行COX回归前,通常需要进行以下三种检验:

    • 使用Schoenfeld residuals 检查等比例风险(proportional hazards)

    • 使用Deviance residual 检查异常值(outliers);

    • 使用Martingale residual检查风险与协变量之间的非线性关系( non-linearity)

      1. 使用Schoenfeld residuals进行等比例风险检验

      test.ph.2 
VPS购买请点击我

文章版权声明:除非注明,否则均为主机测评原创文章,转载或复制请以超链接形式并注明出处。

目录[+]