统计211

 找回密码
 立即注册

QQ登录

只需一步,快速开始

查看: 5691|回复: 0
打印 上一主题 下一主题

生存分析中的截尾数据

[复制链接]
跳转到指定楼层
1
发表于 2016-4-8 21:16:38 | 只看该作者 回帖奖励 |倒序浏览 |阅读模式
    对于生存分析的学习者来说,截尾数据并不陌生。举个例子:某个课题组打算研究乳腺预后生存的影响因素,自2000年1月1日起开始收集病例,2010年12月31日截止随访。那么在2000.1.1至2010.12.31期间,随访的患者可能会出现哪些结局呢?
1.死亡 2. 存活 3. 失联
    一、基本概念
    以上三种结局概括了患者可能出现的所有可能。那么根据我们的研究目的,即乳腺癌患者术后生存情况的影响因素,我们需要先明确几个概念:
    ★终点事件:本例中的终点事件为“因乳腺癌死亡”  
    ★完全数据(complete data): 观察对象在观察期内出现终点事件,这时记录到的时间信息是完整的。
    ★截尾数据(censored data): 在研究截止时,尚未观察到研究对象出现终点事件,常在数据的右上角以符号“+”标识。
    ★生存时间:广义的生存时间指从某个起始事件开始,到某个终点事件的发生所经历的时间。
     所以,上面提到的“1. 死亡 2. 存活 3. 失联”,存活、失联和因其他原因(乳腺癌出外)死亡的,都是截尾数据。
    二、截尾数据分类
    1、点截尾
    左截尾  大概举个例子,如果要观察从感染乙肝开始,到发展为肝硬化的时间。研究过程中,有位患者不知道什么时候感染乙肝的,只知道现在是乙肝感染者。这种起点不明的情况,就是左截尾。当然,只有在研究需要收集起点数据的时候,才需要考虑左截尾。所以实际临床中,左截尾应用较少。
    右截尾  就是终点不明。例如本文的例子,想观察死亡率,如果患者没有出现死亡,就是右截尾。所谓没有观察到死亡,包括:(1) 没有到研究规定的最长随访期就失访/脱落了,即在最长随访期时结果不明;(2) 到了研究规定的最长随访期,却还没死,即到了最长随访期、没有发生死亡(或者研究规定的其他终点事件)。第(2)种情况,一般认为不会引起偏倚,但是第(1)种情况,如果多的话,会影响结果的可信度,就会引起偏倚。
    2、段截尾
    截尾出现的形式是一段时间。比如假设实验中,很确定HIV向AIDS的转变是在某特定时间轴内,那么这个就是段截尾。
    三、截尾数据和删失数据
    对于“截尾数据”和“删失数据”,有人说是一个意思,有人说具体含义不同,还有资料显示生存分析常用左删失和右截尾,有资料则使用左截尾和右删失,到底是咋回事呢?
    zz思考了一下~总结如下,供大家参考,
    删失和截尾的共同点:都具有partially known,也就是不完整性这个特点。
    删失: 是由于观测时间的限制或其他原因造成样品中途退出试验而未看到失效的发生或具体的失效时间不确定。对于右删失的样品,我们可以肯定在删失时间后的某个时间会发生失效。(右删失:小于或等于某设定点的所有实验对象。比如,实验要研究25岁前,男性的年龄和抽烟量的关系。首先要知晓每个人的年龄,这样就能保留所有小于25岁年龄的男性样本)。
    截尾:截尾的数据往往都来自于截尾分布,而且只有左截尾和右截尾,书面上来讲就是在一个特定的区域内到底有没有失效发生是不知道的。
  
其实在生存分析中,删失和截尾的处理方法相近,区分的意义不大,但是在经管学科领域,感觉还是有些区别的,也欢迎大家后台提出意见,一起探讨,共同进步。

分享到:  QQ好友和群QQ好友和群 QQ空间QQ空间 腾讯微博腾讯微博 腾讯朋友腾讯朋友
收藏收藏 转播转播 分享分享 分享淘帖 支持支持 反对反对
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则


免责声明|关于我们|小黑屋|联系我们|赞助我们|统计211 ( 闽ICP备09019626号  

GMT+8, 2025-4-1 00:15 , Processed in 0.077814 second(s), 21 queries .

Powered by Discuz! X3.2

© 2001-2013 Comsenz Inc.

快速回复 返回顶部 返回列表