多元统计学cox课件

申明敬告: 本站不保证该用户上传的文档完整性,不预览、不比对内容而直接下载产生的反悔问题本站不予受理。

文档介绍

多元统计学cox课件

Cox’sproportionalhazardregression比例风险模型——Cox回归\n是一种允许资料有“截尾或终检”数据存在的,可以同时分析众多因素对生存时间影响的多变量生存分析方法。Cox回归\n第一节生存时间一.生存时间概念:狭义的角度来讲,生存时间是患某种疾病的病人发病到死亡所经历的时间跨度。广义的角度来讲,可以把生存时间定义为从某种起始事件到达某种终点事件所经历的跨度。\n例如:我们可以把下列事件作为起始事件和终点事件:起始事件终点事件疾病确诊死亡治疗开始治愈症状缓解疾病恶化接触毒物出现毒性反应接触危险因素发病\n二.两类生存时间数据:(一)完全数据:在随访工作中,当观察到了某患者的明确结局时,该病人所提供的关于生存时间的信息是完整的。我们把到达了明确结局的病人的生存时间数据称为完全数据。用符号“t”表示。\n(二)截尾数据1.定义:在随访工作中,由于某种原因未能观察到病人的明确结局,不知道病人的确切生存时间,随访资料不完整。这样的资料称为截尾数据。2.价值:提供了观察期内的信息,生存时间不会短于观察时间。用符号“t+”表示。3.产生截尾现象的原因:(1)病人失访(2)病人的生存期超过了研究的终止期。(3)在动物实验中,有时预先规定观察期限。\n(三)图示:\n三.生存时间资料的整理:设总共观察了n例病人的生存时间,记第i名病人的生存时间为ti,则全部n例病人的生存时间可以记为t1,t2,…,tn如图1.1中的生存时间(年)按病人号的顺序排列为2,4+,3,1+如果将这些生存时间按由小到大的顺序排列,则得到一个有序的生存时间列为t(1)≤t(2)≤…≤t(n)图1.1中的生存时间有序系列为:1+,2,3,4+。\n几种不同类型的生存时间的例子:例1.120名行输卵管结扎术的妇女经峡部-峡部吻合术后的受孕时间(月)为:1,1,2,3,3,4,4,4,6,6,8,9,9,10,11,12,13,15,17,18。此例中的生存时间均为完全数据,并已按由小到大的顺序排列整理。\n例1.223名行输卵管结扎术的妇女经壶腹部-壶腹部吻合术后的受孕时间(月)为:1,3,5,5,5,6,6,6,7,8,10,10,14+,17,19+,20+,22+,26+,31+,34,34+,44,59。此例为有序生存时间资料,并包括有截尾数据。可在随访期内任何时点上发生截尾类型称为随机截尾(randomcensoring)。本例中的截尾就是随机截尾。\n例1.315只雌性大白鼠接触毒物DHG后观察12周,其生存时间为:4,6,8,9,9,10,10,10,11,12,12,12+,12+,12+,12+。此例是一个定时截尾数据的资料,所有到第12周未死亡的动物的生存时间都属于截尾数据。\n例1.4当观察单位较多时,可以按一定的时间区间分段整理。设在第i个时间内(ti,ti+1)开始时的病人数为ni,在此区间内的死亡数为di,则在第i+1个区间开始时的病人数为ni+1=ni-di。分组资料情况见下表。\n四.生存分析的方法:一般可以分为参数、非参数、半参数三类。1、生存时间的分布符合某一特定类型,如对数正态分布、weibull分布、指数分布等,则可以用特定的分布函数分析,这称之为参数法。2、若不知道生存时间的分布类型,而对分布或其某些特征作推断,就只能用半参数或非参数法。如:用寿命表估计期望寿命;用Kaplan-meier法求生存率,作生存曲线;用logrank检验等作不同组别生存过程差异的显著检验,均属非参数法。3、由于Cox比例风险模型不是直接利用时间t的全部信息,而只是利用了时间t所提供的顺序统计量的信息,故有人称之为半参数方法。\n第二节Cox比例风险回归一.模型结构:设有n名病人,第i名病人的生存时间为ti,同时该病人具有一组伴随变量xi1,xi2,xi3,…,xip。该病人生存到时间ti的风险函数hi(t)是其基础风险函数h0(t)与相应伴随变量的函数的乘积,写成数学表达式为hi(t)=h0(t)·exp(β1xi1+…+βpxip)\nCox证实伴随变量的函数具有指数形式,故Cox的比例风险回归可写为hi(t)=h0(t)·exp(β1xi1+…+βpxip)2-1风险函数:表示一个生存到时间t的病人,从t到t+Δt这一非常小的区间内死亡的概率极限。实际工作中,h(t)可用在时间区间(ti,ti+1)内的死亡人数对该区间开始时的病人数之比来估计。如:表1-1所示。In[hi(t)/h0(t)]=β1xi1+…+βpxip2-2相对风险度的自然对数值β的意义\n二.回归系数的估计方法:危险集(riskset)的意义:是这群病人虽然恰在ti之前尚生存,但处于危险之中,将在ti及以后陆续死亡(或失访)而退出。Cox提出第i例病人在时间ti上死亡的条件似然函数(或称偏似然函数)li为:\nSεRi表示所有属于危险集Ri中的病人。当有截尾数据ti+时,由于该病人只提供了在ti尚生存的信息,而不知道他以后的确切死亡时间。因此,其只能包含在Ri中,而不能直接构成其似然函数。为方便构成整体似然函数,用指示变量来定义Ri是否为完全数据,其赋值规则为:\n对全部n例病人的资料所构成的条件似然函数为:当同一时点ti上有mi(≥1)例重复死亡例数时,Breslow建议采用下面的条件似然函数:\n三.实例:\n一名有巩固治疗的病人(x3=1)和一名无巩固治疗的病人(x3=0)相比,其相对危险度的计算是:hi(t)/h0(t)=exp[b3(1-0)]=exp(-1.8870)=0.15(倍)x2(淋巴结浸润)每增加一个等级,其相对危险度变为:hi(t)/h0(t)=exp(b2)=exp(0.4998)=1.65(倍)\n对于“50例急性淋巴细胞白血病人的资料”如将生存时间的赋值划为二分类变量,即:Y=1(生存一年以内)0(生存一年以上)采用Logistic回归分析,结果如下:\n第三节应用比例风险模型的注意事项1.在应用风险比例模型时,允许有“失访”或“终检”现象,影响因素x可以是计量资料、计数资料或等级资料。该模型可对多个因素及其交互项同时作分析。2.比例风险模型中的hi(t)及h0(t)称之为风险率或死亡率,该指标可以是多种,如发病率、转化率等相对指标。在数理统计上可统称为风险率或风险函数。3.以比例风险模型作分析时,也可以估计相对危险度。某因素的相对危险度就是eβi。\n谢谢!
查看更多

相关文章

您可能关注的文档