- 2022-08-13 发布 |
- 37.5 KB |
- 42页



申明敬告: 本站不保证该用户上传的文档完整性,不预览、不比对内容而直接下载产生的反悔问题本站不予受理。
文档介绍
卫生统计学 logistic
第十四章多因素对某分类指标的影响分析—Logistic回归分析(P229)Logistic回归分析:logistic回归属于概率型非线性回归,它是研究二分类结果/多分类结果与一些影响因素之间关系的一种多变量分析方法优点:模型符合生物学发展规律;可以避免多元线性回归处理二分类反应变量出现的缺陷;引入相对危险度/优势比的概念,更好地理解因素与反应变量间的联系强度用途:除了流行病学病因探索外,还可以用于实验研究中药物或毒物的剂量-反应分析、临床试验评价及疾病的预后分析2007-12-11\n第一节Logistic回归分析一、基本概念Logistic回归模型/回归方程Logistic函数图形Logistic回归方程的特点二、Logistic回归模型的配合\nLogistic回归模型/回归方程应变量Y是一个二值变量,取值为1 出现阳性结果(发病、有效、死亡等)Y=0出现阴性结果(未发病、无效、存活等)表示在m个自变量的作用下Y阳性结果发生的概率为:P=P(Y=1|X1,X2,…,Xm)模型为:\nP的logit变换式中β0表示暴露剂量为0时个体发病与不发病概率之比的自然对数βi,回归系数,表示自变量xi改变一个单位时,logitP的改变量\nLogistic函数图形ZP\nLogistic回归模型/方程的特点自变量任意取值,应变量P的变化范围为0~1;回归系数与优势比(比数比)有直接的联系;表示在两个暴露水平Xj=C1相对于Xj=C0的风险比值情况\n二、Logistic回归模型的配合非条件Logistic回归模型:主要设计类型(完全随机设计case-controlstudy,cross-sectionalstudy)条件Logistic回归模型:主要设计类型(配比设计case-controlstudy,\n非条件Logistic回归模型研究中收集资料的格式\n(一)应变量为二分类的Logistic回归模型应变量为两分类变量自变量可以是无序分类变量、有序分类变量,也可以是数值变量,注意非数值变量值要数量化。\n例题例14-1.为研究病情x1(0表示不严重,1表示严重)、年龄x2(岁)及不同治疗方法x3(0表示传统疗法,1表示新疗法)对某病疗效的影响,某研究者随机抽取40名某病的患者,其中有20名患者采用传统疗法,另20名患者采用新疗法,经过一段治疗后记录下康复的情况y(0表示未康复,1表示康复),结果如下表:\n\n病情(x1)、年龄(x2)及不同治疗方法(x3)对某病疗效影响的单因素分析结果\n单因素分析的缺陷由于受到混杂因素的影响,有时单因素估计暴露与结局之间的关系不能真实地反映两者之间的联系,可能是一种虚假的联系;所以在统计分析策略上,如果混杂因子较少,可以用Mantel-Haenszel分层分析的方法(其缺点是最多调整2层)procfreq;tablesx1*x3*y/chisqcmh;run;(调整x1)OR=5.29(95%CI:1.26~22.25)\n引入多因素Logistic回归分析方法可克服Mantel-Haenszel分层分析方法的缺点也就是说,如果调整了其它混杂因素后,主研究因素仍有统计学意义,说明某因素与结局之间关联是独立的。\nLogistic回归模型参数估计方法最大似然函数估计法(maximumlikelihoodestimate)SAS软件采用迭代重加权最小二乘法(Iterativelyreweightedleastsquaresalgorithm)对式(14-11)求极大值,解得各回归系数值、估计值的方差、标准误、OR值及95%CI等,并进行各种假设检验。标准回归系数可在程序过程语句中加入选择项“STB”获得,用来比较各因素的相对重要性\nLogistic回归模型的相关假设检验整个模型的检验:AIC检验法(AkaikeInformationCriterion)、SC检验法、(SchwarteCriterion)似然比检验法(最可靠)、计分检验法(Score)和Wald检验法各个回归系数的检验:Wald-χ2检验法拟合优度检验(Goodnessoffitstatistics)HosmerandLemeshow法\n程序说明proclogisticdescendingsimple;modely=x1-x3/stblackfit;run;模型中默认以应变量的低值为反应变量,如果加Descending,则以高值为反应变量。\n结果解释\nLogistic逐步回归proclogisticdescendingsimple;modely=x1-x3/selection=stepwisesle=0.1sls=0.1detailsstblackfit;unitsx2=-5;run;\n(二)应变量为有序分类变量的Logistic回归模型分析各种因素自变量对有序分类变量(k>2)的影响\n\n\n\n例14-2某医院外科采用两种不同绷带(X1=0为第一种绷带,X1=1为第二种绷带)和两种不同的包扎方式(X2=0为第一种包扎方式,X2=1为第二种包扎方式)进行腿部溃疡处理。治疗效果分为三个等级:不愈、有效、痊愈(Y=0为不愈,Y=1为有效、Y=2为痊愈)。治疗结果如表14-3所示。试分析不同的治疗方式对治疗效果的影响。\n\n程序运行结果及解释\n\n\n(三)应变量为无序多分类变量的Logistic回归模型应变量的水平数大于2,各水平之间又不存在等级大小次序先后的关系Andeson1972年提出了多分类变量的logistic回归模型,是通过拟合广义Logit模型的方法进行的。若应变量有K个水平,其中有一个水平为对照水平,可以用其它K-1个水平与对照水平相比较,拟合出K-1个广义Logit函数CATMOD(CATegoricaldataMODeling)过程模块进行分析\n第二节条件Logistic回归在研究设计阶段,为控制混杂干扰因素常按干扰因素的不同取值设置相匹配的配比组,病例与对照之比为1:1或1:M。在统计分析阶段应把这种配对的对子或匹配的配比组看成一个整体进行处理与分析。\n\n\n一、1:1的配对设计的条件Logistic回归模型\n\n程序及结果解释drop:在数据中最后不保留id1,gall1,hyper1;Retain:初始值为0,如变量值以后改变,将保持改变后的值直至再改变条件logistic回归,差值为病例-对照,则反应变量为病例\n用phreg过程拟合1:1条件logistic模型Time定义:病例为0,对照为1;括号中的数值代表对照的定义值;Strata为配对号变量;ties=discrete表示拟合离散的Logistic回归模型基本程序格式:procphreg;modeltime*y(0)=Gallhyper/ties=discrete;strataid;run;\n二、1:M的匹配设计条件Logistic回归模型\n\n第三节Logistic回归模型的医学应用及其注意事项医学应用分析流行病学的研究中进行危险因子的筛选。校正混杂因子Logistic曲线拟合可用于分析药物或毒物的剂量反应。医学中不少指标之间呈S型曲线形状的剂量反应关系,拟合成Logistic曲线可以对有效剂量、半数致死量等指标进行确定,并可对剂量反应的趋势做出分析。判别分析与预测。Logistic回归模型是概率模型,它对数据的分布没有严格的要求,可以根据历史上已经获得的经騐资料拟合出的回归方程很方便地进行判别分析及对未发生的事件进行预测。\n注意事项注意变量的类型。应变量是分类变量,自变量可为各种类型变量。与线性回归分析时一样,当为分类变量时注意变量的数量化。要有足够的样本量。一般应多于多重线性回归分析时所需的样本,样本量大于自变量个数的20倍,配比组设计时,配比组数宜大于50。因素间的交互作用。Logistic回归模型可以分析处理因素间的交互作用,但是交互作用的模型为“乘法模型”。在用SAS软件处理时,应在数据步中将考察交互作用的自变量相乘产生一个新的自变量后参加计算分析过程。\n一般先做单因素卡方检验,尽量将回归效果显著的自变量选入回归方程中,作用不显著的自变量排除在外。专业上比较关心的因素(虽然无显著意义)年龄、文化程度等一般要作为调整因素进入模型要避免相关性较高的因素(r>0.7)一起进入模型,否则易引起多重共线性具体SAS程序也可用:逐步回归法(但现在不提倡)\n注意:要注意应变量的赋值,SAS默认低值为反应变量或你所认为的阳性值;要改变反应变量的顺序可用descending,改变此顺序。应变量也是以低值为参比组查看更多