科研助手Logistic回归分析中如

北京中科皮肤医院好不好 http://m.39.net/pf/a_5154126.html

Logistic回归分析是流行病学研究中经常用到的统计方法,对相关预测指标的规律、关联性进行挖掘、提炼、整合,构建多变量的临床预测模型,最终根据此模型有目的地评价患者的疾病发生风险或预后情况,从而为预防疾病或提高预后进行有针对性的临床决策[1]。最优模型的建立决定了临床预测的准确性,对于指导临床工作具有重要意义。

临床预测模型建立的步骤可以分为模型构建——模型评价——模型验证。模型构建涉及到变量的筛选、预测框架的初步建立;模型评价用于观察模型与本次数据的拟合情况;模型验证是将构建好的模型外推至临床工作中,以检验该模型是否能很好地解决临床问题。三项步骤并非单向不可逆推进,当模型评价不合格或模型验证不合格时均需要回到模型构建步骤,调整模型自变量,从而逐步建立最优临床预测模型。

(1)模型构建中变量筛选最常见的方法是单因素分析,先广泛纳入临床变量进行初步检验,将单因素分析结果显示有意义的变量再纳入多因素分析模型中,从而剔除混杂因素,寻找出真正影响因变量的因素。但当变量数目过多、变量间存在共线性或者纳入了存在较多缺失值的样本时,单因素分析的结果就存在局限性。这种情况下就需要进行自变量的筛选,保留更为重要的变量,删除次要或可替代变量,从而减少变量之间的重复。自变量筛选可以借助岭回归、随机森林模型等方法。岭回归是对最小二乘回归的一种补充,通过使损失函数最小化来来换取高的数值稳定性,提高计算精度;随机森林模型是树模型的扩展,可产生高准确度的分类,在决定类别时评估变数的重要性,并且样本中存在资料遗失时仍可以维持较高的准确度,适用于存在缺失值的样本[2]。

(2)模型评价中涉及多种指标拟合情况的评价,消除模型中欠拟合情况,可以用到卡方拟合优度检验、ROC等方法。卡方拟合优度检验是一种非参数检验方法,只针对于类别数据,用于研究实际比例情况是否与预期比例一致;ROC涉及曲线下面积、灵敏度、特异度、准确率等参数,是预测模型鉴别能力的评价方法,其根据不同阈值将研究对象分为阳性与阴性两类,将预测灵敏度与特异度以图示方法结合在一起,可准确反映模型预测价值。

(3)模型检验可展示模型的过拟合情况,也就是结果的外推性是否良好。模型检验的结果体现了该预测模型在临床工作中的指导价值,若在此阶段发现模型存在过拟合状况,也就是说所构建的模型可以很好地预测本次样本,但无法预测新的样本,这就需要返回模型构建阶段重新拟合。模型检验可分为内部检验和外部检验,内部检验的目的是检验模型开发过程的可重复性,方法包括随机拆分验证、交叉验证、Bootstrap重抽样等;外部检验考察的是模型的可移植性和可泛化性,常见形式有时段验证、空间验证以及领域验证[3]。

临床预测模型的本意是借助少量的、易收集的、检测成本低廉的预测因子来预测疾病的状态和预后[4],实际情况下在进行临床预测模型构建时,作者通常仅采用单因素、多因素分析,过少的样本量、不同变量的处理方式、缺失值样本往往都会影响模型的准确性,通过对模型构建、模型评价、模型验证各个环节检验结果进行把控,逐渐剔除干扰因素,提高拟合程度,有利于该预测模型在临床的适用,更好地指导临床结局的预测。

参考文献

[1]贾玉龙,周洁,陈颖,等.临床预测模型的综合评价体系研究[J].中国卫生统计,,36(5):-,.[2]夏静.基于有限数据的临床预测模型研究[D].杭州:浙江大学,.[3]王俊峰,章仲恒,周支瑞,等.临床预测模型:模型的验证[J].中国循证心血管医学杂志,,11(2):-.[4]谷鸿秋,周支瑞,章仲恒,等.临床预测模型:基本概念、应用场景及研究思路[J].中国循证心血管医学杂志,,10(12):-,.

整理编辑:林松叶 审校:郑淑

推荐阅读

科研助手

认知障碍相关量表总结

参考文献出处项中的数字著录易错项解析

优文荐读

Nrf2/ARE信号通路激活对偏头痛大鼠神经源性炎症的影响

以突发性耳聋伴眩晕为首发症状的脑栓塞1例并文献复习

《临床医学研究与实践》

-第二届编委会成员名单-

点击查看

长按下方


转载请注明:http://www.shunxiwb.com/nqsys/37304.html