投稿问答最小化  关闭

万维书刊APP下载

临床预后研究如何分析?有3种统计分析范式,您可了解?

2023/3/29 10:49:04  阅读:105 发布者:

很多人一碰到人群的数据,就是做个回归,探讨影响因素,把所有变量放到回归分析,多因素回归分析,出来个结果就完事了。

这显然是一种稀里糊涂的考虑。

实际上,除了随即对照研究之外,临床预后研究根据不同的目的,有3种统计学分析的角度,它们在回归分析的策略上有有所区别,今天我来说两句。

主要是两点区别,筛选自变量的区别、模型评价的区别。

1种,是近年来比较热门的临床预后预测模型。

预测模型的研究,该研究目的是预测患者预后疾病发展,所以是注重于模型整体效果的方法。

它不关注我们挑选的自变量与预后结局指标有没有因果关系,往往要从经济性、可及性、预测效果去挑选自变量。评价自变量的方法不是每个自变量是否具有统计学意义,而是评价该指标的存在是否能够提高模型的性能;而模型的性能往往用R平方、-2倍对数似然值、AICBICAUC面积等指标来评价。

所以,预测模型回归分析,往往是数据驱动的结果。我们分析的时候,往往可以先单后多挑选自变量、lasso法筛选自变量、逐步回归法筛选自变量。

临床预测模型是用较少的自变量达到不差的预测效果。因此有上述做法,最后留在模型的都应该有它的预测价值。

2种,是大家熟悉的多影响因素研究。

影响因素研究,目前被广泛的误用,把它等同于预测模型的研究,也用R平方、-2倍对数似然值、AICBICAUC面积评价,用逐步回归法来筛选自变量。

其实,不是这样的。影响因素研究,不讲究模型建的R平方到底有多大,没有统计学意义的自变量也照样可以留在模型中。

所以没有必要用逐步回归法。

但是影响因素研究,也需要控制自变量数,因为回归模型不允许自变量太多,从建模失败,所以可以采用先单因素再多因素的回归建模策略。

而自变量筛选上与预测模型很大的区别的是,影响因素分析科学的做法,不是数据驱动型,而是理论驱动型,要主动挑选理论上与预后指标有因果关系的指标放入模型。

这样做两点好处,第1,自变量不会太多,第2,没有因果关系的不纳入模型,结果更好解释。

没有认真思考,一股脑纳入所有自变量进行回归分析,得到是垃圾结果。

3种,聚焦单一变量,混杂因素控制研究

这类研究是临床真实世界研究的主要思路,预后研究不再“雨露均沾”,去探讨多个影响因素,而是聚焦于关键1-2个变量(比如治疗措施、关键身体指标)对预后的影响。这类文章容易发好文章。

这类研究第2种分析方法类似的地方是,它也不注重模型整体AUC面积是否大,R平方是否大,它也需要控制自变量数量。

但不同于2种方法,本类研究除了要研究的因素之外,其他自变量挑选更加严格,自变量往往是分组不均衡的指标,自变量的个数也更少,往往局限于人口学、社会经济学、行为缓解等因素,特别要求不能纳入中介变量进入模型,免得会干扰目标研究指标的作用。

此外,多因素回归时,也不用采用逐步回归法,允许没有统计学意义的协变量留在模型;如果自变量较多,一般考虑效应改变法进行自变量的去留考虑。

转自:“医学论文与统计分析”微信公众号

如有侵权,请联系本站删除!


  • 万维QQ投稿交流群    招募志愿者

    版权所有 Copyright@2009-2015豫ICP证合字09037080号

     纯自助论文投稿平台    E-mail:eshukan@163.com