临床预后研究如何分析？有3种统计分析范式，您可了解？

2023/3/29 10:49:04　阅读：105　发布者：

很多人一碰到人群的数据，就是做个回归，探讨影响因素，把所有变量放到回归分析，多因素回归分析，出来个结果就完事了。

这显然是一种稀里糊涂的考虑。

实际上，除了随即对照研究之外，临床预后研究根据不同的目的，有3种统计学分析的角度，它们在回归分析的策略上有有所区别，今天我来说两句。

主要是两点区别，筛选自变量的区别、模型评价的区别。

第1种，是近年来比较热门的临床预后预测模型。

预测模型的研究，该研究目的是预测患者预后疾病发展，所以是注重于模型整体效果的方法。

它不关注我们挑选的自变量与预后结局指标有没有因果关系，往往要从经济性、可及性、预测效果去挑选自变量。评价自变量的方法不是每个自变量是否具有统计学意义，而是评价该指标的存在是否能够提高模型的性能；而模型的性能往往用R平方、-2倍对数似然值、AIC、BIC、AUC面积等指标来评价。

所以，预测模型回归分析，往往是数据驱动的结果。我们分析的时候，往往可以先单后多挑选自变量、lasso法筛选自变量、逐步回归法筛选自变量。

临床预测模型是用较少的自变量达到不差的预测效果。因此有上述做法，最后留在模型的都应该有它的预测价值。

第2种，是大家熟悉的多影响因素研究。

影响因素研究，目前被广泛的误用，把它等同于预测模型的研究，也用R平方、-2倍对数似然值、AIC、BIC、AUC面积评价，用逐步回归法来筛选自变量。

其实，不是这样的。影响因素研究，不讲究模型建的R平方到底有多大，没有统计学意义的自变量也照样可以留在模型中。

所以没有必要用逐步回归法。

但是影响因素研究，也需要控制自变量数，因为回归模型不允许自变量太多，从建模失败，所以可以采用先单因素再多因素的回归建模策略。

而自变量筛选上与预测模型很大的区别的是，影响因素分析科学的做法，不是数据驱动型，而是理论驱动型，要主动挑选理论上与预后指标有因果关系的指标放入模型。

这样做两点好处，第1，自变量不会太多，第2，没有因果关系的不纳入模型，结果更好解释。

没有认真思考，一股脑纳入所有自变量进行回归分析，得到是垃圾结果。

第3种，聚焦单一变量，混杂因素控制研究

这类研究是临床真实世界研究的主要思路，预后研究不再“雨露均沾”，去探讨多个影响因素，而是聚焦于关键1-2个变量（比如治疗措施、关键身体指标）对预后的影响。这类文章容易发好文章。

这类研究第2种分析方法类似的地方是，它也不注重模型整体AUC面积是否大，R平方是否大，它也需要控制自变量数量。

但不同于2种方法，本类研究除了要研究的因素之外，其他自变量挑选更加严格，自变量往往是分组不均衡的指标，自变量的个数也更少，往往局限于人口学、社会经济学、行为缓解等因素，特别要求不能纳入中介变量进入模型，免得会干扰目标研究指标的作用。

此外，多因素回归时，也不用采用逐步回归法，允许没有统计学意义的协变量留在模型；如果自变量较多，一般考虑效应改变法进行自变量的去留考虑。

转自：“医学论文与统计分析”微信公众号

如有侵权，请联系本站删除！

投稿问答最小化 关闭