临床预后研究如何分析?有3种统计分析范式,您可了解?
2023/3/29 10:49:04 阅读:105 发布者:
很多人一碰到人群的数据,就是做个回归,探讨影响因素,把所有变量放到回归分析,多因素回归分析,出来个结果就完事了。
这显然是一种稀里糊涂的考虑。
实际上,除了随即对照研究之外,临床预后研究根据不同的目的,有3种统计学分析的角度,它们在回归分析的策略上有有所区别,今天我来说两句。
主要是两点区别,筛选自变量的区别、模型评价的区别。
第1种,是近年来比较热门的临床预后预测模型。
预测模型的研究,该研究目的是预测患者预后疾病发展,所以是注重于模型整体效果的方法。
它不关注我们挑选的自变量与预后结局指标有没有因果关系,往往要从经济性、可及性、预测效果去挑选自变量。评价自变量的方法不是每个自变量是否具有统计学意义,而是评价该指标的存在是否能够提高模型的性能;而模型的性能往往用R平方、-2倍对数似然值、AIC、BIC、AUC面积等指标来评价。
所以,预测模型回归分析,往往是数据驱动的结果。我们分析的时候,往往可以先单后多挑选自变量、lasso法筛选自变量、逐步回归法筛选自变量。
临床预测模型是用较少的自变量达到不差的预测效果。因此有上述做法,最后留在模型的都应该有它的预测价值。
第2种,是大家熟悉的多影响因素研究。
影响因素研究,目前被广泛的误用,把它等同于预测模型的研究,也用R平方、-2倍对数似然值、AIC、BIC、AUC面积评价,用逐步回归法来筛选自变量。
其实,不是这样的。影响因素研究,不讲究模型建的R平方到底有多大,没有统计学意义的自变量也照样可以留在模型中。
所以没有必要用逐步回归法。
但是影响因素研究,也需要控制自变量数,因为回归模型不允许自变量太多,从建模失败,所以可以采用先单因素再多因素的回归建模策略。
而自变量筛选上与预测模型很大的区别的是,影响因素分析科学的做法,不是数据驱动型,而是理论驱动型,要主动挑选理论上与预后指标有因果关系的指标放入模型。
这样做两点好处,第1,自变量不会太多,第2,没有因果关系的不纳入模型,结果更好解释。
没有认真思考,一股脑纳入所有自变量进行回归分析,得到是垃圾结果。
第3种,聚焦单一变量,混杂因素控制研究
这类研究是临床真实世界研究的主要思路,预后研究不再“雨露均沾”,去探讨多个影响因素,而是聚焦于关键1-2个变量(比如治疗措施、关键身体指标)对预后的影响。这类文章容易发好文章。
这类研究第2种分析方法类似的地方是,它也不注重模型整体AUC面积是否大,R平方是否大,它也需要控制自变量数量。
但不同于2种方法,本类研究除了要研究的因素之外,其他自变量挑选更加严格,自变量往往是分组不均衡的指标,自变量的个数也更少,往往局限于人口学、社会经济学、行为缓解等因素,特别要求不能纳入中介变量进入模型,免得会干扰目标研究指标的作用。
此外,多因素回归时,也不用采用逐步回归法,允许没有统计学意义的协变量留在模型;如果自变量较多,一般考虑效应改变法进行自变量的去留考虑。
转自:“医学论文与统计分析”微信公众号
如有侵权,请联系本站删除!