投稿问答最小化  关闭

万维书刊APP下载

【文献译读93】关于运动对认知影响的随机对照试验的伞状综述

2023/4/4 14:35:22  阅读:141 发布者:

文献分享会

摘要

广泛的研究表明,定期的运动可以全面提高整个生命周期的认知功能。在此,我们通过对仅限于随机对照试验(RCTs)的meta分析的总括回顾,评估了支持健康人群中这种关系的因果证据。尽管24项审查的meta分析中的大多数报告了积极的整体效果,但我们的评估揭示了主要RCTs的低统计效能、选择性纳入研究、出版偏倚以及预处理和分析决定的组合的巨大差异的证据。此外,我们对修订后的meta分析中包括的所有主要RCTsmeta分析显示,与运动有关的益处很小(d=0.2295% CI0.160.28),在考虑到关键的调节因素(即主动控制和基线差异;d=0.1395% CI0.070.20)后变得非常小,而在纠正了出版偏倚后可以忽略不计(d=0.0595% CI-0.09 0.14)。这些研究结果表明,在积累更多可靠的因果证据之前,在健康人群中把经常性的运动与认知益处联系起来的主张和建议要谨慎。

前言

根据过去一个世纪积累的科学证据,定期运动的生理和健康益处似乎是无可争议的1。此外,不断有研究报告称,定期运动对健康人一生中的认知和大脑都有好处2。这些研究结果推动了当前旨在促进坚持运动的公共卫生政策3,与世界卫生组织一致,该组织目前建议将定期运动作为保持健康认知状态的一种手段4。因此,我们可以说,在健康人群中,长期运动对认知水平的积极影响如今已被视为理所当然。我们在此提出的问题是,这些主张、政策和建议是否得到了科学证据的有力支持。

在许多叙述性评论5和系统性评论6以及相当数量的meta分析7-9中,这些文献的主要结论是:(1)经常进行运动可以提高儿童、青少年和老年人的认知能力,但对年轻人的证据有限;(2)这种影响似乎在执行功能(EF)方面特别普遍,尽管在其他认知领域如记忆和注意力方面也有描述;(3)这种影响的程度往往不大(d=0.2-0.4),尽管是可靠的;以及(4)各种因素可能介导和调节效果(例如,运动强度、干预时间、运动训练模式等)。后一点是这些文章中讨论的主要注意事项,尽管效果本身的存在很少受到质疑。

虽然不经常强调,但科学文献中也有一些评论报告了运动干预对健康人群认知功能有益影响的不确定证据。例如,Verburgh等人10在他们的meta分析中发现,没有证据表明运动干预对认知健康的老年人有任何影响。最近对这一主题进行系统回顾的专家小组11最后也表示,除了数学技能的情况外,没有证据表明体力活动(包括运动在内的更广泛的术语)可以改善儿童的认知或学习成绩。DiamondLing12在一篇有争议的文章中声称,现有的证据表明,有氧运动和阻力运动训练(可以说是被倡导为提高认知能力的最佳运动模式中的两种13)是提高执行功能的低效率工具。

在这篇文章中,总括性评论通过研究仅限于随机对照试验(RCTs)的meta分析评论(目前确定因果关系的黄金标准)来解决这一科学课题的现状,以确定有关定期运动对健康人认知能力的益处的说法是否有坚实可靠的经验证据支持。

结果

从检索到的2000条记录中选出了24项符合纳入标准的meta分析7-9,14-34(图1)。我们在meta分析中确定了271项主要研究,其中我们选择了109项研究(补充表1),这些研究符合我们总体回顾的纳入标准(关于排除标准的详情,见补充资料)。我们从纳入的主要研究中提取了737个效应大小(7项主要研究没有提供效应大小估计所需的信息35-42)。所回顾的meta分析及其各自的主要研究的发表时间反映了过去20年中运动认知课题的指数式增长(图2)。

几乎所有的24meta分析都发现定期运动对健康参与者的认知能力有明显的积极影响(中位数Cohen's d=0.2995% CI0.230.36),结论是运动可以改善认知能力(24项中的22项(参考文献7,9,12-22,24-32))。为了避免使用非目标运动项目或有健康状况的样本的影响,我们只分析了有目标干预措施和健康人群的主要研究结果。重新估计的效果仍然是积极的,尽管是分散的(中位数d=0.1795%CI0.130.19,范围为0.060.39;图3a),并且具有不同的异质性(中位数I2=43.40%,范围为096.91%;图3b)。部分效果和异质性之间的分散可能是由于每个meta分析所采用的纳入标准(补充表1),在运动的类型、参与者的年龄范围或认知结果方面有所不同。其他变异的来源可能来自于单个效应大小的估计方式,或者是meta分析中处理因纳入同一样本参与者的几个结果而产生的依赖性的策略。此外,初级研究的抽样和纳入标准的分歧(见 "研究抽样的差异")可能会影响到meta分析的结果(对所包括的每个meta分析综述的质量评价的全面评估可在以下链接获得:https://osf.io/e9zqf/)。事实上,每项meta分析所包括的主要研究的数量(不包括只有一项研究被纳入的Lindheimer等人17)从每项meta分析的263项研究不等(中位数为11项;图3c)。每项meta分析的平均参与者数量的中位数是78(范围是36-673;图3c)。

由于对现有证据的选择性抽样会影响到meta分析的结果,我们随后对整个研究样本的运动效果进行了评估。我们对24meta分析中包括的所有主要研究进行了多水平meta分析。这个完整的模型作为参考估计来解释所审查的meta分析的结果。我们观察到总体效应为d=0.2295%CI0.160.28P<0.0001,异质性很大,I2=79.52%。平均而言,最初报告的24个效应和重新估计的24个效应分别与完整模型的总效应相差0.150.08。正如预期的那样,纳入的主要研究的数量随着出版年份的增加而增加(Kendall's τ = 0.47, P < 0.001),与主要文章的指数增长同步。相比之下,每个效应的参与者数量并没有随着年份的增加而增加(Kendall's τ = 0.01, P = 0.913),更重要的是,参与者的数量低于d = 0.22的可接受统计能力(即80%)所需的样本量,即与整个初级研究样本的总体效应(即至少652名参与者;与48名参与者的中位数形成对比,范围为10-1476;图3d;关于样本量估计的详情,见方法)。在初级研究层面,只有两项研究43,44达到了等于或高于80%的效能(即≥652名参与者;图3e)。

研究抽样的差异

经审查的meta分析的网络可视化(图4a)显示,不同meta分析之间的差异可能部分是由于在纳入主要研究方面存在分歧。24meta分析共包括109项不同的主要研究,其中28项(25.6%)只包括在一项meta分析中,21项(19.2%)包括在其中两项meta分析中。即使在涉及相同年龄范围和认知结果的meta分析之间,也有明显的重叠现象。例如,有三个侧重于老龄化和一般认知领域的meta分析22,23,25,分别在使用的233425个主要研究中只共享一个主要研究45。虽然这三项meta分析以类似的方法(RCTsmeta分析)在可比的时间范围内(2019年和2020年之间)处理同一主题,但其结果是基于完全不同的证据体。本综述中包括的最新的meta分析33值得特别注意。虽然它与上述三个meta分析涉及相同的年龄目标和认知结果22,23,25,但它没有与它们分享任何主要研究。为了进一步检验meta分析综述之间的这种脱节,我们评估了meta分析进行最后一次检索时,符合各综述纳入标准的初级研究的数量(图4b)。总的来说,meta分析包括了不到一半的符合其标准的现有主要研究(研究的中位数为48.77%)。只有六项meta分析包括了大部分可用的研究(Aghjayan3477%Amatriain-Fernández3180%Angevaren783%Colcombe & Kramer1473%Haverkamp2881%Smith1579%),而在三分之一的meta分析中,所分析的研究占所有潜在目标的35%以下17,20,23,27,29,30,32,33。有关该主题的meta分析文献中的这种缺乏重叠的情况表明,从这些定量审查中得出的结论不能作为多年来积累的经验证据,而只能作为有选择的切片。

影响性变量和出版偏倚

为了检查关键的调节变量(即控制活动的类型、认知结果的类型、年龄范围、训练计划的持续时间和基线表现)的影响,我们使用整个初级研究的样本(即完整的模型)对这些变量的每个层次实施单独的meta分析模型。而对所有年龄组的影响是相似的(老年人:d = 0.2095% CI 0.120.28);成年人:d = 0.3395% CI 0.010.66;儿童和青少年:d = 0.2495% CI 0. 120.36;所有比较P>0.05)和所有类型的认知结果(EFd=0.2295%CI 0.150.28);非EFd=0.1695%CI 0.090.23;总体认知:d=0. 4195%CI 0.000.82;所有比较P>0.05),观察到的好处是被动控制比主动控制活动更大(d = 0.2695%CI 0.170.35;与非身体主动控制相比,d = 0.0895%CI -0.010.17P = 0.007;与身体主动控制相比,d = 0.2095%CI 0.080.33P = 0.426;补充图1a)。即使老年参与者的干预时间(中位数为20周,范围为4-96周)比儿童和青少年(中位数为11周,范围为6-96周),特别是年轻成年人(中位数为6周,范围为4-24周)平均更长,也没有观察到年龄组之间的统计学差异。最后,基线时各组之间的表现差异也占了部分变异性。当实验组基线时的表现低于对照组时,运动的益处更大(β = -0.77P = 0.011;补充图1b)。因此,对照组的类型和基线差异可以解释部分研究间的变异性,将异质性降低到I 2 = 57.21%。包括两个调节器(即控制活动和基线表现)的模型预测,在有主动控制和基线认知表现匹配组的研究中,最终效应下降到d=0.1395%CI0.070.20P0.001。当我们在每个meta分析的主要研究中重新分析这些变量时,完整模型的这些发现没有被复制。在重新分析中,我们再次观察到效果的巨大分散性,在某些情况下,meta分析中的平均估计值与完整模型的估计值不一致(图3f-h)。

关于发表偏倚,24meta分析中只有14项(参考文献9,16,17,21-24,26-28,30,31,33,34)报告了发表偏倚分析,其中大部分采用基于漏斗图的方法(即漏斗图的目视检查、修剪和填充程序以及Egger方法来测试漏斗图的不对称性)。在那些评估中,有7个发现了发表偏倚的证据(14个中有7个(参考文献9,22-24,26,28,34)),其中只有3个调整了最终效果(7个中有3个(参考文献9,22,34))。值得注意的是,其中一项meta分析得出的结论是,即使在发表偏倚校正方法表明效果不显著的情况下,运动对表象记忆也有好处32

我们还测试了出版偏倚的存在,并对有10个或更多主要研究的meta分析(24meta分析中的12个(参考文献8,9,15,19,21-23,25-28,34)的最终效果进行了校正;图5)。我们使用了三种不同的方法来解释来自同一参与者样本的效应之间的依赖性:用同一研究的效应大小的总量进行漏斗不对称性测试(FAT46,三参数选择模型(3PSM47,以及统计意义比例测试(PSST)和过度统计意义测试(TESS48;详见方法)的组合。我们在12meta分析中的9个(参考文献9,15,19,22,23,25-28)观察到至少有一种方法存在发表偏倚的证据。也就是说,在12meta分析中的9个中,较小的主要研究的效应大小往往较大(如FAT所提示的),阳性和显著的结果更有可能被发表(即3PSM)或阳性结果的比例高于给定的meta分析效应和方差的预期比例(根据TESS-PSST)。一般来说,偏倚校正后,最终效果有所下降(图5),当使用meta回归FAT模型的截距作为真实效果的校正估计时,数值最小(即精确效果检验和精确效果估计标准误差法(PET-PEESE)的条件结果49):中位数为0.0195%CI-0.050.05,这在所有情况下是不明显的。然而,3PSM总体上显示出积极但减少的益处(中位数为0.1695%CI0.120.26)。

为了进一步阐明其对该领域的影响,我们评估了整套初级研究的发表偏倚。除了上述三种检测发表偏倚的经典方法(即FAT with aggregates3PSMTESS-PSST),我们还采用了多层次模型(多层次FAT50,51。所有的方法都检测到了发表偏倚的证据,这表明需要对meta分析的效果进行校正。PET-PEESE程序的校正效果可以忽略不计(多级PET-PEESEd=-0.0495%CI-0.160.07P=0.420PET-PEESE与聚集物:d=-0.0195%CI-0.080.06P=0.778)。另一方面,调整后的效果随着3PSM的增加而增加,d = 0.3195% CI 0.150.47P < 0.001,尽管它也随着一组较大的切点(单尾P值为0.0250.050.100.200.400.500.70)而下降,d = -0.0295% CI -0.340.30P = 0.898。鉴于频繁主义推论对非显著性结果的限制,我们应用稳健的贝叶斯meta分析来获得这两种调整方法(即选择模型和PET-PEESE)的模型平均估计数52。贝叶斯meta分析可以在有和无出版偏倚校正的模型中获得最佳的调整后的meta分析效应大小。该模型提出了出版偏倚的有力证据,BFpb648.91,尽管它导致了正效应的不确定证据,BF100.96,后验平均估计值d=0.0595%CI-0.090.14。因此,除了该文献的快速增长外,出版过程似乎更倾向于报告阳性和显著的结果,而不是空洞的结果,特别是在小型研究中。这些发现表明,运动对认知的真正影响可能比meta分析中最初报告的要小,尽管有大量的个别研究,但现有的证据还远不是结论性的。

标准曲线分析(Specification curve analysis

正如我们在前几节所述,所回顾的meta分析的纳入标准不同,可能部分地解释了其结果的差异。然而,即使包括相同的主要研究,由于多种预处理和分析步骤的不同,其结果也可能不同。例如,这些meta分析在估计效应大小和方差的方式、使用有影响力的调节器来调整结果、评估发表偏倚的方法以及处理内效依赖的方法方面都有不同。为了研究所有这些决定对meta分析结果的影响,我们对我们在完整的多水平meta分析中使用的全部主要研究进行了探索性的(非预注册的)标准曲线分析53。分析结果显示,最终效果可能因预处理和分析决定的不同而有很大差异(从d = -0.05d = 0.47;图6)。在回顾的meta分析中,一些常见的规格,如不使用单变量模型处理研究内的依赖性(24个中有9个(参考文献7,8,14,19,27,30,31,33,34)),不校正发表偏倚(24个中有14个(参考文献7,8,14,15,18-20,23-26,28,29,32))或用修剪和填充的方法(2(参考文献9,34 ),这些方法在meta分析实践中不被推荐,导致了更高的效果和更大的可能性。相反,一些提高结果稳健性的保守决定(在修订后的meta分析中很少采用)使最终效果大幅降低:使用多水平模型(24篇中有4篇(参考文献17,21-23))和用PET-PEESE纠正发表偏倚(24篇中有2篇(参考文献9,22))。因此,大多数的meta分析选择了倾向于发现更多积极和显著效应的规格,而决定更保守的meta分析在文献中的代表性不足。

讨论

在这篇综述中,我们研究了经常性的运动会导致整个生命期的认知能力提高这一说法。在重新分析了24RCTsmeta分析后,包括总共109项主要研究和11266名健康参与者,我们发现没有结论性的证据支持在健康人群中定期进行运动可以带来潜在的认知益处。我们的研究结果表明,以前的meta分析综述中报告的运动对认知的影响可能被高估了,总的来说,从RCTs中得到的关于运动-认知联系的因果证据还远不是结论性的。

本综述对过去50年中健康人的运动认知的指数式增长进行了细微的概述。这种快速增长使人们对在普通人群中实施基于运动的干预措施的潜在益处、风险和陷阱有了深入的了解,从而产生了大量的证据。这些证据往往来自力量不足的RCT和可能有偏见的meta分析,显示出不寻常的集群式增长的迹象(也就是说,关于该主题的meta分析并不共享主要的证据来源),尽管有一些说法显示出混合12或矛盾的发现,但运动对认知的有益影响已被视为理所当然54。与最近的说法一致55,我们认为这种低质量证据的指数式积累导致了该领域的停滞而非进步,阻碍了对现有真实效果的辨别。

对已发表的科学发现的复制目前正处于科学辩论的前沿。自从开创性的 "可重复性项目 ": 心理学》56出版以来以来,不同的研究领域都有许多举措来检验经验证据的可靠程度57-59"复制危机"已经动摇了众多领域的基础,并继续质疑许多长期以来被认为是真实的效果。这篇综述是促进科学的透明度、开放性和可重复性的集体努力的一部分。在此,我们勾勒出运动认知meta分析文献的结构性弱点,包括明显的方法论、理论和交流问题。下面,我们简要地提出一系列改进的机会,以指导该领域的未来研究。

在运动-认知领域,充斥着大量针对这种关系的个别实验,这些实验的设计统计能力很低,产生的估计值的精确度和稳定性也很低。虽然进行大样本量的干预研究(脚注3)几乎不是任何一个实验室可以做到的(最近的一个高质量的例外,见Zotcheva等人60),但简化和标准化的实验设计以提高统计效能,促进结果的比较和复制,适当的主动控制组,预注册或多实验室的举措61肯定可以提高这个领域。

值得注意的是,流行病学研究是另一个重要的证据来源,表明运动对改善认知能力有潜在作用62。然而,这类研究也未能显示出一致的证据来支持经常运动能提高认知能力的假说。虽然这些研究确实偶尔报告了与运动相关的认知益处,但在某些情况下,这是由基线差异解释的63。在其他情况下,即使经过多年的练习,运动也与任何认知优势无关43。未来的纵向研究可以帮助辨别定期运动对认知的积极影响的存在,以及不同的调解人和调节人的具体作用。

此外,重要的是要谨慎地重新考虑meta分析的作用,以及它们的结果在多大程度上阐明了这个特定的主题64,65。即使meta分析方法有可能将单个干预研究的一些缺陷降至最低66,但其结果在很大程度上取决于所纳入报告的质量,以及为估计某一特定效果所遵循的方法决定67。因此,meta分析的结果不一定代表某一特定现象的真实效果。正如我们在这里所展示的,从不同的meta分析中得出的特定结论不能被视为多年来积累的经验证据,而只是有选择的切片。此外,对所有可用的证据进行抽样调查(即对初级研究的一个子集进行meta分析)可能会导致不可靠的结果,可能会偏离真实的效果。这也会导致评估调节器和出版偏倚对最终结果的影响的能力下降。

为了使未来的meta分析的结论能够转化为社会建议和基于证据的政策,评论需要尽可能全面。这意味着它们不仅应该包括来自主要文献的知识,还应该包括来自以前的回顾。考虑到运动认知领域明显的出版偏差,即将进行的meta分析应该包括灰色文献的贡献,可以预见的是,其结果并不乐观。最后,在预处理和分析层面,有许多选择可以说是首选。例如,使用基于测试前变化的效应大小估计,以控制基线上预先存在的差异。我们也鼓励使用多水平模型(例如,稳健方差估计(RVE)方法)来说明效应的相关结构,而不需要平均化信息,并通过在模型中识别调节变量来减少异质性。关于发表偏倚的评估,文献中存在的研究数量、异质性或发表偏倚的程度等因素可能会影响现有方法的具体表现68。一个合理的策略是确定meta分析的合理条件,并据此解释结果。作为一种替代方法,稳健贝叶斯meta分析等方法可以根据模型对证据的适合程度进行加权,获得单一的meta分析效应大小,而不需要在几个结果中进行选择。目前,运动认知文献已经足够大,可以实施这种类型的分析,并由此调整最终的效果。

关于这一主题的大量已发表的实验和评论与缺乏一个关于运动诱导的人类认知改善机制的坚定理论模型形成鲜明对比,令人惊讶。对动物模型的研究无疑为可能的神经生物学机制提供了重要的洞察力。例如,经常有报道说,在动物中,偶尔也在人类中,定期运动(1)增加神经元生存的关键生化介质的释放,如脑源性神经营养因子和其他生长因子,如血管内皮生长因子或胰岛素样生长因子-1型(参考文献)。69);(2)抵制随着年龄增长而出现的灰白质萎缩70;(3)增加血管、树突棘的密度和海马的复杂性71;(4)增强突触可塑性72;(5)增加对大脑损伤的抵抗力73;(6)减少中枢和周围的炎症74;甚至(7)调动基因表达谱75。尽管很难将这些发现和各自的假设机制推广到人类身上(因为人类和其他物种之间存在固有的生理和行为差异),但人们还是提出了某些具体的假设来解释人类定期运动的潜在认知益处,如心血管假说76、抗炎假说74或儿茶酚胺假说77。尽管这些假说都是以证据为基础的,但所有这些假说都采用了还原主义的方法,假设与运动相关的益处的机制仅仅来自于分子和细胞水平的生理过程,而对人类运动中所涉及的背景复杂性没有什么意义。事实上,运动远不止是一种引发生理变化的方式。事实上,其他理论模型指出,伴随运动的认知和社会丰富性是其所谓的认知益处的来源(即认知训练假说78),甚至有可能在遗传水平上存在差异,可能解释这种关联(即神经选择假说63)。尽管有数据支持这些假说中的每一个,但到目前为止,没有一个假说能够完全解释所有现有的证据,这些证据似乎指向一个非常复杂的关系,最好描述为一个多因素的现象。这种在理论框架上缺乏共识的情况,由于无数的实验方法阻碍了对不同研究结果的调和,而变得更加突出5。当然,有必要从大脑作为肌肉的比喻中转移出来79,并进一步发展关于这些潜在的运动诱导的认知和神经机制的综合理论模型。

这里报告的结果,加上上述的方法和理论问题,突出了对与经常性的运动有关的潜在认知益处的主张进行细微调整的必要性。然而,发表文章的压力是研究人员和大众媒体共同面临的一个地方性问题。在这两种情况下,都迫切需要发表新奇和吸引眼球的研究结果,以吸引公众的注意力,这有时会导致对科学结果的过度简化、错误表述或过度渲染,而没有正确解释所必需的细微差别和限制。运动认知课题也不能幸免于此。在整个研究过程中采取透明的做法(例如,报告经过偏倚修正的效果),并通过媒体准确地传播科学发现,肯定会改善这种状况80。尽管如此,这只是必要的一步,但还不够。如果没有研究人员愿意透明地报告他们的结果和数据库,没有编辑们协同努力发表有意义的结果(无论这些结果是否是正面的),也没有媒体承诺摆脱夸张的标题和点击率,那么这只是一种徒劳的努力。

尽管总括回顾被认为是干预研究中最高级别的证据,但在解释结果时必须承认其局限性。本综述只关注运动对健康人群的影响,不包括与任何其他认知干预相结合的运动项目。这就使得运动有可能对某些疾病患者(如阿尔茨海默病)的某些认知功能产生促进或保护作用,或者包括身体和认知训练的体力活动(如瑜伽)可以增强运动带来的益处81。此外,本综述仅包括RCTs,但需要注意的是,其他来源的经验证据,如观察性研究或流行病学研究,也应予以考虑。最后,由于遗传和环境因素可能作为混杂变量,所以对研究结果的解释应谨慎。

总之,我们的研究结果表明,目前来自RCTs的证据并不支持经常性的运动对提高认知能力的因果效应,尽管它也不排除这种效应。因此,在更有力的证据积累起来之前,我们敦促在健康人群中把运动与认知益处联系起来的主张和建议要谨慎。关于目前促进运动的公共卫生政策和指导方针,我们坚信没有必要呼吁所谓的、尚不确定的运动的认知益处,特别是目前来自RCTsmeta分析证据表明,即使存在这种效应,它也是非常小的,无法断言其实际意义(Cohen's d0.125,如Ludyga等人的原始meta分析中发现的调整效应9,代表着对组间变异性的解释不到1%,或者也对应着大约两个智商分数的增加)。运动对人类福祉的益处,特别是对身体健康的益处,本身就足以证明基于证据的公共卫生政策能够促进其在我们日常生活中的正常应用82。此外,从事运动不仅能带来身体上的好处,还能带来社会上的好处,因为我们通过建立社会纽带和参与集体活动来与他人联系,使我们有归属感。最后,我们不要忘了为做事而做事的乐趣。运动的价值可能仅仅在于其愉快的性质。

方法

文献检索

我们按照《系统回顾和meta分析的首选报告项目》指南83(最后一次搜索在20227月)在MedlineScopus进行了系统的文献搜索,使用的布尔运算符如下: ('运动''体力活动''运动''慢性运动''定期运动') AND ('认知''大脑''执行功能''记忆') AND (metaanalysismeta-analysis) 。此外,我们还在ProquestGoogle Scholar上进行了搜索,以确定符合纳入标准的未发表的meta分析。检索仅限于以英语发表的论文。检索由三位作者(D.H.D.S.L.F.C.)独立完成,他们修改了标题和摘要,以确定可能的其他出版物。随后,两位作者(D.H.L.F.C.)修改了这些文章的全文,这些作者之间的差异由第三位作者(D.S.)解决。

纳入和排除标准 我们遵循 "参与--干预--比较--结果 "的程序来选择本综述中所包括的meta分析: (1) 参与者:所有年龄和性别的健康参与者。包括肥胖症或轻度认知障碍在内的临床人群的meta分析被排除。然而,如果meta分析包括健康参与者,并且这种效应可以单独提取,我们只考虑这个人群的效应。(2) 干预措施: 研究定期运动项目对任何认知结果影响的RCT,持续时间至少为2周,且涉及有氧运动、阻力运动、混合运动或其他体力活动(如课外体力活动)。(3) 比较:主动对照组(参与者完成不同的运动计划或替代活动)或被动对照组(参与者没有完成任何运动计划)。(4)结果:meta分析应该至少报告全球认知功能或任何特定认知领域(EFs、注意力、记忆等)的测量结果。为了避免混杂因素,我们排除了涉及身心健康、瑜伽或运动项目与任何其他干预措施(如认知训练)相结合的meta分析或经审查的meta分析的主要研究。

数据提取

从纳入meta分析的274项主要研究中提取了以下数据: (1)作者名单和发表年份;(2)meta分析中包括的每篇主要文章的作者名单和发表年份;(3)实验组和对照组的集合参与者人数;(4)样本年龄;(5)运动干预类型;(6)方案持续时间;(7)评估的认知结果;(8)对照条件类型;(9)效应大小类型和估计方法;(10)效应大小、标准误差和CI(11)发表偏倚分析;(12)方案注册和(13)数据的可用性。在这些数据的基础上,我们确定了109项符合本综述标准的主要研究(RCTs、健康参与者、没有心身或认知训练成分的运动等等)。然后,我们审查了每个meta分析的具体纳入和排除标准,并确定哪些符合这些标准的主要研究在其最后报告的搜索时刻是可用的,因此应该被纳入。当meta分析没有报告最后一次检索的日期16,32或只报告了月份14,15,19-21,25,27,29,33时,我们分别使用杂志的接收日期和相应月份的最后一天作为参考。整合所有数据的最终电子表格可在以下链接中找到:https://osf.io/e9zqf/

考虑到该文献中使用的各种实验设计,我们决定测试控制的类型(被动的、控制身体活动或非身体替代活动)、结果的类型(全局认知、EF或其他认知领域)和参与者的年龄范围(儿童和青少年、年轻成人或老年人)的影响。

统计分析

为了避免使用非目标运动项目或有健康状况的样本的影响,我们只对目标干预措施和健康人群的主要研究的效果大小进行了重新分析。在主要分析中,我们使用了测试前和测试后分数之间的标准化平均变化,并进行了小样本偏差校正,作为效果大小的估计。汇总的标准差是由两组的测试前标准差的组合来估计的84。在主要分析中,我们使用以下公式估计方差

其中J代表小样本偏倚的修正系数。此外,为了防止那些一组与另一组参与者数量不平衡的研究(n1/n2>3/2<2/3)产生不相称的影响,用最小组的规模代替最大组的规模来计算抽样差异。

我们对每个meta分析使用其主要研究集进行分析,然后用整个研究样本实施模型。我们采用RVE方法85,使用R统计软件的robumeta86包来进行多层次模型。这种方法可以处理同一主要研究的结果的相关结构。为了评估三个调节变量(控制活动的类型、认知结果的类型和年龄范围)的影响,我们重新估计了24meta分析中每个层次变量的结果。此外,我们在整个研究样本中对每个调节器实施了单独的RVE模型。在完整的模型中,我们还测试了干预前表现的影响,因为这是另一个解释认知训练文献中部分变异性的因素80。即使在RCTs中,由于抽样误差,也有可能观察到小型实验组和对比组之间的基线差异。由于有更大的机会窗口和/或向平均值回归,当实验组的参与者在基线上的表现低于对照组时,他们表现出更大的益处。我们用测试前分数的标准化平均差异,gpre,作为调节器。

我们重新评估了那些至少有10项主要研究、符合我们纳入标准的经审查的meta分析的发表偏倚8,9,14,15,19,21-23,25-28。在我们的重新分析中,我们使用每个meta分析中包含的同一研究的所有效应大小的总和来计算依赖性87(即对同一参与者样本的所有效应大小进行平均,从而将每个研究的结果数量减少到一个)。当出版过程倾向于有选择地报告阳性和显著的结果时,力量不足的研究(即样本量较小,标准误差较大)更容易显示出较大的效果。因此,估计值的大小与其精确度之间的这种联系可以用一个meta回归模型来评估,该模型将效应的标准误差作为协变量50。显著的meta回归系数表明存在非零的关联(即通常小研究的效果较大),因此,效果的分布不对称,偏离了漏斗形状。我们使用研究内汇总的加权最小二乘法meta分析来测试小研究的偏倚(即FAT)。为了防止效应大小和其精确估计之间的人为依赖,我们使用了一个替代公式来估计方差88W=n1+n2/n1×n2)。这个公式不包括待估计的效应大小,如经典的方差估计(n1+n2 n1×n2+d2 n1+n2,其中d代表meta分析效应)。此外,我们还拟合了一个带有集合体的3PSM473PSMVeveaHedges选择模型的一个版本,在显著性阈值处只有一个切点(在pon-tailed=0.025),估计观察到非显著性结果的概率高于显著性结果(用作参考,权重为1)。估计完后,似然比测试可以评估调整后的模型是否更适合。假设阳性和显著的结果更有可能被报道,3PSM根据单个效应的P值调整随机效应meta分析的最终估计和异质性。此外,我们将PSSTTESS结合起来使用48PSST是将观察到的有意义的研究比例与在meta分析的条件下(即拟合估计值、研究内差异和异质性)会报告有意义结果的理论研究比例进行比较。在TESS中,超额统计学意义的比例与可接受的假阳性率(即5%I型错误)进行比较。我们实施了PET-PEESE493PSM47的汇总,以调整最终估计的出版偏倚。PET-PEESE程序将元累进模型的截距作为基础效应的最佳估计值(即抽样误差为零时的估计效应),而3PSM则使用具有某些P值的研究发表的估计概率来校正效应大小。在一些meta分析中,3PSM显示出与随机效应模型的收敛问题,但与固定效应模型收敛15,25,27

随后,我们对整个研究样本的发表偏倚进行了检查。为了处理结果的相关结构(即来自同一参与者样本的几个效应大小),我们使用了RVE多层次模型或来自同一研究的聚集物87,关于方法。FAT是用集合体(FAT with aggregates)和RVE多级模型(FAT multilevel)实现的,还有3PSMPSSTTESS的组合,以及研究集合体。为了说明部分异质性,我们在两种FAT方法和3PSM的模型中加入了控制类型和基线表现作为调节因素。在PSSTTESS的情况下,我们假设主动控制和无基线差异,调整了观察到的效应大小。拟合单变量meta分析,我们使用两个调节器的系数来调整观察到的效果(δobs),假设使用主动控制组和无先验差异:

其中β1和β2是调节器的meta回归系数,Active是一个虚拟变量,值为01,分别代表主动和被动控制。我们使用PET-PEESE程序和3PSM来校正最终结果的选择性报告和小研究偏倚。此外,我们还进行了稳健的贝叶斯meta分析52,以达到这两种调整方法的单一模型平均估计:选择模型和PET-PEESE。对于选择模型,我们使用了Bartoš等人52定义的六组P值切点:(1)双侧选择,0.05;(2)双侧选择,0.050.10;(3)单侧,0.05;(4)单侧,0.0250.05;(5)单侧,0.050.50;以及(6)单侧,0.0250.050.50。贝叶斯模型不是选择其中一种方法的结果,而是用不同模型(总共18个,因为我们只进行了随机效应模型)从数据中得到的支持来加权估计。这种方法的两个相关优点是,稳健的贝叶斯meta分析可以避免在一种或另一种出版偏倚方法的结果之间进行选择,以及它可以区分 "没有证据 ""没有证据"。根据以往的meta分析和反映运动效果小的先验信念的文献,我们选择了以0.35为中心、有一个标准差的正态分布作为备选假设中效果的先验。对于属于无效假设的效应,我们假定以0为中心的正态分布,并且标准差相等。我们只用随机效应模型进行分析,也就是假设所有情况下的异质性不为零,这是心理学研究中最常见的情况。

最后,我们对所有的主要研究进行了探索性的规格曲线分析53。在规格化曲线中,我们估计了三种预处理的总共120种可能的组合的最终效应大小及其意义值:(a)标准化的效应大小是基于测试前的变化或只基于测试后的组间差异;(b)使用Cohen's dHedges'g;以及(c)效应大小的方差估计遵循经典表述或Morris的提议。对于规范曲线,我们选择了这三个预处理步骤以及另外三个分析决策层面: (d) 如何处理研究内的依赖性(无策略或假设内效独立,RVE多层次模型和用总效应大小拟合单变量模型;(e) 是否纳入有影响的调节器来调整结果(即对照组的类型和基线差异);(f) 评估和纠正最终结果的出版偏倚的策略(PETPEESE方法,修剪和填充方法,3PSM和无纠正)。由于修剪填充法和3PSM不能用多水平模型进行,分析导致了120种不同的规格组合,而Morris的方差只应用于效果大小的前测估计(将可能的组合数从192种减少到120种)。

样本量估计 我们估计,对于一个小的效应大小,如双尾双样本t检验中的d=0.22和α为0.05,需要652名参与者才能达到0.80的力量。这种分析与认知测量的前后变化中经典的组间比较相呼应。然而,另一种常见的分析是进行双向混合方差分析,其中组间因素(即治疗组与对照组)和时刻为参与内因素(即测试前与测试后)。在这里,关键效应是组与时刻的相互作用,其中至少需要654名参与者才能达到Cohen's f=0.11的足够力量(或者,相当于η2=0.012)。

预登记

本综述的方法和计划分析于202069日在PROSPERO进行了预注册(CRD42020191357)。假设和分析计划在OSF库中进行了预登记:https://osf.io/hfrpc。所有偏离预注册程序和分析计划的情况都会在稿件中透明地指出。

转自:“一起学科研”微信公众号

如有侵权,请联系本站删除!


  • 万维QQ投稿交流群    招募志愿者

    版权所有 Copyright@2009-2015豫ICP证合字09037080号

     纯自助论文投稿平台    E-mail:eshukan@163.com