中华流行病学杂志, 2023,44(4) 李意杰, 曹焱敏, 范伟, 等.
摘要
测量偏倚(MB)的因果结构已有阐述但仍不完全明确;实践上,暴露与结局间效应的替代估计值(SE)的正确性是因果推断的前提,通常基于测量的暴露与测量的结局间双向无差别的错分。本文提出了基于有向无环图(DAG)的单个变量测量的结构,其MB来源于对不完美的、类似“输入/输出设备”的测量系统的选择。SE的MB受到测量系统本身和测量系统外因素的双重影响:虽然测量系统的独立性或依赖性机制仍可确保SE的MB表现为双向无差别的错分,然而测量系统外因素对SE的MB则可表现为双向无差别、单向或双向有差别的错分。此外,反向因果关系是定义在测量水平上,测量的暴露可以影响测量的结局,反之亦然。结合时序关系,DAGs有助于阐明MB的结构、机制和方向性。
一、背景
测量是科学家认识世界的基础。测量偏倚(measurement bias,MB)随测量的实施而发生[];这是一个必须面对的困境:测量某事物并处理MB。
若人群中存在一个我们感兴趣的属性(例如血糖),其真实值为A,经一个测量系统(MA*)获得估计值(A*)。一般来说,MA*是一些测量过程关键元素的组合,包括研究人员、研究对象、工具、方法等,贯穿于测量的全过程:可形象地认为,MA*就像一个“输入/输出设备(I/O device)”,即将A输入后,输出A*。A和A*之间的差异(UA*=A*-A)即MB。若A为分类变量,MB又被称为错分偏倚[]。为阐述方便,如未特别指出,本文提及的变量均为分类变量;变量的命名规则:真实值(以大写字母如A表示)、其对应的测量值(同名变量带“*”表示,如A*)、测量系统(MA*)及产生的MB(MBA*)。
测量及其偏倚可合理地采用有向无环图(directed acyclic graph,DAG)来展示[]。目前,单个变量MB的结构已达成了一个共识,即:除了A影响A*之外,影响A*值的所有其他因素对A*的影响即A*的MB(MBA*);但当前提出的两种MB-DAGs结构针对MB的处理策略上存在着不同:Hernán和Cole[]以UA代表了除A以外的所有其他影响A*的因素,同时也代表了测量值A*的误差值。然而,UA和A*是测量一刻同时产生的,二者间不可能存在因果律,但被Hernán和Cole[]用于因果图的表述中;因此本文以UA*替换Hernán和Cole[]文中的UA(图1);而Shahar等[]则将除A以外的所有其他影响A*的因素用一个变量数列(M1~Mn)表示,并逐一地列出它们各自对A*的同等影响。显然,前一种方法难以提供“所有除了A之外的其他影响A*的因素”的确切含义,而后一种的枚举法未能捕捉到测量系统的主要特征。
此外,这些策略尚存在其他问题:①A值从不会为人所知,但在某一确定的时点,A值理论上是一个常数。因此,一旦A得以测量则可得到A*值,同时也得到其对应的UA*值(UA*=A*-A)。因A未知,故UA*亦为一个理论上的差值,在现实中不会存在,即:某一因素只可能影响A或A*,而不可能影响UA*。由此可见,当前已发表的MB-DAGs研究将其他变量与UA*通过单箭头连结来表示二者间因果律的做法值得商榷。例如,Hernán和Cole[]举例说明有差别错分偏倚的DAG结构中,癌症(Y)通过影响“所有除了血脂(A)之外的其他影响血脂的测量值(A*)的因素”(即UA*),进而影响A*,表示为:Y→UA*→A*和A→A*(图1),前者的表述显然不成立,实际上是Y影响了A进而影响A*,即Y→A→A*和MA*→A*;相似的问题可见于某种药物的肝毒性影响医生对用药者监测的例子(图1)。②当研究A对Y的效应时,可以明确的是:经测量或观察而为人所知的变量A*(或Y*),不会影响未知变量Y(或A)的真实值[]。然而,未知的A(或Y)影响未知的Y(或A)通常被称为因果关系(或反向因果关系),这点常令人困惑。③实践中,因A和Y均未知,以A*-Y*间的关系作为效应的替代估计值(substitution estimate,SE),其正确性是因果推断的前提,通常基于A*与Y*间存在着双向无差别的错分。然而,迄今尚未有任何DAG能够阐明MB的方向性问题。④实际上,研究中只会选择一种测量系统(或称实测法),但测量系统的选择过程尚未在MB-DAGs中提及。
因此,本文结合实例分三部分进行阐述:①提出用于测量单个变量的结构;②测量系统对SE的MB的影响;③测量系统外因素对SE的MB的影响,以阐明MB的结构、机制及其方向性。
二、单个变量的测量
以葡萄糖耐量试验进行血糖检测为例,虽然被检者提前摄入的葡萄糖将导致血液葡萄糖浓度的上升,但在某一具体时点上抽血并测定其葡萄糖浓度时,该时点的血液葡萄糖的真实值(A)是明确的、固定的。由此可认为,A是一个外源变量。与A不同,A*和UA*的值可能因MA*的不同而变化。
影响A*的原因可分为两方面:一是A值,遵循类似于“价值规律”的现象,通常A*总是决定于A,即A→A*;二是测量系统(MA*)。因此,因果图中的MA*→A*代表着MBA*。对A*的背景或先验知识(KA*)的认识程度为正确理解及选择MA*奠定了基础。对KA*的认识越多,就更能帮助我们综合考虑测量性能、成本和可行性等,从而提出候选的MA*。在一次测量中,所有候选的MA*中只有一个相对科学、合理和有效的MA*将被最终选择(记作SA*)并付诸于实践,这可能产生相对准确且性价比较佳的A*值。基于此,本文提出了单个变量A测量的MB-DAG(图2)。
通常经由SA*选中并付诸实施的MA*只有一种(实测法),但可以想象存在着一种真实值的理论测量方法(真值法)来测量A而获得A*值(此时A=A*)。测量时,实际上进行的是通过实测法与真值法分别得到的测量值和真实值的对比研究(图2)。实测法的性能与真值法越接近,则A→A*越强,而MA*→A*则越弱;当二者完全一致,此时A完全决定了A*,由此路径MA*→A*中的“→”消失,理论上得到了与A值完全一样的A*值;若MA*→A*的关系不变,则意味着A→A*也不变(后续针对SE的MB阐述将用到)。这进一步说明了图2中“MA*→A*”的结构代表着MBA*。然而在实际测量中,即使采用一种当前性能最佳的实测法(即“金标准”),亦难以保证其与真值法完全一样。因此,MA*→A*中的“→”不会消失,即:A*将受到MA*的影响,这也意味着MBA*将不可避免地产生(以下的阐述均基于此种情形,涉及的DAGs将不再绘制KA*与SA*)。若候选的MA*(MA1*,MA2*,…,MAj*)中有任意两种及以上被选中,即相当于进行不同测量系统的一致性研究。
上述单个变量测量的DAG及其思维对理解单个变量MB及其分类很有帮助。测量是研究人员和研究对象通过合适的MA*进行互动的过程;通过分析MA*→A*的结构可知,MA*中影响A*的一个或多个主导因素将引发MBA*:如MA*的主导因素来自于研究人员,对研究对象进行不完美的观察、调查、测量、检查、检测、询问、记录信息(有意或无意的),从而相应地将产生不同的偏倚;如MA*的主导因素来自于研究对象,主动或被动地向研究人员进行不完美的信息报告、回忆等(有意或无意的),也将产生相应的报告或回忆偏倚等[];如MA*的主导因素来自于方法(或工具),因其不统一、检测性能低,将相应地产生测量方法(或工具)引起的偏倚、低检测性能偏倚;如MA*的主导因素来自于电子和纸质记录,将相应地出现记录登记不全引起的偏倚。在整个测量过程中,MA*的上述主导因素可能部分或全部出现;因此,最终产生的MB是这些不同测量性能的MA*综合作用而产生的结果。
最后,这种思维对理解单个变量MB的控制方法也很有帮助。通常认为,采用统一的方法或盲法可起到控制MB的作用。方法统一代表着我们用同样性能的MA*来进行测量,而方法不统一代表着我们用不同性能的MA*来进行测量,后者所获得的测量结果是这些不同性能方法的一个加权值。因此,方法统一仅仅只能去除方法不统一所带来的MB,而不代表着能减少其他原因引起的MB。同样地,采用盲法测量只能去除由非盲法测量引起的MB。此外,采用同一MA*在先后不同时间对同一人群进行两次测量,发现结果具有较高的一致性,以此说明这种MA*的有效性的方法显然是错误的。两次测量结果的一致性只能说明MA*测量性能的稳定性,以及人群中所测量指标的真实值总体不受时间的影响;但测量值的MB仍然存在。这也解释了当前的大数据研究不能避免MB的原因之一。
三、暴露-结局间效应替代估计的影响
若A为暴露,Y为结局,拟研究A-Y间的效应,实践中以A*-Y*间的关联来估计。由上可知,A和Y均难免出现MB:①当A→Y时,因A*←A→Y→Y*,故A*和Y*将出现关联,此时A本身是一个影响A*-Y*间效应估计的混杂因素(图3)。因此,由这条唯一的、以A为混杂子的混杂路径所代替的A*-Y*间的关联,即是研究感兴趣的SE,或因果关联[]。②若A-Y间的效应为零,上述替代估计路径自然中断,此时SE应为零关联。由此可见,为了满足效应研究的可行性,通常需要假设SE是A-Y间效应的合理且可行的替代估计,这正是所有病因研究的潜在含义,保证SE的准确性成为因果推断研究的现实目标。然而,SE将受到测量系统本身及测量系统之外因素的共同影响而产生MB(以MBSE表示),现分别进行阐述。
1. 测量系统:独立性与依赖性机制(图3):当A和Y的测量过程相互独立时(即测量系统的独立性机制),MA*与MY*间无箭头连结。因自MA*至A*仅有一条路径(即MA*→A*,即MBA*),故Y不会对MBA*产生影响;同理,A不会对MY*→Y*(MBY*)产生影响。因此,MBSE为双向无差别的错分偏倚。MA*与MY*间可存在4种因果机制(共因、共果、因果关系或反向因果关系)[],从而可能导致A*和Y*相互依赖,此即为测量系统的依赖性机制:①在A→Y的情形下,若MA*和MY*间存在着共因结构时,自MA*至A*将新增一条路径,即MA*←C→MY*→Y*←Y←A→A*,因其为关闭路径,故其不会影响MBA*(或Y不影响MBA*);同样地,自MY*至Y*将新增一条路径,即MY*←C→MA*→A*←A→Y→Y*,亦为关闭路径,故其不会影响MBY*(或A不影响MBY*),故MBSE仍是双向无差别的错分偏倚。例如,在慢性HBV的母婴传播研究中,在配对的母婴个体中使用相同的HBsAg检测方法(此时MA*=MY*)。同理可分析,MA*与MY*间存在着共果或因果关系时,MBSE亦为双向无差别的错分偏倚。②在A和Y为零效应的情形下,上述两条关闭路径不存在,故MBSE亦为双向无差别的错分偏倚。
2. 测量系统以外的因素:对暴露和结局的测量通常只使用一种实测法,因果图将略去测量系统(MA*与MY*)的展示。不论测量系统是独立性还是依赖性,测量系统产生的MBSE均表现为双向无差别的错分。然而,SE仍然可能受到测量系统外因素的影响,亦可表现为4种因果机制[],按照A和Y间存在着非零效应首先阐述(图4)。
(1)A*和Y*间存在着共因结构:共因结构存在两条新的关闭路径,即A→Y→Y*←…← C→…→A*和Y←A→A*←…←C→…→Y*(图4)。因此,自A至A*间仅有A→A*一条开放路径,故Y不会对A→A*产生影响,这也间接地反映了Y不会对MBA*产生影响;同理,A不会对MBY*产生影响,故MBSE为双向无差别的错分偏倚。
以雌激素使用和子宫内膜癌发生关系研究为例[],由于雌激素使用(A)和子宫内膜癌(Y)均可能增加阴道出血(B)的概率,后者可以由女性自己和/或医生予以识别或诊断(B*),这将增加患者就诊和临床检查的机会,从而相应地增加患者被诊断为子宫内膜癌的机会(Y*)。这种偏倚通常被称为检出偏倚,可以用与研究兴趣无关的额外混杂路径来解释,即A*←A→B→B*→Y*和A*←A→Y→B→B*→Y*(若A→Y成立)(图5)。此即共因结构机制。这里应该强调的是,是研究对象出现并知晓了已被测量的中间结果(阴道出血的测量值B*),而非其未测量的、未知的真实值(阴道出血B),增加了被直接诊断为子宫内膜癌(Y*)的机会。
(2)A*和Y*间存在着共果结构:共果结构也有两条新的关闭路径,即A→Y→Y*→…→S←…←A*和Y←A→A*→…→S←…←Y*;但因调整S(即图中),这两条路径均从关闭转为开放,此时A*和Y*的值都会受到影响。因此,自A至A*间除了A→A*一条开放路径外,尚有因调整S而产生的一条新的开放路径,故Y对A→A*将产生影响,这也间接地反映了Y将对MBA*产生影响。同理,A将对MBY*产生影响(图4)。故MBSE为双向有差别的错分偏倚。例如,在基于记录系统的研究和历史队列研究中,当A和Y同时被测量时,A*和Y*不可能产生因果关系。从这个角度来看,这类研究不太可能产生额外的MB。然而,由于这类研究通常局限于记录在案的研究对象(即S=1,代表研究对象以前被记录过,纳入研究;若S=0,则代表研究对象未被记录过,未纳入研究)。因此,S=1引发的选择偏倚导致了MB的产生,可以用与研究兴趣无关的额外开放路径来解释,即A*→…→←…←Y*(图4)。此即共果结构机制,当被登记的人群与未被登记的人群之间在某些特征上不具有可比性时,可能会导致替代估计的有偏估计,或知情存在偏倚[]。
(3)A*和Y*间存在着因果关系结构:如果A*和Y*间存在着因果关系,有两种情形。
第一种情形,如果A*对Y*产生因果效应,两条新的路径将产生,即A→Y→Y*←…←A*和Y←A→A*→…→Y*。前一条路径为关闭路径,但后一条路径为开放路径。由上同样推理可知,A对Y*的错分是有差别的,而Y对A*的错分是无差别的(图4)。以病毒性疾病(A)和抗生素处方(Y)研究中的霍桑效应为例[],由医生诊断为病毒性疾病的儿童(A*)参与了这项研究。由于医生在接受调查时需要被录音,这导致了医生自身防护意识的提高,从而降低了他们对抗生素处方开具的报告(Y*)。此即因果关系机制;需要强调的是,医生对儿童的诊断(A*)改变了对医生开具处方行为的报告(Y*),或A*→Y*。
第二种情形,当A*和Y*之间的因果关系被“逆转”时(常见于病例对照研究中),两条新的路径将产生,即A→Y→Y*→…→A*和Y←A→A*←…←Y*;这种情况正好与第一种相反,前一条路径为开放路径,后一条路径为关闭路径,因此,A对Y*的错分是无差别的,而Y对A*的错分是有差别的(图4)。这一机制可用于说明在病例对照研究中常提到的回忆偏倚。以研究分娩先天性畸形婴儿的母亲为例,在婴儿被确诊出现先天性畸形(Y*)后,母亲可能会高估或低估既往暴露A*。这种机制通常被称为反向因果关系,可以由与研究兴趣无关的额外开放路径来解释,即Y*→…→A*(图4)。同样地,这里应该强调的是,研究对象出现并知晓了已被测量的结局(婴儿被确诊为先天性畸形,Y*)对暴露的测量(A*)产生影响,即:Y*→A*,而非真实的、未知的结局Y对暴露A产生影响。因此,反向因果关系是一个模糊且多余的概念,是根据测量的暴露和测量的结局间的关系来定义的,但在许多文献报道的DAGs中经常错误地以Y→A来表示。显然,因果关系永远不会逆转。
本研究阐述了当A和Y间存在着非零效应时,错分偏倚对应的4种机制。当A和Y间为零效应时,因A与Y间无箭头存在,故A→A*或Y→Y*不会受到A*和Y*间存在共因结构、共果结构和因果关系结构(A*对Y*产生效应或Y*对A*产生效应)这4种路径的影响,即其对应的MB也不受到影响,均为双向无差别的错分(表1)。按理A*与Y*间的关联应为零;但由于存在上述4种路径提及的与研究兴趣无关的额外路径,仍将出现MBSE。
四、讨论与结论
测量过程可合理地由因果图来展示[]。本研究首先提出了单个变量测量的因果结构,接着识别MBSE在测量系统的独立性和依赖性机制下均表现为双向无差别的错分,而测量系统外因素导致的MBSE可能表现为双向无差别、单向或双向有差别的错分。
理论上,无论是对于单个变量或变量间的关系来说,MB是变量或变量间关系的真实值与其测量值之间的差异。基于单个变量测量类似“输入/输出”的过程,本文结合了先验知识、因果现实和测量系统的选择过程,提出了单个变量测量的DAG,有以下优点:首先,提出了测量系统的概念,突出了测量系统的“输入/输出”作用,识别了UA*不是因果图上的独立变量,是测量系统对A的测量值的影响,即MB(MA*→A*)。其次,这种新的认识有助于理解不同类型的单个变量MB。具有某些缺陷的测量系统会导致相应的偏差。例如,研究人员的粗心观察会导致观察者偏倚;研究对象不完善的报告可能导致报告偏倚;标准化测量过程未依从,则导致非标准化的偏倚。最后,这一思想可迅速地被应用到不同测量系统的性能评估研究中。
单个变量MB不可避免,由此影响到效应的估计值,即:A-Y间的效应和A*-Y*间的SE难免不一致。实践中采用SE进行因果推断,基于MBSE存在的双向无差别的错分来确保SE的正确性,虽然这将导致SE趋向于无效值。然而,这是当前因果推断唯一可行的做法。因此,判定该条件是否满足尤为重要。
影响SE的正确性可有两种来源:一个来自测量系统,另一个来自测量系统之外因素产生的、与研究兴趣无关的任何额外的A*---Y*间的关联。本研究发现,测量系统的独立性或依赖性机制、零效应和测量系统外因素:A*和Y*之间存在的共因结构可确保MBSE表现为双向无差别的错分;然而这种特征在测量系统外因素:A*和Y*之间存在共果或因果结构时则不能实现,提示着后者应加以重视,以确保SE的正确性。结合实例,本研究发现,测量可导致利益相关者做出任何心理或行为上的改变[],从而导致MB的产生。例如,诊断为阴道出血的女性增加了临床就诊次数,增加确诊为子宫内膜癌的机会;参与研究改变了医生开具抗生素处方的行为;分娩先天性畸形婴儿的母亲会高估或低估她们过去的暴露。
MB往往被研究者所忽略[],但其本身并非无足轻重;同时尤为重要的是我们需要尽可能地获得所有单个变量的正确测量值;当有验证数据可供使用时,我们必须转向效应的重建[]。因此,如何正确构建测量过程的因果结构是控制MB的前提。本研究提出的单个变量测量结构,虽然从形式上与Hernán和Cole[]的一致,但其内涵已得以澄清;识别了错分偏倚的机制及其方向性,并阐明了反向因果关系是定义于测量水平上的概念。这些发现为正确认识MB和构建正确的DAGs奠定基础,并指导着MB控制策略的建立和形成。
综上所述,本研究提出的单个变量测量的结构为正确地构建测量DAG奠定基础,从而指导着研究实践;在效应估计上,应重点关注不满足“MBSE双向无差别错分”的情景。基于测量水平,结合时序关系,DAGs有助于阐明MB的结构、机制及其方向性。
转自:“医学科研与管理空间”微信公众号
如有侵权,请联系本站删除!