投稿问答最小化  关闭

万维书刊APP下载

交乘项也有偏误?由来、诊断、策略与建议

2023/4/14 16:35:50  阅读:133 发布者:

主要引文来源:

Hainmueller, J., Mummolo, J., & Xu, Y. (2019). How Much Should We Trust Estimates from Multiplicative Interaction Models? Simple Tools to Improve Empirical Practice. Political Analysis, 27(2), 163-192.

另外来源:

Brambor, Thomas, Clark, William Roberts, and Golder, Matt. 2006. Understanding interaction models: Improving empirical analyses. Political Analysis 14:6382.

原文网址:

https://www.cambridge.org/core/journals/political-analysis/article/how-much-should-we-trust-estimates-from-multiplicative-interaction-models-simple-tools-to-improve-empirical-practice/D8CAACB473F9B1EE256F43B38E458706

推文摘要:传统交乘项得到的估计结果很有可能存在偏误,这种偏误来源于对线性假设和共同支持假设的违背,很多研究都存在这一问题。对此,我们可以通过画散点图来诊断偏误程度。同时,本文介绍了两个方法(分箱估计量、核估计量)来更准确地估计调节效应,并附上了简要的stata代码。当然,经典文献Brambor, Clark, and Golder (2006)对于交乘项的应用建议非常值得参考。

01

引言

交乘项是实证领域无论如何也避不开的一个话题。广义来讲,交乘项捕捉了一些变量受到另一些变量的调节作用;而在应用中,无论是异质性检验、双重差分,还是某些工具变量的构造,目光所及皆是交乘。这不,它出问题了。

对于交乘项的实证应用,Brambor, Clark, and Golder (2006)给出了很好的建议(本推文末列出了这些建议),诚然,这些建议对于其后的研究具有重要引导。然而,传统交乘项想要得到精确估计,所需要的假设非常强,这就使得即使按照这些建议来做,也不能较好反应模型中存在的调节效应,甚至得到相反的结论。尽管这一问题已经算不上“新问题”了,但目前论文对其考察较少,相关推介对其关注较少。掌握这些方法及相关应用,不仅仅能够在技术层面帮助我们做出更精确的因果推断,还可以一定程度上丰富文章故事。因此,这篇推文将介绍一个关于交乘项纠偏的研究。

本推文力求介绍:交乘项“病”在哪了,怎么看“病”,如何治“病”,以期对今后部分实证工作产生一定的指导价值。

何来偏误?

02

传统带有交乘项的线性模型如上式所示。Y是因变量;D为我们关心的自变量;X即常说的调节变量(Moderator,要与Mediator区分开,后者是机制变量),影响D处理的强度或者方向;D*X是本推文着重关注的交乘项。模型还包含一系列的控制变量与误差项。

然而,以下两个核心假设如果不满足,很容易带来偏误:

(一)线性假设

如果式(1)满足正确的模型设定、误差项条件均值为零这两个假设,是可以得到一致估计的。此时,模型蕴含了LIELinear Interaction Effect,线性交互效应,下同)假设,即自变量D对因变量Y的影响满足下式:

  (2)

上式(LIE)告诉我们,想要进行准确的估计,必须满足两个条件:首先,D对于Y的影响随X线性变化,即X增加一单位,DY的影响增加β单位;其次,在整个X的取值范围内,这种线性影响都是存在的。这两个假设太强了,很难给出足够的理论或经验证据。

为了进一步理解这样的假设有多强,考虑一个简单的分解:

式(3)分解了处理的相对效应(relative effect of treatment)。面对处理强度d1d2时,相对效应可以表示为两个线性方程(

)之差,如果在传统框架下进行估计,那么这两个方程必须都是严格线性的,做到“一线到底”。

(二)共同支持假设

式(3)的分解引出了传统交乘模型面临的第二个挑战,共同支持(Common Support)假设的挑战。再看式(3),对于任意一个给定的调节变量X的值,x0,必须再满足以下两个假设才能得到准确的估计:首先,在x0的邻域,必须有足够的数据点,这是估计的基础;其次,在x0的邻域,观测值需要同时接受不同的处理强度,比方说,尽量不要出现x0邻域内只有未接受处理样本的情况。这两个假设同样很强,如果存在一个样本量很少或者处理强度相同的X的邻域,那这部分的推断就依赖于已估计出的函数的插值(interpolation)或者外推(extrapolation)了,而这种插值或者外推本身还需要依赖很强的模型假定。

以上就是关于传统交乘项准确估计依赖的假设,两个大假设套着一堆假设,很显然,这些假设不容易满足。

03

偏误诊断

有了偏误,自然需要做诊断。作者给出了非常简单鲜明的诊断方法——画图法。

(一)D为虚拟变量

Stata代码:twoway (sc Y X) (lowess Y X), by(D)

在这里,作者给出了两套模拟数据。左侧为一组,右侧为一组;左侧例子表示真实情形下,DY的影响线性变化,右侧例子则不随线性变化。

我们根据D分为两组,在不同的组别内画YX的散点图,并加上①YX的线性拟合线②YXLOESSlocally weighted regression;看起来复杂,其实就是一种拟合非线性数据的一种方法)拟合线。左侧图中两种线给了两个证据:首先,由于LOESSOLS拟合线重合程度很高,因此有一定理由相信线性假设满足;其次,两幅图斜率完全不同,说明调节效应可能确实存在。而右图,一看就不满足线性假设。

此外,两幅图的边缘还画出了不同组别内的箱线图,来检验共同支持假设。其中粗线是25%-75%范围;细线是5%-95%范围。以左图为例,两个箱线图覆盖的范围基本重合,表明共同支持假设很大可能是满足的;二者存在共同支持的样本范围基本覆盖了X的范围。

作者在脚注中强调,画个X的密度图也同样有利于诊断。

(二)D为连续变量

相较于D为虚拟变量,连续变量情形稍微复杂一点。作者建议,可以手动将X分组,比如按照分位数分为高中低三等份,在每等份中再画DY的散点图、拟合线。如下图所示:

Stata代码:egen Xbin = cut(X), group(3)

         twoway (sc Y D) (lowess Y D), by(Xbin)

可以看到,尽管在不同的X取值范围内,DY的关系基本都是线性的,但是每段范围内的斜率都有极大差别(三段合起来看呈U型),这就说明线性假设并不满足。     

手动对X分组是一个可行的方法。值得注意的是,D为连续变量情形下,相当于XYD都是连续的,直接画个三维图是否更好看?

上图可以直接在R中实现。方法参照GAM法(generalized additive modelHastie and Tibshirani 1986

估计策略

04

有了问题就要积极地去解决,作者给出了两套估计策略,这两套策略都不需要什么复杂的操作。作者强调,如果真实模型符合线性设定,那这两个估计策略的效率其实较低,但好处是对于线性假设和共同支持假设具有更强的包容性。

(一)分箱估计量(Binning estimator)。

第一步,将连续调节变量X根据1/3分位数分为三组G1G2G3

当然,如果各段内样本都充足,大家也可以多分几组。

第二步,在各组里挑出来一个值(x1x2x3),作者挑的是各组的中位数,我们也可以选其他的,平均值什么的。

最后,直接估计下面的方程。

这个模型相较于基准模型,很大程度上放宽了严格的线性假设,这里的线性假设不需要在整个X区间上都满足,各区间内满足即可。在不同的特征点xj上,D对于Y的影响程度都由α表示。此外,分箱标准是依据X取值来定的,因此我们不太需要上面所提到的外推或者插值法,来对数据分布较少的区间进行推广。

最后,模型提供的各个系数也有助于做其他一系列的识别。如果真实模型就是如式(1)所示,那么式(4)与式(1)的系数对应关系如下:

β为式(1)中的交乘项系数,μ截距项,α处理变量系数,η调节变量系数)

可知,Dxj处的边际影响为:

进一步地,作者通过两幅图展示了这个方法的具体应用。

Stata操作:提前安装命令,ssc install interflex, replace all 即可

分箱估计量:interflex Y D X Z1, vce(r)

若想单独估计传统交乘项估计量:interflex Y D X Z1, vce(r) type(linear)

左侧样本代表真实交互效应就是线性的样本,我们按照上面所说,分三组进行估计。尽管是小样本(N=200),分组估计得到的三个系数仍然都在真实斜率上,说明上述方法其实精确度比较高。如果把

放大,拿显微镜看一下,发现其实会有一点点的偏离,这就是上文所说,为了保护线性假设和共同支持假设,不得不放弃的微小精确度。右侧代表真实交互效应呈U型变化的样本,如果按照传统交乘模型,显然无法得到无偏估计,分组回归缓解了这种假设违背的惩罚。

作者还建议,这时候最好在下面画上一个分布图,不同颜色代表处理组和对照组,可以帮助我们直观判断数据是否满足共同支持假设。

(二)核估计量(Kernel estimator)。

这是一种半参数估计策略,允许大家在整个X区间上自由快乐地估计D对于Y的影响。原理上,较之于分箱估计量略有复杂,所以我放到文末的附录里。

估计结果如下图所示。其中,红色虚线为真实效应,黑色实线是核估计量得到的D对于Y的边际影响。相较于分箱估计量,在核估计量中,我们不用再费心把X分成不同的组别,不用再通过几个标志点估计来猜测D对于Y的整体走势,而是直接得到了一个平滑的、覆盖整个X区间的连续边际效应估计结果。

Stata代码:interflex Y D X Z1, type(kernel) bw(0.345) 其中bw为核估计的带宽)

05

实证应用

作者给了几个例子,所有的样本都来自于政治学顶刊。本推文不对每一个例子进行背景介绍。本文的核心之一就是交流如何去看图说话,因此我将文章中的三个例子转成三道题,方便大家理解和实践。

例题1:线性假设

下面两组图是某一应用场景下,作者根据上述讨论画的两组图。第一组图是散点图+拟合图。第二组图中,左图几个红色置信区间代表分箱估计量,黑色带置信区间的实线代表经典线性模型估计出的结果;右图是运用核估计量的估计结果。请问下面两组图可以为线性假设(LIE)提供充足的证据吗?

答:能够提供比较充足的证据。上面的图中,LOESS拟合图与OLS线性拟合图几乎重合。而下面的图中,分箱估计量得到的各组内估计值基本上落在了传统交乘模型估计出来的直线上,且核估计量得到的估计线也和传统交乘模型估计出来的直线基本平行。

例题2:共同支持假设

下图画出了散点图与拟合线,请根据图中信息判断:1)这种数据结构满足共同支持假设吗?2)若不满足,会造成什么后果?

答:上图严重违背了共同支持假设。在处理组(下)中,基本上所有的点都聚集在了-0.5左右,而对照组(上)中,从-0.60的区间内都有很多数据点,因此不满足该假设。如果非要估计,则分箱估计量和核估计量如下图(各线类型与上题一致)所示。可见,如果非要估计,那么由分箱估计量只能得到其中一个组的估计结果,其他两个组缺乏共同支持所要求的数据。而核估计量同样面临严峻的问题,只要不在存在共同支持的数据区间(-0.5左右),置信区间就非常大,无法得到有效的估计结果。

综合题

上面两个例题,已经对两个假设——线性假设和共同支持假设进行了回顾。现在,请看下图展示情形(各线含义与上文相同)。请问直接用传统的交乘项进行估计,能否得到准确的DY的边际效应吗?若不能,请给出理由。

答:传统的交乘项在估计这种数据结构时,可能发生严重的估计偏误。

首先,分箱估计量说明DY的条件边际效应根本不是线性的,甚至不是单调的,它们在很大程度上违背了线性假设,而传统交乘项估计很依赖这一假设。同时,三个分箱估计量都没有拒绝零假设,表明所谓的调节效应在这个数据结构中可能压根不存在。

其次,共同支持假设遭到了违背,因为基本上所有数据点都集中在02.5的区间内,只有个别点在2.5MAX的区间内,如果在传统线性模型下进行估计,那2.5以后的效应全靠02.5区间的估计结果进行外推得到,这依赖于非常强的模型假设。作者仅剔除了4个杠杆点(leverage point,对总体估计结果有明显影响的数据点),曾经大大方方拒绝0假设的交乘项估计就变成这样了:

同样的,核估计量对于线性假设与共同支持假设同样给出了质疑,且质疑角度与分箱估计量比较相似。

以上就是三道题。作者其实还给出了一个例子,但是囿于篇幅、和第三题比较像,因此没有列出来。感兴趣的读者移步文章。

实践指导

06

1)先画一个散点图+拟合线,这是判断线性趋势假设和共同支持假设是否满足最直接的证据。如果处理变量与调节变量都是连续的,不妨用GAM Plot画一个三维图。

2)应用分箱估计量。分箱估计量是判断线性假设很有效的工具之一,分三个箱只是我们演示的操作,只要数据足够,大家可以多分几个箱来更好地判断整体边际效应的演进趋势。但这并不意味着大家可以分无限多个箱,只有数据量足够并且处理状态存在变化的区间,才能放一个箱子去估计。考虑到这一点,建议大家在分箱估计量的汇报图下加一个数据分布图,方便判断共同支持假设的满足程度。

3)应用核估计量。依托于半参数估计的核估计量能够为我们判断线性假设及边际效应变化趋势提供更充分的证据,也是作者强烈推荐的一种估计方法。

4)谨慎使用传统交乘项模型。只有给出了足够让人信服的LIE假设与共同支持假设满足的证据时,才允许坦然地使用传统交乘模型。当然,这时候就要遵循前人(Brambor, Clark, and Golder (2006))的实践建议了。

既然已经说到这了,前人的实践建议有哪些呢?

推文Appendix

1.Brambor, Clark, and Golder (2006)给出的实践建议:

1) 如果有证据表明变量间可能存在调节关系,一定要加入交乘项。

2) 如果要使用交乘项,一定要加入交乘项的各构成项。比如,如果要加入D*X这个交乘项,别忘了加入DX两个变量。不要想着偷偷不加两个构成项来骗交乘项的显著性。此外,大家如果用三重差分(D*X*Z),那么D*XD*ZX*Z都需要纳入回归中。

3) 如果使用了交乘项,不必太关注各构成项的系数,比如说D单独的系数,仅表示当调节变量Z0DY的影响。

4)汇报处理变量的边际影响。注意,交乘项的系数与标准误均不能单独用来刻画DY的影响,而应该用:

将上面两个式子算出来,就得到了一条边际效应直线和它对应的置信区间,作者建议画出来:

2.核估计量的推导部分

核估计量的计算依赖于如下半参数模型:

其中,fg、γ代表X的光滑函数形式,和传统交乘项模型做个比对,可以发现:

只不过不再要求DY的影响一定要是线性形式了,可以放松成在整个X取值范围内的任何形式。我们用一个基于核的方法来估计上面的模型。

其中,每个由

对应的x0,都是根据最小化以下加权最小二乘目标函数得到的,下式更多细节请见原文:

作者:唐联洲,中国人民大学应用经济学院,联系方式cy.tang@ruc.edu.cn,欢迎交流。

 Abstract

Multiplicative interaction models are widely used in social science to examine whether the relationship between an outcome and an independent variable changes with a moderating variable. Current empirical practice tends to overlook two important problems. First, these models assume a linear interaction effect that changes at a constant rate with the moderator. Second, estimates of the conditional effects of the independent variable can be misleading if there is a lack of common support of the moderator. Replicating 46 interaction effects from 22 recent publications in five top political science journals, we find that these core assumptions often fail in practice, suggesting that a large portion of findings across all political science subfields based on interaction models are fragile and model dependent. We propose a checklist of simple diagnostics to assess the validity of these assumptions and offer flexible estimation strategies that allow for nonlinear interaction effects and safeguard against excessive extrapolation. These statistical routines are available in both R and STATA.

转自:“香樟经济学术圈”微信公众号

如有侵权,请联系本站删除!


  • 万维QQ投稿交流群    招募志愿者

    版权所有 Copyright@2009-2015豫ICP证合字09037080号

     纯自助论文投稿平台    E-mail:eshukan@163.com