原文信息:
Callaway, B., & Sant’Anna, P. H. C. (2021). Difference-in-Differences with multiple time periods. Journal of Econometrics, 225(2), 200–230.
https://doi.org/10.1016/j.jeconom.2020.12.001
01
概述
差异中的差异(DiD)已经成为最流行的研究设计之一,用于评估政策干预的因果效应。在其规范的格式中,有两个时间段和两个组:第一阶段没有人被处理,第二阶段一些单位被处理(被处理组),而一些单位没有被处理(对照组)。如果,在没有处理的情况下,处理组和对照组的平均结果会随着时间的推移遵循平行路径(这就是所谓的平行趋势假设),作者可以通过比较处理组的平均结果变化和对照组的平均结果变化来估计处理的平均效果(ATT)。
来源:
https://www.publichealth.columbia.edu/sites/default/files/png/DIDgraph.png
这篇论文考虑了使用DiD的处理效果参数的识别、估计和推断程序,将DiD推广至:(i)多个时间段,(ii)处理时间的变化,(iii)当“平行趋势”假设“仅在对观察到的协变量进行条件调节后才可能成立。表明在交错的DiD设置中识别了一系列因果效应参数,即使观察到的特征差异在组之间产生了非平行的结果动态。作者的识别结果允许使用结果回归、逆概率加权或双重稳健估计不同的聚集方案,可用于突出不同维度的处理效果异质性,并总结参与处理的总体效果。
这篇推文罗列了该方法的主要假设及结论,并运用原文简单的示例分析实证应用。文章代码R包在CRAN。
方法设置
02
03
最低工资政策对青少年就业的影响
在本节中,作者说明了其方法的实证相关性。为此,作者应用其方法来研究最低工资对青少年就业的影响。本节的主要目的是将使用TWFE规范(应用中最常见的)产生的结果与作者提出的方法产生的结果进行比较。作者认为,为了了解最近工作中讨论的TWFE的理论局限性最终是否转化为应用程序中的有意义的差异,这种比较是重要的。此外,人们可能会认为,理解最低工资变化对就业的影响对TWFE来说是一个具有挑战性的案例,因为最低工资的影响可能是动态的(Meer和West, 2016),而且最低工资变化的时间在各州不同。与TWFE不同的是,作者在当前论文中提出的方法对于这些挑战是稳健的。
到目前为止,试图理解最低工资对就业影响的最常见方法是利用各州最低工资提高时间的变化。作者的识别策略遵循这一方法。特别是,作者考虑了2001-2007年联邦最低工资持平于每小时5.15美元的一段时间。作者关注的是在该时期开始时最低工资与联邦最低工资相等的州的县级青少年就业情况。其中一些州在此期间提高了他们的最低工资——这些人成为受待遇的群体。特别地,作者根据一个州第一次提高最低工资的时间段来定义这些群体。其他没有提高最低工资的群体——这些是未经处理的群体。这种设置使作者比本地案例研究方法有更多的数据。另一方面,它也让作者比周期更多的研究有更清晰的识别(州一级的最低工资政策变化);后一种设置比本文的更为复杂,特别是因为联邦最低工资随时间的变化。它还允许作者检查识别假设的内部一致性——即识别假设在特定州提高最低工资之前的时期是否成立。
注:位于2003年第二季度至2007年第一季度提高了最低工资的州的县的汇总统计数据(有处理)和在整个期间最低工资实际上被设定为联邦最低工资的州(无处理)。样本由2284个县组成。
作者使用了青少年就业和其他县特征的县级数据。县级青少年就业来自季度劳动力指标(QWI),如Dube等人(2016);参见Dube等人(2016)对该数据集的详细讨论。其他预处理县的特征来自2000年的县数据书。这些数据包括2000年的县人口,白人占人口的比例,1990年的教育特征,1997年的收入中位数,以及1997年低于贫困水平的人口比例。在由于2000年最低工资高于联邦最低工资而减少了10个州之后,由于缺乏青少年就业数据而减少了7个州,以及北部人口普查地区的其他4个州,作者最后的样本包括了29个州的县级数据。原文附录中提供了更多细节。
表2提供了各县特征的汇总统计数据。在提高了最低工资标准的州的县与没有提高最低工资标准的州的县之间,县特征有一些显著的差异。接受过处理的县在南方的可能性要小得多。它们的人口也要高得多(平均94000人,而未处理的县平均53000人)。在接受处理的县,白人居民的比例更高(平均为89%,而未接受处理的县为83%)。拥有高中学历的比例和贫困率的差异较小,尽管这些差异在统计上都很显著。接受过教育的县有较高的高中毕业生比例和较低的贫困率。
实证结果
04
作者考虑了这样的情况:人们会假设平行趋势假设无条件成立,以及当它只在控制观察到的特征x后成立。在正文中,作者考虑了从未处理过的县是对照组的情况,并且作者不允许任何预期效应(即,δ=0)。作者提供了使用尚未处理的县作为对照组的结果,并在补充附录中考虑了一年的预期;这些案例的结果与本文给出的结果非常相似。
第一组结果来自使用无条件平行趋势假设来估计提高最低工资对青少年就业的影响。群体时间平均处理效果的结果在图1的面板(a)中报告,同时有95%置信区间。所有推理程序都在县级层面使用聚类引导标准误差,并考虑了数据的自相关性。图中包含了处理前的估计,可用于“预测试”平行趋势假设以及处理后时期的处理效果估计。
群体时间平均处理效果估计为“提高最低工资导致青少年就业减少”这一观点提供了支持。在7个群体时间平均处理效应中,有5个对就业有明显的统计上显著的负面影响。另外两个则略微不显著(且为负)。群体时间平均处理效果范围从降低2.3%的青少年就业率到降低13.6%的青少年就业率。简单平均(仅按群体规模加权)降低了5.2%的青少年就业率,而提高最低工资对所有提高其最低工资的群体的平均效果是降低3.9%的青少年就业率(见表3的面板(a))。带有后处理虚拟变量的双向固定效应模型也提供了类似的结果,表明由于提高最低工资,青少年就业率降低了3.7%。根据有关最低工资的文献,这些结果并不令人惊讶,因为它们与倾向于发现提高最低工资会减少就业的回归类型相对应;参见Dube等人(2010)的讨论。
图一:最低工资组时间平均待遇效果
注:最低工资组时间平均处理效果。注:在无条件平行趋势假设(面板(a))和条件平行趋势假设(面板(b))下估计的最低工资对青少年就业的影响。红线给出了处理前阶段的点估计值和同时的95%置信区间,允许在县一级进行聚类。在所有时期都成立的平行趋势假设的零假设下,这些应该等于0。蓝线为提高最低工资的处理效果提供了点估计值和同时的95%置信区间,允许在县一级进行聚类。上面一行包括在2004年提高了最低工资的州,中间一行包括在2006年提高了最低工资的州,下面一行包括在2007年提高了最低工资的州。面板(b)中的估计使用了文中讨论的双稳健估计器。
正如Meer和West(2016)所述,提高最低工资似乎也存在动态效应。在伊利诺斯州(2004年,该州是唯一一个首次提高最低工资的州),据估计,2004年青少年就业率平均比最低工资没有提高时低3.4%。2005年,青少年就业估计要低7.1%;2006年,下降12.5%;2007年,下降了13.6%。对于2006年首次接受处理的州来说,2006年的效果很小:青少年就业率下降了2.3%;然而,2007年的效果更大:青少年就业率下降了7.1%。
表3的分组(a)报告了综合处理效果措施。首先,作者考虑随着政策实施的时间增加最小变化的效果如何。这些参数描绘了与群体时间平均处理效果大致相同的图景。提高最低工资对青少年就业的影响似乎是负的,而且各州处于较高最低工资的时间越长,影响就越大。特别是,在一个州提高最低工资的第一年,青少年就业率预计将下降2.7%,第二年预计将下降7.1%,第三年预计将下降12.5%,第四年预计将下降13.6%。请注意,后两个动态处理效果估计与来自伊利诺伊州的单独估计完全相同,因为伊利诺伊州是唯一一个至少接受两年处理的州。这些结果通过“平衡”不同时间接受处理的组来保持组的组成不变(见表3中标有“Event Study w/ Balanced Groups”的那一行)。当作者将样本限制为只包括最低工资增长至少一整年的组(即,作者保留了2004年和2006年的组,但没有包括2007年),作者估计提高最低工资对青少年就业的影响是2.7%,在提高一年后,青少年就业降低了7.1%。
注:本表报告了在无条件和条件平行趋势假设下的综合处理效果参数,并在县一级进行聚类。“简单加权平均”行报告了所有可用的组时间平均处理效果的加权平均值(按群体规模)。“群体特定效应”行按最低工资提高的时间总结了平均处理效果;这里,g表示某县首次接受处理的年份。“事件研究”这一行按最低工资提高的时间长短报告了平均处理效果;在这里,e用指数表示接受处理的时长。“日历时间效应”这一行报告了按年计算的平均处理效果;这里,t表示年份。“带有平衡组的事件研究”这一行报告了按暴露时间长度计算的平均处理效果,使用固定组在所有暴露时间长度上;在这里,e用指数表示暴露时间的长短,样本由至少两年暴露于最低工资上涨的县组成。“单一参数”列表示每种类型参数的进一步集合,如文中所述。Panel (b)中的估计使用文中讨论的双鲁棒估计器。
作者按群体和日历时间聚合的汇总参数也与以下观点一致:与没有提高最低工资的情况相比,提高最低工资对县级青少年就业产生了负面影响。
第二组结果来自于使用条件平行趋势假设,即作者只假设在没有处理的情况下,具有相同特征的县在青少年就业方面会遵循相同的趋势。作者使用的县特征是国家的地区、县的人口、县的中位数收入、白人占人口的比例、拥有高中学历的人口的比例,以及县的贫困率。作者使用了上面讨论过的双稳健估计程序。因此,估计需要对上面讨论的广义倾向评分和结果回归进行第一步估计。对于每一个广义倾向得分,作者进行估计了一个logit模型,包括每个县的特征以及人口和收入中值的二次项。对于结果回归,作者对协变量使用相同的规范。
在展示这些结果之前,作者注意到作者的双鲁棒估计程序并不需要计算。在本节中,作者对组时间平均处理效果的估计(跨越所有组和时间段,包括作者的1000次迭代倍增器引导)在一台配备2.80 ghz Intel i5处理器、8GB RAM且不使用任何并行处理的笔记本电脑上在3.0秒内运行。
为了便于比较,作者首先估计了一个具有单位固定效应和区域年固定效应的模型中处理后虚拟变量的系数。这与Dube等人(2010)发现的消除最低工资和就业之间相关性的一类模型非常相似。与Dube等人(2010)一样,使用这一规范,作者发现估计的系数很小,在统计上与0没有区别。然而,作者在本文中提出的方法不同于双向固定效应回归。特别是,作者明确地确定了不同群体和不同时间的组时平均处理效果,只要满足条件平行趋势假设,就允许任意处理效果异质性。因此,作者的因果参数有了明确的解释。正如Wooldridge (2005a)、Chernozhukov等人(2013)、de Chaisemartin和D ' talltffauuille(2020)、Borusyak和Jaravel(2017)、Goodman-Bacon(2019)和ssooczyzynski(2018)所指出的那样,在存在处理效应异质性的情况下,双向固定效应回归可能并非如此。
使用本文方法的结果可在图1的面板(b)和表3的面板(b)中得到。有趣的是,作者发现使用其方法得到的结果与双向固定效应回归方法得到的结果截然不同。特别是,作者继续发现提高最低工资倾向于减少青少年就业的证据。估计的群体时间平均处理效果范围从2006年首次处理的一组州在2006年降低0.9%的青少年就业率(在统计上与0无差异)到2004年首次处理的一组州在2007年降低7.1%的青少年就业率。现在,7个群体时间平均处理效果中有3个在统计上显著。在所有提高了最低工资的群体中,提高最低工资对青少年就业的平均影响是青少年就业减少3.1%。这一估计与TWFE的估计有很大不同。此外,与无条件情况下相同的动态处理效应模式是,提高最低工资的效应幅度倾向于随着暴露时间的延长而增加。
05
总结
总的来说,作者的结果表明,相对于没有政策改变的情况,提高最低工资降低了青少年的就业率。然而,本文方法的应用有一些重要的局限性。
首先,图1中对处理前阶段伪群时间平均处理效果的一些估计与零有显著差异,这为平行趋势假设提供了一些提示性证据。
第二,各州最低工资增长本身的规模存在一定的异质性,这可能会使作者的结果的解释复杂化。综上所述,这些都表明作者的结果应该被谨慎地解释。话虽如此,作者认为,从应用中得到的关键结论是,(隐式地)保持主要识别假设不变,在一个具有许多非常共同特征(处理效果异质性、动态效应和交错处理采用)的经济学杰出应用中,估计方法的选择可能会导致定性不同的结论。
Abstract
In this article, we consider identification, estimation, and inference procedures for treatment effect parameters using Difference-in-Differences (DiD) with (i) multiple time periods, (ii) variation in treatment timing, and (iii) when the “parallel trends assumption” holds potentially only after conditioning on observed covariates. We show that a family of causal effect parameters are identified in staggered DiD setups, even if differences in observed characteristics create non-parallel outcome dynamics between groups. Our identification results allow one to use outcome regression, inverse probability weighting, or doubly-robust estimands. We also propose different aggregation schemes that can be used to highlight treatment effect heterogeneity across different dimensions as well as to summarize the overall effect of participating in the treatment. We establish the asymptotic properties of the proposed estimators and prove the validity of a computationally convenient bootstrap procedure to conduct asymptotically valid simultaneous (instead of pointwise) inference. Finally, we illustrate the relevance of our proposed tools by analyzing the effect of the minimum wage on teen employment from 2001–2007. Open-source software is available for implementing the proposed methods.
转自:“香樟经济学术圈”微信公众号
如有侵权,请联系本站删除!