投稿问答最小化  关闭

万维书刊APP下载

【香樟推文2826】Y or log(Y)—平行趋势何时对函数设定形式敏感?

2023/5/19 10:46:36  阅读:85 发布者:

原文信息:Roth, J. and Sant'Anna, P.H.C. (2023), When Is Parallel Trends Sensitive to Functional Form?. Econometrica, 91: 737-747. https://doi.org/10.3982/ECTA19402

写在前面

正如封面所示,相信很多研究人员可能都会遇到类似的疑惑:为什么平行趋势对水平值Y成立,但却对log(Y)不成立(反之亦然)?虽已有文献注意到了这种现象,但均未给出平行趋势对函数转换不敏感的充要条件,RothSant'Anna的这篇文章则弥补了这一空白。

基于主要结论,本文为研究人员做出更令人信服的结果提供了三条建议:(1)  首先,研究人员可以强调自己使用的冲击几乎是随机分配的。(2)  其次,研究人员可以施加本文提出的条件,即Y(0)的累积分布函数(CDFs)满足平行趋势假设。(3) 最后,研究人员可根据研究背景,强调选择特定函数设定的理由。

推文分为6个部分,第一部分为引言;第二部分介绍了“平行趋势对函数形式不敏感”的核心定义、两个充要条件、三个例子;第三部分为文献贡献;第四部分为如何对本文提出的条件进行假设检验;第五部分为拓展;第六部分为实证建议。

01

引言

双重差分方法(Difference-in-DifferencesDID)已成为当前经济学因果推断领域广泛流行的微观计量方法之一。使用该方法时,处理组和对照组必须满足严苛的common trend假设。验证平行趋势也成为研究人员绕不开的问题。然而,实践操作中,我们可能会发现:因变量y的变化在水平值上满足平行趋势,但logy)却不满足平行趋势(反之亦然)。这篇文章则给出了平行趋势不会因函数形式变化而变化(即平行趋势对函数形式不敏感)的充要条件。若能满足该条件,使用DID方法或者事件研究法(event study)时结果会更为稳健可信;若不能满足该条件,研究人员应谨慎地阐述选择特定函数形式的理由。

本文提供了两个“平行趋势对函数形式不敏感”的充要条件。首先,本文证明了当且仅当Y(0)的整个累积分布函数(CDF)满足类似于“平行趋势”的条件时,平行趋势对函数形式不敏感。接下来,本文提出了第二个充分条件,它可分为三种情况:(i)处理是随机分配的,即无论t=0还是t=1,处理组Y(0)的分布都等于对照组Y(0)的分布(不过,此时似乎也不需要使用DID);(ii)无论是处理组还是对照组,它们Y(0)的分布都不随时间变化;(iii)总体由前两种亚人群混合组成,即一组亚人群是“处理是随机分配的”,另一组亚人群是“Y(0)的分布不随时间变化”。在此基础上,正文在3.2部分将“平行趋势对函数形式不敏感”作为原假设进行假设检验,并借助最低工资对就业影响的例子进行说明。

本文的学术贡献主要体现在两个方面。一方面,虽已有论文提出,平行趋势假设适用于对数值但不适用于水平值的情况 (Athey and Imbens, 2006; Kahn-Lang and Lang, 2020)。但本文首次提出了“平行趋势对函数形式不敏感”的充要条件。另一方面,本文提出的条件与为计算分布式处理效果(distributional treatment effects)而引入的假设相关,但又不同 (Athey and Imbens, 2006)。以AtheyImbens(2006)提出的CIC模型为例,CIC模型并没有将假设放在平行趋势上,而是对潜在结果的分布做出了假设。

文章结尾,作者对实证工作者面临的不同情况给出了几条具体建议。

02

平行趋势的不变性

首先,本文回顾了经典2*2 DID模型(canonical two-period difference-in-differences model)的平行趋势假设,其数学表达如下:

接下来,借鉴AtheyImbens(2006)的研究,作者对“平行趋势对函数形式不敏感”做出了严谨的数学定义,具体如下:

定义1:如果下面式子对所有严格单调且期望存在的有限函数g成立,那么我们则认为平行趋势假设对函数转换不变(也就是“平行趋势对函数形式不敏感”)

此定义也符合我们在实践中改变函数设定的直觉。研究人员发现因变量Y的平行趋势不成立时,也往往会对Y采取严格单调变换再去观察平行趋势,而不会对Y采取非单调变换。进行这一步骤时,研究者默认了“平行趋势对严格单调变换不敏感”,在正文中只需展示一种“好看”的函数设定结果即可。然而,实际上“平行趋势对函数形式不敏感”需满足比经典平行趋势假设更为严格的条件。

交代清楚定义后,作者引出了两个充要条件,即定理 3.1和定理 3.2(受限于篇幅,推文中不再展示证明过程,感兴趣的读者可下载原文阅读):

定理 3.1. “平行趋势对函数形式不敏感”当且仅当式子(2)成立时:

其中, 是的累积分布函数。式(2)可以看作是累积分布函数(CDFs)的平行趋势假设。

定理 3.2. 假设对于所有的,分布函数都相对于某个共同的支配正的有限测度存在Radon-Nikodym密度,那么当且仅当存在、只依赖于时间的累积分布函数和只依赖于组群的累积分布函数满足式子(4)时,平行趋势对函数形式不敏感:

在测度论中,Radon-Nikodym导数是一种衡量测度变化的方式,它可以将一个测度转化为另一个测度的密度,这里不过多展开。当CDF(累积分布函数)关于某种测度的Radon-Nikodym导数存在时,这个导数就可以被认为是概率密度函数(PDF)或概率质量函数(PMF),具体取决于测度的类型。如果这个测度是Lebesgue测度(连续测度),那么导数就是PDF;如果是计数测度(离散测度),那么导数就是PMF。文中引入关于Radon-Nikodym密度的假设主要是为了引出分布函数的概率密度函数,并使用概率密度函数证明定理3.2

式(4)意味着存在以下三种情况:

Case 1: 随机分配.

。此时,对于任何时期(t=0,1),处理组Y(0)的分布都等于对照组Y(0)的分布,也就是发生在处理(似乎)随机分配时。

Case 2:静态的Y(0).

即。此时,对于任何一个组(D=0,1,t=0时期Y(0)的分布都等于t=1时期Y(0)的分布,也就是Y(0)的分布不随时间改变。

Case 3:非随机分配和非静态.

此条件是Case 1Case 2的混合情况。此时,总体由两种亚人群混合组成, 部分人群“处理好像是随机分配的”, 部分人群的“Y(0)的分布不随时间变化”。以现实情况举例,case3可以解释为:总人口分为两个部分,其中一半为年轻工人,处理在年轻人中是随机分配的;另一半为年长工人,他们在两个期间都有未经处理的收入

接下来作者给出了三个例子:

第一个例子是如果Y服从于0-1分布,则式(2)等价于式(1)(可根据0-1分布的全概率公式得出)。此时,若式(1)成立就可保证Y的严格单调变换也满足平行趋势。

第二个例子是Y服从于正态分布,且对于所有的(d,t)方差均为正。此情况不能使case3得到满足,只能通过满足case1case2才能保证式(2)成立。

第三个例子是对case3的模拟,即混合分布情况。Y(0)的分布由式(4)生成,设定,, 并且 。从图1来看,处理组和对照组Y(0)的分布在两个时间段内(t=0,1)均不同,且随时间推移而变化。然而,两组概率密度函数的变化却是相同的。

在这种设定下,如表1中所示,平行趋势适用于Y的所有单调转换。

03

与之前文献的联系

在这一部分,作者将自己的工作与两支文献进行了比较和关联。

第一支文献中,作者列举了几篇使用CDFs平行趋势的实证论文。如Almond, HoynesSchanzenbach(2011)使用DID估计了食品券计划对儿童出生体重分布的影响,这一分析的有效性要求“出生体重”在整个分布上均满足平行趋势,这也是“平行趋势假设对函数形式不敏感”的充要条件。其他论文(例如Cengiz, Dube, LindnerZipperer (2019); Stepner(2019))也进行了相关分析。

第二支文献中,作者将本文的假设、结论与分布式DID模型(distributional DID Models)进行了比较,以AtheyImbens(2006)提出的CIC模型为例:

若对本文中(2)式移项,可以表示为:

等式(5)左侧是观测不到的分布,这也是CIC模型的核心假设所在。CIC模型假设每个组(处理组/对照组)Y(0)的分位数映射在时间上保持稳定,则可以使用对照组经验分布的信息推断出处理组的反事实分布,它的核心结论为:

CIC模型与本文的不同体现在:

在假设上,本文仍然是在传统的平行趋势假设下。本文推导出了潜在结果分布的条件,在这些条件下,通常的平行趋势假设对于转换是不变的。而CIC模型的假设不同于一般的平行趋势假设,它们假设的重点就是放宽了对Y的函数形式限制,即假设是Y对转换是不变的。

在结论上,CIC模型不适用于上面图1中所示的case 3;相反,满足例子2(正态分布)条件时,CIC模型成立,而本文的CDFs平行趋势假设不成立。

CIC模型与本文的相同点体现在:

两种方法推断的反事实分布在case 1case 2情景下是一致的。

除了CIC模型外,本文的条件(5)BonhommeSauder(2011)以及CallawayLi(2019)的分布式DID模型均不嵌套。

04

假设检验

与经典的平行趋势检验一样,CDFs平行趋势假设不能直接检验,只能证伪。

如式(7)所示,等式左边是观察不到的,等式右边三项均观察得到。等式左边是一个CDF,根据CDF的性质,它在y上必须是非严格递增的(weakly increasing)。但等式右边可根据观测数据计算,并不能保证随y非严格递增。因此,如果我们拒绝“等式右侧在y上非严格递增”的原假设,则可证伪条件(7)。实际上,这是强可检验(sharp testable)的,因为式(7)右侧是连续的,且y趋向于正负无穷时,等式右侧的极限分别为10

那么实践中如何进行这样的检验呢?为简单起见,我们将重点检验y在有限支持(finite support)  的情况(有限支持函数只有在某个有限的区间内才有定义,因此只能输出有限的函数值)。此时,原假设等价于检验隐含分布在所有支持点(support points)处都具有非负质量。也就是说,我们感兴趣下式的检验:

其中,是在y处的概率质量函数(PMF)。我们可以使用等式右侧的样本,对等式左侧PMF的隐函数进行估计,即。我们感兴趣的原假设是对于所有的, ,这可以使用矩不等式文献中的方法进行检验。研究人员还可绘制隐含分布,来可视化潜在的违反“分布式平行趋势”假设的情况。在连续Y的情况下,也可以采用类似方法,即使用检验连续矩不等式的方法(或将结果离散化)

接下来,作者使用了Cengiz等人(2019)的数据,以最低工资法的影响效果为例,继续阐述上述的假设检验如何应用于实证研究之中。该政策的pre-treatment period2007年或2010年,post-treatment period2015年,处理是指一个州是否提高了最低工资。

工资区间w中的就业人口比(Employment-to-Population Ratios)对应着wWi的质量函数。对于每个工资区间w,我们可以推断出处理组就业人口比的反事实,也就是

其中是组d中各州在t时期样本的就业人口占比。

2展示了在分布式平行趋势假设下的隐含反事实密度。对于图2.a,我们能够拒绝所有隐含密度都是正的原假设(p = 0.001)。这意味着研究人员使用这样的DID分析来估计形式为的ATT时,应该小心地证明平行趋势假设对于选择特定函数形式的有效性。相比之下,在图2.b,显示了2010-2015年期间的结果,我们看到估计的反事实分布几乎在所有地方都有正密度,我们不能正式拒绝它在所有地方都是正的假设(p=0.29)。但是作者仍然强调:首先,不能拒绝原假设并不意味着平行趋势对函数形式不敏感,这仍然是在证伪;其次,依赖这种平行趋势检验可能会导致pre-trends问题(Roth, 2022)

05

扩展

将正文中单调递增函数扩展其他类型函数: 跟随AtheyImbens(2006),作者关注平行趋势在什么情况下对所有严格单调变换都是不变的。那么对于非严格单调变换呢?在本文的工作论文版本中,作者提出了两种情况:第一,如果g的集合G很大,则可证明平行趋势对所有严格单调变换成立的实际上等价于平行趋势对所有可测量的变换成立。因为如果平行趋势适用于变换g1g2,那么它也适用于g1g2的任何仿射组合。第二,如果g被限制在更小的可转换的函数集中,那么处理组的反事实分布只能被部分识别。

其他的估计量: 在本文的工作论文版本中,作者表明当且仅当处理组的完整反事实分布被确定时,才能识别所有函数形式的ATT。这意味着,如果想要获得ATT(不仅仅是DID)的任何一致估计量,必须施加假设,要么依赖于函数形式,要么确定处理组的Y(0) 的完全反事实分布。

使用处理前时期(pre-treatment periods): 在具有多个处理前时期(multiple pre-treatment periods)的设定中,研究人员可能倾向于使用“不存在事前趋势”来证明一个特定函数形式的平行趋势的有效性。然而,KahnLangLang(2020)指出,处理前平行趋势成立对于处理后平行趋势成立(对于给定的函数形式)既不充分也非必要。事实上,在本文的工作论文版本中。作者证明:第一、如果Y(0)的支持(support)足够充足,那么将会有多个变换g,使得平行趋势在事前(pre-treatment periods)成立,然而至少一个g事后的反事实分布失效。第二、若样本有限,事前的平行趋势检验可能是low power的,依赖于它们可能导致pre-test偏差(Roth2022)

06

对应用工作的建议

文章最后,作者建议研究人员应更清楚地阐述选择研究设计的理由。首先,研究人员可以强调处理是随机分配的,此时平行趋势对Y的任何单调变换均不敏感。其次,研究人员可以对处理组在t=1时期Y(0)的分布施加假设。最后,研究人员可以使用政策背景来论证平行趋势假设对特定函数形式的有效性。比如,若生产函数设定为科布道格拉斯形式,那么研究人员选择log(Y)进行回归就更为合理,而不是Y。作者在工作论文版本给出实证建议更为丰富。与发表版本的差别体现在,如果研究人员想点识别ATT,则采用上述三种思路;如果研究人员愿意采用部分识别工具,可以对平行趋势施加弱一些的假设,如使用Honest DID方法。下图即为工作论文版本的实证建议总结,也列出来供大家参考。

作者信息:静峥,武汉大学经济与管理学院人口、资源与环境经济学专业硕士生,研究方向为资源与环境经济学、发展经济学,邮箱:jingzheng95@163.com,欢迎批评指正!

 Abstract

This paper assesses when the validity of difference-in-differences depends on functional form. We provide a novel characterization: the parallel trends assumption holds under all strictly monotonic transformations of the outcome if and only if a stronger "parallel trends"-type condition holds for the cumulative distribution function of untreated potential outcomes. This condition for parallel trends to be insensitive to functional form is satisfied if and essentially only if the population can be partitioned into a subgroup for which treatment is effectively randomly assigned and a remaining subgroup for which the distribution of untreated potential outcomes is stable over time. These conditions have testable implications, and we introduce falsification tests for the null that parallel trends is insensitive to functional form.

转自:“香樟经济学术圈”微信公众号

如有侵权,请联系本站删除!


  • 万维QQ投稿交流群    招募志愿者

    版权所有 Copyright@2009-2015豫ICP证合字09037080号

     纯自助论文投稿平台    E-mail:eshukan@163.com