异质性分析的新思路
2023/2/8 10:14:24 阅读:187 发布者:
一、缘起
最近读论文的时候,看到一种新的异质性分析的做法。该方法来自于范子英老师 2022 年发表在《中国工业经济》上的论文《财政激励、市场一体化与企业跨地区投资——基于所得税分享改革的研究》。
在异质性分析部分,其并未按照常规做法对总样本进行划分,而是用了一种更为精巧的方法,具体如下:
本文按照行业将实验组的样本划分为制造业和非制造业两组,分别与对照组进行回归。
随后,在群里讨论了一下这两种做法的差异,并在 阳陈 的帮助下,发现会计学顶刊 CAR 于 2020 年发布的一篇文章中,也用了相同的做法:
In the first two columns, we partition our treatment firms into two subsamples based on the median of cost of debt and assign the control firms to the same group.
这一做法有个很明显的优点,那就是降低了分组本身对结果造成的干扰,因为异质的两组使用的是同一个对照组进行比较,而非不同的对照组。
下面我们做简单分析。
二、简单分析
我们考虑一种简单情形:
是工资
为是否上过大学
为是否为男性,仅考虑男、女两种性别
当不存在选择性偏误时,教育回报率为:
假如我们想知道教育回报率的性别差异,此时,我们一般会按照性别进行分组回归。但是,如何进行分组,却有两种不同的方法。
方法一
按照常规做法,我们会将总样本按照性别分为两组,分别进行回归。如下图所示:
此时,男性教育回报率为:
女性教育回报率为:
但是这种方法其实隐含着一个很强的假设,即未读大学的男性与女性不存在系统性差异。不然的话,即使两个系数存在着显著差异,我们也很难说明教育回报确实存在着性别差异,还是仅因为分组本身带来的影响,如男女性的生理差异、性别角色、文化规范等。
此外,还有一个问题的就是,分组往往会导致样本量减少,这会损失估计效率。当两个组别的样本量差距太大时,我们也很难讲清楚,到底是样本减少带来的效率损失,致使显著性存在差异,还是组间差异其来有自。
方法二
另一种思路是先将样本划为男大学生和女大学生,然后分别与未读大学的样本进行回归。
此时,男性教育回归率的估计结果为:
女性教育回报率为:
与方法一相比,方法二有两个优势:
可比性强
两组样本的对照组相同,不管是男大学生还是女大学生,比较对象都是未读大学的样本。
样本量大
因为对照组相同,这意味着在实际回归中,未读大学样本用了两次。通常情况下,“男大学生+未读大学”样本量会大于“男性样本”,同理,女性样本也是如此。这意味着两组估计值的效率都会有一定程度的改进。
尾声
不得不说,大佬的文章处处透露着精妙,细细品类,受益匪浅。
参考文献
范子英,周小昶.财政激励、市场一体化与企业跨地区投资——基于所得税分享改革的研究[J].中国工业经济,2022(02):118-136.
Hope, Ole‐Kristian, Heng Yue, and Qinlin Zhong. "China's anti‐corruption campaign and financial reporting quality." Contemporary Accounting Research 37.2 (2020): 1015-1043.
本文转载自微信公众号“学术宅”。
转自:“刘西川阅读写作课”微信公众号
如有侵权,请联系本站删除!