投稿问答最小化  关闭

万维书刊APP下载

研究分享 | 也谈经济学经验研究的“可信性革命”

2022/12/23 10:00:01  阅读:253 发布者:

作者:赵西亮,厦门大学经济学院

来源:量化研究方法

我宁愿发现一个因果律,也不愿做波斯国的国王。

——德莫克利特

内容摘要

内容摘要:本文主要探讨了最近三十年来发生在西方经济学界的经济学经验研究“可信性革命”的内含。本文讨论了为什么Angrist and Pischke (2010) 将“关注研究设计”看作“可信性革命”的核心。我们发现经验研究“可信性革命”的基础有两个:第一个是随机化实验。随机化实验是因果推断的黄金标准,也是“实验学派”经验研究分析中“研究设计”的基准。第二个是潜在结果框架。潜在结果的概念和分配机制的定义,使经验研究从直接对观测结果进行建模转向对潜在结果进行建模,从而促进了经验研究的“科学化”,提高了研究结果的“可信性”。

关键词:经济学  经验研究  可信性  随机化实验  潜在结果

引言

经验研究方法在经济学研究中的地位和作用越来越重要,根据肖金川等(2014)的统计,近年来国际五大顶尖经济学期刊所发表的文章中,经验研究性质的文章比重越来越多,2012年接近50%。国内也有相似的趋势,近年来在《经济研究》、《管理世界》等国内重要期刊上的文章,以计量经济学模型作为主要研究方法的论文超过发表文章总量的50%以上(李子奈和齐良书,2010),表明经验研究已经成为我国经济学研究的主流研究方法。

然而,经济学界历来存在着“计量经济学是否是科学”的争论 (Henry, 1980; Sims, 1980)Leamer (1983) 更是指出,“计量经济学的艺术就是,研究者在计算机终端中拟合许多(甚至上千个)统计模型,从中选择一个或几个符合作者预期的估计结果在论文中进行报告。”“我们发现我们正处于一种另人沮丧和不科学的景地。没有人将数据分析看作严肃的事情,或者更准确地,没有人把别人的数据分析当回事”。Leamer (1983) 提议让我们将计量经济学中的“谎言和欺骗”剔除出来,他提出的解决方案是“敏感性分析” (sensitivity analysis)。近年来,《经济研究》、《世界经济》等国内重要期刊的经验研究超过70% 的文章进行了敏感性分析(张成思和陈曦,2014),体现出我国经济学者对研究结果稳健性和可信性的追求,也体现出我国经济学经验研究的进步。

但是“敏感性分析”不是解决方案,也不是经验研究“可信性革命”的核心内容(Angrist and Pischke, 2010)。比如一个极端的例子,Sala-i-Martin (1997) 估计了200万个包含62个可能的解释变量的增长回归模型,其中3个变量是主要控制变量(包括GDP、预期寿命和1960年的小学入学率),其余59个其他解释变量的不同组合作为可能的模型设定,得到200万个回归结果,以检验结果的稳健性。但问题是,这些变量是否都是正确的控制变量?为何选择这些变量作为控制?为什么选择这样的函数形式而不是其他的函数形式?并且得到的结果往往很难进行因果效应的解释 (Angrist and Pischke, 2010)

既然“稳健性分析”也不能完全解决经验研究的可信性问题,那“可信性革命”的基本内含是什么呢?Angrist and Pischke (2010) 提出经济学经验研究的“可信性革命”的核心是“关注研究设计”。那么,什么是“关注研究设计”呢?近30年来发生在西方经济学界的经验研究“可信性革命”到底是什么意思?包含什么内容呢?本文就想回答这一基本问题,只有搞清楚了发生在西方经济学界的经验研究“可信性革命”,才能使我国的经验研究在“可信性”上更进一步。要回答这一问题,首先要从随机化实验谈起。

 随机化实验

经济学研究的一个重要内容是考察经济变量之间的因果关系,计量经济学的一个重要功用就是政策评价,而政策评价的基础是理清相关经济变量之间的因果关系,估计政策变量的因果效应。利用观测数据估计政策变量因果效应的时候,往往面临着“内生性”问题的困扰。因此,如何克服“内生性”问题,如何才能得到“可信的”因果效应,是经济学经验研究的主要内容。

在计量经济学应用研究中,一个重要的方法是“控制”(conditioning),比如我们研究教育对收入的影响,我们关注的是教育和收入这两个经济变量,但影响收入的因素很多,比如个人能力、家庭背景、所处行业和就业单位特征等等。为了得到教育对收入的“可信的”因果影响,我们的办法就是将其他可能影响收入的因素进行控制(前提是这些因素都是可观测的)。这一方法的哲学思想实际上来自于约翰·穆勒 (John Stuart Mill) 的差异法 (Method of Difference),“比较某现象出现的场合和不出现的场合,如果这两个场合除一点不同外,其他情况都相同,那么这个不同点就是这个现象的原因,两种情况的差异就是这个原因的因果效应” (Holland, 1986)。在自然科学中,人们往往采用穆勒的差异法,比如物理学中研究自由落体运动规律。在自然界中,铁球和羽毛的运动规律是不一样的,原因是影响物体降落的因素有很多,除了重力,还是空气摩擦力、风力、温度等等。物理学家研究自由落体运动规律,关心的是重力对物体运动速度的影响。物理学家采用了穆勒的差异法,将所有的其他因素都控制起来,在真空的状态下,只有重力这一因素起作用,那么,最后的运动规律就是重力的作用。。

早期的研究,特别是实验研究,往往都是从“控制”的角度,将所有其他可能的影响因素控制住。然而现实中,特别是在社会科学中,研究对象往往与人的行为相关,即使是实验研究,也很难象自然科学里的实验一样,做到把所有的其他因素控制住。

1935年,Ronald A. Fisher 在其经典著作《实验设计》中首次提出了“随机化实验”的思想,他使用了一个著名的“女士品茶”的例子,以判断该女士是否真的具有鉴别能力。在实验设计时,他指出“坚持除了要检验的加奶次序外,‘所有的杯子在各方面都是完全一样的’是不必要的,……,在任何实验中,你都不可能控制住所有可能的差异,……,随机化是保证实验得到可信因果效应的关键,……。实验步骤中的关键点就是让随机定律 (laws of chance) 完全控制我们的频率分布”(Fisher, 1935, p.18-19)

随机化的好处在于,我们不需要控制其他的可能影响因素,因为我们关心的原因变量的取值是随机化的,从而使不同值原因变量的个体的其他可能因素差异都是偶然性的,这样原因变量不同值结果变量的比较,即是该原因变量对结果变量的影响。还是回到教育收益率的例子,假设现在我们可以做随机化实验,考察大学教育对个人收入的影响。对于一个特定总体,对他们的教育进行随机化赋值,比如通过投均匀硬币的方式,正面让他接受大学教育,反面就只让他完成高中教育。如果我们可以完成这样一个假想的随机化实验,那么,我们直接用这两类人收入的比较,即可以得到大学教育对收入的平均因果效应。尽管这两组个体除随机化赋值的教育变量之外,在其他方面,比如能力、家庭背景等可能仍然存在着差异,但这种差异是随机性的,由随机定律控制,不会影响估计结果。如果用经典计量经济学的语言表述,可以构建下列模型:

ln(wage)=β0+β1educ+u

其中,左手边是对数收入,右手边是教育变量,u 为其他影响因素。尽管还有很多其他影响收入的因素,但教育变量 educ 的取值是随机化的,与其他未观测因素(其他影响收入的因素)不相关,从而满足经典线性回归模型的基本假设,因而可以得到教育收益率β1的一致估计。

随机化的关键作用是可以平衡不同原因变量取值下的其他因素的分布,使得不同原因变量值下样本的各协变量(包括可观测变量和未观测变量)具有相同的分布。比如,前面教育变量如果是随机化取值(简单起见,假设仅取二值:大学教育或高中教育),因为教育变量取值是随机化分配的 (random assigned),尽管影响收入的因素还有能力等变量,但通过随机化分配,使得接受大学教育和高中教育的这两组群体,除教育变量之外,其他特征都非常相似(统计分布意义上),包括可观测的和不可观测的变量,比如年龄,能力等。随机化实验的作用就是使除原因变量之外的因素能够分布平衡,从而使得两组个体具有可比性,则两组个体收入的差异就是教育的影响。

一般认为,随机化实验是因果推断的黄金标准 (Rubin, 2008; Abgrist and Pischke, 2009; Imbens and Wooldridge, 2009)。这也是为什么 LaLonde (1986) 的经典论文中,以随机化实验做为基准 (benchmark),构造观测的控制组,利用回归、固定效应、Heckman 选择模型等经典计量经济学方法估计培训对收入的影响,发现这些计量经济学方法都无法复制随机化实验的结果。因而,得到观察研究中计量经济学方法无法可信的估计出因果效应的重要结论。LaLonde (1986) 的研究直接推动了经济学经验研究的“可信性革命”,随后,有很多文献研究观测研究如何才能复制随机化实验的结果,如何才能使经济学的经验研究更加“可信”。

在医学领域,随机化实验是测度新药治疗效果的重要工具。比如,美国食品与药品管理局 (FDA) 规定,新药上市必须经过随机化实验的药效检验,才能进入到临床应用。近年来,越来越多的经济学家,特别是以美国麻省理工学院Banerjee 教授和 Duflo 教授为首的经济学家,在印度、印尼、南非等发展中国家开展了一系列的随机化实验,回答了政治、性别、教育等发展经济学政策问题。Duflo更是因“随机化实验在发展经济学中的应用”方面的工作而获得了2010年美国经济学会颁发的克拉克奖,该奖项奖励“在经济学思想和知识方面”做出突出贡献的40岁以下的美国经济学家。2012年,美国经济学会网站更是专门推出了一个供学者交流、共享随机化实验信息的网站,以推动经济学中随机化实验的应用。

理想的随机化实验是经验研究“可信性”的基准 (benchmark),“可信性革命”的内含实际是指在利用观测数据进行经验分析时,我们需要进行“研究设计”,尽量使我们的经验研究能够模拟随机化实验。尽管没有随机化实验,但研究者可以利用一些“自然实验”或“准实验”,可以使我们的观测研究接近随机化实验,从而使经验研究结果更加可信。因而,Angrist and Pischke (2010) 强调“可信性革命”的核心内容是“关注研究设计”。要真正理解经验研究“可信性革命”的内涵,我们还需要了解 Rubin因果模型 (Rubin Causal Model,简记为 RCM) 或潜在结果框架 (Potential Outcome Framework)

 Rubin 因果模型

经验研究的第一步是如何定义因果,最简单的方法就是穆勒的差异法,如果所有其他因素相同,仅有这一因素不同而造成结果的不同,那么这一因素可以看成是结果差异的原因,而结果的差异则可以看成是这一因素的因果效应。这一哲学思想,直观上比较容易理解,然而,在操作上仍然不明确。波兰统计学家 Neyman 1923)在研究农业重复随机化实验的时候,首先提出了潜在结果的思想。但由于 Neyman (1923) 是用波兰语写成的,在学术界并没有引起很大的关注。直到1974年, Rubin (1974)  重新独立提出了潜在结果的框架,并且 Rubin (1974) 将潜在结果框架的应用推广到观测研究中,从而将随机化实验和观测研究统一在同一个框架下。Holland (1986) Rubin 提出的潜在结果框架称为 Rubin 因果模型 (Rubin Causal Model, RCM)

Rubin 因果模型主要包含两个方面的内容:一个是概念性的“潜在结果”(potential outcomes) 的描述,一个是关于分配机制 (assignment mechanism) 的定义。我们首先简要的介绍一下什么是潜在结果。

1. 潜在结果

为了方便起见,假设我们研究的问题所涉及的原因变量是二值的,比如前文的教育变量,只取两个值:完成大学教育或仅完成高中教育。定义该原因变量为DD = 1 表示完成大学教育,D = 0 表示仅完成高中教育。假设我们考察的总体共有N个,个体用下标 i = 1, , N 表示。

什么是潜在结果呢?因为每个个体都有两种可能的状态,要么完成了大学教育,要么仅完成了高中教育,Rubin (1974) 将每个状态下的结果(这里是收入)称为潜在结果。无论研究者是否能够观测到,对于每个个体,这两个潜在结果都是存在的,并且Rubin (1974) 假设潜在结果是不变的、确定的变量。因而,对于某个体 i,我们可以用 Yi(0), Yi(1) 分别表示该个体在状态 0 (仅完成高中教育)和状态 1(完成大学教育)下的潜在结果。在下文中,在不引起混乱的情况下,我们将省略下标 i

任何一个个体不可能同时处于这两个状态,对于研究者而言,我们仅能观察个体两种状态中的一种,相应地我们也仅能观察到每个个体的一种潜在结果,另一种潜在结果是观察不到的。比如,某个体是大学毕业的 (D = 1),那么,我们可以观察到该个体大学毕业的收入 Y(1),但观察不到他如果没有完成大学教育 (D = 0) 时的收入 Y(0),相反,如果该个体仅高中毕业 (D = 0),则我们可以观察到其高中教育后的收入 Y(0),但无法观察到他如果完成大学教育 (D = 1) 时的收入 Y(1)。因而,我们观察到的结果 Y(观测收入)可以表述为,

Y=DY(1)+(1-D)Y(0)

注意观测结果Y和潜在结果 (Y(0), Y(1)) 之间的不同,前者是实现值,是我们观测到的结果,依赖于个体所处的状态;后者是在两种状态下的潜在结果,通常假设是固定不变的。比如对于某个体的潜在收入是 (4000, 6000元),表示如果他只接受高中教育,我们观测到的收入将是4000元,如果接受了大学教育,收入将是6000元,这两个数值是确定的,没有随机性。而观测结果Y是实现值,依赖于个体所处的状态,是随机变量,观测变量的随机性完全来自于原因变量D取值的随机性。

潜在结果 (Y(0), Y(1)) 和观测结果 Y 之间的区分是现代统计学和现代计量经济学的重要标志,是经济学经验研究“可信性革命”的关键。潜在结果的表述非常简单,但潜在结果的提出是经验研究“科学化”的标志,潜在结果使因果效应的表述更加清晰,使关于因果效应的分析不再模糊不清,不再象经典计量经济学方法一样,一开始就需要关于模型函数形式的设定。有了潜在结果的概念,个人因果效应的定义不需要对分配机制进行任何内生性或外生性的假设,直接可以定义为,

τi=Yi(1)-Yi(0)

即两种状态下潜在结果的差异就是原因变量对结果变量的影响。如果某个体接受大学教育的潜在收入是6000元,而仅接受高中教育的潜在收入是4000元,那么,上大学对其收入的影响就是2000元。因而,有了潜在结果的概念,因果效应的定义就非常清楚,不需要进行任何模型设定及其他外生性的假设。

潜在结果的另一个好处是它将潜在结果的建模和分配机制分离开来,不再象经典计量经济学方法一样将潜在结果和分配机制杂糅在一起。潜在结果框架可以清晰的告诉我们估计量的不确定性来自于哪里。因为有了潜在结果的概念,可以定义个体因果效应,从而分析中允许因果效应具有异质性,注意个体因果效应 τi 有下标 i,因而,不同个体的个体因果效应可以不同,从而潜在结果框架本身蕴含了异质性因果效应的设定,更加符合现实。

事实上,潜在结果的思想在经典计量经济学中也有过萌芽,Haavelmo (1943) 在研究联立方程模型(SEMs)时,讨论了供求模型的识别问题 (identification),他区分了供求函数中“任何想像的价格 π”和“实际价格p”,并将在实际价格 p 下的供求量看作是观察到的均衡量。他所描述的供求函数实际上就是 Rubin(1974) 的潜在结果,而均衡量就是观测结果 (Imens and Wooldridge, 2009; Rubin, 2008)。但不知为什么,后来计量经济学方法的发展,没有沿着潜在结果的方向走下去,而是开始对观测结果直接进行建模,将潜在结果和分配机制杂糅在一起,使因果效应识别变得难以理解,并且引入的假设也越来越多。然而,最近几十年来,越来越多的计量经济学家意识到潜在结果的价值,开始逐渐将潜在结果的概念重新引入到计量经济学的领域,发生了一场计量经济学的“可信性革命”,代表人物主要包括斯坦福大学的 Imbens、麻省理工学院的Angrist、哈佛大学的 Abadie 等人,通常称之为计量经济学的“实验学派”。

2. 分配机制 (assignment mechanism)

分配机制是 RCM 框架的第二个重要内容。分配机制是用来解释为什么有的个体接受了干预 (treatment) 而另外的一些没有接受干预,或者说,分配机制是告诉我们哪些潜在结果可以观测到,哪些潜在结果无法观测到。具体地,分配机制是通过一个有关原因变量 D 取值的概率模型描述为何对于不同个体观测到不同的潜在结果,定义为:

Pr(D|X,Y(0),Y(1))

其中,X 为影响原因变量的协变量,是 D 取值之前就确定的变量,往往是反映个体属性的变量。比如研究教育收益率时,X 中应该包括考大学时的一些个体特征、家庭背景等信息。

Rubin 将分配机制分成三类:随机化实验、非混杂机制和不规则机制。第一种机制主要针对随机化实验,后两种机制适用于观测研究 (observational studies)。在随机化实验中,每个个体接受干预 (D = 1) 的可能性不依赖于潜在结果,并且是协变量 X 的已知函数。非混杂 (unconfounded) 机制,计量经济学中也称为依据观测变量的选择机制 (selection on observables),是指个体接受干预的可能性仅依赖于观测变量,独立于潜在结果,与随机化实验不同的地方在于倾向指数不再是协变量的已知函数。除随机化实验和非混杂机制之外的均称为不规则机制,这种机制下,个体接受干预的可能性与潜在结果具有相关性,计量经济学中也称为依据非观测变量的选择机制 (selection on unobservables)

分配机制的概念将随机化实验研究和利用非实验数据的观测研究统一起来,三类机制下分析方法的差异主要在于分配机制的不同,而随机化实验是另外两机制下分析的基础。比如,在第二种机制下,个体分配机制满足非混杂性,在控制了观测变量之后,潜在结果与原因变量是独立的,它的基本含义就是在控制了观测变量 X,或在观测变量 X 某给定取值下,原因变量 D 的取值可以看成是随机化分配的。在这种情况下,因果效应的估计比较简单,类似于随机化实验下的估计,可以利用匹配方法或回归方法得到可信的因果效应估计,具体方法可以参见 Angrist and Pischke (2009)

对于第三种机制,分配机制部分依赖于潜在结果,这种情况下没有统一的处理方法,但对于一些特殊的机制,目前学界已经有比较深刻的理解,比如工具变量法 (Instrumental Variables,简记为IV)、倍差法(difference-in-difference,简记为DID)、断点回归法 (Regression Discontinuity Design,简记为RDD)。所有这些方法的共同特点都是利用“自然实验”或“准实验”来模拟随机化实验,以得到更为可信的因果效应估计。比如我国经济学界比较熟悉的工具变量法,它的基本要求是找到一个外生的工具 Z,这一工具与我们关心的原因变量 D 相关,但独立于潜在结果,Z仅通过原因变量D这一唯一途径影响结果Y。或者说,要求工具变量 Z 满足非混杂性,即以观测变量X为条件,工具变量Z与潜在结果 (Y(0),Y(1)) 是独立的 (Y(0),Y(1) Z|X)。工具变量类似于一种随机分配机制,工具变量 Z 与潜在结果 (Y(0),Y(1))之间的关系类似于一种随机化实验。工具变量 Z 的变动会改变个体的状态 D,如果 D Z 都是二元变量,我们可将考察的群体分成四类:总是参与者 (always takers)、从不参与者 (never takers)、依从者 (compliers) 和叛逆者 (defiers)。在单调性假设下,如果个体因果效应是异质的,那么工具变量法所得到的因果效应仅能解释为依从者的平均因果效应 (LATE)(Angrist, Imbens, and Rubin, 1996; Angrist and Pischke, 2009)

断点回归法(RDD)是另一个例子,它是针对原因变量或干预变量 (D) 依赖于某一分配变量 (X) 的取值是否高于某一特定的阀值 (c) 的情形,D = 1(X c),其中 1(·)为示性函数,条件为真取1,为假取0。如果个体不能够精确的操纵分配变量 X,那么在临界点 (c) 附近,就近似于一种随机化实验,即在临界点附近,两种状态下(D = 1 D = 0)的个体在观测和未观测特征上是相似的,因而,可以直接用断点附近两种状态个体观测结果的差异作为原因变量的因果效应。

 关注研究设计

通过上文的介绍,我们看到潜在结果框架或Rubin因果模型与传统的计量经济学方法(这里指考尔斯 (Cowles) 委员会构建的结构计量经济学体系)有着很大的不同,最主要的区别就是RCM将潜在结果和分配机制分离开来,单独针对潜在结果建模,而不是象传统计量经济学方法一样直接对观测结果建模。从而使计量经济学的“实验学派”更加强调“研究设计”,因为,计量经济学“实验学派”在进行经济学经验研究时,把随机化实验作为基本的参考标准,随机化实验是因果推断的黄金标准,他们将观测研究看成是复杂的随机化实验,只不过分配机制非常复杂,并且是未知的,研究者的主要目的就是通过研究设计将其中的分配机制恢复出来,使得因果效应更加可信。因而,Angrist and Pischke (2010) 将“关注研究设计”看作经济学经验研究“可信性革命”的核心内容。要使经济学经验研究更加“可信”,必须对观测研究进行设计,使其近似于随机化实验。那么,经济学经验研究应该怎么做,才能做到更“可信”呢?或者说,如何进行观测研究的“研究设计”,才能使观测研究接近于随机化实验呢?Angrist and Pichke (2009) Rubin (2008) 都提出了一些建议:

首先,要明确我们关心的因果效应是什么,对于我们研究的问题,针对所拿到的非实验数据(观测数据),假想的随机化实验或理想的随机化实验是什么样子?研究设计的第一步就是要认真思考什么样的随机化实验才能回答我们想要回答的问题。

第二步是考察我们拿到的样本容量是否足够,这是传统的关于统计功效 (power) 的要求。如果我们的样本容量足够大,那么,我们要做的就是把结果变量先拿掉,就象在真正的随机化实验中一样,在实验设计阶段,我们是不知道观测结果的,只有实验完成之后,我们才能看到观测结果。尽管我们的数据已经是观测数据,观测结果已经有了,在研究设计阶段,我们仍然关注于“设计”,而不考虑结果。不要让观测结果影响我们的研究设计,这一点对于保证后面估计的“可信性”非常重要,是保证因果推断“客观性”和“科学性”的关键。

第三步是恢复分配机制。在这一步要仔细思考为什么有些个体接受了积极干预(比如上大学),而另外的个体却接受了控制干预(仅完成高中教育)?谁是干预状态选择的决策者(谁决定是否上大学),他们遵循的规则是什么?在随机化实验中,这些问题都是已知的,实验者提前就设计好了。但在观测研究中,我们要仔细思考并充分论证假想的随机化分配机制。回归是没有办法解决这一问题的,必须仔细思考什么样的假想随机实验才能复制观测数据。

第四步是检验关键协变量X是否很好的测度。这一步要考察关键协变量的测度质量,如果关键协变量X的测度质量很差,或数据中不存在该变量,去寻找另外的包含该关键变量的数据可能是更加明智的选择。“任何复杂和精妙的分析都不能够拯救数据的不足,除非有非常充分的理论支持你的假设”(Rubin, 2008)

第五步检验关键协变量是否在干预组和控制组之间达到了平衡。这一步试图通过不同的分组或控制,使得同一组子群体中干预个体和控制个体的关键协变量是平衡的,即在子群体中,干预个体和控制个体应该看起来象是随机化分配的。

这五步构成了观测研究“研究设计”的基本步骤,完成“研究设计”之后,我们这时才考察观测结果,从而计算出我们感兴趣的因果效应参数。

以前文提到的教育收益率研究为例,看一下如何通过“研究设计”得到更加“可信”的因果效应的估计。研究教育收益率,我们主要是关心教育对个体收入的影响,这里我们仅关注大学教育的作用。假设我们有一个关于个人教育 (D) 和个人收入 (Y) 的观测数据,我们想利用这个数据得到教育收益率的估计。在“研究设计”阶段,首先我们要考虑理想的随机化实验是什么?理想化的随机实验就是能够将每个人的教育变量进行随机化分配,每个个体都是随机的分配到大学教育或高中教育的组别中,并且每个人被分配到大学教育中的概率都是为正的且小于1。这样的理想化随机实验可以回答我们感兴趣的因果效应,如果有这样的一个随机化实验,两组群体平均收入的差额就是大学教育对个人收入的平均影响。但我们的数据不是随机化实验数据,假设数据容量足够大,满足统计功效要求。这时,我们不考虑个体的观测收入,或暂时将个体的观测收入数据删除。第三步我们要考虑上大学的决策机制是什么样子的,是谁做出大学教育决策的。在我国而言,考大学时年龄基本上在18岁左右,因而考大学时的个人背景信息都可能会影响个人选择,除了学生个人兴趣,父母往往是孩子是否上大学的重要决策者,所有这些因素都应该是关键的协变量。第四步考察关键的协变量是否存在,这里主要是孩子考大学时的家庭背景信息,比如父母教育、家庭收入、所处地区、孩子本身的能力、学习成绩等等,这些是关键的协变量,这些变量是否存在,测度质量如何。比如中国综合社会调查数据(2003年)就调查了个体18岁时的家庭背景信息,那么这一数据就非常适合于进行教育收益率的研究(赵西亮和朱喜,2009)。第五步是因果效应的识别策略是什么。在这里,如果我们有前述关键协变量的信息,则我们可以根据这些协变量将个体分成不同的子群体,则子群体内部可以近似看作随机化实验。如果某些关键协变量不存在,比如个人能力变量。这时我们的识别策略可以考虑寻找外生的工具,比如 Angrist and Krueger (1991) 根据美国义务教育法的规定,找到个人的出生季度作为工具。因为出生季度的不同直接影响个人的入学年龄,义务教育法规定孩子不足16岁不能退学,这样就使出生季度晚的倾向于接受较少的教育,而出生季度早的倾向于接受更多的教育,而出生季度不会直接影响个人收入,出生季度之所以与收入相关,原因是出生季度是仅通过教育这一唯一途径影响收入的。因为出生季度是独立于潜在收入的,从而该工具变量对两组群体(大学教育和高中教育)间近似于随机分配的,从而可以识别出因果效应。只不过这一估计结果只能解释为那些有退学倾向的学生的平均因果效应,因为该工具只会影响那些在16岁时退学的学生,而对其他学生没有影响。上述“研究设计”完毕之后,我们就可以将收入变量纳入进来,利用匹配方法、回归方法或工具变量法来估计教育收益率了,方法的选择依赖于我们的识别策略。

总结

近十几年来,我国现代经济学的发展非常迅速,经济学经验研究越来越受到学者的重视,近年来,国内学者也越来越关注经验研究的“科学性”和“可信性”问题,最近30年来,西方经济学者在这方面走在了前列。

本文主要探讨了发生在西方经济学界的经济学经验研究“可信性革命”的内含。本文讨论了为什么Angrist and Pischke (2010) 将“关注研究设计”作为“可信性革命”的核心,因为计量经济学的“实验学派”将理想的随机化实验作为其观测研究的基准,只有随机化实验才能得到可信的因果效应的估计。因而,在观测研究中,要首先通过“研究设计”,使观测研究近似于随机化实验。

Neyman-Rubin的潜在结果框架 (RCM) 引入了潜在结果的概念,并定义了分配机制,从而使随机化实验和观测研究统一起来,将所有观测研究分成了三类:随机化实验、非混杂机制和不规则机制。潜在结果的概念将计量经济学由直接对观测结果建模转向对潜在结果建模,使研究者更集中精力思考观测数据的分配机制,从而,避免了模型设定方面的假设和错误,并且使因果效应的测度更加清晰。尽管工具变量法等计量经济学方法早就在经济学应用研究中广泛使用,但潜在结果框架对这些方法进行了重新诠释,使估计结果更容易理解,更容易考察异质性因果效应问题。

本文的目的是抛砖引玉,希望能够促进“可信性革命”的思想和内容在我国经济学界迅速传播和发展,因而,本文没有对“实验学派”的具体研究方法展开讨论。经济学经验研究不仅仅是回归,事实上,有时回归是有害的。回归只是一种统计工具,只有当科学的“研究设计”完成之后,回归分析才有价值。最近30年来发生在西方经济学界的“可信性革命”最重要的贡献是认识到这一点:“研究设计”才是经济学经验研究“可信性”的关键,不仅实验研究需要设计,观测研究也需要“研究设计”。

转自:“经管学苑”微信公众号

如有侵权,请联系本站删除!


  • 万维QQ投稿交流群    招募志愿者

    版权所有 Copyright@2009-2015豫ICP证合字09037080号

     纯自助论文投稿平台    E-mail:eshukan@163.com