基于微观非实验数据的政策效应评估方法评价与比较(2)

来源:网络(转载) 作者:卫梦星 发表于:2012-08-21 20:13  点击:
【关健词】政策效应评估;反事实;准实验方法;匹配方法;工具变量法;断点
二、使用非实验数据构建反事实的方法 根据数据产生方式的不同,微观政策效应评估的方法可分为随机受控实验(randomized controlled trial)、准实验(quasiexperiment)以及匹配(matching)等方法。 1.随机

  二、使用非实验数据构建“反事实”的方法
  根据数据产生方式的不同,微观政策效应评估的方法可分为随机受控实验(randomized controlled trial)、准实验(quasiexperiment)以及匹配(matching)等方法。
  1.随机受控实验
  从某种意义上讲,随机受控实验是最可信的一种政策评估方法。它通过将符合项目参与条件的部分个体随机地排除至项目之外,为实验组对象提供一个自动生成的控制组。但是,随机受控实验有其自身的局限性:(1)在经济中很少遇到,且实施成本高,时间长;(2)不能用于外推,不能轻易用作政策实施前的决策依据;(3)实验要求控制组完全不受政策的影响,但实际中很难排除政策的溢出效应、替代效应等。基于以上原因,随机受控实验在实践中应用很少。尽管如此,这一方法仍可帮助我们判断其它评估方法的效力。
  2.准实验
  准实验方法将政策改革视为一项实验,试图在精心设计的实验条件下,为实验组找到一个自然产生的控制组。准实验方法包括工具变量(instrumental variables,IV)、双重差分(differenceindifferences,DID)以及断点回归(regression discontinuity,RD)等方法。其中,IV是该领域最早使用的方法;RD在2000年后才开始使用,目前使用还较少;DID是目前应用最多的方法,可信度也较高。
  3.匹配方法
  匹配方法是利用非实验数据进行政策评估时常用的方法。匹配的目的非常简单,就是要找出足够的可观测变量,找到与实验组个体足够相近的个体作为控制组,二者结果的不同完全取决于是否接受政策干预。这样,如果每个实验组个体都可以找到一个或多个与其具有相同协变量且未参与项目的控制组个体相匹配,那么实验组的每个个体的处置效应就可以计算,ATT也可相应地计算出来。
  计量经济学方法依托于数据,不同来源的数据具有不同的特征。在微观经济政策评估领域,常处理的数据类型主要有以下几种:截面数据(crosssection data)、纵向数据(longitudinal data)和重复截面数据(repeated crosssection data)。依托非实验数据进行政策评估时,必须根据数据特征选择恰当的评估方法。数据结构某种程度上决定了方法的选择,而数据质量则关乎实证结果的可靠性和正确性。由于随机受控实验在实际中较少遇到,本文将着重探讨准实验方法及匹配等其他方法的原理及使用。
  三、利用非实验数据进行微观政策效应评估
  1.工具变量法
  标准的计量经济学提供了一种处理内生性问题的方法——IV法。Ehrlich(1975,1977)运用时间序列数据和截面数据就美国执行死刑对降低谋杀率的影响进行的研究具有典型性。Ehrlich认识到谋杀率与死刑执行率之间的双向因果关系,并试图应用IV来解决其内生解释变量和遗漏解释变量的问题。他选择了此项政策支出的滞后量、总的政府支出、人口、非白人比例等变量作为IV,但并没有解释为什么这些变量是好的IV,所选出的这些IV与内生的解释变量之间又具有怎样的关联。直至Ehrlich(1987,1996)的研究出版,其选择IV的考虑及相关的因果识别问题才得到详细的阐述。Angrist(1990)和Angrist 等(1991)分别用IV研究了参加越战对老兵收入的影响和教育背景对收入的影响,从而充分显现了运用IV进行因果推断的价值。Card 等(1992a,1992b)将学生的出生州与出生队列作为IV,研究了教育投入对教育质量的影响,从而使得教育产出、教育质量领域的研究出现了重大转折。Bound 等(1995)指出了Angrist等.(1991)研究中存在的弱工具变量的问题,从而将IV的效率问题以及IV的选取准则引入研究。此后,有关IV研究的理论问题都主要集中在如何寻找最优的工具变量上。 工具变量法是一个相对简单的估计方法,但是有两个重要的缺陷:(1)工具变量的选择问题。在政策评估问题中,要找出满足条件的工具变量并不容易。在实践中,尤其是当纵向数据和政策实施前的数据可以获得时,研究者多使用因变量的滞后变量作为工具变量。但是,这同样会引发相关性,并不能从根本上解决问题。(2)如果个体对于政策的反应不同,只有当个体对政策反应的异质性并不影响参与决策时,工具变量才能识别ATT、ATE。但这是一个很强的假定,有时研究者不得不假定非理性,或者忽略研究对象的行为异质性(Heckman,1997)。
  2.断点回归
  RD是一种类似于随机受控实验的准实验方法。它的主要思想是:当个体的某一关键变量的值大于临界值时,个体接受政策干预;反之,则不接受政策干预。一般而言,个体在接受干预的情况下,无法观测到其没有接受干预的情况。而在RD中,小于临界值的个体可以作为一个很好的控制组来反映个体没有接受干预时的情况,尤其是在变量连续的情况下,临界值附近样本的差别可以很好地反映干预和结果变量之间的因果联系,进而计算出ATE、ATT等政策效应变量。
  RD最早是由美国西北大学的心理学家Campbell于1958年首先发展设计出来的,但一直没有得到广泛的应用。Hahn 等(2001)为断点回归的模型识别和模型估计进行了严格意义上的理论证明,并提出了相应的估计方法。自此之后,RD在经济学上的应用才开始盛行。到目前为止,对这一方法的研究成果还主要集中在劳动经济学领域。国内学者运用RD进行分析的研究还比较少见,余静文等(2010a)研究了城市圈所产生的集聚效应、辐射效应,考察了其对地区收入差距的影响;余静文等(2010b)还使用该方法考察了城市圈对区域经济绩效的影响,发现城市圈产生的辐射效应和政府治理结构转变所带来的效应会促进城市圈区域的经济发展。
  RD是一种类似于随机实验的方法,也是准实验方法中最具有可信性的方法。Lee(2008)认为在随机实验不可得的情况下,断点回归能够避免参数估计的内生性问题,从而真实反映出变量之间的因果关系。RD方法应用的关键假设是要求在断点附近的个体的特征相同,这一假设可以通过统计分析得到检验。由此可见,RD的吸引力不仅在于它的实验性,还在于它的因果推断可以方便地得到检验。
  3.双重差分
  近年来,DID在政策评估研究得到了广泛应用。DID处理选择偏差的基本思想是:允许存在不可观测因素的影响,但假定它们是不随时间变化的。假定不可观测因素Uit可分解为Uit=φi+θt+μit,其中φi是个体固定效应,不随时间变化;θt是个体所处的共同的环境带来的效应,对于所有个体而言都相同;μit是个体时点效应。DID假定实验组和控制组在研究的区间内具有相同的个体时点效应,也就是说μit相同,因此通过对截面单位在项目实施前后的结果取差值,就能排除φi、θt的影响。反之,若在政策实施条件下,个体时点效应μit不相同,则DID就不再是一致估计量。(责任编辑:南粤论文中心)转贴于南粤论文中心: http://www.nylw.net(南粤论文中心__代写代发论文_毕业论文带写_广州职称论文代发_广州论文网)
顶一下
(14)
100%
踩一下
(0)
0%


版权声明:因本文均来自于网络,如果有版权方面侵犯,请及时联系本站删除.