基于微观非实验数据的政策效应评估方法评价与比较(4)

来源:网络(转载) 作者:卫梦星 发表于:2012-08-21 20:13  点击:
【关健词】政策效应评估;反事实;准实验方法;匹配方法;工具变量法;断点
PSM作为非参数方法,不需要对可观测因素的条件均值函数和不可观测因素的概率分布进行假设,因而相比参数方法具有优势。但是,PSM也有局限性,主要表现为以下几点: (1)极强的前提假设。PSM的应用必须满足CIA和

  PSM作为非参数方法,不需要对可观测因素的条件均值函数和不可观测因素的概率分布进行假设,因而相比参数方法具有优势。但是,PSM也有局限性,主要表现为以下几点:
  (1)极强的前提假设。PSM的应用必须满足CIA和共同支撑域假定,这两个假定合起来称为“强可忽略性”假设。一旦违背这一假定,ATE和ATT就会出现偏误。Heckman 等(1997)通过假设检验表明当“强可忽略性”假定不满足时,不宜应用PSM的方法对政策效应进行评估;Heckman(2008)通过理论分析认为当存在未观测到的混杂因素时,PSM方法不仅不能消除系统误差,反而会带来新的偏差;刘凤芹等(2009)运用蒙特卡罗模拟实验的结果也表明PSM对强可忽略性假设非常敏感,即使是轻度的违背,PSM的估计结果偏差也超过50%;Kannika 等(2010)运用实际数据,对比参数方法与PSM方法的结果,进一步验证了PSM的应用需要满足“强可忽略性”假定。
  (2)不能为所有的实验组个体找到控制组个体。匹配方法仅能为处在共同支撑域上的个体找到合适的对照个体。如果对于不同个体而言,处置效应是同质的,那么共同支撑域的假定不会对政策效应的大小造成影响;反之,如果处置效应是不同质的,共同支撑域的假定使得某些实验组个体很难找到“反事实”,处置效应无法识别。换句话说,如果匹配过程损失了大量的观察值,处置效应的估计量就仅在共同支撑域上具有一致性特征。在异质性响应中,如果实验组个体的处置效应差别很大,估计出的ATT就不能代表政策的平均回报。
  (3)数据量要求极大。Matching方法往往应用于截面数据,为了保证条件独立假设成立,需要尽可能多地搜集协变量信息,将混杂因素分离出来。同时,为了保证能找到与实验组个体特征最为接近的控制组,研究者也需要收集大量的个体数据,以保证结果的精度。 (4)结果的稳健性受到多种挑战。PSM方法计算得到的ATE或ATT的稳健性受到多种因素的影响,如干预分配机制方程的设定、匹配算法的选择等。刘凤芹等(2009)运用蒙特卡罗模拟实验的结果表明,PSM对误差项分布不敏感,对隐指标方程的误设极为敏感;在共同支撑域较小时,PSM对具体匹配方法的选择极其敏感。
  综上所述,Matching的应用必须满足很强的假设前提,并且要具有相当的数据量。如果研究者认为无法验证强可忽略性假定,手头的数据样本又不够大,就必须选用其他的政策评估方法,如DID和样本选择模型等,它们都明确允许有未被观测到的混杂因素的存在。
  四、研究评述
  本文对政策评价的基本原理做了简单阐述,指出构建“反事实”是政策效应评估的核心。目前利用微观非实验数据构建“反事实”的方法主要有RD、IV、DID和Matching等方法,其中,RD类似于随机实验,因果推断最为清晰,结果最为可信,假设的可检验性也最强,但适用的范围还较小;IV、DID、Matching是目前微观政策评价中的常用方法。本文从适用数据类型、对混杂因素的处理以及参数识别三方面对三种方法做简要比较,如表2所示。
  表2基于微观非实验数据的政策效应评估方法比较
  数据类型及容量对方法的选用至关重要。IV法多用于截面数据,但在纵向数据和重复截面数据中也有应用;(条件)DID方法对重复截面数据的处理效果最佳,但必须能够获得政策实施前的相关数据;Matching能很好地应用于截面数据和纵向数据,但需要大量的个体数据作为支撑,当数据量充足时,简单的PSM模型也能获得理想的政策效应参数。仅就数据要求而言,Matching所需的数据量最大。
  不同方法对不可观测因素的处理也不相同。IV和Matching假定不存在未被观测到的混杂因素,所有能同时影响干预分配机制及结果变量的混杂因素都被观测到,个体接受或不接受政策干预都取决于可观测变量。从这个意义上讲,IV和Matching是基于可观测变量的评估方法。而DID则容忍不可观测因素的存在,且允许其对个体决策产生影响,通过假定及差分消除不可观测因素的影响。从对不可观测因素的处理而言,DID更为严谨。
  当处置效应同质时,IV、DID和Matching均可识别ATT、ATE,但当处置效应异质时,各种方法对ATT、ATE的识别情况各不相同。此外,Matching是非参数方法,不用设定方程,更具一般性;DID方法不用施加严格的外生假设,只要处置效应能以可加方式进入结果方程,甚至都不用定义结果方程。相比而言,IV需要对方程施加严格的外生假定,实证分析中需要做更多的检验。
  综上所述,各种方法的适用条件各有不同,优劣各异,在政策效应评估实践中,研究者必须以经济理论为基础,根据政策本身的特点,结合所能获取的数据特征选择适用的方法,并选择符合研究目的的政策效应参数进行识别和估计。
  参考文献:
  陈玉萍,吴海涛,陶大云,等.2010.基于倾向得分匹配法分析农业技术采用对农户收入的影响——以滇西南农户改良陆稻技术采用为例[J].中国农业科学(5):36673676.
  黄清.2009.电力行业放松规制改革政策效果的实证研究——基于发电业数据的双重差分模型检验[J].山西财经大学学报(1):4956.
  刘凤芹,马慧. 2009.倾向得分匹配方法的敏感性分析[J].统计与信息论坛(10):713.
  刘生龙,王亚华,胡鞍钢.2009.西部大开发与区域经济收敛[J].经济研究(9):94105.
  李佳路. 2010.扶贫项目的减贫效果评估:对30个国家扶贫开发重点县调查[J].改革(8):125132.
  李楠,乔榛. 2010.国有企业改制政策效果的实证分析——基于双重差分模型的估计[J].数量经济技术经济研究(2):321.
  聂辉华,方明月,李涛. 2009.增值税转型对企业行为和绩效的影响[J].管理世界(5):1735.
  胥佚萱,林志伟.2011.增值税转型改革与企业固定资产投资决策——基于中国上市公司数据的面板双重差分模型分析[J].税务与经济(1):9097.
  俞红海,徐龙炳.2010.股权分置改革有效改善了公司绩效吗?——基于双重差分模型的估计[J].浙江工商大学学报(1):5662.
  余静文,赵大利. 2010a.城市群落崛起、经济绩效与区域收入差距[J].中南财经政法大学学报(4):3038.(责任编辑:南粤论文中心)转贴于南粤论文中心: http://www.nylw.net(南粤论文中心__代写代发论文_毕业论文带写_广州职称论文代发_广州论文网)
顶一下
(14)
100%
踩一下
(0)
0%


版权声明:因本文均来自于网络,如果有版权方面侵犯,请及时联系本站删除.