序
经过三十多年的努力,中国经济已经从计划经济模式成功转型为以公有制为主导的社会主义市场经济模式。在经济转型与发展过程中,从中央到地方的各种经济政策发挥了主导作用。在国家层次上,有“五年计划”、《中国制造2025》《新劳动合同法》《社会保险法》等规划或法律法规,国家支持新兴战略产业政策,京津冀一体化战略,长江流域发展战略,自贸区战略,“一带一路”愿景,当然也包括财政、货币政策等。在地方层次上,有地方“五年计划”、地方产业政策以及地方性财政政策等。
各级政府的各种经济政策,大都是在调查研究、智库论证、征求有关各方意见的基础上形成的。但是,不少调查研究、征求意见并不一定经过充分、仔细的论证。尤其是各级政府领导人政务繁忙,很多人没有充分时间进行系统的调研与征求意见,也有不少停留在召开座谈会或会议讨论,存在一定程度的形式主义。由于时间等因素的限制,很难充分征求社会各方面的意见。一些从属于各级政府部门的智库,本身可能并不具有很高的专业性,有时还需要揣摩上级主要领导的意图,缺乏必要的独立性。相反,身在中国高校与科研机构、立场比较超然的经济学者的经济政策研究,往往具有较高的专业性和独立性。但是,中国经济学者在从事经济政策研究时,经常是在经过比较简单的定性分析之后,即提出自己的观点、政策建议。这些观点与政策建议,大多不是基于经济数据进行分析,通过严谨的推断过程所获得的结论,因此不具备较高的科学性。诚然,除经济数据外,还必须对经济的现状、历史有深刻的理解与丰富的感性认识。但是,只有建立在经济数据基础上的严谨的实证研究,才能从复杂的经济现象中揭示经济变量之间的因果关系和内在规律,从而使结论以及建立在结论基础上的政策建议具有较高的科学性。
因此,中国经济学者关于经济政策研究的一个努力方向,是提倡以数据分析为基础的实证研究,特别是对各个时期的各种经济政策进行量化评估。最近二十年来,计量经济学出现了一个新的领域,称为政策(或项目)评估计量经济学(econometrics of program evaluation),并广泛应用于评估各种社会经济政策。
所谓政策评估计量经济学,是在经济数据的基础上应用计量经济学方法与工具对社会经济政策进行量化分析,其主要目的是测度某个政策实施后对某个群体、某个行业或某个地区的“因果”影响。由于经济现象的不可实验性(如四万亿元刺激计划不可能再重复一次),政策评估的最主要困难是识别因果关系和测量政策效应的大小或强弱。政策评估计量经济学因此提出了各种条件下的量化评估方法,其核心是估计无法观测到的虚拟事实(counterfactuals),即没有实施某种政策时的效果,这样,某项政策的效应可测度为实际政策作用下的结果与虚拟事实之差。在国外,政策评估计量经济学已被广泛应用于经济学和社会科学很多领域,包括劳动经济学、工业组织、发展经济学、社会学等。例如,Card and Krueger(1994)运用双重差分法(difference in difference)考察了美国最低工资调整对就业的影响。Dehejia and Wahba(1999)使用倾向得分匹配(propensity score matching)估计就业再训练政策对于收入的影响。Hahn et al.(1999)应用断点回归方法评估了美国反歧视联邦法对少数族裔就业的影响。Abadie et al.(2002)则使用分位数处理效应模型估计美国大型的就业再培训计划对于收入分配的影响。Jacob and Lefgren(2004)利用美国芝加哥公立学校1996年教育改革数据评估了芝加哥公立学校所实施的设立暑期培训班以及学生成绩不好需要留级的教育政策对学习成绩的影响。Lalive(2008)评估了奥地利“区域扩展福利计划”(regional extended benefits program)实施后对男性与女性工人失业持续期的影响。
政策评估计量经济学,渊源于统计学科的流行病(epidemiological statistics)统计以及所谓的处理效应(treatment effect)统计。作为政策评估的重要方法论,政策评估计量经济学可用于对中国各种社会经济政策进行严谨的定量评估,这将大大提高中国社会经济政策研究的科学性。特别是现在已进入大数据时代,各种形式的经济数据非常丰富,也便于运用强大的计量机进行处理。事实上,一段时间以来,已有一些智库和学者开始运用计量经济学方法评估中国各种经济政策,并提出相关的经济政策建议。例如,中国科学院预测科学研究中心汪寿阳教授所带领的政策研究团队,多年来运用计量经济学方法,研究各种中国经济政策,很多建议获得政府采纳。美国南加州大学萧政教授等(Hsiao et al.,2012)提出了一种面板数据的政策评估方法,并评估了中国内地与香港的经济关系,他们发现虽然“九七”回归这一政治事件对香港经济增长没有显著影响,但是内地和香港关于建立更紧密经贸关系的安排(CEPA)对香港实际GDP增长贡献了约4%。韩乾、洪永淼(2014)利用上海证券交易所提供的一组市场交易数据,评估了国务院2010年通过的支持七大新兴战略产业的政策对证券市场投资的影响,他们发现这个利好产业政策只是为少数机构投资者提供了操作机会并造成财富从大量散户向机构投资者转移,并没有起到引导证券市场投资者向七大产业投资。Ouyang and Peng(2015)扩展了Hsiao et al.(2012)的方法,使用半参数的方法评估2008—2009年实施四万亿元财政刺激计划的效果。他们的研究发现,财政刺激政策起初的确促进了经济增长,特别是在2009年第三季度左右,GDP增速提高了约5.4%,但这一政策效果随后迅速降低,在2010年第四季度之后甚至变成了负值。因此,四万亿元的财政刺激政策只是临时对经济有促进作用,并无长期影响。
与其他经济学研究方法一样,计量经济学并不是放之四海而皆准的“灵丹妙药”,它既有科学性,也有局限性。在应用计量经济学方法与工具评估社会经济政策时,首先需要注意,每种方法和工具都有其适用的范围与条件,特别因为经济现象具有不可操控实验的特点,很多方法与工具是建立在一些假设基础之上,在应用时需要注意这些假设条件的合理性。
其次,计量经济学的方法论基础是概率论与统计学,因此数据样本的选择是一个实际应用中必然遇到的重要问题。如何选取一个具有代表性的数据样本,避免样本选择偏差,与方法和工具的选择一样重要。另外,数据质量也是一个潜在问题。大数据时代,数据收集与处理成本越来越低,数据质量越来越高。但是在中国,各个地区特别是各地政府部门所收集的数据,可能会存在这样那样的系统性偏差。应该提倡随机抽样调查,或者收集整理数据,建立比较具有独立性和代表性的经济数据库。
再次,经济政策定量评估还必须与定性分析以及其他各种研究方法相结合,包括理论逻辑分析、历史逻辑分析、实地调查研究等,而不是去取代现有研究方法。中国高校的经济学者经常被批评不熟悉中国经济实际状况,因此必须通过调查研究等方法获得第一手资料,丰富自己的感性认识。但是,感性认识并不能确保政策研究的科学性,我们还需要科学的理论思维和分析方法。天文物理学家正是依靠科学的研究方法与工具探索天体物体的运动规律,这值得我们学习和借鉴。
最后,对经济政策的定量评估与分析,需要注意对量化结果进行经济解释。经济政策评估与分析不是以严谨的学术期刊论文发表为主要目的,应该用通俗的语言和直观的表达方式向政府部门和社会公众传播研究结果。当然,直观表达和通俗解释并不意味着降低量化评估分析的标准。社会经济政策评估是经济政策研究的重要组成部分和重要方法,是提升经济政策研究与政策咨询之科学性和有效性的重要途径。尤其在目前经济下行态势下,研究如何制定最佳经济政策组合促进中国经济持续稳定快速发展,具有重要的现实意义,而定量评估各种社会经济政策的实际效果是制定最佳政策组合的关键环节。中国经济学者应该大力倡导应用计量经济学等现代经济学分析方法与工具对中国各种社会经济政策进行定量评估与分析,从而推动建设有中国特色的高水平的新型经济智库。
关于政策评估计量经济学,目前国内暂无详细介绍的计量经济学教材,最近,厦门大学经济学系赵西亮博士写了一本《基本有用的计量经济学》,该书利用潜在结果语言,从总体视角出发,集中探讨了政策评估过程中常用的因果效应识别策略。全书以随机化实验为基础,首先介绍了潜在结果和分配机制的概念,并利用潜在结果定义因果效应。然后介绍了随机化实验,一种特殊的分配机制,可以消除选择偏差,成为观测研究中各种识别策略的基础。所有的识别策略都是通过一定的设计模拟随机化实验,从而得到可信的因果效应估计。另外,作者还简要介绍了因果图方法,它是与潜在结果框架完全等价的因果模型,但是更加直观,容易使用。在这三个理论的基础上,该书介绍了线性回归、匹配方法、工具变量法、面板数据方法和断点回归设计等几种在观测研究中常用的因果效应识别策略。全书的主要特色是用潜在结果语言和因果图介绍各种识别策略。对于每种识别策略,作者还利用具体实例讲解各策略在Stata软件中的实现。当然,该书介绍的方法也有一定的局限性,正如我上文及该书结语中所述,各种识别策略模拟随机化实验,可以得到更为可信的因果效应,但是往往不能回答具体的内在影响机制,读者在使用的时候需要了解各识别策略的假设前提和内在限制。
赵西亮博士嘱我为该书作序,我欣然命笔,并认为该书是有关政策评估计量经济学的一本很好的入门教材,推荐给大家。是为序。
洪永淼
康奈尔大学Ernest S.Liu经济学与国际研究讲席教授
厦门大学经济学院和王亚南经济研究院院长
2017年2月6日