公共管理评论2017年第1期 总第24期第39~54页
科技计划对企业创新的作用评估:基于863计划的实证研究
【摘要】财政科技投入的快速增长与企业薄弱的研发能力,令政府科技计划的作用在我国饱受质疑。科技计划究竟能否促进企业创新,又如何对其作用效果进行评价?本文引入了基于增量概念的科技计划评估框架,并以国家高技术研究发展计划(863计划)为例,实证考察了科技计划对企业创新的作用效果。在运用双重差分倾向得分匹配(PSM-DID)控制选择性偏误后,本文发现,863计划的资助显著提升了企业的创新绩效。本文的研究结论为这一尚处于争议中的研究问题提供了来自新兴国家的重要经验证据。
【关键词】科技计划 政策评估 企业创新 双重差分匹配
一 引言
自第二次世界大战结束以来,美国的先进技术计划(ATP)、小企业创新研究计划(SBIR),欧盟的框架计划(FP)、尤里卡计划(EURECA)等科技计划如雨后春笋般相继启动,现已成为政府组织并推动科技发展的基本渠道和主要模式。在我国,科技计划更是促进科技创新能力与产业发展的一项重要政策工具。统计数据显示,2014年我国的政府财政科技投入达6454.5亿元,占财政支出的4.25%,其中对科技计划的中央财政拨款就高达287.9亿元。
然而在财政科技投入的长期支持下,作为创新主体的企业,研发能力却备受诟病。数据显示,2014年我国规模以上工业企业的平均研发强度仅0.84%, 远逊于美、欧、日等国家企业平均3%的研发强度。企业“大而不强”的问题始终存在:一方面我国企业在世界500强榜单中的排名与数量迅速上升;另一方面在汤森路透发布的“2015全球百强创新机构”中,竟无一家来自中国大陆的企业上榜。政府科技计划的有效性也因此饱受质疑:政府官员究竟能否有效地分配、管理与使用财政科技经费?科技计划究竟能否有效地促进企业创新?
事实上,科技计划的真实效果并非不证自明(self-evident)。政府的研发资助究竟能否促进企业创新,具备较大的异质性,需要进行科学审慎的评估分析。然而长期以来,这类研究都面临着两个核心问题:一是基于什么样的认知框架来理解并评价科技计划发挥的作用?二是通过什么样的计量方法来准确识别政策干预和政策目标间的因果关联。尤其是后者,现已成为创新政策领域关注的焦点问题。
针对上述问题,本文引入了基于增量概念的科技计划评估框架,并以国家高技术研究发展计划(863计划)为例,实证考察了政府科技计划对企业创新的促进作用。基于双重差分倾向得分匹配估计(PSM-DID)的平均干预效应(ATT)估计有效控制了政策评估研究中常见的选择性偏误,得以做出可靠的因果推断。
二 理论背景与研究假设
(一)科技计划与企业创新
现代经济理论指出,创新的正外部性会导致均衡状态下私人部门的研发投入低于社会最优水平。创新作为一种“知识”,很容易被他人学习模仿,这使得创新主体在承担风险的同时却难以独占收益,因而削弱了创新的意愿。同时,研发活动的高调整成本(high adjustment costs)、长回报周期(long-term returns)等特征都导致企业家不愿投入到研发活动中,进一步加剧了上述知识市场的失灵问题。
与此同时,创新还面临资本市场的失灵问题:企业家与外界的信息不对称(information asymmetry)会造成企业的融资约束(financial constraint)。首先,投资人难以判断高技术、高风险项目的优劣;而出于对模仿者的防范,企业家也不愿过多透露新产品的技术特性,加剧了“逆向选择”与“柠檬溢价”。其次,研发活动的直接产出主要依附于人力资本,以无形资产为主不易测量,同时产出的不确定性也进一步增加了外部监管的难度,加剧了“道德风险”问题。
有鉴于此,世界上绝大多数国家均积极通过政府科技计划干预企业的研发活动,以弥补创新的正外部性。一方面,科技计划提供的研发补贴能降低企业创新的成本与风险,进而促进企业的创新行为与创新产出;另一方面,科技计划还能扮演金融中介的作用,通过向市场投资人传递有关企业质量的积极信号,缓解双方的信息不对称,从而帮助企业吸引外部融资。
然而尽管如此,仍有大量学者质疑科技计划的实际效果,认为由政府挑选赢家(picking winner)的模式存在较多的不确定性。
首先,科技计划的核心特征就是资助项目的竞争性与选择性。而政治家与政府官员同样是自利且理性的,很有可能会在公共资源的配置中采取机会主义行为(opportunistic behavior)。尤其是在选择资助对象时,政府官员更愿意选择那些即便未获得政府资金支持也有较大概率成功的研发项目,从而造成科技计划在表面上的“有效”。另外,由于难以完全依赖客观指标,科技计划在选择资助对象时的主观性也为政府官员的寻租行为提供了天然土壤,如Furman在分析我国科技型中小企业创新基金的资助对象时就发现,政治关联企业更容易获得科技计划资助。
其次,企业往往将科技计划视作一种相对“廉价”的资金来源,从而造成浪费,或者低于自有研发资金的使用效率。同时,由于存在信息不对称,科技计划的主管部门难以准确得知资助企业基于研发资助所形成的产出,这使得企业有能力向政府隐瞒资金的真实使用情况、夸大科技计划的资助效果。上述问题也导致在现实中,科技计划的资金往往只是替代或“挤出”(crowd out)了企业的研发投入,造成公共财政资源的极大浪费。
(二)基于增量概念的科技计划评估
评价科技计划的作用效果,其根本困难在于识别政策干预与政策目标间的因果关联。一方面,基于宏观目标开展的评估难以区分整个宏观经济社会背景的潜在影响,如项目执行期间的经济周期、产业调整等;另一方面,基于微观的合同指标,如企业研制的新产品、原型机等,往往会错误地将企业开展的系列研发工作的成果都归功于科技计划的支持,从而高估后者的影响。
基于“增量”(additionality)概念的评估框架有效解决了上述问题。“增量”概念最早运用于20世纪末对英国先进信息技术计划的研究,即考察科技计划的资助在多大程度上形成了企业的研发活动“增量”。OECD则将“增量”概念界定如下:相比没有政府干预的情况,私人部门因接受政府研发资助而新产生的研发活动。随着学者逐渐意识到创新过程的非线性,研究的关注点逐渐从投入增量(input additionality)转移到产出增量(output additionality),即回答科技计划是否促进了企业的创新产出与绩效,测度时的量化指标既包含研发活动直接申请、授予的专利数,也包括新产品产值、销售额、服务创新等企业研发活动的间接产出。
基于“增量”概念评估科技计划的核心在于:政府科技计划是否以及在多大程度上引起了企业的新增研发活动,这在本质上是需要回答一个反事实(counter-factual)的研究问题。因此在“增量”概念发展的初期,相关研究主要采用基于调查的主观评价,存在较严重的系统性偏误。直到近期,得益于计量经济学的迅速发展,基于增量概念的科技计划评估被纳入到干预效应(treatment effect)的研究框架中得以定量化,并逐步转向基于微观数据的计量分析。
对产出增量的实证研究进一步印证了学者此前的担忧。尽管部分学者观察到科技计划的积极作用,如Czarnitzki在针对欧盟框架计划(FP)的分析中指出,资助显著增加了企业的专利数与专利引用数。但仍有不少证据表明,科技计划并未达到预期效果,如Norrman等人的研究并没有发现瑞典创新中心科技计划提升了企业的销售额与总资产。还有学者分析指出,科技计划可能仅起到了部分效果,如Furman的研究就发现,我国的科技型中小企业创新基金虽然能提升企业的存活率,但对专利等创新产出并不存在显著影响。
目前已有的实证研究还主要集中在发达国家,对新兴国家的研究极为匮乏。以我国为例,相关研究提供的还主要是宏观层面的经验证据,不仅无法给出研究者最为关心的平均干预效应的因果推断,也难以区分不同来源研发资助的效果差异。然而,新兴国家技术创新的发展经验可能与发达国家存在根本差异,尤其是政府扮演的主导角色不容忽视。Kim的研究中就指出,韩国政府的技术转移、技术交流与本地研发等产业政策对韩国企业从模仿到创新并最终实现技术追赶起到了关键作用。同时,新兴国家政府的研发资助还面临着与西方国家迥异的政治经济环境,产权保护的不健全,资本市场的滞后,寻租与关系网络等因素,都进一步加剧了该问题的不确定性。
(三)研究假设
1986年3月启动的国家高技术研究发展计划,又称“863计划”,是我国政府在推动高技术研发方面最为核心的科技计划。随着企业逐渐成为技术创新的主体,863计划在“十五”以来开始逐渐引入企业参与乃至主导课题的研发工作,帮助一批创新型企业在这个过程中脱颖而出。尽管学者对科技计划的评估结论存在较大出入,但考虑下述理由,本文仍支持对863计划的积极正面评价,即认为863计划能显著提升企业的创新绩效。
首先,从实际的资助成果来看,863计划自设立的三十年来,成功支持了大量高风险的技术研发及产业化工作,国人耳熟能详的超高性能计算机、深水机器人、载人航天技术等关键前沿技术,以及华为、浪潮、科大讯飞等创新型企业均得益于863计划的阶段性支持。也正是因此,863计划享有崇高的社会声誉,被认为是我国高技术发展的一面旗帜,客观上反映了全社会对863计划的资助效果的认可。
其次,科学家在863计划的立项评审与决策中占据较大话语权,一定程度上减少了政府官员在分配公共资金时的寻租空间。尽管在“十五”期间,863计划中的专家组织不再直接掌握课题的经费配置权,相比之前影响力有一定下降。但不可否认的是,专家组织仍然在863计划的执行过程中承担了重要的技术决策与管理职能。同时,这一阶段的评审环节还引入了同行评审专家库制度,进一步加强公正性。
此外,863计划还有着较为严格的经费使用与成果考核制度。课题责任人须严格执行批准的课题预算,对资金使用的自由裁量权较小,且不得超出课题预算范围。同时,863计划签订的课题合同中,会明确规定课题负责人在结题前需完成的技术成果,以及相应可量化的考核指标,如新产品研发、原型机研制等,并在各个年度对应考核目标进行审查。因此,在863计划中,企业挪用、滥用科研经费的情况相对较少。基于此,本文提出假设:863计划能显著提升企业的创新绩效。
三 研究设计
(一)研究方法
直接比较资助企业与未资助企业在创新产出上的差异,会带来结论的“选择性偏误”,难以得出真正的因果推断。近年来,不少学者采用倾向得分匹配法(Propensity Score Matching, PSM)估计科技计划的平均干预效应(Average Treatment Effect on the Treated, ATT),在一定程度上控制了选择性偏误问题。但倾向得分匹配法只能控制个体可观测特征带来的影响,无法解决由不可观测特征引起的“隐性偏差”。最典型的如企业的创新意愿与政治关联,无法被客观数据捕捉,却有可能同时影响企业获得科技计划资助的概率以及企业的研发产出,导致这类研究的结论仍不十分可信。
本文针对上述不足,采用双重差分倾向得分匹配(Difference-in-Difference PSM, PSM-DID)方法对科技计划的干预效果进行估计。PSM-DID结合了倾向得分匹配法与双重差分模型的优势,不仅能控制可观测特征引起的偏误,还能控制不可观测但不随时间变化(time invariant)的组间差异。PSM-DID的运用须满足有条件独立假定与共同取值假定;此外还需同时包含企业在申请资助前后各期的信息。
设干预前为时期t′,干预后为时期t。在t′时期,所有样本(干预组与控制组)的潜在结果均为y0t′;在t时期,外部干预已经发生,故两种潜在结果分别记为y1t(外部干预)与y0t(未受外部干预)。科技计划的平均干预效应可做如下一致估计:
其中,Sp为共同取值范围的集合,I1与I0分别为干预组与控制组的集合,Nt为集合I1∩Sp中包含的个体数,ω(i, j)为对应于配对(i, j)的权重。(y1ti -y0t′i)为干预组个体i在干预前后的变化,而(y0tj -y0t′j)为控制组个体j在干预前后的变化。
具体的操作步骤如下:①根据干预变量Di与协变量xi估计倾向得分,根据数据特征选择运用logit模型或probit模型进行回归计算;②对干预组的任一样本i,通过近邻匹配法或整体匹配法,确定与其相匹配的控制组样本(集合Sp); ③对干预组的任一样本i,计算因变量在干预前后期的变化(y1ti-y1t′i); ④计算与其匹配的控制组样本的因变量在干预前后期的变化(y0tj-y0t′j); ⑤根据以上公式计算评估干预效应ATT。
(二)数据来源
本文的研究数据主要包含863计划的课题数据与国家统计局的工业企业数据。
首先,基于2001~2006年的863计划课题申请数据与科技部网站公示的课题立项信息,人为筛选出样本企业中申请成功的企业与申请失败的企业,分别作为研究的干预组与控制组。具体处理过程主要包括:①基于2001~2006年各年度的863计划课题申请数据与最终公示的课题立项信息,合并比对得到当年申请成功的企业名录与申请失败的企业名录;②以具有独立法人资格的企业为基本单元,基于企业的名称、地址与法人代表等关键信息,识别同一企业在不同年份的申请信息并进行合并。考虑到对企业而言,最关键的是初次承担863计划、从“无”到“有”的经历,因而本文仅考虑企业首次成功申请863计划的时间,并将其作为外部干预(treatment)的作用时间。
其次,根据企业的名称、地址、法人代表等关键信息,将按照上述办法处理得到的863计划课题数据与国家统计局的工业企业数据库(China Industrial Enterprise Database)进行匹配。工业企业数据库由国家统计局收集统计,每年由各省、区、市的有关工业企业按照统一方法、统计口径和填报目录进行上交,具有较高的准确性和一致性。数据库包含的企业以“国民经济行业分类”中的工业企业,尤其是制造业企业为主,涵盖了我国全部的国有工业企业及规模以上非国有工业企业,是目前国内外学者研究中国企业行为与绩效的主要数据库,获得了广泛运用。
最后,本文对上述数据进行了进一步的检查与删误,并将总资产在1%~99%区间以外的企业均视作离群值予以删除。最终的研究样本中,共包含2001~2006年间申请863计划的630家企业(非平衡面板)。其中,39.8%的企业最终申请成功并获得了863计划的资助,与863计划的整体资助比重较为接近;样本企业主要来自广东、北京、江苏、山东与浙江等创新能力较强的省份,所属行业主要包括通信设备、计算机及其他电子设备制造业,电气机械及器材制造业,化学原料及化学制品制造业,专用设备制造业,以及通用设备制造业,与该期间863计划的重点资助技术领域(信息、能源、交通)较为一致,具有较好的代表性。
(三)变量测度
本文的研究变量主要包括衡量企业创新绩效的因变量、衡量企业是否获得科技计划资助的干预变量,以及影响企业成功申请科技计划的协变量。
本文采用企业的新产品产值(npv)对创新绩效进行测度。新产品产值即报告期内企业生产的新产品的总价值。国家统计局对“新产品”的具体释义如下:新产品是指采用新技术原理、新设计构思研制、生产的全新产品,或在结构、材质、工艺等某一方面比原有产品有明显改进,从而显著提高了产品性能或扩大了使用功能的产品。一般可将新产品简要概括为以下两类:一是技术特性或用途相比前一阶段有显著差异的产品;二是性能具有重大改进或提高的现有产品。
本文认为,技术创新的本质是发明的首次商业化应用,而采用专利数来测量创新绩效存在明显缺陷。首先,专利申请的要求相对较高,不能反映一些改良性的创新。其次,企业可能出于一些战略因素或商业机密的考虑,不愿为创新或新研发产品申请专利;而企业自身的特质,如申请专利积极性上的差异也会影响这一指标测度的准确性,尤其考虑到在我国,企业寻求专利保护的意识还相对薄弱。此外,企业有可能出于应付科技计划课题考核的目标而大量申请专利,在结题后就将其束之高阁,因而采用专利数还有可能高估企业的创新绩效。
本文的干预变量为企业是否获得863计划的资助(granted),属于二元虚拟变量。考虑到863计划主要考察企业的研发能力与产业化潜力,本文在进行倾向得分匹配时,基于已有文献的讨论将下述变量作为匹配的协变量:
①企业所有制(sosce),虚拟变量,采用工业企业数据库中的“控股情况”项作为测度。②企业规模(size),取企业总资产的对数作为测度。③企业年龄(age),采用企业申请863计划年份与企业开业年份间的差值作为测度。④资本密集度(cpi),采用固定资产/职工人数作为测度。⑤营业利润率(profit),即企业的主营业务利润与主营业务收入之比。⑥企业出口(export),虚拟变量,有出口行为的企业设为1,否则为0。⑦资产负债率(lever),测算方式为企业债务总额/企业资产总额。⑧冗余资源(sr),采用企业的净利润/主营业务收入作为测度。⑨行业技术水平(inno),基于本研究对2003年前后标准统一后的二分位行业编码,计算各行业的企业研发投入之和/主营业务收入之和。
四 实证分析
表1汇报了主要变量的描述性统计结果。在样本企业中,39.8%的企业是国有企业,企业的平均年龄17.8年,54.9%的企业有出口行为。
表1 主要变量的描述性统计
⑤ 部分企业的新产品产值为0,取对数后理论上应为负无穷,此处近似赋值为0。因为其余企业的新产品产值(万)均远大于1(取对数为0),因此赋值后不改变原有变量间的大小关系,不会影响计量结果。
表2汇报了主要变量的相关性分析结果。可以看到,企业的新产品产值与所有制、年龄、规模、出口、资产负债率以及行业技术水平等变量紧密相关,表明研究选取的控制变量确实在很大程度上与企业的创新绩效有紧密关联。此外,企业是否成功获得863计划的资助,与企业自身的所有制、年龄、规模、出口、资产负债率等情况密切相关,间接表明了干预组企业与控制组企业之间可能存在系统性差异,在进行分析时需认真考虑选择性偏误问题。
表2 主要变量的相关性分析
表3反映了在申请资助当年,干预组与控制组样本在关键变量上的组间差异。可以发现,干预组企业的新产品产值(8.712)显著高于样本组企业(6.176),可见863计划确实筛选出了更具创新能力的企业;此外,除资本密集度、营业利润率、冗余资源以及行业技术水平4项外,其余5项协变量均存在显著组间差异,无法排除“选择性偏误”的存在。
表3 申请资助时关键变量的组间比较
通过logit回归估计企业获得863计划资助的倾向得分,然后采用二次核匹配将倾向得分相近的企业进行匹配以控制企业资质的差异,匹配范围限于满足共同取值假定的样本企业。表4展示了匹配前后,干预组与控制组在各协变量上的组间差异。可以看到,在进行倾向得分匹配后,所有协变量的组间差异均已不再显著。
表4 倾向得分匹配前后协变量的组间比较
图1反映了匹配前后,干预组与控制组在各协变量上的偏差率。当各点所在位置越接近横轴“0”坐标时,表明干预组与控制组在该协变量上的偏差就越小。在匹配后(matched),各点均更靠近“0”坐标轴,表明匹配后各协变量的组间偏差均接近于0。可以认为,此时满足倾向得分匹配的有条件独立假定。
图1 倾向得分匹配前后协变量的偏差率比较
通过图2也可以直观看到,绝大多数样本的倾向得分均在共同取值范围内,仅有干预组的4个样本因倾向得分过高被剔除出分析,损失样本较少。在剔除这少部分样本后,可以认为此时满足倾向得分匹配的共同取值假定。
图2 倾向得分的共同取值范围
下面进行双重差分倾向得分匹配。考虑到科技计划的资助效果可能存在滞后,本文在匹配后进行差分时,分别将目标年份设定为申请资助后的第一、第二、第三年,将其与基准期(t=0)进行比较,以加强研究结论的稳健性。估计结果分别见表5~表7,汇总后如表8所示。
表5 资助后第一年的平均干预效应
表6 资助后第二年的平均干预效应
表7 资助后第三年的平均干预效应
表8 863计划的平均干预效应
研究发现,863计划的资助显著提升了企业的创新绩效。尽管在申请资助后的第一年,这种效果并不显著,甚至PSM-DID的平均干预效应估计值小于0;但在申请资助后的第二、第三年,PSM-DID的估计结果均大于0。这表明,在考虑选择性偏误后,干预组企业的新产品产值增长仍要明显快于控制组企业,且这一结果在1%的置信水平下显著。
除二次核匹配外,本研究还通过局部线性回归匹配等其他匹配方法进行了估计,以加强结论的稳健性,获得的结果与上文一致。从而假设“863计划能显著提升企业的创新绩效”得证。
五 研究结论、不足与展望
我国于2014年启动了新一轮的科技体制改革,举措之一便是整合863计划、并将其并入新设立的国家重点研发计划。三十年来,尽管863计划取得了突出的成绩,但同时也遭到了一定的非议,亟须对执行效果展开科学评价。作为我国高技术发展的一面旗帜,对863计划的评估与总结,直接关系到未来一段时期内我国的研发资助体系与科技计划管理体制的改革取向与路径选择,具有重要价值。
本文以国家高技术研究发展计划(863计划)为例,实证考察了政府科技计划的产出增量效应。基于863计划的课题数据与国家统计局的工业企业数据,本研究构建了2001~2006年企业层级的863计划申请与立项数据,并通过双重差分倾向得分匹配估计(PSM-DID)有效控制了干预效应研究中常见的选择性偏误,尤其是企业的不可观测特征所引起的隐性偏差。研究发现,863计划能显著提升资助企业的创新绩效,且这一效果在企业申请资助后的第二、第三年显著。
一般而言,技术创新是一个长期过程,从概念的诞生到创新产品的出现需经历漫长的阶段,中途还存在较大的不确定性(如研发的失败、商业化的失败等),因而本文观察到企业在接受863计划资助后的第二年,新产品产值就迅速得到提升,可能存在如下几点原因:①企业在申请863计划前就已制定了较明确详尽的研发计划;②企业申报的新产品可能以性能具有重大改进或提升的现有产品为主,成型的速率高、风险低,也更有可能在短期内研发成功并投入生产;③863计划支持的研发活动,在该阶段主要以技术跟踪为主,因而研发活动的重心在于工程上的技术实现,面临的不确定性较小。这一发现也与近期国外学者的研究结论一致。
本文的主要贡献在于:
第一,引入了基于增量概念的科技计划评估,并针对科技计划的产出增量效应展开实证研究。产出增量无疑是评价科技计划是否有效的直接证据,但相比其重要性,已有的实证研究还远远不足。尤其是对新兴国家,与发达国家截然不同的政治经济环境、法制建设与资本市场现状,都为科技计划的实际效果带来极大的不确定性。本研究为这一尚处于争议中的研究问题提供了来自新兴国家的重要经验证据。
第二,本文有效控制了评估类研究中常见的选择性偏误。一方面通过控制样本来源,构建了申请863计划的企业数据。由于申请863计划需满足一定的门槛,这批企业相较其他企业具备更强的创新意愿与技术实力,使得研究的外部干预条件(treatment)更接近于随机实验;另一方面,通过采用双重差分倾向得分匹配估计,有效控制了创新意愿、政治关联等不随时间变化的不可观测特征,克服了一般匹配方法的固有缺陷,从而对科技计划的实际效果做出因果推断。
当然,采用新产品产值作为创新绩效的测度还有诸多不足。新产品产值主要反映产品技术创新的绩效,难以体现工艺技术创新的绩效,而后者恰恰在创新研究中极易遭到忽略。工艺技术创新有助于改善企业对生产要素的使用,提高劳动生产率;同时改善产品质量,缩短生产周期,对企业极端重要。此外,在实际操作中往往难以对新产品的定义进行准确把握,也不便在产业间与国家间进行横向比较。
未来的相关研究可从以下几个方向着手展开:①变量测度的拓展。综合运用多个指标对企业创新绩效进行测度,除新产品外,进一步考察科技计划对企业新工艺、专利申请与专利授予等变量的影响。②科技计划的拓展。研究对象应涵盖在不同阶段支持企业创新的政府科技计划,包括基础研究、概念验证阶段,以及早期技术研发与产品开发阶段等,加强研究结论的外部效度。③研究方法的拓展。通过采用断点回归等准实验设计,消除随时间变化的不可观测因素带来的选择性偏误,同时运用案例研究方法打开科技计划影响企业创新的过程黑箱。