基于组合预测模型的江苏省 R&D经费投入预测
江苏大学 江苏镇江 212013
摘要 R&D是衡量一个国家或地区科技活动和科技投入水平的重要指标,各个国家或地区的科技、经济、社会发展程度直接受到R&D投入力度的影响。通过对江苏省R&D经费投入的时间序列变换特征进行分析,建立指数曲线预测模型和AR(2)时间序列预测模型的组合预测模型,对江苏省2020—2022年的R&D经费投入的发展变化趋向进行预测。
关键词 R&D经费投入 指数曲线预测模型 AR(2)模型 组合预测模型
引言
随着科技改革的日渐深入,科技与经济的联系日益紧密,科学技术逐渐成为推动国家或区经济社会发展的首要动力。R&D投入是支撑科技竞争力最根本的物质基础,一个国家或地区R&D投入力度的大小将会对其科技、经济、社会的发展有直接的影响。除此之外R&D投入还是衡量一个国家或地区的R&D活动规模、科技实力和创新能力的重要指标。因而,了解江苏省科技投入现状,对其R&D经费投入发展变动趋向进行预测,有助于帮助江苏省合理调整发展战略,科学设定规划目标,实现R&D资金的有效配置。
关于R&D投入规模预测的研究[1-5],学者们分别从全国及各个经济区进行研究,在研究方法选择上有面板数据模型、时间序列模型、灰色马尔科夫链模型、多元回归技术等,在研究角度上主要从R&D规模、结构、来源进行研究,而通过组合预测模型且针对江苏省R&D经费投入的预测少之又少。因此,本文以江苏省为例,将指数曲线预测模型与AR(2)模型相结合,运用组合预测的方法,有效合理地预测江苏省2020—2022年的R&D经费投入的发展变动趋向和规律。
变量选取和数据说明
本文选取江苏省R&D经费内部支出作为研究对象,选取地区生产总值(GDP)来反应地区经济发展水平,选取2009年—2018年共10年数据形成时间序列,R&D经费内部支出时间序列用(X)表示。数据来源于2010-2019年《江苏统计年鉴》。为避免异方差情况的发生,保证模型模拟结果的最优化,在数据模型运行时,对全部初始数据做对数化处理,对数变换后的序列用(DX)表示。本文采用EXCEL和Eviews6.0统计分析软件作为数据分析工具进行实证研究。
预测方法选择及预测模型的建立
考虑到组合预测模型具有更高精确度,更小预测系统误差,预测效果更显著的特点,本文拟先根据序列趋势特征分别确定指数曲线预测法和随机时间序列预测法作为单项预测方法,接着按最小误差原则进行组合预测,对江苏省2009—2018年R&D经费投入进行预测,通过预测值与实际值相比较,得出模型有效的结论后,再对2020—2022年R&D经费投入发展趋势实施预测。
3.1趋势曲线预测模型
3.1.1选择预测模型
依据R&D经费支出序列的发展趋势,选取合适的曲线模型,对趋势值进行外推预测。
从可查数据来看,2009年以来,江苏省政府越来越意识到科技的重要性, R&D资金投入不断加大,R&D经费支出额逐年上升,从2010年不足1000亿元,发展到2018年经费支出超出2500亿元,特别是2011年,增长率达24.9%;而从增长率的趋势来看,上升趋势并不明显,甚至有下降的趋势,2015年增长率最低,仅增长了8.98%。
散点图显示2009年—2018年江苏省R&D经费支出序列(X)的上升趋势明显,判断可以利用趋势曲线模型来对未来3年数据进行预测。由R&D经费支出额序列的一阶环比大体相近的计算结果可推出,可选择指数曲线预测模型来预测。
3.1.2 建立指数曲线预测模型
指数曲线预测模型为:
式中:t表示时间,a、b为参数。
两边取对数,将模型化为对数直线模型:
对于对数直线预测模型,选用最小平方法,选取时间序列{Xt}的中点为时间原点,利用以下公式求反对数,得到a,b的估计值。
将计算结果带入lga、lgb式子中,计算求得
求反对数,得
故所求指数曲线预测模型为:
3.2随机时间序列预测模型
由于R&D经费支出数据是一个时间序列,可以运用计量分析的方法,建立随机时间序列预测模型来对江苏省R&D经费投入趋势进行预测,利用Eviews 6.0软件对模型进行估计与检验,得出全省R&D经费投入趋势变换模型,为预测R&D经费投入提供数量化的参考依据。
3.2.1 序列平稳化处理
首先对R&D经费内部支出时间序列X进行单位根检验,验证序列的平稳性。检验结果显示该序列存在单位根,需对其进行平稳化处理。对序列X进行对数化处理得到新的时间序列(LX),ADF验证结果如表3所示,检验统计量值-26.36358小于相应DW临界值,表明2009-2018年(LX)序列是平稳序列。
表 3 时间序列ADF检验结果
变量 | ADF统计值 | 1%临界值 | 5%临界值 | 10%临界值 | 结论 |
原序列(X) | -0.036684 | -6.292057 | -4.450425 | -3.701534 | 非平稳 |
对数化(LX) | -26.36358 | -8.235570 | -5.338346 | -4.187634 | 平稳 |
3.2.2 模型识别与定阶
表4为模型识别参照表,根据(LX)序列的自相关函数图和偏自相关函数图,初步识别模型。
表 4 平稳时间序列模型识别条件
模型 | AR(p) | MA(q) | ARMA(p,q) |
自相关函数(ACF) | 拖尾 | q阶 | 拖尾 |
偏自相关函数(PACF) | 截尾 | 拖尾 | 拖尾 |
结果显示平稳时间序列的偏相关函数2阶截尾,而自相关函数拖尾,初步确定平稳时间序列(LX)模型为AR(2)模型。
接着,根据最大滞后阶数的t检验和AIC、SC、HQ信息准则,残差序列相关检验结果综合判断最优滞后阶数是多少。从最大滞后阶数4阶开始建立AR(4)模型,并进行回归,统计出变量LNX滞后4阶对应统计量的值,模型的AIC、SC、HQ值等信息。结果如表5。
表 5 信息准则值表
| AR(4) | AR(3) | AR(2) | AR(1) |
AIC | 2.8344 | 2.8052 | 2.7753 | 2.8303 |
SC | 2.9679 | 2.9113 | 2.8454 | 2.8827 |
HQ | 2.8883 | 2.8481 | 2.8073 | 2.8515 |
综合表4和表5的信息,判断选择模型为AR(2)模型。
3.2.3 AR(2)模型回归与检验
本文采用Eviews最小二乘法建立AR(2)模型并回归,根据回归结果得出回归方程表达式为:
接着分别进行残差序列相关检验、异方差检验与拟合优度检验。
对于残差序列相关LM检验,选取滞后1阶来进行残差相关检验,结果显示LM检验统计量对应的P值为0.7848,在5%的显著性水平下,不能拒绝原假设H0,表明残差无序列相关。滞后阶数的选取合理。
根据残差平方滞后项系数的显著性以及AIC、SC、HQ等信息综合判断ARCH检验的最佳滞后项为1,ARCH(1)检验中Obs*R-squared统计量对应P值为0.2510,在5%的显著性水平下不能拒绝原假设H0,表明无ARCH形式的异方差。
拟合优度检验中,单个参数通过显著性检验。
3.3 组合预测方法和模型
本文采用最小误差平方和的组合预测模型,对AR(2)模型预测结果和指数曲线预测模型预测结果赋予不同权重系数,来预测江苏省R&D经费投入的数值及发展趋势。
用t表示时间,将2009年定为基期,用Xt表示第t期江苏省R&D经费支出;用X1t表示指数曲线模型预测方法在第t时刻的预测值,用X2t表示AR(2)模型预测方法在第t时刻的预测值。
用wi表示第i种预测方法的权变系数,权重满足以下条件:
用 εit=(Xt-Xit)来表示第i种预测方法在t时刻的预测误差,则组合预测在第t时刻的预测误差εt为:
则组合预测的预测误差平方和P如下表示:
设 组合预测值公式为:
因此,以预测误差最小平方和原则建立以下模型:
4.未来三年R&D经费投入的预测
4.1指数曲线模型预测R&D经费投入
将各年的t值代入预测模型 中,可得各年R&D经费内部支出的预测值yt,见表6。
表 6 预测值
年份 | 2009 | 2010 | 2011 | 2012 | 2013 | 2014 | 2015 |
预测值 | 792.4956 | 907.3532 | 1038.8573 | 1189.4205 | 1361.8050 | 1559.1734 | 1785.1468 |
年份 | 2016 | 2017 | 2018 | 2019 | 2020 | 2021 | 2022 |
预测值 | 2043.8709 | 2340.0922 | 2679.2453 | 2670.4439 | 2525.4098 | 2804.2986 | 3113.9858 |
4.2 AR(2)模型预测R&D经费投入
根据Eviews得出的lnxf预测结果,计算X的预测结果,如表7所示。
表 7 AR(2)模型预测结果
年份 | 2009 | 2010 | 2011 | 2012 | 2013 | 2014 | 2015 |
预测值 | - | - | 1043.1497 | 1261.4283 | 1465.5707 | 1685.8076 | 1900.7427 |
年份 | 2016 | 2017 | 2018 | 2019 | 2020 | 2021 | 2022 |
预测值 | 2100.6456 | 2298.4724 | 2489.9054 | 2670.4439 | 2835.5749 | 2980.9580 | 3102.6131 |
4.3组合预测模型预测R&D经费投入
实际观测值Xt和两种不同方法算出的预测值结果X1t,X2t及相关运算,以预测误差最小平方和为最小准则计算得到两种方法权重w1,w2,因此线性组合预测模型公式为:
Yt=w1X1t+w2X2t
其中,X1t为指数曲线模型预测值,X2t为AR(2)模型预测值,代入公式可计算出2020—2022年江苏省R&D经费支出年组合预测值见表8。
使用同样方法计算出江苏省GDP数据预测值,以GDP额为分母,R&D经费支出额为分子求出R&D经费投入强度,得到的预测值结果见下表。
表 8 组合模型预测值
年份 | R&D经费支出预测值/亿元 | R&D经费投入强度预测值/% |
2020 | 3047.406643 | 2.83 |
2021 |
3306.644219
| 2.97 |
2022 | 3572.681456 | 3.18 |
5.结论与建议
从分析研究结果看,江苏省委省政府十分重视高科技投入水平的提高,江苏省R&D经费支出额从2009年717.12亿元增加到2018年2504.43亿元,位居全国前列,但增长率飘忽不定甚至有下降的趋势。预测结果显示,江苏省的R&D经费投入将在2020年突破3000亿,将在2022年突破3500亿达到3572.68亿元,并且投入强度将在2020年达到2.83%,2022年突破3%。
不过如果盲目的增加R&D投入而不注重资源配置,有可能会造成资源浪费,对经济促进作用也不能达到最佳状态,因此,明确政府投资的方向, 政府角色的正确定位将直接影响区域经费投入分配,这对区域经济的发展至关重要;要根据省内不同地区的具体情况将R&D资源进行差异化区域投入,建立适合江苏省实际情况的差异化区域R&D投入模式,进而保证江苏省各地区经济能够持续、稳定和协调发展。
参考文献
张士运, 倪红福. 北京地区R&D投入强度结构及贡献率分析[J]. 中国科技论坛, 2013(05):7-13.
赵姣姣. ARIMA模型在重庆市R&D人数预测中的应用[J]. 农家参谋, 2019, 619(10):223.
张良强, 周功元. 福建省R&D经费投入的发展趋势预测与分析[J]. 技术与创新管理, 2016, 037(006):650-656.
贾双华, 赵礼明. 基于灰色马尔科夫模型的辽宁高校R&D支出预测[J]. 中国市场, 2016, 000(044):120-121,123.
刘雪梅, 张晓芬. ARIMA模型在我国R&D经费支出预测中的应用[J]. 辽宁工业大学学报:社会科学版, 2013, 15(1):18-19.
作者简介:杨紫荷,生于1999年11月,女,汉族,山西运城人,江苏大学本科生在读,统计学方向
黄倩桃,生于1998年2月,女,壮族,广西崇左人,江苏大学本科生在读,统计学方向
李卓纯,生于1999年4月,女,满族,吉林辽源人,江苏大学在读,统计学方向
6