admin 管理员组文章数量: 1184232
2024年4月15日发(作者:japanhdvcomapp)
Statistics and Application 统计学与应用, 2023, 12(1), 224-234
Published Online February 2023 in Hans. /journal/sa
/10.12677/sa.2023.121023
江西省地方财政收入预测与研究
龚淑聪
江西财经大学,江西 南昌
收稿日期:2023年1月23日;录用日期:2023年2月13日;发布日期:2023年2月27日
摘 要
财政收入是国家建设和治理的基础和重要保障,它不仅能够综合反映出国民经济状况,也为国家政府对
市场经济进行宏观调控奠定了基础。本文以江西省财政收入为例,收集当地近20年的相关数据进行实证
分析。首先利用LASSO回归分析筛选出影响江西省财政收入的重要因子,将其作为预测模型的变量。然
后将灰色GM(1,1)与BP神经网络结合起来,先利用GM(1,1)拟合得到2025年各变量的估计值,再将这些
估计值作为BP神经网络的输入,输出值即为江西省2025年的财政收入预测值。实验结果表明,预测模
型精度较高,可为当地政府制定相关财政政策给出理论参考。
关键词
财政收入预测,GM(1,1)模型,BP神经网络,LASSO模型
Forecast and Research on Local Fiscal
Revenue of Jiangxi Province
Shucong Gong
Jiangxi University of Finance and Economics, Nanchang Jiangxi
rdthth
Received: Jan. 23
, 2023; accepted: Feb. 13, 2023; published: Feb. 27, 2023
Abstract
Fiscal revenue is the basis and important guarantee for national construction and governance. It
can not only comprehensively reflect the state of the national economy, but also lay the foundation
for the national government to carry out macro-control over the market economy. This paper
takes the fiscal revenue of Jiangxi Province as an example and collects the relevant data in the past
20 years for empirical analysis. First of all, LASSO regression analysis was used to screen out the
important factors affecting the fiscal revenue of Jiangxi Province and take them as the variables of
the prediction model. Then the grey GM(1,1) is combined with BP neural network, and the esti-
文章引用: 龚淑聪. 江西省地方财政收入预测与研究[J]. 统计学与应用, 2023, 12(1): 224-234.
DOI: 10.12677/sa.2023.121023
龚淑聪
mated value of each variable in 2025 is obtained by the fitting of GM(1,1). Then these estimated
values are used as the input of BP neural network, and the output value is the predicted fiscal rev-
enue value of Jiangxi Province in 2025. The experimental results show that the prediction model
has high accuracy and can provide theoretical reference for local government to formulate rele-
vant fiscal policies.
Keywords
Fiscal Revenue Forecast, GM (1,1) Model, BP Neural Network, LASSO Model
Copyright © 2023 by author(s) and Hans Publishers Inc.
This work is licensed under the Creative Commons Attribution International License (CC BY 4.0).
/licenses/by/4.0/
1. 引言
在十九大报告中,明确提出“加快建立现代财政制度,充分发挥财政政策的导向作用,努力提高经
济发展的质量和效益,推进国家治理体系和治理能力现代化”。财政收入在一定程度上是一个国家国民
经济实力映现的窗口,也是国家进行资源配置优化、促进社会公平、改善民生的重要经济杠杆[1]。
从地方层面上来说,地方财政作为我国的财政的重要组成部分,是地区经济建设发展的重要保证,
也是促进其经济平稳运行的物质基础。对地方财政收入进行分析和预测,可以有效克服地方财政预算与
收支失衡的问题,有助于加强相关部门拟订预算及财政政策,以此改进地方财政收入预测模型的科学性、
预测的客观性、规划的前瞻性。
从2020年开始,新冠疫情持续地影响着全省甚至全世界经济的正常运转,为经济的稳定发展带来了
很大的压力。如何把准各自定位,发挥各自优势,进一步提升经济实力,优化财政分配和配置,拉动财
政收入的增长,促进江西省经济高质量发展显得尤为重要。因此,通过探究影响江西省财政收入的关键
经济因素并建立财政收入预测模型,对财政收入情况进行科学分析和准确预测是具有重要意义的。
2. 相关理论及模型介绍
2.1. LASSO变量选择方法
Lassso方法是通过构造一个精炼模型,并对其进行不断地压缩,使得一些变量系数为零,最终达到
变量简化的效果[2]。
给定数据集
D=
{
(
x
1
,
y
1
)
,
(
x
2
,
y
2
)
,
,
(
x
m
,
y
m
)
}
损失函数,则优化目标为
min
∑
i
−
1
y
i
−
ω
T
x
i
ω
m
其中
x∈ℜ
d
,最简单的线性回归模型,以平方误差为
,
()
2
(1)
当样本特征很多,但是样本数量相对较少时,上述(1)式就容易陷入过拟合。
为缓解这一问题,对(1)式引入正则化项。
若使用
L
2
范数正则化,则有
min
∑
i
−
1
y
i
−
ω
T
x
i
ω
m
()
2
+
λω
2
(2)
2
其中正则化参数
λ
>0
。上式被称为“岭回归”,通过引入
L
2
范数正则化,确实能降低过拟合的风险;
DOI: 10.12677/sa.2023.121023
225
统计学与应用
龚淑聪
将正则化项中的
L
2
范数替换为
L
P
范数时,令
p=1
,即采用
L
1
范数,则有
min
∑
i
−
1
y
i
−
ω
T
x
i
ω
m
()
2
+
λω
1
(3)
其中,正则化参数
λ
>0
,上式被称为Lassso。
L
1
范数正则化都能够有效的降低过拟合风险,并且相较于
L
2
而言,正则化(Lassso)还有另一个优点:
更容易获得稀疏解,即通过它求得的
ω
会有更少的非零分量。
2.2. 灰色系统GM(1,1)模型
灰色预测系统是对既含有已知信息、也含有未知信息的系统进行预测,这也就是在有限的变化范围
内的灰色数据系统进行预测[3]。其建模过程如下:
0
首先对原始序列
=X
()
x
()
()
,
i
{
=
0
i
1
1,2,
,
n
进行一次累加得到序列
=X
()
}
x
()
()
,
i
{
=
1
i
对
X
()
建
1,2,
,
n
,
1
}
立一阶线性微分方程为:
d
X
()
1
+aX
()
=u
(4)
d
t
1
求解微分方程,得到预测模型为:
ˆ
−ak
u
ˆ
(
1
)
ˆ
ˆ
(
1
)
(
kX
=+
1
)
X
e
(5)
(
0
)
−
ˆ
a
ˆ
(
1
)
(
k+1
)
经过累减还原为
X
ˆ
(
0
)
(
k+1
)
,即
X
(
0
)
的灰色预测模型为:
将
X
ˆ
(
0
)
(
k
+
1
)
=
X
(
e
ˆ
−a
ˆ
−ak
u
ˆ
(
1
)
−
1
X
e
ˆ
(6)
(
0
)
−
ˆ
a
)
采用后验差检验法进行灰色模型的精度检验。后验差检验的两个重要指标为C (后验差)和P (小误差
概率),模型精度等级[4]如表1所示。
Table 1. Accuracy grade of grey model
表1. 灰色模型精度等级表
等级
一级
二级
三级
四季
后验差比值C
C ≤ 0.35
0.35 < C ≤ 0.5
0.5 < C ≤ 0.65
0.65 < C
小误差频率P
P ≥ 0.95
0.8 ≤ P < 0.95
0.7 ≤ P < 0.80
P < 0.7
2.3. 反向传播(BP)神经网络
BP神经网络[5]是一种按误差反向传播训练的多层前馈网络,其算法称为BP算法[4]。其学习算法如
下:
1) 用随机数初始化层间节点i和j的连接权
W
ij
和节点j的阈值
θ
j
。
2) 读入经预处理的训练样本
{
X
PL
}
和
{
Y
PK
}
。
3) 计算各层节点的输出(对第P个样本)
O
pj
f
∑
(
W
ij
I
pi
−
θ
j
)
,式中
I
pi
既是节点i的输出,又是节
=
i
点j的输出。
4) 计算各层节点的误差信号
DOI: 10.12677/sa.2023.121023
226
统计学与应用
龚淑聪
输出层:
δ
pk
=O
pk
(
y
pk
−O
pk
)(
1
−O
pk
)
隐含层:
=
O
pi
O
pi
(
1
−
O
pi
)
∑
i
δ
pi
W
ij
5) 反向传播
+1
)
αδ
pi
O
pi
+W
ij
(
t
)
权值修正:
W
ij
(
t=
=
阈值修正:
θ
j
(
t+1
)
θ
j
(
t
)
+
βδ
pi
式中
α
为学习因子,
β
为加速收敛的动量因子。
6) 计算误差
=E
p
(
∑
O−Y
pk
)
p
∑
k
)
(
pk
2
2
2.4. 组合预测
灰色预测GM(1,1)模型是根据样本数据的具体分布情况和随机性质,通过常用的关联分析对样本数
据进行分析后,将原本不平稳的样本数据,利用累加函数使其变成单调递增的数据模型,这种累加模型
往往适用于指数型的时间序列数据,但如果数据之间是一种非线性的函数关系,那么这种模型就不能够
体现出来。
人工神经网络预测模型作为一种非线性自适应的预测模型,具有高度的非线性函数映射能力,这种
性质使得神经网络适合应用于存在多因素并且非线性联系的高维复杂问题上,因此它可以反映模型因素
之间的非线性函数关系。作为目前人工网络模型中使用范围最广的BP神经网络模型,它能够处理绝大
多数的非线性的数据序列关系,而且模型能够科学全面地反映样本数列的复杂性,同时还能保证较高的
预测精度。
因此本文结合两种预测方法优缺点,可以将两个单一的预测模型进行组合,这样一方面可以实现两
个模型的优势互补,另一方面又较好地消除了两者不足,在最大程度上又保证了模型的预测精度。
3. 数据来源与变量说明
本文使用的数据主要来自于2006~2021年《江西省统计年鉴》,部分数据参考了《中国统计年鉴》
和《中国经济统计年鉴》,其中包含19个影响江西省财政收入的解释变量[6],主要包括地区生产总值、
税收收入、农村人均消费支出等,如下表2所示。
Table 2. Symbol description of fiscal revenue and influencing factors of Jiangxi Province
表2. 江西省财政收入及影响因素符号说明
符号
X
1
X
2
X
3
X
4
X
5
X
6
X
7
X
8
X
9
X
10
含义
第一产业产值
第二产业产值
第三产业产值
地区生产总值
税收收入
农村人均消费支出
城镇人均消费支出
农村居民人均可支配收入
城镇居民人均可支配收入
外商直接投资
单位
亿元
亿元
亿元
亿元
亿元
元
元
元
元
万美元
DOI: 10.12677/sa.2023.121023
227
统计学与应用
龚淑聪
Continued
X
11
X
12
X
13
X
14
X
15
X
16
X
17
X
18
X
19
教育支出
科学技术支出
农林水支出
存款余额
贷款余额
普通高等学校毕业人数
建筑业总产值
出口总值
进口总值
万元
万元
万元
亿元
亿元
人
亿元
万美元
万美元
4. 实证分析
基于以上三大主要统计理论及预测方法的基础上,运用江西省2006~2020年财政收入及相关影响因
素数据,分别依次利用LASSO模型、灰色预测GM(1,1)模型与神经网络组合模型,进行分析研究[7]。
4.1. 数据预处理
4.1.1. 相关分析
根据江西省历年的经济数据,利用eviews软件对以上各经济指标进行相关性分析。通过eviews软件
计算出因变量与各自变量之间的相关系数,根据相关系数的大小来判断变量与因变量之间的关系,从而
把和因变量没有关联的自变量进行删除[8]。
查询资料后,选用Pear-son对变量与因变量之间的关系进行检验,其公式为:
p=
Cov
(
X,Y
)
Var
(
X
)
Var
(
Y
)
其中是
Cov
(
X,Y
)
变量X和变量Y之间的协方差;
Var
(
X
)
是变量X的方差;
Var
(
Y
)
是变量Y的方差。
地方财政收入与各经济指标之间的相关系数的具体情况,如下表3所示。
Table 3. Correlation coefficients
表3. 相关系数
R
2
Y
R
2
Y
R
2
Y
x
1
0.981
**
x
8
0.971
**
x
15
0.914
**
x
2
0.985
**
x
9
0.973
**
x
16
0.771
**
x
3
0.940
**
x
10
0.835
**
x
17
0.954
**
x
4
0.973
**
x
11
0.982
**
x
18
0.976
**
x
5
0.998
**
x
12
0.885
**
x
19
0.913
**
x
6
0.959
**
x
13
0.991
**
x
7
0.975
**
x
14
0.961
**
注:
**
在0.01水平(双侧)上显著相关。
从上表3中,可以看出地方财政收入与各经济指标之间的相关程度都很高,平均在0.9以上。经过
相关分析可知,各变量与地方财政收入之间的相关性都非常高,因此我们可以选取这些变量对地方财政
收入进行建模,并预测江西省未来几年的地方财政收入值。
DOI: 10.12677/sa.2023.121023
228
统计学与应用
龚淑聪
4.1.2. 多重共线性检验
多重共线性现象是指两个或多个解释变量之间存在相关关系的现象。严重的多重共线性会导致最小
二乘(ols)估计的结果不稳定。此外,解释变量之间的相关关系会导致单个解释变量对响应变量的影响无
法确定,使得模型结果不易解释。因此在建立模型前,需要对可能存在严重多重共线性性的问题进行进
一步的分析和检验。
多重共线性的程度可以用条件数k来度量,条件数的定义为:
k=
λ
max
λ
min
其中
λ
是
X
T
X
的特征值,X是解释变量构成的矩阵。一般认为,当
K>15
,解释变量间存在共线性问题,
当
K>31
,解释变量间存在严重的共线性性。
利用R语言中的kappa()函数,得到条件数为
即各解释变量间存在严重的多重共
=K1.553181e+18
,
线性,因此不能通过建立简单的多元回归模型来分析影响财政收入的主要因素。
对于解释变量间存在多重共线性性的问题,目前已有的针对财政收入影响因素的研究常采用逐步回
归方法或岭回归方法来进行处理,通过逐步回归或岭回归的方法来对解释变量进行筛选,从而降低解释
变量间的共线性性。考虑到本文所研究的解释变量的个数p是大于样本数n的,因此本文选择了处理高
维数据问题常用的LASSO法来进行变量选择。
4.1.3.
标准化处理
为了使模型不受各解释变量大小和单位的限制,在建模前先对数据进行标准化处理,将其转化为无
量纲的纯数值。
4.2. 基于LASSO回归模型的影响因素选取
本文将影响江西省财政收入的19个因素和被解释变量的历史数据带入模型,利用R软件lars()函数
对LASSO问题求解,LASSO求解路径如图1所示。
Figure 1. LASSO solution path
图1. LASSO求解路径
在变量选择的过程中,最重要的是选择合适的
λ
值。利用R软件的()函数进行交叉验证法
(CV),从中选择最佳参数值,CV变化过程如图2所示。
DOI: 10.12677/sa.2023.121023
229
统计学与应用
龚淑聪
Figure 2. CV selection process
图2. CV选择过程
最后,LASSO变量筛选的结果如表4所示。
Table 4. LASSO variable selection coefficient table
表4. LASSO变量选择系数表
X
1
0.0000000
X
6
2.073357e−02
X
11
0.0000000
X
16
0.0000000
X
2
0.0000000
X
7
1.135911e−02
X
12
0.0000000
X
17
0.0000000
X
3
0.0000000
X
8
2.808843e−02
X
13
1.478171e−01
X
18
0.0000000
X
4
0.0000000
X
9
0.0000000
X
14
1.198857e−02
X
19
0.0000000
X
5
7.641881e−01
X
10
0.0000000
X
15
0.0000000
由表2可以看出,使用LASSO回归方法选取的影响江西省地方财政收入的关键影响因素有6个,分
别是X
5
、X
6
、X
7
、X
8
、X
13
、X
14
。
4.3. 基于灰色预测模型的单个因素预测
本文将LASSO变量选择方法[7]筛选出的影响江西省财政收入的6个主要因素,建立灰色系统
GM(1,1)模型,利用R语言构建预测模型,求得相关因素精度表[9]如下表5所示。
Table 5. Precision table of related factors of GM(1,1) model of local fiscal revenue in Jiangxi Province
表5. 江西省地方财政收入GM(1,1)模型相关因素精度表
变量
2021
2022
2023
DOI: 10.12677/sa.2023.121023
X
5
2288.6507
2529.7839
2796.3230
X
6
15846.875
17791.701
19975.207
X
7
25877.606
28007.301
30312.267
X
8
19667.077
21761.207
24078.317
X
13
8865747
9820774
10878678
X
14
53359.567
60781.111
69234.885
230
统计学与应用
龚淑聪
Continued
2024
2025
均方差比值C
小误差概率P
精度等级
3090.9447
3416.6079
0.3416135
2
好
22426.687
25179.028
0.1053796
2
好
32806.929
35506.899
0.1161813
2
好
26642.150
29478.978
0.09310398
2
好
12050540
13348637
0.2908496
2
好
78864.455
89833.360
0.1121744
2
好
因为灰色预测GM(1,1)模型程序比较繁琐复杂,因此本文通过从外部加载代码的形式将其引入R语
言中,然后得到了单个变量真实值与预测值图,如下图3所示。
Figure 3. True value—predicted value
图3. 真实值–预测值
DOI: 10.12677/sa.2023.121023
231
统计学与应用
龚淑聪
从图3中可以说明,利用GM(1,1)模型对这6个变量进行预测时,预测结果较为理想,因此本文将
这6个变量一起加入到后面的神经网络中,然后对江西省财政收入进行预测。
4.4. 江西省财政收入的神经网络预测
通过运用GM(1,1)模型本文得出的6个解释变量2021~2025年5年的预测数据,并将其上述结果及
历史数据带入到江西省地方财政收入所建立的神经网络模型中,如图4所示。
Figure 4. Neural network topology
图4. 神经网络拓扑图
之后,我们对其做了20次的灰色神经网络预测,得到了20组江西省2021~2025年财政收入的预测
值,我们取其平均数之后,最后得出:江西省2020~2025年5年的预测值分别为2824.970亿元、3007.592
亿元、3202.021亿元、3409.018亿元、3629.396亿元。相关数据如下表6所示,其中加粗字体为预测数
据。
Table 6. Historical data and forecast of local fiscal revenue and its related factors
表6. 地方财政收入及其相关因素历史数据和预测表
年份
2006
2007
2008
2009
X
5
208.71
281.86
357.96
430.02
X
6
2688.84
2994.49
3309.21
3532.66
X
7
6645.54
7810.73
8717.37
9739.99
X
8
3541.00
4151.80
4835.27
5238.02
X
13
726157
1035666
1478653
2034071
X
14
5213.76
5900.06
7206.56
9296.39
Y
305.52
389.85
488.65
581.30
DOI: 10.12677/sa.2023.121023
232
统计学与应用
龚淑聪
Continued
2010
2011
2012
2013
2014
2015
2016
2017
2018
2019
2020
2021
2022
2023
2024
2025
585.11
777.09
978.08
1178.74
1381.13
1517.03
1471.10
1515.01
1663.15
1747.63
1701.92
2288.6507
2529.7839
2796.3230
3090.9447
3416.6079
3911.61
4660.09
5129.78
6793.99
7548.00
8486.00
9128.00
9870.00
10885.00
12497.00
13579.00
15846.875
17791.701
19975.207
22426.687
25179.028
10618.69
11747.65
12775.65
13843.00
15142.00
16731.81
17695.65
19244.46
20760.02
22714.27
22134.31
25877.606
28007.301
30312.267
32806.929
35506.899
5991.17
7132.77
8103.39
9089.00
10117.00
11139.08
12137.72
13241.82
14459.89
15796.29
16980.84
19667.077
21761.207
24078.317
26642.150
29478.978
2323354
2879919
3847674
4385353
5001512
5572959
5808964
6077087
5994078
6198025
7403133
8865747
9820774
10878678
12050540
13348637
11846.18
14240.29
16715.91
19434.75
21537.74
24785.15
28893.11
32324.91
35069.51
38952.53
43608.17
53359.567
60781.111
69234.885
78864.455
89833.360
778.09
1053.43
1371.99
1621.24
1881.83
2165.74
2151.47
2247.06
2373.01
2487.39
2507.54
2824.970
3007.592
3202.021
3409.018
3629.396
Figure 5. Real and predicted local fiscal revenue of Jiangxi Province from
2006 to 2025
图5. 2006~2025年江西省地方财政收入真实值与预测值
由图5,由财政收入真实值和预测值对比图可看出,该模型很好的拟合了财政收入的变化情况。
4.5. 模型评价
采用模型指标体系对建立的江西省财政收入预测模型进行评估,结果如表7所示。
Table 7. Evaluation index value of fiscal revenue forecast model of Jiangxi Province
表7. 江西省财政收入预测模型评估指标值
预测精度(%)
95.33
DOI: 10.12677/sa.2023.121023
平均绝对误差(亿元)
92.86
均方根误差(亿元)
112.59
平均绝对百分比误差(%)
5
233
统计学与应用
龚淑聪
在模型评价指标中,模型具有很高的预测精度,可以为政府相关部门的财政决策与管理工作提供参
考依据。
5. 结论与建议
本文考虑了灰色系统GM(1,1)模型和反向传播(BP)神经网络模型两种预测方法的优缺点,将两个单一
的预测模型进行组合。这样既可以实现两个模型的优势互补,又能很好地消除了两者不足,在最大程度
上保证了模型的预测精度。
在实证过程中,结合江西省实际情况,考虑了诸多对江西省财政收入有较大影响的因素,并利用
LASSO变量筛选方法对初步选择的19个变量进行筛选,再采用GM(1,1)分别对主要指标序列进行预测,
最后利用BP神经网络建立地方财政收入预测的组合预测模型。由于组合模型考虑了多指标的共同作用,
较好的改善了综合指标的预测精度,最后得出的,江西省2020~2025年5年的预测值分别为2824.970亿
元、3007.592亿元、3202.021亿元、3409.018亿元、3629.396亿元,其精确度达到了95.33%。
参考文献
[1] 任晶晶, 高上彬. 基于SVR的吕梁市地方财政收入预测模型[J]. 信息技术与信息化, 2022(1): 46-49.
[2] Deng, J.L. (1988) Proeess Adaption of GM(1,l). Grey System. China Ocean Press, Beijing, 150-164.
[3] 王守英. 基于数据挖掘的财政收入预测研究——以济南市为例[D]: [硕士学位论文]. 济南: 山东师范大学, 2020.
[4] 张方. 基于BP神经网络的税收预测研究[D]: [硕士学位论文]. 西安: 长安大学, 2016.
[5] Mikhail, G. and King, J. (2002) Tax Revenue Forecasts in MF—Supported Program. MF Working Paper.
[6] 倪杰. 山东省财政收入影响因素及预测分析[D]: [硕士学位论文]. 济南: 山东师范大学, 2021.
[7] 张新燕. 四川省财政一般收入预测与分析[D]: [硕士学位论文]. 成都: 四川大学, 2007.
[8] 李敏. 甘肃省财政收入影响因素与财政收入预测分析[D]: [硕士学位论文]. 济南: 山东大学, 2019.
[9] 刘倩. 江浙沪财政收入影响因素分析及预测研究[D]: [硕士学位论文]. 杭州: 杭州电子科技大学, 2021.
DOI: 10.12677/sa.2023.121023
234
统计学与应用
版权声明:本文标题:江西省地方财政收入预测与研究 内容由网友自发贡献,该文观点仅代表作者本人, 转载请联系作者并注明出处:http://www.roclinux.cn/p/1713179679a622744.html, 本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容,一经查实,本站将立刻删除。
发表评论