中国省域国内旅游收入影响因素的分位数回归分析
Quantile Regression Analysis of Influencing Factors of Domestic Tourism Income in China
DOI: 10.12677/PM.2022.123038, PDF, HTML, XML, 下载: 424  浏览: 819 
作者: 谢显良:福建师范大学数学与信息学院统计系,福建 福州
关键词: 国内旅游收入影响因素面板分位数回归模型Domestic Tourism Income Influencing Factors Panel Quantile Regression Model
摘要: 基于2011~2018年我国31个省、市和自治区的面板数据,本文以国内旅游收入为研究对象,主要探讨各影响因素对国内旅游收入的异质性效应。首先,采用主成分分析法选取了可能影响国内旅游收入的综合指标,同时对国内旅游收入及各影响因素进行单位根和正态性检验,证明了采用分位数回归方法的合理性;其次,面板分位数回归模型实证结果表明,除旅游接待能力的作用不明显外,经济发展水平、旅游核心吸引物、基础设施和劳动力资源投入均对国内旅游收入有推动作用,且各影响因素的作用大小变化趋势随0.01~0.99分位点的变化而变化。据此,我们做了相应的政策解读。
Abstract: Based on the panel data of 31 provinces, municipalities and autonomous regions in China from 2011 to 2018, this paper takes domestic tourism income as the research object and mainly discusses the heterogeneous effect of various influencing factors on domestic tourism income. Firstly, the comprehensive indexes which may affect the domestic tourism income are selected by using principal component analysis method, and the unit root and normality tests are carried out on the domestic tourism income and the influencing factors, which proves the rationality of using quantile regression method. Second, the empirical results of panel quantile regression model show that in addition to the role of the tourist reception capacity is not obvious, the level of economic development, the core attractions of tourism, infrastructure and labor resource investment all have a promoting effect on domestic tourism income, and the effect of various influencing factors of size change trend changes over 0.01~0.99 sites. Accordingly, we made the corresponding policy interpretation.
文章引用:谢显良. 中国省域国内旅游收入影响因素的分位数回归分析[J]. 理论数学, 2022, 12(3): 344-353. https://doi.org/10.12677/PM.2022.123038

1. 引言

2009年国务院提出把旅游业培育成为国民经济的战略性支柱产业。所谓战略性支柱产业,从质上说,通常指该产业在国民经济中处于支配地位,对相关产业具有广泛带动和促进作用。不仅如此,旅游业还是满足群众精神需求和实现文化价值的重要载体,随着经济的增长,民众收入提高,休闲时间增多,旅游已经成为人们不可或缺的生活组成部分。同时,旅游收入是缩小城乡差距和贫富差距的重要途径,我国70%以上的景区,坐落在偏远和欠发达地区,因此,旅游业的一个重要功能就是实现财富的转移和国民收入的再分配,特别是实现财富由发达地区向相对落后地区的转移。鉴于旅游业的诸多贡献,为了促进旅游业的发展,各级政府提出了许多关于指导旅游业发展的政策,如2015年国家旅游局提出全域旅游发展理念,并在2016年证实启动“全域旅游示范区”创建工作,在2017年推行全域旅游发展战略,2018年,国务院印发的《关于促进全域旅游发展的指导意见》,标志着全域旅游发展战略上升为国家战略。

得益于各级政府的关注与重视,我国旅游业稳步发展,根据中华人民共和国文化和旅游部公布的数据显示,2018年全年我国实现旅游总收入5.97万亿元,全年全国旅游业对GDP的综合贡献为9.94万亿元,占GDP总量的11.04%,其中,国内旅游收入5.13万亿元,占总收入的86%,可见国内旅游对我国经济活动的重要性。因此,国内旅游的发展不仅是各级政府普遍关注的问题,同时也逐渐成为学术界研究的热点领域,从而正确把握国内旅游收入与其因素的内在联系,使旅游业健康发展。近年来,从对国内旅游的研究来看,采用定量实证方法的文献居多,聂晓庆 [1] 用1994~2012年相关数据运用多元线性回归模型对国内旅游收入影响因素进行实证分析,认为国内旅游收入与城镇居民人均旅游花费、农村居民人均旅游花费、国内旅游人数、铁路营业里程呈正相关关系;王雪勤和冉庆波 [2] 则选择了不同变量用多元线性回归模型的理论对国内旅游收入的影响因素进行了研究,表明旅游人数与居民价格消费指数是影响旅游收入的主要因素;姚战琪 [3] 在中国居民人均旅游花费、全国公里里程、铁路营业里程等国内旅游收入影响因素的基础上加入了“1999年实行的长假制度”和“2007年实行的大小长假并行制度”两个因素,通过构建向量自回归模型得到铁路营业里程对国内旅游收入的影响远远大于全国公里里程、长假制度对我国国内旅游收入影响较弱等结论;吴媛媛和宋玉祥 [4] 用2005~2015年旅游经济相关指标的面板数据,运用ESDA、空间变差函数、空间计量方法得到中国旅游经济空间显著正相关、国内旅游收入在东–西方向上空间差异最大以及经济发展水平、旅游资源禀赋等因素影响着中国旅游经济空间格局的形成与演变等结论;郭伟和曾祥静 [5] 等将旅游总收入作为因变量,采用空间杜宾模型估计了2007~2016年期间京津冀13市区域旅游经济在高铁网络下的空间溢出效应,结果表明该区域相邻地区的旅游经济呈现负相关关系,固定资产投资以及劳动资本的引入促进本地区旅游发展,同时劳动资本会对邻近地区旅游经济产生负作用。

上述研究成果对本文深入研究国内旅游收入的影响因素有重要参考价值。通过对相关文献的解读,我们发现国内学者对国内旅游业发展进行了很多有益的探索,同时也可以发现部分学者使用线性模型和普通最小二乘法来估计国内旅游收入影响因素的效应,这仅描述了影响因素对其条件均值的影响大小,没有对其整体分布进行研究,从而不利于探究国内旅游收入与其他因素的内在联系。因此,本文为了解各影响因素对国内旅游收入条件分布的全貌,在已有研究的基础上,采用面板分位数回归模型进行实证分析,从而探究影响因素的异质性效应,有利于各省份因地制宜,采取有针对性的政策措施。

本文以下章节结构安排如下:第二部分简要介绍了分位数回归方法,之后采用主成分分析法选取了可能影响国内旅游收入的综合指标;第三部分采用面板分位数回归模型进行实证分析,首先为检验该方法的适用性,对各变量进行单位根和正态性检验,最后得到在不同分位点下的估计结果,并绘制了各影响因素弹性系数估计值大小及置信区间随0.01~0.99分位点变化的曲线图;第四部分为主要结论及相应的政策建议。

2. 模型建立与变量选取

2.1. 方法介绍

分位数回归最早由Koenker和Bassett [6] 提出,该方法是对传统线性回归的扩展,利用因变量的条件分位数进行回归,得到所有分位数下的回归模型。传统的线性回归描述的是解释变量对被解释变量的平均影响,只有当随机误差项服从零均值、同方差的正态分布时,其参数估计值是最小方差无偏估计。事实上,该假设往往不成立,现实中的经济变量往往具有高峰度、厚尾部和异方差性等特征,因此,不再具有上述性质,其估计不再具有有效性。而分位数回归与之相比具有以下优点:1) 分位数回归可以描述整个条件分布,在不同分位点下可以估计出不同的参数模型,更加细致地描述了解释变量与被解释变量间的关系;2) 分位数回归不需要对随机扰动项做服从零均值、同方差的正态分布,适用范围较广,且在扰动项是非正态的情况下,参数估计值更加有效;3) 分位数回归是通使加权残差绝对值之和求得的参数估计值,对极值点不敏感,因此,参数估计值更具有稳健性。近年来,分位数回归方法已成为计量经济学的主要研究方向之一,其数学表达式如下:

y i = x i β τ + ε i τ , 0 < τ < 1 Q u a n t τ ( y i | x i ) = x i β τ

其中, y 表示被解释变量, x 表示解释变量向量, ε 为随机扰动项,其条件分位数分布等于零, Q u a n t τ ( y i | x i ) 表示被解释变量 y τ 分位数。用 β ^ τ 表示 τ 分位数下回归系数的估计量,则 β ^ τ 满足:

β ^ τ = arg min β y i x i β τ | y i x i β | + y i < x i β ( 1 τ ) | y i x i β |

通过给定不同的 τ 值可得到不同的参数估计。Koenke [7] 讨论了分位数回归的具体理论。

2.2. 变量选取

国内旅游收入的影响因素很多,现有研究中,许多学者对我国各省域旅游业综合竞争力进行评价,如谢凤媛 [8] 对30个关于区域旅游业发展差异影响因素的研究进行分析,识别出16个主要影响因素,分别为:经济发展水平、旅游核心吸引物、政府政策与管理、科技发展水平、区位条件、区域基础设施、旅游服务设施、人力资本、集群因素、产业结构、区域生态环境、社会和历史文化、安全和保障、目标市场定位、与客源地的关系、旅游企业竞争力,并对其出现的频率进行比较分析。借鉴该研究,本文选取其频率均超过50%的5个主要影响因素进行分析,分别为:1) 经济发展水平,本文用人均GDP (元/人)衡量。2) 基础设施包括交通、通讯和城市基础设施三方面,其中,交通基础设施由公路营业里程、铁路营业里程和内河航道里程(万公里)衡量,通讯基础设施由光缆线路长度(万公里)衡量,城市基础设施由城市绿地面积(万公顷)和每万人拥有公共交通车辆(标台)衡量。3) 旅游核心吸引物,本文选取世界遗产、历史文化名城和旅游景点作为衡量旅游核心吸引物的基本指标。其中,世界遗产包括世界文化、世界自然、世界文化和自然双重遗产,旅游景点指3A级以上(包括3A级)景区总数。4) 旅游服务设施,本文主要指旅游接待能力,用旅行社个数和星级饭店数来衡量,其中星级饭店依据其档次低到高分为一星级、二星级、三星级、四星级和五星级饭店。5) 人力资本,考虑到人力资本衡量的复杂性,且没有一个得到一致认可的测度方法,将人力资本替换为劳动力资源的投入,采用旅游业从业总人数来度量,旅游业从业总人数包括星级饭店、旅行社和旅游景区三方面的从业人数。可以发现,不包括经济发展水平指标在内的其余四个指标都有多个指标衡量,因此,为得到衡量各地区基础设施、旅游核心吸引物、旅游服务设施和劳动力资源投入的最终指标,本文采用主成分分析确定权重,再进行加权的方法将上述指标综合,由于本文采用面板数据,为了降低分析的难度,参照王培和王焱鑫 [9] 的研究,对每个指标在时间维度上取均值,从而消去时间维度的影响,退化成截面数据。最后,得到的5个指标分别用PGDP (经济发展水平)、RC (旅游接待能力)、TAP (旅游核心吸引物)、INF (基础设施)和LR (劳动力资源投入)来表示。

2.3. 模型建立

根据前文所述,为研究各影响因素对我国省域国内旅游收入(DR)在不同分位数下的影响,可构建具体的面板分位数回归模型为:

Q τ ( lnDR i t ) = C τ + β 1 τ lnPGDP i t + β 2 τ lnRC i t + β 3 τ lnTAP i t + β 4 τ lnINF i t + β 5 τ lnLR i t + ε i t

其中, Q τ ( lnDR i t ) C τ 为国内旅游收入和截距项的 τ 分位数, β i τ i = 1 , 2 , 3 , 4 , 5 为各解释变量的 τ 分位数弹性系数。

2.4. 各指标数据来源

国内旅游收入来源于各省份统计年鉴以及国民经济和社会发展统计公报,经济发展水平指标(人均GDP)、基础设施相关指标均来源于中国统计局官网,A级景区数、星级饭店数和旅游业从业人数均来源于《中国旅游统计年鉴》。世界遗产数来源世界文化遗产名录、历史文化名城从1982年开始由国务院公布。

3. 实证分析

3.1. 单位根检验和协整检验

平稳性检验是经济数据分析过程中必不可少的步骤之一。在现实中,大多数经济变量都是非平稳序列,而使用非平稳序列进行回归分析可能会导致伪回归,所以采用面板分位数回归模型估计之前,采用单位根检验判断经济变量是否存在单位根,如果经济变量序列存在单位根,则该序列是非平稳的,反之则是平稳序列。其检验方法主要有两大类:第一类方法假设不同截面存在相同的单位根,例如LLC、Breitung和Hadri等检验;第二类方法假设不同截面之间存在不同的单位根,并且允许一阶自回归系数在不同的截面单元可以不同,包括IPS、Fisher-ADF和Fisher-PP等检验。考虑到各变量因素在不同省域的差异,本文运用第二类方法对国内旅游收入(DR)、经济发展水平(PGDP)、旅游接待能力(RC)、旅游核心吸引物(TAP)、基础设施(INF)和劳动力资源投入(LR)进行单位根检验,为了消除异方差性,对各变量取对数,结果见表1。从表中可以看出,各原始序列在0.1的显著性水平下均表示不能拒绝存在单位根的原假设,说明各变量均为非平稳序列,但其一阶差分序列均显著平稳。为了建立非平稳序列模型,Engle和Granger (1987)提出了协整理论,该理论认为一些变量本身是非平稳序列,但它们的线性组合可能是平稳序列,说明各变量之间存在长期的均衡关系。为检验国内旅游收入与其影响因素之间是否存在长期均衡关系,本文选用Kao检验法进行协整检验,检验结果显示ADF统计量的值为−6.0015,p值为0.000,拒绝不存在协整关系的原假设,表明国内旅游收入与各影响因素存在长期的均衡关系,可以建立面板分位数回归模型。

Table 1. Panel unit root test results

表1. 面板单位根检验结果

注:******分别表示在1%、5%和10%检验水平下显著,下同。

3.2. 正态性检验

当样本数据为非正态分布时,分位数回归的估计结果比最小二乘估计具有更强的稳健性,因此在进行分位数回归分析之前,对各变量进行正态性检验。正态性检验方法很多,为保证检验的可靠性,本文同时采用描述性统计、统计量检验和图形法三种方法来检验各变量是否服从正态分布。

描述性统计。偏度和峰度系数是检验变量是否服从正态分布最常用的两个指标,偏度系数用于检验观测数据分布的对称性,其值等于0表示观测数据服从正态分布,大于0表示为右偏分布,小于0左偏分布;峰度系数用于检验观测数据的陡缓程度,其值等于3表示观测数据服从正态分布,大于3表示具有过度的峰度,小于3表示峰度不足。各变量的偏度和峰度系数值见表2,可以看到,所有变量的偏度系数均不为0,峰度系数均不等于3,说明各变量均不服从正态分布。

统计量检验。本文选用Shapiro-Wilk和Shapiro-Francia检验两种方法进行正态检验,检验结果见表2,可以看到,所有变量在这两种检验方法下均显著拒绝服从正态分布的原假设。

图形法。Q-Q图是图形法检验正态分布中最常用的方法,各变量的Q-Q图如图1所示,图中直线表示正态分布变量的期望值,由图1看出,所有变量均偏离了该直线,表明各变量均不服从正态分布。

综上所述,本文所有变量均为非正态分布,说明采用OLS估计得到的参数估计将不再具有有效性和稳健性,进一步证实了采用分位数回归方法的合理性。

Figure 1. Normal Q-Q plot of lnDR, lnPGDP, lnRC, lnTAP, lnINF, lnLR

图1. 变量lnDR、lnPGDP、lnRC、lnTAP、lnINF、lnLR的Q-Q图

Table 2. Test results of normal distribution of each variable

表2. 各变量正态分布检验结果

3.3. 分位数回归结果分析

分位数回归可以估计出各分位点对应的回归方程,参数估计结果揭示了不同水平上解释变量对被解释变量的边际效应。表3列示了部分分位点( 0.1 , 0.2 , , 0.9 )下的弹性系数估计结果,并且为了全面分析各影响因素对处于不同水平时的国内旅游收入的影响机制,绘制了各影响因素弹性系数估计值大小及其0.95的置信区间(lnTAP为0.9的置信区间)随0.01~0.99分位点变化的曲线图,如图2所示。从表3图2可以看出,各影响因素对处于不同水平时的国内旅游收入的影响机制不同,下面结合表3图2对分位数回归结果进行深入探讨。

Table 3. Parameter estimation results of panel quantile regression model

表3. 面板分位数回归模型参数估计结果

Figure 2. The curves of the estimated elastic coefficients and their confidence intervals of each influencing factor changing from 0.01 to 0.99 loci

图2. 各影响因素弹性系数估计值大小及其置信区间随0.01~0.99分位点变化的曲线图

具体的,从部分参数估计结果方面来看,在0.1到0.9分位点下,lnPGDP和lnINF系数估计值均显著大于零,说明经济发展水平和基础设施对国内旅游收入的产出始终为正向作用;lnRC系数估计值在0.1~0.9分位点均未通过系数显著性检验,说明旅游接待能力对国内旅游收入的影响不明显;lnTAP系数估计值仅在0.4、0.5、0.6、0.7分位点处显著大于零,可以认为旅游核心吸引物仅在国内旅游收入处于中等收入水平时起明显推动作用,而当国内旅游收入低、高水平时,旅游核心吸引物的作用不明显;lnLR系数估计值则仅在0.1、0.2分位点处显著性大于零,说明劳动力资源的投入仅对国内旅游收入处于低水平时起推动作用。另一方面,图2(a)可以看到,lnPGDP系数估计值0.01~0.99分位点变化的曲线始终在零的上方,且95%的置信区间除0.99分位点,均未与零相交,进一步说明经济发展水平对国内旅游收入的正向作用,从图形中还可以看出,其正向作用随分位点提高呈现“U”型,即经济发展水平对国内旅游收入的正向效应随国内旅游收入的提高呈先下降后上升的趋势,大概0.9分位点处达到最小值;图2(b)可以看到,lnRC系数估计值95%的置信区间始终与零相交,进一步证实了旅游接待能力对国内旅游收入影响不明显的结论;图2(c)可以看到,lnTAP系数估计值90%的置信区间大概在0.4~0.75分位点均未与零相交,说明当国内旅游收入处于该水平时,旅游核心吸引物起促进作用,其大小呈先增大后减小的趋势,0.6分位点处达到最大值;图2(d)可以看出,lnPGDP系数估计值始终位于零上方,且其95%置信区间均未与零相交,说明基础设施对处于不同水平的国内旅游收入均为推动作用,与其它因素比较可以发现其作用最明显,其大小整体上呈先减小后增大趋势,但幅度变化不大;图2(e)可以看出,lnLR系数估计值随分位点提高呈下降趋势,且仅在0.1分位点以下时,其95%置信区间未与零相交,说明只有劳动力资源投入仅对国内旅游收入低的地区有推动作用。

4. 结论与政策建议

本文基于2011~2018年我国31个省、市和自治区的面板数据,首先采用主成分分析法构建了可能影响国内旅游收入的5个综合指标,并对各指标进行正态性检验,结果表明各变量均不服从正态分布,从而证明了采用分位数回归方法的合理性,接着基于面板分位数回归模型进行实证分析,重点探讨了各影响因素对处于不同分位点处国内旅游收入的不同效应。研究结果表明,经济发展水平、旅游核心吸引物、基础设施和劳动力资源投入在特定的分位数下均对国内旅游收入有不同程度的推动作用,而旅游接待能力的作用不明显。其中,1) 经济发展水平在0.01~0.99分位点处均对国内旅游收入有显著的推动作用,其大小呈先减小后增大趋势,0.9分位点处达到最小值;2) 旅游核心吸引物仅在0.4~0.75分位点处对国内旅游收入有显著的推动作用,其大小呈先增大后减小的趋势,0.6分位点处达到最大值;3) 基础设施在0.01~0.99分位点处均对国内旅游收入有显著的推动作用,其大小整体上呈先减小后增大趋势,幅度变化不大;4) 劳动力资源投入仅在0.01~0.1分位点处对国内旅游收入有显著的推动作用,且其作用较小。

基于上述结论,本文提出以下政策建议:

为进一步提高各地区国内旅游业的发展,各省应采取以下主要措施:各地区进一步提高经济发展水平、加强基础设施建设和旅游资源的开发和利用。同时,不同地区关注的重点应不同。具体的,1) 对于高、低国内旅游收入的省份,应重点关注经济发展水平对其的促进作用;2) 当国内旅游收入处于中等偏上水平时(0.6分位点),应重点关注旅游吸引物对其的促进作用;3) 基础设施建设,对国内旅游收入推动作用最大,各地区应都应重点关注;4) 当国内旅游收入处于低水平时(0.1以下分位点),不能忽视劳动力资源对其的促进作用。

参考文献

[1] 聂晓庆. 国内旅游收入影响因素的计量分析[J]. 经济研究导刊, 2014(15): 217-219.
[2] 王雪勤, 冉庆波. 国内旅游收入主要影响因素的实证分析[J]. 中国市场, 2017(2): 27-29.
[3] 姚战琪. 中国国内旅游收入影响因素的实证分析[J]. 创新, 2015, 9(3): 62-67.
[4] 吴媛媛, 宋玉祥. 中国旅游经济空间格局演变特征及其影响因素分析[J]. 地理科学, 2018, 38(9): 1491-1498.
[5] 郭伟, 曾祥静, 张鑫. 高铁网络、空间溢出与区域旅游经济增长[J]. 统计与决策, 2020, 36(7): 103-107.
[6] Koenker, R. and Bassett, G. (1978) Regression Quantiles. Econometrica, 46, 33-50.
https://doi.org/10.2307/1913643
[7] Koenker, R. (2005) Quantile Regression. Cambridge University Press, New York.
[8] 谢风媛. 省域旅游业发展差异及对经济增长的影响研究[D]: [博士学位论文]. 大连: 大连理工大学, 2010.
[9] 王培, 王焱鑫. 面板数据的主成分分析及其应用[J]. 贵州大学学报(自然科学版), 2009, 26(1): 21-23.