基于大样本数据的机场业务量需求预测方法
Airport traffic demand prediction method based on large sample data
通讯作者: 陈斌
收稿日期: 2022-11-2
| 基金资助: |
|
Received: 2022-11-2
作者简介 About authors
陈斌(1985—),男,博士研究生,主要研究方向为航空运输经济 。
吴瑾(1965—),男,教授,博士研究生导师,博士,主要研究方向为结构耐久性及监测、航空运输经济 。
机场业务量预测是机场建设规模决策的重要依据, 基于大量样本数据, 采用模型构建和实证分析的方法研究机场业务量需求预测。首先提出相关性回归和主成分回归两种预测方法, 针对每个机场的客、货吞吐量, 构建一元线性回归、相关性回归、主成分回归和逐步回归4类细分预测模型, 并利用203个机场的客、货吞吐量数据对构建的模型进行实证分析。分析结果表明: 机场客、货吞吐量与各类宏观变量存在着不同程度的关联性, 其中与国内生产总值(gross domestic product, GDP)、社会消费品零售总额、居民可支配收入等变量呈现高度相关性。从4类预测方法的预测效果来看, 构建的相关性回归和主成分回归模型预测效果表现较好。统计发现, 在可允许的最大绝对误差百分比下, 在203个机场中回归分析法可有效预测的机场数量占比达50%以上。机场客、货吞吐量量级越高, 回归分析法可有效预测的机场数量越多, 旅客吞吐量千万级以上机场和货邮吞吐量5万吨以上机场的可预测机场数量占比均可达90%以上。
关键词:
The prediction of airport traffic demand is an important basis for the decision-making of airport construction scale. Based on a large amount of sample data, this article uses model construction and empirical analysis methods to study the prediction of airport traffic demand. Firstly, two prediction methods, correlation regression and principal component regression, are proposed to construct four types of segmented prediction models for the passenger and cargo throughput of each airport: linear regression, correlation regression, principal component regression, and stepwise regression. Empirical analysis is conducted on the constructed model using passenger and cargo throughput data from 203 airports. The empirical analysis results indicate that there are varying degrees of correlation between airport passenger and cargo throughput and various macro variables, among which there is a high correlation with variables such as gross domestic product (GDP), total retail sales of consumer goods, and residential disposable income. From the perspective of the predictive performance of the four types of prediction methods, the constructed correlation regression and principal component regression models perform well in predicting performance. Statistics result have found that under the allowable maximum absolute error percentage, over 50% of the 203 airports can be effectively predicted by regression analysis method. In addition, the higher the level of airport passenger and cargo throughput, the more effective the regression analysis method can predict the number of airports. The proportion of predictable airports with passenger throughput of over ten million and cargo and mail throughput of over 50 000 tons can both reach over 90%.
Keywords:
本文引用格式
陈斌, 吴瑾.
CHEN Bin.
0 引言
然而, 机场业务量发展容易受到外界宏观经济因素的干扰和驱动, 因此在科学研究领域, 因果关系法常被用于机场业务量需求预测[4, 13-15]。回归分析法是因果关系模型中的一种经典预测方法, 已被广泛使用和推广。在利用回归分析法进行预测时, 首先需要确定与航空运输相关的各类经济指标。例如, Wu等[16]利用2006~2015年中国各省机场吞吐量和社会经济发展数据, 以人均机场客、货吞吐量和单位国内生产总值(gross domestic product, GDP)机场客、货吞吐量作为区域航空运输利用的衡量指标, 分析了机场吞吐量与宏观变量之间的相关性, 结果表明机场客、货吞吐量与人均GDP、城镇化率、人口密度之间存在较强的相关性。Zhang[17]等分析了航空运输与经济增长之间的因果关系, 研究表明航空运输与经济的关系是双向的, 这种双向关系在欠发达地区普遍存在。但通过对航空市场成熟国家的研究发现, 航空运输对经济增长产生积极影响, 反之则不然。在基于回归分析法的预测中, Bastola[18]等在假设机场旅客吞吐量取决于游客人次和GDP的基础上, 分别构建了两个一元线性回归模型, 结果表明构建的模型表现较好。Peng[19]等基于GDP、常住人口、机场竞争和空间距离等多源数据构建了多元线性回归模型, 结果表明GDP和人口是影响民航机场旅客吞吐量的重要因素。Zhang[20]等从GDP、从业人员数量、水路货运量、公路货运量、游客人数等宏观统计指标中选取相关性最高的变量构建回归预测模型, 预测大连新机场航空货邮吞吐量。此外, 随着大数据的发展, Kim[21]等将互联网搜索数据作为自变量构建回归预测模型, 证实了搜索数据是预测航空运输需求的有效数据。
虽然已有大量文章研究回归分析法在机场业务量需求方面的预测问题, 然而从目前的研究成果来看, 依然存在着以下几点不足: ①自变量选择正确与否对预测结果产生重大影响, 虽然已有利用大量样本从省级层面对航空运输影响因素进行研究的文献, 但从机场角度出发进行大样本研究目前较为稀缺, 无法系统地说明哪些宏观变量与机场业务量之间具有强相关性; ②回归分析法有各种变体, 现有研究多使用一元线性回归和多元线性回归, 然而一元线性回归一次只能引入一个宏观变量。多元线性回归一次可以引入多个变量, 但宏观变量之间具有一定的相关性, 同时引入模型会导致模型存在多重共线性, 因此有必要对模型进行改进; ③没有一个单一的预测模型在所有情况下都能始终优于其他模型[22], 也不存在能够保证准确性的最佳预测方法[23-24], 然而现有研究在回归方法选择上多是依赖主观选择, 因此非常有必要利用大量样本对预测方法进行事后评估, 通过大量样本实证研究判断预测模型的适用性[25-28]。
本文从不同回归分析法的优缺点出发, 提出了相关性回归和主成分回归两种组合回归预测方法, 并基于2015年之前通航的203个机场航空客、货吞吐量和机场所在市的12个宏观指标数据, 对每一个机场客、货吞吐量分别构建一元线性回归模型、相关性回归模型、逐步回归模型、主成分回归模型, 并根据预测结果和真实结果之间的绝对误差百分比评判预测效果, 分析每种回归方法在机场客、货吞吐量预测中的适用性, 并得出结论。
1 回归预测模型及评价指标
本文主要介绍构建的旅客吞吐量预测模型, 货邮吞吐量预测模型与之相似。
1.1 模型参数及变量说明
回归预测模型的模型参数及变量说明如下:
k: 机场旅客吞吐量第k个观测年份;
K: 机场旅客吞吐量最大观测年份;
Yhistory={y(1), y(2), …, y(k)} (k=1, 2, …, K): 机场旅客吞吐量历史观测数列;
M: 机场所在市宏观统计变量个数;
m: 机场所在市第m个宏观统计变量;
P: 代入模型的宏观变量个数, 满足P≤M;
Xhistory, m={xm(1), xm(2), …, xm(k)} (m=1, 2, …, M; k=1, 2, …, K)代表机场所在市第m个宏观变量K年的历史观测数列, 其中xm(k)表示第m个宏观变量在第k年的指标观测值;
xmax: 机场所在市M个宏观统计变量中与机场旅客吞吐量相关性最高的变量;
XXhistory, m={xxm(1), xxm(2), …, xxm(k)} (m=1, 2, …, P; k=1, 2, …, K)表示P个宏观变量做主成分后第m个主成分K年的历史观测数列, 其中xxm(k)表示第m个主成分在第k年的指标值;
t: 机场旅客吞吐量第t个预测年份;
T: 机场旅客吞吐量预测区间最大值;
Xfuture, m={xm(1), xm(2), …, xm(t)} (m=1, 2, …, M; t=1, 2, …, T): 机场所在市第m个宏观变量T年的预测数列, 其中xm(t)表示第m个宏观变量在第t年的指标预测值;
XXfuture, m={xxm(1), xxm(2), …, xxm(t)} (m=1, 2, …, P; t=1, 2, …, T)表示主成分分析之后第m个主成分T年的预测序列, 其中xxm(t)表示第m个主成分在第t年的预测值;
Ω: 允许的最大预测误差情景集合;
ω: 一种特定的情景, ω∈Ω;
φ: 允许的最大预测误差百分比。
1.2 预测模型
一元线性回归模型如下:
式中: a1m是一元线性回归模型的回归系数; ε1是常数项。
相关性回归模型如下:
式(2)表示计算旅客吞吐量和第m个宏观变量之间的相关系数; 式(3)表示找到与机场旅客吞吐量相关性最大的宏观统计变量; 式(4)表示利用相关性最高的宏观统计变量进行一元线性回归, amax2, ε2是回归系数。
主成分回归模型如下:
式(5)表示利用P个宏观统计指标做主成分分析后得到P个线性无关的主成分回归建模, b1, b2, …, bm, ε3表示多项式回归系数。
逐步回归模型如下:
逐步回归模型是从备选的宏观自变量中依次引入新变量到回归模型中, 使得最终引入模型的变量都对因变量显著为止。本文使用的搜索方法为向前法。
步骤1 对M个宏观自变量指标x1, x2, …, xm, 分别同旅客吞吐量y建立一元回归模型, 计算自变量xm相应的回归系数的F检验统计量值, 记为F1(1), F2(1), …, FM(1), 取其中的最大值:
对给定的显著性水平α, 记相应的临界值为F(1), Fm1(1)≥F(1), 则将Wm1引入回归模型, 记I1为选入变量的指标集合。
步骤2 建立机场旅客吞吐量y与宏观自变量子集{xm1, x1}, …, {xm1, xm1-1}, {xm1, xm1+1}, …, {xm1, xM}的二元回归模型, 共有M-1个。计算变量的回归系数F检验统计量的值, 记为Fm(2)(m∉I1), 选其中最大者, 记为Fm2(2), 对应的宏观自变量角标记为m2, 即
对给定的显著性水平α, 记相应的临界值为F(2), Fm2(2)≥F(2), 则将变量xm2引入回归模型; 否则, 终止变量引入过程。
步骤3 考虑机场旅客吞吐量对宏观变量子集{xm1, xm2, xm}的回归重复步骤2。
依次按方法重复进行, 每次从未引入回归模型的自变量中选取一个自变量, 直到检验到没有变量引入为止。
1.3 评价指标
对于每个机场客、货吞吐量预测结果, 利用绝对误差百分比进行评估。
式中: et表示第t年的绝对误差百分比; φ(ω)表示情景ω下允许的最大预测误差, 如果机场客、货吞吐量预测误差小于允许的最大预测误差百分比, 则认为模型预测效果良好。
2 算例分析
2.1 数据来源
本文用到的数据主要包括两类: 一类是机场客、货吞吐量, 主要来源于民用航空局官方网站公布的民航机场生产统计公报; 另一类是机场所在市宏观统计指标, 数据来源于统计年鉴。个别城市部分年份的宏观统计指标尚未公布, 应在实证分析过程中将这些缺口数据对应的年份做剔除处理。
2.2 实验及参数设置
在历史数据选取上, 由于2020年和2021年受疫情影响, 航空运输需求受到某种程度抑制, 机场客、货吞吐量未能反映真实的航空运输需求, 本文选用2020年以前的相关数据进行实证分析。在每一个机场客、货吞吐量实证回归预测过程中, 以2002~2014年(2002年后通航的机场以通航年份作为初始年份)数据作为历史数据预测2015~2019年机场客、货吞吐量。其中, 宏观变量为自变量, 机场客、货吞吐量分别为因变量。
在宏观变量选取上, 本文根据各地市公布的历年国民经济和社会生产统计公报选取综合指标、旅游指标、贸易指标、人口指标、收入指标和城镇化度量指标6大类12个可能相关的经济指标, 即GDP、第一产业GDP、第二产业GDP、第三产业GDP、旅游人次、旅游收入、进出口额、社会消费品零售总额、常住人口、年末总人口、人均可支配收入、城镇化率。
在相关性分析中, 一般认为, 相关系数|ρ|≥0.8时, 两个变量之间呈现高度相关; 0.5<|ρ|<0.8时, 两个变量呈现中度相关; 0.3<|ρ|<0.5时, 两个变量呈现低度相关; |ρ|≤0.3时, 两个变量不相关。本文以|ρ|≥0.8作为两个变量之间是否高度相关的判断标准。
在实证过程设计上, 对于每个机场客、货吞吐量进行预测, 在一元线性回归模型构建中, 自变量依次选择12个宏观指标; 在相关性回归模型构建中, 自变量选择与机场客、货吞吐量相关性最高的宏观指标; 在逐步回归模型构建中, 为了验证不同宏观指标组合下预测结果的差异, 自变量分别选取高度相关的n个宏观指标(由机场客、货吞吐量影响因素研究得出高度相关的宏观指标)和12个宏观指标; 在主成分回归模型构建中, 自变量选取与逐步回归法保持一致, 确定自变量后根据主成分分析结果构建多元线性回归模型。为了下文描述清晰, 此处对所有构建的模型进行编号, 如表 1所示。
表1 预测模型编号
Table 1
| 模型 | 自变量 | 模型编号 |
| 一元线性回归模型 | GDP | 1 |
| 第一产业GDP | 2 | |
| 第二产业GDP | 3 | |
| 第三产业GDP | 4 | |
| 常住人口 | 5 | |
| 年末总人口 | 6 | |
| 城镇化率 | 7 | |
| 进出口额 | 8 | |
| 人均可支配收入 | 9 | |
| 社会消费品零售总额 | 10 | |
| 旅游人次 | 11 | |
| 旅游收入 | 12 | |
| 相关性回归模型 | 相关性最大的宏观指标 | 13 |
| 主成分回归模型 | 高度相关的n个宏观指标 | 14 |
| 12个宏观指标 | 15 | |
| 逐步回归模型 | 高度相关的n个宏观指标 | 16 |
| 12个宏观指标 | 17 |
在回归分析模型有效性方面, 一般采用拟合优度R-Squared评估最佳拟合线预测的准确性, R-Squared越接近1, 说明回归直线对观测值的拟合程度越好; 相反, R-Squared值越小, 说明回归直线对观测值的拟合程度越差, 一般拟合优度大于0.8则认为模型有效。此外, 还要通过F检验和t检验对模型参数进行显著性检验, 即检验在一定显著性水平下回归系数的显著性, 显著性水平通常取0.95。本文按照拟合优度是否大于0.8作为回归模型是否有效的判定标准, 并在显著性水平为0.95的条件下对模型参数进行F检验和t检验, 如果同时满足拟合优度检验、F检验和t检验, 则认为拟合模型可以用于预测, 否则则认为拟合模型无法进行有效预测。
在拟合模型满足检验的情况下, 预测效果评判标准设置参照Nicolaisen[29]及Profillidis[30]的事后评估研究。一般情况下, 预测绝对误差百分比在10%以下认为是高精度预测。为了观察φ在不同取值下, 不同回归分析法对中国机场客、货吞吐量的预测效果, 本文对φ进行灵敏度分析, 设置情景1~情景4共4个分析情景。首先, 以5%为步长设置, 设置φ(1)=10%、φ(2)=15%、φ(3)=20%。此外, 机场客、货吞吐量量级不同, 允许的最大预测误差应该有所区别, 因此φ(4)以梯度方式进行设置。根据民航机场生产统计公报, 按照旅客吞吐量200万人次和1 000万人次将机场划分为3个等级, 即1 000万人次以上、200~1 000万人次、200万人次以下; 对应的货邮吞吐量则分为5万吨以上、1~5万吨、1万吨以下3个等级。因此, 按照梯度设置的思路, 旅客吞吐量在200万人次以下(货邮吞吐量在1万吨以下)机场, φ(4)=20%;旅客吞吐量在200~1 000万人次(货邮吞吐量为1~5万吨)机场, φ(4)=15%;旅客吞吐量在1 000万人次以上(货邮吞吐量在5万吨以上)机场,φ(4)=10%。在结果分析中, 对于任意一个机场客、货吞吐量预测结果, 如果绝对误差百分比小于对应情景的φ值, 则认为在该情景下模型预测效果良好。此外, 为了观察回归分析法对不同量级机场客、货吞吐量预测的适用性问题, 本文对203个机场的客、货吞吐量预测效果分别按照3个等级进行统计, 统计结果如表 2和表 3所示。
表2 机场旅客吞吐量等级分布统计
Table 2
| 机场旅客吞吐量等级/万人次 | 机场数量/个 | 机场数量占比/% |
| >1 000 | 39 | 19 |
| 200~1 000 | 34 | 17 |
| <200 | 130 | 64 |
表3 机场货邮吞吐量等级分布统计
Table 3
| 机场货邮吞吐量等级/万吨 | 机场数量/个 | 机场数量占比/% |
| >5 | 41 | 20 |
| 1~5 | 22 | 11 |
| <1 | 140 | 69 |
机场客、货吞吐量预测的目的主要是确定机场建设规模, 常以5年为一个预测周期, 因此本文在2015~2019年预测结果中主要分析2019年的预测结果。以A机场旅客吞吐量预测为例, 当允许的最大预测误差百分比给定后, 对于17个单个拟合模型预测结果, 如果2019年旅客吞吐量预测误差百分比小于允许的最大预测误差百分比, 即当e5≤φ(ω)时,认为模型预测结果有效。对于同一细分回归分析法, 例如一元线性回归, 如果在构建的12个细分模型中至少有一个模型的预测误差百分比满足e5≤φ(ω), 则认为一元线性回归预测结果有效, 同时选取最小的预测误差百分比作为该机场一元线性回归的预测误差。如果12个细分预测模型均不满足e5≤φ(ω), 则记作一元线性回归无法有效预测A机场旅客吞吐量。如果4类回归分析法中至少有一种细分回归分析法可以有效预测A机场的旅客吞吐量。则认为回归分析法能够有效预测A机场的旅客吞吐量。根据Atiya[31]和Blancy[32]的研究结果, 加权平均之后预测结果最可靠, 因此A机场旅客吞吐量回归分析预测误差由4类回归分析法中有效的细分回归分析法的预测误差百分比取平均加权得到。
2.3 预测结果
2.3.1 机场客、货吞吐量影响因素
针对机场客、货吞吐量影响因素已有相关研究[4, 17, 33-34]。本文基于大量的统计数据, 分析了203个机场样本客、货吞吐量与12个宏观指标的两两相关性, 并分别统计客、货吞吐量与12个宏观指标分别高度相关的机场数量, 根据高度相关机场数量确定与机场客、货吞吐量高度相关的宏观指标。此外, 还计算了GDP与其他宏观指标之间的两两相关系数, 用于判定宏观指标之间的自相关性, 统计结果如表 4~表 6所示。研究表明: 机场客、货吞吐量分别与GDP高度相关, GDP又与其他宏观指标相关, 因此机场客、货吞吐量与12个宏观指标均有不同程度的相关性。根据统计, 总体而言, 至少60%的机场的旅客吞吐量与GDP、第三产业GDP、可支配收入、社会消费品零售总额、旅游人次、旅游收入等6个指标呈现高度相关, 至少60%的机场货邮吞吐量与GDP、第一产业GDP、第三产业GDP、社会消费品零售总额、人均可支配收入之间呈现高度相关, 且随着机场量级的不断提高, 机场客、货吞吐量与宏观指标的相关性更加明显。此外, 从机场客、货吞吐量与宏观指标高度相关的单个机场特征来看, 机场均具有历史数据充足、发展规律明显等特点, 然而相关性低的机场则表现为因历史数据少、因改扩建或迁建机场中途停航、迁建后机场客、货吞吐量飞跃式发展、机场客、货吞吐量波动无序发展或吞吐量波动上升(多为支线旅游机场)而呈现出经济指标逐年下降(多为边远省份机场)等特点。
表4 旅客吞吐量与宏观变量高度相关的机场数统计
Table 4
| 机场属性(按旅客吞吐量划分) | 自变量 | |||||||||||
| GDP | 第一产业GDP | 第二产业GDP | 第三产业GDP | 常住人口 | 年末人口 | 城镇化率 | 进出口 | 可支配收入 | 社会消费品零售总额 | 旅游人次 | 旅游收入 | |
| 千万级机场占比 | 100 | 72 | 87 | 100 | 85 | 79 | 79 | 67 | 100 | 100 | 92 | 97 |
| 200万以上机场占比 | 97 | 78 | 79 | 97 | 75 | 68 | 73 | 51 | 97 | 97 | 93 | 96 |
| 100万以上机场占比 | 91 | 75 | 68 | 93 | 62 | 58 | 68 | 47 | 93 | 92 | 89 | 89 |
| 所有机场占比 | 74 | 67 | 53 | 85 | 48 | 41 | 59 | 36 | 85 | 84 | 80 | 76 |
表5 货邮吞吐量与宏观变量高度相关的机场数统计
Table 5
| 机场属性(按旅客吞吐量划分) | 自变量 | |||||||||||
| GDP | 第一产业GDP | 第二产业GDP | 第三产业GDP | 常住人口 | 年末人口 | 城镇化率 | 进出口 | 可支配收入 | 社会消费品零售总额 | 旅游人次 | 旅游收入 | |
| 千万级机场占比 | 98 | 85 | 88 | 98 | 80 | 80 | 76 | 73 | 98 | 95 | 93 | 93 |
| 200万以上机场占比 | 94 | 86 | 81 | 90 | 76 | 76 | 73 | 65 | 94 | 92 | 84 | 84 |
| 100万以上机场占比 | 71 | 65 | 60 | 69 | 50 | 51 | 49 | 42 | 71 | 70 | 64 | 63 |
| 所有机场占比 | 62 | 61 | 51 | 62 | 42 | 39 | 44 | 34 | 67 | 63 | 60 | 57 |
表6 GDP与其他宏观变量高度相关的机场数统计
Table 6
| 机场属性(按旅客吞吐量划分) | 自变量 | |||||||||||
| GDP | 第一产业GDP | 第二产业GDP | 第三产业GDP | 常住人口 | 年末人口 | 城镇化率 | 进出口 | 可支配收入 | 社会消费品零售总额 | 旅游人次 | 旅游收入 | |
| 千万级机场占比 | 100 | 87 | 100 | 100 | 85 | 82 | 69 | 69 | 100 | 100 | 90 | 95 |
| 200万以上机场占比 | 100 | 92 | 100 | 100 | 78 | 75 | 70 | 63 | 100 | 100 | 88 | 89 |
| 100万以上机场占比 | 100 | 88 | 93 | 94 | 67 | 69 | 64 | 58 | 93 | 94 | 82 | 81 |
| 所有机场占比 | 100 | 85 | 90 | 91 | 55 | 59 | 57 | 46 | 87 | 86 | 76 | 75 |
2.3.2 不同回归分析法的预测结果
本节仿真求解每个机场在不同预测模型、不同预测情景下的预测结果。根据机场客、货吞吐量影响因素研究结果, 在逐步回归模型和主成分回归模型计算中, 旅客吞吐量预测时选取12个经济指标和6个高度相关的宏观指标两种情景, 货邮吞吐量选取12个经济指标和5个高度相关的宏观指标两种情景。
4种回归方法构建的17个细分模型客、货吞吐量预测结果如图 1所示。图 1中, 黑色线表示吞吐量与宏观指标高度相关的机场数量, 品红色线表示模型通过检验的机场数量, 深蓝色、红色、绿色、浅蓝色分别表示情景1~情景4的预测结果。对比来看, 高度相关的机场数量高于模型通过检验的机场数量, 模型通过检验的机场数量又远高于情景1~情景4代表的可预测机场数量, 这说明虽然客、货吞吐量与宏观指标高度相关, 但二者构建的回归模型不一定能够通过检验。同时, 即使回归模型通过检验, 也不一定能够得到精准的预测结果。从4类回归方法的预测效果来看, 以情景1为例, 模型13表示的相关性回归预测效果最好; 模型16和模型17表示的逐步回归法预测效果次之。从模型16和模型17的对比来看, 改变自变量输入个数, 可预测的机场数量基本保持一致, 因此如果使用逐步回归法进行预测, 可以引入多个相关的宏观变量, 模型自动选择能使模型显著的若干宏观变量。需要注意的是, 逐步回归法引入的宏观变量相关性并非很高。模型14和模型15表示的主成分回归预测效果相对中等。从模型14和模型15的对比来看, 模型14在自变量选择高度相关的n个宏观变量时预测效果更好, 这说明主成分分析时要选择相关性最高的宏观经济指标, 相关性不高的宏观变量越多, 越会削弱最大主成分所涵盖的主要宏观指标信息, 从而使预测结果精度不高。模型1~模型12表示的一元回归分析预测效果相对最低, 但从单个自变量的预测效果来看, 旅客吞吐量与GDP、第三产业GDP、可支配收入、社会消费品零售总额、旅游人次、旅游收入6个指标的一元回归分析结果相对更加有效, 货邮吞吐量与GDP、社会消费品零售总额、可支配收入、第一产业GDP、第二产业GDP、第三产业GDP的一元回归分析结果相对更加有效, 即一元回归分析法预测效果较好的宏观经济指标均是与机场客、货吞吐量高度相关的宏观指标。从情景1~情景4的预测效果对比来看, 改变φ值, 可有效预测的机场数量基本不会发生太大变化, 即如果回归分析法可以预测, 那么预测误差百分比多在10%以内。从旅客和货邮吞吐量预测效果的对比来看, 利用4类回归方法构建的17个模型对机场客、货吞吐量的预测效果整体上基本一致。
图1
图1
机场客、货吞吐量预测结果
Fig.1
Prediction results of airport passenger and cargo throughput
对4类回归方法可有效预测的机场数量进行统计, 由于不同φ值下预测结果差异不大, 本文以情景3为例进行统计分析, 预测结果的统计分析如图 2所示。
图2
图2
不同回归分析法的预测结果(情景3)
Fig.2
Prediction results of different regression analysis methods (Scenario 3)
从图 2来看, 4类回归方法中, 相关性回归、主成分回归和逐步回归法的预测效果基本一致, 可预测机场数占比在50%上下, 一元线性回归由于一次只能代入一个宏观变量, 预测效果相对较低。此外, 从客、货吞吐量预测效果的对比来看, 4类回归方法可预测机场数量中客运相比货运更多, 这是由于民航客运发展与宏观因素关系密切, 货运在宏观因素的影响下, 还会受到地方政府补贴、快递企业引进等多方面外力因素影响, 导致机场货邮吞吐量发展与地方宏观变量相关性更低。
表7 机场客运吞吐量可有效预测的机场数量(情景3)
Table 7
| 机场属性(按旅客吞吐量划分) | 可有效预测的机场数量/个 | 可有效预测的机场占比/% |
| 所有机场 | 117 | 58 |
| 1 000万人次以上 | 36 | 92 |
| 200~1 000万人次 | 24 | 71 |
| 200万人次以下 | 57 | 44 |
表8 机场货邮吞吐量可有效预测的机场数量(情景3)
Table 8
| 机场属性(按货运吞吐量划分) | 可有效预测的机场数量/个 | 可有效预测的机场占比/% |
| 所有机场 | 97 | 48 |
| 5万吨以上 | 39 | 95 |
| 1~5万吨 | 17 | 77 |
| 1万吨以下 | 41 | 29 |
对机场旅客吞吐量预测而言, 整体上可有效预测机场117个, 占比58%, 从不同量级可有效预测机场数量来看, 机场量级越高, 可预测机场数量越多, 尤其是对旅客吞吐量在千万级以上机场, 回归分析法基本均可实现预测。机场货邮吞吐量也存在一致的结论, 但对于货邮来说, 由于航空货邮发展主要聚焦在一些大型机场, 支线机场多是客运机场, 其货运发展基本处于无序状态, 因此1万吨以下机场可有效预测的机场的数量相比客运较少, 且无法预测的机场的货邮吞吐量基本都在5 000吨以下。客、货吞吐量无法预测的机场的相关数据发展趋势如图 3所示。
图3
图3
无法有效预测机场吞吐量与宏观变量发展关系图
Fig.3
Development relationship between airport throughput and macroeconomic variables of unpredictable airport
图 3中, 纵坐标数值表示原始数据按照0~1归一化后的数值, 根据变动趋势无法预测的机场的特征可归纳为两类, 一是机场客、货吞吐量发展速度与地方经济发展速度不同步, 例如珠海机场、九寨沟机场、郑州机场等; 二是机场在发展过程中经历了迁建、改扩建停航、其他交通方式影响等, 导致机场客、货吞吐量出现猛增、中断或断崖式下跌, 从而无法预测, 例如汉中机场由于迁建, 在2012~2013年停航。
图4
3 结论
基于大量样本数据, 利用4类回归分析法对中国机场旅客吞吐量和货邮吞吐量进行预测, 主要研究结论如下:
(1) 从203个机场预测效果统计来看, 机场客、货吞吐量与各类宏观指标之间均具有一定的相关性。其中, 旅客吞吐量与GDP、第三产业GDP、旅游总人次、旅游总收入、社会消费品零售总额、人均可支配收入呈现高度相关, 货邮吞吐量与GDP、第一产业GDP、第三产业GDP、社会消费品零售总额、人均可支配收入呈现高度相关性。同时, 利用高度相关的指标作为自变量构建的回归模型预测效果相对更好。
(2) 在4类回归方法中, 本文提出的相关性回归、主成分回归及逐步回归预测效果相对更好。通过大量样本实证发现, 不是每个回归方法都适用于所有机场, 存在仅能使用其中一种回归方法进行预测的情况。
(3) 回归分析法能否实现有效预测与机场旅客吞吐量和货邮吞吐量的量级息息相关, 机场客、货吞吐量量级越高, 可预测机场数量越多, 且预测绝对误差百分比越小。其中, 当机场旅客吞吐量超过1 000万人次或机场货邮吞吐量超过5万吨时, 回归分析法可预测90%以上的机场。这是因为当机场客、货吞吐量发展到一定量级后, 机场发展已经逐步稳定, 如果没有疫情、地震等随机事件影响, 机场发展将与宏观经济呈现高度相关性, 因而客、货吞吐量与宏观指标之间的回归预测效果更好。
(4) 从回归分析法对203个机场客、货吞吐量的预测效果来看, 客运可预测机场数量相对更多。这是因为机场航空客运发展主要由当地需求贡献, 货运发展除本地货源, 还靠周边集散货物提振, 因此航空货运发展主要聚焦在大型枢纽机场, 多数机场货运发展长期处于较低量级, 与当地经济相关性较弱, 回归分析法预测效果相对较差。
参考文献
Review on air traffic delay prediction
[J].
基于气象因素的机场进离港延误预测
[J].
Airport arrival and departure delay time prediction based on meteorological factors
[J].
Regional aviation and economic growth: cointegration and causality analy-sis in Australia
[J].
Determinants of air travel demand: the role of low-cost carriers, ethnic links and aviation-dependent employment
[J].
International trade drivers and freight network analysis -The case of the Chinese air cargo sector
[J].DOI:10.1016/j.jtrangeo.2017.02.009 [本文引用: 1]
Air transportation in China: temporal and spatial evolution and development forecasts
[J].DOI:10.1007/s11442-018-1557-y [本文引用: 1]
Air transport and economic growth: a review of the impact mechanism and causal relationships
[J].
Air passenger demand model (APDM): eco-nometric model for forecasting demand in passenger air transports in Nepal
[J].
Research on passenger throughput forecast of civil aviation airport based on multi-source data
[J].
Application of multiple-factor prediction model on the Dalian new airport's freight traffic vo-lume
[J].
Forecasting short-term air passenger demand using big data from search engine queries
[J].
Tourism demand modelling and forecasting: how should demand be measured?
[J].
Short-term traffic flow forecasting: an experimental comparison of time-series analysis and supervised learning
[J].
Forecasting air traffic demand for major infrastructure changes
[J].
Evaluating prediction models for airport passenger throughput using a hybrid method
[J].
Ex-post evaluations of demand forecast accuracy: a literature review
[J].
An expost assessment of a passenger demand forecast of an airport
[J].
Nonlinear vector auto-regression neural network for forecasting air passenger flow
[J].
基于熵值-BP神经网络的机场旅客吞吐量预测
[J].
Prediction of airport passenger throughput based on entropy BP neural network
[J].
后疫情时期的机场旅客吞吐量预测
[J].
Prediction of airport passenger throughput in post-epidemic era
[J].
Djalaluddin Gorontalo Airport passenger data forecasting with Holt's-Winters' exponential smoothing multiplicative event-based method
[J].DOI:10.1088/1742-6596/1320/1/012051
LSTM network: a deep learning approach for short-term traffic forecast
[J].
Forecasting air passenger demand with a new hybrid ensemble approach
[J].DOI:10.1016/j.jairtraman.2019.101744
Research on forecasting method of aviation traffic based on social and economic indicators
[J].DOI:10.1088/1757-899X/780/6/062038
Aviation business volume forecast of Xianyang International Airport based on multiple prediction models
[J].DOI:10.1088/1757-899X/688/2/022028 [本文引用: 1]
Hourly forecasting of global solar radiation based on multiscale decomposition methods: a hybrid approach
[J].DOI:10.1016/j.energy.2016.11.061 [本文引用: 1]
Why does forecast combination work so well?
[J].
When to choose the simple average in forecast combination?
[J].
/
| 〈 |
|
〉 |

