2. 中国民航局第二研究所 成都 610041
2. The Second Research Institute of Civil Aviation administration of China Chengdu 610041
近年来我国民航业持续高速发展,据民航局行业发展统计公报显示,自2010年以来旅客吞吐量平均增速都维持在10%左右,2014年全国民航机场旅客吞吐量达8.32亿人次,位居世界第二。与此同时民航机场运行保障评估研究表明,2015年近60个机场达到资源饱和。传统的依靠资源冗余满足旅客需求的格局已被打破,旅客过站时间长,服务效率、满意度下降等现象成为民航机场亟待解决的难题。国内外学者力图通过研究机场资源配置优化和旅客服务流程优化,提高机场对旅客的服务效率与水平。
文献[1]采用计算机技术对候机大厅内的旅客流进行仿真并提出优化策略,可以提高候机大厅的利用率以及旅客的满意度。文献[2]采用离散事件仿真技术模拟了旅客在航站楼内的流程,在此基础上预测延误,为管理人员提供理性的值机与安检策略。这类研究采用计算机仿真技术实现对航站楼旅客流程的定性分析以及资源优化,在一定程度上缓解了资源紧张。但仿真技术在输入层都采用理想的旅客到达模型(如泊松分布),忽略航班流等运行因素对旅客流的巨大影响,与现实旅客流相比存在较大误差。另一类研究侧重宏观角度预测旅客流量,文献[3]基于模糊理论建立了经济计量模型很好地预测了希腊机场旅客流量。文献[4]则将重力模型加以分析利用,建立了预测模型,该模型在已知机场设施条件下很好地改善了预测精度。宏观角度对旅客流量的预测可以从整体态势与全局角度把握旅客对机场资源的需求,但基于目前机场资源紧张、松弛空间小的条件下,根据旅客到达聚集状态,实时调整资源分配才是未来有效解决资源紧张问题的主要手段。
要做到机场资源的实时分配,旅客聚集人数的精确预测必不可少,因此本文通过分析自助值机系统的旅客数据,以微观角度的单个离港航班为研究对象,对旅客群体层面的动力学进行分析,基于对数正态分布与回归分析,建立了基于航班离港时刻主导的单航班旅客聚集模型。经验证,该模型与真实数据拟合度达到80%以上,为航站楼内各区域旅客聚集人数的精确预测及服务流程优化研究奠定了基础。
1 旅客到达规律分析人类动力学对人类行为做了大量研究,发现由于存在截止时间、个人喜好、排队优先权等因素的影响,人类的日常通信、浏览网站、图书借阅等行为呈现非泊松统计特性,服从重尾分布[5, 6]。科学界通过总结这些问题,基于排队优先权、人类自身兴趣与记忆因素分别建立了数学模型[6, 7, 8]。然而针对截止时间影响的人类行为,很少有公认的数学模型。关于人类群体行为的预测,文献[9]引入截止时间,建立了简单数学模型预测参加会议的注册人数。研究发现,注册人数的增长通常不是线性而是在会议前几天呈现爆发式增长[9]。本文通过研究旅客群体层面在航站楼的聚集行为,说明了旅客到达行为服从重尾分布,但有区别于基于排队优先权的两大普适类。
定义 1 重尾分布[10]是一类分布的总称,其尾部较长并且以幂律分布缓慢下降,重尾分布不存在指数阶矩,即:$E({{\text{e}}^{\lambda X}}) = \int_{{\text{ }}0}^{{\text{ }}\infty } {{{\text{e}}^x}{\text{d}}F(x)} = \infty $,事件发生的间隔也明显偏离负指数分布,呈现幂率分布$p(\tau ) \propto \lambda {\tau ^{ - \alpha }}$。与泊松分布相比,重尾分布有明显的阵发性。即允许一段时间事件频繁发生,也允许事件长时间静默。
以下是对航站楼内旅客到达规律统计,数据来源于某航空公司的自助值机系统。据统计,旅客到达航站楼后,如果通过自助方式值机,基本不需要等待。因此本文用旅客自助值机时间作为旅客到达时间,以自助值机旅客作为样本点,刻画旅客总体到达规律。旅客总体的到达规律如图 1所示,图中横轴表示提前时间即等待时间${t_{\text{w}}}$,原点表示航班起飞时刻${t_0}$,t为旅客自助值机时间,则有${t_{\text{w}}} = {t_0} - t$(为方便时刻与时间段统一计算,将其全部转换为小于1的比例数,即相对时间,下同)。纵轴表示平均到达率,图中每个小矩形的面积表示单位时间到达的旅客比例。由图可见旅客在航站楼的到达行为有很强的非均匀性并且活跃性[11]随时间变化剧烈,平均到达率曲线拖着长长的尾巴有明显的重尾特性。
图 2a为旅客到达航站楼的时间间隔统计,横轴为事件发生次数,纵轴表示时间间隔$\tau $,其总体服从幂指数为-1.728的幂律分布如图 2b所示。将旅客从众数${t_{\text{m}}}$拆分加以分析,前半部分服从幂指数为-1.611的幂律分布,后半部分服从幂指数为-1.871的幂律分布如图 2c所示,说明旅客到达规律具有重尾特性,并且在旅客航站楼聚集这一问题上有着多重标度,不能用单一模式刻画,有着混合分布的特征。根据大量数据分析,其总体幂律特性受干扰因素影响不断变化,但其总体幂指数在[-1.5,-2]区间内。明显区别于文献[8]的重尾分布两大普适类。
对数正态分布为重尾分布中比较重要的成员之一,它是典型的混合分布,其广泛用于经济学分析,也有少量学者用它刻画重尾分布,但一直作为人类动力学的非主流存在。
定义 2 如果随机变量X的对数lnX服从正态分布,则称X服从参数为μ和${\sigma ^2}$的对数正态分布[12]。其概率密度函数为:
$f(x;\mu ,\sigma ) = \frac{1}{{x\sigma \sqrt {2{\text{\pi }}} }}{{\text{e}}^{ - {{(\ln x - \mu )}^2}/2{\sigma ^2}}}\quad \quad x > 0$ | (1) |
分布众数为${x_{\text{m}}} = {{\text{e}}^{\mu - {\sigma ^2}}}$,峰值为$f{(x;\mu ,\sigma )_{\max }} = \frac{{{{\text{e}}^{{\sigma ^2}/2 - \mu }}}}{{\sigma \sqrt {2{\text{\pi }}} }}$,累积概率分布函数为$F(x;\mu ,\sigma ) = \frac{1}{2} + \frac{1}{2}{\text{erf}}\left[{\frac{{\ln (x) - \mu }}{{\sigma \sqrt 2 }}} \right]$。
将旅客数据与式(1)进行数据拟合,并做拟合优度检验。随机抽取12个航班的旅客数据进行拟合,结果如表 1所示,其中$\hat \mu $与$\hat \sigma $为对数正态分布的参数估计值。对于原假设H0:旅客等待时间服从对数正态分布,对于假设H1:旅客等待时间不符合对数正态分布。p为拟合优度检验值,由p值可判断是否拒绝原假设。H=1表示拒绝原假设,H=0表示不拒绝原假设,显著性水平均默认$\partial = 0.05$。如表 1所示,超过83%的离港航班旅客等待时间通过拟合优度检验,不拒绝对数正态分布。从数据层面说明了离港旅客的到达为行服从对数正态分布。
综上分析,建立基于对数正态分布的单航班离港旅客聚集模型(arrived passenger model in sngle flight,SFAPM):
设t0为航班预计离港时刻,tw为提前时间,t为任一航班起飞前时刻。则$P({t_0} - t)$即$P({t_{\text{w}}})$为t时刻旅客累积到达比例,且$P({t_{\text{w}}})$满足以下关系:
$P({t_{\text{w}}}) = \int_{{\text{ }}{t_{\text{w}}}}^{{\text{ }}\infty } {f(s;\mu ,\sigma ){\text{ }}} {\text{d}}s = 1 - F({t_{\text{w}}};\mu ,\sigma )$ |
即:
$P({t_{\text{w}}}) = \frac{1}{2} - \frac{1}{2}{\text{erf}}\left[{\frac{{\ln ({t_{\text{w}}}) - \mu }}{{\sigma \sqrt 2 }}} \right]$ | (2) |
式中,μ与$\sigma $为待定参数。
由表 1可见,由于受到多种因素影响,对数正态分布参数上下浮动较大。为了更直观了解参数变化给分布带来的影响,给出重尾强度D与分布范围R定义。
定义 3 任意一种连续分布的概率密度函数$f(x)$总存在一个$\delta = \frac{{f{{(x)}_{\max }}}}{\alpha }$(α>0)使得$f(x) = \delta $,并且x至少存在一个有效解。假设存在某种分布使得此解存在两个或两个以上,则必存在两个极值解xmax与xmin,其分布范围定义为:
$R = {x_{\max }} - {x_{\min }}$ | (3) |
并且必存在最大值转折点xm,则重尾强度定义为:
$D = \frac{{{x_{\max }} - {x_{\text{m}}}}}{{{x_{\text{m}}} - {x_{\min }}}}$ | (4) |
当该分布为正态分布时D=1,即不是重尾分布;当该分布为重尾分布时D>1,并且重尾特性越强,分布尾巴越长D值越大。通过这两个值能对参数变化带来的影响有更直观的了解。
将定义3应用于对数正态分布,有:
$f(t) = \frac{1}{{t\sigma \sqrt {2{\text{\pi }}} }}{{\text{e}}^{ - {{(\ln t - \mu )}^2}/2{\sigma ^2}}} = \delta $ |
解得:
$\begin{array}{l} {t_{\max }} = {{\rm{e}}^{\mu - {\sigma ^2} + \sigma \sqrt {{\sigma ^2} - 2\mu - 2\ln (\delta \sigma \sqrt {2{\rm{\pi }}} )} }}\\ {t_{\min }} = {{\rm{e}}^{\mu - {\sigma ^2} - \sigma \sqrt {{\sigma ^2} - 2\mu - 2\ln (\delta \sigma \sqrt {2{\rm{\pi }}} )} }} \end{array} $ |
使α=40,将上述结果带入式(3)、式(4),有;
$R = {{\text{e}}^{\mu - {\sigma ^2}}}({e^{2.716{\text{ }}2\sigma }} - {e^{ - 2.716{\text{ }}2\sigma }})$ | (5) |
$D = \frac{{{{\text{e}}^{\sigma \sqrt {2\ln 40} }} - 1}}{{1 - {{\text{e}}^{ - \sigma \sqrt {2\ln 40} }}}} = \frac{{{{\text{e}}^{2.716{\text{ }}2\sigma }} - 1}}{{1 - {{\text{e}}^{ - 2.716{\text{ }}2\sigma }}}}$ | (6) |
由式(5)可知,对数正态分布的分布范围由两个参数共同决定,并且μ起主导作用。由式(6)可知,重尾强度仅与$\sigma $有关,并且为严格的单调递增关系,即$\sigma $值越大重尾特性越强,幂律尾巴越长。
本文经过对旅客数据的分析证明了旅客群体层面的到达规律服从对数正态分布,并且基于对数正态分布建立了单航班离港旅客聚集模型(SFAPM),但由于受到多种因素影响对数正态分布的重尾强度与分布范围有很大波动,对影响因素加以分析才能进一步揭示旅客行为规律。
3 基于航班离港时刻的影响因素分析影响旅客聚集的因素众多,包括时间因素、空间因素与突发因素等。本文只在时间维度考虑对旅客行为的影响,因此有如下假设:
1) 旅客数据均来自同一机场。
2) 航班容量相同。
3) 航线性质相同(国内航班)。
4) 旅客出行当天无天气异常等突发因素。
根据假设旅客受到时间维度的影响主要有t0(航班离港时刻)与M(月份)。不同于多元回归分析,旅客在航站楼聚集的总体规律服从对数正态分布,因此本文基于对数正态分布研究时间维度参量变化引起的分布变化。
根据定义3,随机抽取一个航班,由航班月份变化引起的重尾强度与分布范围变化如表 2所示,由表可以看出由航班月份变化引起的分布变化非常小,因此将航班季度因素作为弱影响因素排除。
航班离港时刻对分布的影响如图 3所示,由图可以看到分布的分布范围R与重尾强度D受航班时刻影响变化非常明显,说明在建模过程中航班离港时刻作为主要影响因素不可忽略。并且在图中还可以看到由于受到航班离港时刻的影响,旅客聚集行为的时间分布范围与重尾强度均呈现明显的递增趋势,即旅客行为的重尾特性会随着离港时刻的推移逐渐增强,这个发现不仅为本文的建模提供依据,并且该规律也为交通运输类人类动力学建模提供一定参考。
经分析由航班离港时刻引起的分布参数变化总体上呈现多项式特征。对μ和$\sigma $进行回归分析,结果如下:
μ分析结果为:
$\mu = {\text{43}}{\text{.68}}{t_0}^4 - {\text{95}}{\text{.04}}{t_0}^3 + {\text{71}}{\text{.64}}{t_0}^2 - {\text{21}}{\text{.29}}{t_0} - {\text{0}}{\text{.7403}}$ |
$\sigma $分析结果为:
$\sigma {\text{ = }}2.44{t_0}^3 - 4.738{t_0}^2 + 3.179{t_0} - 0.383$ |
综上分析,结合SFAPM模型建立航班离港时刻主导的单航班离港旅客聚集模型(arrived passenger model in single flight based on the time of departure,TD-SFAPM)为:
设t0为航班计划离港时刻,t为任一航班起飞前时刻。根据SFAPM模型,在t时刻旅客累积到达比例满足以下关系:
$p({t_0} - t) = \frac{1}{2} - \frac{1}{2}{\text{erf}}\left[{\frac{{\ln ({t_0} - t) - \mu }}{{\sigma \sqrt 2 }}} \right]$ |
且其参数μ与$\sigma $可由离港航班时刻t0唯一决定,有:
$\begin{gathered} \mu = {\text{43}}{\text{.68}}{t_0}^4 - {\text{95}}{\text{.04}}{t_0}^3 + {\text{71}}{\text{.64}}{t_0}^2 - {\text{21}}{\text{.29}}{t_0} - {\text{0}}{\text{.7403}} \hfill \\ \;\;\;\;\;\;\;\sigma {\text{ = }}2.44{t_0}^3 - 4.738{t_0}^2 + 3.179{t_0} - 0.383 \hfill \\ \end{gathered} $ |
设航班的容量为S,航班上座率为$\lambda $,则在t时刻,旅客在航站楼聚集的人数为:
$Q = S\lambda P({t_0} - t)$ |
本节根据旅客行为的重尾特性,基于SFAPM模型与回归分析,建立了航班离港时刻主导的旅客到达聚集模型(TD-SFAPM)。该模型既具有重尾特性与混合分布特点,还可以根据离港航班时刻调整参数,适应重尾强度与分布范围的变化。
4 模型验证与分析 4.1 模型验证根据上文所建立的TD-SFAPM数学模型,将未参与建模分析的航班数据(数据分布在12个月中的26个航班)作为验证集,参与模型验证。随机抽取3个航班,并且每个航班都分布在不同的月份。实验在MATLAB环境中进行,验证结果如图 4所示。
检验的航班包含4月8:00:00、8月14:55:00、12月21:20:00,包含上午、下午以及晚上的3个不同月份与时刻。仿真表明,模型可以根据航班时刻的变化自动调整参数,进而改变模型变化率。在时间维度有很好的契合效果,模型与真实数据的平均拟合度达到80%以上,显示了模型较好的预测能力。同时,由于3个航班分布在不同月份,其良好的预测效果也证明了上文提到的观点,航班月份的变化作为弱影响因素可以忽略不计。
4.2 模型对比SFAPM为典型的固定参数模型,为了证明参数自调整环节对模型精度的影响,将上文使用的3个航班数据作为验证数据,采用SFAPM作为预测模型,在相同的环境下对3个航班进行仿真预测并对比,仿真结果如图 5a所示。在预测的3个航班中,只有14:55:00的航班拟合度为82%,8:00:00的航班拟合度只有11%,21:20:00的航班拟合度为35%。与图 4对比有以下结论:SFAPM为典型的固定参数模型,虽然模型也符合旅客的行为规律,但在旅客重尾特性时变的条件下,不可调整参数使得模型的精度难以保证。对比上文实验,加入参数自调整环节后,模型预测精度在某些时段有了质的提升,可以较好地预测各时段的航班旅客聚集人数,具有较好的适应性。
文献[9]引入截止时间建立了模型$f(t) = Clog\left( {\frac{{{T^*}}}{{{T^*} - t + 1}}} \right)$,其中,T*为截止时间,t为当前时间,C为待定参数。模型将截止时间作为基准时间,较好地预测了会议注册人数与截止时间之间的关系[9]。本文通过仿真,将文献[9]模型应用于晚上9:00的航班。与TD-SFAPM模型预测结果进行对比,其结果如图 5b所示。对比结果表明,TD-SFAPM模型在预测的精度上有10%的提高,显示了更好的预测效果。这归功于TD-SFAPM模型有重尾特性,带有混合分布特点,更加贴近旅客行为规律。加入参数自调整环节后,在不同时刻的航班旅客预测方面,TD-SFAPM模型有更大的优势。
综上所述,TD-SFAPM模型拥有两个方面的优势:1) 模型有参数自调整环节;2) 模型有重尾特性与混合分布特点。这两个优势使得模型紧密结合旅客行为规律,预测精度上得以保障。
5 总结本文首先通过对单航班离港旅客自助值机数据分析,说明了旅客聚集规律服从重尾分布,证明了旅客聚集规律服从对数正态分布,从数据角度说明了对数正态分布在交通领域人类动力学建模的可用性,并且建立了以航班离港时刻主导的单航班旅客聚集模型(TD-SFAPM)。仿真结果显示模型具有较高的预测精度,为实时掌握旅客在航站楼的聚集动态提供了可能。其次经分析随着航班离港时刻的推移,旅客聚集的重尾强度与分布范围逐渐增加,说明了人类行为受到不同截止时间影响其重尾特性不同,这也为交通运输人类动力学建模提供一定参考。最后需要指出的是影响旅客聚集规律的因素还有很多,本文只在时间维度范畴内考虑了主要影响因素,其他影响因素还有待进一步探索。
[1] | CASAS P F, CASANOVAS J. Passenger flow simulation in a hub airport: an application to the Barcelona international airport[J]. Simulation Modelling Practice and Theory, 2014, 44: 78-94. |
[2] | GUIZZI G, MURINO T, ROMANO E. A discrete event simulation to model passenger flow in the airport terminal[J]. Mathematic Methods and Applied Computing, 2012, 40(1): 427-434. |
[3] | PROFILLIDIS V A, BOTZORIS G N. A comparative analysis of performances of econometric, fuzzy and time-series models for the forecast of transport demand[C]// Fuzzy Systems Conference, 2007. [S.l.]: IEEE, 2007: 1-6. |
[4] | GROSCHE T, ROTHLAUF F. Armin heinzl gravity models for airline passenger volume estimation[J]. Journal of Air Transport Management, 2007, 13: 175-183. |
[5] | 韩筱璞, 汪秉宏, 周涛. 人类行为动力学研究[J]. 复杂系 统与复杂性科学, 2010, 7(3): 132-144. HAN Xiao-pu, WANG Bing-hong, ZHOU Tao. Researches of human dynamics[J]. Complex System and Complex Science, 2010, 7(3): 132-144. |
[6] | 周涛, 韩筱璞. 人类行为时空特性的统计力学[J]. 电子科 技大学学报, 2013, 42(4): 481-540. ZHOU Tao, HAN Xiao-pu. Statistical mechanics on temporal and spatial activities of human[J]. Journal of University of Electronic Science and Technology of China, 2013, 42(4): 481-540. |
[7] | VÁZQUEZ A, OLIVEIRA J G, DEZS Z, et al. Modeling bursts and heavy tails in human dynamics[J]. Phys Rev E, 2006, 73(3): 036127. |
[8] | GOH K I, BARABÁSI A L. Burstiness and memory in complex systems[J]. Europhys Lett, 2008, 81(4): 48002. |
[9] | ALFI V, GABRIELLI A, PIETRONERO L. How people react to a deadline[J]. Central European Journal of Physics, 2009, 7(3): 483-489. |
[10] | LEPAGE R. Heavy-tailed distributions[J]. International Encyclopedia of Statistical Science, 2014(2): 626-628. |
[11] | ZHOU T, KIET H A T, KIM B J, et al. Role of activity in human dynamics[J]. Europhysics Letters, 2008, 82(2): 28-32. |
[12] | 边宽江, 崔冰, 金晓燕. 对数正态分布的VAR数学模型 及其计算[J] . 数学的实践与认识, 2011, 41(1): 11-16. BIAN Kuang-jiang, CUI Bing, JIN Xiao-yan. Varmathematical model and its computing methods under the lognormal distribution[J]. Mathematics Knowledge and Practice, 2011, 41(1): 11-16. |