«上一篇 下一篇»
  计算机工程  2020, Vol. 46 Issue (12): 276-282  DOI: 10.19678/j.issn.1000-3428.0056093
0

引用本文  

李浩, 霍雯, 裴春营, 等. 融合VGG与FCN的智能出租车订单预测模型[J]. 计算机工程, 2020, 46(12), 276-282. DOI: 10.19678/j.issn.1000-3428.0056093.
LI Hao, HUO Wen, PEI Chunying, et al. Intelligent Taxi Order Forecasting Model Fusing VGG with FCN[J]. Computer Engineering, 2020, 46(12), 276-282. DOI: 10.19678/j.issn.1000-3428.0056093.

基金项目

国家自然科学基金(61762092)

作者简介

李浩(1970-), 男, 教授、博士, 主研方向为机器学习;
霍雯, 硕士研究生;
裴春营, 硕士研究生;
袁瑶瑶, 硕士研究生;
康雁, 副教授、博士

文章历史

收稿日期:2019-09-23
修回日期:2019-11-14
融合VGG与FCN的智能出租车订单预测模型
李浩1,2 , 霍雯1 , 裴春营3 , 袁瑶瑶1 , 康雁1,2     
1. 云南大学 软件学院, 昆明 650091;
2. 云南省软件工程重点实验室, 昆明 650091;
3. 西安科技大学 测绘科学与技术学院, 西安 710054
摘要:为提高出租车市场管理和运营效率以及实现出租车效益最大化,在地图栅格化的基础上,提出一种融合VGG网络与全卷积网络(FCN)的出租车多区域订单预测模型。将出租车轨迹数据转换为订单图像,去除VGG网络全连接层仅保留主要结构以减少模型参数,利用该网络中深度卷积提取不同空间区域出租车行驶特征,使用FCN中反卷积层上采样重构下一个时间段出租车订单图像,从而获得不同区域和时间段的出租车订单预测数据,并以订单图像形式呈现在地图上。实验结果表明,与BP、RBF等预测模型相比,该模型预测结果平均准确率更高且均方根误差更低,可快速预测出租车多区域订单分布情况。
关键词出租车订单预测    VGG网络    全卷积网络    反卷积层    融合模型    
Intelligent Taxi Order Forecasting Model Fusing VGG with FCN
LI Hao1,2 , HUO Wen1 , PEI Chunying3 , YUAN Yaoyao1 , KANG Yan1,2     
1. School of Software, Yunnan University, Kunming 650091, China;
2. Key Laboratory of Software Engineering of Yunnan Province, Kunming 650091, China;
3. College of Geomatics, Xi'an University of Science and Technology, Xi'an 710054, China
Abstract: In order to improve the efficiency of taxi market management and operation, and maximize the taxi benefit, this paper proposes a multi-region taxi order forecasting model based on VGG network and Fully Convolutional Networks(FCN) using map rasterization.The taxi trajectory data is converted into order images, and the full connection layer of VGG network is removed while only the main structure is retained to reduce the number of model parameters.The deep convolution in the network is used to extract taxi driving characteristics in different spatial regions, and the taxi order images of the next time period is reconstructed by sampling on the deconvolution layer.So the forecasting data of the taxi orders of different regions and periods is obtained and presented as order images on the map.Experimental results show that compared with BP, RBF and other forecasting models, the prediction results of the proposed model has a higher average accuracy and a lower Root Mean Square Error(RMSE).It can quickly predict the distribution of taxi orders in different regions.
Key words: taxi order forecasting    VGG network    Fully Convolutional Networks(FCN)    deconvolution layer    fusion model    
0 概述

随着共享经济和移动物联网技术的不断发展, 出租车时空轨迹、人群流动行为等[1]新型城市轨迹数据应运而生, 与传统轨迹数据相比, 新型轨迹数据的空间分布更广、维数更高且数据量更大[2]。在当前智能交通中, 虽然众多乘车APP在一定程度上缓解了外出乘车难的问题[3], 但是出租车司机接客难、乘客在上下班高峰期乘车难的问题仍然存在。因此, 如何从海量乘客出行轨迹数据中提取具有价值的数据解决上述问题, 成为国内外研究人员关注的热点[4]

目前全球定位系统(Global Positioning System, GPS)在交通出行中应用较广泛, 该系统以一定的频率向交通信息沟通平台发送当前车辆的经度、纬度、时间、速度、方向以及载客状态等轨迹数据[5], 这些数据包含乘客的出行规律、兴趣点分布等信息。利用GPS获取的出租车轨迹数据可分析得到不同区域内车辆载客量分布特征, 并由此预测城市居民流动趋势[6], 这为交通路线优化、出行路线个性化推荐、路网预测以及城市规划等提供了理想的解决方案。

本文基于出租车GPS获取的海量出租车时空轨迹数据, 提出一种融合VGG网络和全卷积网络(Fully Convolutional Networks, FCN)的出租车订单预测模型。将出租车轨迹数据通过计算转换为订单图像, 利用VGG网络提取不同区域出租车客流分布特征, 并采用FCN中反卷积层上采样重构订单图像, 对不同区域与时间段的订单进行预测, 最终得到订单数据分布图。

1 相关工作

近年来, 为更好地解决出租车空载率高、出租车司机寻客难等问题, 研究人员进行了相关研究。文献[7]利用出租车轨迹数据学习乘客上下车行为特点, 为出租车司机和乘客设计推荐系统, 建立利润概率模型表示乘客位置与出租车到达时间, 出租车司机根据该模型输出结果选择乘客与运送路线。文献[8]基于出租车GPS轨迹数据, 通过分析城市热点区域和乘客出行规律创建Taxi-RS系统为出租车司机推荐寻客路线。文献[9]对遗传算法进行改进, 提出一种三阶段方法解决出租车停靠站选址问题, 利用地理信息系统平台从出租车全球定位系统数据中收集出租车需求热点, 从而确定出租车停靠站最佳区域, 再根据出租车需求与出租车停靠站之间的空间互动关系得到需求分段, 并沿道路两侧生成候选停靠站, 建立出租汽车站场选址模型, 使乘客出行成本与出租汽车站建设成本最小。该方法可有效解决出租车停靠不合理导致其利用率低的问题, 也有利于城市交通规划建设。文献[10]利用GPS轨迹数据研究出租车载客信息并提出对出租车可能停靠位置进行定位的探测算法, 可有效帮助出租车调度系统更合理地为乘客安排距离最近的车辆。文献[11]设置乘客出行频率、出租车需求热点以及出租车里程等重要指标, 通过对大量出租车历史运行轨迹的分析提出营运策略, 使出租车利润最大化。文献[12]通过分析大量出租车历史运行轨迹数据, 为出租车提供更好的客源寻找策略。

随着智慧交通的不断发展, 研究人员提出更加精细化的聚类方法对城市热点区域进行划分。文献[13]利用长短期记忆(Long Short-Term Memory, LSTM)网络对未来订单的需求值与近时间点之间的相关性进行时间建模, 即使用局部卷积神经网络(Convolutional Neural Networks, CNN)对局部空间之间的相关性建模, 并对共享相似时间模式区域之间的相关性建模, 最终提出基于深度多视角时空网络(Deep Multi-View Spatial-Temporal Network, DMVST-Net)的时空关系模型, 基于大量出租车实际需求数据的实验结果表明, DMVST-Net模型在预测网约车的需求任务中优于现有的其他方法。文献[14]采用出租车历s史运行轨迹数据设计基于机器学习的智能出租车预测系统, 利用回声状态网络算法预测出租车出行目的地并使用随机森林算法预测抵达时间, 从而更合理地调度出租车资源, 有效减少资源浪费。文献[15]提出结合遗传算法和短期交通预测策略的GACE方法, 可有效预测美国加利福尼亚州高速公路的交通拥堵情况。为预测短期交通流量, 文献[16]提出集成粒子群算法与人工神经网络的创新算法, 可及时提供交通流预测信息, 减少交通拥堵并提高运输流动性。文献[17]提出用于预测交通流状况的算法, 将贝叶斯组合模型与经典单时间序列模型的短期交通预测性能进行对比, 线性回归组合模型较贝叶斯组合模型预测结果更准确。文献[18]提出基于时空相关性的Conv-GRU方法, 使用卷积-门控循环单元提取交通流量的空间和时间特征, 利用双向门控循环单元获取交通流周期性特征, 融合上述特征得到短时交通流量预测值[19]。文献[20]提出一种序列学习模型, 基于LSTM网络由存储于某区域的出租车历史运行信息预测该区域在未来某时间段的出租车需求量。

2 模型建立与分析 2.1 相关定义

定义1 (区域)  区域是基于真实地图划分的栅格区域, 通常根据经度和纬度范围将中心城区分为多个栅格。例如, 将中国成都的城市区域分为24×24个栅格区域, 每个栅格大小为1 km×1 km, 如图 1所示; 美国纽约的城市区域分为16×8个栅格区域, 每个栅格大小为1 km×1 km。

Download:
图 1 栅格区域示例 Fig. 1 Example of grid area

定义2 (起点和终点)   起点和终点(Origin and Destination, OD), 用于描述城市交通中一定时间范围内所有出行起点和终点之间的出行交通量。OD数据主要反映居民从一个区域到另一个区域的动态迁移状况, 在一定程度上体现了居民的出行情况。图 2为居民从O点到D点的出行轨迹点, 轨迹点外部的网格为栅格区域, OD表示忽略中间轨迹点只保留起点和终点, 起点O所在的栅格区域内有一个出租车订单。

Download:
图 2 居民的出行轨迹 Fig. 2 Travel trajectory of resident

定义3 (出租车订单预测)  出租车订单预测是根据t时刻之前的出租车订单数据对tt或者t+xΔt时刻订单数量的预测, 其中, Δt为时间间隔, x=1, 2, …, n。订单预测旨在估计给定区域和时间间隔的出租车订单数量。出租车运营状态分为空载状态和载客状态, 在载客状态中, 以出租车在特定区域所接到的订单数量为研究对象, 即订单行程起止点分别为O点和D点, 主要研究O点所在区域内出租车接到的总订单数。出租车从接到乘客(上车)到将乘客送达目的地(下车)表示一次订单完成, 即乘客完成从O点到D点的迁移。

2.2 模型框架

将城市用栅格划分为m×n的矩阵, 每隔一定时间经过计算得到一张出租车订单图像, 利用卷积神经网络提取订单图像数据的空间依赖特征进行订单预测。

2.2.1 基于VGG网络的特征提取

交通系统是一种复杂、动态且高度相关的网络[21-22], 采用传统人工神经网络[23-25]和时间序列方法[26-28]难以提取图像空间依赖特征[29-30], 而利用卷积神经网络可有效提取该特征[31-33]。本文将出租车订单数据通过区域划分和计算转换为订单图像, 如图 3所示, 其像素值相当于空间区域的订单数量, 栅格区域内数值代表出租车订单数量。出租车在某区域接到订单后将乘客送达目的地, 由于其在目的地及其附近区域再次接到订单的可能性较大, 因此利用CNN提取该空间依赖特征。在图 3中, 每个方格代表真实的地图栅格, 通过经度和纬度范围控制地图栅格范围, 其中标注21数值的区域表示该时间段有21个订单, 下一个时间段该区域的订单很有可能来自相邻区域或者其他区域的出租车, 利用CNN局部感知视野可有效提取出租车的空间流动模式与空间依赖特征。

Download:
图 3 出租车订单图像 Fig. 3 Image of taxi order

在卷积神经网络中, 假设二维图像I为输入, K为二维卷积内核, S为输出, 则所输入图像的互相关表达式如下:

$ \begin{array}{*{20}{l}} {S(i,j) = (I * K)(i,j) = }\\ {{\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} \sum\limits_m {\sum\limits_n I } (m,n)K(i - m,j - n)} \end{array} $ (1)

在卷积神经网络中实现的互相关如式(1)所示, 互相关与卷积类似, 卷积需将卷积核翻转后再进行点乘, 而互相关与卷积运算方式基本一致, 但是未对核进行翻转。卷积表达式如下:

$ \begin{array}{*{20}{l}} {S(i,j) = (K * I)(i,j) = }\\ {{\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} \sum\limits_m {\sum\limits_n I } (i - m,j - n)K(m,n)} \end{array} $ (2)

与传统的手动提取特征相比, 卷积神经网络可自动有效地提取图像特征, 因此被广泛用于图像分类、分割及目标检测等多个领域, 特别是全图分类方面[27-28, 31]

VGG网络[34]使用非常小的3×3卷积核增加网络深度, 仅需少量几次迭代就能实现模型收敛, 因其具有良好的拟合性能, 在图片分类中常被用来提取图像特征。本文采用VGG网络的主要结构, 在订单图像中运用卷积层和池化层来提取特征。

1) 卷积层。假设第k层为卷积层, 第k-1层为池化层或者输入层, 则第k层卷积的计算公式如下:

$ x_j^k = f\left( {\sum\limits_{i \in {M_j}} {x_i^{k - 1}} \times K_{ij}^k + b_j^k} \right) $ (3)

其中, xjk为第k层第j个特征图, xik-1为第k-1层所有关联的特征图, Kijk表示第k层第j个卷积核, bjk为偏置参数。

2) 池化层。假设第k层为池化层, 第k-1层为卷积层或者输入层, 则第k层池化的计算公式如下:

$ x_j^k = f(\beta _j^k {\rm{down}} (x_j^{k - 1}) + b_j^k) $ (4)

其中, down()为下采样函数, β为权重参数。

由于VGG网络中模型参数主要集中在全连接层, 导致网络参数增加且网络训练速度变慢, 因此本文模型去掉全连接层, 采用VGG网络主要结构提取特征, 包括6个3×3的卷积层和3个池化层。经过卷积层处理后输出特征图与输入特征图像在空间维度上保持一致, 每次池化后特征图大小缩减一半。此外, 1个5×5的卷积核可用2个3×3的卷积核近似代替, 1个7×7的卷积核可用3个3×3的卷积核近似代替, 上述近似替代可增加非线性变换, 从而提高网络深度及判别函数的识别能力并减少参数量。

2.2.2 FCN网络重构

全卷积网络可用于图像的语义分割。本文采用FCN网络的上采样结构, 对卷积处理后的图像分别进行8倍、16倍、32倍的上采样。其中, 32倍上采样图像只能实现基本还原, 需要16倍和8倍上采样补充图像细节, 8倍上采样图像较原始图像更模糊和平滑。由于本文中图像的像素值表示出租车收到的订单数量, 而原始图像较粗糙, 因此重构图像不需补充细节。图像上采样主要利用反卷积操作实现, 反卷积在反卷积核特征图的作用下通过反池化使稀疏的特征图变得密集, 这是将特征图还原至原像素空间的过程[30]

传统卷积和反卷积分别如式(5)和式(6)所示:

$ {F = X \otimes Y} $ (5)
$ {X = F \otimes Y} $ (6)

其中, X为原图像, Y为卷积核, F为卷积后的特征图。

本文卷积和反卷积分别如式(7)和式(8)所示:

$ {F = {X_t} \otimes Y} $ (7)
$ {{X_{t + 1}} = F \otimes Y} $ (8)

其中, Xtt时间段出租车订单图像, Xt+1t+1时间段出租车订单图像。将出租车订单数据转换为时间序列图像, 利用t时刻的订单图像重构出t+1时间段的订单图像, 即利用反向传播调整卷积核和反卷积、激活函数等权重, 重构出租车订单数据的具体分布, 以预测下一个时间间隔内多区域的订单图像。

反卷积层对最后一个卷积层的特征图进行上采样, 使其恢复到与输入图像相同的尺寸, 从而对每个像素进行预测, 并保留原始输入图像的空间信息。传统上采样重构图像是恢复原始图像像素结构, 而本文是重构下一个时间段订单图像, 即预测下一个时间段订单信息, 最终输出含有订单信息的图像。

2.2.3 融合模型预测

本文VGG-FCN融合模型结构如图 4所示, 采用VGG网络对大小为24×24的原始图像进行卷积和池化操作后得到抽象的特征图, 多次重复该操作可得到更抽象的特征图, 再经过多层反卷积重构出预测图像, 从而获得各地区出租车订单预测结果。

Download:
图 4 VGG-FCN融合模型结构 Fig. 4 Structure of VGG-FCN fusion model

传统VGG和FCN模型主要用于图像分类与分割, 而本文所提VGG-FCN融合模型用于回归预测, 输入和输出均为相同尺寸的图像。本文采用VGG结构中卷积层、池化层、BN批量标准化结构、ReLU函数以及FCN结构中上采样重构结构(VGG和FCN均不含全连接结构)。

将出租车订单数据进行地理栅格划分, 每隔一段时间根据订单数据计算得到一张订单数据图像并将其按时间顺序排列。采用VGG提取图像特征并生成多张特征图, 接入反卷积层进行2倍、4倍、8倍的上采样重构。重构图像表示为:

$ y = x \otimes K $ (9)

其中, y为重构图像, x为原始图像, ⊗为反卷积操作, K为反卷积核。

代价函数表达式为:

$ \hat y = \mathop {{\rm{ arg}}{\kern 1pt} {\rm{min }}}\limits_{{y_{\Delta t}}} {\left\| {{y_{\Delta t + t}} - {y_{\Delta t}} \otimes k} \right\|^2} $ (10)

其中, 数据项‖yΔt+tyΔtk2表示时间间隔Δt内订单图像和Δt+t时刻图像的差别, $\hat y $表示重构Δt-t时刻的订单预测图像。

3 实验与结果分析 3.1 数据集

本文实验环境为Tesla P4 2核8 GB机器, 采用图形处理器(Graphics Processing Unit, GPU)对本文提出的模型进行训练。使用TaxiCD、BikeNYC1和BikeNYC2共3组不同的数据集。其中, TaxiCD数据集是2014年8月1日至8月30日中国成都市14 000辆出租车GPS轨迹数据, 该数据集包含10亿个GPS点(车辆行驶轨迹每隔10 s~每隔60 s有1个GPS点)信息, GPS点信息包含出租车所在位置的经度、纬度、每个GPS点返回的时间以及出租车载客状态, 其中1代表已载客, 0代表无载客。根据区域和出租车订单预测定义处理数据得到出租车订单图像。将该数据集中最后2天的数据作为测试集, 其他数据作为训练集。

BikeNYC1数据集和BikeNYC2数据集是从纽约市共享自行车系统获取的行程持续时间、行程开始和结束站点ID以及行程开始和结束时间等行程数据。其中, BikeNYC1数据集是2015年4月1日至8月31日纽约共享自行车GPS轨迹数据, BikeNYC2是2016年3月1日至2016年7月31日纽约共享自行车GPS轨迹数据。自行车虽然流动性不如出租车, 但是其同样具备GPS轨迹特性和订单接收系统, 以开锁骑车作为订单开始, 以到达目的地锁车作为订单结束, 因此可用自行车订单数据模拟出租车订单数据, 乘客开锁使用自行车相当于出租车接收乘客, 乘客骑自行车到目的地后锁车相当于出租车运送乘客到达目的地。在BikeNYC1数据集和BikeNYC2数据集中, 以最后10天的数据作为测试集, 其他数据作为训练集。TaxiCD、BikeNYC1和BikeNYC2数据集的具体信息如表 1所示。

下载CSV 表 1 3种数据集的具体信息 Table 1 Specific information of three datasets
3.2 实验模型

本文选择4种模型与本文VGG+FCN融合模型进行对比, 以下对这5种模型进行介绍。

1) BP(Back Propagation)模型。BP模型是采用误差逆向传播算法训练的多层前馈神经网络模型, 划分地图栅格区域个数为24×24, 共576个区域, 将24×24区域中的订单数据转换为24×24的矩阵, 可将该矩阵转换为一维向量进行预测。

2) RBF(Radial Basis Function)模型。RBF模型是一种径向基神经网络模型。

3) CNN模型。利用CNN提取图像特征, 再接入全连接层进行预测。

4) SARIMA(Seasonal Autoregressive Integrated Moving Average)模型。SARIMA模型是一种季节性差分自回归滑动平均模型, 可用于时间序列预测分析。通过SARIMA对每个预测区域建立一个预测模型。

5) VGG+FCN融合模型。该模型采用VGG主要结构提取特征, 并选用FCN的上采样结构通过反卷积重构下一个阶段的预测图像。

3.3 评价指标

本文以平均准确率(ACC)和均方根误差(Root Mean Square Error, RMSE)作为订单预测评价指标, 计算公式如下:

$ {{\rm{ACC}} = \frac{{{\rm{MAE}}}}{{{\rm{ Average }}}}} $ (11)
$ {{\rm{MAE}} = \frac{1}{n}\sum\limits_{i = 1}^n {\sum\limits_{j = 1}^C | } (f_i^j - y_i^j)|} $ (12)
$ {{\rm{ Average }} = \frac{1}{n}\sum\limits_{j = 1}^n {\sum\limits_{i = 1}^C {y_i^j} } } $ (13)
$ {{\rm{RMSE}} = \sqrt {\frac{1}{n}\sum\limits_{j = 1}^n {\sum\limits_{i = 1}^C {{{(f_i^j - y_i^j)}^2}} } } } $ (14)

其中, fi为预测值, yi为真实值, Average为样本中每个区域的平均订单数, n为预测区域的数量。

3.4 结果分析

将BP、RBF、CNN、SARIMA模型与本文VGG+FCN融合模型在TaxiCD数据集上的预测误差进行对比, 结果如表 2所示。可以看出, VGG+FCN融合模型的ACC值达到0.835 9, RMSE为8.13, 比其他模型的ACC值更高且RMSE值更低。这是因为本文VGG-FCN模型提取了空间区域的依赖特征, 且未接入全连接层, 模型训练时间较短、参数较少。

下载CSV 表 2 5种模型在TaxiCD数据集上的实验结果 Table 2 Experimental results of five models on TaxiCD dataset

将BP、RBF、CNN、SARIMA模型与本文VGG+FCN融合模型在BikeNYC1和BikeNYC2数据集上的预测结果进行对比, 结果如表 3所示。可以看出:在这两种数据集上, BP和RBF模型误差较大, 说明人工神经网络很难拟合实际交通中出租车的动态情况; SARIMA模型作为经典的时间序列模型, 能捕捉到周期性变化, 但是由于其为线性, 因此模型拟合效果较差; VGG+FCN融合模型所得ACC值和RMSE值更优, 这是因为该模型获取车辆在城市空间流动的局部相关依赖关系(例如出租车在一个区域的订单数量可能与其周围区域订单数量正相关), 采用VGG结构提取特征来增加网络深度, 提高非线性变化以更好地拟合网络, 同时利用反卷积重构图像减少模型参数, 得到订单图像并利用CNN进行预测, 最后接入全连接层得到与区域相等的一维向量。如果模型太复杂, 则所需计算的资源较大且消耗时间较多, 不能很好地支持计算开销, 无法满足出租车订单预测的实效性要求。VGG+FCN融合模型训练时无全连接层, 无需大量计算开销, 因此支持在线实时预测。

下载CSV 表 3 5种模型在BikeNYC1 and BikeNYC2数据集上的实验结果 Table 3 Experimental results of five models on BikeNYC1 and BikeNYC2 datasets

图 5为VGG-FCN融合模型的订单图像, 该图像是模型对2014年8月1日至8月30日成都主城区出租车轨迹数据进行学习后, 预测未来时间段订单所得, 反映了实时预测的出租车订单情况。可以看出, 一天内出租车订单数量是动态变化的, 由于中心城区(图像中心处深色密集区域)人流量较大, 因此订单数量较多。此外, 个别地区订单量也较大, 这是因为居民日常出行具有规律性和目的性。例如, 在某一个栅格区域订单数很多, 是因为该栅格区域有特定的或者较多的医院或学校。在城市交通中, 出租车作为短时灵活的交通工具, 由于其通常在0.5 h内都会将乘客送达目的地并开始继续寻客, 因此图 5中间隔0.5 h的时间划分较符合出租车实际行驶情况, 如果将时间段划分过大, 则不具有实际预测意义。

Download:
图 5 VGG-FCN融合模型的订单图像 Fig. 5 Order image of VGG-FCN fusion model
4 结束语

本文提出一种VGG-FCN融合模型预测出租车订单数据。采用VGG提取不同区域出租车行驶特征, 利用FCN上采样重构下一个时间段出租车订单图像, 从而快速预测多个区域及不同时间段的出租车订单分布情况。此外, 在保留VGG和FCN主要网络结构的同时去除全连接结构, 减少模型参数量, 加快网络训练速度。实验结果表明, 与BP、RBF等预测模型相比, 该融合模型预测结果平均准确率更高, 适用于出租车订单预测以及采用图像输入与输出的回归预测。后续将结合天气、节假日、兴趣点等影响居民出行的因素进行研究, 进一步提高订单预测准确率。

参考文献
[1]
ZHANG Ningyu, CHEN Huajun, CHEN Xi, et al. Semantic framework of Internet of things for smart cities:case studies[J]. Sensors, 2016, 16(9): 1501-1514.
[2]
GUO Jifu, SUN Mingzheng, WANG Ting, et al. Transportation development and congestion mitigation measures of Beijing, China[J]. Mitigation and Adaptation Strategies for Global Change, 2015, 20(5): 651-663.
[3]
LIU Li, ZHANG Feng, DU Zhenhong, et al. Research on high efficiency passenger seeking strategy based on taxi trajectory data in Shenzhen[J]. Journal of Zhejiang University(Natural Science Edition), 2018, 63(1): 82-91. (in Chinese)
刘丽, 张丰, 杜震洪, 等. 基于深圳市出租车轨迹数据的高效益寻客策略研究[J]. 浙江大学学报(理学版), 2018, 63(1): 82-91.
[4]
RASMUSSEN T K, INGVARDSON J B, HALLDÓRSDÓTTIR K, et al. Improved methods to deduct trip legs and mode from travel surveys using wearable GPS devices:a case study from the Greater Copenhagen area[J]. Computers, Environment and Urban Systems, 2015, 54(11): 301-313.
[5]
ASHBROOK D, STARNER T. Using GPS to learn significant locations and predict movement across multiple users[J]. Personal and Ubiquitous Computing, 2003, 7(5): 275-286.
[6]
CAO Yi, TAO Hongyu, LUO Xia. Forecasting model of city vacant taxis trip distribution under information condition[J]. Computer Engineering, 2016, 42(2): 62-65. (in Chinese)
曹祎, 陶竑宇, 罗霞. 信息条件下城市空驶出租车出行分布预测模型[J]. 计算机工程, 2016, 42(2): 62-65.
[7]
YUAN Jing, ZHENG Yu, ZHANG Liuhuang, et al. T-finder:a recommender system for finding passengers and vacant taxis[J]. IEEE Transactions on Knowledge and Data Engineering, 2013, 25(10): 2390-2403.
[8]
XU Xiujuan, ZHOU Jianyu, LIU Yu, et al. Taxi-RS:taxi-hunting recommendation system based on taxi GPS data[J]. IEEE Transactions on Intelligent Transportation Systems, 2015, 16(4): 1716-1727.
[9]
QU Zhaowei, WANG Xin, SONG Xianmin, et al. Location optimization for urban taxi stands based on taxi GPS trajectory big data[J]. IEEE Access, 2019, 7(5): 62273-62283.
[10]
YUAN Jing, ZHENG Yu, XIE Xing, et al.Driving with knowledge from the physical world[C]//Proceedings of the 17th ACM SIGKDD International Conference on Knowledge Discovery and Data Mining.New York, USA: ACM Press, 2011: 316-324.
[11]
RONG Huigui, WANG Zepeng, ZHENG Hui, et al. Mining efficient taxi operation strategies from large scale geo-location data[J]. IEEE Access, 2017, 5(7): 25623-25634.
[12]
LI Bin, ZHANG Daqing, SUN Lin, et al.Discovering passenger-finding strategies from a large-scale real-world taxi dataset[C]//Proceedings of 2011 IEEE International Conference on Pervasive Computing and Communications Workshops.Washington D.C., USA: IEEE Press, 2011: 63-68.
[13]
YAO Huaxiu, WU Fei, KE Jintao, et al.Deep multi-view spatial-temporal network for taxi demand prediction[EB/OL].[2019-08-08].https://www.researchgate.net/publication/323410816_Deep_Multi-View_Spatial-Temporal_Network_for_Taxi_Demand_Prediction.
[14]
YE Feng, OUYANG Zhichao, CHEN Weibiao, et al. Intelligent taxi forecasting system based on machine learning[J]. Computer Systems and Applications, 2018, 27(9): 61-67. (in Chinese)
叶锋, 欧阳智超, 陈威彪, 等. 基于机器学习的智能出租车预测系统[J]. 计算机系统应用, 2018, 27(9): 61-67.
[15]
LOPEZ G P, ONIEVA E, OSABA E, et al. A hybrid method for short-term traffic congestion forecasting using genetic algorithms and cross entropy[J]. IEEE Transactions on Intelligent Transportation Systems, 2016, 17(2): 557-569.
[16]
CHAN K Y, DILLON T, CHANG E, et al. Prediction of short-term traffic variables using intelligent swarm-based neural networks[J]. IEEE Transactions on Control Systems Technology, 2013, 21(1): 263-274.
[17]
TSELENTIS D I, KARLAFTIS M G, VLAHOGIANNI E I. Improving short-term traffic forecasts:to combine models or not to combine?[J]. IET Intelligent Transport Systems, 2015, 9(2): 193-201.
[18]
YAN Yang, SUN Lijun, ZHU Lanting. Short-term traffic flow prediction method based on spatiotemporal relativity[J]. Computer Engineering, 2020, 46(1): 31-37. (in Chinese)
闫杨, 孙丽珺, 朱兰婷. 基于时空相关性的短时交通流量预测方法[J]. 计算机工程, 2020, 46(1): 31-37.
[19]
LI Yunxuan, LU Jian, ZHANG Lin, et al. Taxi booking mobile App order demand prediction based on short-term traffic forecasting[J]. Journal of the Transportation Research Board, 2017, 2634(1): 57-68.
[20]
XU J, RAHMATIZADEH R, BOLONI L, et al. Real-time prediction of taxi demand using recurrent neural networks[J]. IEEE Transactions on Intelligent Transportation Systems, 2018, 19(8): 2572-2581.
[21]
HINTON G E. Reducing the dimensionality of data with neural networks[J]. Science, 2006, 313(5786): 504-507.
[22]
RUMELHART D E, HINTON G E, WILLIAMS R J.Learning representations by back-propagating errors[EB/OL].[2019-08-08].https://www.nature.com/articles/323533a0.
[23]
FENG Jin, SUN Shiliang.Neural network multitask learning for traffic flow forecasting[EB/OL].[2019-08-08].https://www.researchgate.net/publication/322075709_Neural_Network_Multitask_Learning_for_Traffic_Flow_Forecasting.
[24]
DOUGHERTY M. A review of neural networks applied to transport[J]. Emerging Technologies, 1995, 3(4): 247-260.
[25]
KUMAR K, PARIDA M, KATIYAR V K. Short term traffic flow prediction for a non urban highway using artificial neural network[J]. Procedia-Social and Behavioral Sciences, 2013, 104(12): 755-764.
[26]
MOORTHY C K, RATCLIFFE B G. Short term traffic forecasting using time series methods[J]. Transportation Planning and Technology, 1988, 12(1): 45-56.
[27]
THOMAS T, WEIJERMARS W, VAN BERKUM E. Predictions of urban volumes in single time series[J]. IEEE Transactions on Intelligent Transportation Systems, 2010, 11(1): 71-80.
[28]
VAN D V M, DOUGHERTY M, WATSON S. Combining kohonen maps with ARIMA time series models to forecast traffic flow[J]. Emerging Technologies, 1996, 4(5): 307-318.
[29]
YAN Zhen, YU Chongchong, HAN Lu, et al. Short-term traffic flow forecasting method based on CNN+LSTM[J]. Computer Engineering and Design, 2019, 40(9): 2620-2624. (in Chinese)
晏臻, 于重重, 韩璐, 等. 基于CNN+LSTM的短时交通流量预测方法[J]. 计算机工程与设计, 2019, 40(9): 2620-2624.
[30]
WILLIAMS B M. Multivariate vehicular traffic flow prediction:evaluation of ARIMAX modeling[J]. Journal of the Transportation Research Board, 2001, 1776(1): 194-200.
[31]
LECUN Y, BOTTOU L, BENGIO Y, et al. Gradient-based learning applied to document recognition[J]. Proceedings of the IEEE, 1998, 86(11): 2278-2324.
[32]
TIGHE J, LAZEBNIK S.Finding things: image parsing with regions and per-exemplar detectors[C]//Proceedings of CVPR'13.Washington D.C., USA: IEEE Press, 2013: 3001-3008.
[33]
TOMPSON J, JAIN A, LECUN Y, et al.Joint training of a convolutional network and a graphical model for human pose estimation[EB/OL].[2019-08-08].http://www.oalib.com/paper/4082161#.X59gnlN_n3Q.
[34]
SIMONYAN K, ZISSERMAN A.Very deep convolutional networks for large-scale image recognition[EB/OL].[2019-08-08].http://www.oalib.com/paper/4068791.