2. 南通大学 交通与土木工程学院, 江苏 南通 226019
2. School of Transportation and Civil Engineering, Nantong University, Nantong, Jiangsu 226019, China
开放科学(资源服务)标志码(OSID):
随着我国城市化建设加快,车辆保有率逐步上升,城市交通拥堵问题日益严峻,同时导致空气污染加剧。智能交通系统(Intelligent Transportation System,ITS)将先进的科学技术有效地综合应用于交通运输中,有利于加强车辆、道路和出行者的联系,提高交通资源分配和调度的合理性[1]。
交通参数预测是ITS的重要组成部分,现有研究主要集中于如何根据历史和实时数据预测交通流下一时刻状态,如流量、速度、密度等。城市路网交通速度预测可以为出行者提供实时的交通信息,对提升道路通行能力具有重要意义。通常,有效的城市路网交通速度预测重在捕捉交通系统内部的时空变化特征。神经网络因其优异的性能被广泛地应用于求解交通参数预测问题中[2]。当前常用的神经网络主要包括卷积神经网络[3](Convolutional Neural Network,CNN)、循环神经网络[4](Recurrent Neural Network,RNN)、图卷积网络[5](Graph Convolutional Network,GCN)等。然而,交通状态具有非常复杂的非线性、随机性等特征[6],单一的神经网络模型并不能获得较好的预测性能,因此,当前的研究方向已逐步向混合神经网络模型发展[7]。文献[8]提出的注意力图卷积序列模型,利用GCN和注意力机制分别对空间依赖性和时间依赖性进行建模。文献[9]结合长短时记忆网络和注意力机制构建混合模型框架。文献[10]利用卷积门控循环单元(Gated Recurrent Unit,GRU)进行空间特征提取,结合双向GRU对时间依赖性进行分析,从而有效地对交通流量进行预测。文献[11]堆叠CNN和长短时记忆网络挖掘交通数据的时空特性,取得了良好的预测效果。此外,大量研究表明,混合神经网络模型能够更充分地挖掘时空特征,预测性能更好[12-13]。
图卷积网络是图神经网络的一个重要分支[14],目前已较好地应用于路网交通预测中[15]。文献[16-17]将路网拓扑结构表示为0-1邻接矩阵,利用GCN对城市路网空间相关性进行分析,再结合长短时记忆网络等分析交通流的时间相关性。然而,上述方法对于空间特征的挖掘并不充分,传统的图卷积传播规则依赖于路网的实际拓扑结构,并未考虑到相邻路段间不同的空间影响程度。针对这一缺陷,已有多种解决方法。文献[18]利用相关性分析方法,根据路段的连通性构建邻接矩阵。文献[19]利用softmax函数重构0-1矩阵,对每个非0元素赋予变量值,通过迭代训练得到最优邻接矩阵。这些方法都从一定程度上加强了模型对一阶相邻路段间空间关联程度的挖掘,但是时空特征不受道路连通性的限制,非一阶相邻道路的交通流之间也存在相互影响性[20]。在部分非一阶相邻路段关联度大于部分一阶相邻路段关联度的情况下,如果仍输入原始的邻接矩阵,会遗失一些相对重要的路段空间信息,无法得到较好的预测结果。
为更好地挖掘城市路网的交通特性,本文提出一种基于全局时空特性的速度预测模型G-GCGRU。利用全局图卷积网络进行空间特征分析,构造路网有向带权的内部空间关系,解决非一阶高度关联路段信息缺失的问题,充分挖掘交通流的空间特征。同时,通过GRU分析数据的时间依赖性以挖掘其时间特征。在此基础上,选用深圳市罗湖区城市路网车辆速度数据对模型进行验证。
1 模型建立与求解 1.1 时空矩阵构建为充分挖掘交通流的时空特征,建立时空矩阵作为模型的输入。利用待研究路网中交通流参数的全量特征数据构造时空矩阵,矩阵中的每一列表示为路网中的一个路段,行表示为每个路段一个时间片的特征值,以此构成路网的时空矩阵,其结构如下:
$ {\boldsymbol {X}}_{T}^{R}=\left[\begin{array}{cccc}{\boldsymbol {x}}_{1}^{1}& {\boldsymbol {x}}_{1}^{2}& \cdots & {\boldsymbol {x}}_{1}^{r}\\ {\boldsymbol {x}}_{2}^{1}& {\boldsymbol {x}}_{2}^{2}& \cdots & {\boldsymbol {x}}_{2}^{r}\\ ⋮& ⋮& & ⋮\\ {\boldsymbol {x}}_{t}^{1}& {\boldsymbol {x}}_{t}^{2}& \cdots & {\boldsymbol {x}}_{t}^{r}\end{array}\right] $ | (1) |
其中:
![]() |
下载CSV 表 1 符号定义 Table 1 Symbols definition |
对交通流的空间特征和时间特征分别进行分析,构建预测模型。模型结构主要包含三部分,如图 1所示。第一部分为全局图卷积网络模块,利用全量特征数据进行相关性分析,计算关联度矩阵,将关联度矩阵和指定时间步长的时空矩阵输入图卷积网络中,提取交通流数据全局空间特征;第二部分为门控循环单元模块,将第一部分的输出值输入GRU网络中,进一步分析数据的时间特性;第三部分为预测模块,利用GRU网络最后时刻的输出,通过Dense层控制需要预测的时间步长并计算得到模型最后的预测结果,以此建立G-GCGRU的网络结构。
![]() |
Download:
|
图 1 G-GCGRU网络结构 Fig. 1 Network structure of G-GCGRU |
城市路网的结构特征类似于图的拓扑结构。GCN是当前处理图结构等非欧式数据比较流行的神经网络。将路网拓扑结构表示为无向图
$ \boldsymbol {{H}}^{(l+1)}=\sigma \left(\widehat{\boldsymbol {A}}{\boldsymbol {H}}^{\left(l\right)}{\boldsymbol {W}}^{\left(l\right)}\right) $ | (2) |
其中:
GCN通过邻接矩阵对实际路网的空间结构进行显式表征,利用
对于任意2条路段
$ {\boldsymbol {C}}_{ij}=\frac{\sum\limits_{t=1}^{T}({x}_{t}^{i}-{\stackrel{-}{\boldsymbol {X}}}_{i})({x}_{t}^{j}-{\stackrel{-}{\boldsymbol {X}}}_{j})}{\sqrt{\sum\limits_{t=1}^{T}({x}_{t}^{i}-{\stackrel{-}{\boldsymbol {X}}}_{i}{)}^{2}}\sqrt{\sum\limits_{t=1}^{T}({x}_{t}^{j}-{\stackrel{-}{\boldsymbol {X}}}_{j}{)}^{2}}} $ | (3) |
其中:
关联度矩阵描述的路段节点关系为一张有向带权图,节点之间的连接表示影响权重,方向代表影响关系。通过关联度矩阵聚合与节点自身关联度高的路段信息,进一步提高模型对空间特征的挖掘。因此,全局图卷积网络的规则更新为:
$ {\boldsymbol {H}}^{(l+1)}=\sigma \left(\boldsymbol {C}{\boldsymbol {H}}^{\left(l\right)}{\boldsymbol {W}}^{\left(l\right)}\right) $ | (4) |
将
$ \mathrm{G}\mathrm{g}\mathrm{c}\mathrm{n}({\boldsymbol {X}}_{P}^{R}, \boldsymbol {C})=\mathrm{R}\mathrm{e}\mathrm{L}\mathrm{u}(\boldsymbol {C}\cdot \mathrm{R}\mathrm{e}\mathrm{L}\mathrm{u}(\boldsymbol {C}{\boldsymbol {X}}_{P}^{R}{\boldsymbol {W}}^{\left(0\right)}\left){\boldsymbol {W}}^{\left(1\right)}\right) $ | (5) |
![]() |
Download:
|
图 2 全局图卷积网络传播规则 Fig. 2 Communication rule of G-GCN |
GRU能够有效避免RNN梯度消失和爆炸的问题,是处理时间序列预测问题的主流神经网络之一[22]。GRU网络包含三部分,即输入层、隐藏层和输出层,其核心算法在于隐藏层单元块中的计算过程,如图 3所示。
![]() |
Download:
|
图 3 门控循环单元模块 Fig. 3 Gated recurrent unit module |
针对某一时间片,GRU首先拼接上一时刻隐藏层的输出
将提取的空间特征值
$ {\boldsymbol {r}}_{t}=\sigma \left({\boldsymbol {W}}_{r}\right[\mathrm{G}\mathrm{g}\mathrm{c}\mathrm{n}({\boldsymbol {X}}_{P}^{R}, \boldsymbol {C}), {\boldsymbol {h}}_{t-1}]+{\boldsymbol {b}}_{r}) $ | (6) |
$ {\boldsymbol {z}}_{t}=\sigma \left({\boldsymbol {W}}_{z}\right[\mathrm{G}\mathrm{g}\mathrm{c}\mathrm{n}({\boldsymbol {X}}_{P}^{R}, \boldsymbol {C}), {\boldsymbol {h}}_{t-1}]+{\boldsymbol {b}}_{z}) $ | (7) |
$ {\tilde{\boldsymbol {h}}}_{t}=\mathrm{t}\mathrm{a}\mathrm{n}\mathrm{h}\left({\boldsymbol {W}}_{\tilde{h}}\right[\mathrm{G}\mathrm{g}\mathrm{c}\mathrm{n}({\boldsymbol {X}}_{P}^{R}, \boldsymbol {C}), \left({\boldsymbol {r}}_{t}\mathrm{*}{\boldsymbol {h}}_{t-1}\right)]+{\boldsymbol {b}}_{\tilde{h}}) $ | (8) |
$ {\boldsymbol {h}}_{t}={\boldsymbol {z}}_{t}\mathrm{*}{\boldsymbol {h}}_{t-1}+(1-{\boldsymbol {z}}_{t})\mathrm{*}{\tilde{\boldsymbol {h}}}_{t} $ | (9) |
获取GRU网络最后时刻的输出,输入Dense网络中,控制输出的时间步长得到最后的预测结果:
$ {\boldsymbol {y}}_{t+1}=\mathrm{D}\mathrm{e}\mathrm{n}\mathrm{s}\mathrm{e}\left({\boldsymbol {h}}_{t}\right) $ | (10) |
G-GCGRU模型的主要求解步骤如下:
步骤1 对有效交通数据进行归一化,将数值限定在[0, 1]之间,将数据集按照8∶2的比例拆分为训练集和测试集。
步骤2 设定模型结构及超参数,包括GRU隐藏层神经元数量、模型输入时间步长、输出步长、批数据大小、学习率、迭代次数、损失函数、优化方法等。
步骤3 选择合适的关联路段数量k,构造关联度矩阵,输入G-GCGRU模型中获取预测结果。对预测值与真实值进行对比,使用Adam优化器进行训练,满足迭代次数后训练结束。
步骤4 利用训练后的模型对测试集进行预测。
2 实验 2.1 实验设置实验设置具体如下:
1) 数据集。本文利用深圳市罗湖区2015年1月1日-2015年1月31日的路网数据进行分析。该数据集包含156条路段,以15 min聚合,共计2 976条车速数据。
2) 参数设置。设置单个路段的关联路段数量k,构造关联度矩阵输入模型。实验基于TensorFlow框架进行实现,主要参数设置如下:GRU维数为64;学习率为0.001;批大小为32;训练次数为3 000。
3) 评估指标。以均方根误差(Root Mean Square Error,RMSE)、平均绝对误差(Mean Absolute Error,MAE)和测定系数(Coefficient of Determination,
$ {R}_{\mathrm{R}\mathrm{M}\mathrm{S}\mathrm{E}}=\sqrt{\frac{1}{PR}\sum\limits_{p=1}^{P}\sum\limits_{r=1}^{R}({y}_{p}^{r}-{y}_{p}^{r\mathrm{\text{'}}}{)}^{2}} $ | (11) |
$ {M}_{\mathrm{M}\mathrm{A}\mathrm{E}}=\frac{1}{PR}\sum\limits_{p=1}^{P}\sum\limits_{r=1}^{R}|{y}_{p}^{r}-{y}_{p}^{r\mathrm{\text{'}}}| $ | (12) |
$ {R}_{{\mathrm{R}}^{2}}=1-\frac{\sum\limits_{p=1}^{P}\sum\limits_{r=1}^{R}({y}_{p}^{r}-{y}_{p}^{r\mathrm{\text{'}}}{)}^{2}}{\sum\limits_{p=1}^{P}\sum\limits_{r=1}^{R}({y}_{p}^{r}{-\stackrel{-}{y})}^{2}} $ | (13) |
其中:
G-GCGRU模型考虑全局路网中路段的空间关联性。利用路网路段车辆速度分析路段间的关联性,得到各路段间的相关性值,如图 4所示。图 4(a)为路网中相邻路段间的关联情况,图 4(b)为根据关联路段数量k计算出的高关联路段情况,颜色越深,关联度越高。可以看出,图 4(a)中的节点关联性明显弱于图 4(b),说明真实的拓扑结构对路网空间关联关系的表达并不充分。关联度矩阵通过重新构建路段间的相关性,深度分析高关联的路段并抛弃关联度低的路段信息,能够进一步提高模型捕获空间特征的能力。
![]() |
Download:
|
图 4 道路关联度矩阵对比 Fig. 4 Road correlation matrix comparison |
关联路段数量k是影响模型预测性能的一个重要因素。k与RMSE、MAE值的关系如图 5所示。从整体上看,随着k值的增大,模型误差呈下降趋势,说明多路段空间信息的聚合有利于提高模型对空间特征的挖掘能力。当k值为6时,模型误差达到最低,随后,k值增大,模型误差缓慢增长,这表明6为最佳关联路段数量,并且过多的k会引入额外的数据信息,影响模型的预测能力。
![]() |
Download:
|
图 5 关联路段数量分析 Fig. 5 Analysis of correlation road number |
为验证所提模型的有效性和优越性,选取GCN、GRU及GCN-GRU混合模型进行对比,结果如表 2所示。可以看出,在4种预测模型中,本文提出的G-GCGRU模型性能最优。
![]() |
下载CSV 表 2 模型性能对比 Table 2 Model performance comparison |
图 6为不同模型对路网中编号为102129路段一天数据的拟合曲线图,可以看出,本文提出的模型拟合效果相对较好。与GRU网络相比,GCN网络的预测效果明显不佳,说明时间特征是交通流较为关键的特征。与GRU、GCN相比,GCN-GRU模型预测精度有一定提升,表明混合网络模型同时兼顾了数据的时间和空间特征,进行了较为全面的特征挖掘。而与G-GCGRU相比,GCN-GRU模型性能略有下降,说明关联度矩阵对空间特征的卷积效果优于邻接矩阵,能够有效提高模型预测精度。
![]() |
Download:
|
图 6 4种模型的预测结果对比 Fig. 6 Prediction results comparison of four models |
为验证本文模型的多步预测能力,调整模型输出的时间步长及各参数进行验证,结果如图 7所示。可以看出,随着预测时间步长的增大,模型性能稍有下降。但是各时间步预测结果波动不大,表明本文模型性能对输出步长的改变相对并不敏感,能够有效预测未来长时间段的交通状态。
![]() |
Download:
|
图 7 多步预测结果 Fig. 7 Multi-step prediction result |
本文提出一种基于全局时空特性的城市路网交通速度预测模型G-GCGRU,利用皮尔逊相关系数分析挖掘交通流内部的空间关联性,通过图卷积网络卷积(GCN)提取交通流空间特征,再结合门控循环单元(GRU)分析交通流时间特征。利用真实的路网数据进行测试,实验结果表明,与GCN、GRU及GCN-GRU混合模型相比,G-GCGRU模型性能表现最好。在本文研究中,关联度矩阵通过相关性分析计算得到,后续将考虑利用参数法优化该矩阵,进一步提高模型性能。
[1] |
ZHU L, YU F R, WANG Y G, et al. Big data analytics in intelligent transportation systems: a survey[J]. IEEE Transactions on Intelligent Transportation Systems, 2019, 20(1): 383-398. DOI:10.1109/TITS.2018.2815678 |
[2] |
DO L N N, TAHERIFAR N, VU H L. Survey of neural network-based models for short-term traffic state prediction[J]. WIREs Data Mining and Knowledge Discovery, 2019, 9(1): 1285-1309. |
[3] |
JO D, YU B, JEON H, et al. Image-to-image learning to predict traffic speeds by considering area-wide spatio-temporal dependencies[J]. IEEE Transactions on Vehicular Technology, 2019, 68(2): 1188-1197. DOI:10.1109/TVT.2018.2885366 |
[4] |
MA X L, TAO Z M, WANG Y H, et al. Long short-term memory neural network for traffic speed prediction using remote microwave sensor data[J]. Transportation Research Part C: Emerging Technologies, 2015, 54: 187-197. DOI:10.1016/j.trc.2015.03.014 |
[5] |
GUO G, YUAN W. Short-term traffic speed forecasting based on graph attention temporal convolutional networks[J]. Neurocomputing, 2020, 410: 387-393. DOI:10.1016/j.neucom.2020.06.001 |
[6] |
沈琴琴, 王玥, 黄悦, 等. 改进初值的灰色Verhulst-Markov模型及其应用[J]. 统计与决策, 2020, 36(7): 30-33. SHEN Q Q, WANG Y, HUANG Y, et al. Grey verhulst-Markov model with improved initial value and its application[J]. Statistics & Decision, 2020, 36(7): 30-33. (in Chinese) |
[7] |
DE MEDRANO R, AZNARTE J L. A spatio-temporal attention-based spot-forecasting framework for urban traffic prediction[J]. Applied Soft Computing, 2020, 96: 1-15. |
[8] |
ZHANG Z C, LI M, LIN X, et al. Multistep speed prediction on traffic networks: a deep learning approach considering spatio-temporal dependencies[J]. Transportation Research Part C: Emerging Technologies, 2019, 105: 297-322. DOI:10.1016/j.trc.2019.05.039 |
[9] |
杜圣东, 李天瑞, 杨燕, 等. 一种基于序列到序列时空注意力学习的交通流预测模型[J]. 计算机研究与发展, 2020, 57(8): 1715-1728. DU S D, LI T R, YANG Y, et al. A sequence-to-sequence spatial-temporal attention learning model for urban traffic flow prediction[J]. Journal of Computer Research and Development, 2020, 57(8): 1715-1728. (in Chinese) |
[10] |
闫杨, 孙丽珺, 朱兰婷. 基于时空相关性的短时交通流量预测方法[J]. 计算机工程, 2020, 46(1): 31-37. YAN Y, SUN L J, ZHU L T. Short-term traffic flow prediction method based on spatiotemporal relativity[J]. Computer Engineering, 2020, 46(1): 31-37. (in Chinese) |
[11] |
BOGAERTS T, MASEGOSA A D, ANGARITA-ZAPATA J S, et al. A graph CNN-LSTM neural network for short and long-term traffic forecasting based on trajectory data[J]. Transportation Research Part C: Emerging Technologies, 2020, 112: 62-77. DOI:10.1016/j.trc.2020.01.010 |
[12] |
ZHANG K P, ZHENG L, LIU Z J, et al. A deep learning based multitask model for network-wide traffic speed prediction[J]. Neurocomputing, 2020, 396: 438-450. DOI:10.1016/j.neucom.2018.10.097 |
[13] |
YIN X, WU G, WEI J, et al. Multi-stage attention spatial-temporal graph networks for traffic prediction[J]. Neurocomputing, 2021, 428: 42-53. DOI:10.1016/j.neucom.2020.11.038 |
[14] |
徐冰冰, 岑科廷, 黄俊杰, 等. 图卷积神经网络综述[J]. 计算机学报, 2020, 43(5): 755-780. XU B B, CEN K T, HUANG J J, et al. A survey on graph convolutional neural network[J]. Chinese Journal of Computers, 2020, 43(5): 755-780. (in Chinese) |
[15] |
BOUKERCHE A, WANG J H. A performance modeling and analysis of a novel vehicular traffic flow prediction system using a hybrid machine learning-based model[J]. Ad Hoc Networks, 2020, 106: 1-10. |
[16] |
ZHAO L, SONG Y J, ZHANG C, et al. T-GCN: a temporal graph convolutional network for traffic prediction[J]. IEEE Transactions on Intelligent Transportation Systems, 2020, 21(9): 3848-3858. DOI:10.1109/TITS.2019.2935152 |
[17] |
CUI Z Y, HENRICKSON K, KE R M, et al. Traffic graph convolutional recurrent neural network: a deep learning framework for network-scale traffic learning and forecasting[J]. IEEE Transactions on Intelligent Transportation Systems, 2020, 21(11): 4883-4894. DOI:10.1109/TITS.2019.2950416 |
[18] |
陈喜群, 周凌霄, 曹震. 基于图卷积网络的路网短时交通流预测研究[J]. 交通运输系统工程与信息, 2020, 20(4): 49-55. CHEN X Q, ZHOU L X, CAO Z. Short-term network-wide traffic prediction based on graph convolutional network[J]. Journal of Transportation Systems Engineering and Information Technology, 2020, 20(4): 49-55. (in Chinese) |
[19] |
YU B, LEE Y J, SOHN K. Forecasting road traffic speeds by considering area-wide spatio-temporal dependencies based on a Graph Convolutional Neural network(GCN)[J]. Transportation Research Part C: Emerging Technologies, 2020, 114: 189-204. DOI:10.1016/j.trc.2020.02.013 |
[20] |
PAVLYUK D. Feature selection and extraction in spatiotemporal traffic forecasting: a systematic literature review[J]. European Transport Research Review, 2019, 11: 1-5. DOI:10.1186/s12544-018-0328-2 |
[21] |
ERMAGUN A, LEVINSON D. Spatiotemporal traffic forecasting: review and proposed directions[J]. Transport Reviews, 2018, 38(6): 786-814. DOI:10.1080/01441647.2018.1442887 |
[22] |
孔繁钰, 周愉峰, 陈纲. 基于时空特征挖掘的交通流量预测方法[J]. 计算机科学, 2019, 46(7): 322-326. KONG F Y, ZHOU Y F, CHEN G. Traffic flow prediction method based on spatio-temporal feature mining[J]. Computer Science, 2019, 46(7): 322-326. (in Chinese) |