基于时空信息融合学习的路段行程车速短时预测

引用本文

杨顶, 邓明君, 徐丽萍. 基于时空信息融合学习的路段行程车速短时预测[J]. 计算机工程, 2021, 47(12), 78-86. DOI: 10.19678/j.issn.1000-3428.0060164.

YANG Ding, DENG Mingjun, XU Liping. Short-Term Prediction of Road Travel Speed Based on Spatio-Temporal Information Fusion Learning[J]. Computer Engineering, 2021, 47(12), 78-86. DOI: 10.19678/j.issn.1000-3428.0060164.

基金项目

国家自然科学基金(51965021)；江西省自然科学基金(20142BAB201015)；江西省教育厅科研项目(CJJ160476)

作者简介

杨顶(1998-), 男, 硕士研究生, 主研方向为智能交通;
邓明君, 副教授、博士;
徐丽萍, 硕士研究生

文章历史

收稿日期：2020-12-01
修回日期：2021-01-13

Contents Abstract Full text Figures/Tables PDF

基于时空信息融合学习的路段行程车速短时预测

杨顶 , 邓明君 , 徐丽萍

华东交通大学交通运输与物流学院, 南昌 330013

收稿日期：2020-12-01；修回日期：2021-01-13

基金项目：国家自然科学基金(51965021)；江西省自然科学基金(20142BAB201015)；江西省教育厅科研项目(CJJ160476)

作者简介：杨顶(1998-), 男, 硕士研究生, 主研方向为智能交通; 邓明君, 副教授、博士; 徐丽萍, 硕士研究生.

E-mail: yangding17@163.com

摘要：路段行程车速的变化受时间和空间维度信息的综合影响，多数神经网络模型仅从时间维度上预测路段行程车速的变化规律，未能全面考虑路网结构和上下游交通状态对路段行程车速的影响。结合图卷积网络和门控循环单元构建深度学习模型，挖掘路段行程车速的时空特性。通过在线地图平台获取路段实时行程车速，使用等维递补方法更新历史序列数据，提高预测实时性。在深圳市部分区域路网上的实验结果表明，该模型的多步预测精度均在90%以上，相比自回归积分滑动平均模型、支持向量机回归模型和门控循环单元模型最高提升了6.9%、1.3%和0.4%，具有更优的路段行程车速预测效果。

Short-Term Prediction of Road Travel Speed Based on Spatio-Temporal Information Fusion Learning

YANG Ding , DENG Mingjun , XU Liping

School of Transportation and Logistics, East China Jiaotong University, Nanchang 330013, China

Abstract: The change of road travel speed in a certain road is affected by both temporal and spatial factors.Most of the existing neural network models predict the change of road travel speed by considering only the temporal factors, and ignore the impact of road network structure and upstream and downstream traffic.To address the problem, the spatio-temporal features of road travel speed are analyzed, and on this basis a deep learning model is constructed by combining the Graph Convolutional Network(GCN) and the Gated Recurrent Unit(GRU).The real-time road travel speed is obtained through the online map platform, and the historical sequence data is continuously updated by using the method of equal-dimensional recursive compensation, so the real-time performance of prediction is improved.The model is tested with the data of road networks in some regions of Shenzhen.The experimental results show that the proposed model exhibits excellent performance in predicting travel speed in a certain road section, and provides an accuracy of over 90% for multi-step prediction.Its prediction accuracy is up to 6.9% higher than that of the Auto-Regressive Integral Moving Average (ARIMA) model, 1.3% higher than that of the Support Vector Regression(SVR) model, and 0.4% higher than that of the GRU model.

开放科学(资源服务)标志码(OSID):

0 概述

精确实时的路段行程车速预测有利于出行者的路径规划和时间安排，减少高峰时段的拥堵^[1]，且可为制定交通管理策略提供技术支撑^[2]，但是路段行程车速的变化受路网结构影响，具有高度非线性、不确定性等特点^[3]，使得路段行程车速的精确实时预测面临较大困难。学者们关于提高路段行程车速的预测精度进行了大量研究，并主要建立了统计模型、参数模型、非参数模型等3种模型。统计模型根据数据的统计规律推断变化趋势，代表模型为历史平均(Historical Average，HA)模型^[4]，该模型计算简单快速，但不能很好地适应时间特征，预测精度较低。参数模型通过时间序列数据确定参数然后基于回归函数进行预测，常见的模型有自回归积分移动平均(Autoregressive Integral Moving Average，ARIMA)模型^[5-6]，该模型依赖于平稳性假设，不能有效反映路段行程车速的非线性和不确定性。非参数模型从历史数据中发现路段行程车速的变化规律，常见的模型有支持向量回归(Support Vector Regression，SVR)模型^[7]、贝叶斯网络模型^[8]等，它们能够更好地适应路段行程车速的非线性和不确定性，但仅在时间维度寻找序列数据变化趋势，很难解决路网结构对路段行程车速预测的影响。

近年来，深度学习模型已被证实能够有效挖掘路段行程车速数据的高维特征^[9]，从而降低预测误差，如循环神经网络(Recurrent Neural Network，RNN)、长短期记忆(Long Short-Term Memory，LSTM)网络等能够有效地利用自循环机制来挖掘路段行程车速的长期变化特征^[10-11]。然而，路段行程车速的变化不单受时间因素的影响，路网空间结构及上下游交通状态也是需要考虑的因素。针对路网的空间特性，文献[12]使用深度卷积神经网络(Deep Convolutional Neural Network，DCNN)提取路网结构特征，使用长短期记忆网络获得时间动态变化规律，并通过实验证明了模型的有效性，但DCNN在数据组织上适用于图像、规则网格等欧几里得空间，路网属于典型非欧几里得空间，需要对路网结构进行空间转换，增加训练步骤，从而导致预测实时性较差。文献[13]利用图卷积层获取路网空间特征，并结合门控卷积层对交通预测问题进行建模，在时间维度采用全卷积的方式减少模型参数，从而提高训练效率，但该模型结构无法充分获取交通数据长期变化特征，预测精度有待提高。文献[14]结合图卷积网络设计了时间序列T-GCN模型，经过实验验证具有优于SVR和门控循环单元(Gated Recurrent Unit，GRU)的预测结果，然而该模型在预测过程中未能有效表达预测对象的拓扑结构，预测结果的可解释性较差。文献[15]利用图卷积网络和自由流动可达矩阵(FAST-GCN)来挖掘路网的时空依赖性，以可达矩阵近似表达路网邻接矩阵，相较LSTM模型能够适应大规模路网的预测，但引入可达矩阵的方式增加了参数量，使模型变得复杂，从而降低了训练效率。以上研究均对路网空间结构提出学习方法，但在数据组织和预测精度上仍存在一定的改进空间。

本文在上述研究的基础上，结合图卷积网络(Graph Convolutional Network，GCN)和门控循环单元建立深度学习模型，挖掘路段行程车速预测问题中的时空特性，通过图卷积网络适应路网任意拓扑结构，利用门控循环单元充分挖掘路段行程车速长期变化特征，同时基于Python程序从在线地图平台上实时获取并滚动更新路段行程车速数据。

1 基于GCN-GRU模型的路段行程车速预测 1.1 问题描述

路段行程车速反映路段的运行情况，与一般时间序列预测问题不同，路段行程车速具有复杂的时空特性。在时间维度上，路段行程车速的变化是一个渐变过程，前一时刻的车速影响着下一时刻车速的变化。在空间维度上，多个相连接的路段组成路网，形成上下游路段、交叉路段等多种连接关系，上游路段行程车速通过传递效应影响下游路段行程车速，下游路段行程车速通过反馈效应作用于上游路段行程车速，交叉路段通过空间结构制约交通流向，从而影响路段行程车速的变化^[16-17]。因此，路段行程车速预测的难点在于如何挖掘路段行程车速数据的时空特性。为直观解决这一问题，给出如下假设与定义:

假设1 路网是点和线的集合，路网中每一条路段为一个节点，节点的连接关系由集合中的边线表示。路网时空演变过程如图 1表示，其中节点的不同颜色代表路段不同的行程车速区间，随着时间的变化每个路段的行程车速在发生动态变化，同时路段行程车速的变化与相连接路段行程车速的变化相互影响。

	Download: JPG larger image
图 1 路网时空演变过程 Fig. 1 The spatio-temporal evolution of the road network

定义1 一个具有拓扑结构的路网表示为$ G $^[18]，当时间序列长度为$ S $时，动态变化的路网是一个形如$ \{{G}_{1}, {G}_{2}, \cdot \cdot \cdot , {G}_{S}\} $的连续集合，且$ G=(V, E, \boldsymbol{A}) $，其中: $ V $表示路网中所有路段的集合，当路段数量为$ N $时$ V=\{{v}_{1}, {v}_{2}, \cdot \cdot \cdot , {v}_{N}\} $；$ E $表示连接各路段的边线集合；$ \boldsymbol{A} $是一个N行N列的邻接矩阵，组成元素为0或1，表示两路段之间不连接或者相连接。

定义2 路网的特征矩阵表示为$ \boldsymbol{X} $，构成元素为路段行程车速，$ \boldsymbol{X}\in {\mathbb{R}}^{N\times S} $，$ {\boldsymbol{X}}_{t} $表示在时刻$ t $的路段行程车速集合^[14]。

定义3 路段行程车速为车辆通过某一路段的速度值，是路段长度与行程时间的比值^[18]，其中行程时间包含通过起始交叉口的时间。时刻$ t $的路段行程车速为该路段在$ t-1 $至$ t $时刻所有车辆的路段行程车速平均值。

依据定义1，图 1中部分路段的邻接矩阵如表 1所示。

下载CSV 表 1 邻接矩阵 Table 1 Adjacency matrix

因此，路段行程车速预测问题可表达为: 依据路网空间结构$ G $和时间序列数据X，通过预测模型得到未来某一个时刻的路段行程车速，其中路网空间结构和时间序列数据根据路段编码相互对应。

1.2 GCN-GRU模型

在空间维度上，路网是一个典型的非欧几里得空间，路网中每条路段的相连接路段个数以及路段信息都具有不确定性，路网非结构化的特点使得传统卷积神经网络(Convolutional Neural Network，CNN)无法对其进行局部卷积来提取特征，图卷积网络能够适应任意拓扑结构的节点和图，很好地解决了非欧几里得空间的卷积处理问题，因此选取图卷积网络来学习路网结构特征。在时间维度上，路段行程车速数据是典型的时间序列数据，循环神经网络通过自身循环机制能够很好地对时间序列数据进行预测，但传统循环神经网络存在梯度消失、梯度爆炸等问题，长短期记忆网络以及门控循环单元通过门控机制选择性地保留历史信息，能够有效学习路段行程车速数据的长期变化特征，改善了梯度消失和梯度爆炸的问题^[19-20]。门控循环单元和长短期记忆网络具有相似的控制机理，但门控循环单元具有更简单的逻辑和更快的学习速度，因此采用门控循环单元来学习路段行程车速数据在时间维度上的变化规律。

为同时提取路网时空特征，结合图卷积网络和门控循环单元建立组合深度学习模型，通过学习和训练输入的路网$ G $和特征矩阵X进行预测。模型由两部分组成: 第一部分为时空信息融合，使用图卷积网络将路网拓扑结构融入路段行程车速序列数据；第二部分为数据特征学习，通过门控循环单元进一步挖掘路段行程车速的动态变化规律。如图 2所示，输入路网拓扑结构和路段历史行程车速数据，经图卷积网络学习，得到融合路网空间特性的数据$ {\boldsymbol{X}}_{t}^{\mathrm{\text{'}}} $，然后结合上一个时刻隐藏状态$ {\boldsymbol{h}}_{t-1} $，输入门控循环单元，经由激活函数和控制门处理后得到预测值$ {\boldsymbol{Y}}_{t} $和隐藏值$ {\boldsymbol{h}}_{t} $。

	Download: JPG larger image
图 2 GCN-GRU模型结构 Fig. 2 Structure of GCN-GRU model

1.2.1 图卷积网络

图卷积网络通过构造傅里叶域过滤器捕获路网中的路段节点及其一阶邻域的空间特征，如图 3所示，首先依次对每一个路段进行空间特征提取，通过激活函数$ \mathrm{R}\mathrm{e}\mathrm{l}\mathrm{u}(\mathrm{ }\cdot \mathrm{ }) $和$ \sigma (\mathrm{ }\cdot \mathrm{ }) $分别控制每个卷积层的输出，然后堆叠多个卷积层，最终输出融合路网空间结构的特征矩阵。

	Download: JPG larger image
图 3 双层图卷积网络模型结构 Fig. 3 Structure of double layer map convolutional neural network model

双层图卷积网络模型的计算过程如式(1)~式(6)所示:

$ f(\boldsymbol{X}, \boldsymbol{A})=\sigma \left(\hat{\boldsymbol{A}}\mathrm{R}\mathrm{e}\mathrm{l}\mathrm{u}\right(\hat{\boldsymbol{A}}\boldsymbol{X}{\boldsymbol{W}}_{0}\left){\boldsymbol{W}}_{1}\right) $

(1)

$ \hat{\boldsymbol{A}}={\tilde{\boldsymbol{D}}}^{-\frac{1}{2}}\tilde{\boldsymbol{A}}{\tilde{\boldsymbol{D}}}^{-\frac{1}{2}} $

(2)

$ \tilde{\boldsymbol{A}}=\boldsymbol{A}+{\boldsymbol{I}}_{N} $

(3)

$ \tilde{\boldsymbol{D}}=\sum\limits_{j}{\tilde{\boldsymbol{A}}}_{ij} $

(4)

$ \sigma \left(x\right)=\frac{1}{1+{\mathrm{e}}^{-x}} $

(5)

$ \mathrm{R}\mathrm{e}\mathrm{l}\mathrm{u}\left(x\right)=\mathrm{m}\mathrm{a}\mathrm{x}(0, x) $

(6)

其中: $ \boldsymbol{X} $是特征矩阵；A是邻接矩阵；$ \tilde{\boldsymbol{A}} $是自邻接矩阵；$ \hat{\boldsymbol{A}} $是正则化的拉普拉斯矩阵，通过式(2)和式(3)对A进行对称归一化处理得到；$ {\boldsymbol{I}}_{N} $是N阶单位矩阵；$ \tilde{\boldsymbol{D}} $是度矩阵，矩阵中数值表示与对应路段相连接路段的个数；$ {\boldsymbol{W}}_{0} $和$ {\boldsymbol{W}}_{1} $代表图卷积网络第一层和第二层的权重矩阵；$ \sigma (\cdot ) $是非线性激活函数；$ \mathrm{R}\mathrm{e}\mathrm{l}\mathrm{u}(\cdot ) $是线性整流函数。

1.2.2 门控循环单元

门控循环单元在长短期记忆网络的基础上^[10]，将遗忘门和外部输入门整合为更新门，提高了模型计算速度。门控循环单元通过更新门和复位门控制数据的输入与输出，其中，更新门控制当前输入信息的保留情况，复位门控制前一个时刻的输出对当前输入的影响，门控循环单元原理如图 2中右侧矩形框所示，计算公式如式(7)~式(11)所示:

$ {\boldsymbol{z}}_{t}=\sigma ({\boldsymbol{W}}_{\boldsymbol{z}}\cdot [{\boldsymbol{h}}_{t-1};{\boldsymbol{X}}_{t}^{\mathrm{\text{'}}}]+{\boldsymbol{b}}_{\boldsymbol{z}}) $

(7)

$ {\boldsymbol{r}}_{t}=\sigma ({\boldsymbol{W}}_{\boldsymbol{r}}\cdot [{\boldsymbol{h}}_{t-1};{\boldsymbol{X}}_{t}^{\mathrm{\text{'}}}]+{\boldsymbol{b}}_{\boldsymbol{r}}) $

(8)

$ {\tilde{\boldsymbol{h}}}_{t}=\mathrm{t}\mathrm{a}\mathrm{n}\mathrm{h}({\boldsymbol{W}}_{\tilde{\boldsymbol{h}}}\cdot [({\boldsymbol{r}}_{t}\odot {\boldsymbol{h}}_{t-1});{\boldsymbol{X}}_{t}^{\mathrm{\text{'}}}]+{\boldsymbol{b}}_{\tilde{\boldsymbol{h}}}) $

(9)

$ {\boldsymbol{h}}_{t}={\boldsymbol{z}}_{t}\odot {\tilde{\boldsymbol{h}}}_{t}+(1-{\boldsymbol{z}}_{t})\odot {\boldsymbol{h}}_{t-1} $

(10)

$ \mathrm{t}\mathrm{a}\mathrm{n}\mathrm{h}\left(x\right)=\frac{{\mathrm{e}}^{x}-{\mathrm{e}}^{-x}}{{\mathrm{e}}^{x}+{\mathrm{e}}^{-x}} $

(11)

其中: $ {\boldsymbol{X}}_{t}^{\mathrm{\text{'}}} $是融合路网空间结构的特征矩阵；$ {\boldsymbol{h}}_{t-1} $是$ t-1 $时刻的隐藏值；$ {\boldsymbol{z}}_{t} $、$ {\boldsymbol{r}}_{t} $是在时刻$ t $的更新门和复位门；$ {\tilde{\boldsymbol{h}}}_{t} $、$ {\boldsymbol{h}}_{t} $是在时刻$ t $的存储内容和输出内容；$ {\boldsymbol{W}}_{\boldsymbol{z}} $、$ {\boldsymbol{W}}_{\boldsymbol{r}} $、$ {\boldsymbol{W}}_{\tilde{\boldsymbol{h}}} $是更新门、复位门和存储内容对应的权重矩阵；$ {\boldsymbol{b}}_{\boldsymbol{z}} $、$ {\boldsymbol{b}}_{\boldsymbol{r}} $、$ {\boldsymbol{b}}_{\tilde{\boldsymbol{h}}} $是对应的偏置向量；$ \sigma (\cdot ) $和$ \mathrm{t}\mathrm{a}\mathrm{n}\mathrm{h}(\cdot ) $是非线性激活函数，对应的输出区间分别为(0，1)和(-1，1)。

1.2.3 损失函数

本文在预测模型的训练过程中，选取自适应矩估计(Adam)优化算法对模型参数进行优化。自适应矩估计优化算法是一种可以替代传统随机梯度下降过程的一阶优化算法，基于训练数据迭代更新神经网络的权重。训练过程中通过设置的损失函数来控制模型的学习方向，需要在尽可能最小化路段行程车速预测值和真实值之间误差的同时避免过度拟合。因此，设置损失函数如下:

$ \mathrm{l}\mathrm{o}\mathrm{s}\mathrm{s}=\frac{1}{n}\sum\limits_{\boldsymbol{t}=1}^{\boldsymbol{n}}\left|{\boldsymbol{X}}_{\mathrm{t}}-{\boldsymbol{Y}}_{\mathrm{t}}\right|+\lambda {\boldsymbol{L}}_{\mathrm{r}} $

(12)

其中: $ n $是样本总量；$ {\boldsymbol{X}}_{\mathrm{t}} $是路段行程车速的真实值；$ {\boldsymbol{Y}}_{\mathrm{t}} $是路段行程车速的预测值；$ {\boldsymbol{L}}_{\mathrm{r}} $是正则化项，防止过度拟合；$ \lambda $是损失函数超参数，通过精细化调参确定。

1.2.4 训练步骤

通过输入路网空间结构数据G和路段行程车速历史数据X对深度学习模型进行训练。图卷积网络能够适应任意拓扑结构的特点使模型可直接对输入的路网数据G进行特征提取，经双层图卷积网络的学习，路网空间结构对路段行程车速的影响能够有效融合至时间序列特征矩阵$ {\boldsymbol{X}}_{}^{\mathrm{\text{'}}} $。通过门控循环单元的门控与循环机制充分挖掘融合时空特性的路段行程车速序列数据的长期变化特征。基于图卷积网络和门控循环单元的深度学习模型训练步骤如下:

步骤1 数据预处理，得到路网空间数据$ G $和时间序列数据X。

步骤2 对路网邻接矩阵A进行对称归一化处理得到拉普拉斯矩阵$ \hat{\boldsymbol{A}} $。

步骤3 通过拉普拉斯矩阵$ \hat{\boldsymbol{A}} $和权重矩阵$ {\boldsymbol{W}}_{0} $依次对路网中路段及相连接路段进行第一层卷积计算，经$ \mathrm{R}\mathrm{e}\mathrm{l}\mathrm{u}(\cdot ) $函数激活并输出。

步骤4 对步骤3输出的特征矩阵进行第二层卷积计算，通过$ \sigma (\cdot ) $函数激活并输出特征矩阵$ {\boldsymbol{X}}_{}^{\mathrm{\text{'}}} $。

步骤5 将$ t $时刻特征信息$ {\boldsymbol{X}}_{t}^{\mathrm{\text{'}}} $和$ t-1 $时刻隐藏信息$ {\boldsymbol{h}}_{t-1} $输入至门控循环单元，通过复位门$ {\boldsymbol{r}}_{t} $和更新门$ {\boldsymbol{z}}_{t} $进行处理，确定$ {\boldsymbol{h}}_{t-1} $中需要丢弃和更新的信息。

步骤6 将$ t $时刻特征信息$ {\boldsymbol{X}}_{t}^{\mathrm{\text{'}}} $和复位门$ {\boldsymbol{r}}_{t} $进行处理，运用$ \mathrm{t}\mathrm{a}\mathrm{n}\mathrm{h}(\mathrm{ }\cdot \mathrm{ }) $激活函数产生候选的状态信息$ {\tilde{\boldsymbol{h}}}_{t} $。

步骤7 通过丢弃$ {\boldsymbol{h}}_{t-1} $中部分信息和保留$ {\tilde{\boldsymbol{h}}}_{t} $信息，得到$ t $时刻隐藏信息$ {\boldsymbol{h}}_{t} $和预测信息$ {\boldsymbol{Y}}_{t} $。

步骤8 令$ t=t+1 $，重复步骤5~步骤7直至预测出全部时刻信息。

步骤9 计算损失函数值，并通过自适应矩估计优化算法对模型权重进行调整。

步骤10 在损失函数值符合精度要求或达到最大训练次数时完成模型训练，否则返回步骤3。

1.3 基于数据等维递补的实时预测 1.3.1 等维递补

等维递补方法的基本原理是将最新数据值补充到已知序列后，同时去掉原序列第一个已知数据，保持数据序列与原数据序列等维，利用新的序列预测下一个值，依次递补直至完成预测^[21-22]。

从在线地图平台获取实时更新的路段行程车速数据，采用等维递补方法对序列数据进行更新，如图 4所示，设$ t $时刻为预测开始时刻，历史数据序列长度为$ S $，在$ t+1 $时刻使用获取的最新数据代替$ t-S $时刻历史数据，保证数据的实时性和数据维度一致。深度学习模型对数据量大小比较敏感，输入相同维度的数据能够避免模型超参数多次重复标定。

	Download: JPG larger image
图 4 数据等维递补方法 Fig. 4 Data equal dimension recursive compensation method

1.3.2 路段行程车速预测

使用等维递补方法不断补充最新的路段行程车速信息，通过新的时间序列数据进行路段行程车速预测，预测流程如图 5所示，其中虚线在满足条件时触发，在路网结构不变时可以不间断对路段行程车速进行预测。首先，通过编写的程序按固定采集时间间隔从在线地图平台获取路段行程车速数据并存储于本地数据库中。然后，在收到预测需求后从数据库调取一定长度历史时间序列数据和路网结构数据，进行精细化调参后确定模型超参数并完成训练。最终，通过训练好的深度学习模型进行路段行程车速预测。在得到预测结果后，等待再次从在线地图平台处获取实时数据，以获取到的最新路段行程车速数据等维递补历史序列数据，从而进入下一次预测。当路网结构发生变化或者收到终止预测的指令后结束预测。

	Download: JPG larger image
图 5 路段行程车速预测流程 Fig. 5 Prediction procedure of road travel speed

2 实验设计与分析 2.1 实验环境与数据获取

以Tensorflow中Keras高层神经网络API为框架，在Python3.7环境中完成模型搭建和训练。选取深圳市福田区部分区域路段组成实验路网，研究区域路网地图如图 6(a)所示，路网拓扑结构如图 6(b)所示，路段编号采取高德地图平台编码。该区域中新洲路、深南大道和益田路为城市主干路，民田路、福中路和福华一路为城市次干路，福中三路等为城市支路，共计66个路段，道路等级覆盖较完整，具有较好的代表性。

	Download: JPG larger image
图 6 研究区域示意图 Fig. 6 Schematic diagram of study area

通过Python程序从高德地图平台中以15 min的时间间隔采集2020年7月1日至2020年7月7日该区域路段行程车速数据作为训练数据集、2020年7月8日的数据作为测试集。实验数据由两部分组成: 第一部分为表示路网空间结构的邻接矩阵，由元素0和1构成，路段之间存在连接关系对应1，不存在对应0，对应数据集为一个66×66的矩阵；第二部分为表示路段行程车速变化的特征矩阵，通过高德地图平台编码与区域内的路段建立对应关系，此部分数据集为66×672的矩阵。

2.2 评价指标与超参数设置

为评价模型的预测效果，选取均方根误差(Root Mean Square Error，RMSE)、平均绝对误差(Mean Absolute Error，MAE)、精度(Acc)和方差解释分数(var)4个评价指标，计算公式分别如式(13)~式(16)所示。均方根误差和平均绝对误差表示预测结果的误差情况，误差越小表示模型的预测效果越好；精度用于检测预测结果的精确度情况，精度越大表示模型的预测效果越好；方差解释分数表示预测结果和真实值之间的相似程度，其值越大表示模型的预测效果越好。

$ {R}_{\mathrm{R}\mathrm{M}\mathrm{S}\mathrm{E}}=\sqrt{\frac{1}{n}\sum\limits_{t=1}^{n}({\boldsymbol{X}}_{\mathrm{t}}-{\boldsymbol{Y}}_{\mathrm{t}}{)}^{2}} $

(13)

$ {M}_{\mathrm{M}\mathrm{A}\mathrm{E}}=\frac{1}{n}\sum\limits_{t=1}^{n}\left|{\boldsymbol{X}}_{\mathrm{t}}-{\boldsymbol{Y}}_{\mathrm{t}}\right| $

(14)

$ {A}_{\mathrm{A}\mathrm{c}\mathrm{c}}=1-\frac{{‖{\boldsymbol{X}}_{\mathrm{t}}-{\boldsymbol{Y}}_{\mathrm{t}}‖}_{\mathrm{F}}}{{‖\boldsymbol{X}‖}_{\mathrm{F}}} $

(15)

$ {v}_{\mathrm{v}\mathrm{a}\mathrm{r}}=1-\frac{\mathrm{V}\mathrm{a}\mathrm{r}\left\{\boldsymbol{X}-\boldsymbol{Y}\right\}}{\mathrm{V}\mathrm{a}\mathrm{r}\left\{\boldsymbol{X}\right\}} $

(16)

其中: $ {‖\cdot ‖}_{\mathrm{F}} $表示矩阵范数，为矩阵中元素的平方和再开方；$ \mathrm{V}\mathrm{a}\mathrm{r}\left\{\cdot \right\} $表示样本方差。

使用2020年7月1日至2020年7月7日的数据对模型超参数进行调试和标定，需要设置的超参数有隐藏单元层数、学习速度、批量大小、训练率、训练量以及损失函数超参数$ \lambda $。深度学习模型的超参数设置与数据量密切相关，参考同类深度学习模型的训练过程总结出与该实验数据量相近的模型隐藏单元层数为4~64。

为得到适合的隐藏单元层数，通过调整隐藏单元层数(4、8、16、32和64)来分析其对预测结果的影响，如图 7所示。RMSE和MAE的值随着隐藏单元层数的增大迅速减小后开始增大，如图 7(a)所示。Acc和var的值随着隐藏单元层数的增加迅速增大后开始减小，如图 7(b)所示。从各检验指标的变化情况可以看出，当隐藏单元层数为32时，模型达到最好的预测效果。

	Download: JPG larger image
图 7 不同隐藏单元层数对预测结果的影响 Fig. 7 The influence of different hidden unit layers on the prediction results

学习速度决定了训练过程中的网络更新权重，学习速度过大会导致模型不收敛，过小会增加模型训练时间；批量大小是模型每次学习输入的样本数量；损失函数超参数$ \lambda $控制模型优化过程的灵敏度。实验使用的数据量级为$ {10}^{4} $，通过数据量级设置超参数取值区间，然后进行多次调参取优，最终确定模型超参数设置: 隐藏单元层数为32，学习速度为0.005，批量大小为32，损失函数超参数$ \lambda $为0.000 6，训练率为0.87，训练量为10 000。

3 实验结果分析

使用2.2节中超参数设置进行路段行程车速预测并检验预测效果，选取ARIMA、SVR和GRU作为对比模型。设置预测时间为15 min、30 min、45 min和60 min，对应预测步长为1步、2步、3步和4步，分析单个路段和整体路网的预测结果，同时为检验本文模型多步预测效果，分析4种预测步长下模型预测效果的变化情况。

单个路段的预测结果如图 8所示。对路段570(福中一路)和路段107(深南大道)的预测效果(预测时间为15 min)进行分析，如图 8(a)和图 8(b)所示，本文模型可以很好地预测路段行程车速变化规律。在速度发生突变时，预测误差可能会出现较大幅度的波动，如图 8(c)所示，预测误差最大达到7.5 km/h；在速度变化趋势比较平稳时，预测误差分布比较平稳，如图 8(d)所示，预测误差分布在3 km/h以内。

	Download: JPG larger image
图 8 路段预测结果与误差分布 Fig. 8 Road prediction result and error distribution

对路段570在不同预测步长下的误差分布进行对比分析，如图 9所示，可以看出随着预测步长的增加，误差也会有所增大，但在预测步长最长时误差分布在10 km/h以内，相比文献[19]采用的LSTM-RNN模型有明显的性能提升。

	Download: JPG larger image
图 9 不同预测时间下路段570的误差分布 Fig. 9 Error distribution for road 570 under different prediction times

ARIMA、SVR、GRU和GCN-GRU模型在不同预测时间下路段行程车速预测指标结果如表 2所示，RMSE和var变化情况如图 10所示。通过表 2和图 10的预测结果可以看出，在4种预测步长下GCN-GRU模型与不同对比模型的主要评价指标有以下变化: 1)相比ARIMA模型，RMSE分别减少了40.5%、36.7%、34.7%和32.9%，var分别提高了99%、88.4%、80.5%和80.6%，Acc最高提升6.9%；2)相比SVR模型，RMSE分别减少了5.4%、6.6%、9.1%和10.9%，var分别提高了1.8%、2.7%、4.2%和5.7%，Acc最高提升1.3%；3)相比GRU模型，RMSE分别减少了2.1%、1.6%、3.0%和2.2%，var分别提高了0.6%、0.6%、1.2%和1.1%，Acc最高提升0.4%。通过主要指标的对比分析可知，使用GCN-GRU模型得到的预测效果优于对比模型。

下载CSV 表 2 不同预测时间下4种模型的路段行程车速预测指标结果 Table 2 Results of prediction indexes of road travel speed for four models under different prediction times

	Download: JPG larger image
图 10 不同预测时间下4种模型的RMSE和var变化情况 Fig. 10 Changes of RMSE and var for four models under different prediction times

由上述实验结果可以看出: ARIMA模型的预测效果最差，原因是ARIMA模型基于平稳性假设，不能对路段行程车速变化的非线性和不确定性进行准确预测；SVR模型预测效果介于ARIMA模型和GRU模型之间，是因为其能更好地挖掘路段行程车速在时间序列上的变化趋势，但忽略了路段行程车速的长期变化特征；GRU模型在对比模型中具有最好的预测效果，但未考虑到路网结构对路段行程车速的影响，因此预测效果还是稍劣于GCN-GRU模型。

不同预测时间下GCN-GRU模型的路段行程车速预测指标变化情况如图 11所示，随着预测步长的增加整体预测误差和精度未出现很大变化，模型预测Acc一直保持在90%以上，并且在预测步长最长时误差分布未出现大幅度增加，说明GCN-GRU模型不但适用于路段行程车速短时预测，也适用于中长时预测，预测效果稳定。

	Download: JPG larger image
图 11 不同预测时间下GCN-GRU模型的路段行程车速预测指标变化情况 Fig. 11 Changes of prediction indexes of GCN-GRU model of road travel speed under different prediction times

基于以上实验结果，总结并归纳GCN-GRU模型具有如下优势: 1)采用深度学习算法能够有效解决路段行程车速变化的非线性和不确定性问题；2)结合图卷积网络和门控循环单元能够提取影响路段行程车速变化的路网空间特征和时间序列特征；3)在长时预测过程中具有良好的稳定性；4)通过数据实时获取与更新程序，保证了预测的实时性。

4 结束语

本文基于图卷积网络和门控循环单元构建深度学习模型，通过在线地图平台采集路段实时行程车速和路网结构数据，利用等维递补方法更新历史序列数据，训练并使用GCN-GRU模型进行路段行程车速多步预测。实验结果表明，GCN-GRU模型有效解决了路段行程车速预测中的时空关系问题，提高了预测准确性，并且能够满足路段行程车速预测的实时性要求。后续将研究不同的路段连接关系及车速周期性变化对路段行程车速的影响，提高深度学习模型的可解释性和路段行程车速的预测准确性。

参考文献

[1]	LIEBIG T, PIATKOWSKI N, BOCKERMANN C, et al. Dynamic route planning with real-time traffic predictions[J]. Information Systems, 2017, 64: 258-265. DOI:10.1016/j.is.2016.01.007
[2]	蔡延光, 乐冰, 蔡颢, 等. 暴雨天气下高速公路短时交通流预测[J]. 计算机工程, 2020, 46(6): 34-39. CAI Y G, LE B, CAI H, et al. Short-term traffic flow forecast of expressway under heavy rain[J]. Computer Engineering, 2020, 46(6): 34-39. (in Chinese)
[3]	SIVAK M, SCHOETTLE B. Eco-driving: strategic, tactical, and operational decisions of the driver that influence vehicle fuel economy[J]. Transport Policy, 2012, 22: 96-99. DOI:10.1016/j.tranpol.2012.05.010
[4]	刘静, 关伟. 交通流预测方法综述[J]. 公路交通科技, 2004, 21(3): 82-85. LIU J, GUAN W. A summary of traffic flow forecasting methods[J]. Journal of Highway and Transportation Research and Development, 2004, 21(3): 82-85. (in Chinese)
[5]	MAKRIDAKIS S, HIBON M. ARMA models and the Box-Jenkins methodology[J]. Journal of Forecasting, 1997, 16(3): 147-163. DOI:10.1002/(SICI)1099-131X(199705)16:3<147::AID-FOR652>3.0.CO;2-X
[6]	GUO J H, HUANG W, WILLIAMS B M. Adaptive Kalman filter approach for stochastic short-term traffic flow rate prediction and uncertainty quantification[J]. Transportation Research Part C: Emerging Technologies, 2014, 43: 50-64. DOI:10.1016/j.trc.2014.02.006
[7]	WU C H, HO J M, LEE D T. Travel-time prediction with support vector regression[J]. IEEE Transactions on Intelligent Transportation Systems, 2004, 5(4): 276-281. DOI:10.1109/TITS.2004.837813
[8]	SUN S L, ZHANG C S, YU G Q. A Bayesian network approach to traffic flow forecasting[J]. IEEE Transactions on Intelligent Transportation Systems, 2006, 7(1): 124-132. DOI:10.1109/TITS.2006.869623
[9]	HUANG W H, SONG G J, HONG H K, et al. Deep architecture for traffic flow prediction: deep belief networks with multitask learning[J]. IEEE Transactions on Intelligent Transportation Systems, 2014, 15(5): 2191-2201. DOI:10.1109/TITS.2014.2311123
[10]	代亮, 梅洋, 钱超, 等. 基于深度学习的短时交通量预测研究综述[J]. 计算机科学, 2019, 46(3): 39-47. DAI L, MEI Y, QIAO C, et al. Survey on short-term traffic flow forecasting based on deep learning[J]. Computer Science, 2019, 46(3): 39-47. (in Chinese)
[11]	MA X L, DAI Z, HE Z B, et al. Learning traffic as images: a deep convolutional neural network for large-scale transportation network speed prediction[J]. Sensors, 2017, 17(4): 818. DOI:10.3390/s17040818
[12]	YU H Y, WU Z H, WANG S Q, et al. Spatiotemporal recurrent convolutional networks for traffic prediction in transportation networks[J]. Sensors, 2017, 17(7): 1501. DOI:10.3390/s17071501
[13]	YU B, YIN H T, ZHU Z X. Spatio-temporal graph convolutional networks: a deep learning framework for traffic forecasting[C]//Proceedings of the 27th International Joint Conference on Artificial Intelligence. Stockholm, Sweden: [s.n.], 2018: 1-10.
[14]	ZHAO L, SONG Y J, ZHANG C, et al. T-GCN: a temporal graph convolutional network for traffic prediction[J]. IEEE Transactions on Intelligent Transportation Systems, 2020, 21(9): 3848-3858. DOI:10.1109/TITS.2019.2935152
[15]	闫旭, 范晓亮, 郑传潘, 等. 基于图卷积网络的城市交通态势预测算法[J]. 浙江大学学报(工学版), 2020, 54(6): 1147-1155. YAN X, FAN X L, ZHENG C P, et al. Urban traffic flow prediction algorithm based on graph convolutional neural networks[J]. Journal of Zhejiang University(Engineering Science), 2020, 54(6): 1147-1155. (in Chinese)
[16]	鲁武当. 基于交通态势数据的城市道路平均行程速度时空分布特征及预测研究[D]. 西安: 长安大学, 2019. LU W D. Spatial-temporal distribution characteristics and prediction of urban road average travel speed based on traffic status data[D]. Xi'an: Chang'an University, 2019. (in Chinese)
[17]	陈华伟, 邵毅明, 敖谷昌, 等. 基于在线地图交通状态的关键道路动态识别方法[J]. 交通运输系统工程与信息, 2019, 19(5): 50-58. CHEN H W, SHAO Y M, AO G C, et al. Dynamic identification method of critical roads based on traffic state of online map[J]. Journal of Transportation Systems Engineering and Information Technology, 2019, 19(5): 50-58. (in Chinese)
[18]	ZHANG Z C, LI M, LIN X, et al. Multistep speed prediction on traffic networks: a deep learning approach considering spatio-temporal dependencies[J]. Transportation Research Part C: Emerging Technologies, 2019, 105: 297-322. DOI:10.1016/j.trc.2019.05.039
[19]	王祥雪, 许伦辉. 基于深度学习的短时交通流预测研究[J]. 交通运输系统工程与信息, 2018, 18(1): 81-88. WANG X X, XU L H. Short-term traffic flow prediction based on deep learning[J]. Journal of Transportation Systems Engineering and Information Technology, 2018, 18(1): 81-88. (in Chinese)
[20]	陈卓, 吕娜, 陈坤, 等. 基于时空图卷积网络的无人机网络入侵检测方法[J]. 北京航空航天大学学报, 2021, 47(5): 1068-1076. CHEN Z, LÜ N, CHEN K, et al. UAV network intrusion detection method based on spatio-temporal graph convolutional network[J]. Journal of Beijing University of Aeronautics and Astronautics, 2021, 47(5): 1068-1076. (in Chinese)
[21]	刘明宇, 吴建平, 王钰博, 等. 基于深度学习的交通流量预测[J]. 系统仿真学报, 2018, 30(11): 4100-4105, 4114. LIU M Y, WU J P, WANG Y B, et al. Traffic flow prediction based on deep learning[J]. Journal of System Simulation, 2018, 30(11): 4100-4105, 4114. (in Chinese)
[22]	赵桂生, 张海文, 刘爱军, 等. 基于等维递补灰色GM(1, 1)模型的我国农业灌溉用水预测分析[J]. 数学的实践与认识, 2018, 48(4): 299-304. ZHAO G S, ZHANG H W, LIU A J, et al. Prediction and analysis of agricultural irrigation water in China based on grey GM(1, 1) model with equal dimension[J]. Mathematics in Practice and Theory, 2018, 48(4): 299-304. (in Chinese)