基于全局时空特性的城市路网交通速度预测模型

引用本文

冯思芸, 施振佺, 曹阳. 基于全局时空特性的城市路网交通速度预测模型[J]. 计算机工程, 2022, 48(5), 112-117. DOI: 10.19678/j.issn.1000-3428.0061397.

FENG Siyun, SHI Zhenquan, CAO Yang. Urban Road Network Traffic Speed Prediction Model Based on Global Spatio-Temporal Characteristics[J]. Computer Engineering, 2022, 48(5), 112-117. DOI: 10.19678/j.issn.1000-3428.0061397.

基金项目

国家自然科学基金面上项目“面向流量预测的交通智脑关键技术研究”(61771265)；江苏省“333工程”科研项目“基于多源异构交通大数据的交通流量预测研究”(BRA2017475)；江苏省“青蓝工程”项目；南通市“226”科研项目“基于时空融合的灰色多变量城市路网短时交通流预测研究”(131320633045)

通信作者

施振佺(通信作者)，博士

作者简介

冯思芸(1995-)，女，硕士研究生，主研方向为智能信息处理;
曹阳，教授、博士、博士生导师

文章历史

收稿日期：2021-04-24
修回日期：2021-06-20

Contents Abstract Full text Figures/Tables PDF

基于全局时空特性的城市路网交通速度预测模型

冯思芸¹ , 施振佺^1,2 , 曹阳^1,2

1. 南通大学信息科学技术学院, 江苏南通 226019;
2. 南通大学交通与土木工程学院, 江苏南通 226019

收稿日期：2021-04-24；修回日期：2021-06-20

基金项目：国家自然科学基金面上项目“面向流量预测的交通智脑关键技术研究”(61771265)；江苏省“333工程”科研项目“基于多源异构交通大数据的交通流量预测研究”(BRA2017475)；江苏省“青蓝工程”项目；南通市“226”科研项目“基于时空融合的灰色多变量城市路网短时交通流预测研究”(131320633045)

作者简介：冯思芸(1995-)，女，硕士研究生，主研方向为智能信息处理; 曹阳，教授、博士、博士生导师.

通信作者：施振佺(通信作者)，博士.

E-mail: szq@ntu.edu.cn

摘要：城市路网交通速度预测是智能交通系统中的重要组成部分，其可为出行者提供实时的交通信息，对提升道路通行能力具有重要意义。现有基于图卷积网络的预测模型一定程度上加强了对一阶相邻路段间空间关联程度的挖掘，但在非一阶相邻路段关联度大于一阶相邻路段关联度的情况下，如果仍输入原始的邻接矩阵，会遗失一些相对重要的路段空间信息，无法得到较好的预测结果。为准确挖掘城市路网中的时空特性，提出一种基于全局图卷积和门控循环单元的城市路网交通速度预测模型G-GCGRU。考虑全局路网下非一阶相邻路段间的空间影响程度，利用相关性分析方法计算得到路段间的关联度矩阵，并作为新的卷积方式进一步加深对空间特征的挖掘，在此基础上，采用门控循环单元方法提取路网时间特征。使用深圳市罗湖区城市路网车速数据进行实验，结果表明，该模型预测性能优于图卷积网络(GCN)、门控循环单元(GRU)和GCN-GRU混合模型，以均方根误差为评价指标，预测精度分别提高25.3%、4.7%和2.1%。

Urban Road Network Traffic Speed Prediction Model Based on Global Spatio-Temporal Characteristics

FENG Siyun¹ , SHI Zhenquan^1,2 , CAO Yang^1,2

1. School of Information Science and Technology, Nantong University, Nantong, Jiangsu 226019, China;
2. School of Transportation and Civil Engineering, Nantong University, Nantong, Jiangsu 226019, China

Abstract: Urban road network traffic speed prediction is an important aspect of Intelligent Transportation System(ITS) and is of great significance in improving road capacity by providing real-time traffic information for travelers.The existing prediction model based on the Graph Convolution Network(GCN) strengthens the mining of the spatial correlation degree between first-order adjacent sections to a certain extent.However, if the correlation degree of some non-first-order adjacent sections is greater than that of some first-order adjacent sections, when the original adjacency matrix is input, some relatively important section spatial information may be lost, precluding the realization of better prediction results.To accurately mine the temporal and spatial characteristics of urban road networks, a traffic speed prediction model of an urban road network based on global GCN and Gated Recurrent Unit(GRU), G-GCGRU, is proposed.Considering the degree of spatial influence between non-first-order adjacent road sections under the global road network, the correlation degree matrix between road sections is calculated using the correlation analysis method, which is a new convolution method to further deepen the mining of spatial features.Based on this, the gated cycle unit method is used to extract the time features of the road network.The results show that the performance of the model is better than those of the GCN, Gated Recurrent Unit (GRU), and GCN-GRU hybrid models.Using the root mean square error as the evaluation index, the prediction accuracy is improved by 25.3%, 4.7%, and 2.1%, respectively.

开放科学（资源服务）标志码（OSID）：

0 概述

随着我国城市化建设加快，车辆保有率逐步上升，城市交通拥堵问题日益严峻，同时导致空气污染加剧。智能交通系统(Intelligent Transportation System，ITS)将先进的科学技术有效地综合应用于交通运输中，有利于加强车辆、道路和出行者的联系，提高交通资源分配和调度的合理性^[1]。

交通参数预测是ITS的重要组成部分，现有研究主要集中于如何根据历史和实时数据预测交通流下一时刻状态，如流量、速度、密度等。城市路网交通速度预测可以为出行者提供实时的交通信息，对提升道路通行能力具有重要意义。通常，有效的城市路网交通速度预测重在捕捉交通系统内部的时空变化特征。神经网络因其优异的性能被广泛地应用于求解交通参数预测问题中^[2]。当前常用的神经网络主要包括卷积神经网络^[3](Convolutional Neural Network，CNN)、循环神经网络^[4](Recurrent Neural Network，RNN)、图卷积网络^[5](Graph Convolutional Network，GCN)等。然而，交通状态具有非常复杂的非线性、随机性等特征^[6]，单一的神经网络模型并不能获得较好的预测性能，因此，当前的研究方向已逐步向混合神经网络模型发展^[7]。文献[8]提出的注意力图卷积序列模型，利用GCN和注意力机制分别对空间依赖性和时间依赖性进行建模。文献[9]结合长短时记忆网络和注意力机制构建混合模型框架。文献[10]利用卷积门控循环单元(Gated Recurrent Unit，GRU)进行空间特征提取，结合双向GRU对时间依赖性进行分析，从而有效地对交通流量进行预测。文献[11]堆叠CNN和长短时记忆网络挖掘交通数据的时空特性，取得了良好的预测效果。此外，大量研究表明，混合神经网络模型能够更充分地挖掘时空特征，预测性能更好^[12-13]。

图卷积网络是图神经网络的一个重要分支^[14]，目前已较好地应用于路网交通预测中^[15]。文献[16-17]将路网拓扑结构表示为0-1邻接矩阵，利用GCN对城市路网空间相关性进行分析，再结合长短时记忆网络等分析交通流的时间相关性。然而，上述方法对于空间特征的挖掘并不充分，传统的图卷积传播规则依赖于路网的实际拓扑结构，并未考虑到相邻路段间不同的空间影响程度。针对这一缺陷，已有多种解决方法。文献[18]利用相关性分析方法，根据路段的连通性构建邻接矩阵。文献[19]利用softmax函数重构0-1矩阵，对每个非0元素赋予变量值，通过迭代训练得到最优邻接矩阵。这些方法都从一定程度上加强了模型对一阶相邻路段间空间关联程度的挖掘，但是时空特征不受道路连通性的限制，非一阶相邻道路的交通流之间也存在相互影响性^[20]。在部分非一阶相邻路段关联度大于部分一阶相邻路段关联度的情况下，如果仍输入原始的邻接矩阵，会遗失一些相对重要的路段空间信息，无法得到较好的预测结果。

为更好地挖掘城市路网的交通特性，本文提出一种基于全局时空特性的速度预测模型G-GCGRU。利用全局图卷积网络进行空间特征分析，构造路网有向带权的内部空间关系，解决非一阶高度关联路段信息缺失的问题，充分挖掘交通流的空间特征。同时，通过GRU分析数据的时间依赖性以挖掘其时间特征。在此基础上，选用深圳市罗湖区城市路网车辆速度数据对模型进行验证。

1 模型建立与求解 1.1 时空矩阵构建

为充分挖掘交通流的时空特征，建立时空矩阵作为模型的输入。利用待研究路网中交通流参数的全量特征数据构造时空矩阵，矩阵中的每一列表示为路网中的一个路段，行表示为每个路段一个时间片的特征值，以此构成路网的时空矩阵，其结构如下：

$ {\boldsymbol {X}}_{T}^{R}=\left[\begin{array}{cccc}{\boldsymbol {x}}_{1}^{1}& {\boldsymbol {x}}_{1}^{2}& \cdots & {\boldsymbol {x}}_{1}^{r}\\ {\boldsymbol {x}}_{2}^{1}& {\boldsymbol {x}}_{2}^{2}& \cdots & {\boldsymbol {x}}_{2}^{r}\\ ⋮& ⋮& & ⋮\\ {\boldsymbol {x}}_{t}^{1}& {\boldsymbol {x}}_{t}^{2}& \cdots & {\boldsymbol {x}}_{t}^{r}\end{array}\right] $

(1)

其中：$ R=\{\mathrm{1, 2}, \cdots , r\} $为路段集合；$ T=\{\mathrm{1, 2}, \cdots , t\} $为时间片集合；$ {\boldsymbol {X}}_{T}^{R} $为包含$ r $条路段且时间步长为$ t $的时空矩阵。表 1列出了本文相关的符号定义。

下载CSV 表 1 符号定义 Table 1 Symbols definition

1.2 模型结构

对交通流的空间特征和时间特征分别进行分析，构建预测模型。模型结构主要包含三部分，如图 1所示。第一部分为全局图卷积网络模块，利用全量特征数据进行相关性分析，计算关联度矩阵，将关联度矩阵和指定时间步长的时空矩阵输入图卷积网络中，提取交通流数据全局空间特征；第二部分为门控循环单元模块，将第一部分的输出值输入GRU网络中，进一步分析数据的时间特性；第三部分为预测模块，利用GRU网络最后时刻的输出，通过Dense层控制需要预测的时间步长并计算得到模型最后的预测结果，以此建立G-GCGRU的网络结构。

	Download: JPG larger image
图 1 　G-GCGRU网络结构 Fig. 1 Network structure of G-GCGRU

1.3 全局空间特征提取

城市路网的结构特征类似于图的拓扑结构。GCN是当前处理图结构等非欧式数据比较流行的神经网络。将路网拓扑结构表示为无向图$ G=(V, E) $，其中，$ V $为节点集合表示路段，$ E $为边集合，表示路段间的相邻情况。GCN的计算规则为：

$ \boldsymbol {{H}}^{(l+1)}=\sigma \left(\widehat{\boldsymbol {A}}{\boldsymbol {H}}^{\left(l\right)}{\boldsymbol {W}}^{\left(l\right)}\right) $

(2)

其中：$ \widehat{\boldsymbol {A}}={\tilde{\boldsymbol {D}}}^{-\frac{1}{2}}\tilde{\boldsymbol {A}}{\tilde{\boldsymbol {D}}}^{-\frac{1}{2}} $；$ \tilde{\boldsymbol {A}}=\boldsymbol {I}+\boldsymbol {A} $；$ \boldsymbol {I}\in {\mathbb{R}}^{\boldsymbol {N}\times \boldsymbol {N}} $为单位矩阵；$ \boldsymbol {A}\in {\mathbb{R}}^{\boldsymbol {N}\times \boldsymbol {N}} $为图$ G $的邻接矩阵；$ {\tilde{\boldsymbol {D}}}_{i, i}=\sum _{j}{\tilde{\boldsymbol {A}}}_{i, j} $；$ {\boldsymbol {H}}^{\left(\boldsymbol {l}\right)} $为$ l $层的输出；$ {\boldsymbol {H}}^{\left(0\right)}={\boldsymbol {X}}_{T}^{R} $；$ {\boldsymbol {W}}^{\left(\boldsymbol {l}\right)} $为第$ l $层的权重参数。

GCN通过邻接矩阵对实际路网的空间结构进行显式表征，利用$ \widehat{\boldsymbol {A}} $进行特征卷积，将相邻路段节点特征进行融合，以此获取新的路段特征表示。然而，考虑到道路本身的地理条件和道路周边基础设施的影响，部分相邻路段间的空间影响性会弱于非相邻路段间的空间影响性。邻接矩阵虽然能够表达出直观的路段邻接性，但是并不能表达出路网内部空间影响性。针对这一缺陷，对路段内部的空间结构进行隐式表征。对于任一路段，利用皮尔逊相关系数方法^[21]计算其与路网中其余路段间的关联性，筛选关联度较高的若干条路段数k，组成关联度矩阵$ \boldsymbol {C} $。在此基础上，利用GCN的卷积思想，通过$ \boldsymbol {C} $聚合关联度高的路段空间信息作为道路节点的新特征。

对于任意2条路段$ {\boldsymbol {X}}_{i} $、$ {\boldsymbol {X}}_{j} $，设相应的特征值数据为$ {\boldsymbol {X}}_{i}=({\boldsymbol {x}}_{1}^{i}, {\boldsymbol {x}}_{2}^{i}, \mathrm{ }\cdots \mathrm{ }, {\boldsymbol {x}}_{t}^{i}) $，$ {\boldsymbol {X}}_{j}=({\boldsymbol {x}}_{1}^{j}, {\boldsymbol {x}}_{2}^{j}, \mathrm{ }\cdots \mathrm{ }, {\boldsymbol {x}}_{t}^{j}) $，则关联度矩阵计算方法为：

$ {\boldsymbol {C}}_{ij}=\frac{\sum\limits_{t=1}^{T}({x}_{t}^{i}-{\stackrel{-}{\boldsymbol {X}}}_{i})({x}_{t}^{j}-{\stackrel{-}{\boldsymbol {X}}}_{j})}{\sqrt{\sum\limits_{t=1}^{T}({x}_{t}^{i}-{\stackrel{-}{\boldsymbol {X}}}_{i}{)}^{2}}\sqrt{\sum\limits_{t=1}^{T}({x}_{t}^{j}-{\stackrel{-}{\boldsymbol {X}}}_{j}{)}^{2}}} $

(3)

其中：$ {\stackrel{-}{\boldsymbol {X}}}_{i} $、$ {\stackrel{-}{\boldsymbol {X}}}_{j} $分别为样本均值。

关联度矩阵描述的路段节点关系为一张有向带权图，节点之间的连接表示影响权重，方向代表影响关系。通过关联度矩阵聚合与节点自身关联度高的路段信息，进一步提高模型对空间特征的挖掘。因此，全局图卷积网络的规则更新为：

$ {\boldsymbol {H}}^{(l+1)}=\sigma \left(\boldsymbol {C}{\boldsymbol {H}}^{\left(l\right)}{\boldsymbol {W}}^{\left(l\right)}\right) $

(4)

将$ \boldsymbol {C} $以及包含$ r $条路段和$ p $个时间片的时空矩阵$ {\boldsymbol {X}}_{P}^{R} $输入两层图卷积网络中进行空间特征分析，网络传播规则如图 2所示，计算规则如下：

$ \mathrm{G}\mathrm{g}\mathrm{c}\mathrm{n}({\boldsymbol {X}}_{P}^{R}, \boldsymbol {C})=\mathrm{R}\mathrm{e}\mathrm{L}\mathrm{u}(\boldsymbol {C}\cdot \mathrm{R}\mathrm{e}\mathrm{L}\mathrm{u}(\boldsymbol {C}{\boldsymbol {X}}_{P}^{R}{\boldsymbol {W}}^{\left(0\right)}\left){\boldsymbol {W}}^{\left(1\right)}\right) $

(5)

	Download: JPG larger image
图 2 全局图卷积网络传播规则 Fig. 2 Communication rule of G-GCN

1.4 时间特征提取

GRU能够有效避免RNN梯度消失和爆炸的问题，是处理时间序列预测问题的主流神经网络之一^[22]。GRU网络包含三部分，即输入层、隐藏层和输出层，其核心算法在于隐藏层单元块中的计算过程，如图 3所示。

	Download: JPG larger image
图 3 门控循环单元模块 Fig. 3 Gated recurrent unit module

针对某一时间片，GRU首先拼接上一时刻隐藏层的输出$ {\boldsymbol {h}}_{t-1} $和当前时刻的输入$ {\boldsymbol {X}}_{t} $，通过sigmoid函数将数据变换到[0, 1]中，充当重置门控信号$ {\boldsymbol {r}}_{t} $和更新门控信号$ {\boldsymbol {z}}_{t} $；然后利用门控信号分别对$ {\boldsymbol {h}}_{t-1} $和$ {\boldsymbol {X}}_{t} $进行选择性的遗忘和保存，从而实现在保存上一时刻交通信息的同时结合当前时刻的交通状态，达到捕获时间依赖性的效果。

将提取的空间特征值$ \mathrm{G}\mathrm{g}\mathrm{c}\mathrm{n}({\boldsymbol {X}}_{P}^{R}, \boldsymbol {C}) $按照时间片进行拆分，输入GRU模型中进行时间特征分析，计算过程如下：

$ {\boldsymbol {r}}_{t}=\sigma \left({\boldsymbol {W}}_{r}\right[\mathrm{G}\mathrm{g}\mathrm{c}\mathrm{n}({\boldsymbol {X}}_{P}^{R}, \boldsymbol {C}), {\boldsymbol {h}}_{t-1}]+{\boldsymbol {b}}_{r}) $

(6)

$ {\boldsymbol {z}}_{t}=\sigma \left({\boldsymbol {W}}_{z}\right[\mathrm{G}\mathrm{g}\mathrm{c}\mathrm{n}({\boldsymbol {X}}_{P}^{R}, \boldsymbol {C}), {\boldsymbol {h}}_{t-1}]+{\boldsymbol {b}}_{z}) $

(7)

$ {\tilde{\boldsymbol {h}}}_{t}=\mathrm{t}\mathrm{a}\mathrm{n}\mathrm{h}\left({\boldsymbol {W}}_{\tilde{h}}\right[\mathrm{G}\mathrm{g}\mathrm{c}\mathrm{n}({\boldsymbol {X}}_{P}^{R}, \boldsymbol {C}), \left({\boldsymbol {r}}_{t}\mathrm{*}{\boldsymbol {h}}_{t-1}\right)]+{\boldsymbol {b}}_{\tilde{h}}) $

(8)

$ {\boldsymbol {h}}_{t}={\boldsymbol {z}}_{t}\mathrm{*}{\boldsymbol {h}}_{t-1}+(1-{\boldsymbol {z}}_{t})\mathrm{*}{\tilde{\boldsymbol {h}}}_{t} $

(9)

获取GRU网络最后时刻的输出，输入Dense网络中，控制输出的时间步长得到最后的预测结果：

$ {\boldsymbol {y}}_{t+1}=\mathrm{D}\mathrm{e}\mathrm{n}\mathrm{s}\mathrm{e}\left({\boldsymbol {h}}_{t}\right) $

(10)

1.5 模型求解过程

G-GCGRU模型的主要求解步骤如下：

步骤1 对有效交通数据进行归一化，将数值限定在[0, 1]之间，将数据集按照8∶2的比例拆分为训练集和测试集。

步骤2 设定模型结构及超参数，包括GRU隐藏层神经元数量、模型输入时间步长、输出步长、批数据大小、学习率、迭代次数、损失函数、优化方法等。

步骤3 选择合适的关联路段数量k，构造关联度矩阵，输入G-GCGRU模型中获取预测结果。对预测值与真实值进行对比，使用Adam优化器进行训练，满足迭代次数后训练结束。

步骤4 利用训练后的模型对测试集进行预测。

2 实验 2.1 实验设置

实验设置具体如下：

1) 数据集。本文利用深圳市罗湖区2015年1月1日-2015年1月31日的路网数据进行分析。该数据集包含156条路段，以15 min聚合，共计2 976条车速数据。

2) 参数设置。设置单个路段的关联路段数量k，构造关联度矩阵输入模型。实验基于TensorFlow框架进行实现，主要参数设置如下：GRU维数为64；学习率为0.001；批大小为32；训练次数为3 000。

3) 评估指标。以均方根误差(Root Mean Square Error，RMSE)、平均绝对误差(Mean Absolute Error，MAE)和测定系数(Coefficient of Determination，$ {\mathrm{R}}^{2} $)作为模型性能评价标准，定义分别如下：

$ {R}_{\mathrm{R}\mathrm{M}\mathrm{S}\mathrm{E}}=\sqrt{\frac{1}{PR}\sum\limits_{p=1}^{P}\sum\limits_{r=1}^{R}({y}_{p}^{r}-{y}_{p}^{r\mathrm{\text{'}}}{)}^{2}} $

(11)

$ {M}_{\mathrm{M}\mathrm{A}\mathrm{E}}=\frac{1}{PR}\sum\limits_{p=1}^{P}\sum\limits_{r=1}^{R}|{y}_{p}^{r}-{y}_{p}^{r\mathrm{\text{'}}}| $

(12)

$ {R}_{{\mathrm{R}}^{2}}=1-\frac{\sum\limits_{p=1}^{P}\sum\limits_{r=1}^{R}({y}_{p}^{r}-{y}_{p}^{r\mathrm{\text{'}}}{)}^{2}}{\sum\limits_{p=1}^{P}\sum\limits_{r=1}^{R}({y}_{p}^{r}{-\stackrel{-}{y})}^{2}} $

(13)

其中：$ {y}_{p}^{r} $、$ {y}_{p}^{r\mathrm{\text{'}}} $分别代表真实车速数据及预测数据；$ P $为输入的时间步长；$ R $为路段数量。

2.2 实验结果分析 2.2.1 关联路段数量k的分析

G-GCGRU模型考虑全局路网中路段的空间关联性。利用路网路段车辆速度分析路段间的关联性，得到各路段间的相关性值，如图 4所示。图 4(a)为路网中相邻路段间的关联情况，图 4(b)为根据关联路段数量k计算出的高关联路段情况，颜色越深，关联度越高。可以看出，图 4(a)中的节点关联性明显弱于图 4(b)，说明真实的拓扑结构对路网空间关联关系的表达并不充分。关联度矩阵通过重新构建路段间的相关性，深度分析高关联的路段并抛弃关联度低的路段信息，能够进一步提高模型捕获空间特征的能力。

	Download: JPG larger image
图 4 道路关联度矩阵对比 Fig. 4 Road correlation matrix comparison

关联路段数量k是影响模型预测性能的一个重要因素。k与RMSE、MAE值的关系如图 5所示。从整体上看，随着k值的增大，模型误差呈下降趋势，说明多路段空间信息的聚合有利于提高模型对空间特征的挖掘能力。当k值为6时，模型误差达到最低，随后，k值增大，模型误差缓慢增长，这表明6为最佳关联路段数量，并且过多的k会引入额外的数据信息，影响模型的预测能力。

	Download: JPG larger image
图 5 关联路段数量分析 Fig. 5 Analysis of correlation road number

2.2.2 对比实验

为验证所提模型的有效性和优越性，选取GCN、GRU及GCN-GRU混合模型进行对比，结果如表 2所示。可以看出，在4种预测模型中，本文提出的G-GCGRU模型性能最优。

下载CSV 表 2 模型性能对比 Table 2 Model performance comparison

图 6为不同模型对路网中编号为102129路段一天数据的拟合曲线图，可以看出，本文提出的模型拟合效果相对较好。与GRU网络相比，GCN网络的预测效果明显不佳，说明时间特征是交通流较为关键的特征。与GRU、GCN相比，GCN-GRU模型预测精度有一定提升，表明混合网络模型同时兼顾了数据的时间和空间特征，进行了较为全面的特征挖掘。而与G-GCGRU相比，GCN-GRU模型性能略有下降，说明关联度矩阵对空间特征的卷积效果优于邻接矩阵，能够有效提高模型预测精度。

	Download: JPG larger image
图 6 　4种模型的预测结果对比 Fig. 6 Prediction results comparison of four models

2.2.3 多步预测能力

为验证本文模型的多步预测能力，调整模型输出的时间步长及各参数进行验证，结果如图 7所示。可以看出，随着预测时间步长的增大，模型性能稍有下降。但是各时间步预测结果波动不大，表明本文模型性能对输出步长的改变相对并不敏感，能够有效预测未来长时间段的交通状态。

	Download: JPG larger image
图 7 多步预测结果 Fig. 7 Multi-step prediction result

3 结束语

本文提出一种基于全局时空特性的城市路网交通速度预测模型G-GCGRU，利用皮尔逊相关系数分析挖掘交通流内部的空间关联性，通过图卷积网络卷积(GCN)提取交通流空间特征，再结合门控循环单元(GRU)分析交通流时间特征。利用真实的路网数据进行测试，实验结果表明，与GCN、GRU及GCN-GRU混合模型相比，G-GCGRU模型性能表现最好。在本文研究中，关联度矩阵通过相关性分析计算得到，后续将考虑利用参数法优化该矩阵，进一步提高模型性能。

参考文献

[1]	ZHU L, YU F R, WANG Y G, et al. Big data analytics in intelligent transportation systems: a survey[J]. IEEE Transactions on Intelligent Transportation Systems, 2019, 20(1): 383-398. DOI:10.1109/TITS.2018.2815678
[2]	DO L N N, TAHERIFAR N, VU H L. Survey of neural network-based models for short-term traffic state prediction[J]. WIREs Data Mining and Knowledge Discovery, 2019, 9(1): 1285-1309.
[3]	JO D, YU B, JEON H, et al. Image-to-image learning to predict traffic speeds by considering area-wide spatio-temporal dependencies[J]. IEEE Transactions on Vehicular Technology, 2019, 68(2): 1188-1197. DOI:10.1109/TVT.2018.2885366
[4]	MA X L, TAO Z M, WANG Y H, et al. Long short-term memory neural network for traffic speed prediction using remote microwave sensor data[J]. Transportation Research Part C: Emerging Technologies, 2015, 54: 187-197. DOI:10.1016/j.trc.2015.03.014
[5]	GUO G, YUAN W. Short-term traffic speed forecasting based on graph attention temporal convolutional networks[J]. Neurocomputing, 2020, 410: 387-393. DOI:10.1016/j.neucom.2020.06.001
[6]	沈琴琴, 王玥, 黄悦, 等. 改进初值的灰色Verhulst-Markov模型及其应用[J]. 统计与决策, 2020, 36(7): 30-33. SHEN Q Q, WANG Y, HUANG Y, et al. Grey verhulst-Markov model with improved initial value and its application[J]. Statistics & Decision, 2020, 36(7): 30-33. (in Chinese)
[7]	DE MEDRANO R, AZNARTE J L. A spatio-temporal attention-based spot-forecasting framework for urban traffic prediction[J]. Applied Soft Computing, 2020, 96: 1-15.
[8]	ZHANG Z C, LI M, LIN X, et al. Multistep speed prediction on traffic networks: a deep learning approach considering spatio-temporal dependencies[J]. Transportation Research Part C: Emerging Technologies, 2019, 105: 297-322. DOI:10.1016/j.trc.2019.05.039
[9]	杜圣东, 李天瑞, 杨燕, 等. 一种基于序列到序列时空注意力学习的交通流预测模型[J]. 计算机研究与发展, 2020, 57(8): 1715-1728. DU S D, LI T R, YANG Y, et al. A sequence-to-sequence spatial-temporal attention learning model for urban traffic flow prediction[J]. Journal of Computer Research and Development, 2020, 57(8): 1715-1728. (in Chinese)
[10]	闫杨, 孙丽珺, 朱兰婷. 基于时空相关性的短时交通流量预测方法[J]. 计算机工程, 2020, 46(1): 31-37. YAN Y, SUN L J, ZHU L T. Short-term traffic flow prediction method based on spatiotemporal relativity[J]. Computer Engineering, 2020, 46(1): 31-37. (in Chinese)
[11]	BOGAERTS T, MASEGOSA A D, ANGARITA-ZAPATA J S, et al. A graph CNN-LSTM neural network for short and long-term traffic forecasting based on trajectory data[J]. Transportation Research Part C: Emerging Technologies, 2020, 112: 62-77. DOI:10.1016/j.trc.2020.01.010
[12]	ZHANG K P, ZHENG L, LIU Z J, et al. A deep learning based multitask model for network-wide traffic speed prediction[J]. Neurocomputing, 2020, 396: 438-450. DOI:10.1016/j.neucom.2018.10.097
[13]	YIN X, WU G, WEI J, et al. Multi-stage attention spatial-temporal graph networks for traffic prediction[J]. Neurocomputing, 2021, 428: 42-53. DOI:10.1016/j.neucom.2020.11.038
[14]	徐冰冰, 岑科廷, 黄俊杰, 等. 图卷积神经网络综述[J]. 计算机学报, 2020, 43(5): 755-780. XU B B, CEN K T, HUANG J J, et al. A survey on graph convolutional neural network[J]. Chinese Journal of Computers, 2020, 43(5): 755-780. (in Chinese)
[15]	BOUKERCHE A, WANG J H. A performance modeling and analysis of a novel vehicular traffic flow prediction system using a hybrid machine learning-based model[J]. Ad Hoc Networks, 2020, 106: 1-10.
[16]	ZHAO L, SONG Y J, ZHANG C, et al. T-GCN: a temporal graph convolutional network for traffic prediction[J]. IEEE Transactions on Intelligent Transportation Systems, 2020, 21(9): 3848-3858. DOI:10.1109/TITS.2019.2935152
[17]	CUI Z Y, HENRICKSON K, KE R M, et al. Traffic graph convolutional recurrent neural network: a deep learning framework for network-scale traffic learning and forecasting[J]. IEEE Transactions on Intelligent Transportation Systems, 2020, 21(11): 4883-4894. DOI:10.1109/TITS.2019.2950416
[18]	陈喜群, 周凌霄, 曹震. 基于图卷积网络的路网短时交通流预测研究[J]. 交通运输系统工程与信息, 2020, 20(4): 49-55. CHEN X Q, ZHOU L X, CAO Z. Short-term network-wide traffic prediction based on graph convolutional network[J]. Journal of Transportation Systems Engineering and Information Technology, 2020, 20(4): 49-55. (in Chinese)
[19]	YU B, LEE Y J, SOHN K. Forecasting road traffic speeds by considering area-wide spatio-temporal dependencies based on a Graph Convolutional Neural network(GCN)[J]. Transportation Research Part C: Emerging Technologies, 2020, 114: 189-204. DOI:10.1016/j.trc.2020.02.013
[20]	PAVLYUK D. Feature selection and extraction in spatiotemporal traffic forecasting: a systematic literature review[J]. European Transport Research Review, 2019, 11: 1-5. DOI:10.1186/s12544-018-0328-2
[21]	ERMAGUN A, LEVINSON D. Spatiotemporal traffic forecasting: review and proposed directions[J]. Transport Reviews, 2018, 38(6): 786-814. DOI:10.1080/01441647.2018.1442887
[22]	孔繁钰, 周愉峰, 陈纲. 基于时空特征挖掘的交通流量预测方法[J]. 计算机科学, 2019, 46(7): 322-326. KONG F Y, ZHOU Y F, CHEN G. Traffic flow prediction method based on spatio-temporal feature mining[J]. Computer Science, 2019, 46(7): 322-326. (in Chinese)