基于高斯混合-变分自编码器的轨迹预测算法

引用本文

张显炀, 朱晓宇, 林浩申, 等. 基于高斯混合-变分自编码器的轨迹预测算法[J]. 计算机工程, 2020, 46(7), 50-57. DOI: 10.19678/j.issn.1000-3428.0055074.

ZHANG Xianyang, ZHU Xiaoyu, LIN Haoshen, et al. Trajectory Prediction Algorithm Based on Gaussian Mixture-Variational Autoencoder[J]. Computer Engineering, 2020, 46(7), 50-57. DOI: 10.19678/j.issn.1000-3428.0055074.

基金项目

国防科技"引领"基金（18-163-00-75-004-078-01）

作者简介

张显炀(1995-), 男, 硕士研究生, 主研方向为机器学习、行为预测;
朱晓宇, 硕士;
林浩申, 博士;
刘刚, 教授、博士;
安喜彬, 博士

文章历史

收稿日期：2019-05-30
修回日期：2019-07-10

Contents Abstract Full text Figures/Tables PDF

基于高斯混合-变分自编码器的轨迹预测算法

张显炀 , 朱晓宇 , 林浩申 , 刘刚 , 安喜彬

火箭军工程大学核工程学院, 西安 710025

收稿日期：2019-05-30；修回日期：2019-07-10

基金项目：国防科技"引领"基金（18-163-00-75-004-078-01）

作者简介：张显炀(1995-), 男, 硕士研究生, 主研方向为机器学习、行为预测; 朱晓宇, 硕士; 林浩申, 博士; 刘刚, 教授、博士; 安喜彬, 博士.

E-mail: zhangxyang177@163.com

摘要：海面舰船的轨迹预测对预测精度和实时性具有较高要求，而舰船轨迹数据特征的高复杂度特性，导致传统预测算法精度低、耗时长，难以达到良好的预测效果。为此，提出一种基于变分自编码器的海面舰船轨迹预测算法。将轨迹坐标数据集转化为轨迹移动矢量集，使用变分自编码器完成轨迹运动特征的提取与生成预测。同时为提高轨迹预测精度，将变分自编码网络的隐空间分布设定为混合高斯分布，使其更符合真实的数据分布特征，并在隐空间完成轨迹特征的分类，实现端到端的轨迹预测。仿真结果表明，相较于传统预测算法GMMTP和VAETP，该算法的预测误差分别降低了85.48%和35.59%。

Trajectory Prediction Algorithm Based on Gaussian Mixture-Variational Autoencoder

ZHANG Xianyang , ZHU Xiaoyu , LIN Haoshen , LIU Gang , AN Xibin

School of Nuclear Engineering, Rocket Force University of Engineering, Xi'an 710025, China

Abstract: The trajectory prediction of warships requires high accuracy and real-time performance, but the high complexity of trajectory data features of warships causes the traditional prediction algorithms to be inaccurate and time-consuming, reducing prediction performance.To address the problem, this paper proposes a warship trajectory prediction algorithm based on Variational Autoencoder(VAE).The trajectory coordinate data set is transformed into a trajectory motion vector set, and the trajectory motion features are extracted and generated by using variational autoencoder.Also, in order to improve the prediction accuracy, the hidden space distribution of the variational autoencoding network is set to be mixture Gaussian distribution, which is closer to the features of real data distribution.Then the classification of trajectory features is accomplished in hidden space to implement end-to-end trajectory prediction.Simulation results show that compared with the traditional trajectory prediction algorithms, GMMTP and VAETP, the proposed algorithm can reduce the prediction error rate by 85.48% and 35.59% respectively.

0 概述

轨迹预测的目的是通过分析移动目标的历史轨迹挖掘数据特征, 从而得到轨迹数据模型, 进一步实现轨迹的时空预测^[1]。通过对舰船的历史轨迹数据建模并研究相应的求解算法进行舰船轨迹预测, 可以为海洋作业如海上搜救、海洋运输等提供重要保障。海面舰船与地面道路车辆的不同主要有两点:一是轨迹约束不同, 海面舰船轨道约束和速度约束弱, 其运动的随机性较大, 运动模式多样, 运动规律多变; 二是轨迹数据来源方式不同, 车辆轨迹数据通常可以通过GPS定位得到, 而海面舰船的轨迹一般是通过侦察卫星观测而来, 其轨迹是离散的数据点, 且受到卫星观测精度的影响, 轨迹数据特征进一步复杂化。因此, 将传统的地面车辆轨迹预测方法应用于海面舰船上不能得到良好的预测结果, 但是海洋作业又对舰船轨迹预测精度和实时性提出较高的要求。

当前轨迹预测常用的方法有卡尔曼滤波器(Kalman Filter, KF)^[2-3]、隐马尔科夫模型(Hidden Markov Model, HMM)^[4]和高斯混合模型(Gaussian Mixture Model, GMM)^[5]。卡尔曼滤波器具有线性、无偏、方差小等特点, 被广泛用于预测问题, 但是该方法需要做大量的矩阵运算从而缺乏实时性, 常用于道路车辆等运动模型简单的目标的轨迹预测。隐马尔科夫模型本质上是对时间序列的预测, 但是对噪声没有较好的鲁棒性, 并且随着数据集的增大, 预测误差会不断累积。高斯混合模型是一种被广泛应用的基于概率统计的预测模型, 模型中的轨迹数据由多个高斯过程线性组合产生, 通过高斯混合建模并使用最大似然估计(Expectation-Maximization, EM)算法求取模型参数, 再通过高斯混合回归实现轨迹预测。文献[6]表明, 对于轨迹数据较多的情况, GMM方法在预测精度和实时性上性能均优于KF和HMM方法。目前, GMM方法在车辆轨迹预测^[7-8]、智能交通^[9]、数据聚类^[10-11]等领域都得到了较好的应用。由于车辆的行进轨迹受到道路、速度等诸多约束, 其移动规律和数据特征较为简单, 因此GMM的预测误差小。但是当数据的复杂度提高时, GMM方法不再具有良好的适用性, 并且随着数据集的增大, GMM方法的计算代价也会指数级增加。因此, 针对舰船轨迹的特征, 亟需研究计算代价低、预测精度高的轨迹预测算法。

轨迹预测的本质是通过训练模型获得模型参数, 再利用模型进行预测生成, 这与变分自编码器(Variational Autoencoder, VAE)^[12]的设计思想相近。变分自编码器是当前被广泛应用的一种无监督生成模型^[13-14], 能够解决无标签的机器学习问题^[15-16]。它通过神经网络将原始的高维数据编码到低维的隐空间, 再根据解码网络生成原始数据的逼近值。在经典的变分自编码器中, 隐变量的后验分布通常被假设为简单的分布, 例如标准正态分布, 这导致低维隐空间的表示和对隐空间的特征描述过于简单, 一旦原始训练数据集复杂度提高, 模型生成的精度将达不到要求。为解决该问题, 文献[17-18]通过假设更复杂的先验分布形式来提高模型生成和预测的准确性。如何将VAE方法应用到轨迹预测问题上, 并通过合理假设隐空间的先验分布, 使其更符合真实的数据分布, 是当前需要解决的问题。

本文研究海面舰船的轨迹预测问题, 提出一种基于高斯混合先验-变分自编码器(GMVAE)的轨迹预测算法。将轨迹坐标转化为轨迹矢量, 并以位移矢量表示预测目标的位置坐标, 利用VAE完成轨迹特征的提取与生成预测。针对海面舰船的轨迹数据特点, 将隐空间的先验分布假设为混合高斯分布, 使其更符合真实的数据特征, 同时在隐空间引入类别标签, 完成对数据特征的分类。

1 海面舰船轨迹预测模型 1.1 轨迹预测问题描述

海面舰船的轨迹数据通常由卫星观测获得^[19], 因此, 舰船的轨迹由离散的经纬坐标点构成。本文假设舰船在二维平面上移动, 将上述经纬度坐标看作平面坐标, 以T表示n条轨迹组成的数据集:

$ {\mathit{\boldsymbol{T}} = \{ {T_1}, {T_2}, \cdots , {T_n}\} } $

(1)

$ {{\mathit{\boldsymbol{T}}_i} = \{ ({x_{i1}}, {y_{i1}}), ({x_{i2}}, {y_{i2}}), \cdots , ({x_{il}}, {y_{il}})\} } $

(2)

其中, T_i表示第i条轨迹, (x_ij, y_ij)表示第i条轨迹在j时刻的坐标点, l是第i条轨迹数据的长度, 即该条轨迹包含坐标点的数量。

假设舰船轨迹在x和y方向上相互独立, 在本文中, 均以x方向上的轨迹预测问题为例, y方向上的同理可得。设x轴方向上的真实轨迹数据集为X:

$ \mathit{\boldsymbol{X}} = {({x_1}, {x_2}, \cdots , {x_n})^{\rm{T}}} $

(3)

其中, x_i=(x_i1, x_i2, …, x_il)表示第i条轨迹, l是第i条轨迹的长度。设在x轴方向上预测得到的轨迹数据集为${\mathit{\boldsymbol{\hat X}}}$:

$ \mathit{\boldsymbol{\hat X}} = {({\hat x_1}, {\hat x_2}, \cdots , {\hat x_i}, \cdots , {\hat x_n})^{\rm{T}}} $

(4)

其中, ${{\hat x}_i} = \left( {{{\hat x}_{i1}}, {{\hat x}_{i2}}, \cdots , {{\hat x}_{ik}}} \right)$表示第i条轨迹的预测结果, k表示预测轨迹的长度, 即轨迹中包含坐标点的数量。轨迹预测问题可以描述为:

$ \mathit{\boldsymbol{\hat X}} = {\psi _\lambda }(\mathit{\boldsymbol{X}}) $

(5)

其中, ψ_λ表示轨迹预测模型, λ表示模型参数。

在通常情况下, 轨迹数据集X较大, 如本文的仿真数据集就包含约10 000条轨迹。KF方法是对每条轨迹进行逐条预测, 加上大量的矩阵运算必然导致计算代价高。HMM方法虽然不必逐条预测, 但是其预测误差会随着预测长度的递增不断累积, 本身的迭代计算复杂度也非常高。因此, 上述两种算法均不适用于舰船的轨迹预测。GMM方法虽然可以避免大量的矩阵运算, 在一些简单的轨迹预测问题上, 其实时性和精度均优于上述两种算法^[6], 但是该方法需要计算完整轨迹数据的对数似然关于某个分布的期望, 对于复杂度很高的舰船轨迹数据, 其耗时会随着数据集的增大呈指数级增长, 这在实际的预测中是不可取的。为解决样本数据集增大带来的计算代价增大问题, 同时又保证轨迹预测精度, 本文提出一种基于变分自编码的轨迹预测算法。

1.2 基于变分自编码器的轨迹预测算法

最简单的变分自编码器包含3层神经网络, 即输入层、隐层和输出层, 如图 1所示。输入层到隐层是一个编码过程, 目的是将原始的数据编码到隐层中。隐层到输出层是一个解码的过程, 目的是将隐层中的变量解码得到对应于输入数据X的逼近值${\mathit{\boldsymbol{\hat X}}}$。编码器与解码器通过最小化重构误差^[20]来更新其中的神经网络参数。

	Download: JPG larger image
图 1 变分自编码器结构 Fig. 1 Structure of variational autoencoder

VAE首先在经典编码器基础上融入变分贝叶斯思想, 通过对原始轨迹数据集的训练, 使得高维复杂轨迹输入数据X经过编码网络将目标运动特征映射到一个低维隐层概率分布中, 然后通过在隐层概率分布中采样, 并经过解码网络生成预测轨迹数据${\mathit{\boldsymbol{\hat X}}}$。可以看出, 原始轨迹数据集X的复杂度虽然很高, 但是经过编码后的隐层分布往往是一个简单的易处理的分布。编码过程实现了数据的降维, 并提取到了轨迹数据的关键特征, 由此可根据关键特征完成预测生成。相比于GMM方法, VAE避免了对庞大的原始轨迹数据集直接进行运算带来的计算代价高昂的问题, 适用于海面舰船的轨迹预测问题。

2 基于改进变分自编码器的轨迹预测算法

本节首先对舰船轨迹数据集进行矢量化和归一化处理, 得到轨迹运动矢量集, 从而与变分自编码器结合完成轨迹的特征提取与生成预测; 然后改进了经典VAE的隐空间网络结构, 从而进一步提高轨迹预测精度。

2.1 海面舰船轨迹数据预处理 2.1.1 轨迹矢量集转化

VAE进行轨迹预测的本质是使输出${\mathit{\boldsymbol{\hat X}}}$尽可能地逼近输入X。假设输入轨迹为位置序列X, 其输出便是与训练集轨迹位置序列相似的预测轨迹, 这种预测方法没有用到目标当前的位置信息, 即预测生成的轨迹与当前目标的位置没有任何关联, 并且在算法中难以使用测试轨迹数据评价算法性能。因此, 本文将舰船的轨迹数据集转化为运动矢量集作为编码器的输入, 将预测舰船下一时刻的坐标转化为预测舰船在下一时刻的位移。对轨迹数据集X进行如下转化:

$ \mathit{\boldsymbol{V}} = \{ {\mathit{\boldsymbol{V}}_1}, {\mathit{\boldsymbol{V}}_2}, \cdots , {\mathit{\boldsymbol{V}}_n}\} $

(6)

其中, V_i=(x₁ⁱ, x₂ⁱ, …, x_(l-1)ⁱ)表示第i条轨迹在x轴方向上的矢量集, 且x_jⁱ=(x_i(j+1)-x_ij)。利用VAE完成若干个时刻间舰船位移的预测, 然后将预测结果按时间序列进行累加, 还原出预测的轨迹位置序列, 即可完成轨迹预测。

2.1.2 数据归一化

为使VAE的训练过程能够收敛到最优解, 需要对上述矢量集数据进行归一化处理。归一化公式如下:

$ {x_{{\rm{ nomal }}}} = \frac{1}{{{x_{{\rm{max}}}} - {x_{{\rm{min}}}}}}(x - {x_{{\rm{min}}}}) $

(7)

其中, x_max、x_min为输入轨迹数据的最大值和最小值。按照上述归一化公式, 可以得到模型的输入V_normal。

2.2 VAETP算法

在基于经典VAE的轨迹预测算法(VAETP)中, 编码网络将轨迹数据映射到隐空间Z以提取数据特征, 得到隐变量z的后验分布。引入标准高斯分布作为z的先验分布, 通过最小化后验与先验分布之间的KL距离, 达到训练编码网络参数的目的。预测的轨迹数据通过从z中采样和解码获得。在采样过程中, 为了能够进行参数更新, 使用了参数重构^[11]方法, 对于小样本轨迹数据可以获得良好的预测结果。VAETP网络架构如图 2所示。

	Download: JPG larger image
图 2 VAETP网络架构 Fig. 2 Network architecture of VAETP

VAE的基本思想是假定轨迹数据V是对某个随机过程采样得到的, 每条轨迹样本由隐变量z决定。轨迹数据的生成过程为:首先从先验概率分布p_θ(z)中采样得到样本z, 然后根据条件概率分布函数p_θ(V|z)解码得到轨迹样本, 但是生成过程中解码参数θ和隐变量z的信息未知, 并且无法计算隐变量z的后验概率q_φ(z|V)。所以, VAE统一用神经网络进行拟合。根据边缘概率公式, 似然函数^[12]可以写为:

$ {\rm{lo}}{{\rm{g}}_a}{\kern 1pt} p(\mathit{\boldsymbol{V}}) = {D_{{\rm{KL}}}}[{q_\varphi }(z|\mathit{\boldsymbol{V}})|{\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} |{p_\theta }(z|\mathit{\boldsymbol{V}})] + L(\varphi , \theta ;\mathit{\boldsymbol{V}}) $

(8)

$ \begin{array}{*{20}{l}} {L(\varphi , \theta ;\mathit{\boldsymbol{V}}) = {E_{{q_\varphi }}}[ - {\rm{lo}}{{\rm{g}}_a}{\kern 1pt} {\kern 1pt} {q_\varphi }(z|\mathit{\boldsymbol{V}}) + {\rm{lo}}{{\rm{g}}_a}{\kern 1pt} {\kern 1pt} {p_\theta }(z, \mathit{\boldsymbol{V}})] = }\\ {{\kern 1pt} {\kern 1pt} {\kern 1pt} - {D_{{\rm{KL}}}}({q_\varphi }(z|\mathit{\boldsymbol{V}})|{\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} |{p_\theta }(z)) + {E_{{q_\varphi }}}[{\rm{lo}}{{\rm{g}}_a}{\kern 1pt} {\kern 1pt} {p_\theta }(\mathit{\boldsymbol{V}}|z)]} \end{array} $

(9)

其中, L(φ, θ; V)为变分下界, 也是VAE网络的损失函数; φ、θ为编码和解码网络的参数。在式(9)中:第1项称为KL散度项^[21], 用于衡量后验分布与先验分布的相似程度, 通过优化该项可以使得后验q_φ(z|V)逼近先验p_θ(z), 从而防止模型过拟合; 第2项是一个对数似然估计, 相当于自编码器中的重构误差损失函数, 用于重构原始样本数据。由于KL散度的非负性, 最大化似然函数问题转化为了最大化变分下界的问题。

VAETP运用Adam算法^[22]进行编码和解码网络参数的更新。编码网络的参数φ更新过程如式(10)~式(13)所示, 解码网络的参数θ更新过程同理可得。

$ {{v_i} = {\beta _1} \times {v_{i - 1}} - (1 - {\beta _1}) \times {g_i}} $

(10)

$ {{s_i} = {\beta _2} \times {s_{i - 1}} - (1 - {\beta _2}) \times g_i^2} $

(11)

$ {\Delta {\varphi _i} = - \eta \frac{{{v_i}}}{{\sqrt {{s_i} + \varepsilon } }} \times {g_i}} $

(12)

$ {{\varphi _{i + 1}} = {\varphi _i} + \Delta {\varphi _i}} $

(13)

其中, η为初始的学习率, β₁、β₂、ε为超参数, g_i为φ在第i次训练时的梯度, v_i为g_i的指数加权平均, s_i为g_i²的指数加权平均。通过式(10)和式(11)分别得到参数φ的梯度指数平均和梯度平方的指数平均, 通过式(12)得到第i次训练时梯度的变化量, 通过式(13)得到参数φ更新以后的值。当变分下界收敛时, 编码网络的输出是提取的目标轨迹特征, 解码网络的输出是生成的预测轨迹, 并且轨迹预测长度可以通过设置解码网络输出层的节点数进行调整。

当数据集的复杂度提高, 如轨迹数据包含若干种运动模式, 或者V的分布是复杂的高维分布时, 映射得到的隐空间复杂度随之提高。此时式(9)中z的先验分布对隐空间的描述不能完全刻画原始数据隐空间的特征, 从而导致VAETP算法进行轨迹生成和预测精度不够准确。对此, 通常的解决方法是先对数据进行分类, 再针对每个类别的轨迹数据分别使用VAE训练, 最终得到若干个网络。轨迹生成和预测的过程, 首先判断轨迹数据所属的类别, 再从该类别隐空间中采样得到预测的轨迹。但在实际中, 原始轨迹数据往往很难实现有效分类, 而且该方法模型的整体契合度不高^[23]。

本文提出的轨迹预测算法, 通过调整隐空间的先验分布形式使其更符合真实的分布, 从而有效地解决VAETP算法采用固定高斯先验缺少变异性的问题, 提高预测的精度。该方法不需要事先对轨迹数据进行分类处理, 而是直接将轨迹矢量数据编码到隐空间, 在隐空间完成轨迹数据的分类, 再经过解码得到预测的轨迹矢量, 实现端到端的轨迹预测。

2.3 基于GMVAE的轨迹预测算法

本节设计了基于GMVAE的轨迹预测算法。通过2.2节的分析可以看出, 在VAETP方法中, 隐空间的先验假设过于简单, 难以逼近真实的轨迹特征, 需要用更复杂的分布来描述。而混合高斯分布几乎可以近似任意复杂的概率分布^[24], 所以, 将隐空间的先验分布假设为混合高斯分布, 可以更准确地描述真实的轨迹特征。

GMVAE的网络结构如图 3所示, 其中, 实线箭头表示编码过程, 虚线箭头表示解码过程。在编码过程中, 轨迹数据V首先经过编码网络q(y|V; φ_y)得到分类标签y, 用来描述轨迹的类别, 然后将标签y和原始轨迹数据V共同编码到隐空间z, 实现轨迹的分类和轨迹特征的提取; 在解码过程中, 根据轨迹类别y从对应的隐空间z中采样, 再解码生成预测的轨迹${\mathit{\boldsymbol{\hat V}}}$。

	Download: JPG larger image
图 3 GMVAE网络架构 Fig. 3 Network architecture of GMVAE

编码和解码过程中变量之间的关系如图 4所示, 其中, V表示轨迹数据, y代表类别标签, z代表隐变量, φ_y、φ_z为编码网络参数, θ_z、θ_V为解码网络参数。

	Download: JPG larger image
图 4 GMVAE编码和解码过程中的变量关系 Fig. 4 Variable relationship of GMVAE encoding process and decoding process

隐变量y、z编码过程表示为:

$ {q_\varphi }(y, z|\mathit{\boldsymbol{V}}) = q(y|\mathit{\boldsymbol{V}};{\varphi _y})q(z|\mathit{\boldsymbol{V}}, y;{\varphi _z}) $

(14)

其中, q(y|V; φ_y)表示y的编码过程, q(z|V, y; φ_z)表示z的编码过程。由此, 原始轨迹数据经过编码网络可以得到隐变量z的后验分布:

$ z|y, \mathit{\boldsymbol{V}}\backsim N({\mu _z}, \sigma _z^2;{\varphi _z}) $

(15)

在解码过程中, V、y和z的联合概率分布可以描述为:

$ \left\{ {\begin{array}{*{20}{l}} {p(\mathit{\boldsymbol{V}}, y, z) = p(y)p(z|y;{\theta _z})p(\mathit{\boldsymbol{V}}|z;{\theta _V})}\\ {y\backsim {\rm{Cat}} (\mathit{\boldsymbol{\pi }})}\\ {z|y\backsim N(\mu (y;{\theta _z}), {\sigma ^2}(y;{\theta _z}))}\\ {\mathit{\boldsymbol{V}}|z\backsim B(\mu (z;{\theta _V}))} \end{array}} \right. $

(16)

其中, y服从分类分布, 其参数π是一个向量π=(π₁, π₂, …, π_K), π_i表示某条轨迹属于第i个类别的概率, K为总的类别个数。每个类别对应的隐空间先验p(z|y; θ_z)是均值为μ(y; θ_z)、方差为σ²(y; θ_z)的高斯分布。因此, 隐变量z的分布为:

$ z\backsim \sum\limits_{i = 1}^K {{\pi _i}} N({\mu _{zi}}, \sigma _{zi}^2) $

(17)

可以看出, 隐变量z的先验实际上是一个混合高斯分布。不同的轨迹类别映射到隐空间后对应着不同的高斯分量, 每个分量的系数即为y分布的参数π。生成模型p(V|z; θ_V)通常假设为伯努利分布, 损失函数为:

$ \begin{array}{*{20}{l}} {L(\theta , \varphi ;\mathit{\boldsymbol{V}}) = {E_{q(y, z|\mathit{\boldsymbol{V}})}}[{\rm{ln}}{\kern 1pt} {\kern 1pt} p(\mathit{\boldsymbol{V}}, y, z) - {\rm{ln}}{\kern 1pt} {\kern 1pt} q(y, z|\mathit{\boldsymbol{V}})] = }\\ {{E_{q(y, z|V)}}[{\rm{ln}}{\kern 1pt} {\kern 1pt} \frac{{p(y)}}{{q(y|\mathit{\boldsymbol{V}})}} + {\rm{ln}}{\kern 1pt} {\kern 1pt} \frac{{p(z|y)}}{{q(z|\mathit{\boldsymbol{V}}, y)}} + {\rm{ln}}{\kern 1pt} {\kern 1pt} p(\mathit{\boldsymbol{V}}|y, z)]} \end{array} $

(18)

其中, ${\rm{ln}}{\kern 1pt} {\kern 1pt} \frac{{p(y)}}{{q(y|\mathit{\boldsymbol{V}})}}$可看作标签损失项, 用于衡量生成的轨迹类别与先验的差异, ${\rm{ln}}{\kern 1pt} {\kern 1pt} \frac{{p(z|y)}}{{q(z|\mathit{\boldsymbol{V}}, y)}}$和ln p(V|y, z)分别是KL散度项和重构项。得到变分下界即损失函数后, 利用式(10)~式(13)描述的Adam算法更新参数, 当变分下界收敛时, 从y中即可得到轨迹数据的标签类别, 从隐变量z中可以得到轨迹特征, 而编码输出即为各个类别的预测轨迹。

3 算法设计与仿真

本节设计GMVTP算法流程, 并通过与传统算法GMMTP、VAETP进行比较, 检验其算法性能。

3.1 算法流程

轨迹数据经过预处理后, 得到的轨迹矢量集V_normal作为VAE网络的输入。训练过程中选取n=400条轨迹, 每条轨迹包含200个轨迹点, 设定轨迹类别总数为K=3。本文使用小批量(mini_batch)^[25]方法进行训练, 将整个训练集划分成若干个小的子训练集, 用V_minibatch表示, 每个子集的大小batchsize=m。参数更新过程可以表示为:

$ {\theta _j} = {\theta _j} - \frac{{\partial L}}{{\partial {\theta _j}}} = {\theta _j} - \frac{1}{m}\sum\limits_{i = 1}^m {\frac{{\partial L({\mathit{\boldsymbol{V}}_i})}}{{\partial {\theta _j}}}} $

(19)

算法每次只在一个V_minibatch上更新梯度, 而不用遍历完整的数据集, 大幅减少了算法收敛所需的迭代次数, 而且可以实现并行化计算。

算法1 GMVTP算法

输入轨迹矢量集V_normal={V₁, V₂, …, V_n}

输出网络参数φ、θ

初始化 随机初始化网络参数φ、θ

For i=1:epochs

For j=1:n/m

V_minibatch←{V_j, V_j+1, ...V_j+m-1}//取m条轨迹数据

For k=1:m

y←q(y|V_k; φ_y)//通过编码网络φ_y生成标签y

μ_z, σ_z, z←q(z|y, V_k; φ_z)//通过编码网络φ_z生成z的后验

z←N(μ(y; θ_z), σ²(y; θ_z))//根据y从相应的先验高斯//分布中采样得到z

V_k|z←B(μ(z; θ_V))//根据z解码出轨迹V_k

L(θ, φ; V_k)//根据式(17)计算损失函数值

g_k←g_k-▽_{φ, θ}L(φ, θ; V_k)//计算梯度

End for

g_j←g_k/m//单个batch数据训练后的梯度更新

φ_j, θ_j←φ_j, θ_j//根据式(10)~式(13)进行参数更新

End for

轨迹生成模型p(V|z; θ_V)的神经网络输入层和输出层节点数200, 其他网络输出层节点设置为64, 迭代次数为epochs。轨迹预测过程为将已知的轨迹前k′(k′ < 200)个点作为网络输入, 经过编码可以得到其类别标签y, 再根据标签y从对应的隐空间z中采样解码生成完整的轨迹, 即可得到预测出的第k′+1个~第200个轨迹点。

3.2 仿真条件设置

本文使用的轨迹数据集是MIT Trajectory Data。该数据集来源于卫星采集数据, 移动目标是在平面上中速移动的机动车辆。因为该轨迹数据在采集类型以及目标运动速度、自由度、路径约束等方面与真实的舰船轨迹类似, 所以通过与真实舰船轨迹数据的仿真结果比较, 该数据集的仿真结果能够较为真实地反映算法的性能。本文的仿真环境配置为CPU Intel^®Core^TMi5-8300H @2.3 GHz, 内存8 GB, 显卡NVIDIA GeForce GTX 1050Ti, 操作系统为Ubuntu16.04。训练过程中的超参数设置如表 1所示。

下载CSV 表 1 训练过程超参数设置 Table 1 Setting of hyperparameters in training process

3.3 仿真结果分析 3.3.1 轨迹训练结果

本节从轨迹数据集中选取600条轨迹作为训练集。图 5为600条轨迹经过矢量化和归一化后的结果, 从中可以看出, 目标运动轨迹主要包含了左高右低、左低右高、中间高两边低3种情况。这3种轨迹对应着隐空间的3类特征, 在仿真中给定K=3。图 6为VAETP经过训练后从隐空间采样得到的120条轨迹, 从中可以看出, VAE虽然能够生成和预测轨迹, 但是相对于原始轨迹, 3种运动特征之间的区别不明显, 这是因为在VAE中, 轨迹数据被视为从一个标准正态分布中采样得到。图 7为GMVTP的生成预测结果, 从中可以看出, 3类轨迹之间区分更加明显, 正是由于隐空间分布是混合高斯分布, 因此能够更准确地描述轨迹特征。图 8为随机选取的120轨迹使用GMVTP进行分类的结果, 不同深线线条分别代表不同特征的轨迹, 从中可以看出, GMVTP可基本实现轨迹的无监督分类。

	Download: JPG larger image
图 5 训练轨迹矢量集 Fig. 5 Vector set of training trajectories

	Download: JPG larger image
图 6 VAETP算法的轨迹生成结果 Fig. 6 Trajectory generation result of VAETP algorithm

	Download: JPG larger image
图 7 GMVTP算法的轨迹生成结果 Fig. 7 Trajectory generation result of GMVTP algorithm

	Download: JPG larger image
图 8 GMVTP算法的轨迹分类结果 Fig. 8 Trajectory classification result of GMVTP algorithm

3.3.2 算法性能比较

本节比较GMVTP和VAETP2种算法在相同训练集大小(800条轨迹)下的收敛性, 迭代步数设置为300。图 9为损失函数变化曲线。从中可以看出, VAETP在迭代150步左右收敛, 而GMVTP在50步左右即收敛。损失函数值间接反映出生成轨迹与原始轨迹之间的差异性, 由于GMVTP的隐空间结构被假设为混合高斯分布, 在训练开始阶段就能够精确近似真实的分布, 因此GMVTP的损失函数值始终小于VAETP并很快收敛。

	Download: JPG larger image
图 9 损失函数变化曲线 Fig. 9 Change curves of loss function

3.3.3 预测精度和时间比较

采用均方根误差(RMSE)计算轨迹预测误差:

$ {\rm{RMSE}} = \sqrt {\frac{1}{k}\sum\limits_{i = 1}^k {{{({x_i} - {{\hat x}_i})}^2}} } $

其中, x_i为轨迹的真实值, ${\hat x}$为预测值, k为预测轨迹点的数量。在仿真中给定轨迹前100个点的值, 预测后100个点的值即k=100。图 10给出了3种预测算法在不同测试集大小情况下的预测误差。可以看出, 相对于GMMTP, VAETP的RMSE平均降低了41.19%, 原因在于VAETP中的编码网络提取到了原始轨迹的特征, 从而能够更精确地生成预测轨迹, 而GMVTP的轨迹预测误差在三者中最小, 相对于GMMTP平均降低了85.48%, 说明GMVTP显著提高了轨迹预测的精度。随着训练集轨迹数量增多, GMMTP算法的预测误差会减小, 这是由于历史轨迹数据的增多引入了的更多先验, 使得预测误差不断降低。VAETP有略微上升是因为随着训练集中轨迹数量的增多, 原始数据的复杂度逐渐提高, 其隐空间真实分布的复杂度也随即提高, 而经典VAE由于隐空间采用了标准正态分布的先验假设, 对真实分布的拟合度必然下降, 进一步导致生成预测误差的增加。相比之下, GMVTP由于隐空间的先验是混合高斯分布, 能够更准确近似真实分布, 预测误差几乎不会受到训练集大小影响, 始终处于较低水平。

	Download: JPG larger image
图 10 3种算法的预测误差比较 Fig. 10 Prediction error comparison of three algorithms

为比较3种算法的实时性, 计算在相同收敛条件下不同训练集大小时算法的运行时间, 实验结果取每种条件下训练30次的平均耗时, 如图 11所示。可以看出, GMMTP的平均训练耗时约为21 s, 最长达到27 s, 而VAETP和GMVTP两种算法的平均耗时在4 s左右。相对于GMMTP算法, 后两种算法的训练耗时平均缩短了80.3%和74.9%, 并且随着训练集的增大, GMMTP的训练时间显著增大, 而VAETP和GMVTP两种算法的训练时间无明显增长。这是由于变分自编码器采用了随机梯度下降法更新网络参数, 避免了GMMTP算法中有关概率分布期望的计算, 同时TensorFlow框架下的GPU与程序之间的联系加速了网络参数的训练。因此, 当轨迹数据集庞大时, 基于VAE的轨迹预测算法优势更加明显。从图中还可以看出, GMVTP的训练时间略多于VAETP, 这是由于GMVTP的网络结构更加复杂, 导致训练时间略微增长, 但从上文的仿真可知, GMVTP的预测误差相比于VAETP平均降低了35.59%, 总体而言其性能优于VAETP。

	Download: JPG larger image
图 11 3种算法训练时间比较 Fig. 11 Training time comparison of three algorithms

综上所述, 本文算法在预测精度和实时性上均优于传统的GMM轨迹预测算法, 有利于实现舰船轨迹的在线预测, 并且由于隐空间先验分布复杂度提高, 该算法能够更精确地描述轨迹数据的特征, 进一步减小预测误差。

4 结束语

海面舰船由于路径约束小, 移动规律多变, 且受到观测手段的影响, 其轨迹数据特征较为复杂。为此, 本文提出一种基于高斯混合-变分自编码器的轨迹预测算法GMVTP。将轨迹坐标转化为轨迹矢量, 利用VAE提取轨迹特征并生成预测结果。针对海面舰船的轨迹数据特点, 改进经典的VAE算法, 将隐空间的先验分布假设为混合高斯分布, 从而使其更符合真实的数据特征分布, 并在隐空间中完成轨迹特征分类, 实现端到端的轨迹预测。仿真结果表明, 该算法在预测精度和实时性上优于传统的GMM模型, 有利于舰船轨迹数据的在线训练与预测, 并且提高了轨迹预测精度。下一步将考虑解决类别总数K的自适应问题以及各个类别概率向量π的训练问题。

参考文献

[1]	SUN Hong, CHEN Suo. Spatio-temporal trajectory prediction algorithm based on clustering based hidden Markov model[J]. Journal of Chinese Computer Systems, 2019, 40(3): 472-476. (in Chinese) 孙红, 陈锁. 一种聚类隐马尔可夫模型的时空轨迹预测算法[J]. 小型微型计算机系统, 2019, 40(3): 472-476.
[2]	CHENG Quan, WANG Chaoli.A method of trajectory prediction based on Kalman filtering algorithm and support vector machine algorithm[C]//Proceedings of 2017 Chinese Intelligent Systems Conference.Berlin, Germany: Springer, 2017: 495-504.
[3]	JIANG Jiaxuan, HUANG Chunlin. Tracking fast steering motion of human target based on adaptive Kalman filter algorithm[J]. Modern Radar, 2019, 40(7): 54-60. (in Chinese) 姜嘉璇, 黄春琳. 人体快转向运动自适应卡尔曼跟踪算法[J]. 现代雷达, 2019, 40(7): 54-60.
[4]	LASSOUED Y, MONTEIL J, GU Y, et al.A hidden Markov model for route and destination prediction[C]//Proceedings of the 20th IEEE International Conference on Intelligent Transportation Systems.Washington D.C., USA: IEEE Press, 2018: 126-135.
[5]	LIN Yi, ZHANG Jianwei, WU Xiping, et al. Study on algorithm for flight trajectory prediction based on GMM[J]. Journal of Sichuan University(Engineering Science Edition), 2018, 50(4): 108-113. (in Chinese) 林毅, 张建伟, 武喜萍, 等. 基于GMM的航班轨迹预测算法研究[J]. 工程科学与技术, 2018, 50(4): 108-113.
[6]	QIAO Shaojie, JIN Kun, HAN Nan, et al. Trajectory prediction algorithm based on Gaussian mixture model[J]. Journal of Software, 2015, 26(5): 1048-1063. (in Chinese) 乔少杰, 金琨, 韩楠, 等. 一种基于高斯混合模型的轨迹预测算法[J]. 软件学报, 2015, 26(5): 1048-1063.
[7]	HU Zhenzhen.Research on trajectory prediction of moving vehicles in uncertain environment[D].Changsha: Changsha University of Science and Technology, 2017.(in Chinese) 胡珍珍.不确定环境下移动车辆轨迹预测研究[D].长沙: 长沙理工大学, 2017. http://cdmd.cnki.com.cn/Article/CDMD-10536-1018260686.htm
[8]	XIA Zhuoqun, HU Zhenzhen, LUO Junpeng. EAVTP:an environment adaptive vehicle trajectory prediction method[J]. Journal of Chinese Computer Systems, 2016, 37(10): 2375-2379. (in Chinese) 夏卓群, 胡珍珍, 罗君鹏. EAVTP:一种环境自适应车辆轨迹预测方法[J]. 小型微型计算机系统, 2016, 37(10): 2375-2379.
[9]	KUANG Xianyan, WANG Chengkun, XU Lunhui. Video-based two-wheel vehicle detection for mixed traffic flow based on combination foreground extraction[J]. Journal of Transportation Systems Engineering and Information Technology, 2014(5): 49-54, 73. (in Chinese) 邝先验, 王成坤, 许伦辉. 基于组合前景提取的混合交通两轮车辆视频检测[J]. 交通运输系统工程与信息, 2014(5): 49-54, 73.
[10]	GE Lige, SUN Wei. Research on floating cluster trajectory clustering of moving object in adaptive Gaussian mixture model[J]. Modern Computer, 2018(23): 3-8. (in Chinese) 葛丽阁, 孙伟. 自适应高斯混合模型海上移动对象浮标轨迹聚类研究[J]. 现代计算机, 2018(23): 3-8.
[11]	JING Xiaogang, GE Lige, SUN Wei. A buoy trajectory clustering algorithm based on Gaussian mixture model[J]. Modern Computer, 2017(36): 3-5, 8. (in Chinese) 荆晓刚, 葛丽阁, 孙伟. 一种基于高斯混合模型的海上浮标轨迹聚类算法[J]. 现代计算机, 2017(36): 3-5, 8.
[12]	KINGMA D P, WELLING M.Auto-encoding variational Bayes[EB/OL].[2019-04-30].https://arxiv.org/abs/1312.6114.
[13]	ZHANG Pengsheng. The generative adversarial network based on variational auto-encoder for face frontalization[J]. Software Guide, 2018, 17(12): 48-51. (in Chinese) 张鹏升. 基于变分自编码器的人脸正面化产生式模型[J]. 软件导刊, 2018, 17(12): 48-51.
[14]	HUANG Guojie, JIN Hui, YU Yibiao. Voice conversion using non-parallel corpora based on enhanced variation auto-encoder[J]. Journal of Signal Processing, 2018, 34(10): 108-113. (in Chinese) 黄国捷, 金慧, 俞一彪. 增强变分自编码器做非平行语料语音转换[J]. 信号处理, 2018, 34(10): 108-113.
[15]	WALKER J, DOERSCH C, GUPTA A, et al.An uncertain future: forecasting from static images using variational autoencoders[C]//Proceedings of European Conference on Computer Vision.Berlin, Germany: Springer, 2016: 835-851.
[16]	PU Y, GAN Z, HENAO R, et al.Variational autoencoder for deep learning of images, labels and captions[C]//Proceedings of NIPS'16.Washington D.C., USA: IEEE Press, 2016: 2352-2360.
[17]	LI Peng.Variational automatic encoder based on Gaussian mixture model[D].Harbin: Harbin Institute of Technology, 2017.(in Chinese) 李鹏.基于高斯混合模型的变分自动编码器[D].哈尔滨: 哈尔滨工业大学, 2017.
[18]	WANG L, SCHWING A, LAZEBNIK S.Diverse and accurate image description using a variational auto-encoder with an additive Gaussian encoding space[C]//Proceedings of NIPS'17.Washington D.C., USA: IEEE Press, 2017: 5756-5766.
[19]	GAO Yilun.Index and prediction of ship simulation trajectory data[D].Harbin: Harbin Engineering University, 2014.(in Chinese) 高翊伦.舰船仿真轨迹数据索引及预测研究[D].哈尔滨: 哈尔滨工程大学, 2014.
[20]	TITOV I, KHODDAM E.Unsupervised induction of semantic roles within a reconstruction-error minimization framework[C]//Proceedings of 2015 Conference of the North American Chapter of the Association for Computational Linguistics.Denver, USA: Association for Computational Linguistics, 2015: 1-10.
[21]	LECUN Y, BENGIO Y, HINTON G. Deep learning[J]. Nature, 2015, 521(7553): 436-444.
[22]	GOODFELLOW L, BENGIO Y, COURVILLE A.Deep learning[M].Translated by ZHAO Shenjian, LI Yujun, FU Tianfan, et al.Beijing: Posts and Telecom Press, 2017.(in Chinese) GOODFELLOW L, BENGIO Y, COURVILLE A. 深度学习[M].赵申剑, 黎彧君, 符天凡, 等译.北京: 人民邮电出版社, 2017.
[23]	ZHU Zisheng.Research and implementation of vehicle trajectory prediction algorithm based on neural network[D].Xi'an: Xidian University, 2018.(in Chinese) 朱自升.基于神经网络的车辆轨迹预测算法的研究与实现[D].西安: 西安电子科技大学, 2018. http://cdmd.cnki.com.cn/Article/CDMD-10701-1019011189.htm
[24]	BISHOP C M. Pattern recognition and machine learning(information science and statistics)[M]. New York, USA: Springer-Verlag New York, Inc., 2006.
[25]	METEL M R.Mini-batch stochastic gradient descent with dynamic sample sizes[EB/OL].[2019-04-30].https://www.researchgate.net/publication/.