时空图卷积网络:一种用于交通预测的深度学习框架

由于交通流的高度非线性和复杂性,传统方法不能满足中长期预测任务的要求,其往往忽略了空间和时间依赖性。在本文中,我们提出了一种新的深度学习框架,时空图卷积网络(STGCN),以解决交通领域的时间序列预测问题(即交通预测)。我们不使用正则卷积和循环单元,而是在图上描述问题,并建立具有完整卷积结构的模型,这使得训练速度更快,参数更少。该体系结构包括几个时空卷积块,它们是图形卷积层和卷积序列学习层的组合,用于建模空间和时间依赖性。这在交通研究中首次应用纯卷积结构从图形结构的时间序列中同时提取时空特征。

交通研究中,交通流的基本变量,即速度、交通量和密度,通常被选为监测交通状况的当前状态的和预测未来的指标。根据预测的长度,交通预测通常分为两个尺度:短期(5∼ 30分钟),中长期(超过30分钟)。大多数流行的统计方法(例如,线性回归)都能很好地进行短期预测。然而,由于交通流的不确定性和复杂性,这些方法对于相对长期的预测效果较差。

以往关于中长期交通预测的研究大致可分为动态建模和数据驱动方法两大类。动态建模:使用数学工具(如微分方程)和物理知识通过计算模拟来描述交通问题。要达到稳定状态,仿真过程不仅需要复杂的系统编程,而且要消耗大量的计算能力。模型中不切实际的假设和简化也会降低预测的准确性。因此,随着交通数据采集和存储技术的飞速发展,大量的研究人员将目光转向了数据驱动的方法。

经典统计模型和机器学习模型是数据驱动方法的两个主要代表。时间序列分析中,ARIMA及其变体是基于经典统计学的最综合的方法之一。受到时间序列平稳假设的限制,也没有考虑时空相关性。因此,这些方法对于高度非线性交通流的表达性受限。近年来,经典统计模型在交通预测任务中受到了机器学习方法的有力挑战。这些模型,如k近邻算法(KNN)、支持向量机(SVM)和神经网络(NN),可以实现更高的预测精度和更复杂的数据建模。近年深度学习相关工作取得了重大进展,但这些密集网络很难从输入中联合提取时空特征,此外,在狭隘的限制甚至完全没有空间属性的情况下,这些网络的代表能力将受到严重阻碍。

为了充分利用空间特征,使用卷积神经网络(CNN)捕捉交通网络之间的相邻关系,同时在时间轴上使用递归神经网络(RNN)。用于序列学习的循环网络需要迭代训练,这将逐步引入误差累积。此外,基于RNN的网络(包括LSTM)众所周知难以训练且计算量大。

为了克服这些问题,我们引入了几种策略来有效地模拟交通流的时间动态和空间依赖性。为了充分利用空间信息,我们通过公共图对交通网络进行建模,而不是单独处理它(例如网格或线段)。为了解决循环网络的固有缺陷,我们在时间轴上采用了全卷积结构。

交通量预测是一个典型的时间序列预测问题,即给定之前的M个交通量观测值,预测下一个H时间步中最可能的交通量测量值(例如速度或交通流)。

其中,是在时间步t的n个路段的观测向量,其每个元素记录了单个路段的历史观测。在这项工作中,我们定义了一个图上的交通网络,重点关注结构化的交通时间序列。观测值vt不是独立的,而是在图中成对连接。

图结构的交通数据。每个vt代表时间t上当前交通状态的一个帧,该帧记录在图结构数据矩阵中。vt可以看作是在带权wij的图G上定义的图信号。在第t时间步,在图中,Vt是有限顶点集,对应于交通网络中n个监测站的观测值。代表Gt的带权邻接矩阵。

图上的卷积

基于谱图卷积的概念,我们引入图卷积算子的概念,作为信号和核Θ的乘积。

其中图傅里叶基是归一化图拉普拉斯()的特征向量矩阵。是L的特征值的对角矩阵。根据这一定义,图形信号x被内核Θ用Θ与图形傅里叶变换之间相乘进行过滤。

本文提出的模型

网络架构,将详细介绍提出的时空图卷积网络(STGCN)的架构。STGCN由几个时空卷积块组成,每个时空卷积块形成一个“三明治”结构,两个门控序列卷积层和中间一个空间图卷积层

 时空图卷积网络的体系结构。STGCN框架由两个时空卷积块(ST-Conv块)和最后一个全连接的输出层组成(左)。每个ST-Conv块包含两个时间门控卷积层和中间的一个空间图卷积层(中)。在每个块内部有应用残余连接和瓶颈策略。输入被ST-Conv块统一处理,来连贯的探索空间和时间依赖关系。综合特征由输出层集成,以生成最终预测ˆv。

图卷积网络用于提取空间特征。

交通网络通常组织为图结构,用数学方法将道路网络表示为图。之前的研究忽略了交通网络的空间属性:网络的连通性和全局性被忽略,因为它们被分割成多个段或网格。我们的模型中,图卷积直接用于图结构数据,以提取空间域中具有高度意义的模式和特征。由于图的Fourier基的O(n2)复杂度乘法,公式(2)计算图卷积中的核Θ可能会很昂贵,有两种近似策略用于克服这个问题。

切比雪夫多项式逼近

使滤波器局部化并减少参数数量,核Θ可以被限制为Λ的多项式,其中是多项式系数向量。K是图卷积的核大小,它决定了从中心节点的最大卷积半径。传统上,切比雪夫多项式被用来将核近似为K-1阶的截断展开,其中缩放的λmax代表L的最大特征值。图卷积可以重新写为其中是在缩放的拉普拉斯下计算的k阶切比雪夫多项式。通过多项式逼近来递归的计算K局部卷积

一阶近似

分层线性公式可以通过堆叠多个带有图拉普拉斯一阶近似的局部图卷积层来定义。更深层次的体系结构可以被构建来恢复深层空间信息。由于神经网络中的缩放和归一化,我们可以进一步假设λmax≈ 2.,因此式3可以被简化成其中 是两个核共享参数,为了约束参数和稳定数值性能,可以被一个参数替代,设。W和D是重整后的,即,因此图卷积可以表示为

在垂直方向上应用一阶近似的图卷积堆栈,获得与K局部卷积水平方向相似的效果,所有这些卷积都利用了来自中心节点的(K−1)阶邻域的信息,在这种情况下,K是模型中连续过滤操作或卷积层的数量。此外,分层线性结构对于大型图来说是参数经济且高效的,因为近似的阶数仅限于一

图卷积的泛化

 定义在上图卷积算子可以拓展到多维张量。比如对于有Ci个通道的信号,图卷积可以通过拓展,其中有个切比雪夫系数向量(Ci和Co分别是输入和输出的特征大小)。二维变量的图卷积具体来说,交通预测的输入由M帧道路图组成,每一帧vt都可以看作一个矩阵,其列i是在图Gt在第i个节点的vt的Ci维的值,表示为。对于每个时间步t(总共M个时间步),将具有相同核Θ的等图卷积运算并行施加于。因此,图卷积可以进一步推广到三维变量中

 

 

 

 

 

 

 

 

 

 

 

 

 

 

ti 

 

 

文章出处登录后可见!

已经登录?立即刷新

共计人评分,平均

到目前为止还没有投票!成为第一位评论此文章。

(0)
xiaoxingxing的头像xiaoxingxing管理团队
上一篇 2022年5月9日
下一篇 2022年5月9日

相关推荐