大数据、人工智能等新兴技术的飞速发展，为轨道交通智慧化的运营组织和客流管控提供了思路和方法。城市轨道交通短时客流预测是构建智慧轨道交通系统的重要研究内容，包括短时进站流预测、短时OD流预测以及短时断面流预测

以深度学习为代表的人工智能技术为城市轨道交通短时客流预测的进一步发展提供了契机，详细介绍深度学习在轨道交通领域的应用现状，在此基础上，以轨道交通短时进站流预测为应用背景，以“数据获取-数据预处理-应用实战”为主线

Table of Contents

一、人工智能在轨道交通运营管理的主流研究方向

短时客流预测

根据其研究对象可分为道路交通短时客流预测、公交短时客流预测、城市轨道交通短时客流预测、铁路短时客流预测等

根据样本的总体分布是否已知，可分为参数预测模型和非参数预测模型

根据预测模型线性与否，可分为线性预测模型和非线性预测模型

根据预测过程嵌入的模型数量，可分为单一预测模型和混合预测模型

根据预测模型的发展历程，可分为传统的基于数理统计的预测模型、基于机器学习的预测模型、基于深度学习的预测模型

何谓短时”是需要明确的首要问题，为此，随机选取了50篇相关参考文献，统计其用于短时客流预测的时间粒度，统计结果如图所示

结果显示，用于预测的时间粒度分布从1分钟至1小时不等，考虑到实用性、经济性、必要性、可行性等原因， 2分钟至30分钟内的短时客流预测居多，且本次统计中也并未发现60分钟以上的短时客流预测相关研究

关于城市轨道交通短时客流预测，“预测对象”是需要明确的另外一个问题，根据系统内客流属性的不同，短时客流预测对象可分为

短时进站流预测，用于解决轨道交通系统乘客短时期内“从哪里来”

短时OD流预测，用于解决轨道交通系统乘客短时期内“到哪里去”

短时断面流预测，用于解决轨道交通系统乘客短时期内“走哪条路

纵观短时客流预测的发展历程，大致可分为三个阶段：

第一个阶段为传统的基于数理统计的模型

例如历史平均模型（Historical average model，HA）、最小二乘法、ARIMA、逻辑回归、卡尔曼滤波模型、K近邻模型等。该阶段由于城市轨道交通并未大规模发展，短时客流预测相关研究也多数针对道路交通，因此，城市轨道交通领域相关研究较为匮乏，而在道路交通领域，由于该类模型存在一些不足，例如“实时性”较差，预测精度较低，即无法满足短时客流预测的实时性要求和预测精度要求，因此该阶段开发的模型至今多数已不再应用

第二个阶段为基于机器学习的模型

随着机器学习的发展，一些机器学习模型和混合预测模型被逐渐应用至短时客流预测领域，例如利用决策树、随机森林、多层感知机（Backpropagation neural networks，BPNNs）、支持向量机（Support vector machine，SVM）模型等

随着城市轨道交通的发展，基于机器学习的模型逐渐被应用至城市轨道交通领域，模型既包括单一预测模型，也包括一种或多种模型结合使用的混合预测模型，例如动态贝叶斯网络和高斯混合模型的结合，ARIMA模型和小波分解、支持向量机、BPNNs等的结合。相对传统的基于数理统计的预测模型，该类模型具有更高的预测精度，但多数该阶段的模型无法考虑车站之间更为复杂的时空相关性

第三个阶段为基于深度学习的模型

作为机器学习的一个分支，深度学习近几年得到了快速发展，其良好的预测表现能力极大促进了交通预测领域的革新，该阶段循环神经网络RNN，卷积神经网络CNN，图卷积神经网络GCN等相继被挖掘应用至短时客流预测，大量深度学习框架也随即被开发出来

用于短时客流预测的深度学习模型大致可被分为：基于循环神经网络的模型、基于卷积神经网络的模型、基于图卷积神经网络的模型以及各种基于深度学习框架的模型

基于循环神经网络的模型：深度学习早期阶段涌现出了大量基于RNN的模型进行短时客流预测，长短时记忆网络LSTM模型和门控循环单元（Gated recurrent unit，GRU）模型便是最具代表性的两个RNN模型，能够学习并记忆时间序列中的长期依赖，一定程度上解决普通RNN模型的梯度消失和梯度爆炸的问题，在自然语言处理、模式识别等领域已有极为成熟的应用

2015年，LSTM被首次应用至短时交通速度预测领域，2016年，GRU被首次引入短时客流预测领域。总体而言，循环神经网络相关的模型虽然能够较好地捕捉客流的时间特征，但无法捕捉车站之间的空间特征，且无法采用并行计算进行训练加速，模型训练时间较长

基于图卷积神经网络的模型：GCN由于能够借助邻接矩阵将网络结构信息嵌入至模型构建过程中，近年来获得了学者的大量关注。基于GCN的模型能够考虑交通网络的时空依赖特性，尤其能够考虑车站、道路、区域间的拓扑结构信息，非欧式交通数据的结构信息也能够被充分利用，且相对于RNN和CNN，GCN具有更快的训练效率和更少的超参数，因此，大量学者将GCN应用至短时客流预测领域。为了考虑不同种类的邻接关系，例如邻近性、连通性、功能相近性等，部分学者构建了多图卷积神经网络进行短时客流预测。为了考虑构建的网络图中不同连接的重要性程度，图注意力网络（Graph attention network，GAT）被应用至短时客流预测研究。在城市轨道交通领域，部分学者将GCN引入了地铁的短时客流预测领域，并在模型中考虑了客流的实时模式、日模式、周模式等特征，车站之间的邻接关系被有效刻画。图卷积神经网络一般只能使用浅层网络（一至四层居多），当构建深层次图网络时，模型表现能力就会变差，因此无法像CNN使用残差连接构建深度神经网络，深层次的高阶空间特征也就无法被有效捕捉

基于深度学习框架的模型：为了克服使用单一深度学习模型存在的不足，以及更加有效的捕捉网络客流的时空依赖关系，各种复杂的基于RNN，CNN，和GCN等的深度学习框架逐渐被开发出来。例如部分研究将CNN和LSTM予以组合进行交通预测，部分研究将GCN、LSTM、GRU等予以组合进行短时交通预测，部分研究在Seq2Seq框架下嵌入注意力机制进行短时交通预测，部分研究在Autoencoder框架下嵌入LSTM、高斯回归等模型进行短时交通预测。近期，Transformer网络、胶囊网络、生成对抗网络也被应用至交通预测领域

各类深度学习框架模型中，例如SAE模型、ST-GCN模型、T-GCN模型、ST-ResNet模型、DCRNN模型，均是公认的表现较好的短时交通预测深度学习框架。该类模型部分用于以分钟为单位的短期预期，部分用于以小时或天为单位的中长期预测；部分用于单一或几个车站的预测，部分用于网络层级的预测；部分用于常态下的短时预测，部分用于非常态下的短时预测；部分使用了静态相关关系，部分使用了动态相关关系。综上，大量研究已经表明，深度学习框架比单一的RNN、CNN、GCN模型在多数情况下具有更好的模型表现能力，但某些深度学习框架模型复杂度较高，导致移植性和复现性较差，且需要消耗大量的计算资源和时间训练模型，实用价值因而相对较弱，因此在构建模型的过程中需要权衡模型复杂度、模型表现效果和应用价值，进行综合考虑

综上所述，城市轨道交通短时进站流预测不断发展改进，现已进入以深度学习模型为代表的发展阶段。该阶段构建短时进站流预测模型时，应充分考虑轨道交通网络客流特性、模型复杂度、模型表现效果和模型的应用价值等因素，为构建智慧地铁生态奠定基础

短时O-D流预测

通过短时OD流预测，可以获取网络的OD矩阵，该矩阵可以作为客流分配的重要输入用于短时断面流预测。因此短时OD流预测是短时进站流预测和短时断面流预测的桥梁，在智能城市轨道交通短时客流预测体系中扮演着重要的角色。精准的短时OD流预测模型能够提供车站之间的时空出行分布，有助于理解乘客出行行为

OD预测指利用历史的OD矩阵信息等预测未来的OD矩阵信息，OD估计指利用道路交通路段流量计数信息或轨道交通进出站流量信息估计路网的OD信息，两者存在本质差异

根据研究方法，OD预测或OD估计可以被分为三类：

第一类为传统的基于数理统计或仿真的方法，例如最小二乘估计模型、概率分析估计模型、多主体仿真模型等

第二类为基于机器学习的方法，例如状态空间模型、BPNNs、主成分分析和奇异值分解、分层贝叶斯模型等。针对短时OD预测或OD估计

以上两类模型在实时性和实用性方面表现稍弱，例如，当模型应用于大规模网络时，最小二乘法和状态空间模型会消耗大量的计算资源，此外，该类模型也存在估计精度有待提升、无法在建模过程中考虑OD需求间的时空依赖关系等不足

为了弥补以上不足，近年来，以深度学习模型为代表的第三类模型被广泛应用。例如，使用LSTM模型进行OD矩阵预测，该类研究中，每个车站被单独训练一个LSTM模型进行预测，借助并行计算技术，进行全网络所有车站的OD预测。使用CNN和GCN进行道路交通的OD矩阵预测，该类研究中将路网划分为不同的区域，每个区域作为节点，区域间的邻接关系作为边，与轨道交通网络存在较大差异。使用GCN进行道路交通的OD矩阵估计，该类研究中路段作为节点，路段之间的连接作为边。使用LSTM和CNN进行共享单车系统中基于个体的目的地预测，对于无桩共享单车系统则需要大量的数据预处理工作，例如需事先确定出行的起点和潜在的目的地等。总之，既有研究的研究背景与轨道交通OD预测存在一定差异，但可为轨道交通短时OD流预测提供一定的借鉴意义

根据研究对象，短时OD预测或OD估计可被划分为道路交通OD估计、出租车OD矩阵预测、公交车OD矩阵预测、轨道交通OD矩阵预测等。对于不同的交通系统，数据的可获得性也存在较大差异，

道路交通网络中，实时的以及真实的OD矩阵均无法被获取，但可以通过传感器等获取路段的流量计数，进而通过OD估计得到估计OD矩阵，但难点在于真实OD矩阵无法获取，估计OD矩阵的可靠性也难以评估

出租车系统中，由于无固定的上下车站点，既有研究通常将研究区域划分为交通小区或网格区域，以匹配轨迹数据或订单数据，进而获取真实的区域之间的历史OD矩阵，且一般乘客在乘车时既已确定出行目的地，因此实时的OD矩阵信息也可以被获取

公交系统中，不同城市的公交系统记录的卡数据信息存在较大差异，部分能够完整记录乘客的上下车站点，然而部分只记录乘客的上车站点或上下车站点均无记录，因此，真实的OD矩阵是否可以获取视情况而定；由于存在行程时间，公交系统实时的OD矩阵无法获取

城市轨道交通系统具有固定的地铁车站，乘客需刷卡进出地铁车站，因此，能够基于历史的AFC数据提取真实的历史OD矩阵信息；同样由于交通出行存在行程时间，地铁系统中实时的OD矩阵信息无法获取

综上所述，城市轨道交通短时OD预测领域研究相对较为滞后，需要针对轨道交通独有的特点，充分利用深度学习模型的优点进行模型设计和构建，以满足现阶段构建智慧地铁生态所要求的高精度、高实时性、高可操作性等要求

短时断面流预测

进行城市轨道交通短时进站流和OD流预测之后，即解决了轨道交通系统乘客短时期内“从哪里来”、“到哪里去”的问题之后，由于地铁内乘客的出行轨迹难以获取，AFC数据中也并未记录乘客的出行路径、换乘信息等，需要预测乘客的路径选择进而通过客流分配等手段获取断面流量，即进行短时断面流预测，以解决轨道交通系统乘客短时期内“走哪条路”的问题

构建基于计算图的轨道交通短时断面流预测模型。首先，引入机器学习领域的计算图模型，并详细分析基于计算图的客流分配模型相比传统客流分配模型的优势。其次，将轨道交通客流分配模型置于计算图框架下，通过乘客路径选择建模、k短路搜索以及有效路径选择、构建数学优化模型、优化模型向量化、计算图模型建模等步骤，估计了路段行程时间和站点等车时间，进而通过客流分配和智能体仿真等步骤，最终生成了断面流量。最后，进行了案例研究，将该模型应用于虚拟地铁网络，验证了模型的合理性和有效性，将该模型应用于北京真实地铁网络，获取了网络短时断面客流

综上所述，相较于短时进站流预测和短时OD流预测，既有的轨道交通短时断面流预测模型较少，模型结构较为复杂、陈旧。因此，可结合深度学习思想，借助深度学习领域的计算图模型，将轨道交通客流分配置于计算图框架下，进而构建全新的轨道交通短时断面流预测模型，使其满足实时性、实用性的要求，为智慧地铁生态的构建提供新的思路和借鉴

基于计算机视觉的站内人、物、景检测识别

地铁车站内的行人、物品、场景识别等应用全部基于站内全链条的监控视频数据，例如，基于车站出入口监控视频的人脸识别、客流统计、行为分析等，基于站厅站台监控视频的行人越线检测、物品遗留检测、异常行为分析、人群密度分析等，基于区间监控视频的人防门遗留检测等

基于强化学习的运营优化和控制

强化学习在轨道交通领域的研究相对较晚，多为近几年刚刚发展起来，主要应用在列车时刻表优化、进站流控制、列车节能驾驶控制、城市轨道交通信息信息发布策略等方面

相对经典的强化学习模型包括Q-learning，Sarsa，Deep Q Network，Policy Gradient，Actor Critic等，所有模型均包含状态State，动作Action，奖励Reward，值函数Value Function等几大要素。强化学习在道路交通领域已有较为广泛的应用，例如交叉路口的信号灯控制、物流优化等，但在轨道交通领域应用相对较少

强化学习模型在地铁领域的应用关键在于如何将研究问题包装在强化学习模型框架下，例如，使用Actor-critic演员评论家深度强化学习模型进行列车时刻表优化

轨道交通的列车调度问题可以被看作随机乘客需求下的马尔科夫决策过程，该框架使用Policy Gradient策略梯度算法训练其中的人工神经网络，然后使用演员评论家模型进行在线的调度和控制。其中，状态被定义为列车到达时间、离开时间、乘客数量等，决策变量即动作包含发车间隔、区间运行时间、停站时间，状态转移矩阵为采取不同的动作时，从当前状态到下一状态的概率矩阵，奖励为时间消耗，值函数为总的最优的时间消耗

又如利用Q-learning强化学习模型进行轨道交通系统高峰时段的进站流协同控制，已缓解特定车站的高峰拥堵情况。其中，状态被定义内一条线路上所有车站的进站客流量与所有客流量（包含进站客流量与限流客流量）之比，动作被定义为一条线路上所有车站的限流比例，具体为{0%, 20%, 40%, 60%, 80%, 100%}，奖励为车站安全风险，值函数为所有车站的安全风险函数

对上述三个方面进行简单的总结：

短时客流预测，即利用历史AFC卡数据提取客流时间序列，借助历史客流时间序列数据和外部因素例如天气等数据，构建深度学习模型，进行未来短时间内的客流预测

利用地铁站内的各种监控视频数据，构建深度学习模型，进行行人检测计数、物品检测、场景检测等

强化学习相关的应用，例如基于强化学习的列车时刻表优化和进站流控制等

轨道交通卡数据获取手段及相关开源数据集介绍

轨道交通领域的数据集主要包含AFC刷卡数据、车站内视频监控数据、列车时刻表数据、相关的调研问卷数据等。本章的案例主要以基于卡数据的短时进站流预测为主，因此此处仅对AFC刷卡数据的获取手段以及相关的开源数据集进行简介

分为如下四个数据：

2019年由第十届中国(杭州)国际社会公共安全产品与技术博览会组委会主办、阿里云天池和阿里达摩院承办的全球城市计算AI挑战赛数据

该数据为20190101至20190125共25天地铁刷卡数据记录共涉及3条线路81个地铁站约7000万条数据作为训练数据，每条记录包含七个字段：

刷卡时间地铁线路ID 地铁车站ID 刷卡设备编号ID进出站状态（0为出站、1为进站）脱敏的用户身份ID 用户刷卡类型

此外还提供了路网地图，即各地铁站之间的连接关系表，包含一个81×81的二维邻接矩阵

邻接矩阵中首行和首列表示地铁站ID，行列均为0-80，相应值为1 表示两地铁站直接相连，值为0 表示两地铁站不相连

据深圳市政府数开放平台公布的深圳通刷卡数据，该数据是“2019深圳开放数据应用创新大赛”专用数据

包含2018年10月到2019年3月全市范围内的深圳通公交、地铁刷卡乘车数据，每条数据包含11个字段：卡号交易日期时间交易类型交易金额交易值设备编码公司名称线路站点车牌号联程标记结算日期

中山大学在其研究论文中开源的客流时间序列数据

数据包含上海2016年7月1日至2016年9月30日连续3个月的集计后的15分钟时间粒度的进站流和出站流时间序列数据

以及从第一个杭州刷卡数据集中提取的2019年1月1日至2019年1月25日提取的集计后的15分钟时间粒度的进站流和出站流时间序列数据

研究论文中开源的客流时间序列数据

该数据包含上海2016年2月29日至2016年4月3日连续5周的集计后的10分钟、15分钟、和30分钟时间粒度的进站流和出站流时间序列数据

创作不易觉得有帮助请点赞关注收藏~~~

文章出处登录后可见！

已经登录？立即刷新

基于深度学习的轨道交通刷卡数据背景及数据集简介