CN111613054B - 一种协同考虑时空相关性及贡献差异的多步交通速度预测方法 - Google Patents

一种协同考虑时空相关性及贡献差异的多步交通速度预测方法 Download PDF

Info

Publication number
CN111613054B
CN111613054B CN202010377173.0A CN202010377173A CN111613054B CN 111613054 B CN111613054 B CN 111613054B CN 202010377173 A CN202010377173 A CN 202010377173A CN 111613054 B CN111613054 B CN 111613054B
Authority
CN
China
Prior art keywords
time
prediction
hidden layer
speed
input
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202010377173.0A
Other languages
English (en)
Other versions
CN111613054A (zh
Inventor
赵春晖
崔紫强
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zhejiang University ZJU
Original Assignee
Zhejiang University ZJU
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zhejiang University ZJU filed Critical Zhejiang University ZJU
Priority to CN202010377173.0A priority Critical patent/CN111613054B/zh
Publication of CN111613054A publication Critical patent/CN111613054A/zh
Application granted granted Critical
Publication of CN111613054B publication Critical patent/CN111613054B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G08SIGNALLING
    • G08GTRAFFIC CONTROL SYSTEMS
    • G08G1/00Traffic control systems for road vehicles
    • G08G1/01Detecting movement of traffic to be counted or controlled
    • G08G1/0104Measuring and analyzing of parameters relative to traffic conditions
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2411Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on the proximity to a decision surface, e.g. support vector machines
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • General Engineering & Computer Science (AREA)
  • Evolutionary Computation (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Evolutionary Biology (AREA)
  • Biophysics (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Molecular Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • Biomedical Technology (AREA)
  • Health & Medical Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Analytical Chemistry (AREA)
  • Traffic Control Systems (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开了一种协同考虑时空相关性及贡献差异的多步交通速度预测方法,该方法使用了基于循环神经网络的编码‑解码的网络架构来充分表达交通速度的时序特性。在编码部分,对相关路段速度值所构成的输入向量引入第一阶段的注意力机制,使其自适应学习不同相关路段在不同时刻的权重贡献大小;在解码部分引入第二阶段的注意力机制,来自适应学习不同历史时刻对当前预测时刻的权重贡献大小。同时,考虑到外部因素的影响,将解码器的输出与外部因素特征一同输入全连接神经网络得到最终输出。本方法可以更细粒度地、差异化地刻画交通数据的时空相关特性,且能进行多步交通速度预测,为交通速度预测方法的研究指明了新的方向。

Description

一种协同考虑时空相关性及贡献差异的多步交通速度预测 方法
技术领域
本发明属于交通时序数据分析和预测研究领域,特别是涉及一种基于时空相关性及外部因素特征和具有双阶段注意力机制的序列网络的交通速度预测方法。
背景技术
随着机动车数量的增长,交通拥堵问题日益严重,给人们的出行带来了诸多不便,也对环境造成了污染,甚至威胁到了人们的生命安全。交通拥堵带来的直接问题是出行时间增加。另一方面,机动车数量的增加所带来的交通拥堵使得行驶车辆启动、停止次数增加、路上等待时间增加,导致了汽车尾气排放量的增加,造成大气的污染,严重危害着人类健康。与此同时,交通拥堵也是交通事故频发的一大诱因。据统计,20世纪全世界因交通事故而死亡的人数达2585万。
早期常用的方法以时间序列方法为主,时间序列模型通过对历史时间序列进行数学建模,然后将其应用于预测未来的时间序列,如ARIMA方法。近二十年来,很多研究将包括支持向量机等统计学习方法应用于时序问题建模。近几年,随着人工智能的发展,一些深度学习方法,如循环神经网络、卷积神经网络等以及宽度学习方法也被应用在交通预测中。传统的时间序列模型拟合能力弱,切缺乏非线性表达能力,难以模拟道路的真实状况,且没有考虑到空间相关性。基于宽度学习的方法具有建模速度快的优势,基于循环神经网络的方法和基于卷积神经网络的方法分别可以有效地表达交通速度的时间相关性和空间相关性。但这些方法都没有区分不同时刻对于预测时刻的贡献度以及不同相关路段对于预测路段的贡献度,且大多没有考虑天气、节假日等外部因素的影响。基于此,本发明所提出的方法,既考虑了相关路段的影响,又考虑了历史时刻的影响,且融入了天气和节假日等外部因素的影响。此外,本发明还通过注意力机制表达了不同相关路段和不同历史时刻的贡献差异性,体现了较以往方法更加细粒度的时空相关关系。到目前为止,尚未见到与本发明相关的研究报道。
发明内容
本发明的目的在于针对现有交通速度预测方法的不足,提供一种考虑时空相关性和贡献差异的多步交通速度预测方法。
本发明的目的是通过以下技术方案来实现的:一种考虑时空相关性和贡献差异的多步交通速度预测方法,该方法包括以下步骤:
步骤1:建模数据预处理:对原始速度数据根据路段和时间段进行均值化处理,对天气、节假日等外部因素数据进行类别分类。
步骤2:确定模型的输入变量和外部离散特征向量。
(2.1)设c为待预测路段的编号,根据地理位置,按照与预测路段的交叉和临近的优先原则选取前k个路段,作为与路段c相关的路段,这些相关路段的速度将作为变量用于预测模型的建立。
(2.2)m为建模所需要的历史时间窗口的大小。设tp为第一个预测时刻,则模型预测该时刻所需的输入包括该时刻之前的m个时刻,对于历史时刻i,i=tp-m,tp-m+1,...,tp-1,其对应所需的速度输入向量记为
Figure BDA0002480388750000021
其中k为相关路段的个数。此外还要输入预测时刻所对应的外部离散特征向量dt,包括天气和日期数据。
步骤3:模型的建立和训练。
(3.1)确定相关路段的贡献程度,得到新的输入向量。
编码器网络采用LSTM作为基础单元,历史时间步长为m,与步骤2中的历史时间窗口一致。对于历史时刻i所对应的原始输入向量x,首先计算每个相关路段的得分,如下式所示:
Figure BDA0002480388750000031
其中,j=1,2,...,k,k为相关路段数量,hi-1和si-1分别为Encoder中LSTM单元当前时刻的前一时刻的f维隐藏层状态和细胞状态,
Figure BDA0002480388750000032
是所有输入时刻的第j个相关路段速度值所组成的向量,
Figure BDA0002480388750000033
是网络需要学习的参数。
使用类SoftMax对得分进行归一化处理,使其转化成类概率分布的权重系数:
Figure BDA0002480388750000034
然后将对应路段的速度值与对应的权重相乘,得到该时刻新的输入向量:
Figure BDA0002480388750000035
(3.2)对编码器网络的LSTM单元进行计算和更新。
将新的输入向量输入到LSTM单元,对于历史时刻i的LSTM单元,其计算和更新方式如下,首先计算遗忘门fi、输入门ai、输出门oi
Figure BDA0002480388750000036
Figure BDA0002480388750000037
Figure BDA0002480388750000038
其中,
Figure BDA0002480388750000039
是前一个时刻的隐藏层状态hi-1与当前时刻的输入
Figure BDA00024803887500000310
在向量维度上的拼接。σ表示sigmoid函数,Wf,Wa,Wo,bf,ba,bo都是网络要学习的参数。
然后计算更新当前的细胞状态:
Figure BDA00024803887500000311
其中,Ws,bs是待学习的参数,符号⊙表示对应元素相乘。
计算隐藏层状态如下:
hi=oi⊙tanh(si) (8)
(3.3)确定不同历史时刻的贡献程度,得到新的输入向量。
解码器网络也是由LSTM单元构成。对于当前的预测时刻t(t=tp,tp+1,tp+2,tp为第一个预测时刻),首先我们利用解码器中当前时刻的前一时刻的隐藏层状态和细胞状态以及编码器中的每个隐藏层状态,生成不同历史时刻对当前预测时刻的贡献分数,如下:
Figure BDA0002480388750000041
其中,h't-1和s't-1分别是预测时刻的前一时刻的解码器LSTM单元的隐藏层状态和细胞状态,hi是历史时刻i的编码器LSTM单元的隐藏层状态,vd,Wd,Ud是要学习的参数。
采用类SoftMax的方式对得分进行归一化,得到历史时刻i隐藏层的权重系数:
Figure BDA0002480388750000042
然后将权重系数与隐藏层状态对应相乘再求和,计算出预测时刻t所对应的编码器中所有时刻的隐藏层状态的加权和ct
Figure BDA0002480388750000043
将ct与解码器中上一时刻的输出yt-1在维度上进行拼接,作为解码器中当前时刻LSTM单元的输入向量:
xt=[ct;yt-1] (12)
(3.4)采用步骤(3.2)的方法对解码器网络的LSTM单元进行计算和更新。
(3.5)构建考虑外部因素的全连接神经网络。
在预测t时刻的交通速度时,我们将解码器的输出和由外部因素组成的离散特征拼接起来,并将它们输入到一个全连接神经网络,得到最终的输出
Figure BDA0002480388750000051
Figure BDA0002480388750000052
其中,yt是t时刻解码器的输出值,dt是t时刻的外部离散特征向量,包括天气和日期,Wn和bn是待学习的参数。
(3.6)模型的训练。
采用Adagrad梯度下降法对步骤(3.1)至(3.5)中的参数进行反向传播更新,获得最终参数得到训练好的模型。
步骤4:模型在线预测。
对测试样本,首先按照步骤1到步骤2,对测试样本的格式进行转化,然后将测试样本直接输入到步骤3所训练好的模型中,模型输出最终的预测结果,完成预测。
进一步地,所述步骤1具体为:对于原始速度数据,将获取的车辆速度数据按照不同路段分类。对需要分析的每一个路段,以一小时为时间间隔,将每天划分成24个时间段。对于第z个时间间隔,z=0,1,2,…,23,用该时间间隔内该路段上速度的平均值来表示第z个时间间隔的速度,每一个时刻对应一个固定的速度值。则路段u在p天内获得的速度向量可以表示为vu T(1×24p),其中,u=1,2,…,L,为全部路段的代号,L为路段总数。
对于天气,按照降水量大小将其分类,分别用不同标签表示;将日期类型分为三类:工作日、周末、节假日,分别用不同标签表示;获取上述速度变量对应时刻的天气和日期类型,路段u在p天内的天气数据表示为wu T(1×24p),日期类别数据表示为du T(1×24p)。
与现有技术相比,本发明的有益效果是:本方法从实际交通数据的特点出发,不仅考虑了交通速度的时间相关特性和空间相关特性,而且考虑了天气、节假日等外部因素的影响。时间特性上,我们利用LSTM来充分学习交通速度的时序关联性,还考虑了不同历史时刻对不同预测时刻的贡献差异性,并通过注意力机制来学习这种差异;空间特性上,我们在对目标路段进行预测时,充分考虑了相关路段对其的影响,考虑到不同相关路段对预测路段的影响不同,使用注意力机制来学习这种贡献差异。本方法充分考虑了不同历史时刻的贡献差异和不同相关路段的贡献差异。相比以往的方法,本方法是一种对时空特性刻画更加细粒度、更加全面的端到端方法,为交通速度预测提供了一种有效易行的方法,为实际道路状况预测的研究指明了新的方向。
附图说明
图1是本发明方法架构图。
图2是使用本发明在不同预测步下的10个路段上的预测结果RMSE的均值与其他三种方法的对比图。
图3是使用本发明在不同预测步下的10个路段上的预测结果的RMSE的标准差与其他三种方法的对比图。
具体实施方式
下面结合附图和具体实例,对本发明作进一步详细说明。
本实例所采用数据为杭州市8000辆出租车2013年10月1日~2014年1月31日的为期四个月,共计123天的GPS信号数据,GPS数据中包括速度值和采样时间以及位置信息。
步骤1:建模数据预处理。
对原始速度数据进行均值化处理,对天气、节假日等外部因素类别数据进行预处理。
对于原始速度数据,将获取的车辆速度数据按照不同路段分类。对需要分析的每一个路段,以一小时为时间间隔,将每天划分成24个时间段。对于第z个时间间隔,z=0,1,2,…,23,用该时间间隔内该路段上速度的平均值来表示第z个时间间隔的速度,每一个时刻对应一个固定的速度值。则路段u在p天内获得的速度向量可以表示为vu T(1×24p),其中,u=1,2,…,L,为全部路段的代号,L为路段总数。本实例中,我们对杭州市出租车2013年10月1日~2014年1月31日的为期四个月,共计123天的GPS信号进行了预处理,并从中随机选出了246个路段的数据进行接下来的分析,p=123,L=246。
对于天气,按照降水量大小将其分类,分别用不同标签表示;将日期类型分为三类:工作日、周末、节假日,分别用不同标签表示;获取上述速度变量对应时刻的天气和日期类型,路段u在p天内的天气数据表示为wu T(1×24p),日期类别数据表示为du T(1×24p)。本实例中,对于天气,按照降水量大小将其分为三类,第一类是干燥无降水的天气,比如晴天、多云等;第二类是中度湿润,比如小雨、中雨、小雪、大雾等;第三类是高度湿润,比如大雨、大雪等,分别用数值1、2、3表示。对于节假日的影响,将日期类型分为三类:工作日、周末、节假日,分别用数值1、2、3来表示。本实例共获取为期四个月123天每天24小时的天气,以及123天每天的节假日类型,天气和节假日类型数据均对应于速度向量。如表1所示为某一路段预处理后的部分数据的格式示例。
表1
路段代号 当前速度 时间 天气 节假日
186 35 2013/10/1 9:00 1 3
186 32.1429 2013/10/1 10:00 1 3
186 32 2013/10/1 11:00 1 3
186 33.3571 2013/10/1 12:00 1 3
186 34 2013/10/1 13:00 1 3
186 30.4 2013/10/1 14:00 1 3
步骤2:确定模型的输入变量和外部离散特征向量。
(2.1)设c为待预测路段编号,根据地理位置,按照与预测路段的交叉和临近的优先原则选取前k个路段,作为与路段c相关的路段,这些相关路段的速度将作为变量用于预测模型的建立,本实例中k的值取4,选取了10个预测路段。
(2.2)设m为历史时间窗口的大小,tp为第一个预测时刻,则模型预测该时刻所需的输入包括该时刻之前的m个时刻,对于历史时刻i(i=tp-m,tp-m+1,...,tp-1),其对应所需的速度输入向量记为
Figure BDA0002480388750000081
其中k为相关路段的个数。此外还要输入预测时刻所对应的外部离散特征向量dt,包括天气wtp、节假日dtp在内的外部因素。本实例中m值为24。
步骤3:模型的建立和训练。
(3.1)确定相关路段的贡献程度,得到新的输入向量。
编码器网络采用LSTM作为基础单元,历史时间步长为m,与步骤2中的历史时间窗口一致。对于历史时刻i所对应的原始输入向量x,首先计算每个相关路段的得分,如下式所示:
Figure BDA0002480388750000082
其中,j=1,2,...,k,hi-1和si-1分别为Encoder中的LSTM单元的前一时刻的f维隐藏层状态和细胞状态,
Figure BDA0002480388750000083
是所有输入时刻的第j个相关路段速度值所组成的向量,
Figure BDA0002480388750000084
是网络需要学习的参数。本实例中f取值为96。
使用类SoftMax对得分进行归一化处理,使其转化成类概率分布的权重系数:
Figure BDA0002480388750000085
然后将对应路段的速度值与对应的权重相乘,得到该时刻新的输入向量:
Figure BDA0002480388750000086
(3.2)对编码器网络的LSTM单元进行计算和更新。
将新的输入向量输入到LSTM单元,对于历史时刻i的LSTM单元,其计算和更新方式如下,首先计算遗忘门fi、输入门ai、输出门oi
Figure BDA0002480388750000091
Figure BDA0002480388750000092
Figure BDA0002480388750000093
其中,[hi-1;xi]是前一个时刻的隐藏层状态hi-1与当前时刻的输入xi在向量维度上的拼接。σ表示sigmoid函数,Wf,Wa,Wo,bf,ba,bo都是网络要学习的参数。
然后计算更新当前的细胞状态:
Figure BDA0002480388750000094
其中,Ws,bs是待学习的参数,符号⊙表示对应元素相乘。
然后计算隐藏层状态如下:
hi=oi⊙tanh(si) (8)
(3.3)确定不同历史时刻的贡献程度,得到新的输入向量。
解码器网络也是由LSTM单元构成。对于当前的预测时刻t(t=tp,tp+1,tp+2,tp为第一个预测时刻),首先我们利用解码器中当前时刻的前一时刻的隐藏层状态和细胞状态以及编码器中的每个隐藏层状态,生成不同历史时刻对当前预测时刻的贡献分数,如下:
Figure BDA0002480388750000095
其中,h't-1和s't-1分别是预测时刻的前一时刻的解码器LSTM单元的隐藏层状态和细胞状态,hi是历史时刻i的编码器LSTM单元的隐藏层状态,也是编码器的第i个LSTM单元的隐藏层状态,m是编码器部分中LSTM单元的数量,vd,Wd,Ud是要学习的参数。
采用类SoftMax的方式对得分进行归一化,得到第i个历史时刻隐藏层的权重系数:
Figure BDA0002480388750000101
然后将权重系数与隐藏层状态对应相乘再求和,计算出预测时刻t所对应的编码器中所有时刻的隐藏层状态的加权和ct
Figure BDA0002480388750000102
将ct与解码器中上一时刻的输出yt-1在维度上进行拼接,作为解码器中当前时刻LSTM单元的输入向量:
xt=[ct;yt-1] (12)
本实例中预测步数为3,即解码器网络的LSTM单元个数为3。
(3.4)对解码器网络的LSTM单元进行计算和更新,步骤同(3.2)。
即,将新的输入向量输入到解码器网络的LSTM单元,对于预测时刻t的LSTM单元,其计算和更新方式如下,首先计算遗忘门f′t、输入门a't、输出门o't
f′t=σ(W'f[h't-1;xt]+b'f)
a't=σ(W′a[h't-1;xt]+b'a)
o't=σ(W′o[h't-1;xt]+b'o)
其中,[h't-1;xt]是前一个时刻的隐藏层状态h't-1与当前时刻的输入xt在向量维度上的拼接。σ表示sigmoid函数,W'f,Wa',Wo',b'f,b'a,b'o都是网络要学习的参数。
然后计算更新当前的细胞状态:
s't=f′t⊙s't-1+a't⊙tanh(W′s[h't-1;xt]+b's)
其中,W′',b's是待学习的参数,符号⊙表示对应元素相乘。
计算隐藏层状态如下:
h't=o't⊙tanh(s't)
(3.5)构建考虑外部因素的全连接神经网络。
在预测t时刻的交通速度时,我们将解码器的输出和由外部因素组成的离散特征拼接起来,并将它们输入到一个全连接神经网络,得到最终的输出
Figure BDA0002480388750000111
Figure BDA0002480388750000112
其中,yt是t时刻解码器的输出值,dt是t时刻的外部离散特征向量,包括天气和日期,Wn和bn是待学习的参数。本实例中全连接神经网络的隐藏层数为1,隐藏层的神经元个数设为10。
(3.6)模型的训练。
采用Adagrad梯度下降法对步骤(3.1)至(3.5)中的参数进行反向传播更新,得到模型的最终参数。本实例10个路段分别有2800条样本记录,针对不同路段,我们采用前2400个样本作为训练集,后400个样本作为测试集,Epoch设置为2。
步骤4:模型在线预测。
对不同路段的400个测试样本,首先按照步骤1到步骤2,对测试样本的格式进行转化,然后将测试样本直接输入到步骤3所建立好的模型中,模型输出最终的预测结果,完成预测。
计算本方法和其他方法在10个随机选择的路段上的测试集的预测结果与真实值的均方根误差RMSE,如表2所示。其中,其他方法包括基于时空宽度学习网络ST-BLN、深度神经网络DNN和支持向量回归机SVR的交通速度预测方法,各方法的输入一致。可以看出,本方法在每个预测步骤的每个路段上均优于其他三种方法。表明本方法对预测精度有较为明显的提高。此外,为观察该方法的稳定性,我们针对每个预测时间步分别计算了四种方法在10个路段的标准差,结果表明所提方法是所有四种方法中最稳定的。为了对结果进行更加直观的展示,我们将10个路段上的四种方法在不同路段预测的RMSE的平均值和标准偏差绘制成曲线图,分别如图2和图3所示。该图可以进一步验证结果的有效性,也表明了随着预测步长的增加,本方法的准确性下降的速度小于其他方法。
表2
Figure BDA0002480388750000121
Figure BDA0002480388750000131

Claims (2)

1.一种协同考虑时空相关性和贡献差异的多步交通速度预测方法,其特征在于,该方法包括以下步骤:
步骤1:建模数据预处理:对原始速度数据根据路段和时间段进行均值化处理,对天气、节假日外部因素数据进行类别分类;
步骤2:确定模型的输入变量和外部离散特征向量;
(2.1)设c为待预测路段的编号,根据地理位置,按照与预测路段的交叉和临近的优先原则选取前k个路段,作为与路段c相关的路段,这些相关路段的速度将作为变量用于预测模型的建立;
(2.2)m为建模所需要的历史时间窗口的大小;设tp为第一个预测时刻,则模型预测该时刻所需的输入包括该时刻之前的m个时刻,对于历史时刻i,i=tp-m,tp-m+1,...,tp-1,其对应所需的速度输入向量记为
Figure FDA0003063452170000011
其中k为相关路段的个数;此外还要输入预测时刻所对应的外部离散特征向量dt,包括天气和日期数据;
步骤3:模型的建立和训练;
(3.1)确定相关路段的贡献程度,得到新的输入向量;
编码器网络采用LSTM作为基础单元,历史时间步长为m,与步骤2中的历史时间窗口一致;对于历史时刻i所对应的原始输入向量x,首先计算每个相关路段的得分,如下式所示:
Figure FDA0003063452170000012
其中,j=1,2,...,k,k为相关路段数量,hi-1和si-1分别为Encoder中LSTM单元当前时刻的前一时刻的f维隐藏层状态和细胞状态,
Figure FDA0003063452170000013
是所有输入时刻的第j个相关路段速度值所组成的向量,
Figure FDA0003063452170000014
是网络需要学习的参数;
使用类SoftMax对得分进行归一化处理,使其转化成类概率分布的权重系数:
Figure FDA0003063452170000021
然后将对应路段的速度值与对应的权重相乘,得到该时刻新的输入向量:
Figure FDA0003063452170000022
(3.2)对编码器网络的LSTM单元进行计算和更新;
将新的输入向量输入到LSTM单元,对于历史时刻i的LSTM单元,其计算和更新方式如下,首先计算遗忘门fi、输入门ai、输出门oi
Figure FDA0003063452170000023
Figure FDA0003063452170000024
Figure FDA0003063452170000025
其中,
Figure FDA0003063452170000026
是前一个时刻的隐藏层状态hi-1与当前时刻的输入
Figure FDA0003063452170000027
在向量维度上的拼接;σ表示sigmoid函数,Wf,Wa,Wo,bf,ba,bo都是网络要学习的参数;
然后计算更新当前的细胞状态:
Figure FDA0003063452170000028
其中,Ws,bs是待学习的参数,符号⊙表示对应元素相乘;
计算隐藏层状态如下:
hi=oi⊙tanh(si) (8)
(3.3)确定不同历史时刻的贡献程度,得到新的输入向量;
解码器网络也是由LSTM单元构成;对于当前的预测时刻t(t=tp,tp+1,tp+2,tp为第一个预测时刻),首先我们利用解码器中当前时刻的前一时刻的隐藏层状态和细胞状态以及编码器中的每个隐藏层状态,生成不同历史时刻对当前预测时刻的贡献分数,如下:
Figure FDA0003063452170000031
其中,h't-1和s't-1分别是预测时刻的前一时刻的解码器LSTM单元的隐藏层状态和细胞状态,hi是历史时刻i的编码器LSTM单元的隐藏层状态,vd,Wd,Ud是要学习的参数;
采用类SoftMax的方式对得分进行归一化,得到历史时刻i隐藏层的权重系数:
Figure FDA0003063452170000032
然后将权重系数与隐藏层状态对应相乘再求和,计算出预测时刻t所对应的编码器中所有时刻的隐藏层状态的加权和ct
Figure FDA0003063452170000033
将ct与解码器中上一时刻的输出yt-1在维度上进行拼接,作为解码器中当前时刻LSTM单元的输入向量:
xt=[ct;yt-1] (12)
(3.4)采用步骤(3.2)的方法对解码器网络的LSTM单元进行计算和更新;
(3.5)构建考虑外部因素的全连接神经网络;
在预测t时刻的交通速度时,我们将解码器的输出和由外部因素组成的离散特征拼接起来,并将它们输入到一个全连接神经网络,得到最终的输出
Figure FDA0003063452170000034
Figure FDA0003063452170000035
其中,yt是t时刻解码器的输出值,dt是t时刻的外部离散特征向量,包括天气和日期,Wn和bn是待学习的参数;
(3.6)模型的训练;
采用Adagrad梯度下降法对步骤(3.1)至(3.5)中的参数进行反向传播更新,获得最终参数得到训练好的模型;
步骤4:模型在线预测;
对测试样本,首先按照步骤1到步骤2,对测试样本的格式进行转化,然后将测试样本直接输入到步骤3所训练好的模型中,模型输出最终的预测结果,完成预测。
2.根据权利要求1所述的方法,其特征在于,所述步骤1具体为:对于原始速度数据,将获取的车辆速度数据按照不同路段分类;对需要分析的每一个路段,以一小时为时间间隔,将每天划分成24个时间段;对于第z个时间间隔,z=0,1,2,…,23,用该时间间隔内该路段上速度的平均值来表示第z个时间间隔的速度,每一个时刻对应一个固定的速度值;则路段u在p天内获得的速度向量可以表示为vu T(1×24p),其中,u=1,2,…,L,为全部路段的代号,L为路段总数;
对于天气,按照降水量大小将其分类,分别用不同标签表示;将日期类型分为三类:工作日、周末、节假日,分别用不同标签表示;获取上述速度变量对应时刻的天气和日期类型,路段u在p天内的天气数据表示为wu T(1×24p),日期类别数据表示为du T(1×24p)。
CN202010377173.0A 2020-05-07 2020-05-07 一种协同考虑时空相关性及贡献差异的多步交通速度预测方法 Active CN111613054B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010377173.0A CN111613054B (zh) 2020-05-07 2020-05-07 一种协同考虑时空相关性及贡献差异的多步交通速度预测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010377173.0A CN111613054B (zh) 2020-05-07 2020-05-07 一种协同考虑时空相关性及贡献差异的多步交通速度预测方法

Publications (2)

Publication Number Publication Date
CN111613054A CN111613054A (zh) 2020-09-01
CN111613054B true CN111613054B (zh) 2021-07-06

Family

ID=72204882

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010377173.0A Active CN111613054B (zh) 2020-05-07 2020-05-07 一种协同考虑时空相关性及贡献差异的多步交通速度预测方法

Country Status (1)

Country Link
CN (1) CN111613054B (zh)

Families Citing this family (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112308336B (zh) * 2020-11-18 2023-12-19 浙江大学 一种基于多步时序预测的高速铁路大风限速动态处置方法
CN112652165B (zh) * 2020-12-11 2022-05-31 北京百度网讯科技有限公司 模型训练及路况预测方法、装置、设备、介质及程序产品
CN113077053B (zh) * 2021-03-18 2022-09-02 中国电子科技集团公司第五十四研究所 多元群体活动模式表征方法及目标地理活动区域识别方法
CN113326972B (zh) * 2021-05-06 2024-01-05 大连海事大学 基于实时公交车速度统计数据的公交专用道短时速度预测方法
CN113391622B (zh) * 2021-06-22 2022-09-02 中国人民解放军国防科技大学 利用多元多步预测技术的航天器姿态系统异常检测方法
CN113665576B (zh) * 2021-08-31 2024-07-26 中国第一汽车股份有限公司 车辆行驶工况预测方法、装置、设备及介质
CN114021856A (zh) * 2021-12-03 2022-02-08 重庆大学 一种道路风险预测方法及系统
CN114387782B (zh) * 2022-01-12 2023-06-27 智道网联科技(北京)有限公司 预测交通状态的方法、装置和电子设备
CN114881282B (zh) * 2022-03-28 2024-09-10 天津大学 基于注意力机制和堆叠lstm的交通预测方法
CN116959259B (zh) * 2023-09-19 2023-12-26 深圳市城市交通规划设计研究中心股份有限公司 基于学校放学事件的交通预测方法、电子设备及存储介质
CN117831287B (zh) * 2023-12-29 2024-05-31 北京大唐高鸿数据网络技术有限公司 高速公路拥堵指数的确定方法、装置、设备和存储介质

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109035762B (zh) * 2018-06-28 2020-12-18 浙江大学 一种基于时空宽度学习的交通速度预测方法
CN109131452B (zh) * 2018-08-14 2021-06-15 西安理工大学 一种基于长短时记忆网络的列车状态在线预测方法
AU2018101514A4 (en) * 2018-10-11 2018-11-15 Chi, Henan Mr An automatic text-generating program for Chinese Hip-hop lyrics
CN109544911B (zh) * 2018-10-30 2021-10-01 中山大学 一种基于lstm-cnn的城市路网交通状态预测方法
CN110648527B (zh) * 2019-08-20 2021-05-11 浙江工业大学 一种基于深度学习模型的交通速度预测方法
CN110909931A (zh) * 2019-11-20 2020-03-24 成都理工大学 基于模态分解重构及深度lstm-rnn模型的测井曲线预测方法
CN110889546B (zh) * 2019-11-20 2020-08-18 浙江省交通规划设计研究院有限公司 一种基于注意力机制的交通流量模型训练方法

Also Published As

Publication number Publication date
CN111613054A (zh) 2020-09-01

Similar Documents

Publication Publication Date Title
CN111613054B (zh) 一种协同考虑时空相关性及贡献差异的多步交通速度预测方法
CN111798051B (zh) 基于长短期记忆神经网络的空气质量时空预测方法
CN111709549B (zh) 一种基于svd-pso-lstm的短时交通流预测的导航提醒方法
CN109389244B (zh) 一种基于gru的多因素感知短期景区内游客人数预测方法
CN111899510A (zh) 基于发散卷积和gat的智能交通系统流量短期预测方法及系统
CN111860989B (zh) 一种基于蚁群算法优化的lstm神经网络短时交通流量预测方法
CN113177657B (zh) 轨道交通客流预测方法及装置
CN114781538B (zh) 一种ga-bp神经网络耦合决策树的空气质量预测方法和系统
CN111915073A (zh) 一种考虑日期属性和天气因素的铁路城际客流短期预测方法
CN106448151A (zh) 一种短时交通流预测方法
CN109035762B (zh) 一种基于时空宽度学习的交通速度预测方法
CN111862592B (zh) 一种基于rgcn的交通流预测方法
CN110866631A (zh) 基于集成的门递归单元神经网络gru来预测大气污染情况的方法
CN114841400B (zh) 基于多任务时空图卷积的空气质量预测方法
CN113205698A (zh) 一种基于igwo-lstm的短时交通流预测的导航提醒方法
CN109086926A (zh) 一种基于组合神经网络结构的短时轨道交通客流预测方法
CN106526710A (zh) 一种雾霾预测方法及装置
CN113011455B (zh) 一种空气质量预测svm模型构建方法
CN113449905A (zh) 一种基于门控循环单元神经网络的交通拥堵预警方法
CN112884014A (zh) 一种基于路段拓扑结构分类的交通速度短时预测方法
CN111815075B (zh) 一种重大公共卫生事件下交通出行需求的预测方法
CN113674524A (zh) 基于lstm-gasvr的多尺度短时交通流预测建模、预测方法及系统
CN111915076A (zh) 一种利用人工智能神经网络实现景区观景人员预测的方法
CN114973665A (zh) 一种结合数据分解和深度学习的短时交通流预测方法
CN115482665B (zh) 一种知识与数据协同驱动的多粒度交通事故预测方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant