CN111613054B - 一种协同考虑时空相关性及贡献差异的多步交通速度预测方法 - Google Patents
一种协同考虑时空相关性及贡献差异的多步交通速度预测方法 Download PDFInfo
- Publication number
- CN111613054B CN111613054B CN202010377173.0A CN202010377173A CN111613054B CN 111613054 B CN111613054 B CN 111613054B CN 202010377173 A CN202010377173 A CN 202010377173A CN 111613054 B CN111613054 B CN 111613054B
- Authority
- CN
- China
- Prior art keywords
- time
- prediction
- hidden layer
- speed
- input
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 48
- 238000013528 artificial neural network Methods 0.000 claims abstract description 12
- 238000012360 testing method Methods 0.000 claims description 10
- 238000012549 training Methods 0.000 claims description 7
- 238000001556 precipitation Methods 0.000 claims description 5
- 238000007781 pre-processing Methods 0.000 claims description 4
- 238000009826 distribution Methods 0.000 claims description 3
- 238000011478 gradient descent method Methods 0.000 claims description 3
- 238000012935 Averaging Methods 0.000 claims description 2
- 230000003203 everyday effect Effects 0.000 claims 1
- 230000007246 mechanism Effects 0.000 abstract description 6
- 238000011160 research Methods 0.000 abstract description 4
- 230000000306 recurrent effect Effects 0.000 abstract description 2
- 210000004027 cell Anatomy 0.000 description 9
- 230000006870 function Effects 0.000 description 3
- 206010039203 Road traffic accident Diseases 0.000 description 2
- 238000013527 convolutional neural network Methods 0.000 description 2
- 238000004458 analytical method Methods 0.000 description 1
- 238000013473 artificial intelligence Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 125000004122 cyclic group Chemical group 0.000 description 1
- 238000007405 data analysis Methods 0.000 description 1
- 238000013135 deep learning Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000036541 health Effects 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- YHXISWVBGDMDLQ-UHFFFAOYSA-N moclobemide Chemical compound C1=CC(Cl)=CC=C1C(=O)NCCN1CCOCC1 YHXISWVBGDMDLQ-UHFFFAOYSA-N 0.000 description 1
- 210000002569 neuron Anatomy 0.000 description 1
- 230000008569 process Effects 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 238000012706 support-vector machine Methods 0.000 description 1
- 238000009736 wetting Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G08—SIGNALLING
- G08G—TRAFFIC CONTROL SYSTEMS
- G08G1/00—Traffic control systems for road vehicles
- G08G1/01—Detecting movement of traffic to be counted or controlled
- G08G1/0104—Measuring and analyzing of parameters relative to traffic conditions
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
- G06F18/2411—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on the proximity to a decision surface, e.g. support vector machines
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- General Physics & Mathematics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- General Engineering & Computer Science (AREA)
- Evolutionary Computation (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Bioinformatics & Computational Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Evolutionary Biology (AREA)
- Biophysics (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Molecular Biology (AREA)
- General Health & Medical Sciences (AREA)
- Computational Linguistics (AREA)
- Biomedical Technology (AREA)
- Health & Medical Sciences (AREA)
- Chemical & Material Sciences (AREA)
- Analytical Chemistry (AREA)
- Traffic Control Systems (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明公开了一种协同考虑时空相关性及贡献差异的多步交通速度预测方法,该方法使用了基于循环神经网络的编码‑解码的网络架构来充分表达交通速度的时序特性。在编码部分,对相关路段速度值所构成的输入向量引入第一阶段的注意力机制,使其自适应学习不同相关路段在不同时刻的权重贡献大小;在解码部分引入第二阶段的注意力机制,来自适应学习不同历史时刻对当前预测时刻的权重贡献大小。同时,考虑到外部因素的影响,将解码器的输出与外部因素特征一同输入全连接神经网络得到最终输出。本方法可以更细粒度地、差异化地刻画交通数据的时空相关特性,且能进行多步交通速度预测,为交通速度预测方法的研究指明了新的方向。
Description
技术领域
本发明属于交通时序数据分析和预测研究领域,特别是涉及一种基于时空相关性及外部因素特征和具有双阶段注意力机制的序列网络的交通速度预测方法。
背景技术
随着机动车数量的增长,交通拥堵问题日益严重,给人们的出行带来了诸多不便,也对环境造成了污染,甚至威胁到了人们的生命安全。交通拥堵带来的直接问题是出行时间增加。另一方面,机动车数量的增加所带来的交通拥堵使得行驶车辆启动、停止次数增加、路上等待时间增加,导致了汽车尾气排放量的增加,造成大气的污染,严重危害着人类健康。与此同时,交通拥堵也是交通事故频发的一大诱因。据统计,20世纪全世界因交通事故而死亡的人数达2585万。
早期常用的方法以时间序列方法为主,时间序列模型通过对历史时间序列进行数学建模,然后将其应用于预测未来的时间序列,如ARIMA方法。近二十年来,很多研究将包括支持向量机等统计学习方法应用于时序问题建模。近几年,随着人工智能的发展,一些深度学习方法,如循环神经网络、卷积神经网络等以及宽度学习方法也被应用在交通预测中。传统的时间序列模型拟合能力弱,切缺乏非线性表达能力,难以模拟道路的真实状况,且没有考虑到空间相关性。基于宽度学习的方法具有建模速度快的优势,基于循环神经网络的方法和基于卷积神经网络的方法分别可以有效地表达交通速度的时间相关性和空间相关性。但这些方法都没有区分不同时刻对于预测时刻的贡献度以及不同相关路段对于预测路段的贡献度,且大多没有考虑天气、节假日等外部因素的影响。基于此,本发明所提出的方法,既考虑了相关路段的影响,又考虑了历史时刻的影响,且融入了天气和节假日等外部因素的影响。此外,本发明还通过注意力机制表达了不同相关路段和不同历史时刻的贡献差异性,体现了较以往方法更加细粒度的时空相关关系。到目前为止,尚未见到与本发明相关的研究报道。
发明内容
本发明的目的在于针对现有交通速度预测方法的不足,提供一种考虑时空相关性和贡献差异的多步交通速度预测方法。
本发明的目的是通过以下技术方案来实现的:一种考虑时空相关性和贡献差异的多步交通速度预测方法,该方法包括以下步骤:
步骤1:建模数据预处理:对原始速度数据根据路段和时间段进行均值化处理,对天气、节假日等外部因素数据进行类别分类。
步骤2:确定模型的输入变量和外部离散特征向量。
(2.1)设c为待预测路段的编号,根据地理位置,按照与预测路段的交叉和临近的优先原则选取前k个路段,作为与路段c相关的路段,这些相关路段的速度将作为变量用于预测模型的建立。
(2.2)m为建模所需要的历史时间窗口的大小。设tp为第一个预测时刻,则模型预测该时刻所需的输入包括该时刻之前的m个时刻,对于历史时刻i,i=tp-m,tp-m+1,...,tp-1,其对应所需的速度输入向量记为其中k为相关路段的个数。此外还要输入预测时刻所对应的外部离散特征向量dt,包括天气和日期数据。
步骤3:模型的建立和训练。
(3.1)确定相关路段的贡献程度,得到新的输入向量。
编码器网络采用LSTM作为基础单元,历史时间步长为m,与步骤2中的历史时间窗口一致。对于历史时刻i所对应的原始输入向量x,首先计算每个相关路段的得分,如下式所示:
其中,j=1,2,...,k,k为相关路段数量,hi-1和si-1分别为Encoder中LSTM单元当前时刻的前一时刻的f维隐藏层状态和细胞状态,是所有输入时刻的第j个相关路段速度值所组成的向量,是网络需要学习的参数。
使用类SoftMax对得分进行归一化处理,使其转化成类概率分布的权重系数:
然后将对应路段的速度值与对应的权重相乘,得到该时刻新的输入向量:
(3.2)对编码器网络的LSTM单元进行计算和更新。
将新的输入向量输入到LSTM单元,对于历史时刻i的LSTM单元,其计算和更新方式如下,首先计算遗忘门fi、输入门ai、输出门oi:
然后计算更新当前的细胞状态:
其中,Ws,bs是待学习的参数,符号⊙表示对应元素相乘。
计算隐藏层状态如下:
hi=oi⊙tanh(si) (8)
(3.3)确定不同历史时刻的贡献程度,得到新的输入向量。
解码器网络也是由LSTM单元构成。对于当前的预测时刻t(t=tp,tp+1,tp+2,tp为第一个预测时刻),首先我们利用解码器中当前时刻的前一时刻的隐藏层状态和细胞状态以及编码器中的每个隐藏层状态,生成不同历史时刻对当前预测时刻的贡献分数,如下:
其中,h't-1和s't-1分别是预测时刻的前一时刻的解码器LSTM单元的隐藏层状态和细胞状态,hi是历史时刻i的编码器LSTM单元的隐藏层状态,vd,Wd,Ud是要学习的参数。
采用类SoftMax的方式对得分进行归一化,得到历史时刻i隐藏层的权重系数:
然后将权重系数与隐藏层状态对应相乘再求和,计算出预测时刻t所对应的编码器中所有时刻的隐藏层状态的加权和ct:
将ct与解码器中上一时刻的输出yt-1在维度上进行拼接,作为解码器中当前时刻LSTM单元的输入向量:
xt=[ct;yt-1] (12)
(3.4)采用步骤(3.2)的方法对解码器网络的LSTM单元进行计算和更新。
(3.5)构建考虑外部因素的全连接神经网络。
其中,yt是t时刻解码器的输出值,dt是t时刻的外部离散特征向量,包括天气和日期,Wn和bn是待学习的参数。
(3.6)模型的训练。
采用Adagrad梯度下降法对步骤(3.1)至(3.5)中的参数进行反向传播更新,获得最终参数得到训练好的模型。
步骤4:模型在线预测。
对测试样本,首先按照步骤1到步骤2,对测试样本的格式进行转化,然后将测试样本直接输入到步骤3所训练好的模型中,模型输出最终的预测结果,完成预测。
进一步地,所述步骤1具体为:对于原始速度数据,将获取的车辆速度数据按照不同路段分类。对需要分析的每一个路段,以一小时为时间间隔,将每天划分成24个时间段。对于第z个时间间隔,z=0,1,2,…,23,用该时间间隔内该路段上速度的平均值来表示第z个时间间隔的速度,每一个时刻对应一个固定的速度值。则路段u在p天内获得的速度向量可以表示为vu T(1×24p),其中,u=1,2,…,L,为全部路段的代号,L为路段总数。
对于天气,按照降水量大小将其分类,分别用不同标签表示;将日期类型分为三类:工作日、周末、节假日,分别用不同标签表示;获取上述速度变量对应时刻的天气和日期类型,路段u在p天内的天气数据表示为wu T(1×24p),日期类别数据表示为du T(1×24p)。
与现有技术相比,本发明的有益效果是:本方法从实际交通数据的特点出发,不仅考虑了交通速度的时间相关特性和空间相关特性,而且考虑了天气、节假日等外部因素的影响。时间特性上,我们利用LSTM来充分学习交通速度的时序关联性,还考虑了不同历史时刻对不同预测时刻的贡献差异性,并通过注意力机制来学习这种差异;空间特性上,我们在对目标路段进行预测时,充分考虑了相关路段对其的影响,考虑到不同相关路段对预测路段的影响不同,使用注意力机制来学习这种贡献差异。本方法充分考虑了不同历史时刻的贡献差异和不同相关路段的贡献差异。相比以往的方法,本方法是一种对时空特性刻画更加细粒度、更加全面的端到端方法,为交通速度预测提供了一种有效易行的方法,为实际道路状况预测的研究指明了新的方向。
附图说明
图1是本发明方法架构图。
图2是使用本发明在不同预测步下的10个路段上的预测结果RMSE的均值与其他三种方法的对比图。
图3是使用本发明在不同预测步下的10个路段上的预测结果的RMSE的标准差与其他三种方法的对比图。
具体实施方式
下面结合附图和具体实例,对本发明作进一步详细说明。
本实例所采用数据为杭州市8000辆出租车2013年10月1日~2014年1月31日的为期四个月,共计123天的GPS信号数据,GPS数据中包括速度值和采样时间以及位置信息。
步骤1:建模数据预处理。
对原始速度数据进行均值化处理,对天气、节假日等外部因素类别数据进行预处理。
对于原始速度数据,将获取的车辆速度数据按照不同路段分类。对需要分析的每一个路段,以一小时为时间间隔,将每天划分成24个时间段。对于第z个时间间隔,z=0,1,2,…,23,用该时间间隔内该路段上速度的平均值来表示第z个时间间隔的速度,每一个时刻对应一个固定的速度值。则路段u在p天内获得的速度向量可以表示为vu T(1×24p),其中,u=1,2,…,L,为全部路段的代号,L为路段总数。本实例中,我们对杭州市出租车2013年10月1日~2014年1月31日的为期四个月,共计123天的GPS信号进行了预处理,并从中随机选出了246个路段的数据进行接下来的分析,p=123,L=246。
对于天气,按照降水量大小将其分类,分别用不同标签表示;将日期类型分为三类:工作日、周末、节假日,分别用不同标签表示;获取上述速度变量对应时刻的天气和日期类型,路段u在p天内的天气数据表示为wu T(1×24p),日期类别数据表示为du T(1×24p)。本实例中,对于天气,按照降水量大小将其分为三类,第一类是干燥无降水的天气,比如晴天、多云等;第二类是中度湿润,比如小雨、中雨、小雪、大雾等;第三类是高度湿润,比如大雨、大雪等,分别用数值1、2、3表示。对于节假日的影响,将日期类型分为三类:工作日、周末、节假日,分别用数值1、2、3来表示。本实例共获取为期四个月123天每天24小时的天气,以及123天每天的节假日类型,天气和节假日类型数据均对应于速度向量。如表1所示为某一路段预处理后的部分数据的格式示例。
表1
路段代号 | 当前速度 | 时间 | 天气 | 节假日 |
186 | 35 | 2013/10/1 9:00 | 1 | 3 |
186 | 32.1429 | 2013/10/1 10:00 | 1 | 3 |
186 | 32 | 2013/10/1 11:00 | 1 | 3 |
186 | 33.3571 | 2013/10/1 12:00 | 1 | 3 |
186 | 34 | 2013/10/1 13:00 | 1 | 3 |
186 | 30.4 | 2013/10/1 14:00 | 1 | 3 |
步骤2:确定模型的输入变量和外部离散特征向量。
(2.1)设c为待预测路段编号,根据地理位置,按照与预测路段的交叉和临近的优先原则选取前k个路段,作为与路段c相关的路段,这些相关路段的速度将作为变量用于预测模型的建立,本实例中k的值取4,选取了10个预测路段。
(2.2)设m为历史时间窗口的大小,tp为第一个预测时刻,则模型预测该时刻所需的输入包括该时刻之前的m个时刻,对于历史时刻i(i=tp-m,tp-m+1,...,tp-1),其对应所需的速度输入向量记为其中k为相关路段的个数。此外还要输入预测时刻所对应的外部离散特征向量dt,包括天气wtp、节假日dtp在内的外部因素。本实例中m值为24。
步骤3:模型的建立和训练。
(3.1)确定相关路段的贡献程度,得到新的输入向量。
编码器网络采用LSTM作为基础单元,历史时间步长为m,与步骤2中的历史时间窗口一致。对于历史时刻i所对应的原始输入向量x,首先计算每个相关路段的得分,如下式所示:
其中,j=1,2,...,k,hi-1和si-1分别为Encoder中的LSTM单元的前一时刻的f维隐藏层状态和细胞状态,是所有输入时刻的第j个相关路段速度值所组成的向量,是网络需要学习的参数。本实例中f取值为96。
使用类SoftMax对得分进行归一化处理,使其转化成类概率分布的权重系数:
然后将对应路段的速度值与对应的权重相乘,得到该时刻新的输入向量:
(3.2)对编码器网络的LSTM单元进行计算和更新。
将新的输入向量输入到LSTM单元,对于历史时刻i的LSTM单元,其计算和更新方式如下,首先计算遗忘门fi、输入门ai、输出门oi:
其中,[hi-1;xi]是前一个时刻的隐藏层状态hi-1与当前时刻的输入xi在向量维度上的拼接。σ表示sigmoid函数,Wf,Wa,Wo,bf,ba,bo都是网络要学习的参数。
然后计算更新当前的细胞状态:
其中,Ws,bs是待学习的参数,符号⊙表示对应元素相乘。
然后计算隐藏层状态如下:
hi=oi⊙tanh(si) (8)
(3.3)确定不同历史时刻的贡献程度,得到新的输入向量。
解码器网络也是由LSTM单元构成。对于当前的预测时刻t(t=tp,tp+1,tp+2,tp为第一个预测时刻),首先我们利用解码器中当前时刻的前一时刻的隐藏层状态和细胞状态以及编码器中的每个隐藏层状态,生成不同历史时刻对当前预测时刻的贡献分数,如下:
其中,h't-1和s't-1分别是预测时刻的前一时刻的解码器LSTM单元的隐藏层状态和细胞状态,hi是历史时刻i的编码器LSTM单元的隐藏层状态,也是编码器的第i个LSTM单元的隐藏层状态,m是编码器部分中LSTM单元的数量,vd,Wd,Ud是要学习的参数。
采用类SoftMax的方式对得分进行归一化,得到第i个历史时刻隐藏层的权重系数:
然后将权重系数与隐藏层状态对应相乘再求和,计算出预测时刻t所对应的编码器中所有时刻的隐藏层状态的加权和ct:
将ct与解码器中上一时刻的输出yt-1在维度上进行拼接,作为解码器中当前时刻LSTM单元的输入向量:
xt=[ct;yt-1] (12)
本实例中预测步数为3,即解码器网络的LSTM单元个数为3。
(3.4)对解码器网络的LSTM单元进行计算和更新,步骤同(3.2)。
即,将新的输入向量输入到解码器网络的LSTM单元,对于预测时刻t的LSTM单元,其计算和更新方式如下,首先计算遗忘门f′t、输入门a't、输出门o't:
f′t=σ(W'f[h't-1;xt]+b'f)
a't=σ(W′a[h't-1;xt]+b'a)
o't=σ(W′o[h't-1;xt]+b'o)
其中,[h't-1;xt]是前一个时刻的隐藏层状态h't-1与当前时刻的输入xt在向量维度上的拼接。σ表示sigmoid函数,W'f,Wa',Wo',b'f,b'a,b'o都是网络要学习的参数。
然后计算更新当前的细胞状态:
s't=f′t⊙s't-1+a't⊙tanh(W′s[h't-1;xt]+b's)
其中,W′',b's是待学习的参数,符号⊙表示对应元素相乘。
计算隐藏层状态如下:
h't=o't⊙tanh(s't)
(3.5)构建考虑外部因素的全连接神经网络。
其中,yt是t时刻解码器的输出值,dt是t时刻的外部离散特征向量,包括天气和日期,Wn和bn是待学习的参数。本实例中全连接神经网络的隐藏层数为1,隐藏层的神经元个数设为10。
(3.6)模型的训练。
采用Adagrad梯度下降法对步骤(3.1)至(3.5)中的参数进行反向传播更新,得到模型的最终参数。本实例10个路段分别有2800条样本记录,针对不同路段,我们采用前2400个样本作为训练集,后400个样本作为测试集,Epoch设置为2。
步骤4:模型在线预测。
对不同路段的400个测试样本,首先按照步骤1到步骤2,对测试样本的格式进行转化,然后将测试样本直接输入到步骤3所建立好的模型中,模型输出最终的预测结果,完成预测。
计算本方法和其他方法在10个随机选择的路段上的测试集的预测结果与真实值的均方根误差RMSE,如表2所示。其中,其他方法包括基于时空宽度学习网络ST-BLN、深度神经网络DNN和支持向量回归机SVR的交通速度预测方法,各方法的输入一致。可以看出,本方法在每个预测步骤的每个路段上均优于其他三种方法。表明本方法对预测精度有较为明显的提高。此外,为观察该方法的稳定性,我们针对每个预测时间步分别计算了四种方法在10个路段的标准差,结果表明所提方法是所有四种方法中最稳定的。为了对结果进行更加直观的展示,我们将10个路段上的四种方法在不同路段预测的RMSE的平均值和标准偏差绘制成曲线图,分别如图2和图3所示。该图可以进一步验证结果的有效性,也表明了随着预测步长的增加,本方法的准确性下降的速度小于其他方法。
表2
Claims (2)
1.一种协同考虑时空相关性和贡献差异的多步交通速度预测方法,其特征在于,该方法包括以下步骤:
步骤1:建模数据预处理:对原始速度数据根据路段和时间段进行均值化处理,对天气、节假日外部因素数据进行类别分类;
步骤2:确定模型的输入变量和外部离散特征向量;
(2.1)设c为待预测路段的编号,根据地理位置,按照与预测路段的交叉和临近的优先原则选取前k个路段,作为与路段c相关的路段,这些相关路段的速度将作为变量用于预测模型的建立;
(2.2)m为建模所需要的历史时间窗口的大小;设tp为第一个预测时刻,则模型预测该时刻所需的输入包括该时刻之前的m个时刻,对于历史时刻i,i=tp-m,tp-m+1,...,tp-1,其对应所需的速度输入向量记为其中k为相关路段的个数;此外还要输入预测时刻所对应的外部离散特征向量dt,包括天气和日期数据;
步骤3:模型的建立和训练;
(3.1)确定相关路段的贡献程度,得到新的输入向量;
编码器网络采用LSTM作为基础单元,历史时间步长为m,与步骤2中的历史时间窗口一致;对于历史时刻i所对应的原始输入向量x,首先计算每个相关路段的得分,如下式所示:
其中,j=1,2,...,k,k为相关路段数量,hi-1和si-1分别为Encoder中LSTM单元当前时刻的前一时刻的f维隐藏层状态和细胞状态,是所有输入时刻的第j个相关路段速度值所组成的向量,是网络需要学习的参数;
使用类SoftMax对得分进行归一化处理,使其转化成类概率分布的权重系数:
然后将对应路段的速度值与对应的权重相乘,得到该时刻新的输入向量:
(3.2)对编码器网络的LSTM单元进行计算和更新;
将新的输入向量输入到LSTM单元,对于历史时刻i的LSTM单元,其计算和更新方式如下,首先计算遗忘门fi、输入门ai、输出门oi:
然后计算更新当前的细胞状态:
其中,Ws,bs是待学习的参数,符号⊙表示对应元素相乘;
计算隐藏层状态如下:
hi=oi⊙tanh(si) (8)
(3.3)确定不同历史时刻的贡献程度,得到新的输入向量;
解码器网络也是由LSTM单元构成;对于当前的预测时刻t(t=tp,tp+1,tp+2,tp为第一个预测时刻),首先我们利用解码器中当前时刻的前一时刻的隐藏层状态和细胞状态以及编码器中的每个隐藏层状态,生成不同历史时刻对当前预测时刻的贡献分数,如下:
其中,h't-1和s't-1分别是预测时刻的前一时刻的解码器LSTM单元的隐藏层状态和细胞状态,hi是历史时刻i的编码器LSTM单元的隐藏层状态,vd,Wd,Ud是要学习的参数;
采用类SoftMax的方式对得分进行归一化,得到历史时刻i隐藏层的权重系数:
然后将权重系数与隐藏层状态对应相乘再求和,计算出预测时刻t所对应的编码器中所有时刻的隐藏层状态的加权和ct:
将ct与解码器中上一时刻的输出yt-1在维度上进行拼接,作为解码器中当前时刻LSTM单元的输入向量:
xt=[ct;yt-1] (12)
(3.4)采用步骤(3.2)的方法对解码器网络的LSTM单元进行计算和更新;
(3.5)构建考虑外部因素的全连接神经网络;
其中,yt是t时刻解码器的输出值,dt是t时刻的外部离散特征向量,包括天气和日期,Wn和bn是待学习的参数;
(3.6)模型的训练;
采用Adagrad梯度下降法对步骤(3.1)至(3.5)中的参数进行反向传播更新,获得最终参数得到训练好的模型;
步骤4:模型在线预测;
对测试样本,首先按照步骤1到步骤2,对测试样本的格式进行转化,然后将测试样本直接输入到步骤3所训练好的模型中,模型输出最终的预测结果,完成预测。
2.根据权利要求1所述的方法,其特征在于,所述步骤1具体为:对于原始速度数据,将获取的车辆速度数据按照不同路段分类;对需要分析的每一个路段,以一小时为时间间隔,将每天划分成24个时间段;对于第z个时间间隔,z=0,1,2,…,23,用该时间间隔内该路段上速度的平均值来表示第z个时间间隔的速度,每一个时刻对应一个固定的速度值;则路段u在p天内获得的速度向量可以表示为vu T(1×24p),其中,u=1,2,…,L,为全部路段的代号,L为路段总数;
对于天气,按照降水量大小将其分类,分别用不同标签表示;将日期类型分为三类:工作日、周末、节假日,分别用不同标签表示;获取上述速度变量对应时刻的天气和日期类型,路段u在p天内的天气数据表示为wu T(1×24p),日期类别数据表示为du T(1×24p)。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010377173.0A CN111613054B (zh) | 2020-05-07 | 2020-05-07 | 一种协同考虑时空相关性及贡献差异的多步交通速度预测方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010377173.0A CN111613054B (zh) | 2020-05-07 | 2020-05-07 | 一种协同考虑时空相关性及贡献差异的多步交通速度预测方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111613054A CN111613054A (zh) | 2020-09-01 |
CN111613054B true CN111613054B (zh) | 2021-07-06 |
Family
ID=72204882
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010377173.0A Active CN111613054B (zh) | 2020-05-07 | 2020-05-07 | 一种协同考虑时空相关性及贡献差异的多步交通速度预测方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111613054B (zh) |
Families Citing this family (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112308336B (zh) * | 2020-11-18 | 2023-12-19 | 浙江大学 | 一种基于多步时序预测的高速铁路大风限速动态处置方法 |
CN112652165B (zh) * | 2020-12-11 | 2022-05-31 | 北京百度网讯科技有限公司 | 模型训练及路况预测方法、装置、设备、介质及程序产品 |
CN113077053B (zh) * | 2021-03-18 | 2022-09-02 | 中国电子科技集团公司第五十四研究所 | 多元群体活动模式表征方法及目标地理活动区域识别方法 |
CN113326972B (zh) * | 2021-05-06 | 2024-01-05 | 大连海事大学 | 基于实时公交车速度统计数据的公交专用道短时速度预测方法 |
CN113391622B (zh) * | 2021-06-22 | 2022-09-02 | 中国人民解放军国防科技大学 | 利用多元多步预测技术的航天器姿态系统异常检测方法 |
CN113665576B (zh) * | 2021-08-31 | 2024-07-26 | 中国第一汽车股份有限公司 | 车辆行驶工况预测方法、装置、设备及介质 |
CN114021856A (zh) * | 2021-12-03 | 2022-02-08 | 重庆大学 | 一种道路风险预测方法及系统 |
CN114387782B (zh) * | 2022-01-12 | 2023-06-27 | 智道网联科技(北京)有限公司 | 预测交通状态的方法、装置和电子设备 |
CN114881282B (zh) * | 2022-03-28 | 2024-09-10 | 天津大学 | 基于注意力机制和堆叠lstm的交通预测方法 |
CN116959259B (zh) * | 2023-09-19 | 2023-12-26 | 深圳市城市交通规划设计研究中心股份有限公司 | 基于学校放学事件的交通预测方法、电子设备及存储介质 |
CN117831287B (zh) * | 2023-12-29 | 2024-05-31 | 北京大唐高鸿数据网络技术有限公司 | 高速公路拥堵指数的确定方法、装置、设备和存储介质 |
Family Cites Families (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109035762B (zh) * | 2018-06-28 | 2020-12-18 | 浙江大学 | 一种基于时空宽度学习的交通速度预测方法 |
CN109131452B (zh) * | 2018-08-14 | 2021-06-15 | 西安理工大学 | 一种基于长短时记忆网络的列车状态在线预测方法 |
AU2018101514A4 (en) * | 2018-10-11 | 2018-11-15 | Chi, Henan Mr | An automatic text-generating program for Chinese Hip-hop lyrics |
CN109544911B (zh) * | 2018-10-30 | 2021-10-01 | 中山大学 | 一种基于lstm-cnn的城市路网交通状态预测方法 |
CN110648527B (zh) * | 2019-08-20 | 2021-05-11 | 浙江工业大学 | 一种基于深度学习模型的交通速度预测方法 |
CN110909931A (zh) * | 2019-11-20 | 2020-03-24 | 成都理工大学 | 基于模态分解重构及深度lstm-rnn模型的测井曲线预测方法 |
CN110889546B (zh) * | 2019-11-20 | 2020-08-18 | 浙江省交通规划设计研究院有限公司 | 一种基于注意力机制的交通流量模型训练方法 |
-
2020
- 2020-05-07 CN CN202010377173.0A patent/CN111613054B/zh active Active
Also Published As
Publication number | Publication date |
---|---|
CN111613054A (zh) | 2020-09-01 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111613054B (zh) | 一种协同考虑时空相关性及贡献差异的多步交通速度预测方法 | |
CN111798051B (zh) | 基于长短期记忆神经网络的空气质量时空预测方法 | |
CN111709549B (zh) | 一种基于svd-pso-lstm的短时交通流预测的导航提醒方法 | |
CN109389244B (zh) | 一种基于gru的多因素感知短期景区内游客人数预测方法 | |
CN111899510A (zh) | 基于发散卷积和gat的智能交通系统流量短期预测方法及系统 | |
CN111860989B (zh) | 一种基于蚁群算法优化的lstm神经网络短时交通流量预测方法 | |
CN113177657B (zh) | 轨道交通客流预测方法及装置 | |
CN114781538B (zh) | 一种ga-bp神经网络耦合决策树的空气质量预测方法和系统 | |
CN111915073A (zh) | 一种考虑日期属性和天气因素的铁路城际客流短期预测方法 | |
CN106448151A (zh) | 一种短时交通流预测方法 | |
CN109035762B (zh) | 一种基于时空宽度学习的交通速度预测方法 | |
CN111862592B (zh) | 一种基于rgcn的交通流预测方法 | |
CN110866631A (zh) | 基于集成的门递归单元神经网络gru来预测大气污染情况的方法 | |
CN114841400B (zh) | 基于多任务时空图卷积的空气质量预测方法 | |
CN113205698A (zh) | 一种基于igwo-lstm的短时交通流预测的导航提醒方法 | |
CN109086926A (zh) | 一种基于组合神经网络结构的短时轨道交通客流预测方法 | |
CN106526710A (zh) | 一种雾霾预测方法及装置 | |
CN113011455B (zh) | 一种空气质量预测svm模型构建方法 | |
CN113449905A (zh) | 一种基于门控循环单元神经网络的交通拥堵预警方法 | |
CN112884014A (zh) | 一种基于路段拓扑结构分类的交通速度短时预测方法 | |
CN111815075B (zh) | 一种重大公共卫生事件下交通出行需求的预测方法 | |
CN113674524A (zh) | 基于lstm-gasvr的多尺度短时交通流预测建模、预测方法及系统 | |
CN111915076A (zh) | 一种利用人工智能神经网络实现景区观景人员预测的方法 | |
CN114973665A (zh) | 一种结合数据分解和深度学习的短时交通流预测方法 | |
CN115482665B (zh) | 一种知识与数据协同驱动的多粒度交通事故预测方法及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |