CN111008726B - 一种电力负荷预测中类图片转换方法 - Google Patents

一种电力负荷预测中类图片转换方法 Download PDF

Info

Publication number
CN111008726B
CN111008726B CN201911031399.9A CN201911031399A CN111008726B CN 111008726 B CN111008726 B CN 111008726B CN 201911031399 A CN201911031399 A CN 201911031399A CN 111008726 B CN111008726 B CN 111008726B
Authority
CN
China
Prior art keywords
imf
data
characteristic
feature
length
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201911031399.9A
Other languages
English (en)
Other versions
CN111008726A (zh
Inventor
刘小珠
肖芝阳
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Wuhan University of Technology WUT
Original Assignee
Wuhan University of Technology WUT
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Wuhan University of Technology WUT filed Critical Wuhan University of Technology WUT
Priority to CN201911031399.9A priority Critical patent/CN111008726B/zh
Publication of CN111008726A publication Critical patent/CN111008726A/zh
Application granted granted Critical
Publication of CN111008726B publication Critical patent/CN111008726B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y04INFORMATION OR COMMUNICATION TECHNOLOGIES HAVING AN IMPACT ON OTHER TECHNOLOGY AREAS
    • Y04SSYSTEMS INTEGRATING TECHNOLOGIES RELATED TO POWER NETWORK OPERATION, COMMUNICATION OR INFORMATION TECHNOLOGIES FOR IMPROVING THE ELECTRICAL POWER GENERATION, TRANSMISSION, DISTRIBUTION, MANAGEMENT OR USAGE, i.e. SMART GRIDS
    • Y04S10/00Systems supporting electrical power generation, transmission or distribution
    • Y04S10/50Systems or methods supporting the power network operation or management, involving a certain degree of interaction with the load-side end user applications

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Economics (AREA)
  • General Engineering & Computer Science (AREA)
  • Strategic Management (AREA)
  • Evolutionary Computation (AREA)
  • Human Resources & Organizations (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Biology (AREA)
  • Health & Medical Sciences (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Computing Systems (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Computational Linguistics (AREA)
  • Molecular Biology (AREA)
  • Development Economics (AREA)
  • Biomedical Technology (AREA)
  • Game Theory and Decision Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Biophysics (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Marketing (AREA)
  • Operations Research (AREA)
  • Quality & Reliability (AREA)
  • Tourism & Hospitality (AREA)
  • General Business, Economics & Management (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开了一种电力负荷预测中类图片转换方法,提出了一种新的时间序列数据转换成类彩色图片结构的数据的方法,将转换后的数据输入按一定逻辑使用异形卷积核的改进的卷积神经网络,增强了对时间*特征矩阵中局部和整体的隐含特征规律的提取能力。其在实际电力短期负荷预测实验中,与主流方法相比,训练时间减少,预测的精度提升。

Description

一种电力负荷预测中类图片转换方法
技术领域
本发明属于神经网络、图片识别技术领域,涉及一种类图片转换方法,具体涉及一种电力负荷预测中类图片转换方法。
背景技术
短期电力负荷预测主要是指预报未来几小时、一天至几天的电力负荷,电力负荷预测是能量管理系统的重要组成部分,短期负荷预测不但为电力系统的安全、经济运行提供保障,也是市场环境下编排调度计划、供电计划、交易计划的基础(文献[1])。目前,人工神经网络的应用在负荷预测领域已经较为成熟,比如常见的BP神经网络(backpropagation,BP),循环神经网络(Recurrent Neural Network,RNN),长短期记忆网络(Long Short-Term Memory,LSTM),卷积神经网络(Convolutional Neural Networks,CNN)等。为了获得更好的预测精度,王成纲等人将小波分析法(Wavelet)引入负荷预测,将负荷序列看成是一系列具有不同频率特征分量的叠加,对分解后的分量根据其特点构造相应的神经网络模型进行预测,最后将各分量预测结果以获得最终预测值。这种方法在一定程度上克服了电力负荷序列对外部因素敏感的影响,使非平稳非线性的复杂时间序列转换成了平稳的信号,预测精度得以提高,但是小波基的选取和分解尺度的确定对预测结果有很大的影响(文献[2])。经验模态分解(Empirical Mode Decomposition,EMD)是由Huang等人在1998年提出的希尔伯特-黄变换算法(Hilbert-Huang transform,HHT)的核心算法。文献[3]将EMD和人工神经网络(ANN)结合,利用EMD高适应性的特点,解决了小波分解分辨率低,对小波基选择敏感的问题,更加适合负荷预测的分解分析。文献[4]介绍的经过KPCA和NSGAII优化参数的CNN虽能允许畸形数据的存在,且局部连接和权值共享在一定程度上提高了负荷预测效率和准确性,但对负荷序列的特征提取工作仍需加强。
人工神经网络在电力系统的短期负荷预测领域已经相对成熟,主要问题包含两方面:
(1)通常情况下,电力负荷不仅仅是由过去的电力负荷所决定的,其他特征如地域,人口,温度,气压,工作日或周末等都在一定程度上影响着电力负荷,将同一时刻不同特征对预测目标的影响;不同时刻同一特征对预测目标的影响;不同时刻不同特征对预测目标的影响都进行合理的运算是需要考虑的问题。
(2)实际应用模型时,常见的全连接神经网络虽有一定预测效果,但其完全没有记忆能力,无法学习到动态的时序行为,RNN和LSTM虽有记忆能力,但这种记忆会随着时间轴的拉长而不断减弱,对不同特征不同时间的组合的学习能力较弱,卷积神经网络的表征学习能力有其研究价值,但要考虑如何对特征时间序列卷积。
目前迫切需要一种能充分分析时间*特征矩阵,有对时间*特征矩阵中局部和整体的隐含特征规律的提取能力,且训练时间短,预测精度较高的方法。
[1]康重庆,夏清,刘梅.电力系统负荷预测[M].北京:中国电力出版社,2007.
[2]王成纲.基于负荷分解的电力系统短期预测方法的研究[D].保定:华北电力大学,2006.
[3]郑连清,郑艳秋.基于经验模式分解与人工神经网络的短期电力负荷预测[J].电力系统保护与控制,2009,37(3):66-69.
[4]牛东晓,马天男,王海潮,刘鸿飞,黄雅莉.基于KPCA和NSGAⅡ优化CNN参数的电动汽车充电站短期负荷预测[J].电力建设,2017,38(3):85-92。
发明内容
本发明的目的是对已有的方法作出一定改进,进一步提高短期负荷预测的准确度,减少所消耗的时间。
传统CNN网络识别一张彩色图片是将彩色图片分成R,G,B三通道的像素点分布,一个卷积核的三层分别对三通道进行卷积,得到一个feature map,但电力负荷预测的输入数据毕竟不是图片,一般做法是直接对输入数据进行卷积,所以若将输入数据转换成类彩色图片的数据结构,这样就可以更好的发挥卷积神经网络的表征学习能力,从而提高卷积神经网络对时间序列预测的准确度。
本发明所采用的技术方案是:一种电力负荷预测中类图片转换方法,包括以下步骤:
步骤1:电力负荷数据集的预处理。
(1)电力负荷数据集中数据的查漏删异;
由于选择的数据的真实性,以及数据集的规模较大,为了保证之后实验结果的真实可靠,需要对数据集中错误重复的数据删除,对缺失日期的记录进行补全,对异常的记录进行修正。
对异常值的检测的方法:利用箱形图对单个特征的第一四分位数(Q1)之前1.5个四分位距(IQR)和第三四分位数(Q3)之后1.5个四分位距(IQR),即(Q1-1.5IQR,Q3+1.5IQR)区间之外的值判断为异常值。
补全缺失和异常的方法:根据具体情况使用中位数或众数进行填充;找到缺失记录日期的相似日或临近日期的数据进行填充;根据缺失记录的其他已知特征进行聚类推断填充;
(2)数字化;
数据集中出现的一些非数字型特征如天气类型,是否工作日等并不能直接被使用,需要将其转换成数字类型即进行编码后才能使用,常见的转换方法有直接编码和OneHot编码,本发明使用OneHot编码,编码后特征数量会增加。
(3)聚类;
尝试对其他特征进行聚类(主要是非数字类型特征),将其他单个特征与预测目标特征组合成二维特征空间,使用均值偏移聚类和DBSCAN聚类,将聚类后的结果作为新特征,非数字类型的原始特征可以删去。
(4)数据筛选;
本发明共进行了两次筛选,其中第一次筛选是对刚收集到的数据集中的特征进行筛选,凭经验对其中与预测目标关系不大的特征进行删除,比如当日的月相,住户的家庭情况(预测目标是某地区日均电力负荷),一天中温度最高的时间,日出落时间等。
第二次筛选是在数字化及增加特征后,利用计算机得到各特征与预测目标之间的相关程度,绘制出Hotmap,对于与原始负荷时间序列x(t)的相关系数的绝对值|r[x(t),yi(t)]|小于0.05的其他特征时间序列,删去。
(5)标准化;
标准化是为了提高之后训练模型的收敛速度和预测精度。因为数据集中的各特征的量纲不同,为解决数据的可比性,需要对数据进行标准化(normalization),本文使用Min-Max标准化进行处理,其公式为:
Min-Max标准化方法是对原始数据进行线性变换。将特征y的某时刻t的数值通过Min-Max标准化映射成在区间[0,1]中的值y*(t),其中,ymin,ymax分别代表特征时间序列y(t)的最小和最大值。
步骤2:将原始负荷时间序列x(t)进行EMD分解,分解后会得到N个本征模函数IMF(Intrinsic Mode Function,IMF)和一个剩余分量,这N+1个序列直接叠加即是原始负荷时间序列;
EMD分解将非平稳非线性的复杂电力负荷序列转变成了平稳的信号,更有利于预测精度的提高。
EMD分解的步骤是:
(1)找出原始负荷时间序列x(t)中的所有极大值点和极小值点,并通过三次样条插值函数(Cubic Spline Interpolation,Spline插值)分别拟合x(t)的上包络线eup(t)和下包络线elow(t);
(2)计算上包络线eup(t)和下包络线elow(t)的平均值m1(t):
(3)计算原始负荷时间序列x(t)和包络线均值m1(t)的差值h1(t):
h1(t)=x(t)-m1(t);
(4)如果h1(t)满足IMF条件,那么h1(t)就是求得的第一个IMF分量,它包含原始序列中最短的周期分量;否则将h1(t)视为原始负荷时间序列,重复步骤1~3,直到k次迭代后的差值h1 k(t)满足IMF条件成为第一个IMF分量,记为:
imf1(t)=h1 k(t);
判断是否满足IMF条件的标准是:h1 k(t)若还存在负的局部极大值和正的局部极小值,说明这还不是一个本征模函数,需要继续进行“筛选”。
(5)从原始负荷时间序列x(t)分离出第一个IMF分量imf1(t),即可得到x(t)的剩余分量r1(t):
r1(t)=x(t)-imf1(t);
(6)将剩余分量r1(t)作为新的原始负荷时间序列,重复步骤1~5,直到剩余分量的增幅比预设值小或残余分量变成单调函数或常数为止,即可得到x(t)的所有IMF分量和剩余分量,该过程可以表示为:
(7)原始负荷时间序列可由IMF分量和剩余分量表示为:
步骤3:从电力负荷数据集中将经过预处理后的其他特征如温度,风速,气压等,这样的其他特征时间序列yi(t)(i=1,2,…,M;M表示其他特征的个数),按与原始负荷时间序列x(t)的相关系数的绝对值|r[x(t),yi(t)]|降序排列;
因为CNN网络的表征学习能力,数据的分布一定程度上也影响预测结果,因此按与预测目标x(t)的相关系数降序排列。重新排列后的时间*特征矩阵的数据分布情况就是这样的:纵向是各其他特征的降序排列,横向则是时间,横向长度按选取的合适的时间跨区(timestep)截取。
式中,Var[x(t)]和Var[yi(t)]分别表示原始负荷时间序列x(t)的方差和其他各特征时间序列yi(t)的方差,Cov[x(t),yi(t)]表示x(t)和yi(t)的协方差,即:
Cov[x(t),yi(t)]=E[x(t)yi(t)]-E[x(t)]E[yi(t)]
其中,E[x(t)]和E[yi(t)]表示x(t)和yi(t)的数学期望,这里即是原始负荷时间序列x(t)和各其他特征时间序列yi(t)的平均值。
步骤4:按步骤1中获得的N个本征模函数IMF和剩余分量r(t),共N+1个IMF分量,将这N+1个IMF分量分别放到步骤2中排好顺序的其他各特征时间序列yi(t)的第一位,建立N+1个通道;
其中各通道中其他特征yi k(t)是根据其与本通道的唯一的IMF分量的相关系数的绝对值与其他所有通道的IMF分量与该特征的相关系数的绝对值之和作加权运算获得,即:
式中,yi k(t)表示第i个特征在k通道的t时刻的数值,imfk(t)表示在k通道的IMF分量,表示所有N+1个通道中的IMF分量分别与第i个特征yi(t)的相关程度之和。
本发明还提供了一种电力负荷预测方法,在卷积神经网络中对转换后的类图片结构数据进行处理,预测电力负荷。
在卷积神经网络对转换后的类图片结构数据处理的环节,对卷积神经网络有两部分改进:
(1)卷积过程。这里的数据来源并不是真实的图片,实际的图片在卷积网络输入时,是以R,G,B颜色通道的像素点数值来表示的,而像素点各点间的的属性是完全相同的,转换后的类图片结构的数据,虽然结构上与真实图片相似,但某通道上时间*特征矩阵上各点间的意义却并不太一样,比如任取某点横向来看,就是某特定时刻t0的各特征数据yi k(t0);取其纵向来看,就是某特定特征y0的各时刻的数值y0 k(t),因此根据其意义使用异形卷积核。具体做法是:
{1}首先用时间轴向的长度为1,特征轴向的长度为2~4的长方形卷积核,特征轴向的步长为长方形卷积核的长,时间轴向步长为1,(或特征轴向长为2~4,时间轴向长为1,步长交换),对类图片结构的数据进行1~2次卷积,直到feature maps的特征轴长度减小到足够小的程度(通常在5以下)。
{2}再使用边长为特征轴长度的正方形卷积核,同时对特征轴和时间轴进行卷积,这样得到的feature maps的特征轴长度为1,时间轴长度为若干。
{3}最后使用Flatten平铺,再使用1~2层的全连接网络得到预测结果。
(2)不使用传统卷积神经网络的池化层(Polling),使用随机失活层(Dropout)。池化的目的在于去掉feature maps中不重要的样本,进一步减少参数数量,池化层能减少过拟合,减小输入尺寸但保留重要的信息来提高性能,但本研究中,无论是使用常见的最大池化(Max Pooling)还是平均池化(Mean Pooling),都会因为之前所述的各点间横向和纵向的物理意义不同,导致池化层并没有实现其本来的目的,数据会在一定程度上丢失,使预测精度降低。因此为了弥补,防止网络的过拟合(overfitting)和梯度消失(gradientvanishing)问题,使用随机失活层。
本发明结合了经验模态分解(Ensemble Empirical Mode Decomposition,EMD)提出了一种新的时间序列数据转换成类彩色图片结构的数据的方法,将转换后的数据输入按一定逻辑使用异形卷积核的改进的卷积神经网络,增强了对时间*特征矩阵中局部和整体的隐含特征规律的提取能力。其在实际的电力短期负荷预测实验中,与主流的CNN,RNN和LSTM相比,训练时间减少,预测的精度提升。
附图说明
图1为本发明实施例的原始数据的类图片结构转换示意图;
图2为本发明实施例的类图片转换-CNN负荷预测方法流程图;
图3为本发明实施例的改进CNN卷积过程示意图;
图4为本发明实施例的每天统计的电表记录条数;
图5为本发明实施例的电力负荷的类图片转换-改进卷积神经网络预测结果示意图;
图6为本发明实施例的类图片转换-CNN的5次运行的均方根误差示意图;
图7(a)为本发明实施例的5种电力负荷预测方法的均方根误差的前50次平均值示意图;
图7(b)为本发明实施例的5种电力负荷预测方法的均方根误差的50~150次平均值示意图;
图8(a)为本发明实施例的LSTM模型损失函数变化情况示意图;
图8(b)为本发明实施例的EMD_LSTM模型损失函数变化情况示意图;
图8(c)为本发明实施例的CNN模型损失函数变化情况示意图;
图8(d)为本发明实施例的类图片转换-改进卷积神经网络模型损失函数变化情况示意图。
具体实施方式
为了便于本领域普通技术人员理解和实施本发明,下面结合附图及实施例对本发明作进一步的详细描述,应当理解,此处所描述的实施示例仅用于说明和解释本发明,并不用于限定本发明。
请见图1,本发明提供的一种电力负荷预测中类图片转换方法,包括以下步骤:
步骤1:电力负荷数据集的预处理。
步骤2:将原始负荷时间序列x(t)进行EMD分解,分解后会得到N个本征模函数IMF和一个剩余分量,这N+1个序列直接叠加即是原始负荷时间序列;
步骤3:从电力负荷数据集中将经过预处理后的其他特征如温度,风速,气压等,这样的其他特征时间序列yi(t)(i=1,2,…,M;M表示其他特征的个数),按与原始负荷时间序列x(t)的相关系数的绝对值|r[x(t),yi(t)]|降序排列;
重新排列后的时间*特征矩阵的数据分布情况是:纵向为其他各特征的降序排列,横向是时间;
步骤4:按步骤1中获得的N个本征模函数IMF和剩余分量r(t),共N+1个IMF分量,将这N+1个IMF分量分别放到步骤2中排好顺序的其他各特征时间序列yi(t)的第一位,建立N+1个通道。
请见图2,本发明提供的类图片转换-CNN负荷预测方法,在卷积神经网络中对转换后的类图片结构数据进行处理,预测电力负荷。
本实施例首先要对数据进行预处理,将除原始负荷序列的其他特征序列(如温度,气压等)经过筛选,补缺删异,日期特征处理及简单聚类,数字化,再筛选;对于原始负荷序列,采用EMD分解负荷序列,得到多个imfs序列。然后再统一进行标准化。
之后是将经过上述操作后的数据进行类图片结构的转换,先按分解出的imf序列的个数建立N个通道,再按与原始负荷序列的相关程度对其他特征排序,对于各通道(层)中的其他特征的数值按此特征与各个通道的imf序列的相关程度进行一个加权运算,这样最终得到的数据结构就类似于彩色图片的R,G,B三通道。例如本次设计方法,原始负荷序列经EMD分解得到8个imf序列和1个剩余分量,因此数据集转换成了有9个通道的,时间轴和特征轴长度都为18的类图片结构的数据集。
最后是对卷积模型的配置,去掉池化层,以随机失活层代替,先选取合适长度,宽度为1的卷积核,对特征轴方向进行1~2次卷积,例如本发明在对结构为(9,18,18)的输入进行卷积时,先选取了128@(1,3)的卷积核进行了第一次卷积操作,又使用了256@(1,2)的卷积核进行第二次卷积,此时的feature map结构就为(256,18,3),然后再用768@(3,3)的卷积核同时对特征轴和时间轴进行卷积,这样feature map的结构就变为(768,6,1),最后进行Flatten操作,之后就是经过全连接层得出结果。全过程如图3所示。
本实施例选择了真实电力负荷记录作为例子验证发明的效果,使用的数据集来自kaggle上的伦敦智能电表数据集。数据集包含2011年11月至2014年2月期间参与英国电力网络领导的低碳伦敦项目的5,567名伦敦家庭样本的智能电表的能耗读数的数据。首先将数据集进行预处理,然后运用本发明中的方法进行实验仿真,实验的仿真环境是AnacondaNavigator下Jupyter notebook,机器学习库是Tensorflow,用Keras来搭建具体的神经网络。并同时与LSTM,EMD-LSTM,CNN和本发明方法比较训练时间和预测精度。
(1)伦敦智能电表数据集及其预处理;
研究的数据集中智能电表记录的每天的电力负荷的平均/最大/最小/中位等共9个特征,记录条数为1048576条;其中天气状况记录有每天的温度,湿度,气压,及银行假期等共32个特征,记录的条数为883条。
因数据集记录的电表数据的条数每天的差别很大,如图4,统计本地区总电力负荷存在困难,因此选择日均电力负荷作为预测目标。
对数据集进行筛选,将一些无关的特征删去,比如家庭信息,地点信息,日出/日落的时间,月相等,再整理成DateFrame格式的数据集,如下表1,方便之后的调用。
表1 DataFrame格式的数据集
缺失重复数据补全,对于数据集中time,icon,precipType等是非数字量使用OneHot编码。再利用现有特征,绘制出Hotmap,分析特征之间的相关情况,对于与目标变量day_avg_energy_sum相关程度小于0.05的特征,删去。
为避免取值范围大的属性比取值范围小的属性更占优势,所以对样本数据各属性进行归一化处理,线性调整到[-1,+1]。本发明中利用MinMaxScaler函数进行标准归一处理。
最终经过整理后的数据集如下表2所示;
表2预处理后的数据集
(2)为验证方法的预测准确度在Anaconda Navigator下的仿真:
选择的卷积神经网络的结构为:
Conv2D:128(1,3),strides=(1,3),activation='relu'-
Dropout(0.2)-
Conv2D:256(1,2),strides=(1,2),activation='relu'-
Dropout(0.2)-
Conv2D:768(3,3),strides=(3,1),activation='relu'-
Dropout(0.2)-
Flatten()-
Dense(512),activation='relu'-
Dropout(0.3)-
Dense(1),activation='relu'
损失函数选择为:loss='mape'
优化器选择为:optimizer='Adam'
评估标准选择为:metrics=['accuracy']
优化器的学习率设置为:lr=0.001
迭代次数设置为:epochs=50
每次迭代输入的数据个数设置为:batch_size=100
将经过类图片转换后的数据输入改进后的卷积神经网络,其中前70%的数据作为训练集,后30%的数据作为测试集。
训练数据的格式为:(566,18,18,9)
测试数据的格式为:(243,18,18,9)
预测目标的格式为:(243,)
请见图5,为测试集的真实情况与预测结果的对比,x轴为时间轴,y轴为预测目标日均电力负荷的数值;其中实线代表真实情况,虚线代表预测结果。可以看出,虚线和实线基本重合,表明本发明方法有一定的准确性,但无法评估其与其他主流模型的准确度差别。
为比较本发明方法和其他主流模型的准确度差别,为更准确区别本发明方法的效果,定义均方根误差σ:
其中k表示测试集的数据个数,yi *表示真实值,yi表示预测值。均方根误差σ是用来衡量预测值同真值之间的偏差,均方根误差σ越小,则说明准确度越高。为了使结果较严谨,分别运行5次取均方根误差的平均值;
请见图6,图中曲线表示本发明方法运行5次的均方根误差,从图中可以看出,随着预测次数的增加,均方根误差总体略有上升趋势,而总体均方根误差基本趋于平稳。
请见图7(a)(b),EMD分解可以提高LSTM模型的准确性。随着预测次数的增加,各种方法的均方根误差的平均值都略有上升趋势,这是因为随着预测次数的增加,预测未来的规律性的难度也在不断增加。本研究方法所代表的曲线在50次之前表现弱与CNN模型,而在50次之后则优于其他所有的模型。在预测的规模足够大时,才能发挥其优势。
(3)为验证各方法间的训练时间对比;
本实施例统计本发明方法和其他方法的训练时间,及损失函数的变化情况。
表3各模型参数及训练时间
从图8可以看出,总体上来说CNN类模型比LSTM类模型的损失函数下降得更快,训练时间更短,收敛到稳定值较为迅速。对比图8(a),(b)可以看出LSTM模型在加入了EMD分解后损失函数震荡减弱,更平稳的收敛到稳定值,但收敛时间有所增加。对比图(c),(d)类图片转换-改进卷积神经网络模型相较通常CNN模型,损失函数下降得更加平稳迅速,基本没有震荡过程。
表3列出了4种方法对比的训练时间,从表中可以看出,类图片转换-CNN方法在训练速度上消耗的时间是其他三种方法的1/3,而精度也有一定的保证。
应当理解的是,本说明书未详细阐述的部分均属于现有技术;上述针对较佳实施例的描述较为详细,并不能因此而认为是对本发明专利保护范围的限制,本领域的普通技术人员在本发明的启示下,在不脱离本发明权利要求所保护的范围情况下,还可以做出替换或变形,均落入本发明的保护范围之内,本发明的请求保护范围应以所附权利要求为准。

Claims (6)

1.一种电力负荷预测中类图片转换方法,其特征在于,在卷积神经网络中对转换后的类图片结构数据进行处理,预测电力负荷;
所述转换后的类图片结构数据,通过电力负荷预测中类图片转换方法获得;具体包括以下步骤:
步骤1:将原始负荷时间序列x(t)进行EMD分解,分解后会得到N个本征模函数IMF和一个剩余分量,这N+1个序列直接叠加即是原始负荷时间序列;
步骤2:从电力负荷数据集中将经过预处理后的其他特征,获得其他特征时间序列yi(t),i=1,2,…,M;M表示其他特征的个数;按与原始负荷时间序列x(t)的相关系数的绝对值|r[x(t),yi(t)]|降序排列,重新排列后的时间*特征矩阵的数据分布情况是:纵向为其他各特征的降序排列,横向是时间;所述其他特征包括温度、风速、气压;
步骤3:按步骤1中获得的N个本征模函数IMF和剩余分量r(t),共N+1个IMF分量,将这N+1个IMF分量分别放到步骤2中排好顺序的其他各特征时间序列yi(t)的第一位,建立N+1个通道;
所述卷积神经网络,在卷积过程中:
(1)首先用时间轴向的长度为1,特征轴向的长度为2~4的长方形卷积核,特征轴向的步长为长方形卷积核的长,时间轴向步长为1,对类图片结构的数据进行1~2次卷积,直到feature maps的特征轴长度减小到预设值以下;或特征轴向长为2~4,时间轴向长为1,步长交换,对类图片结构的数据进行1~2次卷积,直到feature maps的特征轴长度减小到预设值以下;
(2)再使用边长为特征轴长度的正方形卷积核,同时对特征轴和时间轴进行卷积,这样得到的feature maps的特征轴长度为1,时间轴长度为若干;
(3)最后使用Flatten平铺,再使用1~2层的全连接网络得到预测结果。
2.根据权利要求1所述的电力负荷预测中类图片转换方法,其特征在于,步骤1中所述将原始负荷时间序列进行EMD分解,具体实现包括以下子步骤:
步骤1.1:找出原始负荷时间序列x(t)中的所有极大值点和极小值点,并通过三次样条插值函数(Cubic Spline Interpolation,Spline插值)分别拟合x(t)的上包络线eup(t)和下包络线elow(t);
步骤1.2:计算上包络线eup(t)和下包络线elow(t)的平均值m1(t);
步骤1.3:计算原始负荷时间序列x(t)和包络线均值m1(t)的差值h1(t);
h1(t)=x(t)-m1(t);
步骤1.4:判断;
如果h1(t)满足IMF条件,那么h1(t)就是求得的第一个IMF分量,它包含原始序列中最短的周期分量;否则将h1(t)视为原始负荷时间序列,重复步骤1.1~步骤1.3,直到k次迭代后的差值h1 k(t)满足IMF条件成为第一个IMF分量,记为:
imf1(t)=h1 k(t);
判断是否满足IMF条件的标准是:h1 k(t)若还存在负的局部极大值和正的局部极小值,说明这还不是一个本征模函数,需要继续进行“筛选”;
步骤1.5:从原始负荷时间序列x(t)分离出第一个IMF分量imf1(t),即可得到x(t)的剩余分量r1(t);
r1(t)=x(t)-imf1(t);
步骤1.6:将剩余分量r1(t)作为新的原始负荷时间序列,重复步骤1.1~步骤1.5,直到剩余分量的增幅比预设值小或残余分量变成单调函数或常数为止,即得到x(t)的所有IMF分量和剩余分量,该过程表示为:
则原始负荷时间序列由IMF分量和剩余分量表示为:
3.根据权利要求1所述的电力负荷预测中类图片转换方法,其特征在于:步骤2中,
式中,Var[x(t)]和Var[yi(t)]分别表示原始负荷时间序列x(t)的方差和其他各特征时间序列yi(t)的方差,Cov[x(t),yi(t)]表示x(t)和yi(t)的协方差;
Cov[x(t),yi(t)]=E[x(t)yi(t)]-E[x(t)]E[yi(t)]
其中,E[x(t)]和E[yi(t)]表示x(t)和yi(t)的数学期望,这里即是原始负荷时间序列x(t)和各其他特征时间序列yi(t)的平均值。
4.根据权利要求1所述的电力负荷预测中类图片转换方法,其特征在于:步骤3中,各通道中其他特征yi k(t)是根据其与本通道的唯一的IMF分量的相关系数的绝对值与其他所有通道的IMF分量与该特征的相关系数的绝对值之和作加权运算获得,即:
式中,yi k(t)表示第i个特征在k通道的t时刻的数值,imfk(t)表示在k通道的IMF分量,表示所有N+1个通道中的IMF分量分别与第i个特征yi(t)的相关程度之和。
5.根据权利要求1所述的电力负荷预测中类图片转换方法,其特征在于:所述卷积神经网络,不使用传统卷积神经网络的池化层Polling,使用随机失活层Dropout。
6.根据权利要求1所述的电力负荷预测中类图片转换方法,其特征在于:步骤2中,其他各特征的预处理,具体实现包括以下子步骤:
(1)电力负荷数据集中数据的查漏删异;
对异常值的检测的方法:利用箱形图对单个特征的第一四分位数Q1之前1.5个四分位距IQR和第三四分位数Q3之后1.5个四分位距IQR,即(Q1-1.5IQR,Q3+1.5IQR)区间之外的值判断为异常值;
补全缺失和异常的方法:根据具体情况使用中位数或众数进行填充;找到缺失记录日期的相似日或临近日期的数据进行填充;根据缺失记录的其他已知特征进行聚类推断填充;
(2)数字化;
数据集中出现的一些非数字型特征,使用OneHot编码将其转换成数字类型;
(3)聚类;
对非数字类型特征进行聚类,将其他单个特征与预测目标特征组合成二维特征空间,使用均值偏移聚类和DBSCAN聚类,将聚类后的结果作为新特征;
(4)数据筛选;
包括两次筛选,其中第一次筛选是对刚收集到的数据集中的特征进行筛选,凭经验对其中与预测目标关系不大的特征进行删除;
第二次筛选是在数字化及增加特征后,利用计算机得到各特征与预测目标之间的相关程度,绘制出Hotmap,对于与原始负荷时间序列x(t)的相关系数的绝对值|r[x(t),yi(t)]|小于0.05的其他特征时间序列,删去;
(4)对数据进行标准化;
使用Min-Max标准化进行处理,其公式为:
将特征y的某时刻t的数值通过Min-Max标准化映射成在区间[0,1]中的值y*(t),其中,ymin,ymax分别代表特征时间序列y(t)的最小和最大值。
CN201911031399.9A 2019-10-28 2019-10-28 一种电力负荷预测中类图片转换方法 Active CN111008726B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201911031399.9A CN111008726B (zh) 2019-10-28 2019-10-28 一种电力负荷预测中类图片转换方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201911031399.9A CN111008726B (zh) 2019-10-28 2019-10-28 一种电力负荷预测中类图片转换方法

Publications (2)

Publication Number Publication Date
CN111008726A CN111008726A (zh) 2020-04-14
CN111008726B true CN111008726B (zh) 2023-08-29

Family

ID=70111563

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201911031399.9A Active CN111008726B (zh) 2019-10-28 2019-10-28 一种电力负荷预测中类图片转换方法

Country Status (1)

Country Link
CN (1) CN111008726B (zh)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111583065B (zh) * 2020-05-12 2023-08-22 广东电网有限责任公司计量中心 一种电力负荷数据预测方法及装置
CN111582943B (zh) * 2020-05-13 2023-03-24 江南大学 基于cnn和lstm的电力系统负荷预测方法
CN111695731B (zh) * 2020-06-09 2023-05-02 中国电力科学研究院有限公司 基于多源数据和混合神经网络的负荷预测方法、系统及设备
CN112803398A (zh) * 2021-01-08 2021-05-14 武汉数澎科技有限公司 基于经验模态分解和深度神经网络的负荷预测方法及系统
CN113536989B (zh) * 2021-06-29 2024-06-18 广州博通信息技术有限公司 基于摄像视频逐帧分析的制冷机结霜监控方法及系统

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2008132066A1 (en) * 2007-04-27 2008-11-06 Siemens Aktiengesellschaft A method for computer-assisted learning of one or more neural networks
CN107239854A (zh) * 2017-05-22 2017-10-10 华北电力大学 基于emd‑gra‑mpso‑lssvm模型的负荷预测方法
CN107609671A (zh) * 2017-08-10 2018-01-19 燕山大学 一种基于综合因素评价模型的短期电力负荷预测方法
TWI623890B (zh) * 2017-07-04 2018-05-11 台灣電力股份有限公司 由多個類神經網路組成的發電量預測系統與其方法
CN108256697A (zh) * 2018-03-26 2018-07-06 电子科技大学 一种用于电力系统短期负荷的预测方法
CN109543901A (zh) * 2018-11-20 2019-03-29 国网辽宁省电力有限公司经济技术研究院 基于信息融合卷积神经网络模型的短期电力负荷预测方法
CN109785409A (zh) * 2018-12-29 2019-05-21 武汉大学 一种基于注意力机制的图像-文本数据融合方法和系统
CN110222826A (zh) * 2019-06-11 2019-09-10 上海海事大学 一种基于改进的EEMD-IndRNN船舶流量预测方法
CN110298509A (zh) * 2019-06-28 2019-10-01 佰聆数据股份有限公司 一种结合短期负荷预测的大工业行业用电优化方法

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9830529B2 (en) * 2016-04-26 2017-11-28 Xerox Corporation End-to-end saliency mapping via probability distribution prediction

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2008132066A1 (en) * 2007-04-27 2008-11-06 Siemens Aktiengesellschaft A method for computer-assisted learning of one or more neural networks
CN107239854A (zh) * 2017-05-22 2017-10-10 华北电力大学 基于emd‑gra‑mpso‑lssvm模型的负荷预测方法
TWI623890B (zh) * 2017-07-04 2018-05-11 台灣電力股份有限公司 由多個類神經網路組成的發電量預測系統與其方法
CN107609671A (zh) * 2017-08-10 2018-01-19 燕山大学 一种基于综合因素评价模型的短期电力负荷预测方法
CN108256697A (zh) * 2018-03-26 2018-07-06 电子科技大学 一种用于电力系统短期负荷的预测方法
CN109543901A (zh) * 2018-11-20 2019-03-29 国网辽宁省电力有限公司经济技术研究院 基于信息融合卷积神经网络模型的短期电力负荷预测方法
CN109785409A (zh) * 2018-12-29 2019-05-21 武汉大学 一种基于注意力机制的图像-文本数据融合方法和系统
CN110222826A (zh) * 2019-06-11 2019-09-10 上海海事大学 一种基于改进的EEMD-IndRNN船舶流量预测方法
CN110298509A (zh) * 2019-06-28 2019-10-01 佰聆数据股份有限公司 一种结合短期负荷预测的大工业行业用电优化方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
基于经验模式分解与人工神经网络的短期电力负荷预测;郑连清;郑艳秋;;电力系统保护与控制(第23期);全文 *

Also Published As

Publication number Publication date
CN111008726A (zh) 2020-04-14

Similar Documents

Publication Publication Date Title
CN111008726B (zh) 一种电力负荷预测中类图片转换方法
CN110610280A (zh) 一种电力负荷短期预测方法、模型、装置及系统
CN108805213B (zh) 计及小波熵降维的电力负荷曲线双层谱聚类方法
CN113554466A (zh) 一种短期用电量预测模型构建方法、预测方法和装置
CN110956312A (zh) 基于emd-cnn深度神经网络的光伏配电网电压预测方法
CN114792156A (zh) 基于曲线特征指标聚类的光伏输出功率预测方法和系统
CN114548586B (zh) 一种基于混合模型的短期电力负荷预测方法及系统
CN111062539B (zh) 基于次级用电量特性聚类分析的总电量预测方法
CN109344990A (zh) 一种基于dfs和svm特征选择的短期负荷预测方法及系统
CN114066073A (zh) 电网负荷预测方法
CN115470962A (zh) 一种基于LightGBM的企业失信风险预测模型构建方法
CN111815026A (zh) 一种基于特征聚类的多能源系统负荷预测方法
CN112330052A (zh) 一种配变负荷预测方法
CN115936177A (zh) 一种基于神经网络的光伏输出功率预测方法及系统
CN114912720A (zh) 基于记忆网络电力负荷预测方法、装置、终端及存储介质
CN111882114B (zh) 一种短时交通流量预测模型构建方法及预测方法
CN113868938A (zh) 基于分位数回归的短期负荷概率密度预测方法、装置及系统
CN113205223A (zh) 一种电量预测系统及其预测方法
CN113449919A (zh) 一种基于特征和趋势感知的用电量预测方法及系统
CN116470491A (zh) 基于copula函数的光伏功率概率预测方法及系统
CN116542701A (zh) 一种基于cnn-lstm组合模型的碳价预测方法及系统
CN113344257B (zh) 一种国土空间云平台中图层分析响应时间的预测方法
CN101206727A (zh) 数据处理装置、方法和程序以及计算机可读介质
CN109858667A (zh) 一种基于雷电气候对负荷影响的短期负荷聚类方法
CN117913808A (zh) 一种分布式光伏发电预测方法及其装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant