本发明涉及计算机,尤其涉及一种多元时间序列数据预测方法、装置、电子设备及存储介质。
背景技术:
1、多元时间序列数据指的是包括多个变量的时间序列集合,这些变量之间存在相互依赖,导致多元时间序列数据具有复杂的时间动态性和高维特征。随着产生大规模数据集的行业迅速增长,多元时间序列数据的事件在现实场景中无处不在。例如交通、金融、物联网(iot)和能源系统等领域,都会产生大量的多元时间序列数据。多元时间序列预测是数据挖掘领域的重要研究课题,具有广泛的实际应用。事实上,准确预测多元时间序列对于许多行业的战略制定和管理至关重要。例如,在金融领域,预测经济指标的对于有效的投资管理至关重要。在交通领域,预测未来的交通流量和速度数据可以帮助城市交通规划,减轻交通拥堵,缓解通勤压力。在物联网中,预测设备故障和维护需求对于高效的生产流程至关重要。
2、准确预测多元时间序列数据主要面临以下问题:在多元时间序列数据中,变量之间存在相互依赖,准确的预测要求同时捕捉变量间的依赖性和时序依赖性。多元时间序列数据是由具有不同模式的时间序列集合组成,各个时间序列之间的模式可能存在显著差异。现有技术对于同时预测具有不同模式的多个时间序列的预测不准确,导致根据预测结果对包括多元时间序列数据的事件应对时也会出现偏差。
技术实现思路
1、本发明实施例的主要目的在于提出一种多元时间序列数据预测方法、装置、电子设备及存储介质,提高了多元时间序列数据中时间序列依赖关系预测的准确性。
2、本发明的实施例一方面提供了一种多元时间序列数据预测方法,包括:
3、获取目标事件的目标多元时间序列数据,所述目标多元时间序列数据为变量的集合,其中变量为第一时间序列,其中第一时间序列为按照时间排列的交通流量数据集合;
4、对所述目标多元时间序列数据采用多元时间序列预测模型进行预测,得到预测结果,所述预测结果为第一图结构,所述第一图结构用于表征变量之间的依赖关系;
5、根据预测结果生成处理所述目标事件的应对策略;
6、其中,目标事件为交通管理事件,其中第一图结构为交通管理事件在未来时刻的车流量、车速及出租车需求之间的依赖关系;
7、所述多元时间序列预测模型的训练包括以下步骤:
8、获取训练数据的第二时间序列,将所述第二时间序列映射至固定长度的向量中,得到嵌入向量;
9、计算所述嵌入向量之间的第二图结构,根据所述嵌入向量的相似性构建邻接矩阵,所述邻接矩阵用于表征所述嵌入向量的依赖关系,所述第二图结构用于表征所述嵌入向量之间的相似性;
10、对所述训练数据采用lstm进行处理,得到所述训练数据的隐状态,所述隐状态用于表征所述训练数据的时间依赖关系;
11、根据所述隐状态及所述邻接矩阵,采用基于拉普拉斯锐化的图卷积函数执行处理,得到所述训练数据的空间依赖关系;
12、根据所述时间依赖关系和所述空间依赖关系,执行所述训练数据的多元时间序列预测,以及采用损失函数进行模型训练的优化,得到所述多元时间序列预测模型。
13、本发明的实施例的获取训练数据的第二时间序列,将所述第二时间序列映射至固定长度的向量中,得到嵌入向量,包括:
14、采用tcn模型的一维卷积和因果卷积对所述训练数据的时间依赖关系进行捕捉,得到所述第二时间序列,将所述第二时间序列映射至固定长度的向量中,计算公式为
15、he=σ(tcn-conv(we·zt+be)),∈rn×k
16、其中,zt∈rn×t为第二时间序列,he∈rn×k为嵌入向量,we代表训练参数,k代表嵌入向量he的维度,conv为卷积运算,n为训练数据的节点数量,t为时间序列的长度,σ表示激活函数,tcn表示时序卷积网络模型,be表示偏置项,we、he、be中的角标e表示时间序列嵌入,所述第二时间序列为训练数据中的多元时间序列数据。
17、本发明的实施例的计算所述嵌入向量之间的第二图结构,根据所述嵌入向量的相似性构建邻接矩阵,包括:
18、使用余弦相似性度量计算节点的嵌入向量之间的相似性;
19、根据嵌入向量之间的相似性构建初始邻接矩阵,将初始邻接矩阵中每行中的预设个元素指定为1,同时将其余元素设为0,得到所述邻接矩阵。
20、本发明的实施例的对所述训练数据采用lstm进行处理,得到所述训练数据的隐状态,包括:
21、通过所述lstm的输入门、遗忘门、输出门以及记忆单元对所述训练数据进行时间步骤处理,其中时间步骤处理包括以当前输入、前一个记忆单元和前一个输出的信息对记忆单元进行更新,得到所述隐状态,其中所述隐状态用于表征节点基于时间维度的隐藏状态。
22、本发明的实施例的根据所述隐状态及所述邻接矩阵,采用基于拉普拉斯锐化的图卷积函数执行处理,得到所述训练数据的空间依赖关系,包括:
23、采用切比雪夫多项式对所述邻接矩阵进行变换处理,得到卷积核;
24、将所述卷积核对所述隐状态采用基于拉普拉斯锐化的处理,得到多元时间序列数据的时间依赖关系和空间依赖关系。
25、本发明的实施例的根据所述时间依赖关系和所述空间依赖关系,执行所述训练数据的多元时间序列预测处理,得到所述多元时间序列预测模型,包括:
26、对进行时间维度的卷积处理和空间维度的卷积处理时采用残差连接进行信息传递;
27、采用均方误差作为的损失函数,执行训练得到所述多元时间序列预测模型。
28、本发明的实施例的对所述目标多元时间序列数据采用多元时间序列预测模型进行预测,得到预测结果,包括:
29、通过所述多元时间序列预测模型将第一时刻的时间戳数据映射至第二时刻的时间戳数据,得到预测结果,所述第一时刻用于表征历史时刻,所述第二时刻用于表征未来时刻。
30、本发明实施例的另一方面提供了一种多元时间序列数据预测装置,包括:
31、多元数据预测模块及模型训练模块;
32、所述多元数据预测模块包括第一单元、第二单元及第三单元;
33、所述第一单元用于获取目标事件的目标多元时间序列数据,所述目标多元时间序列数据为变量的集合,其中变量为第一时间序列,其中第一时间序列为按照时间排列的交通流量数据集合;
34、所述第二单元用于对所述目标多元时间序列数据采用多元时间序列预测模型进行预测,得到预测结果,所述预测结果为第一图结构,所述第一图结构用于表征变量之间的依赖关系;
35、所述第三单元用于根据预测结果生成处理所述目标事件的应对策略;
36、所述模型训练模块包括第四单元、第五单元、第六单元、第七单元及第八单元,用于执行多元时间序列预测模型的训练;
37、第四单元,用于获取训练数据的第二时间序列,将所述第二时间序列映射至固定长度的向量中,得到嵌入向量;
38、第五单元,用于计算所述嵌入向量之间的第二图结构,根据所述嵌入向量的相似性构建邻接矩阵,所述邻接矩阵用于表征所述嵌入向量的依赖关系,所述第二图结构用于表征所述嵌入向量之间的相似性;
39、第六单元,用于对所述训练数据采用lstm进行处理,得到所述训练数据的隐状态,所述隐状态用于表征所述训练数据的时间依赖关系;
40、第七单元,用于根据所述隐状态及所述邻接矩阵,采用基于拉普拉斯锐化的图卷积函数执行处理,得到所述训练数据的空间依赖关系;
41、第八单元,用于根据所述时间依赖关系和所述空间依赖关系,执行所述训练数据的多元时间序列预测,以及采用损失函数进行模型训练的优化,得到所述多元时间序列预测模型。
42、本发明实施例的另一方面提供了一种电子设备,包括处理器以及存储器;
43、所述存储器用于存储程序;
44、所述处理器执行所述程序实现如前文所描述的方法。
45、本发明实施例还公开了一种计算机程序产品或计算机程序,该计算机程序产品或计算机程序包括计算机指令,该计算机指令存储在计算机可读存储介质中。计算机设备的处理器可以从计算机可读存储介质读取该计算机指令,处理器执行该计算机指令,使得该计算机设备执行前文所描述的方法。
46、本发明的有益效果为:通过以事件的多元时间序列数据作为变量,采用时间序列嵌入方法将变量映射为嵌入向量;通过图结构学习获取嵌入向量的邻接矩阵来捕捉多个变量之间的关系,能够同时捕捉多元时间序列数据中的复杂相互依赖关系和时序特征,且无需预先确定变脸之间的图结构;通过lstm和引入了拉普拉斯锐化的chebnet对图结构学习的邻接矩阵进行预测,提高了多元时间序列数据中时间序列依赖关系预测的准确性及预测性能;解决了事件处理的准确性和效率。
1.一种多元时间序列数据预测方法,其特征在于,包括:
2.根据权利要求1所述的多元时间序列数据预测方法,其特征在于,所述获取训练数据的第二时间序列,将所述第二时间序列映射至固定长度的向量中,得到嵌入向量,包括:
3.根据权利要求2所述的多元时间序列数据预测方法,其特征在于,所述计算所述嵌入向量之间的第二图结构,根据所述嵌入向量的相似性构建邻接矩阵,包括:
4.根据权利要求1所述的多元时间序列数据预测方法,其特征在于,所述对所述训练数据采用lstm进行处理,得到所述训练数据的隐状态,包括:
5.根据权利要求4所述的多元时间序列数据预测方法,其特征在于,所述根据所述隐状态及所述邻接矩阵,采用基于拉普拉斯锐化的图卷积函数执行处理,得到所述训练数据的空间依赖关系,包括:
6.根据权利要求5所述的多元时间序列数据预测方法,其特征在于,所述根据所述时间依赖关系和所述空间依赖关系,执行所述训练数据的多元时间序列预测处理,得到所述多元时间序列预测模型,包括:
7.根据权利要求1所述的多元时间序列数据预测方法,其特征在于,所述对所述目标多元时间序列数据采用多元时间序列预测模型进行预测,得到预测结果,包括:
8.一种多元时间序列数据预测装置,其特征在于,包括:
9.一种电子设备,其特征在于,包括处理器以及存储器;
10.一种计算机可读存储介质,其特征在于,所述存储介质存储有程序,所述程序被处理器执行实现如权利要求1-7中任一项所述的多元时间序列数据预测方法。