一种基于时间序列文本数据的预测方法、装置及设备与流程

技术2025-12-16 15

本申请涉及人工智能，尤其是涉及一种基于时间序列文本数据的预测方法、装置及设备。

背景技术：

1、时间序列文本数据用于描述现象随时间变化的情况，这类数据反映了某一事物、现象等随时间的变化状态或程度。时间序列文本数据可以包括多个文本数据项，且每个文本数据项包括时间点(时间戳)和该时间点的属性值。

2、比如说，时间序列文本数据的形式为(t0，v0)，(t1，v1)，…，(tn，vn)，时间点t是等间距变化的时间点，属性值v是随时间变化的属性值，属性值v的维度大于或等于1。例如，属性值可以是每小时用电量的变化(v＝1)、属性值可以是每日营业额的变化(v＝1)、属性值可以是每年销售额和净利润的变化(v＝2)、属性值可以是路口每小时经过的小汽车、卡车和工程车数量(v＝3)。

3、在某些应用场景下，需要基于时间序列文本数据对未来时间点的属性值进行预测。比如说，在交通场景下，基于时间序列文本数据预测路口在未来时间点的交通流量，基于交通流量对路口进行管理。比如说，若未来时间点的交通流量较大，在该未来时间点增加路口的绿灯时长，减少红灯时长，若未来时间点的交通流量较小，在该未来时间点增加路口的红灯时长，减少绿灯时长。

4、然而，如何使用时间序列文本数据对未来时间点的属性值进行预测，在相关技术中还没有有效的预测方式，存在预测结果不准确等问题。

技术实现思路

1、本申请提供一种基于时间序列文本数据的预测方法，所述方法包括：

2、获取目标时间序列文本数据，所述目标时间序列文本数据包括多个文本数据项，且文本数据项包括时间点和该时间点的真实属性值；

3、获取参考周期集合，所述参考周期集合包括多个参考周期；

4、针对每个参考周期，基于该参考周期将所述目标时间序列文本数据划分为多个目标文本片段，且目标文本片段包括处于同一参考周期的多个文本数据项；

5、基于所述多个目标文本片段生成多个目标文本子集，针对每个目标文本子集，该目标文本子集包括每个目标文本片段中处于同一位置的文本数据项；

6、将每个参考周期对应的多个目标文本子集输入给已训练的目标预测模型，由所述目标预测模型输出第一未来时间点的预测属性值。

7、本申请提供一种基于时间序列文本数据的预测装置，所述装置包括：

8、获取模块，用于获取目标时间序列文本数据，所述目标时间序列文本数据包括多个文本数据项，且文本数据项包括时间点和该时间点的真实属性值；获取参考周期集合，所述参考周期集合包括多个参考周期；

9、生成模块，用于针对每个参考周期，基于该参考周期将目标时间序列文本数据划分为多个目标文本片段，且目标文本片段包括处于同一参考周期的多个文本数据项；基于多个目标文本片段生成多个目标文本子集，针对每个目标文本子集，该目标文本子集包括每个目标文本片段中处于同一位置的文本数据项；

10、处理模块，用于将每个参考周期对应的多个目标文本子集输入给已训练的目标预测模型，由所述目标预测模型输出第一未来时间点的预测属性值。

11、本申请提供一种电子设备，包括：处理器和机器可读存储介质，所述机器可读存储介质存储有能够被所述处理器执行的机器可执行指令；所述处理器用于执行机器可执行指令，以实现基于时间序列文本数据的预测方法。

12、本申请提供一种计算机程序产品，计算机程序产品包括计算机程序，所述计算机程序被处理器执行时实现基于时间序列文本数据的预测方法。

13、本申请提供一种机器可读存储介质，所述机器可读存储介质存储有能够被处理器执行的机器可执行指令；其中，所述处理器用于执行所述机器可执行指令，以实现上述的基于时间序列文本数据的预测方法。

14、由以上技术方案可见，本申请实施例中，可以将目标时间序列文本数据划分为多个目标文本片段，基于多个目标文本片段生成m个目标文本子集，基于m个目标文本子集预测未来时间点的属性值，从而能够有效预测未来时间点的属性值，预测结果准确可靠。在上述过程中，提出基于自适应周期回溯的文本子集(lag-patch)的时序数据组织形式，从而使得文本子集充分体现时序信息，在基于文本子集预测属性值时，能够充分利用时序信息实现预测。

技术特征：

1.一种基于时间序列文本数据的预测方法，其特征在于，所述方法包括：

2.根据权利要求1所述的方法，其特征在于，所述将每个参考周期对应的多个目标文本子集输入给已训练的目标预测模型，由所述目标预测模型输出第一未来时间点的预测属性值之后，所述方法还包括：

3.根据权利要求1所述的方法，其特征在于，若所述参考周期集合包括p个参考周期，所述目标预测模型包括p个多层感知机和transformer网络层；

4.根据权利要求1-3任一项所述的方法，其特征在于，

5.根据权利要求1-3任一项所述的方法，其特征在于，所述将每个参考周期对应的多个目标文本子集输入给已训练的目标预测模型之前，还包括：

6.根据权利要求5所述的方法，其特征在于，基于多个场景的样本时间序列文本数据对初始预测模型进行训练得到所述预训练模型的过程，包括：

7.根据权利要求6所述的方法，其特征在于，所述获取参考周期集合包括：

8.一种基于时间序列文本数据的预测装置，其特征在于，所述装置包括：

9.根据权利要求8所述的装置，其特征在于，

10.一种电子设备，其特征在于，包括：处理器和机器可读存储介质，所述机器可读存储介质存储有能够被所述处理器执行的机器可执行指令；所述处理器用于执行机器可执行指令，以实现权利要求1-7任一所述的方法。

技术总结
本申请提供一种基于时间序列文本数据的预测方法、装置及设备，该方法包括：获取目标时间序列文本数据，目标时间序列文本数据包括多个文本数据项；获取参考周期集合，参考周期集合包括多个参考周期；针对每个参考周期，基于该参考周期将目标时间序列文本数据划分为多个目标文本片段，目标文本片段包括处于同一参考周期的多个文本数据项；基于多个目标文本片段生成多个目标文本子集，该目标文本子集包括每个目标文本片段中处于同一位置的文本数据项；将每个参考周期对应的多个目标文本子集输入给目标预测模型，由目标预测模型输出第一未来时间点的预测属性值。通过本申请技术方案，文本子集充分体现时序信息，能够充分利用时序信息实现预测。

技术研发人员：万峰,简春菲,李林森,姜伟浩,浦世亮
受保护的技术使用者：杭州海康威视数字技术股份有限公司
技术研发日：
技术公布日：2024/10/24

转载请注明原文地址:https://symbian.8miu.com/read-38053.html

专利

最新回复(0)