本技术涉及大数据,特别是涉及一种数据处理方法、装置、计算机设备、计算机可读存储介质和计算机程序产品。
背景技术:
1、在投资基金之前,基金管理人员通常会通过数据处理方法来预测基金走向,得到预测结果,以使基金管理人员和投资者能够根据预测结果对基金做出更加明智的投资决策。
2、目前的数据处理方法,获取目标产品(目标基金)的历史交易数据集。然后,通过时间序列模型对目标产品的历史交易数据集进行预测处理,得到目标产品的预测结果。
3、但是,目前的数据处理方法,只考虑了目标产品的历史交易数据集,考虑因素单一,因此,目前的数据处理方法的准确性较低。
技术实现思路
1、基于此,有必要针对上述技术问题,提供一种数据处理方法、装置、计算机设备、计算机可读存储介质和计算机程序产品。
2、第一方面,本技术提供了一种数据处理方法,包括:
3、获取目标产品的历史交易特征集和初始文本数据集;所述初始文本数据集包含各初始文本数据和每一所述初始文本数据对应的评论数据子集;
4、根据各所述初始文本数据确定文本向量集,并对各所述评论数据子集进行情感分析处理,得到各情感特征;所述文本向量集中各携带特征标签的文本向量;
5、基于各所述携带特征标签的文本向量和各所述情感特征,确定综合文本特征集;
6、根据复合模型对所述历史交易特征集和所述综合文本特征集进行预测处理,得到所述目标产品的预测结果。
7、在其中一个实施例中,所述获取目标产品的历史交易特征集,包括:
8、获取目标产品的历史交易数据集;所述历史交易数据集中包含各评价指标对应的历史交易数据子集;
9、根据小波变换算法,对每一所述评价指标对应的历史交易数据子集进行特征提取,得到所述评价指标对应的波动特征;
10、基于各所述评价指标对应的波动特征构建历史交易特征集。
11、在其中一个实施例中,所述基于各所述评价指标对应的波动特征构建历史交易特征集,包括:
12、在各所述评价指标对应的波动特征中确定目标评价指标对应的目标波动特征,并根据各所述目标波动特征构建第一历史交易特征集;
13、根据各所述波动特征构建第二历史交易特征集,并根据所述第一历史交易特征集和所述第二历史交易特征集构建历史交易特征集。
14、在其中一个实施例中,所述根据各所述初始文本数据确定文本向量集,包括:
15、根据分词模型对各所述初始文本数据进行分词处理和标准化处理,得到各文本数据;
16、基于词向量模型对每一所述文本数据进行向量化处理,得到所述文本数据对应的文本向量;
17、基于循环神经网络模型对所述文本向量进行分类处理,得到所述文本向量的特征标签,并根据所述特征标签对所述文本向量进行标注,得到携带所述特征标签的文本向量;
18、根据各携带所述特征标签的文本向量构建文本向量集。
19、在其中一个实施例中,所述基于各所述携带特征标签的文本向量和各所述情感特征,确定综合文本特征集,包括:
20、针对每一所述文本向量,根据所述文本向量对应的初始文本数据,确定所述文本向量关联的情感特征;
21、根据所述文本数据携带的特征标签和所述情感特征,确定综合情感分析结果;
22、根据所述综合情感分析结果更新所述文本向量的特征标签,得到综合文本特征,并基于各所述综合文本特征构建综合文本特征集。
23、在其中一个实施例中,所述根据所述文本数据携带的特征标签和所述情感特征,确定综合情感分析结果,包括:
24、若所述文本数据携带的特征标签和所述情感分析结果表征的所述目标产品的走势相同,确定综合情感分析结果为所述特征标签;
25、若所述文本数据携带的特征标签和所述情感分析结果表征的所述目标产品的走势不相同,根据预设的权重、所述特征标签和所述情感特征确定所述综合情感分析结果。
26、在其中一个实施例中,所述复合模型包含卷积神经网络和长短期记忆网络,所述根据复合模型对所述历史交易特征集和所述综合文本特征集进行预测处理,得到所述目标产品的预测结果,包括:
27、根据所述历史交易特征集和所述综合文本特征集构建所述目标产品的特征集;
28、基于所述卷积神经网络对所述目标产品的特征集进行特征提取,得到特征提取结果;
29、根据所述长短期记忆网络对所述特征提取结果进行预测处理,得到所述目标产品的预测结果。
30、第二方面,本技术还提供了一种数据处理装置,包括:
31、获取模块,用于获取目标产品的历史交易特征集和初始文本数据集;所述初始文本数据集包含各初始文本数据和每一所述初始文本数据对应的评论数据子集;
32、第一确定模块,用于根据各所述初始文本数据确定文本向量集,并对各所述评论数据子集进行情感分析处理,得到各情感特征;所述文本向量集中各携带特征标签的文本向量;
33、第二确定模块,用于基于各所述携带特征标签的文本向量和各所述情感特征,确定综合文本特征集;
34、处理模块,用于根据复合模型对所述历史交易特征集和所述综合文本特征集进行预测处理,得到所述目标产品的预测结果。
35、第三方面,本技术还提供了一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现以下步骤:
36、获取目标产品的历史交易特征集和初始文本数据集;所述初始文本数据集包含各初始文本数据和每一所述初始文本数据对应的评论数据子集;
37、根据各所述初始文本数据确定文本向量集,并对各所述评论数据子集进行情感分析处理,得到各情感特征;所述文本向量集中各携带特征标签的文本向量;
38、基于各所述携带特征标签的文本向量和各所述情感特征,确定综合文本特征集;
39、根据复合模型对所述历史交易特征集和所述综合文本特征集进行预测处理,得到所述目标产品的预测结果。
40、第四方面,本技术还提供了一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现以下步骤:
41、获取目标产品的历史交易特征集和初始文本数据集;所述初始文本数据集包含各初始文本数据和每一所述初始文本数据对应的评论数据子集;
42、根据各所述初始文本数据确定文本向量集,并对各所述评论数据子集进行情感分析处理,得到各情感特征;所述文本向量集中各携带特征标签的文本向量;
43、基于各所述携带特征标签的文本向量和各所述情感特征,确定综合文本特征集;
44、根据复合模型对所述历史交易特征集和所述综合文本特征集进行预测处理,得到所述目标产品的预测结果。
45、第五方面,本技术还提供了一种计算机程序产品,包括计算机程序,该计算机程序被处理器执行时实现以下步骤:
46、获取目标产品的历史交易特征集和初始文本数据集;所述初始文本数据集包含各初始文本数据和每一所述初始文本数据对应的评论数据子集;
47、根据各所述初始文本数据确定文本向量集,并对各所述评论数据子集进行情感分析处理,得到各情感特征;所述文本向量集中各携带特征标签的文本向量;
48、基于各所述携带特征标签的文本向量和各所述情感特征,确定综合文本特征集;
49、根据复合模型对所述历史交易特征集和所述综合文本特征集进行预测处理,得到所述目标产品的预测结果。
50、上述数据处理方法、装置、计算机设备、计算机可读存储介质和计算机程序产品,获取目标产品的历史交易特征集和初始文本数据集;所述初始文本数据集包含各初始文本数据和每一所述初始文本数据对应的评论数据子集;根据各所述初始文本数据确定文本向量集,并对各所述评论数据子集进行情感分析处理,得到各情感特征;所述文本向量集中各携带特征标签的文本向量;基于各所述携带特征标签的文本向量和各所述情感特征,确定综合文本特征集;根据复合模型对所述历史交易特征集和所述综合文本特征集进行预测处理,得到所述目标产品的预测结果。采用本方法,获取目标产品的历史交易特征集,明确了目标产品的历史交易情况。然后,通过初始文本数据集确定文本向量集和情感特征,并通过文本向量和情感特征,确定综合文本特征集,明确了目标产品在文本维度和情感维度上的特征。通过复合模型对不同维度的数据进行预测处理,从而得到预测结果,提高了数据处理方法的准确性。
1.一种数据处理方法,其特征在于,所述方法包括:
2.根据权利要求1所述的方法,其特征在于,所述获取目标产品的历史交易特征集,包括:
3.根据权利要求2所述的方法,其特征在于,所述基于各所述评价指标对应的波动特征构建历史交易特征集,包括:
4.根据权利要求1所述的方法,其特征在于,所述根据各所述初始文本数据确定文本向量集,包括:
5.根据权利要求1所述的方法,其特征在于,所述基于各所述携带特征标签的文本向量和各所述情感特征,确定综合文本特征集,包括:
6.根据权利要求5所述的方法,其特征在于,所述根据所述文本数据携带的特征标签和所述情感特征,确定综合情感分析结果,包括:
7.根据权利要求1所述的方法,其特征在于,所述复合模型包含卷积神经网络和长短期记忆网络,所述根据复合模型对所述历史交易特征集和所述综合文本特征集进行预测处理,得到所述目标产品的预测结果,包括:
8.一种数据处理装置,其特征在于,所述装置包括:
9.一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至7中任一项所述的方法的步骤。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至7中任一项所述的方法的步骤。