本申请涉及数据分析,尤其涉及一种电子设备及基于因果发现和归因的因果分析方法。
背景技术:
1、在数据平台的智能运营方面,可以采集各种针对于用户行为的观测数据,对这些观测数据进行数据分析与挖掘,以识别和预测用户的需求和行为,从而生成满足用户需求的推送信息。例如,在电商平台,通过采集用户的购买历史、浏览历史、搜索历史等数据,分析用户的购买行为和偏好,从而精准地生成商品推荐界面、广告投放、内容推送等个性化推送信息,呈现至用户。
2、可以每间隔预设周期采集一次观测数据,并基于因果分析的方法分析用户行为,得到不同因素对用户行为的影响程度的相关数据,进行存储并实时更新。当需要生成推送信息时,可以调用存储的用户行为的相关数据。然而,在实际应用中,特征数量较大,因果发现算法在处理超多维度特征的过程中,会呈现计算复杂度随着特征的增多而爆炸增长的趋势,计算复杂度较高,降低数据分析效率。并且在实际应用场景中,得到因果关系这种定性判定后,通过一个定量的指标衡量无法准确地衡量不同变量对结果的影响程度,从而使得基于因果分析方法分析得到的数据生成的推送信息偏差大,准确性低。
技术实现思路
1、本申请提供了一种电子设备及基于因果发现和归因的因果分析方法,以解决因果分析复杂度高、准确性低的问题。
2、第一方面,本申请一些实施例提供一种电子设备,包括存储器和处理器,其中,存储器被配置为存储因果数据,所述因果数据包括基于前预设检测周期采集的观测数据获得的因果图和平均因果效应值;处理器被配置为执行以下程序步骤:
3、获取观测数据;
4、基于所述观测数据构建因果图,所述因果图包括多个因果节点,所述因果节点用于表征所述观测数据中的特征变量,所述因果节点之间的边用于表征所述特征变量之间的因果关系,所述边的方向用于表征因果方向,所述因果节点之间的距离用于表征因果关系的紧密程度,所述因果图基于相关信息图构建,所述相关信息图包括存在相关性的特征变量;
5、在所述因果图中提取目标节点的子因果图,所述子因果图包括与所述目标节点的距离小于或等于预设距离的父节点集合;
6、基于所述子因果图计算平均因果效应值,所述平均因果效应值用于表征所述父节点集合中的父节点对所述目标节点的影响程度;
7、根据将所述平均因果效应值和所述因果图更新所述存储器中存储的因果数据。
8、第二方面,本申请一些实施例还提供一种基于因果发现和归因的因果分析方法,应用于上述电子设备,包括:
9、获取观测数据;
10、基于所述观测数据构建因果图,所述因果图包括多个因果节点,所述因果节点用于表征所述观测数据中的特征变量,所述因果节点之间的边用于表征所述特征变量之间的因果关系,所述边的方向用于表征因果方向,所述因果节点之间的距离用于表征因果关系的紧密程度,所述因果图基于相关信息图构建,所述相关信息图包括存在相关性的特征变量;
11、在所述因果图中提取目标节点的子因果图,所述子因果图包括与所述目标节点的距离小于或等于预设距离的父节点集合;
12、基于所述子因果图计算平均因果效应值,所述平均因果效应值用于表征所述父节点集合中的父节点对所述目标节点的影响程度。
13、由以上技术方案可知,本申请提供一种电子设备及基于因果发现和归因的因果分析方法,所述方法在获取到观测数据后,可以基于观测数据构建因果图,其中,因果图包括多个因果节点,因果节点用于表征观测数据中的特征变量,因果节点之间的边用于表征特征变量之间的因果关系,边的方向用于表征因果方向,因果节点之间的距离用于表征因果关系的紧密程度,因果图基于相关信息图构建,相关信息图包括存在相关性的特征变量。然后在因果图中提取目标节点的子因果图,并基于子因果图计算平均因果效应值。其中,子因果图包括与目标节点的距离小于或等于预设距离的父节点集合,平均因果效应值用于表征父节点集合中的父节点对目标节点的影响程度。所述方法采用相关信息图约束下的因果判定机制,减少因果关系判定的复杂程度,并从全量因果图中筛选出最优子图进行平均因果效应判定,提高归因的计算速度。
1.一种电子设备,其特征在于,包括:
2.根据权利要求1所述的电子设备,其特征在于,所述处理器执行基于所述观测数据构建因果图,还被配置为:
3.根据权利要求2所述的电子设备,其特征在于,所述处理器还被配置为:
4.根据权利要求1所述的电子设备,其特征在于,所述处理器执行根据所述相关系数矩阵计算邻居节点,还被配置为:
5.根据权利要求3所述的电子设备,其特征在于,所述处理器执行基于所述相关信息图,以所述目标节点为起始点依次向外遍历预设因果图深度内的父节点,还被配置为:
6.根据权利要求1所述的电子设备,其特征在于,所述处理器执行在所述因果图中提取目标节点的子因果图,还被配置为:
7.根据权利要求6所述的电子设备,其特征在于,所述处理器还被配置为:
8.根据权利要求7所述的电子设备,其特征在于,所述处理器执行基于所述子因果图计算平均因果效应值,还被配置为:
9.根据权利要求7所述的电子设备,其特征在于,所述处理器执行基于所述子因果图计算平均因果效应值,还被配置为:
10.一种基于因果发现和归因的因果分析方法,其特征在于,应用于权利要求1-9任一项所述的电子设备,所述电子设备包括存储器和处理器,所述存储器用于存储因果数据,所述因果数据包括基于前预设检测周期采集的观测数据获得的因果图和平均因果效应值,所述方法包括: