本技术涉及但不限于供应链管理,尤其涉及一种供应链协同优化方法、装置、设备、存储介质及产品。
背景技术:
1、供应链是指在生产及流通过程中,涉及将产品或服务提供给最终用户活动的上游与下游企业所形成的网链结构。供应链管理的目的是对供应链进行优化,对供应链的执行过程进行监督指导,以实现降低供应链成本、提升效率等效果。
2、现有的供应链管理常用企业资源计划系统、制造执行系统、仓储管理系统等多个软件系统进行,各上下游企业均以本地利益最大化为目标,供应链各参与者并没有从供应链考虑各决策,无法做出对供应链具有最大价值的决策。
技术实现思路
1、有鉴于此,本技术提供了一种供应链协同优化方法、装置、设备、存储介质及产品,能够确定供应链节点当前状态下具有最大动作价值的决策。
2、本技术实施例的技术方案是这样实现的:
3、第一方面,本技术提供了一种供应链协同优化方法,由供应链节点执行,所述方法包括:获得所述供应链节点的第一状态、所述供应链节点当前的节点信息以及其他供应链节点当前的节点信息,所述第一状态为所述供应链节点在第i-1个时间单元的状态,i为大于或者等于2的整数;根据所述第一状态、所述供应链节点当前的节点信息以及所述其他供应链节点当前的节点信息,确定所述供应链节点的第二状态,所述第二状态为所述供应链节点在第i个时间单元的状态;通过预设的动作价值函数,确定所述供应链节点在所述第二状态下动作价值最大的第一动作,其中,所述动作价值函数用于指示供应链节点在不同状态下执行不同动作所对应的动作价值。
4、在一些可能的实施方式中,所述动作价值是基于节点奖励确定的,所述节点奖励包括全局奖励、个体奖励以及协作奖励中的至少之一;所述个体奖励是供应链节点执行第二动作后得到的;所述全局奖励是由中心节点在供应链节点执行第三动作后并计算得到的,所述第三动作用于实现供应链最大化利润率;所述协作奖励是供应链节点在与其他供应链节点满足协作条件时得到的。
5、在一些可能的实施方式中,在所述通过预设的动作价值函数,确定所述供应链节点在所述第二状态下动作价值最大的第一动作之前,所述方法还包括:获得所述供应链节点的动作价值函数;初始化所述供应链节点的动作价值函数,获得所述供应链节点在每个状态下各个动作的初始动作价值;获取所述供应链节点在每个状态下各个动作的节点奖励;从所述供应链节点在所述第二状态下各个动作的初始动作价值开始,通过迭代计算动作价值更新方程确定所述供应链节点在所述第二状态下各个动作的动作价值。
6、在一些可能的实施方式中,在所述通过预设的动作价值函数,确定所述供应链节点在所述第二状态下动作价值最大的第一动作之前,所述方法还包括:获得所述供应链节点的第一数字孪生模型;其中,所述第一数字孪生模型是基于供应链知识图谱和供应链的各个供应链节点的第二数字孪生模型生成的,所述供应链知识图谱用于表示供应链各节点之间的依赖关系,所述第二数字孪生模型用于仿真所述供应链节点的节点信息;使用所述第一数字孪生模型进行情景仿真与分析,以评估不同决策对供应链的影响;确定所述供应链节点在所述第二状态下实现自身利益最大化的动作。
7、在一些可能的实施方式中,所述获得所述供应链节点的第一数字孪生模型,包括:从所述供应链知识图谱中获取供应链各节点之间的依赖关系;其中,所述依赖关系包括上下游关系和物料供应关系;在各个供应链节点的第二数字孪生模型之间添加所述依赖关系,以获得所述第一数字孪生模型。
8、在一些可能的实施方式中,所述供应链知识图谱通过以下步骤构建:将供应链大数据中的结构化知识表示为知识图谱三元组;对所述供应链大数据中的非结构化知识进行自然语言处理,提取元素与关系并转换为知识图谱三元组;基于知识图谱三元组,构建所述供应链知识图谱。
9、在一些可能的实施方式中,在所述构建所述供应链知识图谱之后,所述方法还包括:根据所述供应链大数据中的已有知识数据进行知识推理,获得新的知识图谱三元组;其中,所述知识数据包括供应链各节点具有的用于维持供应链运行的知识;将所述新的知识图谱三元组关联至所述供应链知识图谱中。
10、在一些可能的实施方式中,在所述构建所述供应链知识图谱之后,所述方法还包括:获得新增数据;其中,所述新增数据包括在所述供应链大数据中新增加的知识数据;将所述新增数据中的结构化知识表示为知识图谱三元组;对所述供应链大数据中的非结构化知识进行自然语言处理,以提取元素与关系并转换为知识图谱三元组;将所述新增数据的知识图谱三元组关联到所述供应链知识图谱中。
11、在一些可能的实施方式中,在所述构建所述供应链知识图谱之后,所述方法还包括:将所述供应链知识图谱进行可视化展示。
12、在一些可能的实施方式中,在所述构建所述供应链知识图谱之前,所述方法还包括:构建所述供应链的各参与者的知识库;使用每个知识库收集对应参与者的知识数据,以形成供应链大数据;其中,所述知识数据包括参与者具有的用于维持供应链运行的知识;将所述知识数据预处理为所述供应链知识图谱所需格式。
13、第二方面,本技术提供了一种供应链协同优化装置,所述装置包括:获取模块,用于获得所述供应链节点的第一状态、所述供应链节点当前的节点信息以及其他供应链节点当前的节点信息,所述第一状态为所述供应链节点在第i-1个时间单元的状态,i为大于或者等于2的整数;状态确定模块,用于根据所述第一状态、所述供应链节点当前的节点信息以及所述其他供应链节点当前的节点信息,确定所述供应链节点的第二状态,所述第二状态为所述供应链节点在第i个时间单元的状态;决策模块,用于通过预设的动作价值函数,确定所述供应链节点在所述第二状态下动作价值最大的第一动作,其中,所述动作价值函数用于指示供应链节点在不同状态下执行不同动作所对应的动作价值。
14、第三方面,本技术提供了一种电子设备,所述电子设备包括存储器和处理器,所述存储器存储有可在处理器上运行的计算机程序,所述处理器执行所述程序时实现第一方面或第一方面任一种可能的实施方式所述方法中的步骤。
15、第四方面,本技术提供了一种计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现第一方面或第一方面任一种可能的实施方式所述方法中的步骤。
16、第五方面,本技术提供了一种计算机程序产品,该计算机程序产品包括存储有计算机程序的计算机可读存储介质,当计算机程序被计算机读取并执行时,实现第一方面或第一方面任一种可能的实施方式所述方法中的步骤。
17、本技术提供的一种供应链协同优化方法,供应链节点能够在获得供应链节点的第一状态、供应链节点当前的节点信息以及其他供应链节点当前的节点信息后,确定第二状态;并且,通过预设的动作价值函数,确定供应链节点在第二状态下动作价值最大的第一动作。该方法通过确定供应链节点在第二状态下动作价值最大的第一动作,避免了供应链节点仅考虑本地利益而不从供应链考虑的情况,使供应链节点能够准确做出对供应链具有最大动作价值的决策。
18、应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,而非限制本公开的技术方案。
1.一种供应链协同优化方法,其特征在于,由供应链节点执行,所述方法包括:
2.根据权利要求1所述的方法,其特征在于,所述动作价值是基于节点奖励确定的,所述节点奖励包括全局奖励、个体奖励以及协作奖励中的至少之一;所述个体奖励是供应链节点执行第二动作后得到的;所述全局奖励是由中心节点在供应链节点执行第三动作后并计算得到的,所述第三动作用于实现供应链最大化利润率;所述协作奖励是供应链节点在与其他供应链节点满足协作条件时得到的。
3.根据权利要求1所述的方法,其特征在于,在所述通过预设的动作价值函数,确定所述供应链节点在所述第二状态下动作价值最大的第一动作之前,所述方法还包括:
4.根据权利要求1至3任一项所述的方法,其特征在于,在所述通过预设的动作价值函数,确定所述供应链节点在所述第二状态下动作价值最大的第一动作之前,所述方法还包括:
5.根据权利要求4所述的方法,其特征在于,所述获得所述供应链节点的第一数字孪生模型,包括:
6.根据权利要求4所述的方法,其特征在于,所述方法还包括:
7.根据权利要求6所述的方法,其特征在于,在所述构建所述供应链知识图谱之后,所述方法还包括:
8.根据权利要求6所述的方法,其特征在于,在所述构建所述供应链知识图谱之后,所述方法还包括:
9.根据权利要求6所述的方法,其特征在于,在所述构建所述供应链知识图谱之后,所述方法还包括:
10.根据权利要求6所述的方法,其特征在于,在所述构建所述供应链知识图谱之前,所述方法还包括:
11.一种供应链协同优化装置,其特征在于,包括:
12.一种电子设备,包括存储器和处理器,所述存储器存储有可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现权利要求1至10中任一项所述方法中的步骤。
13.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该计算机程序被处理器执行时实现权利要求1至10中任一项所述方法中的步骤。
14.一种计算机程序产品,该计算机程序产品包括存储有计算机程序的计算机可读存储介质,其特征在于,当计算机程序被计算机读取并执行时,实现权利要求1至10中任一项所述方法中的步骤。