本发明涉及数字处理,尤其涉及一种半封闭空间内有害气体扩散的预测方法、装置、设备及存储介质。
背景技术:
1、在现代城市与工业快速发展背景下,半封闭空间如地铁、地下停车场、隧道、仓库等场所日益增多,这些环境成为人们生活与工作中不可或缺的部分。然而,伴随而来的是潜在的有害气体泄漏风险,诸如燃气泄漏、化学物质溢出等事件频发,对公共安全构成严重威胁。一旦有害气体在半封闭空间内扩散,其后果可能迅速恶化,导致人员中毒、火灾甚至爆炸,因此,准确预测气体扩散路径与浓度分布对于及时启动应急响应至关重要。
2、现有技术问题在于预测模型的动态适应性和精确度不足。传统的气体扩散模型多依赖静态网格布局和简化的环境假设,无法动态适应实际环境中气体浓度的瞬息万变和复杂气流特性,尤其是在气体泄漏初期和高浓度区域,预测精度急剧下降。此外,模型往往忽视了历史数据的有效利用,特别是气体扩散的历史轨迹信息,导致对气体扩散行为的预测缺乏连续性和预见性。因此,如何在复杂、动态变化的半封闭空间内,构建一个既能准确捕捉气体扩散细节,又能实时适应环境变化的预测系统,成为亟待解决的技术难题。
技术实现思路
1、本发明实施例提供一种半封闭空间内有害气体扩散的预测方法、装置、设备及存储介质,通过引入动态网格重构、深度强化学习与蒙特卡洛树搜索算法,能够提升半封闭空间内有害气体扩散的预测的实时性和准确性,确保公共安全。
2、本发明一实施例提供一种半封闭空间内有害气体扩散的预测方法,包括:
3、收集初始数据;初始数据包括半封闭空间的三维结构信息、初始环境参数及每个检测位置的历史气体浓度;
4、根据所述初始数据,采用动态网格重构算法,依据气体浓度变化与气流动力学特性,调整网格大小,动态构建空间网格模型;
5、构建深度强化学习模型,并通过空间网格模型的每个网格中的初始数据进行学习训练,得到训练好的强化学习模型;
6、获取实时的气体浓度分布数据;
7、通过结合深度强化学习模型和蒙特卡洛树搜索算法,并基于实时的气体浓度分布数据和实时环境参数,预测得到半封闭空间内有害气体的未来扩散路径。
8、作为上述方案的改进,所述根据所述初始数据,采用动态网格重构算法,依据气体浓度变化与气流动力学特性,调整网格大小,动态构建空间网格模型,包括:
9、根据激光雷达与环境传感器网络收集的空间信息,生成基础的均匀网格模型,设初始网格集合为g0={g1,g2,...,gn-1,gn};其中,g1,g2,...,gn-1,gn是集合g0中的网格元素,g1是第一个元素,gn是第n个元素,n为网格总数;
10、对每个网格gi计算出其浓度梯度量δc和流体动力学因子λ;λ=α·vi+β··γ·δc;vi是网格gi中的平均风速,α、β、γ是调节因子,平衡风速、浓度梯度量对网格调整的影响;
11、根据气体浓度变化率δci和流体动力学因子λ,并基于网格调整函数为每个网格gi计算一个调整因子,网格调整函数为:adjustgriddensity(gi,δc,a)->scalefactor;adjustgriddensity函数接受网格gi、浓度梯度量δc和流体动力学因子λ,返回调整因子scalefactor用于控制网格的密度调整;调整因子的数值范围为(0,1),其中1表示不调整,0表示极度稀疏松网格;调整因子的计算公式为:η和λ是两个正则化参数,决定网格调整的敏感度;
12、更新网格大小:新网格g′i的边长宽乘以调整因子得到动态调整后的网格大小。
13、作为上述方案的改进,所述构建深度强化学习模型,并通过空间网格模型的每个网格中的初始数据进行学习训练,得到训练好的强化学习模型,包括:
14、对从动态网格模型的每个网格的初始数据进行环境状态st提取和动作at提取;其中,设计环境状态为st=[ct,δct,wt,tt,ht,vt,pt]其中ct为第t个网格历史各个时刻网格浓度,δct为第t个网格历史各个时刻浓度变化率,wt为第t个网格历史各个时刻的湿度,tt为第t个网格历史各个时刻的温度,vt为第t个网格历史各个时刻的风速,pt为第t个网格的网格位置信息;其中,ht代表第t个网格的历史时刻的数量;设计动作空间定义为历史时间步的网格的有害气体的扩散浓度,其中动作为:at,at代表第t个网格历史各个时刻各个时间步的扩散浓度集;
15、初始化深度神经网络,输入层为状态向量,隐藏层结合卷积神经网络捕捉网格间空间相关性,全连接层抽象特征,输出层预测动作向量;
16、采用a3c算法,并基于环境状态st和动作at,对深度神经网络进行训练,得到训练好的强化学习模型;强化学习模型的深度神经网络结构包括:
17、输入层:接收状态向量s,该向量包含了空间网格模型的气体浓度分布数据、环境参数和网格的位置;
18、卷积层:使用多个卷积核来捕捉每个网格及其邻近网格之间的空间关联性,卷积层的输出是空间特征图;
19、全连接层:将卷积层的输出转换为更高层次的抽象特征;
20、输出层:预测每个可能动作a的预期回报,即在给定状态下采取动作a后预期获得的总奖励。这为模型提供了决策的基础,指导其如何选择最佳策略。
21、作为上述方案的改进,所述通过结合深度强化学习模型和蒙特卡洛树搜索算法,并基于实时的气体浓度分布数据和实时环境参数,预测得到半封闭空间内有害气体的未来扩散路径,包括:
22、通过深度强化学习模型根据当前状态向量s输出一个预测的动作向量a;当前状态向量包括实时的气体浓度分布数据和实时环境参数;
23、通过蒙特卡洛树搜索算法将当前状态作为根节点,根据深度强化学习模型提供的动作向量,生成若干子节点,每个子节点代表采取一个动作后的新状态;
24、通过蒙特卡洛树搜索算法让每个子节点继续生成其子节点,直到达到预设终止状态,叶子节点代表预测的未来状态;预设终止状态包括:设定的时间步数或达到预定的扩散范围;
25、选择:从根节点开始,根据以下探索公式选择下一个子节点进行探索:
26、
27、其中,q(st,a)是动作a在状态s下的平均回报;p(s,a)是是采取动作a的先验概率;n(s)是状态s的访问次数;n(s,a)是从状态st采取动作a后到达的子状态的访问次数;c是平衡探索与利用的常数;
28、扩展:到达未探索的叶节点时,根据模型创建新的子节点;
29、模拟:从当前叶子节点开始,沿着一条随机路径进行模拟,模拟气体扩散过程,直到达到一个终止状态,记录模拟结束时这个路径上的奖励;
30、回传:将模拟得到的奖励反向传播,更新从根节点到当前叶节点路径上所有节点的统计信息;统计信息包括访问次数和累计奖励;
31、经过多次迭代后,通过蒙特卡洛树搜索算法根据每个节点的访问次数和累计奖励来评估不同路径的期望价值,并选择期望价值最大的路径作为预测的未来扩散路径。
32、本发明另一实施例对应提供了一种半封闭空间内有害气体扩散的预测装置,包括:
33、收集模块,用于收集初始数据;初始数据包括半封闭空间的三维结构信息、初始环境参数及每个检测位置的历史气体浓度;
34、第一构建模块,用于根据所述初始数据,采用动态网格重构算法,依据气体浓度变化与气流动力学特性,调整网格大小,动态构建空间网格模型;
35、第二构建模块,用于构建深度强化学习模型,并通过空间网格模型的每个网格中的初始数据进行学习训练,得到训练好的强化学习模型;
36、获取模块,用于获取实时的气体浓度分布数据;
37、预测模块,用于通过结合深度强化学习模型和蒙特卡洛树搜索算法,并基于实时的气体浓度分布数据和实时环境参数,预测得到半封闭空间内有害气体的未来扩散路径。
38、作为上述方案的改进,第一构建模块具体用于:
39、根据激光雷达与环境传感器网络收集的空间信息,生成基础的均匀网格模型,设初始网格集合为g0={g1,g2,...,gn-1,gn};其中,g1,g2,…,gn-1,gn是集合g0中的网格元素,g1是第一个元素,gn是第n个元素,n为网格总数;
40、对每个网格gi计算出其浓度梯度量δc和流体动力学因子λ;λ=α·vi+β··γ·δc;vi是网格gi中的平均风速,α、β、γ是调节因子,平衡风速、浓度梯度量对网格调整的影响;
41、根据气体浓度变化率δci和流体动力学因子λ,并基于网格调整函数为每个网格gi计算一个调整因子,网格调整函数为:adjustgriddensity(gi,△c,λ)->scalefactor;adjustgriddensity函数接受网格gi、浓度梯度量δc和流体动力学因子λ,返回调整因子scalefactor用于控制网格的密度调整;调整因子的数值范围为(0,1),其中1表示不调整,0表示极度稀疏松网格;调整因子的计算公式为:η和λ是两个正则化参数,决定网格调整的敏感度;
42、更新网格大小:新网格g′i的边长宽乘以调整因子得到动态调整后的网格大小。
43、作为上述方案的改进,所述第二构建模块用于:
44、对从动态网格模型的每个网格的初始数据进行环境状态st提取和动作at提取;其中,设计环境状态为st=[ct,δct,wt,tt,ht,vt,pt],其中ct为第t个网格历史各个时刻网格浓度,δct为第t个网格历史各个时刻浓度变化率,wt为第t个网格历史各个时刻的湿度,tt为第t个网格历史各个时刻的温度,vt为第t个网格历史各个时刻的风速,pt为第t个网格的网格位置信息;其中,ht代表第t个网格的历史时刻的数量;设计动作空间定义为历史时间步的网格的有害气体的扩散浓度,其中动作为:at,at代表第t个网格历史各个时刻各个时间步的扩散浓度集;
45、初始化深度神经网络,输入层为状态向量,隐藏层结合卷积神经网络捕捉网格间空间相关性,全连接层抽象特征,输出层预测动作向量;
46、采用a3c算法,并基于环境状态st和动作at,对深度神经网络进行训练,得到训练好的强化学习模型;强化学习模型的深度神经网络结构包括:
47、输入层:接收状态向量s,该向量包含了空间网格模型的气体浓度分布数据、环境参数和网格的位置;
48、卷积层:使用多个卷积核来捕捉每个网格及其邻近网格之间的空间关联性,卷积层的输出是空间特征图;
49、全连接层:将卷积层的输出转换为更高层次的抽象特征;
50、输出层:预测每个可能动作a的预期回报,即在给定状态下采取动作a后预期获得的总奖励。这为模型提供了决策的基础,指导其如何选择最佳策略。
51、作为上述方案的改进,所述预测模块具体用于:
52、通过深度强化学习模型根据当前状态向量s输出一个预测的动作向量a;当前状态向量包括实时的气体浓度分布数据和实时环境参数;
53、通过蒙特卡洛树搜索算法将当前状态作为根节点,根据深度强化学习模型提供的动作向量,生成若干子节点,每个子节点代表采取一个动作后的新状态;
54、通过蒙特卡洛树搜索算法让每个子节点继续生成其子节点,直到达到预设终止状态,叶子节点代表预测的未来状态;预设终止状态包括:设定的时间步数或达到预定的扩散范围;
55、选择:从根节点开始,根据以下探索公式选择下一个子节点进行探索:
56、
57、其中,q(st,a)是动作a在状态s下的平均回报;p(s,a)是是采取动作a的先验概率;n(s)是状态s的访问次数;n(s,a)是从状态st采取动作a后到达的子状态的访问次数;c是平衡探索与利用的常数;
58、扩展:到达未探索的叶节点时,根据模型创建新的子节点;
59、模拟:从当前叶子节点开始,沿着一条随机路径进行模拟,模拟气体扩散过程,直到达到一个终止状态,记录模拟结束时这个路径上的奖励;
60、回传:将模拟得到的奖励反向传播,更新从根节点到当前叶节点路径上所有节点的统计信息;统计信息包括访问次数和累计奖励;
61、经过多次迭代后,通过蒙特卡洛树搜索算法根据每个节点的访问次数和累计奖励来评估不同路径的期望价值,并选择期望价值最大的路径作为预测的未来扩散路径。
62、本发明另一实施例提供了一种半封闭空间内有害气体扩散的预测设备,包括处理器、存储器以及存储在所述存储器中且被配置为由所述处理器执行的计算机程序,所述处理器执行所述计算机程序时实现上述发明实施例所述的半封闭空间内有害气体扩散的预测方法。
63、本发明另一实施例提供了一种存储介质,所述计算机可读存储介质包括存储的计算机程序,其中,在所述计算机程序运行时控制所述计算机可读存储介质所在设备执行上述发明实施例所述的半封闭空间内有害气体扩散的预测方法。
64、相比于现有技术,上述技术方案中的一个技术方案具有如下优点:
65、本发明实施例首先构建一个对半封闭空间的详尽了解,包括其三维结构、环境参数及历史气体浓度概况。随后,采用创新的动态网格重构技术,依据气体扩散特性和气流体力学,智能调整网格布局以实现精准建模。在此基础上,利用深度强化学习模型,结合空间网格内的丰富数据进行训练,形成对扩散行为能够深度理解的强化学习模型。最后,结合实时监控数据和蒙特卡洛树搜索算法,对实时情况进行快速分析,预测气体扩散路径,提供即时且精确的预警信息。由上分析可知,本发明实施例融合了动态网格重构、深度强化学习与蒙特卡洛树搜索算法,首先基于初始数据构建动态适应的网格模型,随后利用深度强化学习模型学习历史与实时数据中的扩散规律,并通过蒙特卡洛树搜索策略优化预测过程,以实现对半封闭空间有害气体扩散路径的高效、精准预测。因此,本发明实施例显著提升了有害气体扩散预测的实时性和准确性,为公共安全提供了强有力的预警与应对策略支持。
1.一种半封闭空间内有害气体扩散的预测方法,其特征在于,包括:
2.如权利要求1所述的半封闭空间内有害气体扩散的预测方法,其特征在于,所述根据所述初始数据,采用动态网格重构算法,依据气体浓度变化与气流动力学特性,调整网格大小,动态构建空间网格模型,包括:
3.如权利要求1所述的半封闭空间内有害气体扩散的预测方法,其特征在于,所述构建深度强化学习模型,并通过空间网格模型的每个网格中的初始数据进行学习训练,得到训练好的强化学习模型,包括:
4.如权利要求3所述的半封闭空间内有害气体扩散的预测方法,其特征在于,所述通过结合深度强化学习模型和蒙特卡洛树搜索算法,并基于实时的气体浓度分布数据和实时环境参数,预测得到半封闭空间内有害气体的未来扩散路径,包括:
5.一种半封闭空间内有害气体扩散的预测装置,其特征在于,包括:
6.如权利要求5所述的半封闭空间内有害气体扩散的预测装置,其特征在于,第一构建模块具体用于:
7.如权利要求5所述的半封闭空间内有害气体扩散的预测装置,其特征在于,所述第二构建模块具体用于:
8.如权利要求7所述的半封闭空间内有害气体扩散的预测装置,其特征在于,所述预测模块具体用于:
9.一种半封闭空间内有害气体扩散的预测设备,其特征在于,包括处理器、存储器以及存储在所述存储器中且被配置为由所述处理器执行的计算机程序,所述处理器执行所述计算机程序时实现如权利要求1至4中任意一项所述的半封闭空间内有害气体扩散的预测方法。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质包括存储的计算机程序,其中,在所述计算机程序运行时控制所述计算机可读存储介质所在设备执行如权利要求1至4中任意一项所述的半封闭空间内有害气体扩散的预测方法。