本发明涉及港口作业,尤其涉及一种基于动态强化学习和卡尔曼粒子跟踪的集卡防吊起方法。
背景技术:
1、在集装箱运输行业中,集卡被吊起事故常常是一个不容忽视的安全隐患。这类事故往往发生在码头龙门吊(如rtg/rmg等)进行集装箱吊运到堆场时,由于集卡锁销与集装箱锁孔未能完全释放,导致龙门吊意外将集卡车一同吊起,对人员和车辆安全构成严重威胁。
2、目前现有技术多依赖于人工检查和激光检测等方式。这些方法不仅效率低下,而且在某些情况下还可能出现误报和漏报,难以实现实时精准的监测。因此,为了应对这一挑战,本发明提出一种创新的解决方案,用于实现对集卡吊起状态的智能判断和实时监测。通过这种方式,本发明可以及时发现并预防潜在的集卡吊起事故,从而极大地提升集装箱运输的安全性和效率,满足现代化港口对安全生产的高标准要求。
技术实现思路
1、为了克服现有技术的上述缺点,本发明提出了一种基于动态强化学习和卡尔曼粒子跟踪的集卡防吊起方法,首先从摄像头采集的视频流图像中通过yolov8分割模型,精准定位出集装箱和集卡车托架的位置,然后通过强化学习优化的卡尔曼粒子滤波跟踪算法实现对集装箱和集卡车托架两种目标的实时运动跟踪,并引入了动态强化学习实现对集卡车吊起运动趋势做决策,满足吊起策略时控制器输出报警信号到外部系统进行防护响应,防止人员和集卡受到二次伤害。
2、本发明解决其技术问题所采用的技术方案为:一种基于动态强化学习和卡尔曼粒子跟踪的集卡防吊起方法,包括如下步骤:
3、步骤一、利用实时采集的集卡车视频流数据解码出图像数据;
4、步骤二、利用yolov8分割模型定位出集装箱和集卡车托架的位置;
5、步骤三、利用自适应卡尔曼粒子滤波跟踪算法对集装箱和集卡车托架两种目标进行实时目标跟踪;
6、步骤四、通过动态强化学习实现对集卡车吊起运动趋势的智能决策。
7、与现有技术相比,本发明的积极效果是:
8、本发明提出了一种自适应动态策略优化adpo(adaptive dynamic policyoptimization)强化学习方法,核心思想有两个:一是卡尔曼粒子滤波算法结合了卡尔曼滤波的线性预测能力和粒子滤波的非线性处理能力,通过自适应动态调整粒子分布来优化跟踪的精度和鲁棒性,进一步提升目标跟踪的速度和精度;二是动态策略调整,不同于传统的强化学习算法,adpo自适应动态策略强化学习算法可根据实时跟踪结果调整跟踪参数以应对不同的环境和目标状态,从而提升了对于集装箱和集卡车托架两种目标跟踪的速度和精度。其次,本发明提出了通过动态强化学习算法实现吊起决策,提升了集卡吊起报警准确性,从而确保在集卡车被吊起时系统可以及时发出报警信号到外部系统进行防护响应。
1.一种基于动态强化学习和卡尔曼粒子跟踪的集卡防吊起方法,其特征在于:包括如下步骤:
2.根据权利要求1所述的基于动态强化学习和卡尔曼粒子跟踪的集卡防吊起方法,其特征在于:步骤三所述利用自适应卡尔曼粒子滤波跟踪算法对集装箱和集卡车托架两种目标进行实时目标跟踪的方法包括如下步骤:
3.根据权利要求2所述的基于动态强化学习和卡尔曼粒子跟踪的集卡防吊起方法,其特征在于:在跟踪过程中,根据目标在图像中的运动情况和yolov8图像分割模型的输出动态调整粒子的位置和范围:当目标移动时,根据yolov8图像分割模型提供的目标位置信息来更新粒子的位置;当目标形状或大小发生变化时,根据yolov8图像分割模型提供的目标区域信息来更新粒子的范围。
4.根据权利要求2所述的基于动态强化学习和卡尔曼粒子跟踪的集卡防吊起方法,其特征在于:粒子集滤波更新的方法包括如下步骤:
5.根据权利要求4所述的基于动态强化学习和卡尔曼粒子跟踪的集卡防吊起方法,其特征在于:判断是否需要部分重采样或完全重采样的方法为:
6.根据权利要求4所述的基于动态强化学习和卡尔曼粒子跟踪的集卡防吊起方法,其特征在于:对低权重粒子进行重采样的方法为:将粒子按照权重从低到高排序,选择权重最低的n-nresample个粒子进行重采样,对于每个需要重采样的粒子,根据其权重进行随机选择,对于每个被选中的低权重粒子,首先进行复制,然后对于每个复制后的粒子,在其状态向量x的每个维度上扫完如下公式添加一个随机扰动:
7.根据权利要求2所述的基于动态强化学习和卡尔曼粒子跟踪的集卡防吊起方法,其特征在于:强化学习模型采用的奖励函数包括:
8.根据权利要求1所述的基于动态强化学习和卡尔曼粒子跟踪的集卡防吊起方法,其特征在于:步骤四所述通过动态强化学习实现对集卡车吊起运动趋势的智能决策的方法为:使用多层感知机和高斯分布相结合作为策略网络,将集卡车托架分割目标上边缘中心点和集装箱分割目标底部边缘中心点的位置信息状态作为输入,利用训练好的多层感知机输出报警动作的均值和标准差,从而输出集卡吊起报警或者不报警的动作,然后进行激励;与环境交互,利用收集的状态、动作、激励数据对策略网络进行更新。
9.根据权利要求8所述的基于动态强化学习和卡尔曼粒子跟踪的集卡防吊起方法,其特征在于:采用如下形状激励函数对集卡吊起报警或者不报警的动作进行激励:
10.根据权利要求1所述的基于动态强化学习和卡尔曼粒子跟踪的集卡防吊起方法,其特征在于:步骤二所述利用yolov8分割模型定位出集装箱和集卡车托架的位置的方法为: