本发明涉及机器人导航,尤其涉及基于目标识别的机器人导航决策方法。
背景技术:
1、随着人工智能和机器人技术的快速发展,机器人在工业、医疗、服务等领域的应用越来越广泛,其中,机器人自主导航技术作为机器人能够自主移动和执行任务的关键技术,受到了广泛关注,自主导航技术包括环境感知、路径规划和导航控制等多个方面,旨在使机器人能够在复杂、多变的环境中安全、高效地移动。
2、现有的机器人导航技术主要依赖于预先构建的环境地图和固定的路径规划算法,通常使用激光雷达、摄像头等传感器进行环境感知,然而,现有技术存在多个缺点,首先,环境感知和目标识别的准确性和实时性不足,容易受到环境变化和噪声的干扰;其次,路径规划算法的灵活性和适应性较差,难以应对复杂动态环境中的多种障碍物;最后,导航决策的动态调整能力有限,缺乏实时优化和反馈机制,无法保证机器人在不断变化的环境中始终高效、安全地进行导航。
3、本发明的目的是提供一种基于目标识别的机器人导航决策方法,显著提升了系统的可靠性和适应性,确保机器人能够在复杂环境中安全、高效地完成任务。
技术实现思路
1、基于上述目的,本发明提供了基于目标识别的机器人导航决策方法。
2、基于目标识别的机器人导航决策方法,包括以下步骤:
3、s1:利用摄像头以及图像传感器获取机器人周围环境的实时图像数据,并对获取的图像数据进行预处理,包括图像去噪、灰度化以及边缘检测;
4、s2:对预处理后的图像数据进行目标识别,识别出环境中的目标物体,并从识别出的目标物体中提取特征信息;
5、s3:整合特征信息,并用栅格地图将整合的特征信息构建为栅格环境模型,生成环境地图,环境地图包括目标物体的位置、形状和相关信息;
6、s4:基于构建的环境模型,计算机器人从当前位置到目标点的最优路径;
7、s5:基于路径规划的结果,引入生成对抗网络进行路径预测与修正,动态调整和优化机器人导航路径,具体包括:
8、s51:利用生成对抗网络生成潜在路径,并对生成的潜在路径进行评估,输出每条生成路径的可行性评分;具体包括:生成器不仅输入随机噪声,还输入当前环境模型、机器人位置信息和路径约束,生成潜在路径;判别器输入生成的路径和真实路径,并结合环境特征和多尺度特征进行评估,输出路径的可行性评分;通过生成器和判别器的对抗训练;生成器的损失函数为:
9、;
10、其中,为随机噪声,为环境特征向量,为路径约束,为多尺度特征,为噪声的概率分布,为环境特征的概率分布,为路径约束的概率分布,d表示识别器,是期望;
11、s52:根据可行性评分的结果,选择可行性最高的路径作为当前导航路径;
12、s53:在机器人实际导航过程中,实时监控环境变化,通过生成对抗网络动态修正路径;
13、s6:根据路径预测与修正的结果,结合机器人当前的位置、速度和方向,生成导航指令,指导机器人进行实时导航,动态调整导航决策;
14、s7:通过实时图像数据和导航结果的反馈,不断优化目标识别和导航决策。
15、进一步的,所述s1步骤包括:
16、s11,图像数据获取:利用安装在机器人的摄像头和图像传感器获取机器人周围环境的实时图像数据;
17、s12,图像去噪处理:采用高斯滤波器对获取的图像数据进行去噪处理;
18、s13,图像灰度化处理:使用加权平均法将去噪后的图像数据进行灰度化处理,将彩色图像转换为灰度图像;
19、s14,边缘检测处理:采用canny边缘检测算法对灰度化后的图像进行边缘检测,提取图像中的边缘信息。
20、进一步的,所述s2步骤包括:
21、s21,目标识别:采用卷积神经网络(cnn)模型对预处理后的图像数据进行目标识别,识别出环境中的目标物体,包括障碍物、目标点和导航标志;
22、s22,特征提取:从识别出的目标物体中提取特征信息,包括目标物体的形状、大小、位置和运动状态,具体包括:
23、s221,形状特征提取:利用canny边缘检测算法提取目标物体的轮廓和边缘,计算形状特征,包括周长、面积和轮廓近似多边形;
24、s222,大小特征提取:计算目标物体的边界框,得到其宽度、高度和面积;
25、s223,位置特征提取:确定目标物体在图像中的位置,计算其质心坐标;
26、s224,运动状态特征提取:通过连续多帧图像数据计算目标物体的运动轨迹和速度,利用光流算法估计目标物体的运动矢量。
27、进一步的,所述s3步骤具体包括:
28、s31,特征信息整合:将从目标识别和特征提取中获得的目标物体的特征信息进行整合;
29、s32,环境模型构建:基于整合的特征信息,采用栅格地图的方法构建栅格环境模型;所述栅格地图将环境划分为若干栅格,每个栅格包含一个概率值,表示对应区域被占据的可能性,利用目标物体的位置和大小信息更新栅格的占据概率,生成包含目标物体的栅格地图;栅格环境模型的数学公式为:
30、;
31、其中,是第个栅格被占据的概率,是栅格的对数几率,为从时间1到的传感器测量值;
32、s33,环境地图生成:将构建的环境模型转换为环境地图。
33、进一步的,所述s4步骤包括:
34、s41,规划路径:基于构建的栅格环境模型,采用a*算法计算机器人从当前位置到目标点的最优路径;
35、s42,路径优化:在路径规划过程中,考虑机器人尺寸和运动能力,使用样条插值方法对路径进行平滑处理,计算公式为:
36、;
37、其中,为平滑路径上的点,为控制点,为参数。
38、进一步的,所述s51步骤包括:
39、s511,生成器:生成器不仅输入随机噪声,还输入当前环境模型、机器人位置信息和路径约束,生成潜在路径,计算公式为:
40、;
41、其中,为随机噪声,为环境特征向量(包含当前环境模型和机器人位置信息),为路径约束(如最大转弯角度、最小安全距离等),为生成器的权重矩阵,为第一偏置,为激活函数;
42、s512,判别器:判别器输入生成的路径和真实路径,并结合环境特征和多尺度特征进行评估,输出路径的可行性评分,计算公式为:
43、;
44、其中,为输入路径(包括生成路径和真实路径),为环境特征向量,为多尺度特征(如局部路径特征和全局路径特征),为判别器的权重矩阵,为第二偏置,为激活函数;
45、s513,生成对抗训练:通过生成器和判别器的对抗训练,计算公式为:
46、生成器的损失函数:
47、;
48、其中,为随机噪声,为环境特征向量,为路径约束,为多尺度特征,为噪声的概率分布,为环境特征的概率分布,为路径约束的概率分布,是期望;
49、判别器的损失函数:
50、;
51、其中,为真实路径数据,为环境特征向量,为多尺度特征,为真实路径数据的概率分布,为环境特征的概率分布,为多尺度特征的概率分布;
52、s514,路径生成与评估:
53、路径生成:生成器输入随机噪声、环境特征和路径约束,生成潜在路径,计算公式为:
54、;
55、路径评估:判别器输入生成的路径、环境特征和多尺度特征,输出路径的可行性评分,计算公式为:
56、;
57、真实路径评估:判别器输入真实路径、环境特征和多尺度特征,输出真实路径的可行性评分,计算公式为:
58、。
59、进一步的,所述s52步骤包括:
60、s521,路径评分排序:对所有生成的潜在路径的可行性评分进行排序,得到按评分降序排列的路径列表,对应的,计算公式为:
61、;
62、其中,为判别器对路径的可行性评分,为环境特征向量,为多尺度特征;
63、s522,选择最佳路径:从排序后的路径列表中选择可行性评分最高的路径作为当前导航路径,计算公式为:
64、;
65、其中,为可行性评分最高的路径,为其对应的评分。
66、进一步的,所述s53步骤包括:
67、s531,环境变化监控:利用摄像头和传感器实时获取机器人周围环境的最新图像数据和传感器数据,更新环境特征向量,计算公式为:
68、;
69、其中,和分别为最新的图像数据和传感器数据,为环境特征提取函数;
70、s532,路径再生成:生成器输入随机噪声、更新后的环境特征向量和路径约束,生成新的潜在路径,计算公式为:
71、;
72、其中,为生成器函数,为生成器的权重矩阵,为第一偏置,为激活函数;
73、s533,路径再评估:判别器输入新的潜在路径、更新后的环境特征向量和多尺度特征,输出新的路径可行性评分,计算公式为:
74、;
75、其中,为判别器函数,为判别器的权重矩阵,为第二偏置,为激活函数;
76、s534,路径选择与切换:根据新的路径可行性评分,选择可行性评分最高的路径作为当前导航路径,实时切换机器人导航路径,计算公式为:
77、。
78、进一步的,所述s6步骤包括:
79、s61,导航决策:根据路径预测与修正的结果,结合机器人当前的位置、速度和方向,生成导航指令,指导机器人进行实时导航,具体包括:
80、s611,路径信息获取:从路径修正中获取当前选定的最佳路径;
81、s612,状态信息更新:实时获取机器人的当前位置、速度和方向,计算公式为:
82、;
83、s613,导航指令生成:根据最佳路径和机器人的当前状态,使用模型预测控制(mpc)算法生成导航指令,指导机器人进行实时导航,计算公式为:
84、;
85、其中,为控制输入(如速度和转向角度),和为权重矩阵,为欧几里得距离;
86、s62,动态调整:在机器人导航过程中,实时监测环境变化和机器人的状态变化,动态调整导航决策。
87、进一步的,所述s7步骤包括:
88、s71,反馈机制:通过实时获取的图像数据和导航结果,建立反馈机制,以不断优化目标识别和导航决策,具体包括:
89、s711,实时数据获取:利用摄像头和传感器实时获取机器人导航过程中的图像数据和传感器数据;
90、s712,导航结果记录:记录机器人导航过程中的路径选择、避障情况和导航效果,包括实际路径、避障点和到达目标的时间;
91、s713,数据反馈:对实时获取的图像数据、传感器数据和导航结果进行反馈,计算公式为:
92、;
93、其中,是实时图像数据,是实时传感器数据,是导航结果;
94、s72,目标识别优化:根据反馈机制的结果,采用在线学习算法更新卷积神经网络(cnn)模型的权重,计算公式为:
95、;
96、其中,为模型参数,为学习率,为损失函数,是梯度计算;
97、s73,导航决策优化:根据反馈机制的结果,利用强化学习算法更新导航策略,计算公式为:
98、;
99、其中,为当前状态,为动作,s' 为下一时刻状态,a'为下一时刻动作,为即时奖励,为折扣因子,为学习率。
100、本发明的有益效果:
101、本发明通过基于目标识别的机器人导航决策方法,显著提升了机器人在复杂环境中的导航准确性、实时性和适应性,利用摄像头和传感器实时获取环境图像数据,并通过高效的图像预处理、目标识别与特征提取方法,准确识别出环境中的目标物体,提取其详细特征信息,这些特征信息被用于构建精确的环境模型和环境地图,为后续的路径规划和导航决策提供了坚实的基础;
102、本发明通过引入生成对抗网络进行路径预测与修正,生成器结合环境特征和路径约束生成潜在路径,并由判别器对生成的路径进行可行性评分,确保选择最优路径,不仅提高了路径规划的灵活性和适应性,还通过实时监控环境变化和动态修正路径,确保机器人在复杂动态环境中能够灵活应对障碍物和其他突发情况,显著提升了导航系统的可靠性和安全性;其中,在多源数据输入步骤中,生成器引入了环境特征(包括当前环境模型、机器人位置信息)和路径约束复杂信息,增强了gan 模型生成潜在路径的能力;引入多尺度特征:通过引入局部和全局的多尺度特征,使得判别器在评估路径可行性时更加全面,能够同时考虑局部路径细节和全局路径规划;路径约束的加入:加入了路径约束(如最大转弯角度、最小安全距离等),确保生成的路径不仅可行,还符合实际应用中的安全要求,相比传统路径规划方法的简单规则,将路径约束作为模型的一个内在部分,极大提升了路径规划的合理性和安全性。
103、本发明通过结合模型预测控制算法生成导航指令,并在导航过程中实时监测环境和机器人的状态变化,动态调整导航决策,确保机器人能够顺利到达目标点,此外,利用实时图像数据和导航结果的反馈,不断优化目标识别和导航决策模型,采用在线学习和强化学习算法动态更新模型参数,提高了系统的整体性能和鲁棒性,确保机器人在不断变化的环境中始终保持高效、安全的导航能力。
1.基于目标识别的机器人导航决策方法,其特征在于,包括以下步骤:
2.根据权利要求1所述的基于目标识别的机器人导航决策方法,其特征在于,所述s1步骤包括:
3.根据权利要求1所述的基于目标识别的机器人导航决策方法,其特征在于,所述s2步骤包括:
4.根据权利要求3所述的基于目标识别的机器人导航决策方法,其特征在于,步骤s3步骤具体包括:
5.根据权利要求4所述的基于目标识别的机器人导航决策方法,其特征在于,所述s4步骤包括:
6.根据权利要求1所述的基于目标识别的机器人导航决策方法,其特征在于,所述s51步骤包括:
7.根据权利要求6所述的基于目标识别的机器人导航决策方法,其特征在于,所述s52步骤包括:
8.根据权利要求7所述的基于目标识别的机器人导航决策方法,其特征在于,所述s53步骤包括:
9.根据权利要求8所述的基于目标识别的机器人导航决策方法,其特征在于,所述s6步骤包括:
10.根据权利要求9所述的基于目标识别的机器人导航决策方法,其特征在于,所述s7步骤包括: