本发明涉及弹道极限速度预测领域,具体涉及一种基于数据增强的破片侵彻靶板弹道极限速度预测方法。
背景技术:
1、弹道极限速度是衡量破片或弹道导弹穿透靶板能力的一种指标,对于设计和评估弹道导弹的性能十分重要。通过弹道极限速度确定弹头的穿透能力,进而评估导弹的杀伤效果并指导材料选择和设计优化,从而提高导弹的战斗效能。对于不同材料、不同直径的破片侵彻不同材质、厚度的目标,其对应的弹道极限速度不同。现有研究中,确定弹道极限速度的方法主要包括经验公式方法和数值计算方法。经验公式主要式基于大量试验实测数据建立弹道极限速度计算公式,包括de marre公式、午新民公式等,公式的适用条件及适用范围都不相同。数值计算方法主要应用有限元软件进行大量仿真工况计算,模拟结果依赖于网格划分及仿真参数,工作量大且准确性较难保证。传统计算方法中往往存在试验成本高、试验周期长等问题,因此采用机器学习方法解决这些问题。
2、随着互联网和大数据的迅速发展,机器学习方法被广泛地应用于研究破片对靶板的侵彻与贯穿过程。决策树是回归分析中的常用模型,采用集成学习的方法,将多个决策树组合成一个强大的模型,能有效减小模型的偏差和方差,且能够处理复杂的非线性关系,提升模型的预测准确性。决策树模型的预测能力依赖大量的样本数据,但侵彻数据量少且存在偏差数据,直接使用会导致模型预测效果。因此,结合数据增强方法和数据筛选,能够有效提高模型的预测效果。
技术实现思路
1、本发明的技术解决问题是:克服现有技术中存在的问题,提供了一种基于数据增强的破片侵彻靶板弹道极限速度预测方法,该方法通过新增少数区间样本数以规避侵彻数据量较少、存在异常值及样本分布不均衡带来的计算误差,从而更好地预测破片侵彻靶板的弹道极限速度值。
2、本发明的技术解决方案是:
3、一种基于数据增强的破片侵彻靶板弹道极限速度预测方法,具体包括如下步骤:
4、(1)对预先获取的侵彻数据进行数据异常检测与剔除;
5、(2)基于k-means聚类算法将经过步骤(1)处理过的侵彻数据分成h个待增强数据区间,并对该h个待增强数据区间进行处理,得到包括h个数据区间的扩充数据集d1;
6、所述对该h个待增强数据区间进行处理的方法为:
7、根据h个待增强数据区间的样本数据量及不平衡比例,选出少数样本区间,使用smote数据增强方法对该选出的少数样本区间的样本进行数据增强,对进行数据增强后的少数样本区间中的样本数据进行数据筛选;
8、(3)从扩充数据集d1中的每个数据区间中随机划分训练数据traindata和测试数据testdata;
9、(4)利用网格搜索和交叉验证方法选取最优模型参数,建立gbdt模型;
10、(5)使用步骤(3)得到的训练数据traindata对步骤(4)建立的gbdt模型进行训练,并使用测试数据testdata进行验证,得到验证后的gbdt模型;
11、(6)使用步骤(5)得到的验证后的gbdt模型对待测试的侵彻数据进行预测,得到破片侵彻靶板弹道极限速度预测值。
12、所述步骤(1)中,进行数据异常检测的方法为:以弹靶厚度比为x轴,弹道极限速度为y轴,利用origin软件进行曲线拟合,利用拟合得到的公式对弹道极限速度进行计算,统计试验数据值与公式计算值之间的误差,将误差值大于30%的数据点剔除,得到去除异常样本后的数据集,避免异常数据影响数据增强效果;
13、弹靶厚度比是破片直径与靶板厚度的比值;
14、所述步骤(2)中,分成h个待增强数据区间的方法为:使用k-means聚类算法对破片侵彻靶板试验数据进行区间聚类,初始化m个聚类中心,然后计算每个数据点到聚类中心的欧式距离,依次比较得到的欧式距离,将经过比较的各数据样本分配到距离最小的聚类中,然后以当前聚类中所有样本的均值来更新聚类中心;
15、所述步骤(2)中,进行数据增强的方法为:对少数样本区间m中的任一样本通过数据增强的方式来新增样本,具体为:
16、使用knn算法,通过欧氏距离计算m中的样本x到m中的所有样本的距离,从其k个邻居中随机选取若干个样本,假设选择的近邻为b,对每一个随机选出的样本b,分别与原样本数据按照如下公式构建新的样本:
17、bnew=x+rand(0,1)×(x-b)
18、其中,rand(0,1)代表0到1内的随机数,不包括0和1;
19、所述步骤(2)中,进行数据筛选的方法为:
20、利用origin软件对增强数据样本进行曲线拟合,得到拟合公式后计算相应的弹道极限速度,计算增强数据值与计算值之间的误差,剔除误差大于15%的数据;
21、所述步骤(4)中,选取最优模型参数的方法为:网格搜索用于选取gbdt模型的最优超参数,将gbdt模型参数的取值区间按照设定规则划分为若干小区间,将各个参数可能的取值进行超参数组合,每组超参数采用交叉验证法进行评估,通过比较选择出最优超参数组合;对gbdt模型超参数的取值区间按照设定的搜索步长进行网格划分;超参数组合通过5折交叉验证的方法进行优化,将数据集平分为不相交的5个子集,一个子集作为测试集,其余子集作为训练集,由此得到5个gbdt模型的指标,将5个gbdt模型指标取平均值,作为5折交叉验证的模型的结果。
22、与现有技术相比,本发明的有益效果:
23、本发明提出的基于数据增强的破片侵彻靶板弹道极限速度预测方法,在数据质量的问题上,由于原数据集中存在一定的异常值,采用本发明提出的方法,规避了异常数据可能带来的误差以及对预测结果的影响;在数据数量的要求上,因为侵彻数据量较少,通过数据增强增加样本数据,解决现有方法中数据量缺乏的问题;在数据分布的问题上,解决了传统预测方法中数据分布的不平衡问题,最大程度上平衡了各区间的数据,减少样本数据不平衡带来的误差,从而提高模型整体的泛化能力,更好地实现对弹道极限速度的预测。
1.一种破片侵彻靶板弹道极限速度预测方法,其特征在于步骤包括:
2.根据权利要求1所述的一种基于数据增强的破片侵彻靶板弹道极限速度预测方法,其特征在于:
3.根据权利要求1或2所述的一种基于数据增强的破片侵彻靶板弹道极限速度预测方法,其特征在于:
4.根据权利要求3所述的一种基于数据增强的破片侵彻靶板弹道极限速度预测方法,其特征在于:
5.根据权利要求1或2所述的一种基于数据增强的破片侵彻靶板弹道极限速度预测方法,其特征在于:
6.根据权利要求5所述的一种基于数据增强的破片侵彻靶板弹道极限速度预测方法,其特征在于:
7.根据权利要求5所述的一种基于数据增强的破片侵彻靶板弹道极限速度预测方法,其特征在于:
8.根据权利要求1所述的一种基于数据增强的破片侵彻靶板弹道极限速度预测方法,其特征在于:
9.根据权利要求8所述的一种基于数据增强的破片侵彻靶板弹道极限速度预测方法,其特征在于:
