基于混合集成学习的智能围岩分级方法、装置和终端与流程

    技术2025-05-01  32


    本发明涉及数据分类领域,具体是基于混合集成学习的智能围岩分级方法、装置和终端。


    背景技术:

    1、围岩分级一直以来都是地质学、资源勘查、岩土勘察、岩石力学与工程等领域非常重要而基础的问题,也是必不可缺的环节。因此,准确高效地对围岩进行分级非常重要。而根据物探数据对围岩进行智能分析恰恰为人们提供有力的自动化围岩分级工具。

    2、传统的围岩分级方法主要依赖于个人经验和地质专业知识,耗时长,专业性强,在数据不足的情况下,导致准确率不理想。人工智能技术的引入减少了围岩分级的难度,同时有利于提高准确性。但是在面对数据与围岩类别间的复杂关系时,仅利用一种机器学习模型容易产生错分及漏分的现象,导致围岩分级误差较大等问题。因此,本发明提出基于混合集成学习的智能围岩分级方法,通过引入多种机器学习算法,以减少单个模型的偏差和方差,提供了更可靠、高效的智能识别结果。


    技术实现思路

    1、本发明的目的在于克服现有技术的不足,提供一种基于混合集成学习的智能围岩分级方法,其特征在于,包括如下步骤:

    2、s1、数据预处理:对原始数据按设定比例划分,并进行清洗、转换以及标准化,得到初始数据集;

    3、s2、特征构造:依据初始数据集中数据物理背景进行特征构造,获得试验数据集;

    4、s3、训练基学习器:采用xgboost作为基学习器框架,利用试验数据集训练基学习器,得到初步输出;

    5、s4、训练元学习器:拼接初步输出,训练元学习器,元学习器输出围岩识别结果;

    6、s5、通过元学习器对采集的围岩数据进行识别,得到围岩识别结果;若分类准确率低于阈值,则模型动态更新。

    7、进一步的,所述对原始数据按设定比例划分,并进行清洗、转换以及标准化,得到初始数据集,包括:

    8、s11、对原数据按8:2划分训练集和测试集,分别去除原始数据中的空缺值,重复值,冲突值;对岩性数据进行顺序编码,得到目标值;岩性数据包括:坚硬程度、完整性以及地下水情况;

    9、s12、对初步清洗后的数据进行最大最小标准化,采用如下公式:

    10、

    11、其中x′是最大最小标准化后的特征值,x是原始的特征值,max和min分别是特征的最大值和最小值。

    12、进一步的,所述依据初始数据集中数据物理背景进行特征构造,获得试验数据集,包括:

    13、s21、根据物理背景构造与地质特征相关的新特征,新增特征包含:纵波速度与密度的融合指标一、纵波速度与密度的融合指标二、泊松比与密度的融合指标、横纵波速度的融合指标以及密度的倒数;

    14、其中纵波速度与密度的融合指标一为密度除与纵波速度的比值;其中纵波速度与密度的融合指标二为纵波速度与密度的乘积;泊松比与密度的融合指标为泊松比与密度的比值;横纵波速度的融合指标为纵波速度与横波速度的比值;

    15、s22、根据地址特征与目标值计算互信息量:

    16、

    17、其中x和y分别表示特征和目标值,p(x)和p(y)分别表示特征和目标值对应的边际概率密度函数,p(x,y)表示x和y的联合概率密度函数;根据计算结果,选择互信息量最高的六个特征作为训练特征;

    18、s23、对物探数据进行k-mean聚类,基于岩性类别数量选择相同的聚类数c1,选择c1个点作为初始簇中心,计算各数据点到初始簇中心的距离:

    19、

    20、将各数据点归类到离其距离最近的簇中心,对每一类别,计算所有数据点的平均值,将数据点的平均值作为新的聚类中心,直至簇中心不再移动,得到基本岩性分级,作为新的训练特征。

    21、进一步的,所述采用xgboost作为基学习器框架,利用试验数据集训练基学习器,得到初步输出,包括:

    22、s3.1根据数据集中岩石硬度的类别确定基学习器的数量,将每个基学习器负责类别对应的目标值设为1,其余类别对应的目标值设为0,得到训练数据集;其中岩石硬度的类别是极硬岩、硬岩、较软岩、软岩、极软岩等五类;

    23、s3.2选用xgboost的分类版本xgboostclassifier作为基学习器框架,预测值为:

    24、

    25、其中表示对第i个样本的预测值,xi表示第i个样本的特征值,表示前面t-1棵树的累加值,表示第t棵树的预测结果;

    26、xgboost的损失函数为;

    27、

    28、其中为模型误差,为正则项;

    29、其中正则项为:

    30、

    31、正则项用于表示决策树的复杂程度,γ,λ为超参数,t为决策树叶子结点总个数,为每个叶子节点值,优化目标为:

    32、

    33、在加法模型中正则项为:

    34、

    35、正则项近似项为:

    36、

    37、将正则项近似项转化为:

    38、

    39、通过泰勒二阶展开将xgboost的损失函数转化并求出最优目标函数值为:

    40、

    41、则最优解为:

    42、

    43、进一步的,所述拼接初步输出,训练元学习器,元学习器输出围岩识别结果,包括:

    44、s41、将步骤s3中所有基学习器的输出与对应目标值合并成一个新的特征数据集得到新的训练数据集;

    45、s42、选用xgboost的分类版本xgboostclassifier作为元学习器框架,利用s41中训练数据集训练元学习器,得到完整的混合集成学习模型。

    46、进一步的,所述若分类准确率低于阈值,则模型动态更新,包括:

    47、将采集数据用于重新训练元学习器,若新数据中岩性各类别不平衡,加入原样本平衡数据,若更新后分类准确率低于阈值,则重复步骤s3、s4,重新训练混合集成学习模型。

    48、一种基于混合集成学习的智能围岩分级装置,应用所述的基于混合集成学习的围岩分级方法,包括:

    49、数据预处理模块,用于对数据集进行清洗,转换,标准化等操作;

    50、特征构造模块,用于对数据集进行特征构造,聚类操作,得到初始类别;

    51、基学习器模块,用于训练调优基学习器,得到最佳预测结果;

    52、元学习器模块,用于根据基学习器输出结果得到最终围岩分级结果;

    53、动态更新模块,用于更新模型参数和权重,提高模型的性能。

    54、一种基于混合集成学习的智能围岩分级终端,包括处理器和存储器,所述处理器应用所述的基于混合集成学习的围岩分级方法。

    55、本发明的有益效果是:本发明提出混合集成学习,通过结合多个弱学习器来构建一个更强大的集成模型以降低单个弱学习器的预测误差,整体模型准确率得以提高。集成学习充分利用多个算法优势融合多个模型预测结果,应用不同的集成策略根据具体情况进行适配,具有极高灵活性。本发明构造了高地质领域物理意义以及高互信息量的新特征;提供了根据物探数据对围岩进行智能分级的方法,根据物理背景利用互信息量来构造特征以捕捉地质属性之间的相关性,对物探数据进行k-mean聚类并根据其结果得到基本围岩分级作为新特征;使用的xgboost模型在具备决策树的优势同时具有强大的性能和高解释性。xgboost模型是一种基于梯度提升决策树的机器学习算法,通过迭代训练多个若学习模型以提升模型预测能力,并且在模型训练过程中计算排序特征重要性。同时xgboost支持增量训练得以快速更新模型,使用系数特征优化技术以提高预测效率,同时给提供了一些轻量级的模型压缩技术以进一步减小模型体积,提高模型推理性能。


    技术特征:

    1.一种基于混合集成学习的智能围岩分级方法,其特征在于,包括如下步骤:

    2.根据权利要求1所述的基于混合集成学习的围岩分级方法,其特征在于,所述对原始数据按设定比例划分,并进行清洗、转换以及标准化,得到初始数据集,包括:

    3.根据权利要求1所述的基于混合集成学习的围岩分级方法,其特征在于,所述依据初始数据集中数据物理背景进行特征构造,获得试验数据集,包括:

    4.根据权利要求1所述的基于混合集成学习的围岩分级方法,其特征在于,所述采用xgboost作为基学习器框架,利用试验数据集训练基学习器,得到初步输出,包括:

    5.根据权利要求1所述的基于混合集成学习的围岩分级方法,其特征在于,所述拼接初步输出,训练元学习器,元学习器输出围岩识别结果,包括:

    6.根据权利要求1所述的基于混合集成学习的围岩分级方法,其特征在于,所述若分类准确率低于阈值,则模型动态更新,包括:

    7.一种基于混合集成学习的智能围岩分级装置,其特征在于,应用权利要求1-6任一所述的基于混合集成学习的围岩分级方法,包括:

    8.一种基于混合集成学习的智能围岩分级终端,其特征在于:包括处理器和存储器,所述处理器应用权利要求1-6所述的基于混合集成学习的围岩分级方法。


    技术总结
    本发明涉及数据分类领域,公开了基于混合集成学习的智能围岩分级方法、装置和终端,包括:数据预处理:对原始数据按设定比例划分,并进行清洗、转换以及标准化,得到初始数据集;特征构造:依据初始数据集中数据物理背景进行特征构造,获得试验数据集;训练基学习器:采用Xgboost作为基学习器框架,利用试验数据集训练基学习器,得到初步输出;训练元学习器:拼接初步输出,训练元学习器,元学习器输出围岩识别结果;通过元学习器对采集的围岩数据进行识别,得到围岩识别结果;若分类准确率低于阈值,则模型动态更新。通过本发明,可以实现围岩分类的准确性。

    技术研发人员:卢松,伊小娟,肖洋,邹杨,汪旭,吴奎锋,孟露,李强,陈大阳,侯弈腾
    受保护的技术使用者:中铁西南科学研究院有限公司
    技术研发日:
    技术公布日:2024/10/24
    转载请注明原文地址:https://symbian.8miu.com/read-30221.html

    最新回复(0)