本发明涉及石油勘探与开发钻井工程,尤其涉及一种基于工程参数-钻速关联模型优化机械钻速的方法及系统。
背景技术:
1、机械钻速是影响钻井作业周期和作业成本的关键因素之一,也是钻井作业整体水平的直观反映。多年来,钻井领域的专家学者和工程技术人员一直致力于机械钻速的提升,领域内的传统工艺技术通常依靠钻井工具(钻头、扭冲、螺杆)来实现“硬”提速,从岩石物理力学性质、钻井工艺及设备能力、钻井液流变性能以及钻井工程参数等方面建立了诸多模型,但基本都是基于经验和逻辑推理,建模和求解过程相对复杂、考虑影响因素也十分有限;不仅导致作业成本高,而且由于各井之间地质条件不同导致提速效果差异大,无法满足工程改进的要求,从而陷入提速瓶颈。
2、例如专利文件cn202011454345.6提供“一种基于cart算法的油气钻井机械钻速预测与优化方法”,该方法采用工程参数作为模型的输入参数,但是未对工程参数实现充分的处理,而工程数据受井下复杂环境干扰较多,数据往往存在异常或缺失,大大影响预测模型的精确度;专利文件cn202110264976.x提供“基于深度神经网络sequential模型的深井钻井机械钻速预测方法”,该方法通过取得某一区块不同井的数据后,直接将其作为普适的原始数据集,缺乏对区块内不同井的分类,忽略了不同井参数的差异性,无法实现精确度满足要求的数据分析;王文等的《基于神经网络的深层机械钻速预测方法》中提供一种基于神经网络的深层机械钻速预测方法,其针对渤海油田开发的需要,首先对影响深层机械钻速的各项因素进行分析并建立了渤中区域深层机械钻速预测神经网络模型,然后结合探井实例对钻速预测模型进行了验证,实践证明神经网络预测的结果和实际机械钻速吻合较好,最后结合提出的模型对深层提速工具进行了优选。该方案中基于神经网络建立深层机械钻速预测方法,需要的样本数据规模大,预测值与真实值的误差上限值为10%左右,该研究中使用的神经网络模型较为简单,有陷入局部最优情况的风险,影响预测精度;李昌盛的《基于多元回归分析的钻速预测方法研究》中提供一种基于多元回归分析的钻速预测方法,其以bourgoyne&youngs方程作为理论基础,从元坝地区钻井数据库抽取300组录井数据,利用多元回归分析方法进行钻速方程系数的求解,针对不同地层得到的回归系数也不相同。采用同区块井的钻井数据进行验证,发现其预测钻速与实际钻速基本相符,平均相对误差上限值为13%。该文章利用多元回归分析法建立钻速预测方法,但其训练样本数较少(300组),且考虑的机械钻速影响因素不足,其结果的准确性难以保障。
3、随着大数据和人工智能技术的发展,虽然钻井作业决策呈现由经验驱动、逻辑驱动逐步向数据驱动的趋势发展,为综合考虑多因素提高机械钻速带来了新的技术思路。但是由于地质构造岩性复杂,且深部地层机械钻速低,显著制约降本增效,钻井提速是永恒的主题,因此需要提供一种全面考虑机械钻速影响因素的可靠钻速提升方法。
4、公开于本发明背景技术部分的信息仅仅旨在加深对本发明的一般背景技术的理解,而不应当被视为承认或以任何形式暗示该信息构成己为本领域技术人员所公知的现有技术。
技术实现思路
1、为解决上述全部或部分问题,本发明提供了一种基于工程参数-钻速关联模型优化机械钻速的方法及系统,在一个实施例中,所述方法包括:
2、样本数据采集步骤、选取一个或多个已钻井状态井作为样本井,针对样本井全面收集其机械钻速相关数据作为样本数据,包括钻井、录井、测井数据和对应钻速;
3、样本数据处理步骤、针对收集的样本数据,采用匹配的方法对数据内容分别进行异常值剔除处理、缺失数据补偿处理和优化降噪处理;
4、数据归类处理步骤、利用测井数据曲线作为分层聚类分析的参数,基于井位对样本数据进行归类处理;
5、输入参数优选步骤、归类处理后,通过分析样本数据两个或多个参数间的相关程度,根据分析结果选择模型的输入特征参数;
6、关联模型构建步骤、基于选取的输入特征参数分别建立与机械钻速数据之间的非线性关系,利用设定的训练集数据进行模型训练和调参,形成目标机械钻速预测模型;
7、提速参数评选步骤、针对各需求地层,分别以各特征参数为自变量利用目标机械钻速预测模型进行运算,根据运算结果评估各个特征参数的重要程度,选取重要参数作为转速提升调节对象。
8、优选地,一个实施例中,所述方法还包括:在关联模型构建步骤中,基于所述优选的特征参数另外划分验证集,利用验证集数据验证目标机械钻速预测模型,输入验证集特征参数,将计算得到的运算钻速与实际钻速对比,验证目标机械钻速预测模型的泛化能力和预测精度。
9、进一步地,一个实施例中,在样本数据采集步骤中,所述测井数据中包含反映地层的岩性、电性和物性的ac、gr、den及sp四类测井数据。
10、可选的实施例中,样本数据处理步骤中,采用直方图分析法对样本数据进行统计分析,确定数据正态分布规律,并基于其结合设定的处理规则识别数据异常值进行剔除。
11、进一步地,一个可选的实施例中,数据归类处理步骤中,利用k-means聚类方法基于井位对样本数据进行归类处理,包括下述操作:
12、利用手肘法,确定k-means算法中的关键参数k的取值;
13、通过计算ch指标来选取每个层系最终应该分几类使用k-means算法聚类分析;
14、执行聚类分析得出概率密度函数,确定四项输入参数对聚类结果的影响权重排序。
15、可选地,一个实施例中,在输入参数优选步骤中,利用pearson相关系数和最大信息系数算法,对不同层系的钻井参数进行相关性分析,评价两个或者多个参数间的相关程度,反映参数的影响敏感性。
16、进一步地,优选地,一个实施例中,输入参数优选步骤中,对不同层系的钻井参数进行相关性分析的过程包括:
17、根据最大信息系数法计算得到参数间的相关系数矩阵,并绘制对应的相关性分析热力图,基于此选取目标模型输入参数,选取的目标模型输入参数包括:井深、岩性、钻压、转盘转速、钻井液密度、入口流量、立压和扭矩参数。
18、可选的实施例中,在提速参数评选步骤中,利用随机森林算法评估各个特征参数的重要程度,对计算的重要程度进行排序,选取若干特征参数,结合其与机械钻速的相关属性制定钻速提升调节策略。
19、基于上述任意一个或多个实施例中所述方法的其他方面,本发明还提供一种存储介质,该存储介质上存储有可实现如上述任意一个或多个实施例中所述方法的程序代码。
20、基于上述任意一个或多个实施例中所述方法的应用方面,本发明还提供一种基于工程参数-钻速关联模型优化机械钻速的系统,该系统执行如上述任意一个或多个实施例中所述的方法。
21、与领域内现有技术相比,本发明具备如下有益效果:
22、本发明提供的基于工程参数-钻速关联模型优化机械钻速的方法及系统,该方法全面收集历史样本井与机械钻速相关的数据作为样本数据,包括钻井、录井、测井数据和对应钻速;采用匹配的方法对数据内容分别进行异常值剔除处理、缺失数据补偿处理和优化降噪处理;通过多方位预处理措施对数据进行优化,保证数据全面性和精确性的基础上,有效避免异常数据和噪声数据对后续运算过程的干扰,同时提升数据运算的效率;
23、利用分层聚类分析算法基于井位对样本数据进行归类处理后,通过分析样本数据参数间的相关程度选取模型的输入特征参数;利用设定的训练集数据进行模型训练和调参,分别建立各输入特征参数与机械钻速之间的非线性关系,形成目标机械钻速预测模型;针对各需求地层,分别基于各特征参数利用目标机械钻速预测模型计算机械转速,评估各个特征参数的重要程度并选取作为转速提升调节对象的参数,采用该方法,能够深入挖掘已钻井的钻井、测井和录井数据之间的隐含逻辑,揭示影响深部地层机械钻速低的内在原因及影响因素,建立机械钻速预测模型,实现钻井提速,对于提高钻井效率和降低钻井成本具有重要意义,可以有效的进行钻井提速。
24、本发明的其它特征和优点将在随后的说明书中阐述,并且,部分地从说明书中变得显而易见,或者通过实施本发明而了解。本发明的目的和其他优点可通过在说明书、权利要求书以及附图中所特别指出的结构来实现和获得。
1.一种基于工程参数-钻速关联模型优化机械钻速的方法,其特征在于,所述方法包括:
2.根据权利要求1所述的方法,其特征在于,所述方法还包括:在关联模型构建步骤中,基于所述优选的特征参数另外划分验证集,利用验证集数据验证目标机械钻速预测模型,输入验证集特征参数,将计算得到的运算钻速与实际钻速对比,验证目标机械钻速预测模型的泛化能力和预测精度。
3.根据权利要求1所述的方法,其特征在于,样本数据采集步骤中,所述测井数据中包含反映地层的岩性、电性和物性的ac、gr、den及sp四类测井数据。
4.根据权利要求1所述的方法,其特征在于,样本数据处理步骤中,采用直方图分析法对样本数据进行统计分析,确定数据正态分布规律,并基于其结合设定的处理规则识别数据异常值进行剔除。
5.根据权利要求1所述的方法,其特征在于,数据归类处理步骤中,利用k-means聚类方法基于井位对样本数据进行归类处理,包括下述操作:
6.根据权利要求1所述的方法,其特征在于,输入参数优选步骤中,利用pearson相关系数和最大信息系数算法,对不同层系的钻井参数进行相关性分析,评价两个或者多个参数间的相关程度,反映参数的影响敏感性。
7.根据权利要求6所述的方法,其特征在于,输入参数优选步骤中,对不同层系的钻井参数进行相关性分析的过程包括:
8.根据权利要求1所述的方法,其特征在于,提速参数评选步骤中,利用随机森林算法评估各个特征参数的重要程度,对计算的重要程度进行排序,选取若干特征参数,结合其与机械钻速的相关属性制定钻速提升调节策略。
9.一种存储介质,其特征在于,所述存储介质上存储有可实现如权利要求1~9中任一项所述方法的程序代码。
10.一种基于工程参数-钻速关联模型优化机械钻速的系统,其特征在于,所述系统执行如权利要求1~9中任意一项所述的方法。
