本公开是关于自适应优化框架,所述基于机器学习的自适应优化框架用于水质的预测。所述框架自动优化ann的架构和选择用于水质预测模型输入的多个影响特征而无需基于领域专家知识去针对不同情况或地理区域的ann水质预测模型进行手动调整,而无需基于领域专家知识去针对不同情况或地理区域的ann水质预测模型进行手动调整。所述框架也提出使用基于dc的特征而增强ann捕获因为极端事件或突发事件使水质发生显著趋势变化的能力。
背景技术:
1、随着工业快速发展,其所带来的环境污染问题日益严重,保护环境已经成为非常具挑战性的工作。良好的水质是城市发展的必要组成部分之一,与人类健康息息相关。为了更好地维持水质,不仅各项水质指标需要被实时监控,水质的未来趋势也需要被预判,以使可以预先准备对可能污染物的特殊处置以及降低水质周期性波动对生产生活的影响。
2、基于历史水质观测数据的未来水质预测对于人们的社会生活十分重要。在实际预测中,水质受到许多不同方面因素的影响,例如气候因素(诸如降雨以及温度)、化学因素(诸如由于农业废弃物污染的氮以及磷含量)、生物因素(诸如粪便大肠杆菌群浓度)、位置因素(诸如湖、河、河口等等水源)、以及环境因素(诸如工业污水突然溢出到淡水源之发生)。由于各类因素对于水质的影响各不相同,因此可通过机器学习技术分析历史趋势模式去预测水质是一项可行的技术。与本公开相关的是,存在关联于使用机器学习技术的两个技术问题(特别是使用ann模型)来预测水质。
3、首先該注意到的是,相关于水质预测以及用于机器学习模型的观测数据通常为ts数据类型。ts是一种数据序列,带有以某特定取样间隔来取用的数据样本。通常,基于各种不同的理由,取样间隔是固定长度的,例如,以数小时乃至于数天的量级。此外,ts数据通常是从原始测量数据中以向下取样(downsampling)的方式来备制。ts所使用的取样间隔通常是被领域专家基于领域知识以及实用上的限制来決定。例如,一些观测变量依据理解是缓慢的变化,所以是不需要高取样率的;且/或训练机器学习模型的高成本是归因于高取样率。另一方面,万一短时间內突然发生极端或突发事件,要是ts的取样率不够高,ts会经常错过此般事件的发生。然而,在训练机器学习模型中提高取样率是昂贵的方法。因此,要处理的第一技术问题是如何在极端或突发事件之中,从观测数据取出信息而不诉诸于提高取样率。
4、在不同的情况下,或针对不同的地理区域,使用机器学习技术来预测水质是有需要的。其需要机器学习模型架构的优化以及影响因素(或影响特征)的优化选择,所述影响因素是一组影响特征候选集合之中对该水域水质预测有关联的因素。然而,在本领域之中,ann架构以及影响特征最常被领域专家通过尝试错误法而手动调整,以避免引入无关的噪声特征。因此,当应用到不同的情况或其他的地理区域而进行精确预测的时候,水质预测的下层(underlying)机器学习模型需要被重新设计。在本公开之中,要处理的第二技术问题是如何自动地优化ann架构以及选择影响特征的一组优化的集合,而不需要手动调整。
5、在本领域之中,基于复杂设定的ts数据来使用机器学习技术,以用于预判有用的指示符(诸如水质、电力消耗以及空气质量),已经见诸于例如cn 101916335a、cn107292383a、cn 107239852a、cn106056210a以及us 7,720,615 b2。在这些文献之中,ann模型于其中仅处理ts视角上的观测数据,而未处理如何识别或侦测在短时间内所发生的极端或突发事件。此外,这些用于预测的ann模型架构以及超参数(hyperparameter)是默认值或由经验观测所决定。这些模型设定未必适合其他的情境或数据集合,而且ann模型需要为其他应用而被手动地重新设计。us 8,510,242 b2公开一种用于确定碳氢化合物储层(hydrocarbon reservoir)的相对渗透率(relative permeability)的ann模型。此外,所述的ann模型的架构是使用ga而被优化。ga是传统的元启发式演算法(meta-heuristicalgorithm),其具有固定突变策略以及控制参数。此做法可能不能广泛地普适更多的搜索环境与不同的搜索阶段。
6、本领域存在用来改善机器学习技术的需要,所述经改善的机器学习技术解决上述两个预测水质之问题。
技术实现思路
1、本案公开的是计算机实施的方法,以用于从观测数据来预测水质,據以产生所预测的水质数据,所述观测数据关联于水质预测有关的多个原始特征。
2、所述的方法包括设定ann而用于从特征数据计算所预测的水质数据,所述特征数据关联于多个影响特征。所述关联于多个影响特征的特征数据是从观测数据而被计算出来的。所述多个影响特征是可以学习的。ann的架构是可依据多个模型超参数来配置的。ann具有多个ann模型参数而用于配置ann的输入输出关系。方法更包括学习多个影响特征、多个模型超参数以及多个ann模型参数。
3、在本公开之中所公开方法的某些实施例,提供增强所述ann的技术优点,其在于捕捉因为极端或突发事件导致水质型态可能显著改变的能力。特别是,当学习多个影响特征时,个别影响特征是选自于多个影响特征候选,其包括多个基于dc的特征。单独基于dc的特征是关联于对应的原始特征,且被用于指示对应原始特征之中任何dc事件的发生。多个影响特征候选之中包含有单独基于dc特征,这就增强了ann捕捉到因为极端或突发事件导致水质型态可能显著改变的能力。
4、所述单独基于dc的特征是与不同dc阈值相关联dc阈值,所述dc阈值是用于控制对应原始特征之中任何dc事件的侦测。在某些实施例之中,关联于相同对应原始数据的多个dc特征,是关联于不同的dc阈值,所述dc阈值可提供不同dc特征给ann,使其以更有效地学习以区别不同等级严重性的极端或突发事件。
5、在某些实施例之中,多个影响特征候选更包括多个下取样原始特征。此外,所述单独基于dc特征更关联于相对应的下取样原始特征。关联于对应下取样原始特征的特征数据经由下取样而由对应观测数据所获得,所述对应观测数据是关联于对应原始特征。
6、在某些实施例之中,对应原始特征是从多个影响特征候选所排除,以使得dc特征与对应下取样的原始特征被包含到多个影响特征候选之中,增强ann捕捉因为极端或突发事件而可能显著改变水质型态的能力,同时避免ann直接处理关联于对应原始特征的特征数据。
7、在本公开之中,某些公开方法的实施例于应用本文所公开方法到水质预测的不同情况时,提供避免需要手动调整或手动调谐ann架构以及多个影响特征的技术优点。特别地,多个影响特征以及多个模型超参数被de学习,而用于最大化ann所达成的水质预测性能。因此,当应用ann到水质预测的不同情况时,致使ann架构以及多个影响特征能被自动优化而无需领域专家的手动调整。
8、优选地,学习多个影响特征、多个模型超参数以及多个ann模型参数包括:获得训练ann的训练数据集合、以及测试数据集合以验证所训练ann;设置参数搜寻空间而建议不同的影响特征候选以及不同的模型超参数选项,以使得多个影响特征候选与多个模型超参数选项从参数搜寻空间可获得,其中多个模型超参数是选自多个模型超参数选项;以及执行迭代过程。此外,迭代过程的个别迭代包括:产生对多个影响特征以及多个模型超参数两者的参数建议,其中如果个别迭代是初始迭代,则参数建议是以预置建议而被初始化或者是在参数搜寻空间中随机而被产生,否则参数建议是在突变、交换(crossover)、以及选择的基于de操作的突变策略与控制参数因为过去迭代中所进行的建议依据水质预测的历史性能被适应调整之后,通过执行参数搜寻空间之中的所述三个基于de操作而产生;依据参数建议而配置ann的架构以及输入输出关系;在ann的架构以及输入输出关系被配置之后,通过依据训练数据集合中的数据而训练ann而学习多个ann模型参数,从而获得经过训练的ann;依据测试数据集合中的数据而验证所训练ann的预测精确度,从而产生预测性能值;以及如果预测性能值收敛或预先定义的停止条件被符合,则终止迭代过程,以使得所述个别迭代之中获得的所训练ann有用于推断,否则进行执行下一个迭代。
9、优选地,突变策略以及控制参数被突变策略适应调整机制以及控制参数适应调整机制所分别适应调整,从而增强搜寻水质预测的不同情况间参数建议的效率。在突变策略适应调整机制之中,突变策略依据突变策略之间基于历史排序的性能,通过调整每一个突变策略的选择机率而适应调整。在控制参数适应调整机制之中,控制参数通过分别调整控制参数成过去迭代之中所获得的权重,成功控制参数而被适应调整。
10、优选地,迭代过程的所述个别迭代更包括通过解码演算法,而将所产生参数建议解码成多个影响特征以及多个模型超参数,以使得所解码的多个影响特征以及多个模型超参数可被ann所解读。解码演算法被配置有多个转换规则,所述多个转换规则分别用于处理多个数据类型的数据,且其中多个数据类型包含二进制数据类型、类别数据类型、整数数据类型以及实数数据类型。
11、在某些实施例之中,方法更包括:设置数据扩充模块,以用于从观测数据计算特征数据,所述特征数据关联于多个影响特征,从而用于从观测数据计算所预测水质数据的水质预测模型,通过数据扩充模块与ann的级联(cascade)而形成;以及设置sode控制器而用于学习多个影响特征以及多个模型超参数。sode控制器可与水质预测模型通讯。此外,sode控制器被安排以:执行迭代过程;在所述个别迭代执行的期间,分别发送所解码的多个模型超参数以及多个影响特征到ann以及数据扩充模块,以配置ann架构并且通知数据扩充模块,计算关联于多个影响特征的特征数据;在所述个别迭代的执行的其间,通过命令数据扩充模块处理训练数据集合中所记录观测的数据,以及通过命令ann发送所获得的预测水质数据到sode控制器而训练ann,并且在所述个别迭代的执行的期间,通过命令数据扩充模型处理测试数据集合中所记录的观测数据,以及通过命令ann发送获得的所预测水质数据到sode控制器而验证所训练ann的预测精确度。
12、在某些实施例之中,多个模型超参数被安排成提供至少ann的处理单元类型,模型整体架构等信息到ann。多个模型超参数选项包含ann处理单元类型以及模型架构的不同组合。在产生不同组合中使用的ann类型可从mlp、lstm以及gru而被选择。
13、在某些实施例之中,ann是一个模块化的神经网络,所述神经网络包括多个学习子模块和一个全连接层(dense layer)。多个学习子模块被用于处理关联于多个影响特征的特征数据。个别学习子模块被实现为分立的神经网络而用于处理特征数据,所述特征数据关联于对应影响特征,所述对应影响特征选自多个影响特征,从而产出中间特征的特征数据。全连接层被用于融合分别中间特征的特征数据而产生所预测的水质数据。个别学习子模块被mlp、lstm或gru实现。
14、在某些实施例之中,方法更包括:在ann的架构以及输入输出关系被所学习多个模型超参数以及所学习多个ann模型参数来分别配置之后,通过从观测数据计算所学习多个影响特征关联的特征数据,而从观测数据来推断所预测水质数据,且接着使用ann从所学习多个影响特征关联的所计算特征数据而来计算所预测水质数据。
15、本公开的其他方面如下文实施例所例示而被公开。
1.一种用于从多个原始数据所关联观测数据预测水质的计算机实施,从而产生所预测水质数据的方法,所述多个原始数据相关于水质预测,所述方法包括:
2.根据权利要求1所述的方法,其中:
3.根据权利要求1所述的方法,其中:
4.根据权利要求3所述的方法,其中所述对应原始特征被排除于所述多个影响特征候选,以使得所述个别基于dc特征与所述对应下取样原始特征在所述多个影响特征候选中的包含增强所述ann捕捉因为极端与突发事件的水质的可能显著改变型态的能力,同时避免所述ann直接处理关联于所述对应原始特征的特征数据。
5.根据权利要求1所述的方法,其中所述多个影响特征与所述多个模型超参数被差分进化(de)学习,以用于最大化所述ann所达成的水质预测性能,从而致能所述ann架构与所述多个影响特征被自动优化而无需领域专家在将所述ann应用到水质预测的不同情况时的手动调整。
6.根据权利要求5所述的方法,其中所述多个影响特征、所述多个模型超参数以及所述多个ann模型参数的所述学习包括:
7.根据权利要求6所述的方法,其中所述突变策略以及控制参数通过突变策略适应调整机制与控制参数适应调整机制被分别适应调整,以增强搜寻水质预测的不同情况之间的参数建议的效率,其中:
8.根据权利要求6所述的方法,其中所述迭代过程的所述个别迭代更包括:
9.根据权利要求8所述的方法,更包括:
10.根据权利要求1所述的方法,其中所述多个模型超参数被安排以提供所述ann的至少类型与大小的信息到所述ann,且所述多个模型超参数选项包含所述ann类型与所述ann大小的不同组合。
11.根据权利要求10所述的方法,其中用以产生所述不同组合的所述ann类型是被选自多层感知器(mlp)、长短期内存(lstm)以及门控循环单元(gru)。
12.根据权利要求1所述的方法,其中所述ann是模块神经网络,其包括:
13.根据权利要求12所述的方法,其中所述个别学习子模块被多层感知器(mlp)、长短期内存(lstm)或门控循环单元(gru)实现。
14.根据权利要求1所述的方法,更包括:
15.一种计算机实施的方法,用于从多个原始特征所关联观测数据预测水质,从而产生所预测水质数据,所述多个原始特征相关于水质预测,所述方法包括:
16.根据权利要求15所述的方法,其中所述多个影响特征、所述多个模型超参数以及所述多个ann模型参数的所述学习包括:
17.根据权利要求16所述的方法,其中所述突变策略以及控制参数通过突变策略适应调整机制与控制参数适应调整机制被分别适应调整,以增强搜寻水质预测的不同情况之间的参数建议的效率,其中:
18.根据权利要求16所述的方法,其中所述迭代过程的所述个别迭代更包括:
19.根据权利要求18所述的方法,更包括:
20.根据权利要求15所述的方法,更包括: