一种基于多种数据采集系统的多模态数据异常检测方法

    技术2025-05-03  37


    本发明涉及多模态数据异常检测,具体为一种基于多种数据采集系统的多模态数据异常检测方法。


    背景技术:

    1、构建异常检测模型框架主要考虑的问题是如何利用上多模态数据,目前市面上主流的还是利用单独的数据进行异常检测,构建出了多模态数据融合图后引入图神经网络进行训练学习,然后利用二分类模型进行异常检测,然后在公开数据集中检测模型检测效果,验证其可行性和有效性,最后再验证随机游走根因定位算法的有效性。然后再编写系统,包含数据采集,异常检测,数据可视化模块,实时监控系统状态。

    2、目前在异常检测和根因定位方面存在一些问题:

    3、1.数据质量问题:在数据采集和存储过程中可能会受到噪声和异常数据的干扰,这可能最终会导致异常检测效果比较差。

    4、2.不足的数据聚合技术:当前国内在异常检测方面主要还是利用单一数据进行异常检测,在利用多模态数据的时候如何统一和表示异构多源数据,并为它们之间的复杂关联和相互作用建模。

    5、3.检测效果问题:目前大多数方案还是采用无监督学习方法实现异常检测,虽然微服务可观测数据指标很难获取,但还是可以有一些有指标数据,因此可以考虑使用半监督学习方法提高模型效果。

    6、4.根因定位问题:得到异常结果后,考虑使用dfs、bfs或随机游走相关算法,准确检测到前几名异常根因。

    7、鉴于此,提供一种基于多种数据采集系统的多模态数据异常检测方法以克服上述问题。


    技术实现思路

    1、本发明的目的在于提供一种基于多种数据采集系统的多模态数据异常检测方法,以解决上述背景技术中提出的问题。

    2、为解决上述技术问题,本发明提供的一种基于多种数据采集系统的多模态数据异常检测方法,包括以下步骤:

    3、s1、数据采集;

    4、s2、数据预处理;

    5、s3、多模态数据融合:将预处理后的多模态数据进行融合,构建多模态数据融合图,将不同来源、不同格式的数据统一表示,并为它们之间的复杂关联和相互作用建模;

    6、s3.1、在图融合数据的基础上,利用图神经网络学习不同模态数据之间的关联关系;

    7、s3.2、融合过程考虑数据的异构性和复杂性;

    8、s4、构建异常检测模型框架:在融合图上应用图注意力机制网络,捕捉全局序列层面上不同模态在时间和空间上的复杂相互关系;

    9、s4.1、利用二分类模型进行异常检测,针对无监督学习方法在异常检测中的局限性;

    10、s4.1.1、引入半监督学习方法,结合微服务系统的实际特点,设计合适的损失函数和优化算法;

    11、s4.1.2、考虑异常检测中时间和空间特性,设计合适的特征提取和编码方法;

    12、s5、构建根因定位模型框架:在检测到异常后,利用随机游走算法在融合图中进行根因定位;

    13、s5.1、通过对比不同根因的权重,确定前几名异常根因;

    14、s6、系统实现:编写包含数据采集、异常检测、数据可视化模块的系统;系统实时监控系统状态,将异常检测和根因定位的结果进行可视化展示,提供友好的用户界面和交互功能。

    15、进一步的,在s3.2中,考虑数据的异构性和复杂性的过程中采用合适的融合算法,包括基于注意力机制的融合算法。

    16、进一步的,在s4中,引入基于深度学习的异常检测算法、基于时间序列分析的异常检测算法;并与图注意力机制网络进行融合。

    17、进一步的,在s4中,设计一种自适应学习机制,使模型能够根据微服务系统的实时状态和数据变化自动调整参数和模型结构。

    18、进一步的,在s4.1.2中,考虑时间特性包括时序特征提取、周期性特征检测;考虑空间特性包括空间分布特征、局部与全局特征;并对特征编码;特征编码包括独热编码、嵌入编码。

    19、进一步的,使用特征选择算法来自动选择最相关的特征,周期性特征检测通过季节性分解、频谱分析方法来增强,更准确地捕获周期性模式;并在图像处理、空间数据中,将局部特征和全局特征结合。

    20、进一步的,在s5中,结合微服务系统的实际拓扑结构和依赖关系,设计合适的随机游走策略。

    21、进一步的,在s5中,设计一种交互式根因定位机制,允许运维人员与系统进行交互,提供额外的信息和反馈。

    22、与现有技术相比,本发明的有益效果是:

    23、多模态数据融合将不同来源、不同格式的数据统一表示,并建模它们之间的复杂关联和相互作用,有助于发现数据间的潜在关联和规律;利用图神经网络学习不同模态数据之间的关联关系,能够更准确地识别出异常模式。

    24、引入图注意力机制网络,能够捕捉全局序列层面上不同模态在时间和空间上的复杂相互关系,提高异常检测的准确性和敏感性;引入半监督学习方法,结合微服务系统的实际特点设计损失函数和优化算法,能够克服无监督学习方法的局限性,提高异常检测的可靠性。

    25、利用随机游走算法在融合图中进行根因定位,能够迅速定位到异常发生的根本原因,减少故障排查的时间和成本;设计交互式根因定位机制,允许运维人员与系统进行交互,提供额外的信息和反馈,进一步提高根因定位的准确性和效率。



    技术特征:

    1.一种基于多种数据采集系统的多模态数据异常检测方法,其特征在于,包括以下步骤:

    2.如权利要求1所述的一种基于多种数据采集系统的多模态数据异常检测方法,其特征在于:在s3.2中,考虑数据的异构性和复杂性的过程中采用合适的融合算法,包括基于注意力机制的融合算法。

    3.如权利要求1所述的一种基于多种数据采集系统的多模态数据异常检测方法,其特征在于:在s4中,引入基于深度学习的异常检测算法、基于时间序列分析的异常检测算法;并与图注意力机制网络进行融合。

    4.如权利要求1所述的一种基于多种数据采集系统的多模态数据异常检测方法,其特征在于:在s4中,设计一种自适应学习机制,使模型能够根据微服务系统的实时状态和数据变化自动调整参数和模型结构。

    5.如权利要求1所述的一种基于多种数据采集系统的多模态数据异常检测方法,其特征在于:在s4.1.2中,考虑时间特性包括时序特征提取、周期性特征检测;考虑空间特性包括空间分布特征、局部与全局特征;并对特征编码;特征编码包括独热编码、嵌入编码。

    6.如权利要求5所述的一种基于多种数据采集系统的多模态数据异常检测方法,其特征在于:使用特征选择算法来自动选择最相关的特征,周期性特征检测通过季节性分解、频谱分析方法来增强,更准确地捕获周期性模式;并在图像处理、空间数据中,将局部特征和全局特征结合。

    7.如权利要求1所述的一种基于多种数据采集系统的多模态数据异常检测方法,其特征在于:在s5中,结合微服务系统的实际拓扑结构和依赖关系,设计合适的随机游走策略。

    8.如权利要求1所述的一种基于多种数据采集系统的多模态数据异常检测方法,其特征在于:在s5中,设计一种交互式根因定位机制,允许运维人员与系统进行交互,提供额外的信息和反馈。


    技术总结
    本发明公开了一种基于多种数据采集系统的多模态数据异常检测方法,涉及多模态数据异常检测技术领域,包括以下步骤:S1、数据采集:通过数据采集系统,采集微服务系统中的可观测数据,包括性能指标、日志信息、网络流量;S2、数据预处理:对采集到的多模态数据进行清洗、整合和标准化处理,消除噪声和异常数据;本发明中,通过全面采集数据、多模态数据融合、优化异常检测算法和根因定位机制等手段,提高了异常检测的准确性和效率,降低了故障排查的成本和时间,为微服务系统的稳定运行提供了有力的支持,同时,系统还具备实时性、自适应性和友好的交互性,为运维人员提供了更便捷、更高效的运维工具。

    技术研发人员:程海波,程学林,吴波涛
    受保护的技术使用者:浙江大学
    技术研发日:
    技术公布日:2024/10/24
    转载请注明原文地址:https://symbian.8miu.com/read-30341.html

    最新回复(0)