本发明涉及人工智能,尤其涉及一种识别虚拟化平台用户使用行为的方法与系统。
背景技术:
1、经过多年的探索和发展,国产虚拟化平台已经形成一定的自主能力,产业和生态也逐渐健全。当前主流的国产虚拟化平台在应用场景下,对安全与审计提出了更高的要求,因此需要对运行状态进行智能识别与风险管理。如何在国产虚拟化平台上实现智能的识别风险,是国产虚拟化平台要解决的问题中,较为关键重要的工作之一。现有的运行状态安全与审计方法多采用预设模式,使用探针或内置规则对一定范围内固定的场景进行先行防控,对虚拟化平台性能与用户体验稍有影响,尚未有对用户体验无影响的行为智能识别的方法。因此,对于国产处理器虚拟化平台而言,有一套完整的、可靠的国产虚拟化平台运作状态智能识别方法装置、设备及计算机可读存储介质具有十分重要的意义。
技术实现思路
1、本发明目的在于公开一种识别虚拟化平台用户使用行为的方法与系统,以在不影响用户使用体验的情况下,精准地识别用户使用行为。
2、为达上述目的,本发明公开的识别虚拟化平台用户使用行为的方法包括:
3、采集数据,所采集数据为使用云桌面的任一c/s组合中的与传输性能有关的数据序列,任一数据序列将从客户端同步采集的cpu负载、使用内存、总流量、带宽均值和带宽峰值数据,以及从服务器端同步采集的cpu负载、使用内存、虚拟机pid的cpu占用及虚拟机pid的内存占用数据以统一的数据结构进行特征组合;
4、标记各数据序列所分别对应的类别,并在对各特征的数据进行清洗及归一化处理后,计算各特征对数据集进行分割所产生的信息增益,且在对信息增益低于设定阈值的特征进行约简后得到目标数据集;
5、基于所述目标数据集训练得到用户使用行为分类模型;
6、将实时采集的数据按历史数据集的相同方法进行预处理后输入所述用户使用行为分类模型,得到相应的分类结果并输出。
7、可选地,各数据序列所标记的类别为正常行为和非正常行为组合的二分类。
8、可选地,所述目标数据集中的各数据序列对应至少两种用户使用场景。例如:所述用户使用场景包括:未列入监控识别的正常场景、异常网络波动场景、疑似网络攻击场景、异常值画面传输场景、疑似异常操作场景、异常负载运行场景及疑似风险故障场景。
9、为达上述目的,本发明还公开一种识别虚拟化平台用户使用行为的系统,包括存储器、处理器以及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述的方法。
10、本发明具有以下有益效果:
11、1、在同一数据序列中,多维的特征数据同步采集,确保了用户行为作用在特征数据的时效一致性,进而提升了训练模型的精准度和预测结果的准确性。
12、2、在模型训练过程中,对特征进行约简,约简后的数据集及后续用于预测的实时采样数据中去除了对行为分类结果相关性不大的特征,从而使得通过降维处理提升了模型训练的效率及预测结果的实时性。
13、3、本发明需采集的系列数据都可在不影响用户使用体验的情况下便捷高效的获取,从而更容易识别出用户真实地使用行为,提升了监测过程的私密性和有效性。
14、下面将参照附图,对本发明作进一步详细的说明。
1.一种识别虚拟化平台用户使用行为的方法,其特征在于,包括:
2.根据权利要求1所述的方法,其特征在于,各数据序列所标记的类别为正常行为和非正常行为组合的二分类。
3.根据权利要求1或2所述的方法,其特征在于,所述目标数据集中的各数据序列对应至少两种用户使用场景。
4.根据权利要求3所述的方法,其特征在于,所述用户使用场景包括:
5.一种识别虚拟化平台用户使用行为的系统,包括存储器、处理器以及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现上述权利要求1至4任一所述的方法。