本申请涉及数据处理,具体涉及一种数据分析系统。
背景技术:
1、目前,传统的移动通信过程其本质是为基于远程无线通信网络或有线网络的信号建立数据传输的过程,在通信请求发起以及数据传输的过程中,通信数据需要经过多个无线基站或有线中转站的接收与转发,为了防止数据丢包以及通信掉话等异常情况发生,每个基站会在数据传输的过程中输出大量的监测日志数据,移动运营商通过对日志记录的实时分析可以及时捕获通话异常并分析异常原因,实现对移动网络的故障监控。同时,深入分析与挖掘日志数据,能够获取通信网络中的热点区域、热点用户以及故障集中区域,可以协助优化通信服务质量。
2、但是,庞大的数据吞吐量、复杂的数据结构以及实时性任务需求使得数据的处理变得非常困难,但实时的通信日志储存、分析对提高通信服务质量以及创造商业价值提供了机会,因此,针对通信数据大数据管理平台的设计和实现是一项潜力巨大又充满挑战的工作,传统的通信数据管理系统主要架构于基于硬盘的单机系统或分布式环境之上,由于数据储存与处理的能力有限,目前的数据处理方式主要是通过数据采样与统计,只将统计信息保存在数据库系统中,丢弃原始数据,因此,如何针对于庞大的通信数据进行数据分析,已经成为业界亟待解决的问题。
技术实现思路
1、本申请实施例提供一种数据分析系统,用以解决如何对庞大的通信数据进行数据分析的技术问题。
2、第一方面,本申请实施例提供一种数据分析系统,包括:
3、通信数据管理平台、数据分析查询系统和服务管理系统;所述通信数据管理平台和数据分析查询系统通信连接,所述服务管理系统分别与所述分析查询系统和所述通信数据管理平台连接;
4、其中,所述通信数据管理平台用于根据接收到的用户通话日志、用户网络访问日志和移动终端测量报告,生成通信指标信息,将所述通信指标信息进行分布式储存;
5、其中,所述数据分析查询系统用于进行区域热点分析、区域故障统计分析、用户故障投诉分析、通话详单查询;
6、其中,所述服务管理系统用于实现服务请求的接收,服务请求处理和服务请求响应,系统配置文件的读取,以及其它服务进程的同步通知。
7、在一个实施例中,所述通信数据管理平台包括:数据处理模块、分布式文件储存系统、数据分析查询模块和实时定位查询模块;所述分布式文件储存系统分别与所述数据处理模块、数据分析查询模块和实时定位查询模块连接;所述数据处理模块、数据分析查询模块和实时定位查询模块均与所述数据分析查询系统连接;
8、其中,所述数据处理模块用于根据接收到的用户通话日志、用户网络访问日志和移动终端测量报告,生成通信指标信息,将所述通信指标信息传输到所述分布式文件储存系统进行数据储存;
9、其中,所述数据分析查询模块用于从多个维度对所述分布式文件储存系统储存的数据进行数据分组、汇总、排序等复杂逻辑操作,并向所述分布式文件储存系统反馈数据分析结果;
10、其中,所述实时定位查询模块用于根据数据筛选条件,从所述分布式文件储存系统储存的数据中定位目标信息;
11、其中,所述数据分析查询系统用于进行区域热点分析、区域故障统计、用户故障投诉分析和通话详单查询。
12、在一个实施例中,所述数据处理模块包括:数据拼接单元和指标计算单元,所述指标计算单元分别与所述数据拼接单元和所述分布式文件储存系统连接;
13、其中,所述数据拼接单元用于接收所述用户通话日志、用户网络访问日志和移动终端测量报告,并按照数据间的预设关联规则进行拼接,得到完成拼接的完整用户通话记录;
14、其中,所述指标计算单元用于提取所述完整用户通话记录中的指标字段,并根据运算规则,生成新字段及对应值,得到通信指标信息。
15、在一个实施例中,所述数据分析查询系统,包括:区域热点分析模块、区域故障统计模块、用户故障投诉模块和通话详单查询模块;所述区域热点分析模块、区域故障统计模块与所述数据分析查询模块连接,所述用户故障投诉模块和通话详单查询模块与所述实时定位查询模块连接。
16、在一个实施例中,所述服务管理系统包括:服务请求与处理模块、通知与处理模块和配置管理模块;
17、其中,所述服务请求与处理模块用于同步,通知与处理模块和配置管理模块,所述服务请求与处理模块负责服务请求的接收,服务请求处理和服务请求响应;
18、其中,所述同步通知与处理模块负责接收来自其他服务进程的同步通知,并进行处理;
19、其中,所述配置管理模块读取系统配置文件,配置分为静态配置内容和动态配置内容。
20、在一个实施例中,所述用户通话日志记录了移动终端用户在呼叫过程中的相关信息,数据由呼叫所经过的通讯中转站与通讯基站记录并输出,所述用户网络访问日志是用户使用无线网络数据业务时通过无线网络传输的数据,所述移动终端测量报告是由移动终端测量并通过通讯中转站整理输出的无线测量信息。
21、在一个实施例中,所述分布式文件储存系统以分布式文件系统为底层文件系统,parquet作为文件储存格式,并使用thrift格式进行网络通信数据的传输。
22、在一个实施例中,所述分布式文件储存还包含hbase数据库所生成的索引表。
23、在一个实施例中,所述用户通话日志包括:用户通过移动终端在呼叫过程中产生的信息,所述信息由呼叫所经过的通讯中转站与通讯基站记录并输出。
24、在一个实施例中,所述用户网络访问日志包括:用户使用无线网络数据业务时通过无线网络传输的数据。
25、本申请实施例提供的数据分析系统,针对通信数据处理中存在的数据高吞吐量、结构复杂、时序混乱以及查询业务的高实时性、运算密集等特点,采用通信数据管理平台根据接收到的用户通话日志、用户网络访问日志和移动终端测量报告,生成通信指标信息,将所述通信指标信息进行分布式储存,并且通过数据分析查询系统可以实现区域热点分析、区域故障统计分析、用户故障投诉分析、通话详单查询等功能,通过服务管理系统可以实现服务请求的接收,服务请求处理和服务请求响应,系统配置文件的读取,以及其它服务进程的同步通知,通过对通信数据处理中存在的数据高吞吐量、结构复杂、时序混乱以及查询业务的高实时性、运算密集等特点,提出基于当前的分布式技术,设计和实现高效通信数据管理平台,支持数据的高效储存、近实时查询处理以及动态业务模型生成,基于分布式平台与分布式计算模式结合内存技术支持大数据处理而且能够提升实时查询的性能。
1.一种数据分析系统,其特征在于,包括:通信数据管理平台、数据分析查询系统和服务管理系统;所述通信数据管理平台和数据分析查询系统通信连接,所述服务管理系统分别与所述数据分析查询系统和所述通信数据管理平台连接;
2.根据权利要求1所述的数据分析系统,其特征在于,所述通信数据管理平台包括:数据处理模块、分布式文件储存系统、数据分析查询模块和实时定位查询模块;所述分布式文件储存系统分别与所述数据处理模块、数据分析查询模块和实时定位查询模块连接;所述数据处理模块、数据分析查询模块和实时定位查询模块均与所述数据分析查询系统连接;
3.根据权利要求2所述的数据分析系统,其特征在于,所述数据处理模块包括:数据拼接单元和指标计算单元,所述指标计算单元分别与所述数据拼接单元和所述分布式文件储存系统连接;
4.根据权利要求2所述的数据分析系统,其特征在于,所述数据分析查询系统,包括:区域热点分析模块、区域故障统计模块、用户故障投诉模块和通话详单查询模块;所述区域热点分析模块、区域故障统计模块与所述数据分析查询模块连接,所述用户故障投诉模块和通话详单查询模块与所述实时定位查询模块连接。
5.根据权利要求1所述的数据分析系统,其特征在于,所述服务管理系统包括:服务请求与处理模块、通知与处理模块和配置管理模块;
6.根据权利要求1所述的数据分析系统,其特征在于,所述用户通话日志记录了移动终端用户在呼叫过程中的相关信息,数据由呼叫所经过的通讯中转站与通讯基站记录并输出,所述用户网络访问日志是用户使用无线网络数据业务时通过无线网络传输的数据,所述移动终端测量报告是由移动终端测量并通过通讯中转站整理输出的无线测量信息。
7.根据权利要求2所述的数据分析系统,其特征在于,所述分布式文件储存系统以分布式文件系统为底层文件系统,parquet作为文件储存格式,并使用thrift格式进行网络通信数据的传输。
8.根据权利要求2所述的数据分析系统,其特征在于,所述分布式文件储存还包含hbase数据库所生成的索引表。
9.根据权利要求1所述的数据分析系统,其特征在于,所述用户通话日志包括:用户通过移动终端在呼叫过程中产生的信息,所述信息由呼叫所经过的通讯中转站与通讯基站记录并输出。
10.根据权利要求1所述的数据分析系统,其特征在于,所述用户网络访问日志包括:用户使用无线网络数据业务时通过无线网络传输的数据。