买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
申请/专利权人:越亮传奇科技股份有限公司
摘要:本发明实施例涉及数据处理技术领域,公开了一种基于大数据的流量话单分析方法、装置、设备及存储介质。该方法包括:对所述流量话单的数据源进行采集,获取流量话单数据;对所述流量话单数据进行预分析;所述预分析包括:通过Flume分布式集群同时处理多个Source和Sink;对所述预分析后的数据进行实时或离线分析。实施本发明实施例,可以使得这些数据在处理能力提升的同时还提高了数据的精准度。
主权项:1.一种基于大数据的流量话单分析方法,其特征在于,包括:对所述流量话单的数据源进行采集,获取流量话单数据;对所述流量话单数据进行预分析;所述预分析包括:通过Flume分布式集群同时处理多个Source和Sink,Source由Flume转化为数据流,通过Flume的Filechannel保证所有话单数据写入磁盘,Sink进行话单批次处理,并把批次数据保存到Zookeeper集群;Sink还把原始话单写入Hadoop集群,保存到HDFS的分布式文件系统;对所述预分析后的数据进行实时或离线分析;对所述预分析后的数据进行实时分析包括:对保存到Zookeeper集群的批次数据进行实时计算分析,实时计算是根据批次号来判断是否重复计算,每个批次的数据都处理完了才进行下一个批次的数据处理;对所述预分析后的数据进行离线分析包括:采用HadoopMapReduce,针对预分析后存储于HDFS分布式文件系统中的数据进行离线分析,主要处理一次批量同步的数据以及较长时间间隔才清洗计算一次的大数据;离线分析完成后,将分析后的话单流量结果数据同步到MongoDB中进行缓存。
全文数据:
权利要求:
百度查询: 越亮传奇科技股份有限公司 基于大数据的流量话单分析方法、装置、设备及存储介质
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。