买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
申请/专利权人:武汉烽火众智数字技术有限责任公司
摘要:本发明提供了一种基于大数据的外地人员流窜作案分析方法及系统,该方法包括以下步骤:获取本地部署的各电子围栏设备采集的手机特征数据并存储在大数据平台;从大数据平台中提取一个时间周期采集的手机特征数据,分析人员出现的天数,得到本地常住居民结果集;选择流窜分析区域内的电子围栏设备得到目标电子围栏设备;检索出目标电子围栏设备在预设排查时间段内采集到的各个手机特征数据组成特征数据集,将特征数据集与本地常住居民结果集进行碰撞比对,得到单流窜区域结果集;将多个单流窜区域结果集进行数据比对,得到多流窜区域碰撞结果集。本发明有效的解决多地流窜作案嫌疑目标的身份认定和明确的问题,极大降低警务人员工作成本及时间成本。
主权项:1.一种基于大数据的外地人员流窜作案分析方法,其特征在于,包括以下步骤:S1,获取本地部署的各电子围栏设备采集的手机特征数据并存储在大数据平台;所述步骤S1中,将手机特征数据以“时间-采集设备-特征码”为行,以“时间-采集设备-特征信息”为列,建立特征数据序列存储于Hbase数据库,并将手机特征数据存储到全文搜索引擎elasticsearch中;S2,从大数据平台中提取一个时间周期采集的手机特征数据,分析人员出现的天数,若出现天数与时间周期的比值大于一定值则判断该人员为本地常住居民,各本地常住居民的手机特征数据组成本地常住居民结果集;S3,获取流窜分析区域,选择流窜分析区域内的电子围栏设备得到目标电子围栏设备;S4,预设排查时间段,检索出目标电子围栏设备在该排查时间段内采集到的各个手机特征数据组成特征数据集,将特征数据集与本地常住居民结果集进行碰撞比对,排除本地常住居民结果集中的手机特征数据,剩余的手机特征数据构成单流窜区域结果集;所述步骤S4具体包括:S401、根据选择的目标电子围栏设备和预设的排查时间段,通过大数据全文检索引擎elasticsearch,检索出符合条件的数据构成特征数据集;S402、将本地常住居民结果集放到布隆过滤器中,循环判断步骤S401检索出来的特征数据集中的数据是否存在于布隆过滤器中,若存在则直接将该条数据从特征数据集中删除;S5,将多个单流窜区域结果集进行数据比对,选出在至少两个单流窜区域结果集中出现的手机特征数据构成多流窜区域碰撞结果集。
全文数据:基于大数据的外地人员流窜作案分析方法及系统技术领域本发明涉及公安侦查破案领域,尤其涉及一种基于大数据的外地人员流窜作案分析方法及系统。背景技术当前刑事犯罪处于高发态势,犯罪涉及多时空、多区域。犯罪行为人利用车辆快速作案、快速逃离、跨区域等特点作案,给侦查部门带来了巨大的挑战。传统的侦查手段已不能适应当前高效率、高质量打击刑事犯罪的要求。近年来,侦查机关应利用现代信息技术变革侦查模式,拓展侦查思维,转变侦查观念,创新侦查方法,建设电子围栏设备,在打击破案方面发挥了重要作用。这些采集设备采集到大量数据,然而这些数据大量都是无效的,如何在这些数据中找出对于破案有用的线索、快速定位到嫌疑目标,提高排查效率,特别是利用这些数据对外地人员流窜作案进行分析成为亟待解决的问题。发明内容本发明的目的在于提供一种基于大数据的外地人员流窜作案分析方法及系统,旨在用于解决现有技术无法利用采集设备采集到的大量数据对外地人员流窜作案进行分析的问题。本发明是这样实现的:一方面,本发明提供一种基于大数据的外地人员流窜作案分析方法,包括以下步骤:S1,获取本地部署的各电子围栏设备采集的手机特征数据并存储在大数据平台;S2,从大数据平台中提取一个时间周期采集的手机特征数据,分析人员出现的天数,若出现天数与时间周期的比值大于一定值则判断该人员为本地常住居民,各本地常住居民的手机特征数据组成本地常住居民结果集;S3,获取流窜分析区域,选择流窜分析区域内的电子围栏设备得到目标电子围栏设备;S4,预设排查时间段,检索出目标电子围栏设备在该排查时间段内采集到的各个手机特征数据组成特征数据集,将特征数据集与本地常住居民结果集进行碰撞比对,排除本地常住居民结果集中的手机特征数据,剩余的手机特征数据构成单流窜区域结果集;S5,将多个单流窜区域结果集进行数据比对,选出在至少两个单流窜区域结果集中出现的手机特征数据构成多流窜区域碰撞结果集。进一步地,所述步骤S1中,将手机特征数据以“时间-采集设备-特征码”为行,以“时间-采集设备-特征信息”为列,建立特征数据序列存储于Hbase数据库,并将手机特征数据存储到全文搜索引擎elasticsearch中。进一步地,所述步骤S2中,通过MapReduce算法模型对手机特征数据进行聚合,按手机特征数据中特征码进行分组,以电子围栏设备采集时间由大到小排序来进行聚合,然后通过大数据impala实时分析组件,统计各特征码出现的天数即为对应人员出现的天数。进一步地,所述步骤S2之后还包括:将得到的本地常住居民结果集的成员数量与本地的实际常住居民总数对比,若差异较大,则延长所述时间周期重新分析得出本地常住居民结果集。进一步地,所述步骤S3中,设置目标电子围栏设备数量的最小值,只有在获取的目标电子围栏设备的数量不少于所述最小值时,才进行后续分析过程,否则加大所选的流窜分析区域的范围,重新获取所述目标电子围栏设备。进一步地,所述步骤S4具体包括:S401、根据选择的目标电子围栏设备和预设的排查时间段,通过大数据全文检索引擎elasticsearch,检索出符合条件的数据构成特征数据集;S402、将本地常住居民结果集放到布隆过滤器中,循环判断步骤S401检索出来的特征数据集中的数据是否存在于布隆过滤器中,若存在则直接将该条数据从特征数据集中删除。进一步地,所述步骤S5具体包括:将多个单流窜区域结果集逐个放到哈希表中,如果某个手机特征数据发生碰撞则统计加1,最后从哈希表取出统计数大于1的手机特征数据构成嫌疑目标集。另一方面,本发明还提供一种基于大数据的外地人员流窜作案分析系统,包括数据获取模块、本地常住居民分析模块、目标电子围栏设备获取模块、单流窜区域结果分析模块以及多流窜区域结果分析模块;所述数据获取模块用于获取本地部署的各电子围栏设备采集的手机特征数据并存储在大数据平台;所述本地常住居民分析模块用于从大数据平台中提取一个时间周期采集的手机特征数据,分析人员出现的天数,若出现天数与时间周期的比值大于一定值则判断该人员为本地常住居民,各本地常住居民的手机特征数据组成本地常住居民结果集;所述目标电子围栏设备获取模块用于获取流窜分析区域,选择流窜分析区域内的电子围栏设备得到目标电子围栏设备;所述单流窜区域结果分析模块用于预设排查时间段,检索出目标电子围栏设备在该排查时间段内采集到的各个手机特征数据组成特征数据集,将特征数据集与本地常住居民结果集进行碰撞比对,排除本地常住居民结果集中的手机特征数据,剩余的手机特征数据构成单流窜区域结果集;所述多流窜区域结果分析模块用于将多个单流窜区域结果集进行数据比对,选出在至少两个单流窜区域结果集中出现的手机特征数据构成多流窜区域碰撞结果集。进一步地,所述数据获取模块将手机特征数据以“时间-采集设备-特征码”为行,以“时间-采集设备-特征信息”为列,建立特征数据序列存储于Hbase数据库,并将手机特征数据存储到全文搜索引擎elasticsearch中。进一步地,所述本地常住居民分析模块通过MapReduce算法模型对手机特征数据进行聚合,按手机特征数据中特征码进行分组,以电子围栏设备采集时间由大到小排序来进行聚合,然后通过大数据impala实时分析组件,统计各特征码出现的天数即为对应人员出现的天数。与现有技术相比,本发明具有以下有益效果:本发明提供的这种基于大数据的外地人员流窜作案分析方法及系统,对本地电子围栏设备采集的数据进行分析,得到本地常住居民结果集,对流窜分析区域的目标电子围栏设备采集的手机特征数据分析,通过多流窜区域的手机特征数据碰撞,在排除本地常住居民的情况下,得到作案嫌疑人的手机特征数据,在辅助其他公安技术手段明确目标身份,有效的解决多地流窜作案嫌疑目标的身份认定和明确的问题,极大降低警务人员工作成本及时间成本。附图说明图1为本发明实施例提供的一种基于大数据的外地人员流窜作案分析方法的流程图;图2为本发明实施例提供的一种基于大数据的外地人员流窜作案分析系统的方框图。具体实施方式下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其它实施例,都属于本发明保护的范围。如图1所示,本发明实施例提供一种基于大数据的外地人员流窜作案分析方法,包括以下步骤:S1,获取本地部署的各电子围栏设备采集的手机特征数据并存储在大数据平台;S2,从大数据平台中提取一个时间周期采集的手机特征数据,分析人员出现的天数,若出现天数与时间周期的比值大于一定值则判断该人员为本地常住居民,各本地常住居民的手机特征数据组成本地常住居民结果集;S3,获取流窜分析区域,选择流窜分析区域内的电子围栏设备得到目标电子围栏设备;S4,预设排查时间段,检索出目标电子围栏设备在该排查时间段内采集到的各个手机特征数据组成特征数据集,将特征数据集与本地常住居民结果集进行碰撞比对,排除本地常住居民结果集中的手机特征数据,剩余的手机特征数据构成单流窜区域结果集;S5,将多个单流窜区域结果集进行数据比对,选出在至少两个单流窜区域结果集中出现的手机特征数据构成多流窜区域碰撞结果集。本发明的技术方案对本地电子围栏设备采集的数据进行分析,得到本地常住居民结果集,对流窜分析区域的目标电子围栏设备采集的手机特征数据分析,通过多流窜区域的手机特征数据碰撞,在排除本地常住居民的情况下,得到作案嫌疑人的手机特征数据,在辅助其他公安技术手段明确目标身份,有效的解决多地流窜作案嫌疑目标的身份认定和明确的问题,极大降低警务人员工作成本及时间成本。下面对上述各步骤进行详细说明。在一个实施例中,所述步骤S1中,首先,在各地基于圈块格点布点理念部署电子围栏设备,用于采集手机特征数据,电子围栏设备包括用于采集手机MAC的WIFI围栏、用于采集手机IMEI或IMSI的电子围栏等。各个地方均获取本地部署的各电子围栏设备采集的手机特征数据并存储在大数据平台,供后续分析使用。本实施例中,将手机特征数据以“时间-采集设备-特征码”为行,以“时间-采集设备-特征信息”为列,建立特征数据序列存储于Hbase数据库,并将手机特征数据存储到全文搜索引擎elasticsearch中。在一个实施例中,所述步骤S2中,为了提高分析效率及准确性,本实施实例中以30天为时间周期,若人员出现的天数大于时间周期的三分之二,即大于20天,则可判定该人员为本地常住居民。本实施例分析人员出现天数的具体方法为:通过MapReduce算法模型对手机特征数据进行聚合,按手机特征数据中特征码进行分组,以电子围栏设备采集时间由大到小排序来进行聚合,然后通过大数据impala实时分析组件,统计各特征码出现的天数即为对应人员在本地出现的天数。优选地,还将得到的本地常住居民结果集的成员数量与本地的实际常住居民总数对比,若差异较小,则说明该特征结果集正常,若差异较大,则延长所述时间周期以扩大数据分析量,重新分析得出本地常住居民结果集,保证本地常住居民结果集的准确性。在一个实施例中,所述步骤S3中,流窜分析区域可以由用户直接在地图上进行自定义绘制,也可以由系统软件自动分析获取,流窜分析区域可以选择与目标案件同类型案件的案发地点周围一定区域。优选地,还设置目标电子围栏设备数量的最小值,可以设置为1,只有在获取的目标电子围栏设备的数量不少于所述最小值时,才进行后续分析过程,否则加大所选的流窜分析区域的范围,重新获取所述目标电子围栏设备。在一个实施例中,所述步骤S4具体包括:S401、根据选择的目标电子围栏设备和预设的排查时间段,通过大数据全文检索引擎elasticsearch,检索出符合条件的数据构成特征数据集,并以采集设备由大到小进行排序;S402、将本地常住居民结果集放到布隆过滤器中,循环判断步骤S401检索出来的特征数据集中的数据是否存在于布隆过滤器中,若存在则直接将该条数据从特征数据集中删除,特征数据集中最后剩余的手机特征数据构成单流窜区域结果集,单流窜区域结果集表示在预设时间段内在流窜分析区域出现的外地人员。在一个实施例中,所述步骤S5具体包括:将多个单流窜区域结果集逐个放到哈希表中,如果某个手机特征数据发生碰撞则统计加1,最后从哈希表取出统计数大于1的手机特征数据构成多流窜区域碰撞结果集,多流窜区域碰撞结果集表示至少在两个流窜分析区域出现的外地人员,这些人员即为流窜作案的嫌疑目标,最后再根据多流窜区域碰撞结果集中的手机特征数据排查流窜作案嫌疑目标。本发明实施例首先以天为单位,提取所有电子围栏设备采集的手机特征数据。然后对所有的特征数据进行分析、挖掘,以特征码为维度进行计算、聚合、统计,利用Hbase列式数据库列可以无限扩展的特点,将特征数据按特征码为主键存储于Hbase中,再通过选择区域和时间检索出单区域特征数据,通过布隆过滤器排除本地常住居民,然后再利用哈希表进行多区域嫌疑目标碰撞,计算流窜作案的嫌疑目标。本发明基于大数据的分布式集群计算模式,避免了计算时服务器内存的限制,同时列式数据库Hbase能很好的解决数据库字段数量的约束,利用impala实时计算组件,省掉了大量的IO开销。在此基础上,在辅助其他公安技术手段明确目标身份,有效的解决多地流窜作案嫌疑目标的身份认定和明确的问题,极大降低警务人员工作成本及时间成本。基于同一发明构思,本发明实施例还提供一种基于大数据的外地人员流窜作案分析系统,由于该系统解决技术问题的原理与上述一种基于大数据的外地人员流窜作案分析方法解决技术问题的原理类似,因此该系统的实施可以参照上述方法的实施,重复之处不再赘述。如图2所示,为本发明实施例提供的一种基于大数据的外地人员流窜作案分析系统,用于执行上述方法实施例,该系统包括数据获取模块11、本地常住居民分析模块12、目标电子围栏设备获取模块13、单流窜区域结果分析模块14以及多流窜区域结果分析模块15;所述数据获取模块11用于获取本地部署的各电子围栏设备采集的手机特征数据并存储在大数据平台;所述本地常住居民分析模块12用于从大数据平台中提取一个时间周期采集的手机特征数据,分析人员出现的天数,若出现天数与时间周期的比值大于一定值则判断该人员为本地常住居民,各本地常住居民的手机特征数据组成本地常住居民结果集;所述目标电子围栏设备获取模块13用于获取流窜分析区域,选择流窜分析区域内的电子围栏设备得到目标电子围栏设备;所述单流窜区域结果分析模块14用于预设排查时间段,检索出目标电子围栏设备在该排查时间段内采集到的各个手机特征数据组成特征数据集,将特征数据集与本地常住居民结果集进行碰撞比对,排除本地常住居民结果集中的手机特征数据,剩余的手机特征数据构成单流窜区域结果集;所述多流窜区域结果分析模块15用于将多个单流窜区域结果集进行数据比对,选出在至少两个单流窜区域结果集中出现的手机特征数据构成多流窜区域碰撞结果集。在一个实施例中,所述数据获取模块11将手机特征数据以“时间-采集设备-特征码”为行,以“时间-采集设备-特征信息”为列,建立特征数据序列存储于Hbase数据库,并将手机特征数据存储到全文搜索引擎elasticsearch中。在一个实施例中,所述本地常住居民分析模块12通过MapReduce算法模型对手机特征数据进行聚合,按手机特征数据中特征码进行分组,以电子围栏设备采集时间由大到小排序来进行聚合,然后通过大数据impala实时分析组件,统计各特征码出现的天数即为对应人员出现的天数。在一个实施例中,所述本地常住居民分析模块12还用于将得到的本地常住居民结果集的成员数量与本地的实际常住居民总数对比,若差异较大,则延长所述时间周期重新分析得出本地常住居民结果集。在一个实施例中,所述目标电子围栏设备获取模块13还用于设置目标电子围栏设备数量的最小值,只有在获取的目标电子围栏设备的数量不少于所述最小值时,才进行后续分析过程,否则加大所选的流窜分析区域的范围,重新获取所述目标电子围栏设备。在一个实施例中,所述单流窜区域结果分析模块14具体用于:根据选择的目标电子围栏设备和预设的排查时间段,通过大数据全文检索引擎elasticsearch,检索出符合条件的数据构成特征数据集;将本地常住居民结果集放到布隆过滤器中,循环判断步骤S401检索出来的特征数据集中的数据是否存在于布隆过滤器中,若存在则直接将该条数据从特征数据集中删除。在一个实施例中,所述多流窜区域结果分析模块15具体用于:将多个单流窜区域结果集逐个放到哈希表中,如果某个手机特征数据发生碰撞则统计加1,最后从哈希表取出统计数大于1的手机特征数据构成嫌疑目标集。本领域普通技术人员可以理解实施例的各种方法中的全部或部分步骤是可以通过程序来指令相关的硬件来完成,该程序可以存储于一计算机可读存储介质中,存储介质可以包括:只读存储器ROM,ReadOnlyMemory、随机存取存储器RAM,RandomAccessMemory、磁盘或光盘等。以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
权利要求:1.一种基于大数据的外地人员流窜作案分析方法,其特征在于,包括以下步骤:S1,获取本地部署的各电子围栏设备采集的手机特征数据并存储在大数据平台;S2,从大数据平台中提取一个时间周期采集的手机特征数据,分析人员出现的天数,若出现天数与时间周期的比值大于一定值则判断该人员为本地常住居民,各本地常住居民的手机特征数据组成本地常住居民结果集;S3,获取流窜分析区域,选择流窜分析区域内的电子围栏设备得到目标电子围栏设备;S4,预设排查时间段,检索出目标电子围栏设备在该排查时间段内采集到的各个手机特征数据组成特征数据集,将特征数据集与本地常住居民结果集进行碰撞比对,排除本地常住居民结果集中的手机特征数据,剩余的手机特征数据构成单流窜区域结果集;S5,将多个单流窜区域结果集进行数据比对,选出在至少两个单流窜区域结果集中出现的手机特征数据构成多流窜区域碰撞结果集。2.如权利要求1所述的基于大数据的外地人员流窜作案分析方法,其特征在于:所述步骤S1中,将手机特征数据以“时间-采集设备-特征码”为行,以“时间-采集设备-特征信息”为列,建立特征数据序列存储于Hbase数据库,并将手机特征数据存储到全文搜索引擎elasticsearch中。3.如权利要求1所述的基于大数据的外地人员流窜作案分析方法,其特征在于:所述步骤S2中,通过MapReduce算法模型对手机特征数据进行聚合,按手机特征数据中特征码进行分组,以电子围栏设备采集时间由大到小排序来进行聚合,然后通过大数据impala实时分析组件,统计各特征码出现的天数即为对应人员出现的天数。4.如权利要求1所述的基于大数据的外地人员流窜作案分析方法,其特征在于,所述步骤S2之后还包括:将得到的本地常住居民结果集的成员数量与本地的实际常住居民总数对比,若差异较大,则延长所述时间周期重新分析得出本地常住居民结果集。5.如权利要求1所述的基于大数据的外地人员流窜作案分析方法,其特征在于:所述步骤S3中,设置目标电子围栏设备数量的最小值,只有在获取的目标电子围栏设备的数量不少于所述最小值时,才进行后续分析过程,否则加大所选的流窜分析区域的范围,重新获取所述目标电子围栏设备。6.如权利要求1所述的基于大数据的外地人员流窜作案分析方法,其特征在于,所述步骤S4具体包括:S401、根据选择的目标电子围栏设备和预设的排查时间段,通过大数据全文检索引擎elasticsearch,检索出符合条件的数据构成特征数据集;S402、将本地常住居民结果集放到布隆过滤器中,循环判断步骤S401检索出来的特征数据集中的数据是否存在于布隆过滤器中,若存在则直接将该条数据从特征数据集中删除。7.如权利要求1所述的基于大数据的外地人员流窜作案分析方法,其特征在于,所述步骤S5具体包括:将多个单流窜区域结果集逐个放到哈希表中,如果某个手机特征数据发生碰撞则统计加1,最后从哈希表取出统计数大于1的手机特征数据构成嫌疑目标集。8.一种基于大数据的外地人员流窜作案分析系统,其特征在于:包括数据获取模块、本地常住居民分析模块、目标电子围栏设备获取模块、单流窜区域结果分析模块以及多流窜区域结果分析模块;所述数据获取模块用于获取本地部署的各电子围栏设备采集的手机特征数据并存储在大数据平台;所述本地常住居民分析模块用于从大数据平台中提取一个时间周期采集的手机特征数据,分析人员出现的天数,若出现天数与时间周期的比值大于一定值则判断该人员为本地常住居民,各本地常住居民的手机特征数据组成本地常住居民结果集;所述目标电子围栏设备获取模块用于获取流窜分析区域,选择流窜分析区域内的电子围栏设备得到目标电子围栏设备;所述单流窜区域结果分析模块用于预设排查时间段,检索出目标电子围栏设备在该排查时间段内采集到的各个手机特征数据组成特征数据集,将特征数据集与本地常住居民结果集进行碰撞比对,排除本地常住居民结果集中的手机特征数据,剩余的手机特征数据构成单流窜区域结果集;所述多流窜区域结果分析模块用于将多个单流窜区域结果集进行数据比对,选出在至少两个单流窜区域结果集中出现的手机特征数据构成多流窜区域碰撞结果集。9.如权利要求8所述的基于大数据的外地人员流窜作案分析系统,其特征在于:所述数据获取模块将手机特征数据以“时间-采集设备-特征码”为行,以“时间-采集设备-特征信息”为列,建立特征数据序列存储于Hbase数据库,并将手机特征数据存储到全文搜索引擎elasticsearch中。10.如权利要求8所述的基于大数据的外地人员流窜作案分析方法,其特征在于:所述本地常住居民分析模块通过MapReduce算法模型对手机特征数据进行聚合,按手机特征数据中特征码进行分组,以电子围栏设备采集时间由大到小排序来进行聚合,然后通过大数据impala实时分析组件,统计各特征码出现的天数即为对应人员出现的天数。
百度查询: 武汉烽火众智数字技术有限责任公司 基于大数据的外地人员流窜作案分析方法及系统
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。