首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

时序人流量数据和标量标签数的融合方法及系统 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

申请/专利权人:上海分泽时代软件技术有限公司

摘要:本发明提供了一种时序人流量数据和标量标签数的融合方法及系统,包括:清洗时序数据和标签数据,获取时序访问数据和离线标签汇总数据;完成时序数据和标签数据的治理;进行时序数据特征工程;将特征工程结果数据拟合正态分布,去除预设标准值以外的数值;补充预设标准值以外的数值的空缺窗口,并构建时序数据分布曲线;将标签数据标量拟合时序数据的分布曲线,得到任意时刻的人群分布。本发明充分利用不同种类数据所特有优势来进行相互补充,完成时序特征和标量特征,标签数据和非标签数据的融合。本发明能够获得实时预测标签人群的能力,为大屏展示,业务扩展和楼宇画像等诸多场景提供数据支撑。

主权项:1.一种时序人流量数据和标量标签数的融合方法,其特征在于,包括:步骤S1:清洗时序数据和标签数据,获取时序访问数据和离线标签汇总数据;步骤S2:完成时序数据和标签数据的治理;步骤S3:进行时序数据特征工程;步骤S4:将特征工程结果数据拟合正态分布,去除预设标准值以外的数值;步骤S5:补充预设标准值以外的数值的空缺窗口,并构建时序数据分布曲线;步骤S6:将标签数据标量拟合时序数据的分布曲线,得到任意时刻的人群分布;在所述步骤S1中:清洗时序数据和标签数据,获取预设时间内的时序人员访问数据和以预设时间段为窗口的离线标签汇总数据;时序数据有人群的时间分布规律,拥有时间维度,但是不带有标签;标签数据为统计标量,没有时间属性,时间范围为预设的统计量;在所述步骤S2中:构建ETL管道,完成时序数据和标签数据的治理;治理包括数据指标的筛选和融合,时序数据需要空间距离的约束,业务范畴的约束,离线标签数据需要地理围栏做切割,需要标签选择;在所述步骤S4中:将二项差分计算结果数据拟合正态分布,完成预设的数据置信度取值,去除预设标准值以外的数值;利用正态分布曲线的置信区间完成预设标准值以外的数值的筛选,将预设标准值以外的数值剔除,对于空缺的窗口进行左右窗口平滑的补全处理,将标签数据分配到时间分布曲线中完成数据的融合。

全文数据:

权利要求:

百度查询: 上海分泽时代软件技术有限公司 时序人流量数据和标量标签数的融合方法及系统

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。