买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
摘要:本发明提供一种对消费场景进行分类的方法和装置,该方法包括:获取归类后各类别下的数据信息;数据信息包括:场景名称、场景类型、省份、城市和地址;对所述数据信息进行数据预处理;将预处理后的数据信息存储至数据库内;获取当前用户消费的收货地址;将数据库内存储的预处理后的数据信息的地址信息,与用户消费的收货地址进行文本匹配,确定当前用户消费的收货地址所属的消费场景类别。本方案无需改变业务流程,用户只需要按正常业务流程填写收货地址,即可实现了对用户无感知的用酒场景行为分析,从而运营人员可以改进服务流程,分析用户需求和调整经营策略。
主权项:1.一种对消费场景进行分类的方法,其特征在于,所述方法包括:获取归类后各类别下的数据信息;数据信息包括:场景名称、场景类型、省份、城市和地址;对所述数据信息进行数据预处理;将预处理后的数据信息存储至数据库内;获取当前用户消费的收货地址;将数据库内存储的预处理后的数据信息的地址信息,与用户消费的收货地址进行文本匹配,确定当前用户消费的收货地址所属的消费场景类别;对所述数据信息进行数据预处理包括:对所述数据信息进行数据结构化和数据清洗,得到处理后的数据信息;调用地图接口对处理后的数据信息内的地址信息增加经纬度数据;所述将数据库内存储的预处理后的数据信息的地址信息,与用户消费的收货地址进行文本匹配包括:利用正则语句和最长公共子串算法对所述收货地址进行场景类别的匹配;若匹配失败,则选取正则语句和最长公共子串算法匹配得分大于预设阈值的文本作为训练样本;利用TF-IDF对所述训练样本中的地址文本进行拆分和提取;将提取后的文本输入xgboost模型进行训练,输出训练结果;所述利用TF-IDF对所述训练样本中的地址文本进行拆分和提取包括:利用TF-IDF对所述训练样本中的地址文本进行分词处理;根据各场景类别赋予地址文本内词语的权重,提取出满足预设权重阈值的词语。
全文数据:
权利要求:
百度查询: 上加下信息技术成都有限公司 对消费场景进行分类的方法和装置
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。