买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
摘要:本发明涉及数据清理技术领域,具体涉及一种智能门锁产品订单数据清理方法及系统。方法包括:获取历史时间段内智能门锁的订单数据,基于每个订单的门锁总价和实际支付金额,得到交易金额异常指数;根据每个订单的门锁数量与其他订单的门锁数量的差异、每个订单所对应的用户相邻两次下单的时间间隔以及每个订单所对应的用户的下单次数占比,得到交易频次异常指数;根据每个订单与其他订单所对应的用户名之间的差异和收货地址之间的差异,得到交易地址异常指数;根据交易金额异常指数、交易频次异常指数和交易地址异常指数,确定综合异常系数,进而实现对异常数据的清理。本发明提高了异常数据清理结果的准确性。
主权项:1.一种智能门锁产品订单数据清理方法,其特征在于,该方法包括以下步骤:获取历史时间段内智能门锁的订单数据,所述订单数据包括门锁总价、实际支付金额、门锁数量、下单时间、用户名、收货地址;基于每个订单的门锁总价与实际支付金额的差异确定每个订单的优惠力度;基于每个订单的门锁总价与所有订单的门锁总价的差异以及所述优惠力度,得到每个订单的交易金额异常指数;根据每个订单的门锁数量与其他订单的门锁数量的差异、每个订单所对应的用户相邻两次下单的时间间隔以及每个订单所对应的用户的下单次数占比,得到每个订单的交易频次异常指数;根据每个订单与其他订单所对应的用户名之间的差异和收货地址之间的差异,得到每个订单的交易地址异常指数;根据所述交易金额异常指数、所述交易频次异常指数和所述交易地址异常指数,确定每个订单的综合异常系数;基于所述综合异常系数筛选异常订单数据并清理;所述基于每个订单的门锁总价与所有订单的门锁总价的差异以及所述优惠力度,得到每个订单的交易金额异常指数,包括:以历史时间段内订单数据中门锁总价为横坐标,以优惠力度为纵坐标,构建商品优惠坐标图;对所述商品优惠坐标图中的数据点进行线性拟合获得拟合直线;获取所述商品优惠坐标图中各数据点与所述拟合直线之间的距离,作为各数据点对应的订单的拟合距离;根据每个订单的拟合距离与所有订单的拟合距离之间的差异、所有订单的拟合距离的标准差、每个订单的门锁总价与所有订单的门锁总价之间的差异和所有订单的门锁总价的标准差,得到每个订单的交易金额异常指数;采用如下公式计算第i个订单的交易金额异常指数: 其中,为第i个订单的交易金额异常指数,为第i个订单的拟合距离,为所有订单的拟合距离的均值,为第i个订单的门锁总价,为所有订单的门锁总价的均值,为所有订单的拟合距离的标准差,为所有订单的门锁总价的标准差,为商家的最大优惠限度,为预设第一调整参数,为预设第二调整参数,max为取最大值函数;所述根据所述交易金额异常指数、所述交易频次异常指数和所述交易地址异常指数,确定每个订单的综合异常系数,包括:对于第i个订单:根据所有订单的每类异常指数,确定第i个订单的每类异常指数的权重;其中异常指数共三类,分别为交易金额异常指数、交易频次异常指数和交易地址异常指数;基于第i个订单的每类异常指数的权重,对第i个订单的所述交易金额异常指数、第i个订单的所述交易频次异常指数和第i个订单的所述交易地址异常指数进行加权求和,获得第i个订单的综合异常系数;根据所有订单的每类异常指数,确定第i个订单的每类异常指数的权重,包括:对于任意一类异常指数:将所有订单的该类异常指数的信息熵记为第一指标;将所有订单中与第i个订单的该类异常指数相同的订单记为第i个订单的参考订单,将所有订单中除所述第i个订单的参考订单外的其他所有订单的该类异常指数的信息熵记为第二指标;将所述第一指标与所述第二指标之间的差值绝对值记为熵值差异,将所述熵值差异与所述第二指标的比值作为第i个订单的该类异常指数的参考指标;计算第i个订单的三类异常指数的参考指标的和值;分别将第i个订单的每类异常指数的参考指标与所述参考指标的和值的比值,确定为第i个订单的每类异常指数的权重。
全文数据:
权利要求:
百度查询: 江苏振通门业有限公司 一种智能门锁产品订单数据清理方法及系统
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。