Document
拖动滑块完成拼图
首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

一种基于kmeans与iForest决策异常行为的识别方法 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

申请/专利权人:青岛海智信息工程有限公司

摘要:一种基于kmeans与iForest决策异常行为的识别方法,属于数据分析识别技术领域,所述识别方法包括以下步骤:获取既定周期内电商平台的商品经营数据,所述商品经营数据包括商品名称,商品销量、商品销售额以及商品与店铺的对应关系,并存储到数据库中;对商品经营数据进行预处理,以保证数据指标缺失率处于可控范围内;建立kmeans‑iForest识别模型,结合预处理后的商品经营数据来识别存在异常经营行为的店铺。

主权项:1.一种基于kmeans与iForest决策异常行为的识别方法,其特征在于,所述识别方法包括以下步骤:S1,获取既定周期内电商平台的商品经营数据,所述商品经营数据包括商品名称,商品销量、商品销售额以及商品与店铺的对应关系,并存储到数据库中;S2,对商品经营数据进行预处理,以保证数据指标缺失率处于可控范围内;S3,建立kmeans-iForest识别模型,结合预处理后的商品经营数据来识别存在异常经营行为的店铺;建立kmeans-iForest识别模型,结合预处理后的商品经营数据来识别存在异常经营行为的店铺包括以下步骤:S3.1,利用融合粒子群算法对iForest参数进行优化,利用适应度函数评价每个粒子优劣的关键指标,确定iForest模型分类预测的准确率,完成异常值检测;S3.2,利用K-Means聚类算法对正常商品经营数据进行聚类;S3.3,利用Gapstatistic算法进行调整优化,得到最佳簇数K;所述适应度函数的粒子更新速度计算公式为: ;计算更新速度后,可以重新得出粒子的新位置: ;其中,代表当前的迭代次数,含义为第次迭代时粒子第维方向的速度,含义为粒子的当前位置,含义为所有粒子获得的全局最优位置,含义为粒子达到的局部最优位置,表示惯性权重,能够调整其寻优能力,和表示为加速常数,能够调整寻优的步长,和表示随机生成的为区间[0,1]之间的两个数,能够提升寻优过程中的随机性; 和值表示加速常数会设置在1到2之间,表示个体学习,体现了粒子对其自身历史最优位置的学习和记忆能力,较大时有利于在局部区域进行精细搜索;表示全局学习,它反映了粒子对整个种群中当前最优位置的响应程度,较大时,粒子更容易受到全局最优解的吸引,有助于全局搜索; 和在每次迭代中生成并用于计算粒子速度的更新,引入随机搜索方向,有助于跳出局部最优陷阱;另外,每个粒子在更新速度时使用的是独立生成的随机数,会造成个体间差异,有助于保持种群内部的多样性,防止粒子群过于集中于某一区域;利用K-Means聚类算法对正常商品经营数据进行聚类包括以下步骤:S3.2.1,选取初始化的个样本作为初始聚类中心;S3.2.2,针对数据集中每个样本计算它到聚类中心的距离并将其分到距离最小的聚类中心所对应的类中;S3.2.3,针对每个类别,重新计算它的聚类中心;S3.2.4,重复上述步骤S3.2.2和S3.2.3,达到终止条件;所述终止条件包括迭代达到聚类中心不再改变和设置最大迭代次数。

全文数据:

权利要求:

百度查询: 青岛海智信息工程有限公司 一种基于kmeans与iForest决策异常行为的识别方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。