首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

无监督聚类方法、装置、电子设备及介质 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

申请/专利权人:平安科技(深圳)有限公司

摘要:本发明涉及人工智能技术领域,揭露一种无监督聚类方法,包括:获取待聚类数据集,转化为数据点集;在数据点集中选取第一聚类中心,根据欧式距离从数据点集中获取异常噪声点集,并将不满足预设数据规则的噪声数据点剔除,得到去噪数据点集;为去噪数据点集随机设置第二聚类中心,利用第二聚类中心将去噪数据点重新划分数据类,得到多个聚类数据子集;根据多个聚类数据子集重新计算去噪数据点集的聚类中心,直至去噪数据点集的聚类中心满足预设条件,得到最终聚类数据。本发明还提出一种无监督聚类装置、设备及存储介质。本发明还涉及区块链技术,所述待聚类数据集可存储于区块链节点中。本发明可以提高数据聚类的准确性。

主权项:1.一种无监督聚类方法,其特征在于,所述方法包括:获取待聚类数据集,获取所述待聚类数据集中待聚类数据的数据类型,并根据所述数据类型将所述待聚类数据集中的待聚类数据映射至平面坐标系,得到所述数据点集,所述数据类型为所述待聚类数据所属的数据类别,包括文本数据或图像数据;在所述数据点集中选取第一聚类中心,计算所述数据点集中各个数据点到所述第一聚类中心的欧式距离,并根据所述欧式距离从所述数据点集中获取异常噪声点集,所述第一聚类中心有且只有一个;将所述异常噪声点集中不满足预设数据规则的噪声数据点剔除,得到去噪数据点集;为所述去噪数据点集随机设置至少两个第二聚类中心,利用所述第二聚类中心将所述去噪数据点集中的各个去噪数据点重新划分数据类,得到多个聚类数据子集;根据多个所述聚类数据子集重新计算所述去噪数据点集的聚类中心,再根据重新计算得到的聚类中心重新将所述去噪数据点集中的各个去噪数据点划分数据类,得到新的多个聚类数据子集,再次执行所述根据多个所述聚类数据子集重新计算聚类中心的操作,当所述去噪数据点集的聚类中心不再发生变化时,得到最终聚类数据;其中,所述根据所述欧式距离从所述数据点集中获取异常噪声点集,包括:获取各个所述数据点的异常点查找半径,所述各个所述数据点的异常点查找半径为各个所述数据点到所述第一聚类中心的欧式距离与预设比例的乘积;判断在各个所述数据点的异常点查找半径范围内是否存在其他数据点;若各个所述数据点中第一数据点的异常点查找半径范围内存在其他数据点,则确定所述第一数据点不为异常噪声点;若各个所述数据点中第二数据点的异常点查找半径范围内不存在其他数据点,则确定所述第二数据点为异常噪声点;汇总所有所述第二数据点,得到所述异常噪声点集;所述根据多个所述聚类数据子集重新计算所述去噪数据点集的聚类中心,包括:获取多个所述聚类数据子集中所有的数据点的横坐标和纵坐标;计算多个所述聚类数据子集中所有数据点的横坐标和纵坐标的平均值,得到聚类中心。

全文数据:

权利要求:

百度查询: 平安科技(深圳)有限公司 无监督聚类方法、装置、电子设备及介质

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

相关技术
相关技术
相关技术