买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
摘要:本申请适用于数据处理技术领域,尤其涉及一种自动化实体拆分方法、装置、设备及介质。该方法获取待拆分的实体元组以及预设的逻辑规则组,使用逻辑规则组对实体元组中表征为同一实体的属性拆分为一拆分元组,得到至少一个拆分元组,使用逻辑规则组对每个拆分元组中所有属性进行属性值推导,得到每个拆分元组中每个属性下所有的属性值结果,根据每个拆分元组中每个属性下所有的属性值结果,确定每个拆分元组中所有属性的最终属性值,实现自动化地对实体的拆分,并在拆分后进行属性值的推导和校验,从而得到较为准确地拆分结果,有助于数据在准确度要求较高的场景中使用。
主权项:1.一种自动化实体拆分方法,其特征在于,所述自动化实体拆分方法包括:获取待拆分的实体元组以及预设的逻辑规则组,使用所述逻辑规则组对所述实体元组中表征为同一实体的属性拆分为一拆分元组,得到至少一个拆分元组;使用所述逻辑规则组对每个拆分元组中所有属性进行属性值推导,得到所述每个拆分元组中每个属性下所有的属性值结果;根据所述每个拆分元组中每个属性下所有的属性值结果,确定所述每个拆分元组中所有属性的最终属性值;所述逻辑规则组包括至少两个逻辑规则,所述使用所述逻辑规则组对每个拆分元组中所有属性进行属性值推导,得到所述每个拆分元组中每个属性下所有的属性值结果,包括:获取验证数据,根据所述验证数据对每个逻辑规则进行验证,得到验证通过的逻辑规则;针对任一个拆分元组,将所述拆分元组中任一属性作为当前推导属性,依次调用每个验证通过的逻辑规则,对所述当前推导属性进行属性值推导,得到所述当前推导属性下的所有属性值结果;遍历所述拆分元组中所有属性以及所有拆分元组,得到所述每个拆分元组中每个属性下的所有属性值结果;所述根据所述每个拆分元组中每个属性下所有的属性值结果,确定所述每个拆分元组中所有属性的最终属性值,包括:针对任一拆分元组,将所述拆分元组中存在属性值结果冲突的属性作为待解决属性;获取所述拆分元组的已验证属性集合,其中,所述已验证属性集合包括已验证通过的属性;根据所述已验证属性集合中所有属性的属性值,对所述待解决属性中所有的属性值结果进行筛选,得到筛选出的属性值结果为所述待解决属性的最终属性值。
全文数据:
权利要求:
百度查询: 深圳计算科学研究院 自动化实体拆分方法、装置、设备及介质
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。