买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
申请/专利权人:微软技术许可有限责任公司
摘要:本文描述了一种用于利用数据流分析来执行关于源数据集和所生成的导出数据集的数据分类的系统和方法。根据所执行的动作和导出数据集,使用自适应算法来计算字段的流置信度。根据相关联的置信度和流置信度来计算针对特定标签的相关联的导出置信度。当相关联的导出置信度大于或等于第一阈值时,将特定标签复制到导出数据集。在一些实施例中,当相关联的导出置信度小于或等于第二阈值时,不将特定标签复制到导出数据集。否则,要采取的动作被标识。接收对该动作的响应,并且根据所接收的响应来修改自适应算法。
主权项:1.一种电子系统,包括:至少一个硬件处理器;以及存储器,所述存储器具有存储在其上的计算机可执行指令,所述计算机可执行指令当由所述至少一个硬件处理器执行时,使所述系统:获得特定导出数据集,所述特定导出数据集已通过将特定源数据集转换为所述特定导出数据集而被生成,所述特定源数据集将数据存储在一个或多个字段中,所述一个或多个字段包括具有第一标签置信度的第一字段,第一标签将所述第一标签置信度应用于所述第一字段中的信息;向被训练用于确定流置信度的自适应算法提供如下转换信息:关于被用于将所述特定源数据集转换为所述特定导出数据集的一个或多个处理操作的转换信息,所述流置信度包括反映如下置信度的数值:标签从源数据集流到通过转换所述源数据集而获得的导出数据集的置信度;根据所述转换信息,使用所述自适应算法来计算针对所述第一字段的第一流置信度,所述第一流置信度包括反映如下可能性的第一数值:在将所述特定源数据集转换为所述特定导出数据集的所述一个或多个处理操作期间、所述第一标签从所述特定源数据集流到所述特定导出数据集的可能性;根据所述第一标签置信度和所述第一流置信度,计算针对所述第一标签的导出置信度;当所述导出置信度大于或等于第一阈值时,将所述第一标签与所述特定导出数据集自动关联;以及当所述导出置信度小于所述第一阈值并且大于第二阈值时:标识关于针对所述特定导出数据集的所述第一标签要执行的第二动作;接收对关于针对所述特定导出数据集的所述第一标签的所述第二动作的响应;以及根据所接收的所述响应修改所述自适应算法。
全文数据:
权利要求:
百度查询: 微软技术许可有限责任公司 使用数据流分析进行数据分类
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。