买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
申请/专利权人:武汉博科国泰信息技术有限公司
摘要:本申请涉及智能数据分析领域,提供了一种基于机器学习的数据智能治理系统及方法,其通过获取被标注为正常数据的历史治理数据的集合和待评估数据,并采用基于机器学习的数据处理和分析算法来对所述被标注为正常数据的历史治理数据的集合和所述待评估数据进行语义嵌入编码,以此根据所述历史治理数据的集合和所述待评估数据之间的语义交互匹配特征来自动地判断待评估数据是否为正常数据。通过这样的方式,实现了自动化地识别数据集中的异常或非正常数据,降低误报正常数据为异常的风险,同时减少漏报真正的异常数据,从而提高了数据的质量。
主权项:1.一种基于机器学习的数据智能治理系统,其特征在于,包括:历史治理数据采集模块,用于获取被标注为正常数据的历史治理数据的集合;历史治理数据语义嵌入编码模块,用于对所述被标注为正常数据的历史治理数据的集合中的各个被标注为正常数据的历史治理数据进行语义嵌入编码以得到正常数据语义嵌入编码向量的集合;正常数据语义强化模块,用于将所述正常数据语义嵌入编码向量的集合输入基于显著性-全局性的上下文语义强化模块以得到强化正常数据语义嵌入编码向量的集合;待评估数据获取模块,用于获取待评估数据;待评估数据语义嵌入编码模块,用于对所述待评估数据进行语义嵌入编码以得到待评估数据语义嵌入编码向量;数据单项交互模块,用于以所述待评估数据语义嵌入编码向量作为查询特征向量,将所述查询特征向量和所述强化正常数据语义嵌入编码向量的集合输入单向交互匹配模块以得到数据单向匹配特征向量作为数据单向匹配特征;治理结果生成模块,用于基于所述数据单向匹配特征,得到治理结果,所述治理结果用于表示待评估数据是否为正常数据。
全文数据:
权利要求:
百度查询: 武汉博科国泰信息技术有限公司 基于机器学习的数据智能治理系统及方法
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。