买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
申请/专利权人:浪潮软件科技有限公司
摘要:本发明涉及数据加工技术领域,特别涉及一种基于关系型数据库的数据质量问题数据存储方法。该基于关系型数据库的数据质量问题数据存储方法,按照固定顺序进行质量结果的加工整理,依次判断问题数据是否违反了对应顺序索引的检测标准;对问题数据中的问题字段,进行整理及存储;通过设置质量规则的计算标准值以及问题数据的质量标准值,并分别与质量规则的问题数据检测结果以及问题记录的字段违规结果进行位运算计算求值,实现查询统计。该基于关系型数据库的数据质量问题数据存储方法,可以快速的对问题数据的总体特征及关键属性进行筛选与统计,大大提供了计算效率,降低了存储问题数据的空间,通过构建新的存储结构降低了存储的内存消耗。
主权项:1.一种基于关系型数据库的数据质量问题数据存储方法,其特征在于:通过构建新检测结果数据结构以及运用位运算计算方式,提高问题数据的整体查询及分析的效率;具体步骤如下:步骤S1、根据需求自定义检测数据中需要检测的字段,并按照自定义顺序进行排列,形成字段索引序列;步骤S2、确定数据质量检测所涉及的质量维度,将质量维度划分为有效性,一致性,唯一性,及时性以及完整性,并按照自定义的固定顺序进行排列,形成维度索引序列;然后,确定数据质量检测所涉及的质量规则,并按照质量规则的特征划分至对应的数据质量维度,同样按照自定义的固定顺序对质量规则进行排列,形成规则索引序列;步骤S3、数据质量检测完成得到问题数据后,按照步骤S2中定义的质量维度顺序进行质量结果的加工整理,即按照设定的质量维度顺序分别对当前问题数据进行占位赋值,依次判断当前的问题数据是否违反了对应顺序索引的质量维度的检测标准:若违反了当前索引维度的检测标准,则将当前占位值设置为1;若没有违反当前索引标准,则将当前占位设置为0;所有的占位赋值操作完成后,根据当前的问题数据得出一个二进制数值,将该二进制数值转为十进制后储存为当前检测结果的维度违规信息,该十进制数值即为当前问题记录的质量维度的检测结果;步骤S4、质量维度检测结果整理完毕后,按照步骤S2中定义的质量规则顺序进行质量结果的加工整理,即按照设定的质量规则顺序分别对当前问题数据进行占位赋值,依次判断当前的问题数据是否违反了对应顺序索引的质量规则的检测标准:若违反了当前索引的标准,则当前占位设置为1;若没有违反当前索引标准,则当前占位设置为0;所有的占位赋值操作完成后,可以根据当前的问题数据整理出一个二进制数值,将二进制该数值转为十进制后储存为当前检测结果的规则违规信息,该十进制数值即为当前问题记录的质量规则的检测结果;步骤S5、质量规则检测结果整理完毕后,整理字段是否存在问题的检测结果;即按照步骤S1中设定的字段顺序分别对当前问题数据中的问题字段进行占位赋值:若当前索引位置的字段存在问题,则记录为1;若不存在问题,则当前占位设置为0;所有的占位赋值操作完成后,根据当前的问题数据包含的问题字段整理出一个二进制数值,将二进制数值转为十进制后储存为当前检测结果的字段违规信息,该十进制数值即为当前问题记录的字段违规结果;步骤S6、步骤S3~步骤S5整理完成后,将问题数据中的问题字段,即对应的涉及的质量规则标识,进行整理及存储;步骤S7、明细检测结果信息存储完成后,通过设置质量规则的计算标准值以及问题数据的质量标准值,并分别与质量规则的问题数据检测结果以及问题记录的字段违规结果进行位运算计算求值,以实现对质量规则、问题数据与质量维度的查询统计。
全文数据:
权利要求:
百度查询: 浪潮软件科技有限公司 一种基于关系型数据库的数据质量问题数据存储方法
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。