买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
申请/专利权人:西安几何数字信息技术有限公司
摘要:本发明涉及一种基于医疗的数据质量校验方法,步骤如下:根据医院业务范围采集业务系统内的医疗数据;将采集的医疗数据完成数据落库入数据仓库;对数据仓库的数据设计业务分析主题,将业务分析主题划分为若干主题域,并梳理每个主题域中的关键性指标,确定每个主题域的校验类型依据校验类型,将业务系统中的SQL语句作为校验口径,并将SQL语句转化为数据源,采用ETL对数据仓库的数据质量进行校验;构建校验结果的医疗数据模型表,并将校验结果储存到模表中,采用springboot架构,开发数据质量结果展示功能,输出校验结果。通过该方法实现了对医院各系统的统计口径数据进行自动校验,提升了数据在医院内部共享和分析的质量。
主权项:1.一种基于医疗的数据质量校验方法,其特征在于,具体包括以下步骤:步骤1梳理医院运营管理的业务范围,根据业务范围通过ETL对接医院内的各业务系统,并自动采集各业务系统内的医疗数据;步骤2在ETL中将采集的医疗数据导入到数据落地区;再根据统一的数据字典和格式,对数据内容进行归一化,完成数据准备区的加载;将处理后的数据加载到数据存储区,并在数据存储区中加载基础数据层,加工汇总层和应用集市层的数据,在数据存储区中加载基础数据层、加工汇总层和应用集市层的数据的方式为:在基础数据层对数据储存区的数据进行清洗、维度退化处理,生成维表数据和明细数据,并对明细数据采用常用维度做轻度的汇总,构建公共粒度的汇总指示表;所述生成维表数据的方式为:以维度作为建模驱动,根据每个维度的业务含义,通过添加维度属性和关联维度的定义计算逻辑,完成属性定义,并使用雪花模型建立一致的数据分析维表;生成明细数据的方式为:以业务过程作为建模驱动,根据每个具体的业务过程特点,构建最细粒度的明细事实表;处理完成后数据落库入数据仓库;步骤3对数据仓库的数据分别梳理维度、度量和指标,设计相应的业务分析主题,将业务分析主题划分为若干主题域,并梳理每个主题域中的关键性指标,确定每个主题域的校验类型;步骤4根据校验类型,采用ETL以业务系统中的SQL语句作为校验口径,对数据仓库的数据质量进行校验;所述数据质量校验方法如下:41连接业务系统,将业务系统中的SQL语句作为数据源;42对数据源的关键字段进行排序、汇总和行转列操作;43连接数据仓库,在数据仓库中编写SQL语句,查询和数据源相同的内容;44将数据源和数据仓库的结果,用时间和核验内容进行关联合并后,作为数据质量校验结果;45在数据仓库中增加序列、数据仓库表和计算器,并获取数据仓库表的最大主键值,将序列和数据仓库表的最大主键值关联,并通过计算器生成自增数字,作为要落地数据仓库表的主键;46将处理完成汇总的数据作为数据质量校验结果;步骤5构建数据质量校验结果的医疗数据模型表,将数据质量校验结果储存到医疗数据模型表中,并采用springboot架构,开发数据质量结果展示功能,输出数据质量校验结果并展示。
全文数据:
权利要求:
百度查询: 西安几何数字信息技术有限公司 一种基于医疗的数据质量校验方法
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。