首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

数据血缘关系的确定方法、装置、设备及可读存储介质 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

申请/专利权人:昆仑数智科技有限责任公司;中国石油天然气集团有限公司

摘要:本申请公开了一种数据血缘关系的确定方法、装置、设备及可读存储介质,属于大数据技术领域。该方法包括:获取图谱模型,图谱模型包括多个对象类型以及多个对象类型之间的依赖关系,多个对象类型分别包括至少一个对象属性;按照图谱模型对多个数据源中的石油数据进行采集,得到多个数据对象,多个数据对象之间包括依赖关系;将多个数据对象按照多个对象类型进行分类,得到多个数据对象集;根据多个数据对象集确定多个数据对象之间的血缘关系。该方法通过建立的图谱模型对不同的数据源中的石油数据进行采集和血缘分析,提供了石油数据的全局性视角,从而为石油的生产、开发和运维提供决策基础。

主权项:1.一种数据血缘关系的确定方法,其特征在于,所述方法包括:基于数据湖中的数据类型确定多个对象类型,根据所述多个对象类型和所述多个对象类型之间的依赖关系获取图谱模型,所述图谱模型包括所述多个对象类型以及所述多个对象类型之间的依赖关系,所述多个对象类型分别包括至少一个对象属性,所述多个对象类型包括字段、表、视图、物化视图、函数、数据集、命名空间和版本中的至少两个,所述依赖关系包括外键关系、等级关系、包含关系、版本关系、数据项转换关系和映射关系中的至少一个;按照所述图谱模型对多个数据源中的石油数据进行采集,得到多个数据对象,第一数据对象对应第一对象类型,所述第一数据对象包括所述第一对象类型对应的至少一个对象属性以及与第二数据对象的依赖关系,所述第一数据对象为所述多个数据对象中的任一数据对象,所述第二数据对象为所述多个数据对象中除所述第一数据对象之外的任一数据对象,所述第一数据对象在所述第二数据对象中采集得到,所述石油数据是在油田生产、勘探及开发的过程中产生的;将所述多个数据对象按照所述多个对象类型进行分类,得到多个数据对象集;对于所述多个数据对象中的任一数据对象,在所述任一数据对象所属的数据对象集中按业务需求进行遍历,获取至少一个同级数据对象,所述至少一个同级数据对象的至少一个对象属性与所述任一数据对象的至少一个对象属性之间的相似度大于相似度阈值;基于所述任一数据对象和所述至少一个同级数据对象分别包括的依赖关系,获取所述任一数据对象对应的血缘关系;根据所述任一数据对象对应的血缘关系,确定所述多个数据对象之间的血缘关系;其中,上一对象类型的数据对象之间的血缘关系由下一对象类型的数据对象之间的血缘关系确定,所述上一对象类型与所述下一对象类型之间存在所述依赖关系。

全文数据:

权利要求:

百度查询: 昆仑数智科技有限责任公司 中国石油天然气集团有限公司 数据血缘关系的确定方法、装置、设备及可读存储介质

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。