宏景科技股份有限公司蔡皇伯获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉宏景科技股份有限公司申请的专利一种基于多源异构元数据与预训练大模型的数据血缘全链路溯源方法及系统获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN119917814B 。
龙图腾网通过国家知识产权局官网在2025-09-19发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202510388535.9,技术领域涉及:G06F18/20;该发明授权一种基于多源异构元数据与预训练大模型的数据血缘全链路溯源方法及系统是由蔡皇伯;姚占兵;胡新;刘洋设计研发完成,并于2025-03-31向国家知识产权局提交的专利申请。
本一种基于多源异构元数据与预训练大模型的数据血缘全链路溯源方法及系统在说明书摘要公布了:本发明提供了一种基于多源异构元数据与预训练大模型的数据血缘全链路溯源方法及系统,所述方法包括以下步骤:S1:采集元数据并对数据进行预处理;S2:使用数据血缘关系检测模型对S1处理后的数据进行识别,输出数据实体间的血缘概率矩阵;S3:基于动态阈值对血缘概率矩阵进行过滤生成血缘关系图谱;S4:对S3中获得的血缘关系图谱进行渲染来将数据血缘关系进行可视化。本发明通过元数据多维度特征提取与深度学习大模型的端到端训练,解决传统技术规则僵化、计算效率低、语义理解不足等问题,实现了高精度、自适应的数据血缘关系建模。
本发明授权一种基于多源异构元数据与预训练大模型的数据血缘全链路溯源方法及系统在权利要求书中公布了:1.一种基于多源异构元数据与预训练大模型的数据血缘全链路溯源方法,其特征在于,所述方法包括以下步骤: S1:采集元数据并对数据进行预处理; S2:使用数据血缘关系检测模型对S1处理后的数据进行识别,输出数据实体间的血缘概率矩阵; S3:基于动态阈值对血缘概率矩阵进行过滤生成血缘关系图谱; S4:对S3中获得的血缘关系图谱进行渲染来将数据血缘关系进行可视化; 在所述步骤S3中,还包括通过在线学习机制更新模型参数,通过增量式训练来更新模型,以适应元数据模式漂移; 在所述步骤S1中,所述对数据预处理包括: S11:对数据依次进行二维卷积神经网络编码和位置编码; S12:对编码后的数据进行编码映射,然后对编码映射后的数据进行特征拼接; 所述编码具体包括:对采集到的数据进行特征向量化处理,包括结构化特征、时序特征以及图特征的向量化处理;其中, 对于所述结构化特征:通过对字段类型、数据量级进行One-Hot编码来将其映射为向量,具体为对于字段类型将其映射为结构化特征向量VT; 对于所述时序特征,使用滑动窗口来提取操作频率并将频率特征向量化;其中,所述滑动窗口公式为,表示滑动窗口中操作次数的数量;表示滑动窗口的长度;表示滑动窗口中的操作频率; 对于所述图特征,基于数据依赖关系构建邻接矩阵,并通过图嵌入算法生成节点向量。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人宏景科技股份有限公司,其通讯地址为:510000 广东省广州市黄埔区映日路111号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。