深圳航天智慧城市系统技术研究院有限公司费新勇获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉深圳航天智慧城市系统技术研究院有限公司申请的专利一种面向生态环境领域基于大模型的数据质量检测方法、系统及存储介质获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN120561117B 。
龙图腾网通过国家知识产权局官网在2025-11-21发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202511045362.7,技术领域涉及:G06F16/215;该发明授权一种面向生态环境领域基于大模型的数据质量检测方法、系统及存储介质是由费新勇;陈兴晖;侯素双设计研发完成,并于2025-07-29向国家知识产权局提交的专利申请。
本一种面向生态环境领域基于大模型的数据质量检测方法、系统及存储介质在说明书摘要公布了:本发明提供了面向生态环境领域基于大模型的数据质量检测方法、系统及存储介质,该方法包括:步骤1:连接数据库,根据数据治理库的规划、数据字典,构建多个知识库;步骤2:制定通用规则、生态环境领域专有规则、自定义规则;步骤3:结合数据血缘和数据规则,通过大模型专用prompt模板校核规则是否合理有效;步骤4:依据当前有效的数据质量规则及更新频率创建相应的调度任务列表;步骤5:通过大模型专用prompt模板,对收集到的数据质量问题进行检查,并输出分析报告;步骤6:通过大模型专用prompt模板针对由步骤5发现的问题点,结合问题的情况及原因,生成改进建议。本发明的有益效果是:提升规则校核的科学性和有效性。
本发明授权一种面向生态环境领域基于大模型的数据质量检测方法、系统及存储介质在权利要求书中公布了:1.一种面向生态环境领域基于大模型的数据质量检测方法,其特征在于,包括: 步骤1,数据接入:连接数据库,根据数据治理库的规划、数据字典,构建多个知识库; 步骤2,规则制定:制定数据质量检测规则,包括通用规则、生态环境领域专有规则、自定义规则; 步骤3,规则校验:结合数据血缘和数据规则,通过大模型专用prompt模板校核规则是否合理有效,如果校核某条规则不符合要求,则返回所述步骤2进行调整,否则,将验证后的规则标记为有效状态,用于后续的数据质量检测任务; 步骤4,任务制定:依据当前有效的数据质量规则及其更新频率自动创建相应的调度任务列表; 步骤5,数据质量分析:通过大模型专用prompt模板,对收集到的数据质量问题进行全面检查,并输出分析报告; 步骤6,冶理建议:通过大模型专用prompt模板针对由所述步骤5发现的问题点,结合问题的情况及原因,生成改进建议; 所述步骤1还包括: 步骤S1:根据数据治理库的规划,收集字段名中允许使用的词缀,将词缀、词缀在字段名中位置以及词缀所属字段类型整理成文档,对文档做向量化处理后,存入知识库A; 步骤S2:分析数据字典,识别数据字典中的维表,将维表信息向量化后,存入知识库B; 步骤S3:对数据字典中的所有表进行分析,识别每个字段对应的词缀与词根,将表名、字段名、字段名词缀、字段名词根以及字段类型做向量化处理后,存入知识库C; 步骤S4:对数据字典中的所有表进行遍历,逐张表分析与其在同一个血缘分组下的其他表的表名;分析每个血缘分组中,所有表两两之间的上下层级关系; 在所述步骤S4中,还包括: 每个血缘分组中,各表按两两之间的上下层级关系进行排序,从而得出该血缘分组完整的血缘链条。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人深圳航天智慧城市系统技术研究院有限公司,其通讯地址为:518000 广东省深圳市南山区粤海街道高新区社区高新南九道09号威新软件科技园5号楼4层;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励