南京维拓科技股份有限公司杨松贵获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉南京维拓科技股份有限公司申请的专利基于大语言模型的数字主线自动建模方法及系统获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN120523828B 。
龙图腾网通过国家知识产权局官网在2025-10-31发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202511032779.X,技术领域涉及:G06F16/242;该发明授权基于大语言模型的数字主线自动建模方法及系统是由杨松贵;严以慷;朱斌;仲昭林设计研发完成,并于2025-07-25向国家知识产权局提交的专利申请。
本基于大语言模型的数字主线自动建模方法及系统在说明书摘要公布了:本发明公开了一种基于大语言模型的数字主线自动建模方法及系统,所述基于大语言模型的数字主线自动建模系统包括数据库系统、嵌入模型、向量数据库、匹配处理单元、前端界面、提示词生成模块、大语言模型接口,所述基于大语言模型的数字主线自动建模方法包括以下步骤:S1:抽取标准数据库和待匹配数据库的数据信息并转换格式;S2:使用嵌入模型将标准数据库的数据信息向量化存储在向量数据库中;S3:将待匹配的业务数据库数据信息向量化,在向量数据库中查找相似字段,选出候选字段;S4:用户检查候选的相似字段,确认映射关系;S5:将数据匹配关系输入大语言模型,生成数据转移SQL;S6:执行SQL,实现数据整合、自动建模。
本发明授权基于大语言模型的数字主线自动建模方法及系统在权利要求书中公布了:1.一种基于大语言模型的数字主线自动建模方法,其特征在于:包括以下步骤: S1:抽取标准数据库和待匹配数据库的数据信息并转换格式; 数据库系统对标准数据库和待匹配数据库中结构化的元数据信息进行提取; 数据库系统对提取出的元数据信息进行标准化解析,将元数据信息转换为标准化格式; 所述标准化格式是一种标准化的、机器可读的数据交换格式; S2:使用嵌入模型将标准数据库的数据信息向量化存储在向量数据库中; 通过嵌入模型对标准化数据库中的字段进行的向量化采用了二次嵌入,两次嵌入会产生两种向量表示,每种向量表示都被分别保存在两个专门的向量数据库中,分别为标准表向量数据库以及标准字段向量数据库; 所述二次嵌入的步骤为: S21:第一次嵌入,为了将标准数据库中表级别的上下文信息向量化,将目标字段所属数据表的名称以及该数据表的描述信息拼接组合后,整体输入嵌入模型; S22:第一次嵌入输出结果,嵌入模型生成一个表级别语义向量,该向量蕴含了该字段所处的数据表的整体业务背景和上下文信息; S23:第二次嵌入,为了将标准数据库中字段信息向量化,将字段自身的字段名称以及该字段的描述信息,拼接组合后,整体输入嵌入模型; S24:第二次嵌入输出结果,嵌入模型生成一个字段语义向量,该向量直接表征该字段的所有信息; S3:将待匹配的业务数据库数据信息向量化,在向量数据库中查找相似字段,选出候选字段; 用户预先设定候选表的数量a和候选字段的数量b,嵌入模型对待匹配业务数据库中的字段进行向量化,接着再通过匹配处理单元对向量化后的字段进行二次匹配,使用向量化后的字段在向量数据库中搜索,得到候选数据表以及候选字段,再对候选字段进行进一步筛选,得到该待匹配字段的最终匹配结果; 所述二次匹配的步骤: S31:表向量搜索,使用表信息生成的向量在标准表向量数据库中搜索,即进行表之间的匹配; S32:得到候选表,计算候选表与待匹配字段所属的数据表的余弦相似度,并根据相似度分数排序,选出相似度得分最高的a张数据库表作为候选数据表; S33:字段向量搜索,使用字段信息生成的向量在标准字段向量数据库中搜索; S34:得到候选字段,计算候选字段与待匹配字段的余弦相似度,并根据相似度分数排序,选出相似度得分最高的b个数据字段作为候选字段; S4:用户检查候选的相似字段,确认映射关系; 使用程序循环,对待匹配业务数据库中的每个待匹配字段执行S3,得到一组候选匹配关系,即每一个待匹配字段对应0至b个候选字段,通过匹配处理单元会将匹配关系保存在数据库系统中,通过前端界面展示给用户,用户根据个人本身的知识做最后的检查,最终确定映射匹配关系; 如果前端界面中没有候选字段或候选字段都不正确,说明业务数据库和标准数据库中存在不能匹配的字段,将结果空置或根据具体业务需求输入正确的注释或者字段名称; S5:将数据匹配关系输入大语言模型,生成数据转移SQL; 当最终的数据映射关系被决定后,用户将确定的数据匹配关系通过提示词生成模块直接转换成文本,并插入提示词,然后通过大语言模型接口将提示词直接输入大语言模型中,大语言模型根据文本信息,运用自身的编程工具编写SQL语句并返回; S6:执行SQL,实现数据整合、自动建模; 将S5中大语言模型返回的SQL语句直接输入数据库系统中,数据库系统完成SQL语句的数据操作,实现数据的整合、创建模型。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人南京维拓科技股份有限公司,其通讯地址为:211000 江苏省南京市雨花台区软件大道11号花神大厦3楼302室;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励