国网浙江省电力有限公司营销服务中心;浙江大学沈然获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉国网浙江省电力有限公司营销服务中心;浙江大学申请的专利自然语言转化为数据库语句的方法、装置、设备及介质获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN117370378B 。
龙图腾网通过国家知识产权局官网在2026-03-17发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202311195858.3,技术领域涉及:G06F16/2452;该发明授权自然语言转化为数据库语句的方法、装置、设备及介质是由沈然;沈皓;孙钢;汪一帆;李伊玲;金良峰;章一新;姜伟昊设计研发完成,并于2023-09-15向国家知识产权局提交的专利申请。
本自然语言转化为数据库语句的方法、装置、设备及介质在说明书摘要公布了:本发明公开了一种自然语言转化为数据库语句的方法,涉及自然语言处理技术领域,用于解决现有模型准确率低的问题,该方法包括以下步骤:根据数据库表结构信息,生成问答对的提示学习模板,并生成对应的问题及查询语句;根据所述问题及查询语句构建指令微调训练集;根据所述指令微调训练集,进行生成式大模型指令微调,得到自然语言转化为数据库语句的模型;接收需要查询问题的文本,并输入所述模型,输出查询语句。本发明还公开了一种自然语言转化为数据库语句的装置、电子设备和计算机存储介质。本发明通过训练数据进行处理并进行模型微调,进而获取准确度高的转换模型。
本发明授权自然语言转化为数据库语句的方法、装置、设备及介质在权利要求书中公布了:1.一种自然语言转化为数据库语句的方法,其特征在于,包括以下步骤: 根据数据库表结构信息,结合生成问答对的提示学习模板,通过Chatgpt3.5生成对应的问题及查询语句; 根据所述问题及查询语句构建指令微调训练集,所述训练集包括问题、所有数据库表名列名为输入,问题所涉及的相关表名为输出的第一训练集及问题、涉及的相关数据库表名为输入,问题对应的SQL语句为输出的第二训练集; 根据所述问题及查询语句构建指令微调训练集,包括: 将数据库表名列嵌入批量生成问题和对应数据库的提示学习模板中,利用chatgpt,批量生成问题和对应的数据库查询语句,得到初始数据集; 以问题和数据库表名列名为输入,以数据库查询语言对应的表名为标签,嵌入所述提示学习模板中,得到第一训练集; 以问题和数据库表名列名作为输入,以对应数据库查询语言作为标签,嵌入所述提示学习模板中,得到第二训练集; 将所述第一训练集和第二训练集随机组合,得到所述指令微调训练集; 通过生成式大模型语义解析和生成能力进行指令微调,包括: 通过Byte-PairEncoding对所述指令微调训练集进行分词; 将分词后的所述指令微调训练集输入transformer架构为基座的生成式大模型进行模型训练;所述transformer架构为deocder-only结构; 通过位置编码和RMSNorm层标准化进行模型优化,并通过deepspeed框架进行模型训练加速,并完成模型训练; 根据所述指令微调训练集,结合位置编码和RMSNorm层标准化进行生成式大模型指令微调,得到自然语言转化为数据库语句的模型; 接收需要查询问题的文本,并输入所述模型,输出对应的数据库查询语句。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人国网浙江省电力有限公司营销服务中心;浙江大学,其通讯地址为:311100 浙江省杭州市余杭区云联路138号5幢;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励