Document
拖动滑块完成拼图
个人中心

预订订单
服务订单
发布专利 发布成果 人才入驻 发布商标 发布需求

在线咨询

联系我们

龙图腾公众号
首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索
当前位置 : 首页 > 专利喜报 > 恭喜南京邮电大学许多获国家专利权

恭喜南京邮电大学许多获国家专利权

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

龙图腾网恭喜南京邮电大学申请的专利一种低资源场景下Text2SQL任务的监督微调方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN119474277B

龙图腾网通过国家知识产权局官网在2025-04-22发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202510046322.8,技术领域涉及:G06F16/332;该发明授权一种低资源场景下Text2SQL任务的监督微调方法是由许多;潘甦设计研发完成,并于2025-01-13向国家知识产权局提交的专利申请。

一种低资源场景下Text2SQL任务的监督微调方法在说明书摘要公布了:本发明公开一种低资源场景下Text2SQL任务的监督微调方法,该方法分解为模式连接任务和SQL生成任务两个部分;其中以模式连接任务部分作为重点,对整体流程进行精确调整,其核心在于根据特定的关系将电信数据库中的所有表分组到几个切片中,模型即可根据GPU内存限制灵活地覆盖不同数量的表。同时,将思想链(CoT)方法结合到模式连接任务的推理过程中,使模型能够逐步引导自己生成最终结果。随后,在SQL生成模型中输入模式连接模型预测出的与问题相关的少量表进行语句生成任务。通过本发明,可以有效地减少微调过程中的GPU内存消耗,并保持与现有方法相当的模型性能。

本发明授权一种低资源场景下Text2SQL任务的监督微调方法在权利要求书中公布了:1.一种低资源场景下Text2SQL任务的监督微调方法,其特征在于,该方法分解为模式连接任务和SQL生成任务两个部分;其中所述模式连接任务部分包括:S100、将整个电信数据库分解为多个切片,每个切片包含可调节数量的表信息;并根据GPU内存限制动态调整每个切片覆盖的表数量;具体方法为:S110、将电信数据库中所有表分为两组集合,分别为通过外键互连的表的集合,以及无外键相关性的表的集合;具体方法为:将电信数据库中所有表集合定义为,将其分为和两组,表示为: ;其中,表示通过外键互连的表的集合,;其中,表示一个相关组,该组中的每个表都受到第个外键或其相关外键施加的约束;定义,其中表示在第个相关组内的第个表的表名及其所有列;,其中表示第个相关组的第个表中的第列,表示与第个相关组中的第个表相关的第个外键,且; 表示无外键相关性的表的集合,;其中,表示无外键相关性的表和它们各自的所有列,定义,其中表示第个表中的第列;S120、根据GPU内存,将两组集合分解为多个切片,获得切片集合;具体方法为:对和进行更详细的分解,定义监督微调中表信息的最小切片单位,切片集合为,定义为当模型在的GPU内存容量下用一个批次大小进行微调时,单个数据实例的最大token容量,定义为对模型的特殊字符和监督微调模板进行编码的token计数;在对切片进行编码之后,总的token计数满足:;初始化两个空集合和;首先处理通过外键互连的表的集合,对于其中的每个相关组,对其每个表进行判断,如果与合并后的长度小于,将该表添加到中;如果长度大于给定的,将添加到中,并清空,再把表添加到清空后的中;然后处理无外键相关性的表集合,对于其中的每个表,判断与合并后的长度是否小于,如果是则将表添加到中,如果不是,则将添加到中,并清空,再把表添加到清空后的中;获得最终的切片集合;S200、使用监督微调方法训练一个模式连接模型,并进行模型推理,预测与用户查询问题相关的表;使用监督微调方法训练一个模式连接模型,具体方法为:以包含成对的问题和答案的模式连接任务数据集,和切片集合,作为模型输入,设定训练步数;初始化模式连接模型和优化器,之后进入训练循环;在每次训练中,先初始化损失,接着对中的每一对问题和答案进行处理;对于切片集合中的每个切片,如果答案中的某一个相关表在切片中,则使用模式连接模型进行预测并计算损失,同时平衡样本数量再次预测并计算损失,然后将添加到集合中;若不在中,则仅使用模式连接模型预测并计算损失;处理完所有切片和答案后,进行损失的反向传播和优化器的步骤和参数更新;循环上述过程,直到训练步数达到;步骤S200中进行模型推理,具体方法为:将查询问题,以及目标数据库D下的所有表输入所述模式连接模型;通过调用函数对所有表进行切片操作得到切片集合;对切片集合中的每一个切片进行处理,即利用语言模型函数结合查询问题、当前切片和相关表的集合得到一个相关表,再把得到的相关表添加到表集合中;最终获得相关表的集合;所述SQL生成任务部分,包括:S300、基于模式连接模型预测出的表和对应问题,训练一个SQL生成模型,以该SQL生成模型生成与用户查询问题相关的SQL查询语句。

如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人南京邮电大学,其通讯地址为:210003 江苏省南京市鼓楼区新模范马路66号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。