买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
摘要:本发明实施例涉及一种NL2SQL大语言模型的自增强微调方法和装置,所述方法包括:1确认第一模型、初始化迭代计数器;2初始化种子数据集;3清洗种子数据集;4基于种子数据集微调第一模型;5利用第一模型对种子数据集进行数据增强和低质记录过滤,并合并增强数据集和种子数据集得到新的种子数据集;6迭代计数器超过阈值转至7,未超过则计数器加1后返回3;7对完成迭代微调的第一模型进行参数固化并确认微调训练结束。通过本发明可以缩短训练周期、减少训练成本、提高训练水平。
主权项:1.一种NL2SQL大语言模型的自增强微调方法,其特征在于,所述方法包括:步骤1,将完成预训练的NL2SQL大语言模型作为对应的第一模型;并初始化迭代计数器为1;步骤2,基于预设的公开数据集初始化第一种子数据集;所述第一种子数据集包括多个第一种子记录;所述第一种子记录包括第一NL指令、第一SQL指令、第一数据库访问接口和第一查询文本;所述第一NL指令为一个自然语言指令,所述第一SQL指令为一个SQL指令;步骤3,对所述第一种子数据集进行种子清洗处理;步骤4,基于所述第一种子数据集对所述第一模型进行一轮微调;步骤5,在本轮微调结束后,利用所述第一模型对所述第一种子数据集进行数据增强处理得到对应的第一增强数据集;并利用所述第一模型对所述第一增强数据集进行低质记录过滤处理;并对完成过滤的所述第一增强数据集和所述第一种子数据集进行数据集合并处理并将得到的合并数据集作为新的所述第一种子数据集;所述第一增强数据集包括多个第一增强记录;所述第一增强记录包括第二NL指令、第二SQL指令、第二数据库访问接口和第二查询文本;步骤6,对所述迭代计数器是否超过预设的迭代次数阈值进行识别;若超过,则转至步骤7;若未超过,则对所述迭代计数器加1并返回步骤3;步骤7,对完成迭代微调的所述第一模型进行参数固化,并确认本次模型微调训练结束。
全文数据:
权利要求:
百度查询: 北京深势科技有限公司 一种NL2SQL大语言模型的自增强微调方法和装置
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。