首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

大模型训练方法及基于大模型的数据查询方法 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

申请/专利权人:广州思迈特软件有限公司

摘要:本申请涉及一种大模型训练方法及基于大模型的数据查询方法,旨在提升大语言模型在特定数据仓库环境下对复杂、不常见或用户不常查询的基础字段的理解和识别能力。该方法通过结合数据仓库的星座数据模型,能够精确地定位并强化训练目标基础字段,确保模型在这些关键领域具备更高的理解能力。训练过程中,通过生成多样化的第二自然查询语句,丰富了训练数据集,使模型能够学习到更多关于查询意图与字段之间关联性的知识,增强了模型的推理能力和泛化能力。在面对多样化的查询需求时,模型能够保持高度的准确性,还能够快速响应并准确识别出那些传统方法难以处理的复杂列名,从而为用户提供了更加高效、便捷的数据查询体验。

主权项:1.一种数据查询大模型训练方法,其特征在于,包括以下步骤:获取若干第一自然查询语句;若任一所述第一自然查询语句包含目标基础字段,根据所述第一自然查询语句生成若干具有相同查询意图的第二自然查询语句;其中,所述第二自然查询语句不包含所述第一自然查询语句中的目标基础字段;所述目标基础字段从目标数据仓库对应的星座数据模型中确定;所述星座数据模型记录若干数据表以及各个数据表包含的基础字段;将各个所述第二自然查询语句、预设的第一任务执行文本、每个所述第二自然查询语句对应的第一查询标签信息,输入文本处理模型进行训练;其中,所述第一查询标签信息包括所述第二自然查询语句对应的第一自然查询语句中包含的所述目标基础字段;所述第一任务执行文本用于提示文本处理模型输出符合所述第二自然查询语句的查询意图的查询信息,所述查询信息包括基础字段;将训练完成的所述文本处理模型,确定为所述目标数据仓库对应的数据查询大模型。

全文数据:

权利要求:

百度查询: 广州思迈特软件有限公司 大模型训练方法及基于大模型的数据查询方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。