首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

一种GQL语料生成模型训练方法、装置和存储介质 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

申请/专利权人:杭州智通福科技有限公司

摘要:本发明公开的一种GQL语料生成模型训练方法、装置和存储介质,通过提取图数据库产品手册中的各GQL原始语句及其对应的自然语言描述文本的匹配对,构建初始语料数据集,结合预设等价变换规则和大语言模型对所述初始语料数据集中的各GQL原始语句进行等价变换生成对应GQL变体语句,构建变体语料数据集,结合初始语料数据集与变体语料数据集,构建包括多个正负样本对的正负样本数据集后,将初始语料数据集、变体语料数据集以及构建的正负样本数据集整合为扩充语料数据集,输入目标GQL语料生成模型中对模型进行微调,使目标GQL语料生成模型能够根据输入的自然语言描述文本生成对应的GQL语句,实现高质量、大规模、低成本的GQL语料生成模型训练。

主权项:1.一种GQL语料生成模型训练方法,其特征在于,包括如下步骤:S1,提取图数据库产品手册中的各GQL原始语句及对应的自然语言描述文本的匹配对,构建初始语料数据集;S2,根据预设等价变换规则,结合大语言模型对所述初始语料数据集中的各GQL原始语句进行等价变换,生成对应GQL变体语句,构建变体语料数据集,具体包括:S21,识别初始语料数据集中各GQL原始语句的可变换单元,根据预设等价变换规则生成分别对应各GQL原始语句的各等价变换语句组,所述可变换单元包括谓词、WHERE子句;S22,将各GQL原始语句和对应的等价变换语句组输入训练好的第一语言模型中结合预设打分函数对各等价变换语句进行打分,将最高打分结果所对应的等价变换语句作为对应GQL变换语句;S3,结合初始语料数据集与变体语料数据集,构建包括多个正负样本对的正负样本数据集,所述正负样本对包括匹配的GQL语句和对应自然语言描述文本的正样本对、以及不匹配或随机组合的GQL语句和对应自然语言描述文本的负样本对;S4,将初始语料数据集、变体语料数据集以及构建的正负样本数据集整合为扩充语料数据集,将所述扩充语料数据集输入至目标GQL语料生成模型中对模型进行微调,使目标GQL语料生成模型能够根据输入的自然语言描述文本生成对应的GQL语句。

全文数据:

权利要求:

百度查询: 杭州智通福科技有限公司 一种GQL语料生成模型训练方法、装置和存储介质

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。