首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

一种大语言模型中的推测性解码方法、装置、设备及介质 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

申请/专利权人:上海燧原科技股份有限公司

摘要:本发明实施例公开了一种大语言模型中的推测性解码方法、装置、设备及介质。该方法包括:在内存中读取历史文本信息,并传输至计算单元;在计算单元中执行:将历史文本信息输入至预设长度预测器,得到推理长度;将推理长度以及历史文本信息输入至预设推测性解码模型,得到与推理长度相同个数的预测文本信息;将历史文本信息输入至大语言模型中,得到大语言模型输出的目标文本信息;将历史文本信息、目标文本信息以及各预测文本信息输入至大语言模型进行验证,得到推理正确的目标预测文本信息;根据历史文本信息与目标预测文本信息进行迭代训练,得到目标长度预测器和目标推测性解码模型。该方法在推测性解码中考虑了推理长度,可提高模型推理性能。

主权项:1.一种大语言模型中的推测性解码方法,其特征在于,包括:在内存中读取历史文本信息,并将所述历史文本信息传输至计算单元中;在计算单元中,将所述历史文本信息输入至预设长度预测器,得到推理长度;在计算单元中,将所述推理长度以及所述历史文本信息输入至预设推测性解码模型,得到与推理长度相同个数的预测文本信息;在计算单元中,将所述历史文本信息输入至大语言模型中,并得到大语言模型输出的目标文本信息;在计算单元中,将所述历史文本信息、所述目标文本信息以及各所述预测文本信息输入至大语言模型进行验证,得到推理正确的目标预测文本信息;在计算单元中,根据所述历史文本信息与所述目标预测文本信息进行预设长度预测器以及预设推测性解码模型的迭代训练,得到目标长度预测器和目标推测性解码模型。

全文数据:

权利要求:

百度查询: 上海燧原科技股份有限公司 一种大语言模型中的推测性解码方法、装置、设备及介质

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。