训练语言模型的方法及装置

买专利卖专利找龙图腾，真高效！查专利查商标用IPTOP,全免费！专利年费监控用IP管家,真方便！

摘要：本说明书实施例涉及训练语言模型的方法及装置，方法包括：首先，将目标输入文本分别输入目标语言模型以及预训练的参考语言模型，得到两个模型各自关于第一输出文本的概率值，以及各自关于第二输出文本的概率值，其中，第一输出文本相对于第二输出文本被标记为关于所述目标输入文本的偏好输出文本；然后，确定训练损失，其与第一损失项负相关，且与第二损失项正相关；其中，第一损失项包括所述两个模型关于第一输出文本的概率值之间的差异；第二损失项包括所述两个模型关于第二输出文本的概率值之间的差异与0之间的较大值；接下来，以减小所述训练损失为目标，调整所述目标语言模型中的参数。

主权项：1.一种训练语言模型的方法，包括：将目标输入文本分别输入目标语言模型以及预训练的参考语言模型，得到两个模型各自关于第一输出文本的概率值，以及各自关于第二输出文本的概率值，其中，第一输出文本相对于第二输出文本被标记为关于所述目标输入文本的偏好输出文本；确定训练损失，其与第一损失项负相关，且与第二损失项正相关；其中，第一损失项包括所述两个模型关于第一输出文本的概率值之间的差异；第二损失项包括所述两个模型关于第二输出文本的概率值之间的差异与0之间的较大值；以减小所述训练损失为目标，调整所述目标语言模型中的参数。

全文数据：

权利要求：

百度查询：支付宝(杭州)信息技术有限公司训练语言模型的方法及装置

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：北美型猪繁殖与呼吸综合征病毒囊膜主要糖蛋白GP5的保守中和表位QT7、核酸分子、表达载体、中和抗体及其应用

下一篇：表壳装配结构和手表

相关技术

北美型猪繁殖与呼吸综合征病毒囊膜主要糖蛋白GP5的保守中和表位QT7、核酸分子、表达载体、中和抗体及其应用

表壳装配结构和手表

车用电子水泵

发动机壳体铝铸件气密性检测治具及检测设备

一种智能眼镜

一种便于滑道清理的铝合金门窗

断路器系统

一种耐老化物流集装箱密封条

一种防护服抗穿刺测试装置

一种蓄电池安装架

一种生产包装吸塑盘的模切机构

中央处理器CPU的调频装置

语言相关技术

训练语言模型的方法及装置_支付宝(杭州)信息技术有限公司_202411123942.9

基于互动语言的素材推送方法及装置_成都帆点创想科技有限公司_202411002172.2

针对PHP语言的Webshell文件检测方法及系统_北京信息科技大学_202411027271.6

一种自然语言需求至可工作软件的转化方法及系统_北京跨赴科技有限公司_202411220931.2

一种基于大型语言模型的会议纪要生成方法_航天物联网技术有限公司_202411159823.9

一种基于语言大模型的语句生成方法及设备_海信集团控股股份有限公司_202411099543.3

一种面向大语言模型的文本切分方法、设备和介质_知学云(北京)科技股份有限公司_202410571033.5

基于知识图谱的语言模型查询请求处理方法与服务设备_上海玄图智能科技有限公司_202411009747.3

结合双模态理解与大语言模型的伪造信息检测方法_深圳市金大智能创新科技有限公司_202410996900.X

自适应噪声抑制的多语言长录音转写方法、系统以及设备_深圳市贝铂智能科技有限公司_202411452249.6

模型相关技术

基于预训练模型参数融合的模型微调方法_浙江大学_202410989398.X

模型训练方法、模型推理方法和装置_上海壁仞科技股份有限公司_202411175297.5

美发教习模型_青岛金达发制品有限公司_202420253532.5

动漫人物模型尺_刘毅_202411000219.1

模型部署方法及其装置_维沃移动通信有限公司_202411101863.8

模型评测方法及设备_北京达佳互联信息技术有限公司_202210770160.9

钢结构框架教学模型_山东祥云数据科技有限公司_202323392239.1

波浪谱模型选取方法_中国电建集团成都勘测设计研究院有限公司_202411039936.5

一种火箭模型_徐州市前沿智能科技有限公司_202420368359.3

基于高斯混合模型和隐马尔可夫模型的眼动行为分类方法_中国科学技术大学_202411023991.5

方法相关技术

编码方法及其设备、解码方法及其设备_三星电子株式会社_202411414455.8

图像生成方法、模型的训练方法、图像处理方法、设备和介质_京东方科技集团股份有限公司_202411178775.8

像素电路及其驱动方法、显示面板及其驱动方法_合肥维信诺科技有限公司_202310798771.9

显示面板及其制备方法、驱动方法、显示装置_京东方科技集团股份有限公司_202310558383.3

可重复印标光缆及其制备方法、印标方法和重复印标方法_长飞光纤光缆股份有限公司_202310578778.X

时隙同步方法、时隙分配方法、通信方法及其系统_北京智芯半导体科技有限公司_202411480890.0

样本集生成方法、分类模型训练方法及数据分类方法_华晨宝马汽车有限公司_202310537850.4

任务处理方法、信息抽取方法、文本分类方法、任务处理模型训练方法及基于任务处理模型的信息处理方法_阿里巴巴达摩院(杭州)科技有限公司_202410851095.1

车位检测方法、有效性判断方法、泊车方法、设备和介质_安徽蔚来智驾科技有限公司_202210639084.8

图像处理方法、排序方法及相关装置_联想(北京)有限公司_202411216731.X

龙图腾网&IPTOP

设置信息完成注册

手机号绑定多个账号

训练语言模型的方法及装置

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务