模型训练方法、模型推理方法和装置

买专利卖专利找龙图腾，真高效！查专利查商标用IPTOP,全免费！专利年费监控用IP管家,真方便！

摘要：本申请提供一种模型训练方法、模型推理方法和装置，涉及人工智能技术领域，包括：基于当前步长对当前长度的输入文本对应的键值缓存进行分块；基于当前权重阈值以及所述键值缓存的各个分块对模型推理结果的影响权重，对各个分块进行筛选；对所述当前步长和所述当前权重阈值进行调整，确定步长设定值和权重阈值设定值；所述步长设定值和所述权重阈值设定值用于在模型推理阶段对所述当前长度的输入文本对应的键值缓存进行分块和筛选。本申请提供的方法和装置，使得大语言模型在进行推理时可以减少显存占用量同时保证模型推理的精度，提高了大语言模型对长文本的处理能力。

主权项：1.一种模型训练方法，其特征在于，包括：基于当前步长对当前长度的输入文本对应的键值缓存进行分块；基于当前权重阈值以及所述键值缓存的各个分块对模型推理结果的影响权重，对各个分块进行筛选；对所述当前步长和所述当前权重阈值进行调整，确定步长设定值和权重阈值设定值；其中，所述步长设定值和所述权重阈值设定值用于在模型推理阶段对所述当前长度的输入文本对应的键值缓存进行分块和筛选。

全文数据：

权利要求：

百度查询：上海壁仞科技股份有限公司模型训练方法、模型推理方法和装置

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：一种学习坐姿及学习休息提醒纠正检测装置

下一篇：装修用装饰面板

相关技术

一种学习坐姿及学习休息提醒纠正检测装置

装修用装饰面板

一种花卉基质打散混合装置及方法

一种下肢康复智能训练仪

一种农产品供应链信息管理系统

一种冷凝器组装生产平台

核桃油指纹图谱构建及掺假鉴别用平台系统

一种用于过滤器焊接的定位夹持装置

一种控制稻田甲烷排放的沼液施用装置及其方法

一种电池涂层、电池、电池组、用电设备

一种防盗门的通风除尘装置

一种胺脱氢酶、基因、重组菌、胺脱氢酶粗酶液、脱氢酶组合物、脱氢酶粗酶液组合物和制备(R)-3-氨基丁醇的方法

推理相关技术

基于推理模板的大模型意图推理方法、装置、设备及介质_北京神州泰岳软件股份有限公司_202411009030.9

一种基于逻辑推理的知识图谱推理引擎数据处理方法_戎行技术有限公司_202411073804.4

模型推理方法、装置、电子设备和存储介质_上海壁仞科技股份有限公司_202411207298.3

AI语音识别、推理、生成系统及方法_深圳镜天网络科技有限公司_202410638382.4

模型训练方法、模型推理方法和装置_上海壁仞科技股份有限公司_202411175297.5

一种MCU的网络模型推理故障处理方法及系统_山东浪潮科学研究院有限公司_202410958227.0

基于自我问答的可信多模态大模型推理方法及装置_中国科学院自动化研究所_202411465874.4

一种数据自采集的模型推理服务系统及方法_深圳市魔数智擎人工智能有限公司_202311496254.2

大语言模型推理的动态批处理方法、装置、设备及介质_北京燧原智能科技有限公司_202411496229.9

一种模型推理优化方法、设备、存储介质及程序产品_北京壁仞科技开发有限公司_202411127891.7

模型相关技术

基于预训练模型参数融合的模型微调方法_浙江大学_202410989398.X

模型训练方法、模型推理方法和装置_上海壁仞科技股份有限公司_202411175297.5

美发教习模型_青岛金达发制品有限公司_202420253532.5

动漫人物模型尺_刘毅_202411000219.1

模型部署方法及其装置_维沃移动通信有限公司_202411101863.8

模型评测方法及设备_北京达佳互联信息技术有限公司_202210770160.9

钢结构框架教学模型_山东祥云数据科技有限公司_202323392239.1

波浪谱模型选取方法_中国电建集团成都勘测设计研究院有限公司_202411039936.5

一种火箭模型_徐州市前沿智能科技有限公司_202420368359.3

基于高斯混合模型和隐马尔可夫模型的眼动行为分类方法_中国科学技术大学_202411023991.5

方法相关技术

编码方法及其设备、解码方法及其设备_三星电子株式会社_202411414455.8

图像生成方法、模型的训练方法、图像处理方法、设备和介质_京东方科技集团股份有限公司_202411178775.8

像素电路及其驱动方法、显示面板及其驱动方法_合肥维信诺科技有限公司_202310798771.9

显示面板及其制备方法、驱动方法、显示装置_京东方科技集团股份有限公司_202310558383.3

可重复印标光缆及其制备方法、印标方法和重复印标方法_长飞光纤光缆股份有限公司_202310578778.X

时隙同步方法、时隙分配方法、通信方法及其系统_北京智芯半导体科技有限公司_202411480890.0

样本集生成方法、分类模型训练方法及数据分类方法_华晨宝马汽车有限公司_202310537850.4

任务处理方法、信息抽取方法、文本分类方法、任务处理模型训练方法及基于任务处理模型的信息处理方法_阿里巴巴达摩院(杭州)科技有限公司_202410851095.1

车位检测方法、有效性判断方法、泊车方法、设备和介质_安徽蔚来智驾科技有限公司_202210639084.8

图像处理方法、排序方法及相关装置_联想(北京)有限公司_202411216731.X

龙图腾网&IPTOP

设置信息完成注册

手机号绑定多个账号

模型训练方法、模型推理方法和装置

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务