基于卷积的大模型微调加速方法及装置

买专利卖专利找龙图腾，真高效！查专利查商标用IPTOP,全免费！专利年费监控用IP管家,真方便！

摘要：本公开涉及人工智能领域，提供一种基于卷积的大模型微调加速方法及装置，所述方法包括：获取经过预训练的大模型和微调训练数据；在所述大模型的自注意力模块中引入卷积模块，得到初始微调模型；在固定所述大模型的参数的条件下，利用所述微调训练数据，对所述初始微调模型进行训练，得到微调训练模型；基于所述微调训练模型，得到经过微调的大模型。本公开可以解决对大模型进行微调训练可能会遇到训练内存占用高、训练速度慢、预训练知识遗忘的问题，实现模型对微调训练数据的加速学习，优化模型在微调训练数据所属的任务或领域中的表现。

主权项：1.一种基于卷积的大模型微调加速方法，其特征在于，所述方法包括：获取经过预训练的大模型和微调训练数据，其中，所述大模型包括自注意力模块，所述微调训练数据包括训练样本以及对所述训练样本的标注信息，所述训练样本包括图像数据，所述大模型为视觉大模型或多模态大模型；在所述自注意力模块中引入卷积模块，得到初始微调模型，其中，所述卷积模块的通道数量与所述自注意力模块的注意力头的数量相同，并且所述卷积模块的卷积分组数量与所述注意力头的数量相同；在固定所述大模型的参数的条件下，利用所述微调训练数据，对所述初始微调模型进行训练，得到微调训练模型；基于所述微调训练模型，得到经过微调的大模型。

全文数据：

权利要求：

百度查询：中国科学院自动化研究所基于卷积的大模型微调加速方法及装置

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：一种冷料仓下料自动补偿装置

下一篇：一种酸碱液回收利用装置

相关技术

一种冷料仓下料自动补偿装置

一种酸碱液回收利用装置

酿造结构及酿造装置

5G网络资源动态调整方法

车盖后视装置、行人预警装置、行人预警方法及相关装置

一种磁保持继电器的安装限定结构

一种宠物兽医用雾化治疗箱

发动机壳体铝铸件气密性检测治具及检测设备

一种眼科手术用超声乳化设备

基于多维时序特征的换流变阀侧套管在线绝缘监测方法

一种防护服抗穿刺测试装置

一种具有碰撞缓冲功能的检测浮标

加速相关技术

一种卷积神经网络推理加速器及加速方法_南京宁麒智能计算芯片研究院有限公司_202010348927.X

一种加速管弹性支架_中广核中科海维科技发展有限公司_201910506958.0

用于由数据处理加速器处理数据的方法及数据处理加速器_百度(美国)有限责任公司_202011455568.4

加速度传感器及其信号检测方法_松山湖材料实验室_202411480252.9

用于加速临床工作流程的系统和方法_通用电气公司_201980015990.7

一种矩阵乘法加速器_上海芯圣电子股份有限公司_202411032325.8

基于卷积的大模型微调加速方法及装置_中国科学院自动化研究所_202411455251.9

应力自隔离的石英谐振加速度计芯片及石英谐振加速度计_西安交通大学_202410570355.8

一种粒子加速器用电磁铁快速安装结构_兰州迈思锐技术服务有限公司_202420603107.4

一种加速器引出窗及其制备方法_西安聚能医工科技有限公司_202411498229.2

模型相关技术

基于预训练模型参数融合的模型微调方法_浙江大学_202410989398.X

模型训练方法、模型推理方法和装置_上海壁仞科技股份有限公司_202411175297.5

美发教习模型_青岛金达发制品有限公司_202420253532.5

动漫人物模型尺_刘毅_202411000219.1

模型部署方法及其装置_维沃移动通信有限公司_202411101863.8

模型评测方法及设备_北京达佳互联信息技术有限公司_202210770160.9

钢结构框架教学模型_山东祥云数据科技有限公司_202323392239.1

波浪谱模型选取方法_中国电建集团成都勘测设计研究院有限公司_202411039936.5

一种火箭模型_徐州市前沿智能科技有限公司_202420368359.3

基于高斯混合模型和隐马尔可夫模型的眼动行为分类方法_中国科学技术大学_202411023991.5

方法相关技术

编码方法及其设备、解码方法及其设备_三星电子株式会社_202411414455.8

显示面板及其制备方法、驱动方法、显示装置_京东方科技集团股份有限公司_202310558383.3

像素电路及其驱动方法、显示面板及其驱动方法_合肥维信诺科技有限公司_202310798771.9

图像生成方法、模型的训练方法、图像处理方法、设备和介质_京东方科技集团股份有限公司_202411178775.8

样本集生成方法、分类模型训练方法及数据分类方法_华晨宝马汽车有限公司_202310537850.4

可重复印标光缆及其制备方法、印标方法和重复印标方法_长飞光纤光缆股份有限公司_202310578778.X

时隙同步方法、时隙分配方法、通信方法及其系统_北京智芯半导体科技有限公司_202411480890.0

任务处理方法、信息抽取方法、文本分类方法、任务处理模型训练方法及基于任务处理模型的信息处理方法_阿里巴巴达摩院(杭州)科技有限公司_202410851095.1

车位检测方法、有效性判断方法、泊车方法、设备和介质_安徽蔚来智驾科技有限公司_202210639084.8

一种计算机系统、启动方法、睡眠方法及唤醒方法_华为技术有限公司_202310574053.3

龙图腾网&IPTOP

设置信息完成注册

手机号绑定多个账号

基于卷积的大模型微调加速方法及装置

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务