一种基于Inception模块的提示微调方法

买专利卖专利找龙图腾，真高效！查专利查商标用IPTOP,全免费！专利年费监控用IP管家,真方便！

申请/专利权人：成都信息工程大学

摘要：本发明涉及一种基于Inception模块的提示微调方法，通过将一个用于下游任务的提示网络插入预训练模型内部，该网络包含有随机选取预训练模型词表进行初始化的连续提示，以及与连续提示相连接的多个尺寸递增的带有上下投影的瓶颈网络，其形状类似于Inception模块，起到对单一连续提示向量的深度和宽度进行高效扩充的作用。在针对下游任务微调预训练模型时，冻结主干模型使得仅提示网络可以进行参数更新，因提示网络放置于预训练模型的中后部，在反向传播过程中距离较短任务相关信息损失少，同时优化训练时间和内存占用。

主权项：1.一种基于Inception模块的提示微调方法，其特征在于，所述提示微调方法通过将一个用于下游任务的提示生成器模块插入预训练模型内部，在针对下游任务微调预训练模型时，冻结主干模型使得仅提示生成器模块可以进行参数更新，所述提示生成器模块具有三个瓶颈大小不同的瓶颈网络以Inception-Resnet的方式连接得到，实现对信息在多尺度上进行处理，因提示生成器模块放置于预训练模型的中后部，在反向传播过程中距离较短任务相关信息损失少，同时训练时间和内存占用减少，具体包括：步骤1：采集数据集，所述数据集是公开数据集，或通过采集某特定任务短文本数据自行构造的数据集；步骤2：若选用公开数据集则跳过步骤2，若为自行采集的数据则执行步骤2，由标注人员对其进行标注得到标注数据集；步骤3：为步骤1或2得到的数据集中的所有原始句子添加带掩码提示模板，再把所述带掩码提示模板和原始句子结合，作为基础预训练模型的输入输入数据RoBERTainput；步骤4：对于不同的特定任务，通过构建相应的空间答案映射V，同时用空间答案映射V中的真实标签ytrue替代下游任务的训练样本和测试样本的答案，实现将分类任务转为对词汇概率的预测任务；步骤5：预设基础预训练模型的参数，基础预训练模型以RoBERTa为例，不局限于RoBERTa，初始化RoBERTa模型，RoBERTa模型参数至少包括学习率、随机失活和训练轮数以及提示插入层；步骤6：首先将预训练模型的主干冻结，即取消主干参数的梯度，自定义一个提示生成器模块并使该模块可训练，即打开提示生成器模块的梯度，允许其在反向传播阶段进行梯度更新，同时对提示生成器模块的输入和输出维度进行限制，具体设置为预训练模型的隐藏层维度；步骤7：将步骤3所得的输入数据RoBERTainput、位置信息Pos送入词嵌入层获得词嵌入向量hin；步骤8：将由步骤7获取的词嵌入向量hin送入步骤5初始化好的预训练基础模型中，以RoBERTa模型为例，RoBERTa模型为包括24层的编码器模型，将词嵌入向量hin依次输入每一层并判断该层是否是提示添加层，如是提示添加层，则提示生成器模块生成提示，则在前一层输出的隐藏向量h的基础上，合并生成的提示得到新的隐藏向量hnew，将新的隐藏向量hnew代替原有的隐藏向量h继续输入剩余层的编码器模型，得到最后一层隐藏向量hend；步骤9：将步骤8得到的最后一层隐藏向量hend以及步骤3中的所述带掩码提示模板中掩码的位置计算出带掩码隐藏向量hmask，将两者结合得到最终隐藏向量hout；步骤10：将最终隐藏向量hout送入RoBERTa模型头中，得到最后的预测结果ypre；步骤11：通过交叉熵损失计算所述预测结果ypre和步骤4中的真实标签ytrue的差值，将差值通过反向传播传递回整个带有提示生成器模块的预训练模型，并更新提示生成器模块的权重和偏置；步骤12：不断迭代步骤6到步骤11，当所述交叉熵损失值收敛时或到达规定轮次时停止训练，保存训练完成的提示生成器模块；步骤13：训练完成的提示生成器模块即为当前预训练模型在该训练数据集子任务下的附加模块，后续使用预训练模型用于该任务时，只需要将训练好的提示生成器模块载入预训练模型中即可。

全文数据：

权利要求：

百度查询：成都信息工程大学一种基于Inception模块的提示微调方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：轨对轨输入级电路及运算放大器

下一篇：散热器及具有该散热器的燃料电池冷却系统

相关技术

轨对轨输入级电路及运算放大器

散热器及具有该散热器的燃料电池冷却系统

导体迹线结构、转子、转角传感器单元和用于制造转角传感器单元的转子的方法

一种防弹隐身方舱

一种小麦晚播施肥方法及其应用

一种用于碳素生产的布袋除尘装置

一种晶圆预清洗腔室穹顶清洗方法

一种环栅堆叠纳米器件及其制备方法

一种调用链采样方法、装置、设备及介质

基于图像处理的水下机器人的定位方法及相关装置

考虑可替代物料和切换成本的智能生产排程系统和方法

面向语义通信的数字无线传输方法及系统

提示相关技术

列车导航提示方法及装置_北京城建智控科技股份有限公司_202411006656.4

离车前带物提示器_詹国辉_202411089922.4

一种基于Inception模块的提示微调方法_成都信息工程大学_202410891816.1

一种信息提示方法及装置_浙江大华技术股份有限公司_202110775743.6

信息提示方法、装置、存储介质和电子设备_广州博冠信息科技有限公司_202011086233.X

一种邮箱提示器接收端_珠海富景科技有限公司_202420004047.4

耳机电量提示方法、装置、电子设备和存储介质_百度在线网络技术(北京)有限公司_202010682932.4

一种基于电磁波信号的信号触发方法和语音提示系统_上海沿锋汽车科技股份有限公司_202410759011.1

基于共享设备的提示方法、装置、电子设备及存储介质_北京骑胜科技有限公司_201911420057.6

基于安全切面的提示语盗取攻击防御方法及装置_蚂蚁科技集团股份有限公司_202411261676.6

微调相关技术

一种基于Inception模块的提示微调方法_成都信息工程大学_202410891816.1

一种军事大模型的微调训练方法、装置以及设备_厦门渊亭信息科技有限公司_202411274724.5

一种对管端平口手动微调的便携式通用装置_成都派铂宇航科技发展有限公司_202420380124.6

动态搜索低秩适应的大模型微调方法、装置、设备及介质_厦门蝉羽网络科技有限公司_202410766202.0

基于动态信息的模型增量微调方法、系统、设备及介质_广州探域科技有限公司_202410344611.1

面向大模型联邦迁移场外微调的适配器隐私保护方法、系统、设备及介质_西安电子科技大学_202410913795.9

一种用于无线边缘网络的大模型分布式微调联邦分割学习方法、系统及介质_清华大学_202410787393.9

一种模具的外置微调装置_青岛偲迈特工业设备有限公司_202420234218.2

一种微调型轴套式微分头_珠海芯烨电子科技有限公司_202411258242.0

一种芯板切割夹具用微调装置_湖北中科产业技术研究院有限公司_202210863405.2

方法相关技术

通信方法、码本指示方法、通信装置_北京紫光展锐通信技术有限公司_202310363970.7

萃取方法_阿里山制酒股份有限公司_202410147785.9

地震资料前处理方法、静校正处理方法及构造成像方法_中国石油化工股份有限公司_202310355196.5

一种页面处理方法、编译方法、渲染方法及装置_抖音视界有限公司_202310348131.8

胸罩、增大胸部的方法、塑造大胸部的方法_山川谦辅_202380013191.2

数据单元的发送方法、接收方法及装置_华为技术有限公司_201910657446.4

广告出价方法、广告投放方法及其装置、设备、介质_广州方硅信息技术有限公司_202411004892.2

游戏资源的推荐方法、游戏试玩方法及装置_咪咕互动娱乐有限公司_202410958184.6

参考信号的发送方法,接收方法和装置_华为技术有限公司_202310403960.1

信号发射方法、信号接收方法及存储介质_重庆智铸达讯通信有限公司_202411055871.3

龙图腾网&IPTOP

设置信息完成注册

手机号绑定多个账号

一种基于Inception模块的提示微调方法

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务