基于微调的阅读领域大模型优化方法及伴读文稿生成方法

导航：龙图腾网> 最新专利技术> 基于微调的阅读领域大模型优化方法及伴读文稿生成方法

买专利卖专利找龙图腾，真高效！查专利查商标用IPTOP,全免费！专利年费监控用IP管家,真方便！

摘要：本申请公开了一种基于微调的阅读领域大模型优化方法及伴读文稿生成方法，方法包括：获取伴读文稿的文稿生成需求和本地语料库，文稿生成需求用于表征生成伴读文稿的要求，本地语料库是基于少儿语言领域的伴读文本数据进行构建的；根据文稿生成需求，从大语言模型中确定待微调参数，待微调参数为大语言模型中适用于文稿生成需求的部分参数；根据本地语料库中的训练语料和待微调参数，微调并优化大语言模型，得到预先训练的伴读文稿生成模型。因此，采用本申请实施例，可以使得生成的伴读文稿能够准确捕捉少儿语境的需求，同时在处理复杂语法结构和文学修饰时不会出现误解，从而保证了生成风格一致的文稿内容。

主权项：1.一种基于微调的阅读领域大模型优化方法，其特征在于，所述方法包括：获取伴读文稿的文稿生成需求和本地语料库，所述文稿生成需求用于表征生成伴读文稿的要求，所述本地语料库是基于少儿语言领域的伴读文本数据进行构建的；根据所述文稿生成需求，从大语言模型中确定待微调参数，所述待微调参数为所述大语言模型中适用于所述文稿生成需求的部分参数；根据所述本地语料库中的训练语料和所述待微调参数，微调并优化所述大语言模型，得到预先训练的伴读文稿生成模型；其中，所述根据所述本地语料库中的训练语料和所述待微调参数，微调并优化所述大语言模型，包括：预处理所述本地语料库中的训练语料，得到训练数据集和测试数据集；对所述待微调参数进行矩阵低秩分解，得到分解后的第一参数矩阵和第二参数矩阵，所述第一参数矩阵包含与所述大语言模型中原始权重矩阵的列相关的变换参数，所述第二参数矩阵包含与所述大语言模型中原始权重矩阵的行相关的变换参数；根据所述训练数据集、所述第一参数矩阵和第二参数矩阵，对所述大语言模型进行微调；根据所述测试数据集，对微调后的大语言模型进行优化；其中，，为所述原始权重矩阵，为一个大小为的矩阵，表示矩阵的行数，表示矩阵的列数，为低秩分解中的秩，用于控制近似的精度和参数的数量，为所述第一参数矩阵，为所述第二参数矩阵；其中，所述根据所述训练数据集、所述第一参数矩阵和第二参数矩阵，对所述大语言模型进行微调，包括：根据第一训练数据、所述第一参数矩阵和第二参数矩阵，计算模型的前向传播结果，所述第一训练数据为所述训练数据集中每个训练数据；根据所述前向传播结果以及预设损失函数，计算所述大语言模型的模型损失值，所述预设损失函数是将所述大语言模型的原始损失函数中模型参数冻结并替换为所述第一参数矩阵和第二参数矩阵得到的；在所述模型损失值到达最小的情况下，得到微调后的大语言模型；其中，所述前向传播结果的计算公式为：其中，为前向传播结果，为第一训练数据，为矩阵低秩分解的结果；所述预设损失函数为：其中，是在时间步的前向传播结果，是原始权重矩阵，是偏置项，为激活函数，为时间步的第一训练数据，为待微调参数，为优化目标是最大化参数集合的损失值，为第一训练数据，为训练数据的标签，为训练数据集，表示输出序列的长度，为对数概率，为大语言模型的原始参数，为低秩更新参数，是时间步的标签。

全文数据：

权利要求：

百度查询：北京奇趣万物科技有限公司基于微调的阅读领域大模型优化方法及伴读文稿生成方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：一种光伏支架及其单元结构

下一篇：一种防护服抗穿刺测试装置

相关技术

一种光伏支架及其单元结构

一种防护服抗穿刺测试装置

一种复合垫片的双密封面加工设备及加工工艺

一种建筑消防救援机器人

表壳装配结构和手表

一种钢筋布设间距检测装置

一种具有碰撞缓冲功能的检测浮标

一种眼科手术用超声乳化设备

一种酸碱储槽的酸雾吸收装置

一种磁保持继电器的安装限定结构

北美型猪繁殖与呼吸综合征病毒囊膜主要糖蛋白GP5的保守中和表位QT7、核酸分子、表达载体、中和抗体及其应用

一种低盐红茶香咸鸭蛋腌制方法

优化相关技术

优化的弹簧笼_赫斯曼汽车有限公司_202380034185.5

梯级水库群优化调度并行变参数模拟退火优化方法_长江勘测规划设计研究有限责任公司_202411019942.4

一种电机运行数据的无线传输优化方法及优化系统_常州全一智能科技有限公司_202411498542.6

一种多目标优化的5G基站布局优化方法_陕西智引科技有限公司_202410944738.7

一种优化单晶铸件晶粒生长方向的装置及优化方法_苏州高晶新材料科技有限公司_202411106175.0

一种基于改进季节优化算法的无人机速度控制优化方法_欧冶链金再生资源有限公司_202411106739.0

空气优化设备的无极调压调速电路及空气优化设备_青岛普兴正道空气消毒有限公司_202010382835.3

一种基于优化算法的配电网自愈策略优化方法及系统_贵州电网有限责任公司_202410885378.8

基于持续优化迭代的电网控制优化系统和方法_国网新疆电力有限公司巴州供电公司_202411159690.5

跟踪目标的定位优化方法_重庆工商大学_202210354094.7

方法相关技术

编码方法及其设备、解码方法及其设备_三星电子株式会社_202411414455.8

图像生成方法、模型的训练方法、图像处理方法、设备和介质_京东方科技集团股份有限公司_202411178775.8

像素电路及其驱动方法、显示面板及其驱动方法_合肥维信诺科技有限公司_202310798771.9

显示面板及其制备方法、驱动方法、显示装置_京东方科技集团股份有限公司_202310558383.3

可重复印标光缆及其制备方法、印标方法和重复印标方法_长飞光纤光缆股份有限公司_202310578778.X

时隙同步方法、时隙分配方法、通信方法及其系统_北京智芯半导体科技有限公司_202411480890.0

样本集生成方法、分类模型训练方法及数据分类方法_华晨宝马汽车有限公司_202310537850.4

任务处理方法、信息抽取方法、文本分类方法、任务处理模型训练方法及基于任务处理模型的信息处理方法_阿里巴巴达摩院(杭州)科技有限公司_202410851095.1

车位检测方法、有效性判断方法、泊车方法、设备和介质_安徽蔚来智驾科技有限公司_202210639084.8

图像处理方法、排序方法及相关装置_联想(北京)有限公司_202411216731.X

模型相关技术

基于预训练模型参数融合的模型微调方法_浙江大学_202410989398.X

模型训练方法、模型推理方法和装置_上海壁仞科技股份有限公司_202411175297.5

美发教习模型_青岛金达发制品有限公司_202420253532.5

动漫人物模型尺_刘毅_202411000219.1

模型部署方法及其装置_维沃移动通信有限公司_202411101863.8

模型评测方法及设备_北京达佳互联信息技术有限公司_202210770160.9

钢结构框架教学模型_山东祥云数据科技有限公司_202323392239.1

波浪谱模型选取方法_中国电建集团成都勘测设计研究院有限公司_202411039936.5

一种火箭模型_徐州市前沿智能科技有限公司_202420368359.3

基于高斯混合模型和隐马尔可夫模型的眼动行为分类方法_中国科学技术大学_202411023991.5

龙图腾网&IPTOP

设置信息完成注册

手机号绑定多个账号

基于微调的阅读领域大模型优化方法及伴读文稿生成方法

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务