一种对于文本嵌入模型的优化方法

买专利卖专利找龙图腾，真高效！查专利查商标用IPTOP,全免费！专利年费监控用IP管家,真方便！

申请/专利权人：众数(厦门)信息科技有限公司;厦门众数寻知人工智能有限公司

摘要：本发明公开了一种对于文本嵌入模型的优化方法，包括以下步骤：S1、在文本嵌入模型中，将K参数矩阵和V参数矩阵联合为一个大KV矩阵，再采用低秩矩阵分解将大KV矩阵分解替换为两个维度更低的矩阵；S2、在文本嵌入模型中，将Q参数矩阵分解替换为两个维度更低的矩阵；S3、采用稀疏混合专家模型，使用由多个专家模块与一个专家选择门结合，以最优的选择嵌入维度输出；该方法在原通用Embedding模型的基础结构上，针对编码层中的注意力主要计算模块进行优化，以在保留模型最大性能的前提下提升推理效率；针对中间计算模块做出改进，扩充模型的学习维度、增强学习能力，进一步提升输出嵌入对离散数据的表达能力。

主权项：1.一种对于文本嵌入模型的优化方法，其特征在于，包括以下步骤：S1、在文本嵌入模型中，将K参数矩阵和V参数矩阵联合为一个大KV矩阵，再采用低秩矩阵分解将大KV矩阵分解替换为两个维度更低的矩阵；步骤S1的具体过程为：S11、将原本用于分别计算K参数和V参数的K参数矩阵和V参数矩阵联合为一个大KV矩阵，并将大KV矩阵分解为两个维度更低的矩阵和矩阵，计算公式为：，，，其中，K参数矩阵为，，表示维度大小为行列的实数矩阵的集合；V参数矩阵为，，表示维度大小为行列的实数矩阵的集合；大KV矩阵为，，表示维度大小为行列的实数矩阵的集合；表示维度大小为行列的实数矩阵的集合；表示维度大小为行列的实数矩阵的集合；表示合并后的大KV矩阵的原始列维度大小；表示降维后的、的对应中间维度大小；S12、将矩阵和矩阵分别替换原本的K参数矩阵和V参数矩阵，用于分别计算K参数和V参数，计算公式为：，，，其中，表示token的隐藏状态特征向量，表示维度大小为的实数向量集合；表示token的被合并的key和value特征向量，表示维度大小为的实数向量集合；表示token的key特征向量，表示维度大小为的实数向量集合；表示token的value特征向量，表示维度大小为的实数向量集合；S2、在文本嵌入模型中，将Q参数矩阵分解替换为两个维度更低的矩阵；步骤S2的具体过程为：S21、将Q参数矩阵分解为两个维度更低的矩阵和矩阵，计算公式为：，，，，其中，Q参数矩阵为，，表示维度大小为行列的实数矩阵的集合；表示维度大小为行列的实数矩阵的集合；表示维度大小为行列的实数矩阵的集合；表示的原始列维度大小；表示降维后的、的对应中间维度大小；S22、将矩阵和替换原本的Q参数矩阵，用于计算Q参数，计算公式为：，，其中，表示token的query特征向量，表示维度大小为的实数向量集合；S3、采用稀疏混合专家模型，使用由多个专家模块与一个专家选择门结合，以最优的选择嵌入维度输出；所述Q参数矩阵的降维程度低于大KV矩阵，用于不影响注意力输出的表达效果和丢失过多注意力信息，即。

全文数据：

权利要求：

百度查询：众数(厦门)信息科技有限公司厦门众数寻知人工智能有限公司一种对于文本嵌入模型的优化方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：植物的耐热性或耐干燥性提高剂、耐盐性提高剂、活性提高剂

下一篇：一种平开窗

相关技术

植物的耐热性或耐干燥性提高剂、耐盐性提高剂、活性提高剂

一种平开窗

一种风电场景下超大二维码定位识别系统及方法

一种铅酸电池自动组装设备及工艺

一种轮胎X光检验机输送定位系统及工作方法

一种一体式行星齿轮组减速机构

设备健康预测方法和计算机可读存储介质

一种高速公路路网级路面养护中长期规划决策方法及系统

一种室内立式蔬菜栽培架

一种纤维假捻纺纱设备及用于复合纤维的纺纱工艺

一种基于蜣螂优化算法的智能车轨迹跟踪控制方法

用于处理振动信号的方法、计算设备和存储介质

嵌入相关技术

一种嵌入式冰箱连接器及其嵌入式冰箱_创维电器股份有限公司_202323620928.3

一种对于文本嵌入模型的优化方法_众数(厦门)信息科技有限公司_202410974663.7

一种嵌入式钢筋笼下放平台_中交二航局第四工程有限公司_202411085032.6

一种嵌入式触摸屏_深圳易拓创兴科技有限公司_202420610128.9

一种嵌入安装式移动配电柜_江苏东浩电力设备有限公司_202410925682.0

一种嵌入式水冷服务器_深圳市思创华源科技有限公司_202411163754.9

安装装置及嵌入式灯具_深圳市拓享科技有限公司_202411315991.2

一种基于双操作系统的嵌入式机载板卡实现方法_陕西千山航空电子有限责任公司_202410721748.4

多模态特征嵌入的室内三维场景理解方法及终端_深圳大学_202411436931.6

一种带钢衬板嵌入合金板压合装置_南京天保昌冶金机械配件有限公司_202420604956.1

优化相关技术

系统优化方法_微软技术许可有限责任公司_202380032043.5

GPU波到波优化_高通股份有限公司_202380031752.1

光伏功率优化器_天合光能股份有限公司_202411129409.3

一种基于拓扑优化的液冷板流道设计与优化方法_桂林电子科技大学_202411040914.0

混合储能系统能量分配及容量优化的双层优化配置方法及系统_中国大唐集团科学技术研究总院有限公司华东电力试验研究院_202410908979.6

基于多目标优化算法的高性能金属玻璃模具优化方法_常熟理工学院_202411266139.0

分割掩码的优化及装置_浙江吉利控股集团有限公司_202411425187.X

优化的多重连接和数据复制_诺基亚技术有限公司_201980092116.3

河道排口生态优化系统_深圳贵人生态建设有限公司_202420506050.6

智能包装设计优化系统_金华信园科技有限公司_202411448497.3

方法相关技术

塔吊设备及其安装方法、控制方法_中国长江三峡集团有限公司_202310938789.4

图像编码/解码方法和发送方法_LX半导体科技有限公司_202411300302.0

配制方法_诺和诺德股份有限公司_202380032098.6

学习系统、确定系统和预测系统以及学习方法、确定方法和预测方法_富士胶片株式会社_202380031812.X

层叠设计方法、焊接条件设定方法、焊接控制方法、焊接控制装置及焊接系统_日商神钢机器人股份有限公司_202280095094.8

喷浆方法_徐州吉安矿业科技有限公司_202411091708.2

资源配置方法、资源发送方法、资源测量方法及电子设备_成都爱瑞无线科技有限公司_202411141003.7

汽车玻璃的设计方法、控制方法和车辆_中国第一汽车股份有限公司_202410996170.3

高粘度废酸过滤处理方法、反冲洗方法_深圳瑞赛环保科技有限公司_202411109671.1

光学模块的调整方法以及检查方法_松下知识产权经营株式会社_202380033876.3

龙图腾网&IPTOP

设置信息完成注册

手机号绑定多个账号

一种对于文本嵌入模型的优化方法

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务