一种句子向量模型训练方法

买专利卖专利找龙图腾，真高效！查专利查商标用IPTOP,全免费！专利年费监控用IP管家,真方便！

申请/专利权人：临沂中科好孕智能技术有限公司

摘要：本发明提供一种句子向量模型训练方法，包括：S1、对多个原始句子进行数据增强处理，得到每个原始句子的多个相似句子，将所有句子复制多份后用于构建多个句子对及其相似性标签；S2、用BERT模型基于所述多个句子对进行预训练，得到第一BERT模型，其中，所述预训练包括利用句子对进行掩码语言模型预训练以及利用句子对和相似性标签进行的判断两个句子是否相似的预训练；S3、利用相应领域的任务对应的分类数据集对第一BERT模型进行微调，得到句子向量模型，该模型具有较好的泛化能力。基于句子向量模型采用的文本检索方法，提高文本检索效率。

主权项：1.一种句子向量模型训练方法，其特征在于，包括：S1、对多个原始句子进行数据增强处理，得到每个原始句子的多个相似句子，将所有句子复制多份后用于构建多个句子对及其相似性标签；S2、用BERT模型基于所述多个句子对进行预训练，得到第一BERT模型，其中，所述预训练包括利用句子对进行掩码语言模型预训练以及利用句子对和相似性标签进行的判断两个句子是否相似的预训练；S3、利用相应领域的任务对应的分类数据集对第一BERT模型进行微调，得到句子向量模型；其中，所述预训练的学习过程包括：随机遮罩句子对中预定比例的词，在BERT模型中进行掩码语言模型预训练，获得遮罩词的预测结果，基于预测结果和遮罩的原词计算第一子损失；将句子对输入BERT模型中进行二分类预训练，获得指示句子对中两个句子是否相似的分类结果，根据分类结果和相似性标签计算第二子损失；利用第一子损失和第二子损失加权求和的总损失通过反向传播更新BERT模型参数，得到第一BERT模型。

全文数据：

权利要求：

百度查询：临沂中科好孕智能技术有限公司一种句子向量模型训练方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：具有均匀氢键合相互作用、同碱基对和异碱基对偏好以及错配辨别力的修饰核碱基

下一篇：一种一体式行星齿轮组减速机构

相关技术

具有均匀氢键合相互作用、同碱基对和异碱基对偏好以及错配辨别力的修饰核碱基

一种一体式行星齿轮组减速机构

一种可热封餐盒及其制备方法

植物的耐热性或耐干燥性提高剂、耐盐性提高剂、活性提高剂

一种光伏构件

基于鸿蒙系统的Web端与原生同步通信方法、系统及产品

基于大语言模型的代码处理方法、装置、设备和介质

一种高速公路路网级路面养护中长期规划决策方法及系统

信息展示方法及电子设备

投屏声音故障的确定方法、装置、电子设备和存储介质

一种铅酸电池自动组装设备及工艺

一种面向桥梁微形变监测的基于微流道技术的平面电容型微位移传感器

龙图腾网&IPTOP

设置信息完成注册

手机号绑定多个账号

一种句子向量模型训练方法

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务