买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
申请/专利权人:马上消费金融股份有限公司
摘要:本申请公开一种模型构建方法、文本处理方法及装置,该方法包括:基于对比学习,利用第一训练集对预训练的第一文本模型进行第一模型训练,得到第二文本模型,第一训练集包括正样本和负样本,正样本和负样本均为短句且带有音律短词标注,正样本包括设置在第一位置的符号,负样本包括设置在第二位置的符号,第一位置为音律短词在样本中的位置,第二位置与第一位置不同且不为句尾;基于第二文本模型进行模型构建,得到韵律短词预测模型。即通过对比学习正、负样本,使得第二文本模型在第一文本模型的基础上增加了能够识别韵律短词的能力,进而使得基于第二文本模型构建得到的韵律短词预测模型具有能够识别韵律短词的能力。
主权项:1.一种模型构建方法,其特征在于,所述方法包括:基于对比学习,利用第一训练集对预训练的第一文本模型进行第一模型训练,得到第二文本模型,所述第一训练集包括正样本和负样本,所述正样本和所述负样本均为短句且带有音律短词标注,所述正样本包括设置在第一位置的符号,所述负样本包括设置在第二位置的符号,所述第一位置为音律短词在样本中的位置,所述第二位置与所述第一位置不同且不为句尾;基于所述第二文本模型进行模型构建,得到韵律短词预测模型。
全文数据:
权利要求:
百度查询: 马上消费金融股份有限公司 模型构建方法、文本处理方法及装置
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。