平安科技(深圳)有限公司颜泽龙获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉平安科技(深圳)有限公司申请的专利文本匹配模型训练方法、装置、电子设备及存储介质获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN113850383B 。
龙图腾网通过国家知识产权局官网在2025-07-25发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202111134466.7,技术领域涉及:G06N3/088;该发明授权文本匹配模型训练方法、装置、电子设备及存储介质是由颜泽龙;王健宗设计研发完成,并于2021-09-27向国家知识产权局提交的专利申请。
本文本匹配模型训练方法、装置、电子设备及存储介质在说明书摘要公布了:本申请涉及人工智能,提供了文本匹配模型训练方法,包括:获取文本匹配模型,所述文本匹配模型包括预训练的BERT模型,所述预训练的BERT模型包括dropout层;获取训练数据,所述训练数据中的数据样本不包括标签;至少两次输入所述训练数据至所述文本匹配模型,分别获得所述文本匹配模型的输出结果;获取所述输出结果间的相似度表示;基于所述相似度表示对应的损失函数,优化模型中的参数,得到训练完成的文本匹配模型。通过在BERT模型中设置具有确定激活比例的dropout层,并对同一数据输入两次,基于两次输出结果的不同进行反向参数优化,由于无需使用带有标签的数据,因此降低了模型训练的代价,提升了模型训练的效率。
本发明授权文本匹配模型训练方法、装置、电子设备及存储介质在权利要求书中公布了:1.一种文本匹配模型训练方法,包括: 获取文本匹配模型,所述文本匹配模型包括预训练的BERT模型,所述预训练的BERT模型包括dropout层,其中,所述dropout层的激活比例小于1; 获取训练数据,所述训练数据中的数据样本不包括标签; 将所述训练数据超过两次输入至所述文本匹配模型中,分别获得所述文本匹配模型的多个输出结果; 获取所述训练数据超过两次输入至所述文本匹配模型中的多个输出结果{si,1,si,2,...si,k},其中,i表示每个训练数据的标号,i=1,2,…,N,k表示这个训练数据输入至所述文本匹配模型的次数,k大于2; 使用Cosine余弦公式,计算任意两个输出结果间的距离Cosinsi,m,si,n,其中m,n表示任意两个输出结果的标号;所述距离Cosinsi,m,si,n为两个输出结果间的相似度表示; 基于所述相似度表示对应的损失函数,通过反向传播算法优化所述文本匹配模型中的参数,得到训练完成的文本匹配模型;其中,所述文本匹配模型的每一网络层后加入所述dropout层,通过所述dropout层在每一次的迭代中随机丢弃部分训练参数; 将所述训练数据至训练后的所述文本匹配模型中,并将输出结果作为标准文本数据。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人平安科技(深圳)有限公司,其通讯地址为:518000 广东省深圳市福田区福田街道福安社区益田路5033号平安金融中心23楼;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。