上海哔哩哔哩科技有限公司谢彧获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉上海哔哩哔哩科技有限公司申请的专利模型训练方法、用于检测和识别文本的方法及相关装置获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN119418321B 。
龙图腾网通过国家知识产权局官网在2025-09-30发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202411537538.6,技术领域涉及:G06V20/62;该发明授权模型训练方法、用于检测和识别文本的方法及相关装置是由谢彧;张婕蕾设计研发完成,并于2024-10-30向国家知识产权局提交的专利申请。
本模型训练方法、用于检测和识别文本的方法及相关装置在说明书摘要公布了:本申请提供了一种模型训练方法、用于检测和识别文本的方装置、电子设备、计算机可读介质和计算机程序产品。本申请的方法包括:获取目标任务对应的训练图像集,所述目标任务为同时检测和识别图像中的文本;使用基于贝塞尔曲线的降噪训练方法来训练目标模型,其中,所述方法通过冻结目标参数来针对目标模型的词表映射层和目标任务对应的部分进行训练;将已冻结的参数解冻后,基于训练图像集对目标模型进行微调。本申请通过采用基于贝塞尔曲线的降噪方法来训练模型,进而使用训练好的模型来同时对输入图像中包含的文本进行检测和识别,提升了文本检测和识别的准确性,提升了效率。
本发明授权模型训练方法、用于检测和识别文本的方法及相关装置在权利要求书中公布了:1.一种模型训练方法,包括: 获取目标任务对应的训练图像集,所述目标任务为同时检测和识别图像中的文本; 使用基于贝塞尔曲线的降噪训练方法来训练目标模型,其中,所述方法通过冻结目标模型中目标参数之外的参数来针对目标参数相应的部分进行训练; 将已冻结的参数解冻后,基于训练图像集对目标模型进行微调; 其中,所述方法还包括: 对目标模型进行预训练,以供所述目标模型学习到通用的特征表示; 其中,所述目标模型为基于Transformer架构的模型,该模型的结构包括骨干网络、编码器和解码器,所述方法通过以下步骤来训练所述模型: 在骨干网络中对输入图像进行全局特征提取处理,得到相应的全局特征和局部特征; 在编码器中进一步提取输入图像的全局特征; 在解码器中基于所述全局特征,进一步对输入图像进行局部特征提取处理,得到相应的局部特征; 在解码器中应用基于贝塞尔曲线的降噪训练方法来训练模型; 其中,所述基于Transformer架构的模型还包括检测头和识别头,通过所述检测头来进行文本检测并通过所述识别头来进行文本识别。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人上海哔哩哔哩科技有限公司,其通讯地址为:200433 上海市杨浦区四平路1945号1641室;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励