西安电子科技大学齐飞获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉西安电子科技大学申请的专利一种多任务增强场景文本识别方法及系统获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN114821559B 。
龙图腾网通过国家知识产权局官网在2025-07-15发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202210339990.6,技术领域涉及:G06V20/62;该发明授权一种多任务增强场景文本识别方法及系统是由齐飞;李景泉;邓亚鹏;石光明设计研发完成,并于2022-04-01向国家知识产权局提交的专利申请。
本一种多任务增强场景文本识别方法及系统在说明书摘要公布了:本发明提供了一种多任务增强场景文本识别方法及系统,通过将第一场景原始信息输入矫正网络模块,生成第一矫正结果信息输入特征生成模块,获得第一文本特征信息;输入上下文建模模块、分支任务模块,获得第一上下文建模结果、第二文本识别结果;将第一上下文建模结果输入预测模块,获得第一文本识别结果;根据第一文本识别结果和第二文本识别结果训练多任务增强场景文本识别模型;将第二场景原始信息输入获得第一多任务文本识别结果。解决了现有技术中文字检测识别在保持速度和规模不变条件下,识别率难以提升,而影响文字识别精准度的技术问题。达到利用多任务多模型统一架构稳定提升模型性能,推理阶段没有任何规模和速度损失的技术效果。
本发明授权一种多任务增强场景文本识别方法及系统在权利要求书中公布了:1.一种多任务增强场景文本识别方法,其特征在于,所述方法应用一种多任务增强场景文本识别模型,所述模型包括矫正网络模块、特征生成模块、上下文建模模块、预测模块和分支任务模块,所述方法包括: 将第一场景原始信息输入矫正网络模块,生成第一矫正结果信息; 将所述第一矫正结果信息输入特征生成模块,获得第一文本特征信息; 将所述第一文本特征信息输入上下文建模模块,获得第一上下文建模结果; 将所述第一上下文建模结果输入预测模块,获得第一文本识别结果; 将所述第一文本特征信息输入分支任务模块,生成第二文本识别结果; 根据所述第一文本识别结果和所述第二文本识别结果训练多任务增强场景文本识别模型; 将第二场景原始信息输入所述多任务增强场景文本识别模型,获得第一多任务文本识别结果; 所述将所述第一文本特征信息输入分支任务模块,生成第二文本识别结果,包括: 根据所述分支任务模块,获得第一分支任务模块和或第二分支任务模块; 将所述第一文本特征信息输入所述第一分支任务模块,获得第一任务文本识别结果; 将所述第一文本特征信息输入所述第二分支任务模块,获得第二任务文本识别结果; 所述将所述第一文本特征信息输入所述第一分支任务模块,获得第一任务文本识别结果,包括: 根据所述第一文本特征信息,生成第一位置编码; 基于注意力机制通过所述第一文本特征和所述第一位置编码进行特征融合,获得第一位置融合特征; 将所述第一位置融合特征输入第一全连接层进行存在性特征提取,再通过Sigmoid激活函数进行处理后,获得第一存在性特征; 将所述第一存在性特征输入长度预测公式,获得第一字符串长度预测结果; 其中,所述长度预测公式为: 其中,表示当前位置的字符串长度预测结果,表示表征的字符串长度在对应位置的存在性特征,为表征的字符串长度对应的权重,为个字符串长度组成的取值矩阵,表示最长的字符串长度,表示存在性特征,表示字符串长度的取值矩阵; 所述将所述第一文本特征信息输入所述第二分支任务模块,获得第二任务文本识别结果,包括: 第二分支任务模块为引入各类型字符数量统计的任务; 遍历所述第一文本特征信息,生成第一查询向量; 基于注意力机制将所述第一查询向量输入第一字符融合特征计算公式进行特征融合,获得第一字符融合特征; 其中,所述第一字符融合特征计算公式为: 其中,表示字符融合特征,表示文本特征占据权重,表示个维度的文本特征权重组成的取值矩阵,表示文本特征维度数,表示文本特征,表示文本特征对应的字符特征; 将所述第一字符融合特征输入第二全连接层,获得第一分类结果,包括利用注意机制对第一查询向量、图像特征及其变换作为键值对,进行特征融合,计算融合特征,将对每个字符得到的融合特征通过一个全连接层即第二全连接层进行分类; 所述遍历所述第一文本特征信息,生成第一查询向量,包括: 获得第一查询向量计算公式: 其中,表示查询向量,表示字符集的编码集合,为可学习的字符集对应的权重矩阵,表示字符集中的字符数量,为个字符集中字符数量组成的取值矩阵,为D个特征维度对应的字符数量组成的取值矩阵; 遍历所述第一文本特征进行编码提取,获得第一字符编码集; 将所述第一字符编码集输入所述第一查询向量计算公式,获得所述第一查询向量。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人西安电子科技大学,其通讯地址为:710071 陕西省西安市太白南路2号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。