华南理工大学刘发贵获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉华南理工大学申请的专利一种基于深度学习的文本检测与识别的端到端方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN116758552B 。
龙图腾网通过国家知识产权局官网在2026-01-16发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202310866899.4,技术领域涉及:G06V30/18;该发明授权一种基于深度学习的文本检测与识别的端到端方法是由刘发贵;陈希;朱伯远设计研发完成,并于2023-07-14向国家知识产权局提交的专利申请。
本一种基于深度学习的文本检测与识别的端到端方法在说明书摘要公布了:本发明公开了一种基于深度学习的文本检测与识别的端到端方法,包括以下步骤:构建并训练基于神经网络的端到端模型,使用训练完成的端到端模型对给定图像中的文档文本进行检测和识别。本发明的文本检测与识别的端到端模型,在骨架网络阶段,通过设计的融合模块达成跨尺度的特征融合,不仅降低了计算开销,还提高了模型的精度;在训练的优化阶段,通过联合文本检测任务的损失函数和文本识别的损失函数,兼顾了文本检测与识别的损失,同时优化文本检测与文本识别任务,降低训练带来的时间成本;在推理阶段,模型只需要进行一次向前推理,就可以在较低代价下同时获取文本框和对应的置信度、文本内容。
本发明授权一种基于深度学习的文本检测与识别的端到端方法在权利要求书中公布了:1.一种基于深度学习的文本检测与识别的端到端方法,其特征在于,包括以下步骤: S1、构建并训练基于神经网络的文本检测与识别的端到端模型;包括以下步骤: S1.1、构建非对称的双分支特征提取网络,双分支特征提取网络分别用于提取局部信息和全局信息,并采用自适应加权的融合模块结合双分支的信息以获取特征图; S1.2、使用可微分二值化的方法获取特征图中的概率信息和阈值信息,并将特征图中的概率信息和阈值信息结合为用于区分文本区域与非文本区域的二值信息,将概率信息、阈值信息、二值信息作为检测分支的输出; S1.3、在训练模式下,从训练标签获取文本框;在推理模式下,从二值信息获取文本框;根据文本框从特征图中截取相对应的区域,使用透视投影的方式得到固定高度的矩形区域特征,作为文本识别任务的输入特征; S1.4、将文本识别的矩形区域特征输入LSTM组成的序列解码器,获取文本识别区域相关的文本信息,作为识别分支的输出; S1.5、计算检测分支和识别分支的损失,将检测分支的损失和识别分支的损失的加权和作为损失函数,并以加权损失和作为训练的损失进行端到端模型的训练;S2、使用训练完成的文本检测与识别的端到端模型对待检测图像中的文本进行检测和识别。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人华南理工大学,其通讯地址为:510640 广东省广州市天河区五山路381号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励