Document
拖动滑块完成拼图
首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

基于视觉提示的文本检测模型的训练方法及文本检测方法 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

申请/专利权人:杭州海康机器人股份有限公司

摘要:本申请实施例提供了基于视觉提示的文本检测模型的训练方法及文本检测方法,涉及图像处理技术领域。训练方法包括:获取样本图像集;提取样本图像的图像特征,并确定样本图像中文本区域的视觉提示特征;针对每张样本图像,将图像特征和各文本区域的视觉提示特征输入至文本检测模型,以使文本检测模型对图像特征和每一文本区域的视觉提示特征进行融合,基于融合特征,利用位置检测器进行预测,得到样本图像对应的预测结果;基于各样本图像的标签信息与对应的预测结果,对文本检测模型进行模型参数调整。应用本申请实施例提供的方案,可以在不依赖于待检测的工业场景的场景图像作为样本图像的前提下,训练得到适用于待检测的工业场景的文本检测模型。

主权项:1.一种基于视觉提示的文本检测模型的训练方法,其特征在于,所述方法包括:获取样本图像集;其中,所述样本图像集包括对多种现有场景进行图像采集得到的多张样本图像,所述多张样本图像中的文本区域的类型包括多种预设文本类型,且每一张样本图像具有:至少包含该样本图像中的文本区域的位置信息的标签信息;提取每一张样本图像的图像特征,并确定每一张样本图像中的各文本区域的视觉提示特征;其中,每一文本区域的视觉提示特征用于表征:该文本区域所属文本类型下的区域的属性;针对每一张样本图像,分别将该样本图像的图像特征以及该样本图像中的各文本区域的视觉提示特征,输入至待训练的文本检测模型,以使所述文本检测模型对该样本图像的图像特征和该样本图像中的每一文本区域的视觉提示特征分别进行融合操作,并基于融合操作所得到的融合特征,利用位置检测器进行预测分析,得到该样本图像对应的预测结果;其中,所述预测结果至少包括:该样本图像中的文本区域的位置信息;基于各张样本图像的标签信息与对应的预测结果,对所述文本检测模型进行模型参数调整。

全文数据:

权利要求:

百度查询: 杭州海康机器人股份有限公司 基于视觉提示的文本检测模型的训练方法及文本检测方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。