基于视觉提示的文本检测模型的训练方法及文本检测方法

导航：龙图腾网> 最新专利技术> 基于视觉提示的文本检测模型的训练方法及文本检测方法

买专利卖专利找龙图腾，真高效！查专利查商标用IPTOP,全免费！专利年费监控用IP管家,真方便！

申请/专利权人：杭州海康机器人股份有限公司

摘要：本申请实施例提供了基于视觉提示的文本检测模型的训练方法及文本检测方法，涉及图像处理技术领域。训练方法包括：获取样本图像集；提取样本图像的图像特征，并确定样本图像中文本区域的视觉提示特征；针对每张样本图像，将图像特征和各文本区域的视觉提示特征输入至文本检测模型，以使文本检测模型对图像特征和每一文本区域的视觉提示特征进行融合，基于融合特征，利用位置检测器进行预测，得到样本图像对应的预测结果；基于各样本图像的标签信息与对应的预测结果，对文本检测模型进行模型参数调整。应用本申请实施例提供的方案，可以在不依赖于待检测的工业场景的场景图像作为样本图像的前提下，训练得到适用于待检测的工业场景的文本检测模型。

主权项：1.一种基于视觉提示的文本检测模型的训练方法，其特征在于，所述方法包括：获取样本图像集；其中，所述样本图像集包括对多种现有场景进行图像采集得到的多张样本图像，所述多张样本图像中的文本区域的类型包括多种预设文本类型，且每一张样本图像具有：至少包含该样本图像中的文本区域的位置信息的标签信息；提取每一张样本图像的图像特征，并确定每一张样本图像中的各文本区域的视觉提示特征；其中，每一文本区域的视觉提示特征用于表征：该文本区域所属文本类型下的区域的属性；针对每一张样本图像，分别将该样本图像的图像特征以及该样本图像中的各文本区域的视觉提示特征，输入至待训练的文本检测模型，以使所述文本检测模型对该样本图像的图像特征和该样本图像中的每一文本区域的视觉提示特征分别进行融合操作，并基于融合操作所得到的融合特征，利用位置检测器进行预测分析，得到该样本图像对应的预测结果；其中，所述预测结果至少包括：该样本图像中的文本区域的位置信息；基于各张样本图像的标签信息与对应的预测结果，对所述文本检测模型进行模型参数调整。

全文数据：

权利要求：

百度查询：杭州海康机器人股份有限公司基于视觉提示的文本检测模型的训练方法及文本检测方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：新能源多场站柔性直流外送系统强度评估方法、装置

下一篇：用于修复叶片根部的方法

相关技术

新能源多场站柔性直流外送系统强度评估方法、装置

用于修复叶片根部的方法

水泵减振装置

一种变压器电磁温度流体多物理场间接耦合计算方法及系统

订单处理方法、装置、电子设备及存储介质

基于海洋渔业价值链的海产品汞金属总量核算方法和装置

一种AGV随行系统、方法、装置、设备及存储介质

一种燃料舱搭载精度控制方法和燃料舱

一种无线电力传输方法、无线电力发送器和无线电力接收器

基于鸿蒙系统的Web端与原生同步通信方法、系统及产品

一种基于蜣螂优化算法的智能车轨迹跟踪控制方法

一种电动汽车无线充电系统漏磁优化方法

龙图腾网&IPTOP

设置信息完成注册

手机号绑定多个账号

基于视觉提示的文本检测模型的训练方法及文本检测方法

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务