首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

基于深度神经网络的古文字检测、识别和检索系统 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

申请/专利权人:天津恒达文博科技股份有限公司;西安文数保科技有限公司

摘要:本发明提供了一种基于深度神经网络的古文字检测、识别和检索系统,最终能够在多个应用场景下实现较为精准地对古文字信息的检测、识别和方便地检索。从总体结构上划分,整个系统可分为开发者模块群、使用者模块群和演示控制模块,前者包括基于预检测的框标注模块、基于预识别的识别标注模块、数据库存储模块、检测器和识别器训练模块;中者分为基于机器码的古文字检索模块、基于手写的古文字检索模块、基于图像内容的字形检索模块、整图检测和识别模块;演示控制模块则通过用户的演示需要,对当前已经进行过的一部分功能的缓存数据进行屏蔽或开启。

主权项:1.基于深度神经网络的古文字检测、识别和检索系统,其特征在于:包括开发者模块群,用于建立古文字数据库,以及对标签数据和样本数据进行训练;用户模块群,用于输入待识别数据,输出识别结果;演示控制模块,用于控制系统功能模块的执行顺序;所述开发者模块群包括:基于预检测的框标注模块:用于在包含古文字形的图像中,对其中的样本区域位置和标签区域位置、以及他们之间的对应关系分别进行机器自动提取,并通过人工修正完成检测框标准数据的获取;基于预识别的识别标注模块:用于根据提取出的标签位置,获取所有标签位置对应的图片块,并通过预识别系统对这些图像块进行初步识别,然后通过人工校正,得到标签图像块的机器码;数据库存储模块:用于将所有的标签图片和样本图像以及它们的对应关系,通过表的形式存储在后台数据库中;检测器、识别器训练模块:用于根据框标注模块获取的检测框对检测器进行训练,根据识别标注模块获取的标签机器码和框标注模块获取的样本图像,以及和这些标签的对应关系,对分类器进行训练;所述基于预检测的框标注模块包括框提取策略选择模块、特征预设模块、目标预定位模块、以及手动修正模块;所述框提取策略选择模块包括:预定位模块和连通分量提取模块,所述预定位模块包括深度神经网络预定位模块以及基于设计特征的预定位模块,所述连通分量提取模块包括基于极值区域树剪枝的连通分量提取模块和基于图片二值化和聚合策略的连通分量提取模块;所述特征预设模块包括通过对样本图像块和标签图像块对应的连通分量在图像位置分布、亮度或颜色特征分布特征的预先设定来对样本和标签图像块进行预先判定、以及基于样本图像和标签图像的位置关系对它们之间的对应关系进行预判;所述目标预定位模块包括:如果选择基于深度神经网络预定位模块,则系统首先依据手动标注出来的少量框位置的样本和标签图像区域,对基于深度卷积网络的检测器进行训练;然后对于待自动标注的图像用此检测器进行预检测,输出结果分别为推荐的样本图像块的外接框和标签图像块的外接框;如果选择基于设计特征的预定位模块,则系统对事先提取的连通分量,依据设计好的位置、尺度或颜色等特征对连通分量进行特征提取,并进行分类和基于尺度和位置关系进行聚合,最终分别确定对应于标签图像块和样本图像块的连通分量,并把这些连通分量的外接框作为预检测结果;所述手动修正模块用于对预检测结果进行处理;所述基于极值区域树剪枝的连通分量提取模块中,建立极值区域r的归一化面积曲线它是一个长度为固定值的向量,每个位置的值为这个叶到根路径的在阈值为Ir时的区域的面积νrir与νr的面积的比值,但如果νrir面积超过了νr则取倒数,等价于如下公式: 引入归一化面积的加权和作为区域r的显著度ωr,计算公式如下: 在连通分量提取时,计算所有极值区域的显著度值,并依据非极大值抑制的策略进行剪枝得到候选连通分量集合。

全文数据:

权利要求:

百度查询: 天津恒达文博科技股份有限公司 西安文数保科技有限公司 基于深度神经网络的古文字检测、识别和检索系统

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。