首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

基于机器视觉的甲骨文识别方法及其系统 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

申请/专利权人:微山同在电子信息科技有限公司

摘要:本发明公开了基于机器视觉的甲骨文识别方法及其系统,方法包括数据采集、数据预处理、图像增强、建立甲骨文识别模型和甲骨文识别。本发明属于文字识别技术领域,具体是指基于机器视觉的甲骨文识别方法及其系统,本方案建立双U‑Net模型,分别完成去噪过程中噪声的预测和数据分布的变换,在上采样阶段将相应位置的特征图进行通道连接,使用组归一化代替批量归一化操作,在骨干层和下采样层的每个残差块之后都使用了Dropout层;建立的模型每个空间核在两个独立的分支中独立地卷积输入图像,通过生成的特征图中的神经元直接捕获两个相距很远的像素之间的相关性,通过特征组合和底部分支处理,提取全局时空特征。

主权项:1.基于机器视觉的甲骨文识别方法,其特征在于:该方法包括以下步骤:步骤S1:数据采集,采集甲骨文图像数据集;步骤S2:数据预处理,对采集的图像进行数据集标注和划分数据集;步骤S3:图像增强,建立双U-Net模型,分别完成去噪过程中噪声的预测和数据分布的变换;模型在经历了五次下采样后,将输入图像的大小从256×256转换为8×8;下采样过程中,使用残差模块来提取输入图像的特征信息,并在上采样阶段将相应位置的特征图进行通道拼接;主干层中包含两个残差块,每个残差块包含一个单步卷积层;在图像恢复过程中,使用了五个上采样步骤逐渐完成;模型使用了分组归一化;此外,在主干层和下采样层的每个残差块之后,使用了Dropout层;步骤S4:建立甲骨文识别模型,通过特征组合和底部分支处理,提取全局时空特征,以此构建甲骨文识别模型;步骤S5:甲骨文识别,利用训练完成的甲骨文识别模型,模型输出甲骨文所属类别;在步骤S4中,所述建立甲骨文识别模型具体包括以下步骤:步骤S41:卷积层设计,卷积层对特征图上的局部特征区域进行加权求和,其中滑动的卷积核与局部区域共享权重,表示如下: ;式中,是卷积操作后在第l层中的第j个输出特征图;是偏置项;是第l-1层的输入特征图中的第i个特征图;是应用在第l层上用于生成第j个输出特征图的卷积核,i是输入特征图索引,j是输出特征图索引;和分别是第l-1层和第l层的通道数,即卷积核数量;是卷积操作;步骤S42:池化层设计,池化作为子采样步骤,在保留主要信息的同时降低维数;对输入特征映射上的每个局部区域进行平均池化,表示如下: ;式中,是平均池化操作后在第l层中的第i个输出特征图;average·表示将输入特征映射上的每个局部区域进行平均池化操作;表示第l-1层中的第i个输入特征图上的第r个局部区域;S是总区域数;步骤S43:批归一化并恢复特征表示,批归一化用以缓解内部协变量偏移,表示如下: ; ;式中,是归一化后的第l-1层的第i个输入特征图;E[·]是对训练批次和像素位置的期望;Var[·]是取方差;是批归一化的输出;是缩放参数;是平移参数;步骤S44:全连接层设计,用以接受来自卷积和池化层生成的特征图向量化,表示如下: ;式中,是表示在第l层中的第z个神经元的输出;是第l层中的第z个神经元的偏置参数;是第l层中的第z个神经元与前一层特征之间的连接权重;Z是神经元数量;步骤S45:整体映射,所建立的模型基于3×3的卷积核通过卷积操作从输入图像中提取局部特征;应用批归一化来标准化数据,基于批归一化操作计算输入特征图的均值和方差,并对特征图进行归一化处理;输入图像被填充以保持尺寸一致;从输入图像到顶部分支的输出特征图的整体映射表示如下: ;式中,是顶部分支生成的特征图;max·是逐元素应用的最大操作符;是在输入图像上应用的卷积和批归一化操作,X0是输入图像,是所有训练参数;步骤S46:底部架构设计,底部架构考虑了全局相关性,通过使用空间分离的1D卷积核和随后的外积运算,产生具有全局时空相关性嵌入的特征图,具体而言,采用了两个不同的1D卷积核来处理输入图像,其中一个卷积核与输入图像的高度相同,另一个卷积核与输入图像的宽度相同,这两个卷积核分别在输入图像上进行卷积操作,生成两个不同的特征图,表示如下: ; ;式中,和分别是垂直方向和水平方向的特征图;和分别是垂直方向和水平方向的偏置项;和分别是垂直方向和水平方向的权重参数;是底部分支的输出通道数;步骤S47:特征组合,为提取全局时空特征,通过外积将获得的特征图组合起来,以得到2D形式的新特征,表示如下: ;式中,是通过向量外积产生的特征图;是向量外积操作;步骤S48:底部分支处理,在ReLU激活之前应用批归一化,表示如下; ;式中,是底部分支的特征图;是底部分支中批归一化的实现函数;步骤S49:平均池化,采用2×2的池化区域和步幅为2的平均池化来减小每个空间维度的大小一半;在应用平均池化之前,首先对来自局部和全局分支的特征图进行通道级的拼接,表示如下: ; ;式中,是合并后的特征图;和分别是局部分支和全局分支的特征图;是生成的特征图;·是参数化所确定的整个映射;是维度为的张量,其中cL表示局部特征图的通道数,cG表示全局特征图的通道数,n和m分别表示特征图的高度和宽度;是维度为的张量,其中c表示通道数;步骤S410:分类,全局平均池化产生一个与最后一个3×3卷积中的通道数相同长度的向量;随后,将生成的向量输入到全连接层中进行分类;浅层神经网络被部署为仅具有输入和输出层的全连接分类器;最后,softmax激活为输出层的每个类别分配概率,其中具有最高概率的类别被视为输入数据的最终分类,表示如下: ;式中,是模型预测输出;是全连接层函数;是对输入特征图Γ进行全局平均池化操作;RC是一个C维的向量空间,表示具有C个类别的输出空间。

全文数据:

权利要求:

百度查询: 微山同在电子信息科技有限公司 基于机器视觉的甲骨文识别方法及其系统

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。