北京交通大学卢思洋获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉北京交通大学申请的专利一种基于端到端神经网络的木板印刷满文识别方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN115862038B 。
龙图腾网通过国家知识产权局官网在2025-08-29发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202211405330.X,技术领域涉及:G06V30/244;该发明授权一种基于端到端神经网络的木板印刷满文识别方法是由卢思洋;王志炜;魏翔;卢苇;王明泉设计研发完成,并于2022-11-10向国家知识产权局提交的专利申请。
本一种基于端到端神经网络的木板印刷满文识别方法在说明书摘要公布了:本发明提供了一种基于端到端神经网络的木板印刷满文识别方法。该方法包括:从满文古籍图片中切割出独立的满文单词,将每个满文单词用一个满文单词图片来表示;使用卷积神经网络CNN对满文单词图片进行卷积操作时,提取出满文单词图片的特征向量;使用长短期记忆网络LSTM处理CNN提取出的特征向量,得到向量序列;采用连接性时序分类算法CTC算法将LSTM输出的向量序列转化为对应满文单词的标签序列,根据标签序列对满文单词进行识别。本发明方法可以有效地从大量的印刷满文图片中提取出清晰、可拆分且通用的特征并加以识别,同时对上下文中相关联的特征信息进行有效的筛选与关联,进而获得高识别准确率的印刷满文识别模型。
本发明授权一种基于端到端神经网络的木板印刷满文识别方法在权利要求书中公布了:1.一种基于端到端神经网络的木板印刷满文识别方法,其特征在于,包括: 从满文古籍图片中切割出独立的满文单词,将每个满文单词用一个满文单词图片来表示; 使用卷积神经网络CNN对满文单词图片进行卷积操作,提取出满文单词图片的特征向量; 使用长短期记忆网络LSTM处理CNN提取出的特征向量,得到含有语义信息的向量序列; 采用连接性时序分类算法CTC算法将LSTM输出的向量序列转化为对应满文单词的标签序列,根据标签序列输出满文单词的识别结果; 所述的从满文古籍图片中切割出独立的满文单词,将每个满文单词用一个满文单词图片来表示,包括: 从数字化的每一页满文古籍图片中切割出独立的满文单词,将每个满文单词用一个长宽不同的满文单词图片来表示,将所有满文单词图片都缩放到相同的大小,在保持单词图片的纵横比的前提下将所有单词图片归一化为相同的宽度,将每个满文单词图片逆时针旋转90度,为所有的满文字母分配不同的标签,用字形编码注释所有提取出的木板印刷满文单词; 所述的采用连接性时序分类算法CTC算法将LSTM输出的向量序列转化为对应满文单词的标签序列,根据标签序列对满文单词进行识别,包括: 采用CTC算法将LSTM输出的向量序列转化为对应满文单词的标签序列,计算并对比不同标签序列之间的条件概率,并将其中条件概率值最高的标签序列作为预测的结果输出,每个满文单词中字母的条件概率定义为在某一时刻观察到相应字母图片的概率,而整个满文单词的条件概率通用把不同字母排列组合之后对条件概率求和得到; CTC算法计算标签序列的条件概率的过程包括:将输入CTC算法的标签序列用y1,y2,…,yr表示,其中T为输入序列的长度,L表示使用的36种不同的字符标签,L’为在L的基础上加入了空白标签,即L′=L∪{blank},其中blank代表空白标签,π定义为任意可能出现的标签序列,并且有π的条件概率计算方法如下: 其中表示在时刻t出现标签πt的概率,pπ│y表示在序列y1,y2,…,yr中出现标签序列π的条件概率; 在上定义一组多对一的映射方法B,具体描述如下:B首先移除π中的重复标签,去除掉所有的空白标签,得到新的标签序列l,将l的条件概率定义为标签序列π经过B映射到l的条件概率之和; l的条件概率计算公式如下: 在无词典的模式中,选取标签序列中条件概率最高的序列作为满文单词的识别结果输出,计算方法如下: hx≈Bl′#5 其中hx为最终预测的单词标签序列,l′表示选取具有最高条件概率的标签序列; 在基于词典的模式中,选取在词典中与该单词最相近的且条件概率最高的序列作为满文单词的识别结果输出; 所述的使用CNN对满文单词图片进行卷积操作时,提取出满文单词图片的特征向量,包括: CNN选用多组适应于满文单词特征大小的卷积核,使满文单词图片通过CNN中的多组大小不同的卷积核,卷积核的长与宽代表了每一次卷积操作提取的特征区域大小,每一次通过卷积核之后,使用最大池化对输出的特征图进行降维,最大池化选取候选区域中的最大值作为整体表示,最终得到包含更多单词纹理信息的特征向量; 所述的使用LSTM处理CNN提取出的特征向量,得到向量序列,包括: 使用包含两个方向的LSTM处理满文单词图片的特征向量,获得特征向量中包含的各个上下文信息h1,h2,…,hT,将所有上下文信息进行综合,得到Bi-LSTM输出的包含上下文信息的向量序列hi: 其中和分别代表向后和向前的隐藏状态序列,最终输出的向量序列hi是二者的加和。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人北京交通大学,其通讯地址为:100044 北京市海淀区西直门外上园村3号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。