买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
申请/专利权人:大连民族大学
申请日:2015-09-29
公开(公告)日:2021-10-08
公开(公告)号:CN108830270B
专利技术分类:
专利摘要:本分案申请公开了一种对满文单词正确分割各识别的满文单词中轴线的定位方法,属于文字处理领域,用于解决提高识别准确率的问题,要点是包括S1.单词图像预处理;S2.确定满文单词中轴线的宽度;S3.确定满文单词中轴线左右边界位置,效果是提高了识别准确率。
专利权项:1.一种对满文单词正确分割各识别的满文单词中轴线的定位方法,其特征在于,包括以下步骤:S1.单词图像预处理;S2.确定满文单词中轴线的宽度;S3.确定满文单词中轴线左右边界位置;所述的满文单词图像预处理的步骤为:扫描满文文档,获得满文文档的彩色图像,并对满文文档的彩色图像进行二值化,采用垂直投影法提取每一列满文文档的图像,获得列图像,并对列图像采用水平投影法提取满文单词图像,然后对满文单词图像进行位置归一化处理,归一化处理的步骤是找到满文单词图像最外侧上、下、左、右四个点的坐标位置,以这四个点为边界,重新确定满文单词图像的大小,并用I、W、H分别表示归一化处理后的二值满文单词图像、二值满文单词图像的宽度数值和二值满文单词图像的高度数值;所述的确定满文单词中轴线宽度的步骤为:对二值满文单词图像I采用数学形态学进行处理,具体方法是采用长度为2的水平方向直线型形态学结构元素,对二值满文单词图像I进行腐蚀处理,得到I的腐蚀图像Ie,并求二值满文单词图像I与腐蚀图像Ie的纵向边缘图像Iv,即Iv=I-Ie,提取到满文单词的纵向边缘,然后对纵向边缘图像Iv进行垂直投影,统计纵向边缘图像Iv的每一列中所包含的黑色像素的个数,垂直投影序列以vp1表示,取向量vp1中不重复的元素,并按照数值从大到小的降序方式进行排列,得到新的向量vp2,并取vp2中的前3个元素分别标记为ind1、ind2和ind3,用wd表示中轴线的宽度,wdmin表示最小中轴线宽度,赋值wdmin=0,wdmax表示最大中轴线宽度,T为最大中轴线宽度的阈值,赋值T=13,则最大中轴线宽度wdmax为对T×W的结果向下取整后的值,即分别定义wd1、wd2、wd3为3个候选中轴线宽度,wd表示最终确定的中轴线宽度,其中wd1=∣ind1-ind2∣-1,wd2=∣ind1-ind3∣-1,wd3=∣ind2-ind3∣-1,如果wdminwd1wdmax并且wdminwd2wdmax并且wdminwd3wdmax,则wd=wd1,如果wdminwd1wdmax并且wdminwd2wdmax并且wd3=wdmin或者wd3=wdmax,则取wd1和wd2中值较大的一个做为wd的输出值,即wd=maxwd1,wd2,如果wdminwd1wdmax并且wdminwd3wdmax并且wd2=wdmin或者wd2=wdmax,则取wd1和wd3中值较大的一个做为wd的输出值,即wd=maxwd1,wd3,如果wdminwd2wdmax并且wdminwd3wdmax并且wd1=wdmin或者wd1=wdmax,则取wd2和wd3中值较大的一个做为wd的输出值,即wd=maxwd2,wd3,如果wdminwd1wdmax并且wd2=wdmin或者wd2=wdmax并且wd3=wdmin或者wd3=wdmax,则wd=wd1,如果wdminwd2wdmax并且wd1=wdmin或者wd1=wdmax并且wd3=wdmin或者wd3=wdmax,则wd=wd2,如果wdminwd3wdmax并且wd1=wdmin或者wd1=wdmax并且wd2=wdmin或者wd2=wdmax,则wd=wd3,如果wd1=wdmin或者wd1=wdmax并且wd2=wdmin或者wd2=wdmax并且wd3=wdmin或者wd3=wdmax,则wd=wdmax。
百度查询: 大连民族大学 对满文单词正确分割各识别的满文单词中轴线的定位方法
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。