中通服创立信息科技有限责任公司戢翔获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉中通服创立信息科技有限责任公司申请的专利基于文档布局分析的多层级文本矫正方法、系统获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN120932245B 。
龙图腾网通过国家知识产权局官网在2025-12-26发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202511461255.2,技术领域涉及:G06V30/146;该发明授权基于文档布局分析的多层级文本矫正方法、系统是由戢翔;裴贵军;赵永义;杜良辉;李涛设计研发完成,并于2025-10-14向国家知识产权局提交的专利申请。
本基于文档布局分析的多层级文本矫正方法、系统在说明书摘要公布了:本发明涉及人工智能在文档图像处理中的应用技术领域,公开了一种基于文档布局分析的多层级文本矫正方法、系统,包括:结合多尺度自相似性特征算法与方向性频域峰值特征算法判别待校正图像的类型,并进行适应性预处理得到标准化图像;提取标准化图像中的文本连通域,利用无监督聚类技术对文本连通域中的每个符号进行聚类得到若干词簇,合并词簇形成文本块,获取每个文本块的最小外接四边形得到对应的文本框;分别获取每个文本框的中心点坐标,判定两个文本框是否为同一行文本;对文本框执行水平对齐和倾斜修正;对旋转后的文本框中的字符进行形态规整处理;输出校正后的图像以及结构化的JSON数据。本发明具备了极强的适应性。
本发明授权基于文档布局分析的多层级文本矫正方法、系统在权利要求书中公布了:1.一种基于文档布局分析的多层级文本矫正方法,其特征在于,包括: 针对待校正图像,结合多尺度自相似性特征算法与方向性频域峰值特征算法判别所述待校正图像的类型,并根据判定的图像类型对所述待校正图像进行适应性预处理得到标准化图像; 提取所述标准化图像中的文本连通域,利用无监督聚类技术对所述文本连通域中的每个符号进行聚类得到若干词簇,合并满足预设条件的词簇形成至少一个文本块,并分别获取每个所述文本块的最小外接四边形得到对应的文本框; 其中,利用无监督聚类技术对所述文本连通域中的每个符号进行聚类得到若干词簇的具体过程为: 设置所述无监督聚类技术为DBSCAN聚类算法,利用所述DBSCAN聚类算法对所述文本连通域中的每个符号进行聚类时,以任意两个相邻符号间的水平间距、垂直间距、面积比及质心角度差构建4维特征向量,设置聚类邻域半径ε、最小样本数MinPts,当两个相邻符号的特征向量距离≤ε且邻域内样本数≥MinPts时,将两个符号归为同一聚类簇; 对每个所述聚类簇,统计所述聚类簇内所有符号对之间的水平间距集合与垂直间距集合;取水平间距集合的中位数为所述符号对的水平间距,取所述垂直间距集合的中位数为所述符号对的垂直间距,若所述聚类簇内的符号数≥3,则剔除所述水平间距集合与垂直间距集合中与中位数偏差1.5×的作为离群值的符号得到词簇,重新计算中位数,将中位数修正并基于修正后的中位数重新计算水平间距集合与垂直间距集合,IQR为四分位距; 分别获取每个所述文本框的中心点坐标,并且根据相邻文本框的中心点纵坐标差判定两个文本框是否为同一行文本; 对属于同一行文本的所有文本框执行水平对齐和倾斜修正,使得属于同一行文本的所有文本框旋转至同一水平线上; 对旋转后的所述文本框中的字符进行形态规整处理,使得所述字符所在区域形成边沿整齐、无错位的标准矩形文本块,以避免字符形态因抗锯齿或平滑处理被破坏; 输出校正后的图像以及结构化的JSON数据。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人中通服创立信息科技有限责任公司,其通讯地址为:610000 四川省成都市高新区神仙树北路14号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励