恭喜江西省天轴通讯有限公司张弛获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网恭喜江西省天轴通讯有限公司申请的专利一种基于模板匹配的文档分类方法及系统获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN119672744B 。
龙图腾网通过国家知识产权局官网在2025-06-06发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202510180212.0,技术领域涉及:G06V30/412;该发明授权一种基于模板匹配的文档分类方法及系统是由张弛;江泊;周继斌;肖武林;万旻设计研发完成,并于2025-02-19向国家知识产权局提交的专利申请。
本一种基于模板匹配的文档分类方法及系统在说明书摘要公布了:本发明提供了一种基于模板匹配的文档分类方法及系统,该方法通过对待分类文档进行文本框检测,确定文本块的边框以及边框的坐标和尺寸,再获取待分类文档的二值化布局图与各模板的二值化布局图,并使用改进的SSIM进行布局相似度计算,得到相似度得分;确定相似度得分最高的分值以及对应的模板,并判断分值是否超过阈值;若是,则确定相似度得分最高的模板为目标模板,并建立待分类文档与目标模板匹配区域的映射关系,可以快速、准确地完成文档分类。
本发明授权一种基于模板匹配的文档分类方法及系统在权利要求书中公布了:1.一种基于模板匹配的文档分类方法,其特征在于,应用于检察行业场景中,所述方法包括:对待分类文档进行文本框检测,具体的,获取待分类文档的图像,将待分类文档的图像转换为灰度图像;采用自适应阈值方法对所述灰度图像进行处理,得到二值化布局图,其中,根据灰度图像局部区域的灰度特性自动确定合适的阈值,以应对不同照明条件;使用连通组件分析识别所述二值化布局图潜在的文本区域,并根据预设的区域长宽比和面积,去除噪声,得到目标连通组件;根据层次聚类法,将间隔小于预设距离的目标连通组件组合,得到文本块;获取所述文本块的边框以及边框的坐标和尺寸;获取待分类文档的二值化布局图与各模板的二值化布局图,并进行布局相似度计算,得到相似度得分,其中,使用改进的SSIM计算结构相似性指数,计算公式为: 其中,表示以(i,j)为中心的窗口的布局密度比较,表示以(i,j)为中心的窗口的布局对比度比较,表示以(i,j)为中心的窗口的结构比较,表示空间加权函数,表示结构相似性指数,α表示布局密度比较的权重,β表示布局对比度比较的权重,λ表示结构比较的权重;确定相似度得分最高的分值以及对应的模板,并判断所述分值是否超过阈值;若是,则确定相似度得分最高的模板为目标模板,并建立待分类文档与目标模板匹配区域的映射关系,以完成文档分类;所述获取待分类文档的二值化布局图与各模板的二值化布局图,并进行布局相似度计算,得到相似度得分的步骤包括:根据所述空间加权函数,计算归一化因子;根据所述归一化因子和所述结构相似性指数,计算第一相似度得分;获取文本行间距一致性参数以及页边距对齐参数,并根据所述第一相似度得分、所述文本行间距一致性参数以及所述页边距对齐参数,计算第二相似度得分,所述第二相似度得分为最终的相似度得分。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人江西省天轴通讯有限公司,其通讯地址为:330000 江西省南昌市东湖区豫章路1号红三楼311室;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。