恭喜深圳壹账通智能科技有限公司董润华获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网恭喜深圳壹账通智能科技有限公司申请的专利基于光学字符识别的附件分类方法、装置、设备及介质获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN114153972B 。
龙图腾网通过国家知识产权局官网在2025-05-27发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202111437898.5,技术领域涉及:G06F16/35;该发明授权基于光学字符识别的附件分类方法、装置、设备及介质是由董润华设计研发完成,并于2021-11-30向国家知识产权局提交的专利申请。
本基于光学字符识别的附件分类方法、装置、设备及介质在说明书摘要公布了:本发明涉及智能决策技术,揭露一种基于光学字符识别的附件分类方法,包括:获取待分类图片集经过光学字符识别产生的文本附件集合,提取所述文本附件的真实类别及训练关键词集与训练标签比值;利用训练关键词集及训练标签比值配置原始附件分类器,利用原始附件分类器对所述文本附件预测,得到预测的附件类别及分值;将预测的附件类别与真实类别进行比较得到预测正确率;根据预测正确率训练原始附件分类器,直至预测正确率大于训练阈值,得到标准附件分类器;利用标准附件分类器对待分类附件进行分类。本发明还提出一种基于光学字符识别的附件分类装置、电子设备以及存储介质。本发明可以解决光学字符识别扫描出的附件的分类不明确问题。
本发明授权基于光学字符识别的附件分类方法、装置、设备及介质在权利要求书中公布了:1.一种基于光学字符识别的附件分类方法,其特征在于,所述方法包括:获取待分类图片集经过光学字符识别产生的文本附件集合;从所述文本附件集中逐一选择其中一个文本附件,提取所述文本附件预先被标注的真实类别及所述文本附件中所有的附件关键词、段落标签及表格标签;将所述文本附件中提取到的各个附件关键词进行组合,得到所述文本附件的训练关键词集,并计算所述段落标签与所述表格标签在数量上的比值,得到训练标签比值;利用所述训练关键词集及所述训练标签比值,配置预构建的原始附件分类器;利用所述原始附件分类器对所述文本附件进行分类预测,得到所述文本附件的附件类别及对应的分值;判断所述分值是否小于预设的预测阈值;当所述分值小于预设的预测阈值时,利用所述分值对所述原始附件分类器进行梯度调节,并返回至上述的利用所述原始附件分类器对所述文本附件进行分类预测,得到所述文本附件的附件类别及对应的分值步骤;当所述分值大于或等于预设的预测阈值时,将所述预测得到的附件类别与所述文本附件的真实类别进行比较,得到预测正确或者预测错误的预测结果;汇总所述文本附件集中所有的文本附件的预测结果,得到预测正确率;判断所述预测正确率是否大于或等于预设的训练阈值;若所述预测正确率小于所述训练阈值,返回上述的利用所述训练关键词集及所述训练标签比值,配置预构建的原始附件分类器的步骤,直至所述预测正确率大于或等于所述训练阈值,得到标准附件分类器;接收待分类附件,利用所述标准附件分类器对所述待分类附件进行分类,得到所述待分类附件的分类结果。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人深圳壹账通智能科技有限公司,其通讯地址为:518000 广东省深圳市前海深港合作区前湾一路1号A栋201室(入驻深圳市前海商务秘书有限公司);或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。