首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

文本纠错方法、控制装置、存储介质及设备 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

申请/专利权人:北京国双科技有限公司

摘要:本发明实施例提供一种文本纠错方法、控制装置、存储介质及设备,属于文字识别技术领域。所述文本纠错方法包括:通过原始汉字字符、所述原始汉字字符在OCR识别后对应出现字形错误的汉字字符及对应出现字形错误的错误次数,构建易混淆识别图谱;将所述易混淆识别图谱转换为易混淆识别矩阵;对所述易混淆识别图谱中的汉字进行嵌入处理,得到嵌入矩阵;使用所述易混淆识别矩阵和所述嵌入矩阵,对通过图卷积神经网络构建的文本纠错模型进行训练;以及通过训练后得到的所述文本纠错模型,对OCR识别后的文字进行纠错。可以解决垂直领域内由字形相似导致的OCR识别误文本的纠错问题。

主权项:1.一种文本纠错方法,其特征在于,所述文本纠错方法包括:通过原始汉字字符、所述原始汉字字符在OCR识别后对应出现字形错误的汉字字符及对应出现字形错误的错误次数,构建易混淆识别图谱;将所述易混淆识别图谱转换为易混淆识别矩阵;对所述易混淆识别图谱中的汉字进行嵌入处理,得到嵌入矩阵;使用所述易混淆识别矩阵和所述嵌入矩阵,对通过图卷积神经网络构建的文本纠错模型进行训练;以及通过训练后得到的所述文本纠错模型,对OCR识别后的文字进行纠错。

全文数据:

权利要求:

百度查询: 北京国双科技有限公司 文本纠错方法、控制装置、存储介质及设备

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。