中国科学院自动化研究所张志扬获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉中国科学院自动化研究所申请的专利融合版面信息的端到端文档图像翻译方法及装置获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN117253239B 。
龙图腾网通过国家知识产权局官网在2026-03-27发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202311189129.7,技术领域涉及:G06V30/244;该发明授权融合版面信息的端到端文档图像翻译方法及装置是由张志扬;张亚萍;向露;周玉;宗成庆设计研发完成,并于2023-09-14向国家知识产权局提交的专利申请。
本融合版面信息的端到端文档图像翻译方法及装置在说明书摘要公布了:本发明提供一种融合版面信息的端到端文档图像翻译方法及装置,该方法包括:获取待翻译文档图像的字符识别结果,所述字符识别结果包括所述待翻译文档图像中的多个单词以及每个单词的二维坐标信息,所述二维坐标信息基于所述待翻译文档图像的像素值确定;基于所述每个单词对应的文本、所述每个单词的二维坐标信息以及所述每个单词的一维位置信息,得到第一特征向量,所述一维位置信息用于指示所述单词在单词序列中的位置,所述单词序列用于指示从所述待翻译文档图像中识别出来的所有单词组成的一维序列;对所述第一特征向量解码,得到所述待翻译文档图像对应的译文文本。本发明提供的融合版面信息的端到端文档图像翻译方法,有效提升文档翻译效果。
本发明授权融合版面信息的端到端文档图像翻译方法及装置在权利要求书中公布了:1.一种融合版面信息的端到端文档图像翻译方法,其特征在于,包括: 获取待翻译文档图像的字符识别结果,所述字符识别结果包括所述待翻译文档图像中的多个单词以及每个单词的二维坐标信息,所述二维坐标信息基于所述待翻译文档图像的像素值确定; 基于所述每个单词对应的文本、所述每个单词的二维坐标信息以及所述每个单词的一维位置信息,得到第一特征向量,所述一维位置信息用于指示所述单词在单词序列中的位置,所述单词序列用于指示从所述待翻译文档图像中识别出来的所有单词组成的一维序列; 对所述第一特征向量解码,得到所述待翻译文档图像对应的译文文本; 所述对所述第一特征向量解码,得到所述待翻译文档图像对应的译文文本,包括: 对所述第一特征向量解码,得到所述每个单词对应的第一隐层向量,所述第一隐层向量用于指示所述每个单词的阅读顺序; 基于所述第一隐层向量,确定所述每个单词对应的句子边界类别标签,所述句子边界类别标签用于指示所述每个单词是否为句子起始单词; 基于所述第一隐层向量和所述句子边界类别标签,确定所述所有单词对应的每个源语言句子的语义特征; 基于所述每个源语言句子的语义特征,确定所述待翻译文档图像对应的译文文本。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人中国科学院自动化研究所,其通讯地址为:100190 北京市海淀区中关村东路95号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励