哈尔滨工业大学(深圳)(哈尔滨工业大学深圳科技创新研究院)吴湘平获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉哈尔滨工业大学(深圳)(哈尔滨工业大学深圳科技创新研究院)申请的专利一种基于多任务引导的多视图特征融合的扭曲文档图像矫正方法及系统获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN121095520B 。
龙图腾网通过国家知识产权局官网在2026-03-17发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202511644739.0,技术领域涉及:G06V10/24;该发明授权一种基于多任务引导的多视图特征融合的扭曲文档图像矫正方法及系统是由吴湘平;李恒;陈清财设计研发完成,并于2025-11-11向国家知识产权局提交的专利申请。
本一种基于多任务引导的多视图特征融合的扭曲文档图像矫正方法及系统在说明书摘要公布了:本发明公开了一种基于多任务引导的多视图特征融合的扭曲文档图像矫正方法及系统,包括:获取扭曲文档图像,并将扭曲文档图像输入至视觉编码器获得扭曲文档图像视觉特征;将扭曲文档图像视觉特征输入两个坐标分支分别计算扭曲图像的世界坐标、UV坐标映射,得到坐标分支视图特征;将扭曲文档图像视觉特征输入两个平面分支分别计算前景掩码和文本行掩码,得到平面分支视图特征;将坐标分支视图特征和平面分支视图特征输入多视图融合模块,得到二维形变场坐标;利用二维形变场坐标映射所述扭曲文档图像的像素位置,实现对扭曲文档图像的矫正。本发明适用于带有复杂背景的、大多数的扭曲文档图像的矫正,提高可视化效果和文本识别精度。
本发明授权一种基于多任务引导的多视图特征融合的扭曲文档图像矫正方法及系统在权利要求书中公布了:1.一种基于多任务引导的多视图特征融合的扭曲文档图像矫正方法,其特征在于,包括以下步骤: 步骤S1,获取扭曲文档图像,并将所述扭曲文档图像输入至视觉编码器,得到与所述文档图像对应的扭曲文档图像视觉特征; 步骤S2,将所述扭曲文档图像视觉特征输入坐标分支,得到坐标分支视图特征; 步骤S3,将所述扭曲文档图像视觉特征输入平面分支,得到平面分支视图特征; 步骤S4,将所述坐标分支视图特征和平面分支视图特征输入多视图融合模块,得到二维形变场坐标; 步骤S5,利用二维形变场坐标映射所述扭曲文档图像的像素位置,实现对扭曲文档图像的矫正; 步骤S2中,将所述扭曲文档图像视觉特征输入坐标分支,得到坐标分支视图特征的方法包括: 将所述扭曲文档图像视觉特征输入自注意力模块的世界坐标分支,得到世界坐标视图特征; 将所述世界坐标视图特征输入上采样模块计算所述扭曲文档图像的世界坐标; 将所述扭曲文档图像视觉特征输入自注意力模块的UV坐标分支,得到UV坐标视图特征; 将所述UV坐标视图特征输入上采样模块计算所述扭曲文档图像的UV坐标映射; 将所述世界坐标视图特征和所述UV坐标视图特征进行拼接得到坐标分支视图特征; 步骤S3中,将所述扭曲文档图像视觉特征输入平面分支,得到平面分支视图特征的方法包括: 将所述扭曲文档图像视觉特征输入自注意力模块的前景分支,得到前景视图特征; 将所述前景视图特征输入上采样模块得到所述扭曲文档图像的前景掩码; 将所述扭曲文档图像视觉特征输入自注意力模块的文本行分支,得到文本行视图特征; 将所述文本行视图特征输入上采样模块得到所述扭曲文档图像的文本行掩码; 将所述前景视图特征和所述文本行视图特征进行拼接得到平面分支视图特征。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人哈尔滨工业大学(深圳)(哈尔滨工业大学深圳科技创新研究院),其通讯地址为:518071 广东省深圳市南山区桃源街道深圳大学城哈尔滨工业大学校区;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励