首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

一种基于特征增强和多尺度特征融合的医疗票据图像文本检测方法 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

申请/专利权人:浙江科技大学

摘要:本发明涉及一种基于特征增强和多尺度特征融合的医疗票据图像文本检测方法,该方法融合了高效的分割模块和可学习的后处理模块,并通过引入视觉语言预训练模型来增强检测方法的性能;其中,分割模块包括特征增强模块和多尺度特征融合模块,用于增强模型的泛化性和鲁棒性;后处理模块采用了可微分的二值化方法,能够自适应地设置阈值,从而改善文本检测的效果;预训练模块引入了视觉语言预训练模型,使得模型获得丰富的视觉和语义表征能力。本发明可以有效提高其文本检测的速度和精度,也为后续更加复杂的医疗场景下的文本检测算法研究以及工程应用提供了新的思路。

主权项:1.一种基于特征增强和多尺度特征融合的医疗票据图像文本检测方法,其特征在于构建基于特征增强和多尺度特征融合的医疗票据图像文本检测算法的体系结构,具体包括以下步骤:S1:构建医疗票据图像数据集,并进行预处理操作;S2:引入视觉语言预训练模型进行ResNet50网络的迁移学习;S3:基于权重迁移后的ResNet50网络的多层次特征提取;S4:基于EFEM模块的特征增强处理;S5:基于MSFM模块的多尺度特征融合处理;S6:在获得融合后的最终特征图F之后,进一步利用特征图F来生成概率图P和阈值图T,并在此基础上通过可微分二值化,得到近似二值化图;S7:根据近似二值图计算模型的总损失、精确度、召回率及F度量值,对模型进行评估;S8:通过标签生成算法产生文本检测结果。

全文数据:

权利要求:

百度查询: 浙江科技大学 一种基于特征增强和多尺度特征融合的医疗票据图像文本检测方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。