首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

一种面向生产测井的档案资料的OCR识别方法 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

申请/专利权人:东北石油大学

摘要:本发明涉及测井档案资料处理技术领域,公开了一种面向生产测井的档案资料的OCR识别方法,本发明解决了现有生产测井档案资料依赖人工处理效率低和纸质档案资料腐损的问题。本发明结合了DBNet的文本检测技术和CRNN的文本识别技术,用于高效准确地识别生产测井档案资料,DBNet通过ResNet18和FPN结构解决了梯度问题,提高了检测准确性,而CRNN中的BiLSTM增强了序列上下文建模能力,CTC损失函数则优化了识别效果,实验证明该方法在提取图像特征、识别档案资料方面表现卓越,有效增强了模型能力,为生产测井档案资料的数字化转化提供了新思路,显著提高了处理效率和准确性。

主权项:1.一种面向生产测井的档案资料的OCR识别方法,包括基于DBNet的文本检测方法和基于CRNN的文本识别方法,其特征在于:文本检测方法包括以下步骤:S1:数据预处理:通过参加大庆某石油公司项目开发,收集生产测井档案资料数据集,包括生产测井原始测井图、注入剖面测井地质设计和射孔深度通知单,将收集到的生产测井档案资料图像和数据进行预处理,包括对数据集的灰度化、二值化和图像倾斜矫正;S2:数据集划分:将预处理后的数据集划分为三个子集:训练集、验证集和测试集,其中训练集用于模型训练,验证集用于模型训练过程中的误差计算和参数调整,测试集用于最终评估模型的性能;S3:模型搭建与训练:搭建文本检测DBNet模型,使用训练集对模型进行训练,并使用验证集评估模型性能并进行调整,以达到更好的文本检测结果;S4:模型验证与评估:在模型训练完成后,使用测试集对模型进行最终验证和评估,通过计算模型在测试集上的性能指标,评估模型性能,同时通过可视化结果方式,进一步验证模型的文本检测效果;S5:应用模型:利用训练好的DBNet模型对生产测井档案资料进行文本检测,将待检测图像输入到模型中,模型将输出图像中文本区域的位置和大小信息,根据这些信息进一步对文本进行识别和处理;文本识别方法包括以下步骤:S1:数据预处理:与文本检测方法中的S1同理将原始图像转换为灰度图像,去除颜色信息,然后进行二值化处理,将图像转为简单的黑白二值图像,对倾斜的图像进行矫正,使其水平化;S2:数据集划分:与文本检测方法中的S2同理将经过预处理的数据集划分为训练集、验证集和测试集,用于模型的训练、验证和评估;S3:模型训练:构建文本识别CRNN网络模型,并使用训练集对其进行训练,通过输入训练集图像和对应的标签,利用误差计算和反向传播的方法更新模型参数,以提高模型在文本识别方面的准确度;S4:模型验证:使用测试集对训练好的CRNN模型进行验证,将测试集图像输入到模型中,通过模型输出的文本结果与真实标签进行对比,评估模型在文本识别方面的性能,采用准确率、编辑距离指标进行评估,判断模型的准确度;S5:应用模型:利用训练好的CRNN模型对生产测井档案资料进行文本识别,将待识别的图像输入到模型中,模型将输出识别结果。

全文数据:

权利要求:

百度查询: 东北石油大学 一种面向生产测井的档案资料的OCR识别方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。