买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
摘要:本发明公开了一种基于大模型的OCR识别纠错方法、系统、设备及介质,所述方法包括以下步骤:对训练图像进行图像预处理;将预处理后的图像输入待训练大模型中进行特征提取和文本识别;基于文本识别内容对待训练大模型进行参数调整以及模型优化;将OCR识别结果输入至训练后的大模型中进行纠错处理;根据训练后的大模型对于OCR识别结果的纠错结果,对训练后的大模型进行性能评估;本发明能够利用大模型在文本理解领域的强大能力,通过对不同行业的OCR识别结果通过标准纠错大模型的定向微调训练,解决了OCR识别对例如药品名称等特殊行业专有名词的识别纠错不准确的问题,提高了OCR识别的准确性和效率。
主权项:1.一种基于大模型的OCR识别纠错方法,其特征在于,包括以下步骤:数据预处理:对训练图像进行图像预处理;文本内容提取:将预处理后的图像输入待训练大模型中进行特征提取和文本识别;定向微调训练:基于所述文本识别内容对所述待训练大模型进行参数调整以及模型优化;OCR纠错:将OCR识别结果输入至训练后的大模型中进行纠错处理;纠错反馈:根据所述训练后的大模型对于所述OCR识别结果的纠错结果,对所述训练后的大模型进行性能评估。
全文数据:
权利要求:
百度查询: 浪潮金融信息技术有限公司 基于大模型的OCR识别纠错方法、系统、设备及介质
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。