买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
申请/专利权人:长城信息股份有限公司
摘要:本发明公开了一种票据微缩文字检测方法、系统及介质,其中方法包括:获取待检测图像并进行剪裁得到多个子图;将子图进行缩放输入微缩文字检测模型进行预测;其中,所述微缩文字检测模型是基于对票据影像中的所有印刷的微缩文字进行标注得到数据集,进而输入改进后的YOLOv5模型中进行训练得到的;将子图的预测结果进行去冗余处理后转换回原始图像坐标,得到输入原始图像的微缩文字的检测坐标位置。所述方法能够针对微缩文字在整个票据图像中占比非常小,不易检测的问题,实现准确、快速地检测到票据图像中的微缩文字。
主权项:1.一种票据微缩文字检测方法,其特征在于,包括:S1:获取待检测图像并进行剪裁得到多个子图;所述剪裁采用切片辅助超推理算法,通过设置切片图像的大小、重叠率,将原始图像切割成多个切片图像;S2:将子图进行缩放输入微缩文字检测模型进行预测;其中,所述微缩文字检测模型是基于对票据影像中的所有印刷的微缩文字进行标注得到数据集,进而输入改进后的YOLOv5模型中进行训练得到的;所述微缩文字检测模型的预测过程为:S21:骨干网络模块对输入的子图进行低层图像特征进行提取,并输出给颈部网络模块;S22:基于骨干网络输出的低层图像特征,颈部网络模块进行上采样,并与输入的高层图像特征进行融合后送入SwinTransformer模块,得到整合的微缩文字数据特征;其中SwinTransformer单元集成了归一化注意力模块,对处理输入序列数据特征过程中的特征信息进行权重调整;S23:根据得到整合的微缩文字数据特征,头部网络模块通过检测头,对输入图片进行微缩文字检测,输出微缩文字的类型及位置信息;其中,检测头的数量为4个,尺寸大小分别为160×160、80×80、40×40、20×20;S3:将子图的预测结果进行去冗余处理后转换回原始图像坐标,得到输入原始图像的微缩文字的检测坐标位置;模型训练过程中采用Lion优化器进行参数更新,更新参数的过程为 ;其中,为一阶动量;、均为衰减率;为时间步t时的梯度;为时间步t时的一阶动量;为时间步t-1时的一阶动量;为当前时刻下降的梯度;为当前时刻更新的参数;为解耦权重衰减参数;去冗余处理采用非极大值抑制处理,具体过程为:S31:将检测框按原始得分进行排序,并选出原始得分最高的检测框作为候选框;S32:将当前待检测框和候选框的交并比与第一阈值进行比较:若当前待检测框和候选框的交并比小于第一阈值,则当前待检测框的得分即为原始得分;若当前待检测框和候选框的交并比大于或等于第一阈值,且小于或等于第二阈值,则重新计算当前待检测框的得分;若当前待检测框和候选框的交并比大于第二阈值,则将当前待检测框的得分归零;所述S32中重新计算当前待检测框的得分的过程为:将当前待检测框的原始得分与其对应的权值相乘;其中,权值的计算公式为 ;其中,表示当前检测框的权值;为当前检测框;M为候选框;为当前检测框与候选框M的交并比。
全文数据:
权利要求:
百度查询: 长城信息股份有限公司 一种票据微缩文字检测方法、系统及介质
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。