山东科技大学施陈博获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉山东科技大学申请的专利一种基于小样本切图数据的OCR识别方法和系统获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN120954001B 。
龙图腾网通过国家知识产权局官网在2025-12-26发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202511475442.6,技术领域涉及:G06V30/14;该发明授权一种基于小样本切图数据的OCR识别方法和系统是由施陈博;李泽龙;祝长生;张淳;臧祥腾设计研发完成,并于2025-10-16向国家知识产权局提交的专利申请。
本一种基于小样本切图数据的OCR识别方法和系统在说明书摘要公布了:本发明涉及图像处理技术领域,具体为一种基于小样本切图数据的OCR识别方法和系统;首先获取待识别图像并裁剪为切图以构建原始数据集,接着划分多个小样本任务数据集;对各小样本任务数据集进行特征提取,得到字符间的语义关联与顺序信息数据;通过上下文建模得到整体失稳系数;再将整体失稳系数与失稳可控阈值比较,生成不同信号;最后根据不同信号干预识别过程,输出OCR识别结果。本发明能够基于小样本数据有效处理各类复杂场景的OCR识别任务,保障OCR识别的准确性与稳定性。
本发明授权一种基于小样本切图数据的OCR识别方法和系统在权利要求书中公布了:1.一种基于小样本切图数据的OCR识别方法,其特征在于,包括如下操作: S1、获取待识别图像,裁剪后得到若干个切图,构建原始数据集合; 根据待识别图像的多维度特性对原始数据集合进行划分,构建多个小样本任务数据集,每个小样本任务数据集包含支持集和查询集; S2、对每个小样本任务数据集进行特征提取,获得多个字符之间的语义关联和顺序信息数据; S3、根据多个语义关联和顺序信息数据计算语义相似度与顺序连贯性,语义相似度与顺序连贯性加权融合计算语义关联一致性; 预设应变信号持续总时间,将语义关联一致性与应变信号持续总时间进行求和计算整体失稳系数; 计算语义相似度的具体公式如下: , 其中,SemanticSimilarity为语义相似度,A和B为同一任务支持集查询集中的文字片段,表示对文字片段A和B进行嵌入操作,将文字片段转换为数值向量; 计算顺序连贯性的具体公式如下: , 其中OrderContinuity为顺序连贯性,表示第i个字符在切图中的实际坐标;表示根据特征提取模块预测的字符预期坐标;表示任务内最大允许位置偏移阈值; 计算语义关联一致性的具体公式如下: Semantic_Stability=ω1·Avg_Semantic_Similarity+ω2·Avg_Order_Continuity 其中Semantic_Stability为语义关联一致性,ω1,ω2为权重系数,ω1+ω2=1,Avg_Semantic_Similarity和Avg_Order_Continuity分别为多个语义相似度与顺序连贯性的平均值; 计算整体失稳系数的具体公式如下: C_instability=λ1·1-Semantic_Stability+λ2·T_adjust 其中C_instability为整体失稳系数,Semantic_Stability为语义关联一致性,T_adjust为应变信号持续总时间,λ1,λ2为动态权重,λ1+λ2=1; S4、将整体失稳系数和失稳可控阈值一、阈值二分别进行比较; 若整体失稳系数小于失稳可控阈值一,生成保持信号; 若整体失稳系数大于等于失稳可控阈值一且小于失稳可控阈值二,生成调整信号; 若整体失稳系数大于等于失稳可控阈值二,生成预警信号; S5、根据生成的不同信号,对字符识别过程进行动态干预; 当接收到稳定信号时,对语义关联和顺序信息数据进行识别; 当接收到调整信号时,对S2中特征提取的参数进行调整,记录参数调整时间间隔作为新的应变信号持续总时间,重新计算整体失稳系数后,执行S4; 当接收到预警信号时,识别小样本任务数据集中的低质量样本,加强特征提取后,获得更新的多个字符之间的语义关联和顺序信息数据,执行S3; 调整参数的操作具体为: 基于当前整体失稳系数C_instability计算温度参数T: T=1.0+0.5·C_instability 动态调整多分支融合权重weights的分布: weights=softmax[similarityTforsimilarityinsimilarities] 其中similarity为特征相似度,表示不同特征分支或通道输出之间的相似程度;公式描述了一种基于特征相似度similarity动态调整多分支融合权重weights的机制:首先,通过遍历不同特征分支或通道间的特征相似度集合similarities,将每个特征相似度除以温度参数T进行缩放;随后,通过softmax函数将缩放后的结果转换为一组权重分布,确保所有权重之和为1; 根据支持集规模S_task更新分组卷积的分组数G: G=max4,min16,int12exp-0.03S_task 其中exp函数是用于计算以自然常数e为底的指数函数; 调整基于特征图方差感知的空洞率R: R=2+0.2log1+batch_variance 其中batch_variance表示在一个训练批次batch中,所有样本的特征图的方差。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人山东科技大学,其通讯地址为:266590 山东省青岛市黄岛区前湾港路579号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励