山东大学刘晓倩获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉山东大学申请的专利多粒度多视角多任务的增量多语言文本识别方法及系统获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN121303120B 。
龙图腾网通过国家知识产权局官网在2026-03-10发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202511870511.3,技术领域涉及:G06F40/279;该发明授权多粒度多视角多任务的增量多语言文本识别方法及系统是由刘晓倩;许信顺;罗昕;陈振铎设计研发完成,并于2025-12-12向国家知识产权局提交的专利申请。
本多粒度多视角多任务的增量多语言文本识别方法及系统在说明书摘要公布了:本发明属于文本识别技术领域,提供了一种多粒度多视角多任务的增量多语言文本识别方法及系统,对于目标图像,利用预训练的特色识别器提取视觉特征和语义特征;进行字符和单词两个粒度的共享知识发现,确定共享实例,并定义相应的所属语言标签;利用语言适配器通过建模视觉特征和语义特征,分别预测字符和单词的所属语言得分,利用门控机制对视觉依赖和语义依赖进行动态加权,得到融合视觉和语义信息的全局所属语言得分,进而指导各个特色识别的协同协作,完成字符级别和单词级别的序列解码,实现多语言文本识别。本发明可以减轻增量学习过程中对旧语言知识的遗忘,从而提高文本识别器的持续学习能力。
本发明授权多粒度多视角多任务的增量多语言文本识别方法及系统在权利要求书中公布了:1.一种多粒度多视角多任务的增量多语言文本识别方法,其特征是,包括以下步骤: 特色语言学习阶段:对于目标图像,利用预训练的特色识别器提取视觉特征和语义特征; 混淆增量多语言学习阶段:进行字符和单词两个粒度的共享知识发现,确定共享实例,并定义相应的所属语言标签; 基于提取的视觉特征和语义特征,利用语言适配器通过建模视觉特征和语义特征,分别预测字符和单词的所属语言得分,利用门控机制对视觉依赖和语义依赖进行动态加权,得到融合视觉和语义信息的全局所属语言得分; 基于融合视觉和语义信息的全局所属语言得分,指导各个特色识别的协同协作,以完成字符级别和单词级别的序列解码,实现多语言文本识别; 基于提取的视觉特征和语义特征的过程中,对于每一种新增语言学习一个特色识别器,到当前增量任务,共得到t个特色识别器,对于样本,经过t个特色识别器得到一组视觉特征和一组语义特征,其中,表示任务的回放集,和分别表示第k个特色识别器提取的视觉特征和语义特征; 利用语言适配器通过建模视觉特征和语义特征,分别预测字符和单词的所属语言得分,利用门控机制对视觉依赖和语义依赖进行动态加权的过程包括: ; ; 其中,表示语言适配器的参数;为视觉特征,为语义特征;上标c和w分别表示字符级别和单词级别;表示语言适配器建模视觉特征后所预测的字符级别所属语言得分,表示建模视觉特征后所预测的单词级别所属语言得分;表示语言适配器建模语义特征后所预测的字符级别所属语言得分,表示建模语义特征后所预测的单词级别所属语言得分; 通过门控机制对视觉依赖和语义依赖进行动态加权,得到融合视觉和语义信息的全局所属语言得分: 在字符级别: ; ; 其中,和表示门控机制中字符级别全连接层的权重和偏置参数;和表示基于视觉的语言判别器和基于语义的语言判别器输出的字符级别所属语言得分;表示特征拼接操作;表示Sigmoid函数;表示门机制在字符级别的输出值;表示元素相乘;表示融合视觉和语义信息后的字符级别所属语言得分; 在单词级别: ; ; 其中,和表示门控机制中单词级别全连接层的权重和偏置参数;和表示基于视觉的语言判别器和基于语义的语言判别器输出的单词级别所属语言得分;表示特征拼接操作;表示Sigmoid函数;表示门机制在单词级别的输出值;表示元素相乘;表示融合视觉和语义信息后的单词级别所属语言得分。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人山东大学,其通讯地址为:250000 山东省济南市高新区舜华路1500号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励