天津大学刘岩获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉天津大学申请的专利一种考虑汉字字形结构特征的汉字图像修复方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN114862721B 。
龙图腾网通过国家知识产权局官网在2025-09-26发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202210573664.1,技术领域涉及:G06T5/77;该发明授权一种考虑汉字字形结构特征的汉字图像修复方法是由刘岩;潘刚;周磊;米红泽;宋钊;胡书豪设计研发完成,并于2022-05-26向国家知识产权局提交的专利申请。
本一种考虑汉字字形结构特征的汉字图像修复方法在说明书摘要公布了:作为图像修复的分支,文字修复近几年受到了广泛重视,但现今的文字修复大多针对英文这种结构简单的文字,对于中文这种结构复杂且多样化的文字研究较少,同时目前包括文字修复在内的图像修复工作大多针对残损图像,对于被涂抹图像的修复目前没有特别多的研究。本发明提出了一种使用字型结构性特征注意力网络的文字修复算法。其可以针对残损、涂抹或二者兼有的汉字图像进行有效的结构性修复。其中字型结构性特征注意力网络是考虑到与英语不同,汉字种类繁多且结构千差万别,如果使用传统的图像修复技术,很难针对汉字的不同结构性特征进行特异性修复,故本发明从汉字的结构下手,提出了针对不同汉字进行特异性修复的字型结构性特征注意力网络。
本发明授权一种考虑汉字字形结构特征的汉字图像修复方法在权利要求书中公布了:1.一种考虑汉字字形结构特征的汉字图像修复方法,大致步骤如下: 1步骤1:构建残损和涂抹汉字数据集; 上述修复方法需要使用残损和涂抹的汉字图像数据集,采用合成的数据或者使用自己收集的数据; 2步骤2:训练预处理网络; 使用深度学习搭建的预处理网络基于U-Net网络改进升级,在编码器和解码器对称的网络层之间跳跃连接,将编码器卷积丢失的特征信息传递给解码器;为了保留更多的空间生成更好的区域掩码并达到下采样的目的,使用2×2大小的卷积核和步长为2的卷积层来代替传统的池化层,还采用了更多的卷积和反卷积层以得到更好的预处理效果;通过预处理网络对输入的残损的汉字图像进行简单的去噪和修复并提取图片中文字信息,以为后面的修复网络提供更好地输入; 3步骤3:训练修复网络; 字形结构性特征注意力网络TAN本质上是卷积层的组合,以起到与注意力机制类似的作用,能够对输入的图像特征进行选择,去除与字形结构无关的特征以及阻碍字形修复的特征;记字形结构性特征注意力网络TAN为其表达式如下: 其中Xj代表输入特征图像,fi为一种特征拆分自适应映射,在网络中一共采用了4种拆分方式,所以i的取值为1至4,而j为输入特征图像X的目的字符的编号,kij为对应fi在编号j下的权值,每个字会有不同权值向量{k1,k2,k3,k4}; 为了保证字形结构注意网络训练的正确性,引入预训练的VGG网络,对其进行监督;记字形结构注意网络TAN的损失函数为Lattention,其表达式如下: 其中Xin,Xin2分别是输入的残损特征图像和修复网络第二次卷积输出,为字形结构注意网络,为预训练的VGG特征提取网络,为修复网络中对应大小的反卷积输出; 全局语义监督网络在某种程度上以隐含索引的形式强化了字形结构注意网络的训练效果,使得字形结构注意网络能够更好的训练出针对不同结构文体的权重,同时其和VGG分别作为语义损失和图像损失在语言和图像两个维度上强化了修复效果;记语义监督网络的损失函数为Lsem,其表达式如下: Lsem=1-cosy,e 其中e为预训练的bert模型对句子E={c1,c2,…,cn}进行词嵌入得到,y为语义监督网络根据每个字ci对应图像imgi进行处理得到; 在预处理网络和修复网络我们映入一致性损失Lconsist,通过强化残损图像的特征图分别经预处理网络和修复网络处理前后的一致性来增强网络修复能力,Lconsist表达式如下: 其中Xtruth为残损输入图像Xin的未残损的目标图像,为预处理网络,为修复网络,λ为超参数可以根据实验结果调整,LsmoothL1损失对应表达式如下: 当预测值和groundtruth差别较小的时候绝对值差小于1,其实使用的是L2损失;而当差别大的时候,是L1损失的平移,SooothL1损失其实是L2损失和L1损失的结合,它同时拥有L2损失和L1损失的部分优点;训练的总损失表达如下: Lall=Lconsist+Lattention+Lsem 4步骤4:测试修复网络对汉字图像的修复结果; 使用步骤3搭建完成的网络在残损和涂抹的汉字图像数据集上进行测试,能够针对残损、涂抹或二者兼有的文字图像取得良好的修复效果。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人天津大学,其通讯地址为:300350 天津市津南区海河教育园雅观路135号天津大学北洋园校区;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励