首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

一种强噪声复杂背景图像中的汉字组词方法 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

申请/专利权人:汕头大学;广东叁玖捌大数据科技有限公司

摘要:本发明公开的强噪声复杂背景图像中的汉字组词方法,根据若干个包含汉字的背景图像,构建用于汉字定位的神经网络模型;获取待处理的第一背景图像,并根据神经网络模型对第一背景图像进行汉字定位,获得若干个汉字定位框;根据预设的深度学习模型,对若干个汉字定位框中的文字进行汉字识别,获得待组词乱序文字;再利用训练文本结合预设的训练模型构建出字符表,对于输入的乱序文字,遍历所有排序,并基于构建好的字符表,计算每个排序对应的自然语序度量值,最后以自然语序度量值最高的排序作为乱序文字的排序结果。本发明能够提高在强噪声复杂背景图像中汉字定位、汉字识别和汉字组词的准确性,从而扩大汉字识别和组词的应用场景和范围。

主权项:1.一种强噪声复杂背景图像中的汉字组词方法,其特征在于,包括:根据若干个包含汉字的背景图像,构建用于汉字定位的神经网络模型;其中,所述背景图像为强噪音复杂背景图像;获取待处理的第一背景图像,并根据所述神经网络模型对所述第一背景图像进行汉字定位,获得若干个汉字定位框;根据预设的深度学习模型,对所述若干个汉字定位框中的文字进行汉字识别,获得待组词乱序文字;获取待组词乱序文字对应的待组词字符串,并根据字符串中的字符查找表查询所有待组词字符串对应的出现总次数,以此构建第一向量;根据所述待组词字符串当前的字符排列顺序,分别查询第一字符词频表和第二字符词频表,并根据查询结果构建第一条件概率计数向量和第二条件概率计数向量;其中,所述第一字符词频表、第二字符词频表和字符查找表组成字符频表;所述字符频表由预设的训练文本和训练模型而得到;根据第一向量、第一条件概率计数向量和第二条件概率计数向量,分别计算得出所述待组词字符串对应的第一条件概率向量和第二条件概率向量;分别对所述第一条件概率向量和第二条件概率向量中的各元素取对数,并将概率之积转化为对数概率之和,依次获得第一自然语序度量值和第二自然语序度量值;根据所述第一自然语序度量值和第二自然语序度量值,获得所述待组词字符串当前的字符排列顺序对应的自然语序度量值,并遍历所述待组词字符串的所有字符排列顺序,按照相同的计算方法,依次获得若干个自然语序度量值,再选择自然语序度量值最大的字符排列顺序,将所述待组词字符串进行自动组词。

全文数据:

权利要求:

百度查询: 汕头大学 广东叁玖捌大数据科技有限公司 一种强噪声复杂背景图像中的汉字组词方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。