买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
申请/专利权人:长飞光纤光缆股份有限公司
摘要:本发明公开了一种基于权重策略的混合验证码的识别方法,包括:获取验证码图片,并对该验证码图片进行预处理,以得到预处理后的图片,将预处理后的图片分别输入N个光学字符识别应用程序接口OCRAPI,以得到对应于每个OCRAPI的多个识别字符所组成的识别字符组,所有识别字符组构成识别字符集合,通过针对每个字符组中的字符设置不同权重数,经过逐一对比后得到权重数最大的字符,组成最终的识别字符。本发明能够解决现有混合验证码识别方法由于需要对模型进行训练且训练过程非常冗长,导致识别过程复杂且费时的技术问题。
主权项:1.一种基于权重策略的混合验证码的识别方法,其特征在于,包括以下步骤:(1)获取验证码图片,并对该验证码图片进行预处理,以得到预处理后的图片;(2)将步骤(1)预处理后的图片分别输入N个光学字符识别应用程序接口OCRAPI,以得到对应于每个OCRAPI的多个识别字符所组成的识别字符组,所有识别字符组构成识别字符集合,其中N为自然数;(3)设置计数器i=1;(4)判断计数器i是否大于步骤(2)中使用的OCRAPI的总数N,如果是则返回步骤(1),否则进入步骤(5);(5)判断对应于第i个OCRAPI的识别字符组中识别字符的数量是否等于步骤(1)预处理后的图片中字符的总数,如果是则进入步骤(7),否则进入步骤(6);(6)设置步骤i=i+1,并返回步骤(5);(7)将第i个OCRAPI对应的识别字符组放置于识别字符集合的最开头,从而得到重新排序后的识别字符集合{D11,D12,…,D1p’,D21,D22,…,D2q’,…,DN-11,DN-12,…,DN-1t’,DN1,DN2,…,DNr’},然后进入步骤(8);其中p’表示重新排序后的识别字符集合中第一个识别字符组中识别字符的总数,q’表示重新排序后的识别字符集合中第二个识别字符组中识别字符的总数,…,t’表示重新排序后的识别字符集合中倒数第二个识别字符组中识别字符的总数,r’表示重新排序后的识别字符集合中最后一个识别字符组中识别字符的总数;(8)为步骤(7)重新排序后的识别字符集合中所有识别字符组中第一个识别字符D11,…,DN-11,DN1分配权重值2,为步骤(7)重新排序后的识别字符集合中除了第一个识别字符组以外的所有识别字符组中第二个识别字符D22,…,DN-12,DN2分配权重值1,针对形成的第一识别字符集合{D11,…,DN-11,DN1,D22,…,DN-12,DN2}中出现次数大于等于两次的每个识别字符而言,将该识别字符所对应的权重值相加,以得到该识别字符对应的权重和,将得到的多个权重和按照从大到小的方式进行排序,并将最大权重和对应的识别字符作为识别结果的首字符;(9)设置计数器k=1;(10)判断计数器k是否大于p’-1,如果是则进入步骤(13),否则进入步骤(11);(11)对重新排序后的识别字符集合中的多个识别字符组D12,…,D1p’-1,D22,D22,…,D2q’-1,…,DN-12,DN-13,…,DN-1t’-1而言,将所有识别字符组中第k个识别字符D1k,…,DN-1k,DNk分配权重值2,为除了第一个识别字符组D12,…,D1p’-1以外的所有识别字符组中第k-1个识别字符D2k-1,…,DN-1k-1,DNk-1分配权重值1,为除了第一个识别字符组D12,…,D1p’-1以外的所有识别字符组中第k+1个识别字符D2k+1,…,DN-1k+1,DNk+1分配权重值1,针对形成的第二识别字符集合{D1k,…,DN-1k,DNk,DN1,D2k-1,…,DN-1k-1,DNk-1,D2k+1,…,DN-1k+1,DNk+1}中出现次数大于等于两次的每个识别字符而言,将该识别字符所对应的权重值相加,以得到该识别字符对应的权重和,将得到的多个权重和按照从大到小的方式进行排序,并将最大权重和对应的识别字符作为识别结果的第k个中间字符;(12)设置计数器k=k+1,并返回步骤(10);(13)为步骤(7)重新排序后的识别字符集合中所有识别字符组中最后一个识别字符D1p’,…,DN-1t’,DNr’分配权重值2,为步骤(7)重新排序后的识别字符集合中除了第一个识别字符组以外的所有识别字符组中倒数第二个识别字符D2q’-1,…,DN-1t’-1,DNr’-1分配权重值1,针对形成的第三识别字符集合{D1p’,…,DN-1t’,DNr’,D2q’-1,…,DN-1t’-1,DNr’-1}中出现次数大于等于两次的每个识别字符而言,将该识别字符所对应的权重值相加,以得到该识别字符对应的权重和,将得到的多个权重和按照从大到小的方式进行排序,并将最大权重和对应的识别字符作为识别结果的尾字符;(14)将步骤(9)得到的首字符、步骤(11)得到的中间字符、以及步骤(13)得到的尾字符组合成为最终的识别结果。
全文数据:
权利要求:
百度查询: 长飞光纤光缆股份有限公司 一种基于权重策略的混合验证码的识别方法和系统
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。