首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

一种智能无透镜文字识别系统 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

申请/专利权人:浙江大学

摘要:本发明公开了一种智能无透镜文字识别系统。包括光学模块和计算成像及智能文字定位识别模块,光学模块由可调制幅度掩膜板和传感器组成,其中掩膜板的透射光幅度分布被建模为二维卷积层,可作为参数被优化;计算成像及文字定位识别模块包含计算成像模型、文字定位模型和文字识别模型,输入数据为经过光学模块后在传感器上得到的原始数据,输出为预测的文字的文本形式,同时通过结果反馈来优化光学模块中的掩膜版透光幅度分布以及计算成像网络参数。本发明实现了软硬件一体化的无透镜成像和文字识别的深度学习模型优化,提高了在无透镜下的文字定位和文字识别的准确率,且该系统的每个模块具有通用性和普适性,具有很强的实际应用性。

主权项:1.一种智能无透镜文字识别系统,其特征在于,包括光学模块和计算成像及文字定位识别模块,光学模块由平行放置的可调制幅度掩膜板和光学传感器组成,待识别目标放置于光学模块前方,待识别目标发出的光线经可调制幅度掩膜板散射后,在光学传感器的平面上投射形成投影图像,光学传感器将投影图像传输至计算成像及文字定位识别模块;可调制幅度掩膜板上的图案通过液晶显示器显示,掩模版上的图案通过训练优化后确定;计算成像及文字识别模块包括计算成像模型、文字定位模型和文字识别模型,三个模型串行连接;计算成像及文字识别模块的输入为经光学模块后在传感器上得到的投影图像,输出为投影图像上文字的文本形式;通过训练优化后确定掩模版图案的方法包括以下步骤:1将待识别目标与光学模块的成像过程建模为二维卷积层,具体为:m=w*o 其中,w表示掩模版上的幅度分布,即掩模版上单元格的值分布;以掩模版中心点为原点构建坐标系,i,j为掩膜板上单元格中心点的坐标,wi,j表示掩膜板上坐标为i,j的单元格的值;o表示待识别目标不经过掩模版时在传感器平面上缩放后的图像;以传感器平面中心点为原点构建坐标系,x,y表示投影图像的像素点在传感器平面上的坐标值,ox,y表示待识别目标不经过掩模版时在传感器平面的x,y处的像素值;ox+i,y+j表示在传感器平面上x+i,y+j处的像素值;m表示待识别目标经过掩模版后投影在传感器平面上的图像;mx,y表示待识别目标经过掩模版后在传感器平面的x,y处的像素值;k表示掩模版上单元格的行数或列数,i∈[1,k];2将二维卷积层进行二值化得到二值神经网络二维卷积层,结果如下: 其中, 其中,wb表示对w进行二值化处理后的结果;3将二值神经网络二维卷积层的参数wb作为模型参数与计算成像及文字定位识别模块一同训练优化;3.1训练过程中,通过电路调整对掩膜板的图案做随机初始化,并将随机初始化的结果作为二值神经网络卷积层的初始参数;3.2系统前向传播过程的训练:固定待识别目标,在真实物理场景中测量待识别目标经掩膜版后在光学传感器的平面上得到的投影图像,并将其作为计算成像及文字定位识别模块的输入;反向传播过程的训练:计算成像及文字定位识别模块输出的预测图像与真实图像标签的损失函数Loss,将损失函数Loss反向传播至二值神经网络卷积层,更新二值神经网络卷积层参数wb,并根据更新的参数wb调制可调掩膜版,调制结果作为下一轮训练时模型前向传播过程中的掩膜版图案;3.3训练完成后得到的掩膜版图案为优化后的结果。

全文数据:

权利要求:

百度查询: 浙江大学 一种智能无透镜文字识别系统

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。