买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
申请/专利权人:吉林大学;吉林卡普林科技有限公司
摘要:一种基于计数模块的手写数学公式多尺度识别方法,涉及图像识别技术领域,解决现有技术针对手写体数字识别模型存在的识别准确性低的问题,本方法通过构建手写数学公式图像数据集,将手写数学公式图像输入构建基于计数模块的手写数学公式识别模型,采用ResNet对处理后的图像数据集中手写数学公式图像提取特征图,采用符号计数模块对特征图添加全局信息,通过LSTM输出预测的LaTeX序列。本方法将手写数学公式识别建模为一个图像至序列的任务。利用编码器被用于提取输入图像的特征,而解码器则逐步预测对应LaTeX序列。本方法有效地将手写数学公式识别问题转化为一个端到端的序列生成问题,简化了问题的复杂性。
主权项:1.一种基于计数模块的手写数学公式多尺度识别方法,其特征是:该方法由以下步骤实现:步骤一、获取手写数学公式图像数据集;步骤二、对步骤一所述的手写数学公式图像数据集进行多尺度缩放增广处理,获得处理后的图像数据集;步骤三、构建基于计数模块的手写数学公式识别模型,采用ResNet网络对所述处理后的图像数据集中手写数学公式图像提取特征图,采用符号计数模块对所述特征图添加全局信息,最后通过LSTM网络输出预测的LaTeX序列;具体过程为:步骤三一、将所述ResNet网络作为编码器对输入的手写数学公式图像进行特征提取,获得特征图F;步骤三二、采用所述符号计数模块对所述特征图F提取符号特征,获得符号计数向量V,所述符号计数向量V中的每个值为预测的对应符号的计数值;步骤三三、将所述LSTM网络作为解码器对步骤三一获得的特征图F进行解码,同时对步骤三二获得的符号计数向量V作为全局信息输入解码器中,最终成生手写数学公式图像对应的LaTeX公式序列。
全文数据:
权利要求:
百度查询: 吉林大学 吉林卡普林科技有限公司 一种基于计数模块的手写数学公式多尺度识别方法
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。