Document
拖动滑块完成拼图
首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

神经网络数据运算加速装置、方法、设备与介质 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

申请/专利权人:湖南长城银河科技有限公司

摘要:本发明涉及神经网络数据运算加速装置、方法、设备与介质,通过首先获取神经网络运算的输入数据和Cin个卷积核数据,先将特征矩阵SMF在C方向划分为N个特征子矩阵MF,然后对于每一个特征子矩阵MF,生成其pad后的img2col操作的索引表,然后将生成img2col操作的索引表映射回原始的特征矩阵SMF的索引表,最后实现神经网络运算的数据的局部化并进入运算处理,可以一次计算多个滑动窗口,即一次可读入多个数据,从而大大减少了对数据的访问次数以极大提升运算效率。相比于传统技术,实现了神经网络的局部化运算,有效减少计算机的缓存占用的同时减少了对特征数据的访问次数,可通用于多种神经网络的运算加速。

主权项:1.一种神经网络数据运算加速装置,其特征在于,包括:数据获取模块,用于获取神经网络运算的输入数据和Cin个卷积核数据;Cin为神经网络的输入通道数;矩阵划分模块,用于将神经网络的特征矩阵在C方向划分为N个WHC0大小的特征子矩阵,并将神经网络的权重矩阵对应划分成N个权重子矩阵;W是特征子矩阵的宽度,H是特征子矩阵的高度,C0为大于1的整数,N为不小于1的整数;索引生成模块,用于生成所有特征子矩阵填充后的img2col操作的索引表;索引映射模块,用于将生成的img2col操作的索引表映射回特征矩阵的索引表;运算处理模块,用于根据特征子矩阵的索引表读取所述输入数据进行局部化,按照特征子矩阵的小矩阵的索引表读入数据并进行预处理后,利用卷积核完成运算处理,得到N个特征子矩阵的运算结果;结果累加模块,用于将N个特征子矩阵的运算结果累加作为最后的神经网络运算的输出结果。

全文数据:

权利要求:

百度查询: 湖南长城银河科技有限公司 神经网络数据运算加速装置、方法、设备与介质

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。