买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
摘要:本发明提供了一种逐块计算的向量‑零值稀疏感知卷积神经网络加速器,加速器包括整体控制器、特征搜索单元、输入特征管理单元、权重管理单元、卷积计算阵列、输出特征管理单元和内存管理单元;整体控制器负责控制整个加速器的运行;特征搜索单元用于确定输出特征向量与输入特征的映射关系;输入特征管理单元用于暂存即将用到的输入特征向量,并根据搜索结果将对应的特征向量中的非零值加载到卷积计算阵列;权重管理单元用于暂存权重;输出特征管理单元暂存输出特征向量,并采用零值压缩算法将特征向量压缩;内存管理单元将压缩后的特征写回片外存储器,完成特征块的更新。通过本发明方案,提高了加速器算力,减少了计算资源和能量消耗。
主权项:1.一种支持逐块计算的向量-零值稀疏感知卷积神经网络加速器,其特征在于,所述加速器包括:整体控制器、特征搜索单元、输入特征管理单元、权重管理单元、卷积计算阵列、输出特征管理单元和内存管理单元,整体控制器负责控制整个加速器的运行;特征搜索单元用于确定输出特征向量与输入特征的映射关系,即计算每个输出特征向量需要哪些特征向量的参与,特征搜索单元包括坐标缓冲区和特征搜索器,坐标缓冲区用于存储特征块中每个特征向量的坐标,特征搜索器用于搜索有效特征,首先将特征块转化为空间位图,然后用卷积核按照从左到右,从上到下遍历空间位图,从而得到输入特征和输出特征的映射关系;输入特征管理单元用于暂存即将用到的输入特征向量,并根据特征搜索单元搜索到的映射关系将对应的特征向量中的非零值加载到卷积计算阵列,以执行具体的卷积运算,输入特征管理单元包括特征译码器,坐标缓冲区,0-1索引缓冲区,非零值缓冲区,坐标匹配单元和特征聚合器;特征译码器首先从片外存储器读取压缩过的特征向量,并对读入的特征向量进行解码,解码后得到特征向量的坐标x,y、0-1索引和非零值三部分,并将这三部分存入对应的缓冲区;然后,坐标匹配单元读坐标缓冲区,并判断读取的特征向量的坐标与特征搜索单元的搜索结果是否匹配,若匹配,则特征聚合器将检查该特征向量对应的权重是否已经被剪掉,如果没有剪掉,特征聚合器将该特征向量中的非零值和对应的权重加载到卷积计算阵列;权重管理单元用于暂存权重,并根据需要将权重输出到卷积计算阵列,权重管理单元包括剪枝标志寄存器和权重缓冲区,给定神经网络中的权重数据,采用网络剪枝技术去掉权重中的冗余部分;卷积计算阵列包含多个卷积计算单元,每个卷积计算单元包含乘法器、加法树、累加器和批归一化单元,用以执行卷积运算中的乘法、加法操作,以及后续的批归一化操作;输出特征管理单元暂存输出特征向量,并采用零值压缩算法将特征向量压缩,输出特征管理单元包括输出缓冲区、特征编码器、坐标缓冲区、0-1索引缓冲区、非零值缓冲区、特征组装器和边界检测单元,输出缓冲区用于缓冲卷积计算阵列的输出结果,该结果尚未压缩,特征编码器对输出特征进行零值压缩编码,并将编码结果分别存入对应的坐标缓冲区、0-1索引缓冲区和非零值缓冲区中,特征组装器将压缩编码结果组装成固定长度的标准帧,边界检测单元用于检测当前输出特征向量是否位于块边界,并将检测结果送往内存管理单元;内存管理单元将压缩后的特征写回片外存储器,完成特征块的更新,加速器与片外存储器的交互由内存管理单元完成,内存管理单元包含内存读写控制器和特征块存放表,内存读写控制器用于执行具体的片外存储器读写操作,特征块存放表用于记录每个特征块在内存中的存放地址以及完成特征块更新。
全文数据:
权利要求:
百度查询: 电子科技大学 一种逐块计算的向量-零值稀疏感知卷积神经网络加速器
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。