买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
摘要:本发明涉及卷积神经网络技术领域,尤其为一种适用于并行计算架构的权重地址排布方法,包括:内存排布优化单元按计算顺序来排布权重在内存中的位置;任务拆分控制单元将神经网络计算任务拆分为多个可执行的子任务;直接内存读写控制单元将权重系数从内存搬移到多核处理器中。本发明在卷积神经网络并行计算架构中,按照输出通道将任务拆分到不同处理核中进行运算的需求,针对多任务间的权重系数设计一种高效的内存排布方式,可以显著提高任务执行效率,降低芯片片内存储空间压力。本发明按计算顺序来排布权重在内存中的位置确保权重的连续读取,可以减少内存读取的latency,优化计算。
主权项:1.一种适用于并行计算架构的权重地址排布方法,其特征在于:包括S1.1:内存排布优化单元按计算顺序来排布权重在内存中的位置;S1.2:任务拆分控制单元将神经网络计算任务拆分为多个可执行的子任务;S1.3:直接内存读写控制单元将权重系数从内存搬移到多核处理器中;所述S1.2中,包括如下步骤:S3.1:按照权重参数输出通道每32字节拆分子任务;S3.2:拆分子任务的数量等于权重参数输出通道数向上取整;所述S1.1中,包括如下步骤:S2.1:将权重参数输出通道数按照每32字节拆分为一组;S2.2:计算整个卷积核分组数量时,当中,n的值向上取整;内存排布优化单元将OCL按照每32Byte拆分为一组,所述内存排布优化单元支持每个卷积核数据类型format为1Byte,2Byte,4Byte;当卷积核数据类型为1字节时,每组支持存放32个权重参数输出通道数;当卷积核数据类型为2字节时,每组支持存放16个权重参数输出通道数;当卷积核数据类型为4字节时,每组支持存放8个权重参数输出通道数。
全文数据:
权利要求:
百度查询: 芯砺智能科技(上海)有限公司 一种适用于并行计算架构的权重地址排布方法
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。