买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
申请/专利权人:安徽芯纪元科技有限公司
摘要:本发明涉及二维卷积计算,具体涉及一种提高硬件电路执行单批次二维卷积计算效率的方法,基于二维特征图平面内,不同区域的元素的二维卷积结果可以并行计算的特点,实现处理单批次二维卷积计算时MAC阵列中所有处理单元PE并行计算二维特征图中各区域的二维卷积结果;本发明提供的技术方案能够有效克服现有技术所存在的处理单批次二维卷积计算时效率较低的缺陷。
主权项:1.一种提高硬件电路执行单批次二维卷积计算效率的方法,其特征在于:处理单批次二维卷积计算时,二维特征图中各区域数据分别存储在input_buffer的各bank中,针对各输出通道的卷积核权重存储在weight_buffer的各bank中,各区域二维卷积结果存储在output_buffer的各bank中;将二维特征图分为多个区域,各区域数据分别存储在input_buffer的各bank中,并分别广播至MAC阵列中各行所有处理单元PE,各行处理单元PE分别计算一个区域的二维卷积结果,实现处理单批次二维卷积计算时MAC阵列中所有处理单元PE并行计算二维特征图中各区域的二维卷积结果;计算结果输出时,每行处理单元PE的计算结果拼接后输出至output_buffer的对应bank,实现输出特征图一个区域的计算结果在output_buffer中仍然在一个bank中的效果,再次对计算结果执行二维卷积计算时,不需要进行数据重排;其中,在input_buffer的各bank中填充二维特征图的区域数据时,依次按照通道、列、行三个优先级顺序摆放;所述MAC阵列由片上存储器提供数据,所述片上存储器分为三大块,这些大块称为block,一块存储器从行的方向上向MAC阵列提供数据,记为input_buffer;一块存储器从列的方向上向MAC阵列提供数据,记为weight_buffer;一块存储器接收MAC阵列的计算结果,记为output_buffer;每块存储器又分为多个小块,每个小块存储器向一行处理单元PE或一列处理单元PE传输数据,这些小块存储器同时向MAC阵列传输数据,记为bank;所述input_buffer每个bank的数据广播至MAC阵列的每一行,所述weight_buffer每个bank的数据广播至MAC阵列的每一列,每个所述处理单元PE执行行方向上输入数据与列方向上输入数据的乘累加计算,一行所述处理单元PE的计算结果拼接后输出至output_buffer的对应bank;其中,input_buffer、output_buffer的bank数与MAC阵列中处理单元PE的行数R相同,weight_buffer的bank数与MAC阵列中处理单元PE的列数C相同。
全文数据:
权利要求:
百度查询: 安徽芯纪元科技有限公司 一种提高硬件电路执行单批次二维卷积计算效率的方法
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。