买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
摘要:本申请提供了一种基于存内计算Macro的CNN加速系统,涉及计算机技术领域。该CNN加速系统具有高能效、低延迟的特点,暂存区模块和状态控制模块作为独立的端点通过总线连接到CPU上可极大限度的降低数据在进出CPU和外设之间的延迟;在CNN加速系统和片外存储器的控制器之间四路串行外设接口总线直接读取片外闪存数据,这有助于减少CNN推理期间的权重更新延迟;乒乓缓冲区模块有助于隐藏输入激活预取的时间从而减少延迟,使用与存内计算集群模块相同容量的权重缓冲模块可以提前在片外进行权重的预取,比直接访问片外存储器具有更低的能耗和更少的延迟;使用存内计算Macro来完成卷积和全连接运算本身就具有高能效的特点。
主权项:1.一种基于存内计算Macro的CNN加速系统,其特征在于,包括:暂存区模块、状态控制模块、乒乓缓冲区模块、存内计算集群模块、权重缓冲模块、加法树模块以及数据可重构控制模块;中央处理器CPU通过总线发送表示配置寄存器的指令到CNN加速系统的状态控制模块,状态控制模块将CNN模型第一层的指令送入到数据可重构控制模块进行指令译码操作,得到依次的权重更新指令、激活预取指令、存内计算指令以及结果写回指令;先执行权重更新指令,由权重缓冲模块通过本地专用的四路串行外设接口总线读取片外存储器上的权重数据,然后将权重缓冲模块中的权重数据写入存内计算集群模块;权重更新指令执行完毕后执行激活预取指令,将暂存区模块中的特征数据输入乒乓缓冲区模块,在写乒缓冲区时,将乓缓冲区中的数据写入存内计算集群模块的存内计算Macro;在写乓缓冲区时,将乒缓冲区中的数据写入存内计算集群模块的存内计算Macro,循环往复一直到写完一层所有的输入特征数据到存内计算Macro中;然后开始存内计算指令,开启存内计算集群模块中对应的存内计算Macro使能开始计算,计算完毕后向状态控制模块发送表明当前层运算完成的信号;加法树模块对各个存内计算Macro的输出结果进行累加,并在接收到结果写回指令后将累加结果发送到暂存区模块,用于CNN的下一层计算。
全文数据:
权利要求:
百度查询: 中国科学院微电子研究所 一种基于存内计算Macro的CNN加速系统
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。