买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
申请/专利权人:北京君正集成电路股份有限公司
摘要:本发明提供一种基于第一层4bit卷积计算的优化方法,所述方法实现的是针对输入3通道彩色图像输出数据深度为16的一个完整的卷积计算过程,所涉及到simd指令运算在最内层循环,在最里层循环中,是将图像三通道和依次宽度上的三组深度数据视为一组数据,进行处理计算,其中卷积核数据存储顺序根据卷积计算的要求顺序去存储,即根据卷积计算存储的卷积核数据,相邻两行即在输出深度的两组数据交叉存储;simd指令在最内层循环,需要连续八行每相邻两行交叉存储,将第9行的每个数据与0进行交叉计算,此时数据相当于存储了十行数据。本方法优化操作简单,在方法中只需在最内层循环增加相关simd指令就可实现运行速度的成倍提升。
主权项:1.一种基于第一层4bit卷积计算的优化方法,其特征在于,所述方法实现的是针对输入3通道彩色图像输出数据深度为16的一个完整的卷积计算过程,所涉及到simd指令运算在最内层循环,在最里层循环中,是将图像三通道和依次宽度上的三组深度数据视为一组数据,进行处理计算,其中卷积核数据存储顺序根据卷积计算的要求顺序去存储,即根据卷积计算存储的卷积核数据,相邻两行即在输出深度的两组数据交叉存储;simd指令在最内层循环,需要连续八行每相邻两行交叉存储,将第9行的每个数据与0进行交叉计算,此时数据相当于存储了十行数据;所述方法在加载数据时是连续加载,在所述最内层循环中,每次加载的数据中的一个数据拷贝到simd指令的变量的寄存器中,进行8bit的乘法simd指令计算,再进行转化16bit后,进行累加simd指令计算;或者在卷积计算中,使用相乘再相邻相加的simd指令实现8bit数据转化为16bit数据。
全文数据:
权利要求:
百度查询: 北京君正集成电路股份有限公司 一种基于第一层4bit卷积计算的优化方法
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。