基于循环优化技术的通用卷积运算加速器架构的设计与实现方法

导航：龙图腾网> 最新专利技术> 基于循环优化技术的通用卷积运算加速器架构的设计与实现方法

买专利卖专利找龙图腾，真高效！查专利查商标用IPTOP,全免费！专利年费监控用IP管家,真方便！

申请/专利权人：大连理工大学

摘要：本发明公开一种基于循环优化技术的通用卷积运算加速器架构的设计与实现方法，通过循环平铺、循环交换与循环展开等关键技术，设计出一套高效的循环优化策略，进而指导加速器硬件架构的开发。提出一种针对卷积操作的循环优化策略，主要聚焦于循环‑2、循环‑3和循环‑4的展开，以多个并行的乘积‑累加计算单元展开循环‑2和循环‑4，同时通过多个周期展开循环‑3。基于此策略，构建了一种新颖的卷积加速器架构，并根据提出的循环优化策略，定制有效的数据流处理方法，确保了卷积计算的高效执行。综合应用这些策略，本发明不仅期望提高卷积加速器的计算性能，还旨在优化资源使用，从而为FPGA在高效计算领域的应用开辟新路径。

主权项：1.一种基于循环优化技术的通用卷积运算加速器架构的设计与实现方法，所述的卷积运算包括四个层次的循环，分别表示如下：循环-1：forky＝0；kyNky；ky++与forkx＝0；kxNkx；kx++：这个最内层的双层循环遍历卷积核的每个元素，其中，其中kx与ky表示卷积核在其宽度和高度上的索引，用于遍历卷积核的每个元素，以进行卷积计算；Nky和Nkx分别表示卷积核在y和x维度上的大小；循环-2：forni＝0；niNif；ni++：第二层循环遍历输入特征图的深度，其中，ni表示当前操作的输入特征图的通道索引，Nif表示输入特征图的通道数；循环-3：fory＝0；yNoy；y+＝S与forx＝0；xNox；x+＝S：这个双层循环遍历输出特征图的每个位置，步长为S；Nox和Noy表示输出特征图在x和y维度上的大小；循环-4：forno＝0；noNof；no++：最外层循环遍历输出特征图的深度，其中，no表示当前操作的输出特征图的通道索引，Nof表示输出特征图的通道数；其特征在于，所述的基于循环优化技术的通用卷积运算加速器架构的设计与实现方法的步骤如下：步骤1：利用循环优化技术流程设计卷积神经网络架构，以平衡计算效率、存储需求和数据传输；步骤1.1：通过并行乘累加操作展开循环-2和循环-4，以及在多个周期内展开循环-3，最小化计算延迟，同时优化数据重用和资源消耗；步骤1.2：通过从循环-1依次至循环-4的顺序执行卷积计算；步骤1.3：通过在循环-3和循环-4维度上平铺数据，并根据设计变量传输到片上存储器；步骤2：设计数据流和数据布局，从片外存储器到片上缓存，再到计算单元PE阵列；步骤2.1：将特征数据分块并编码，确保每个数据块通过单次总线传输获取；步骤2.2：定制特征图和卷积核的读取顺序，以实现数据访问的连续性；步骤3：基于异构FPGA设计硬件卷积加速器，以实现利用循环优化技术所设计卷积神经网络架构；步骤3.1：实现DMA模块控制数据从片上缓存到处理单元的访问；步骤3.2：实现乒乓模式下的寄存器组缓存权重；步骤3.3：实现计算单元中的控制逻辑模块协调特征和权重的同步读取；步骤3.4：实现MAC单元在每个周期内对权重和像素数据进行乘法运算，通过加法器树累加得到部分和；步骤3.5：实现累加器单元对MAC单元生成的部分和的累加和缓冲；步骤3.6：实现位移和截断操作模块，在完成累加后处理输出像素。

全文数据：

权利要求：

百度查询：大连理工大学基于循环优化技术的通用卷积运算加速器架构的设计与实现方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：一种可调节径向大小的管道机器人及使用方法

下一篇：半导体存储器件

相关技术

一种可调节径向大小的管道机器人及使用方法

半导体存储器件

一种具有清洁组件的制袋机自动放卷设备

指纹识别组件及智能门锁

导体迹线结构、转子、转角传感器单元和用于制造转角传感器单元的转子的方法

一种园林用草坪修剪机

一种自动化地下管道铺设用微型顶管装置

一种晶圆预清洗腔室穹顶清洗方法

一种小麦晚播施肥方法及其应用

高效固件测试

用于治疗胰腺癌的帕特胺A衍生物

图像处理方法、装置、电子设备及存储介质

积相关技术

一种烟道除积灰装置_西安热工研究院有限公司_202411040807.8

扫刷式防积尘水洗装置_无锡索奥半导体科技有限公司_202323497940.X

用于电子级亚微米球形硅微粉生产的防积碳球化炉_江苏联瑞新材料股份有限公司_202410821264.7

一种演示赵爽弦图积定和最小的滑轨式教具_朱金凤_202411085218.1

罩式退火炉波纹型内罩积碳清洗机_天津市新天钢冷轧板业有限公司_202410998087.X

一种光伏组串积灰率测定装置_重庆中电自能科技有限公司_202410913695.6

电除尘器阳极板及阴极线积灰的清理装置_国投金城冶金有限责任公司_202420256736.4

一种干式变绕组内壁积灰清洁工具_江苏国信溧阳抽水蓄能发电有限公司_202420237505.9

一种消积通便止痛的中药膏及其制备工艺_北京京师维康医药科技有限公司_202411161475.9

一种光伏太阳能板积尘监控系统_中建泓泰通信工程有限公司_202410854400.2

加速器相关技术

一种神经网络加速器_深圳鲲云信息科技有限公司_202010574432.9

一种LU分解硬件加速器及加速方法_北京烽火万家科技有限公司_202411274307.0

改进数据转换加速器中的数据转换操作_迈凌有限公司_202410402143.9

一种神经网络加速器编译方法及装置_清华大学_202110821142.4

一种可实现4π治疗方法的环形直线加速器治疗系统_上海希替直加医疗科技有限公司_202411114595.3

基于梯度磁场改善燃烧的磁致聚合燃烧加速器的结构_武汉富世达能源科技股份有限公司_202410814294.5

一种用于放射治疗电子直线加速器的剂量控制优化方法_山东大学齐鲁医院_202410734812.2

用于X射线线性加速器的实时能量和剂量监测的系统和方法_拉皮斯坎控股公司_202380020243.9

基于循环优化技术的通用卷积运算加速器架构的设计与实现方法_大连理工大学_202410454244.0

一种服务器、加速装置以及加速卡_浪潮电子信息产业股份有限公司_202411223824.5

运算相关技术

全差分运算放大器和全差分运算放大器电路_圣邦微电子(北京)股份有限公司_202110308302.5

深度学习模型运算和生物识别方法、装置、介质及设备_北京眼神科技有限公司_202310355888.X

基于CAN报文解析运算的自动驾驶测试方法和系统_际络科技(上海)有限公司_202111450657.4

轨对轨输入级电路及运算放大器_新唐科技股份有限公司_202311383597.8

存储数据的装置和方法以及执行分组卷积运算的装置_北京地平线机器人技术研发有限公司_201910777752.1

轨到轨运算放大器及其输入级结构_圣邦微电子(北京)股份有限公司_202111594328.7

基于简廓多边形布尔运算的图像绘制方法及系统_蚂蚁财富(上海)金融信息服务有限公司_202410925282.X

一种集成运算放大器的通用自动化测试系统_昇陌微电子(苏州)有限公司_202410963322.X

基于循环优化技术的通用卷积运算加速器架构的设计与实现方法_大连理工大学_202410454244.0

计算窄位宽线性代数运算的方法_巴塞罗那超算中心-国家超算中心_202280092709.1

龙图腾网&IPTOP

设置信息完成注册

手机号绑定多个账号

基于循环优化技术的通用卷积运算加速器架构的设计与实现方法

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务