恭喜中科亿海微电子科技(苏州)有限公司屈心媛获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网恭喜中科亿海微电子科技(苏州)有限公司申请的专利FPGA CNN加速器并行度最优解的获得方法及系统获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN113592086B 。
龙图腾网通过国家知识产权局官网在2024-09-24发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202110877922.0,技术领域涉及:G06N3/082;该发明授权FPGA CNN加速器并行度最优解的获得方法及系统是由屈心媛;黄志洪;蔡刚设计研发完成,并于2021-07-30向国家知识产权局提交的专利申请。
本FPGA CNN加速器并行度最优解的获得方法及系统在说明书摘要公布了:FPGACNN加速器并行度最优解的获得方法及系统,能够高效地排除冗余的并行度方案,压缩超过99%的搜索空间,删减无效的计算分支,成功将计算所需时长从106小时量级减少到10秒内。方法包括:数据粗筛;数据精筛;输出数据筛选后的单层并行度组合集合Ti;从第1层到第5层的嵌套循环遍历过程中,实时计算并更新跨层组合方案已经使用的DSP和BRAM个数;若计算到某一层,资源使用已经超标,则直接跳过后续所有内层循环,将该分支的跨层组合方案全部裁剪;实时更新已遍历的跨层组合中最优的max{#cyclei}结果maxCycle;在后续循环过程中,如果当前层的#cycle大于maxCycle,意味着该组合分支无法进一步优化maxCycle,停止往内层继续遍历,将该分支对应的跨层组合方案全部裁剪。
本发明授权FPGA CNN加速器并行度最优解的获得方法及系统在权利要求书中公布了:1.FPGACNN加速器并行度最优解的获得系统,其特征在于:其包括:输入模块,其配置来输入CNN网络结构参数和FPGA片上可用资源数;构建模块,其配置来构建问题模型:为确定加速器的最优并行度配置参数Parain,Paraout,Paraseg,提出一种最优并行度搜索算法,其设计目标为:在取值区间内以最细粒度遍历所有可行的并行度组合方案,筛选出计算资源利用率最高的并行度配置参数;约束模块,其配置来列举算法约束约束1.为保证资源分配的合理性,#DSPi与片上可用DSP总量#DSPtotal之比,等于卷积层计算量#OPi占网络总计算量#OPtotal的百分比;约束2.全流水加速器的吞吐率受限于最大#cyclei,为提高吞吐率,减小max{#cyclei},#cyclei是单层所需周期数;约束3.∑#DSPi不超过片上可用DSP资源总数#DSPtotal;约束4.∑#BRAMi不超过片上可用存储资源总数#BRAMtotal;遍历模块,其配置来以最小粒度遍历元组Parain,Paraout,ROWout,确定α,β约束下的并行度集合Si;Parain是输入并行度,Paraout是输出并行度,ROWout表示ROWin行输入特征图片段经过卷积后得到的输出特征图片段的行数,α为计算周期浮动因子,β为DSP分配浮动因子;#DSPi是单层资源使用量,#BRAMi为单层存储资源使用量;数据粗筛模块,其配置来执行排序和局部数据清洗;数据精筛模块,其配置来执行排序和全局数据清洗;输出模块,其配置来输出数据筛选后的单层并行度组合集合Ti;搜索剪枝模块,其配置来从第1层到第5层的嵌套循环遍历过程中,实时计算并更新跨层组合方案已经使用的DSP和BRAM个数;若计算到某一层,资源使用已经超标,则直接跳过后续所有内层循环,将分支的跨层组合方案全部裁剪;实时更新已遍历的跨层组合中最优的max{#cyclei}结果maxCycle;在后续循环过程中,如果当前层的#cycle大于maxCycle,意味着分支无法进一步优化maxCycle,停止往内层继续遍历,将分支对应的跨层组合方案全部裁剪;所述数据粗筛模块中,排序为:对单层Si集合中的元素,第一轮迭代以#cyclei、#DSPi、#BRAMi优先级递减的顺序,将数据按照升序排列;第二轮迭代以#DSPi、#cyclei、#BRAMi优先级递减的顺序升序排列;第三轮迭代则是以#BRAMi、#cyclei、#DSPi优先级递减的顺序升序排列;所述数据粗筛模块中,局部数据清洗为:对于集合Si中的元素σj和σk,j≠k,若σj的#cycle、#DSP和#BRAM均不大于σk的相应指标,定义偏序关系KO:元素σk完败,被KO元素σj,元素σj完胜,KO元素σk;对于每轮排序完毕的单层数据,进行一次局部数据清洗,流式压缩遍历,比较相邻元素并剔除完败的;数据每经过一轮局部清洗,有序集合都满足如下条件:任意相邻的两个元素不存在KO偏序关系;所述数据精筛模块中,单层集合Si经过数据粗筛压缩后,得到的有序集合记为S’i,将其重新以#cyclei、#DSPi、#BRAMi优先级递减的顺序按照升序排列,并进行全局数据清洗:遍历S’i,若某元素σj完败排在其前面的某个元素σk,kj,则将σj从集合S’i中删除;数据经过一轮全局清洗后,集合S’i进一步压缩为Ti,有序集合Ti满足如下条件:集合中任意两个元素不存在KO偏序关系。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人中科亿海微电子科技(苏州)有限公司,其通讯地址为:215000 江苏省苏州市苏州工业园区金鸡湖大道99号纳米城西北区NW-01幢7层705房间;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。