嵩山实验室王偲柠获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉嵩山实验室申请的专利基于Gem5框架的晶圆级多GPU仿真方法、装置及存储介质获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN116776821B 。
龙图腾网通过国家知识产权局官网在2026-04-17发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202310716863.8,技术领域涉及:G06F30/398;该发明授权基于Gem5框架的晶圆级多GPU仿真方法、装置及存储介质是由王偲柠;邵阳雪;刘战伟;魏帅;李沛杰;裴雪;于洪设计研发完成,并于2023-06-16向国家知识产权局提交的专利申请。
本基于Gem5框架的晶圆级多GPU仿真方法、装置及存储介质在说明书摘要公布了:本发明公开了一种基于Gem5框架的多GPU仿真模拟方法,用于晶圆级系统,包括:搭建Gem5系统模拟运行环境,下载源文件、编译、运行;创建多个GPU组件,并将多个GPU的L2缓存分别连接到Directory上,Directory再将其分别指向各个GPU所属的内存段;更改ROCk驱动,为一个或多个程序创建多个软件队列,并分配给多个GPU,为每个GPU均创建一个doorbellregion;采用搭建的Gem5系统对多GPU的所述晶圆级系统进行仿真测试、验证系统性能。可见,本发明实现了多GPU间的通信、交互与调度,从而减少了晶圆级系统的设计时间,降低了系统的验证成本;本发明还公开了一种基于Gem5的GPU仿真模拟装置及存储介质。
本发明授权基于Gem5框架的晶圆级多GPU仿真方法、装置及存储介质在权利要求书中公布了:1.一种基于Gem5框架的多GPU仿真方法,用于晶圆级系统,其特征在于,包括以下步骤: S1:搭建Gem5系统模拟运行环境,包括下载源文件、编译、运行; S2:在Gem5系统中创建多个GPU组件,并将多个GPU的L2缓存分别连接到Directory上,Directory再将其分别指向各个GPU所属的不同内存段; S3:更改ROCkRadeonOpenComputekernel驱动,为一个或多个程序创建多个软件队列,并分配给多个GPU,为每个GPU均创建一个doorbellregion; S4:采用搭建的Gem5系统对多GPU的所述晶圆级系统进行仿真测试、验证系统性能; 其中,步骤S2具体包括: S21:在GPU组件创建过程中,采用从0到N循环重复创建N个GPU组件,N为GPU的个数; S22:为每个GPU组件创建Shader、ComputeUnits、HSAPacketProcessor、GPUDispatcher以及GPUCommandProcessor; 步骤S23:重新构建拓扑结构,将每个GPU都作为一个Node连接到Directory上,模拟PCIE的交互模式; 步骤S24:在Directory内部,增加每个Node分别指向不同的内存段; 步骤S25:在GPU的Viper系统中,增加采用从0到N循环重复为每个GPU组件添加Cache; 步骤S26:在GPU的TLB配置中,为每个GPU组件分别设置一个TLBhierarchy; 步骤S3具体包括: 步骤S31:当userspace的代码调用系统的ioctl函数时,请求ROCk创建一个队列,ROCk通过ioctl的参数得到GPU的ID,将kernel分配到对应的GPU; 步骤S32:为ROCk创建一个哈希表来维护队列到GPU的对应关系,使ROCk记录每个队列对应的GPU; 步骤S33:为每个GPU均创建一个doorbellregion; 步骤S34:在mmap函数的输入参数中增加offset参数; 步骤S35:在mmap函数中增加计算逻辑,通过起始地址、长度、偏移值,计算出物理内存中对应的GPU所属的内存映射地址。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人嵩山实验室,其通讯地址为:450000 河南省郑州市郑东新区龙子湖自然资源大厦C栋;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励