首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

GPU动态多任务可控并发执行方法及系统 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

申请/专利权人:上海交通大学

摘要:本发明提供了一种GPU动态多任务可控并发执行方法及系统,包括:步骤S1:在程序编译阶段生成一个或多个proxykernel作为待执行kernel的入口;步骤S2:在程序运行阶段,用户动态选择并发执行的待执行kernel;步骤S3:根据选择的待执行kernel所需要的寄存器数量,选择proxykernel提交到GPU中;步骤S4:用户通过proxykernel动态控制各个待执行kernel使用的计算单元数量,跳转到待执行kernel并执行。本发明通过proxykernel为待执行kernel动态分配指定数量的计算单元,可以实现GPU程序运行阶段细粒度的计算单元分配。

主权项:1.一种GPU动态多任务可控并发执行方法,其特征在于,包括:步骤S1:在程序编译阶段生成一个或多个proxykernel作为待执行kernel的入口;步骤S2:在程序运行阶段,用户动态选择并发执行的待执行kernel;步骤S3:根据选择的待执行kernel所需要的寄存器数量,选择proxykernel提交到GPU中;步骤S4:用户通过proxykernel动态控制各个待执行kernel使用的计算单元数量,跳转到待执行kernel并执行;在所述步骤S1中:生成一个或多个proxykernel的源代码,每个proxykernel拥有相同的源代码,每个proxykernel具有不同的寄存器数量;proxykernel是所有待执行kernel的入口,所有并发执行的kernel都从proxykernel跳转执行;将proxykernel和待执行kernel的源代码编译为二进制文件;将编译过的proxykernel和待执行kernel所在的二进制文件加载到GPU内存中;proxykernel的参数包括待执行kernel函数入口地址、待执行kernel参数地址以及待执行kernel使用的计算单元数量;对于每一个CUOccupancy都生成对应最大寄存器数量的proxykernel;在所述步骤S4中:在GPU中执行proxykernel,根据当前所处的计算单元ID选择对应的待执行kernel,设置参数并跳转到待执行kernel执行;proxykernel设置待执行kernel的函数参数、线程块ID以及线程ID;使用JMP指令跳转到待执行kernel的函数入口地址。

全文数据:

权利要求:

百度查询: 上海交通大学 GPU动态多任务可控并发执行方法及系统

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。