首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

托卡马克新经典环向粘滞力矩CUDA模拟实现方法 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

申请/专利权人:安徽大学;中国科学院合肥物质科学研究院

摘要:本发明提供一种基于CUDA加速的托卡马克新经典环向粘滞力矩模拟实现方法,涉及托卡马克模拟技术领域,本发明通过将计算原程序分解为多个子单元,并识别出最慢子单元及其内部的高消耗函数,能够精确地定位到性能瓶颈所在,确保了后续的优化措施能够针对性地作用于真正影响计算效率的部分;对于识别出的高消耗函数,进一步分析其代码段,找出执行时间长的高负载代码段,并将重用数据复制到CUDA的共享内存中,减少了数据访问的延迟,将高负载代码段分解为多个可以并行执行的独立任务,并利用CUDA核函数将这些任务映射到GPU的多个线程块中,充分利用了GPU的大量并行处理核心,极大地提升了计算速度。

主权项:1.一种基于CUDA加速的托卡马克新经典环向粘滞力矩模拟实现方法,其特征在于,具体步骤包括:步骤1:将托卡马克新经典环向粘滞力矩模拟的计算原程序基于物理过程和计算任务分解成为多个子单元并进行编号,获得每个子单元的函数调用图和时间消耗分布,识别出每个子单元内部消耗时间超过时间阈值的高消耗函数,并找到原程序中的最慢子单元;步骤2:对于最慢子单元内部消耗时间超过时间阈值的高消耗函数,从高消耗函数的函数入口开始逐行分析高消耗函数的各行代码并对代码进行分段,根据各段代码的执行时间和函数消耗的时间的占比,识别出执行时间超过占比阈值的高负载代码段;步骤3:分析高负载代码段中的循环和函数调用代码,找出读取次数超过读取阈值但不修改的数据标定为重用数据,将重用数据复制到CUDA的共享内存中,修改原始代码,使其从共享内存中读取重用数据,完成高负载代码段的优化;步骤4:将高负载代码段分解为多个可以并行执行的独立任务,确定线程块和线程的最优数量,使用CUDA核函数将分解的独立任务映射到不同的线程块中,每个线程块执行相同数量的任务,等待所有线程完成执行步骤;步骤5:使用性能分析工具对于优化前后的最慢子单元的执行时间进行测量,判断优化效果是否满足要求,并在满足要求后执行优化后的托卡马克新经典环向粘滞力矩模拟的计算程序,完成模拟。

全文数据:

权利要求:

百度查询: 安徽大学 中国科学院合肥物质科学研究院 托卡马克新经典环向粘滞力矩CUDA模拟实现方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。