Document
拖动滑块完成拼图
首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

一种基于CPU-DCU异构架构的LBM并行计算方法 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

申请/专利权人:长沙星河云顶科技有限公司

摘要:本发明公开的一种基于CPU‑DCU异构架构的LBM并行计算方法,涉及算法优化领域,本方法扩展格子玻尔兹曼方法在流体动力学模拟中的流体域范围,实现了基于CPU‑DCU异构集群的格子玻尔兹曼计算方法,可以在集群上进行大规模并行模拟,可以实现大范围、高精度的基于格子玻尔兹曼方法的流体动力学模拟。

主权项:1.一种基于CPU-DCU异构架构的LBM并行计算方法,其特征在于,包括以下步骤:S1、根据计算域范围及网格精度将三维全局网格沿着xoy平面划分成npx×npy个子网格块,CPU端对每个子网格块分配一个进程用于计算,所述子网格块包括内部网格与边界层网格;S2、在每个网格块x和y方向的四个面上各增加1层交换层网格用于进行进程之间的数据交换;S3、CPU端各进程创建子网格数据结构信息用于存储子网格信息,所述子网格数据结构信息包括:子网格编号、子网格尺寸、子网格性质数组、内部网格分布函数数组、内部网格相邻网格索引数组、边界层网格分布函数数组、边界层网格相邻网格索引数组,交换层分布函数数组;S4、CPU端各进程读取对应的计算域的几何结构信息和流场的初始条件,初始化子网格数据结构,并为CPU端的每个进程分配一个DCU加速器,然后CPU端各进程向对应的DCU端传输子网格数据结构信息;S5、在DCU端首先遍历子网格中的边界层网格,为每个边界层网格点分配一个hip线程,根据LBM碰撞模型进行碰撞计算,计算完成后将边界层网格分布函数数组根据预设赋值规则赋值到交换层网格分布函数数组中,然后启动异步拷贝将交换层网格对应的分布函数数组从DCU端传输到CPU端,并在启动异步拷贝后为每个内部网格点分配一个线程,开始遍历内部网格进行并行碰撞计算;S6、完成DCU端到CPU端的数据拷贝后,每个进程根据网格的二维划分方式先完成交换层分布函数数组在x方向的进程间数据通信,等待x方向的数据通信完成后完成交换层分布函数数组在y方向的进程间数据通信;S7、CPU端启动异步传输将接收到的子网格交换层数据传输至DCU端子网格的交换层;S8、DCU端在完成步骤S5-S7后再进行子网格块中边界层与内部网格的迁移计算;S9、重复步骤S5-S8直到达到模拟要求的预设迭代步数。

全文数据:

权利要求:

百度查询: 长沙星河云顶科技有限公司 一种基于CPU-DCU异构架构的LBM并行计算方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。