首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

一种适合复杂异构系统的HPL矩阵更新优化方法 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

申请/专利权人:中国科学院软件研究所

摘要:本发明公开了一种适合复杂异构系统的HPL矩阵更新优化方法,其特征在于,对HPL矩阵更新的行交换进行优化:在执行HPL的第一分段行交换完成、上一次循环矩阵更新和当前进程接收到下一次循环的行交换信息之后,执行第一分段的下一次循环的行交换。对Long行交换通信方法优化,将spread过程接收缓冲与roll过程发送缓冲分离,当前行进程执行roll过程前,将数据拷贝到roll发送缓冲区;在roll过程执行网络传输的同时,将spread所需的数据传输到MPI发送缓冲区;roll执行完成MPI网络通信后,开启执行spread过程,同时把roll接收的数据异步传输到GPU。本发明能够充分发挥GPU的计算能力。

主权项:1.一种适合复杂异构系统的HPL矩阵更新优化方法,其特征在于,对HPL矩阵更新的行交换进行优化:在执行HPL的第一分段行交换完成、上一次循环矩阵更新和当前进程接收到下一次循环的行交换信息之后,执行第一分段的下一次循环的行交换;其中,对HPL矩阵更新中的Long行交换通信方法进行优化,其包括spread过程和roll过程;将spread过程的接收缓冲与roll过程的发送缓冲分离,当前行进程在执行roll过程之前,将本地需要交换的数据拷贝到roll过程的发送缓冲区;在roll过程执行网络传输的同时,当前行进程将spread过程所需的数据封装并异步传输到MPI进程的发送缓冲区;roll过程执行完成MPI网络通信后,开启执行spread过程,同时把roll过程接收的数据异步传输到GPU,并执行数据交换;在spread过程结束后,非当前行进程再将换入的数据传输到GPU,并交换到相应位置,当前行进程对需要进行内部交换的数据执行GPU上的本地交换。

全文数据:

权利要求:

百度查询: 中国科学院软件研究所 一种适合复杂异构系统的HPL矩阵更新优化方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。