买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
摘要:本申请涉及一种基于线程束内洗牌算法的位数组分块整理方法和装置,该方法包括:对当前GPU上运行的线程块中的所有线程束进行标记,得到奇、偶线程束,并确定每个线程束中有效数据的范围;将奇、偶线程束内的有效数据划分为两两一对,计算每个数据对的标识;根据该标识对部分数据进行调整;根据数据对偶线程束和奇线程束内有效数据进行移动,将线程束内数据分为两组;将线程块中两个相邻线程束作为一个线程束对,以线程束对为基本单位移动数据,完成当前GPU上线程块内标记位数组的整理。本方法利用线程束内洗牌算法实现了标记位二进制数组的分块整理,优化了GPU上线程调度问题,提升了GPU计算效率。
主权项:1.一种基于线程束内洗牌算法的位数组分块整理方法,其特征在于,所述方法包括:对当前GPU上运行的线程块中的所有线程束进行标记,得到偶线程束和奇线程束,并确定每个线程束中有效数据的范围;将所述偶线程束和所述奇线程束内的有效数据划分为两两一对的数据对,并计算每个数据对的标识,并根据数据对的标识对部分数据进行调整;其中,数据对为(1,1)时,数据对标识为A;数据对为(0,0)时,数据对标识为B;数据对为(1,0)时,数据对标识为C;数据对为(0,1)时,数据对标识为D;根据数据对的标识对所述偶线程束和奇线程束内有效数据进行移动,将线程束内数据分为两组;将当前GPU上运行的线程块中两个相邻线程束作为一个线程束对,并以线程束对为基本单位移动数据,完成当前GPU上线程块内标记位数组的整理;其中,将所述偶线程束和所述奇线程束内的有效数据划分为两两一对的数据对,并计算每个数据对的标识,包括:利用线程束内函数__shfl_down_sync,分别将所述偶线程束和所述奇线程束内的有效数据划分为两两一对的数据对,并计算每对数据对的标识;根据数据对的标识对部分数据进行调整;其中,根据数据对的标识对部分数据进行调整,包括:对于数据对标识为A和B的数据对,在后续移动时,分别将数据对前移0位和2位;对于数据对标识为C和D的数据对,在将数据对标识为C和D两种情况合并,在后续移动时,将数据对前移1位。
全文数据:
权利要求:
百度查询: 中国人民解放军国防科技大学 基于线程束内洗牌算法的位数组分块整理方法和装置
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。