买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
申请/专利权人:山东浪潮科学研究院有限公司
摘要:本发明公开了GPGPU并行数据处理优化方法、设备及介质,属于GPGPU数据处理技术领域,本发明要解决的技术问题为如何将PSO算法融入GPGPU的数据处理,使PSO算法更好适配GPGPU的高并行,实现高效的数据处理,技术方案为:CPU获取并预处理SPSOP算法需要的数据,并将预处理后的数据存放到指定地址;其中,通过RISC‑V核的CPU进行前期的数据预处理搬运实现GPGPU的逻辑架构的优化,并在优化后的GPGPU上实现SPSOP算法;通过DMA将CPU预处理后的数据直接搬运到GPGPU当中,GPGPU将数据处理后,通过DMA返回给CPU,CPU对处理好的数据进行后处理。
主权项:1.一种GPGPU并行数据处理优化方法,其特征在于,该方法具体如下:CPU获取并预处理SPSOP算法需要的数据,并将预处理后的数据存放到指定地址;其中,SPSOP算法是基于PSO算法进行升级,针对高维度复合函数进行优化,并针对SPSOP算法的适配性,通过RISC-V核的CPU进行前期的数据预处理搬运实现GPGPU的逻辑架构的优化,并在优化后的GPGPU上实现SPSOP算法;通过DMA将CPU预处理后的数据直接搬运到GPGPU当中,不占用CPU资源,提高数据的搬运效率;GPGPU将数据处理后,通过DMA返回给CPU,CPU对处理好的数据进行后处理;其中,后处理包括拼接、显示及提取;其中,GPGPU的逻辑架构的优化是基于CUDA编程,CUDA编程用于简化RAM和GPU专用RAM之间的信息传输,通过分配一个线程执行由给定计算产生的矩阵或数组的特定元素的计算,实现并行化,并计算给定粒子的结果或在距离矩阵的情况下,计算离子对的结果;SPSOP算法具体如下:PSO算法是一种通过迭代实现的随机技术,使用N个独立的D维粒子,或搜索空间中Ω^D的位置找到f(x)的最小值;其中,x∈Ω^D;粒子的位置根据搜索的程度进行更新,粒子i的速度v在迭代时刻t+1的速度更新为:vi(t+1)=ω(t)vi(t)+C1r1(pibest(t)-xi(t))+C2r2(gibest(t)-xi(t));其中,vi(t+1)是粒子i的更新之后的速度;ω(t)vi(t)表示粒子惰性,受更新前的速度影响;C1r1表示当前的加速因子;gbest表示全局最佳位置;pbest表示粒子当前最佳位置;xi表示粒子当前位置,粒子更新后的速度受最佳位置和当前最佳位置的影响;ω代表惯性因子,控制全局和或局部的范围;pibest表示i粒子找到最佳位置;gbest表示整个粒子群找到最佳位置,随机性是通过r1,r2-U(0,1)影响,用于维持种群的多样性;随后第i个因子的位置被更新为:xi(t+1)=xi(t)+vi(t+1),i=1,···,N;ω表示为: ; ; ;其中,di表示粒子xi到其他每一个粒子的平均距离;dg表示全局最佳粒子的平均距离;dmin=min(di),dmax=maxdi,i=1,…,N,而Φ为进化因子,用于根据粒子聚类计算出的搜索状态;Φ∈[0,1],则ω∈[0.45,0.91],SPSOP算法进一步在模糊隶属函数中使用ω确定搜索的当前状态;使用相同的过程修改加速度系数局部效应C1和全局效应C2,并根据粒子位置和当前搜索状态更新惯性和状态。
全文数据:
权利要求:
百度查询: 山东浪潮科学研究院有限公司 GPGPU并行数据处理优化方法、设备及介质
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。