Document
拖动滑块完成拼图
个人中心

预订订单
服务订单
发布专利 发布成果 人才入驻 发布商标 发布需求

在线咨询

联系我们

龙图腾公众号
首页 专利交易 IP管家助手 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索
当前位置 : 首页 > 专利喜报 > 北京科技大学胡长军获国家专利权

北京科技大学胡长军获国家专利权

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

龙图腾网获悉北京科技大学申请的专利一种支持合并访存和循环队列的GPU模板计算方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN116126540B

龙图腾网通过国家知识产权局官网在2025-08-01发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202310181904.8,技术领域涉及:G06F9/50;该发明授权一种支持合并访存和循环队列的GPU模板计算方法是由胡长军;汪岸;李嘉莉;李建江设计研发完成,并于2023-02-21向国家知识产权局提交的专利申请。

一种支持合并访存和循环队列的GPU模板计算方法在说明书摘要公布了:本发明公开一种支持合并访存和循环队列的GPU模板计算方法,所述方法包括:合并访存读取二维平面上的一块数据;基于循环队列的模板计算。针对以往在GPU上使用的2.5D分块模板计算方法能够很好地复用某一条轴上的数据通常为轴,但无法实现完全的合并访存,也难以适用于计算物理中复杂的复合微分算子。现代GPU的访存效率远小于计算效率,无法利用合并访存的计算应用很难充分利用GPU的性能。本发明建立一种结合了循环队列和合并访存的分块模板计算方法,能够充分利用GPU的访存性能,并且适用于复杂的微分算子。

本发明授权一种支持合并访存和循环队列的GPU模板计算方法在权利要求书中公布了:1.一种支持合并访存和循环队列的GPU模板计算方法,其特征在于,所述方法包括: 合并访存读取二维平面上的一块数据; 基于循环队列的模板计算: 给定三维模板计算问题:模板计算公式F,模板半径rx、ry和rz,其中rx、ry和rz为模板沿三个方向的半径;三维网格Dx×Dy×Dz,周围halo区域大小Hx、Hy和Hz;输入数据指针data,输出数据指针out;初始化指向共享内存不同数据块的指针smm,sm,sc,sp,spp;线程块大小Bx、By,当前线程块的索引bx、by,当前线程的索引tx、ty; 读取最初的数据块除了第一块数据到共享内存,sm,sc,sp,spp; 调整输出数据指针,使其指向正确位置:计算二维平面相距的数据点数量,l=Dx+2HxDy+2Hy;计算当前线程在二维平面上的索引,ix=tx+bxBx,iy=ty+byBy;计算当前线程的第一个输出数据所在位置,out=out+ix+Hx+iy+HyDx+2Hx+rzl; 计算二维平面相距的数据点数量,l=Dx+2HxDy+2Hy; 令k=2rz,表示当前应该读入的数据块沿z方向的索引; 如果k<Dz+2Hz,执行下列操作: a进行线程同步; b读取新数据到smm; c轮换指针,使smm指向原sm的数据、sm指向原sc的数据、……、spp指向原smm的数据; d执行模板计算公式F; e输出数据到out指向的位置; f调整out指向下一个输出位置,out=out+l; g重新比较k与Dz+2Hz的大小; 如果kDz+2Hz,则表示所有输出数据计算完毕。

如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人北京科技大学,其通讯地址为:100080 北京市海淀区学院路30号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。