Document
拖动滑块完成拼图
个人中心

预订订单
服务订单
发布专利 发布成果 人才入驻 发布商标 发布需求

在线咨询

联系我们

龙图腾公众号
首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索
当前位置 : 首页 > 专利喜报 > 恭喜浙江大学;沐曦集成电路(上海)股份有限公司周昆获国家专利权

恭喜浙江大学;沐曦集成电路(上海)股份有限公司周昆获国家专利权

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

龙图腾网恭喜浙江大学;沐曦集成电路(上海)股份有限公司申请的专利基于模板的GPU高性能张量缩并方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN115203634B

龙图腾网通过国家知识产权局官网在2025-06-10发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202210343327.3,技术领域涉及:G06F17/16;该发明授权基于模板的GPU高性能张量缩并方法是由周昆;侯启明;芦嘉良;任重设计研发完成,并于2022-03-31向国家知识产权局提交的专利申请。

基于模板的GPU高性能张量缩并方法在说明书摘要公布了:本发明公开了一种基于模板的GPU高性能张量缩并方法,首先由用户定义张量缩并,对其索引与维度进行分类,得到四个索引序列和四个维度序列;然后对其进行降维,得到访存函数与隐式维度,再定义占位符,并根据BLAS库实现与优化方法编写计算模板,然后进行编译期的模板派发,将访存函数和隐式维度代入选定计算模板的占位符,生成CUDACC++代码,并编译为可重复使用的可执行程序,最后输入各张量的数据,以及各维度的具体值,完成计算。本发明可以以有限的一组模板支持任意的张量缩并;在保持易用的前提下,系统性能仍然接近甚至超过手动优化的cuBLAS、cuDNN等计算库。

本发明授权基于模板的GPU高性能张量缩并方法在权利要求书中公布了:1.一种基于模板的GPU高性能张量缩并方法,其特征在于,包括以下步骤:1用户输入张量缩并的定义,对其索引与维度进行分类,得到p,x,y,r四个索引序列,P,Y,X,R四个维度序列;1.1记号约定:将维度从高到低分别为D=Dn,…,D1的n维张量T,记作TD;用T[i]=T[in,...,i1]代表索引序列i=in,...,i1处的标量;函数extik=Dk,k=1,...,n,将单个索引映射到与之相对应的维度上,而Exti=extin,...,exti1=Dn,...,D1=D对索引序列映射为相应的维度序列;用户输入的任意张量缩并C=A×B均以爱因斯坦求和约定来表示:C[ic]=A[ia]×B[ib]1其中,ic、ia、ib分别为张量C、A、B的索引序列;2对索引序列p,x,y,r和维度序列P,Y,X,R进行降维,得到访存函数与隐式维度;3定义占位符,表示隐式批量矩阵乘法中与访存函数和隐式维度相关的内容;4根据BLAS库实现与优化方法编写计算模板,其中预留步骤3所述占位符;5进行编译期的模板派发,将访存函数和隐式维度代入选定计算模板的占位符,生成CUDACC++代码;根据P,Y,X,R四个维度序列的内容是否为空,在编译期选择特定的线性代数计算模板: 选择模板后,将占位符代入计算模板,生成合法的CUDACC++代码;其中,GEDOT表示内积,GEMV表示矩阵-向量乘法,GER表示外积,GEMM表示矩阵乘法;6将步骤5生成的代码编译为可重复使用的可执行程序;7输入各张量的数据,以及各维度的具体值,使用步骤6编译出的可执行程序完成计算。

如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人浙江大学;沐曦集成电路(上海)股份有限公司,其通讯地址为:310058 浙江省杭州市西湖区余杭塘路866号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。