首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

一种用于GPU的超越函数拟合系统 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

申请/专利权人:沐曦集成电路(上海)有限公司

摘要:本申请涉及数据处理技术领域,特别是涉及一种用于GPU的超越函数拟合系统,系统包括:GPU、数据库和存储有计算机程序的存储器,当计算机程序被处理器执行时,实现以下步骤:对目标超越函数进行指数提取,对指数提取后的超越函数进行分段处理,得到若干第一区间段,使用多次项函数分别对每个第一区间段进行拟合,得到每个第一区间段对应的拟合系数向量,将拟合系数向量存储于查找表中。通过分段方式对超越函数进行拟合,保证每个第一区间段具有较高的拟合精度,进而有效提升超越函数整体的拟合精度,而且所拟合得到的拟合系数向量存储于查找表中,能够令GPU进行调用,能够同时保证GPU对数据进行超越函数处理时的精度和效率。

主权项:1.一种用于GPU的超越函数拟合系统,其特征在于,所述系统包括:GPU、数据库和存储有计算机程序的存储器,其中,所述数据库中包括待拟合的目标超越函数fax1,x1=-1^d11×2^d21-2^h11-1+1×1+d312^h21,其中,x1是指目标超越函数的输入浮点数据,d11为x1的符号位数据,d21为x1的阶数数据,h11为d21的位宽,d31为x1的尾数数据,h21为d31的位宽,d31的高g11位数据作为索引标识d311,d31的低g21位数据作为尾数子数据d312,g11+g21=h21,a为[1,A]范围内的整数,A为可拟合的超越函数数量,GPU中包括查找表,当所述计算机程序被处理器执行时,实现以下步骤:S201,对目标超越函数fax1=fa-1^d11×2^d21-2^h11-1+1×1+d312^h21进行指数提取,得到fax1=fay1×2^-Eay1,其中,fay1的值域范围设置为mar1,mar2,mar1是指第一阈值,mar2是指第二阈值,y1为待处理浮点数据,Ea为指数系数;S202,根据d311和d312,对fay1进行分段处理,得到2^g11个第一区间段;S203,使用I次项函数ly1=∑Ii=0ci×y1^i,分别对每个第一区间段进行拟合,得到每个第一区间段对应的拟合系数向量Cj=[c0j,c1j,…,cij,…,cIj],其中,ci是指ly1中第i次项的拟合系数,i为[0,I]范围内的整数,Cj是指第j个第一区间段对应的拟合系数向量,j为[1,2^g11]范围内的整数,cij是指第j个第一区间段对应的拟合系数向量中第i次项的拟合系数,其中,S203步骤还包括如下步骤:S2031,针对任一第一区间段,在该第一区间段内任选I+2个参考值zk,k为[1,I+2]范围内的整数;S2032,使得∑Ii=0ci×zk+-1^k×e=fay1,形成I+2个参考方程,e是指参考误差;S2033,根据所述I+2个参考方程,计算得到临时拟合系数ci’和临时误差e’;S2034,根据ci’和e’,得到临时函数l’y1;S2035,根据该第一区间段的边界值和所述I+2个参考值zk,形成I+3个临时区间;S2036,根据l’y1,在每个临时区间中确定max(|l’y1-fay1|);S2037,若所有临时区间对应的max(|l’y1-fay1|)的最大值与e’相同,则以计算得到的ci’形成对应第一区间段的拟合系数向量Cj;S2038,若所有临时区间对应的max(|l’y1-fay1|)的最大值与e’不同,则确定每个临时区间中max(|l’y1-fay1|)对应的临时值,得到I+3个临时值;S2039,将所述I+3个临时值中对应最小max(|l’y1-fay1|)的临时值剔除,以保留的I+2个临时值更新I+2个参考值zk,返回执行S2032步骤至S2039步骤,直至得到对应第一区间段的拟合系数向量Cj;S204,将Ea和Cj存储于所述查找表中。

全文数据:

权利要求:

百度查询: 沐曦集成电路(上海)有限公司 一种用于GPU的超越函数拟合系统

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。