买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
申请/专利权人:北京麟卓信息科技有限公司
摘要:本发明公开了一种基于简单SIMD指令的浮点数倒数快速求解方法,通过引入与倒数相关的计算参数ky构建正数浮点数倒数近似值计算公式,将倒数运算转换为由简单SIMD指令构成的运算组合;再根据倒数计算的计算精度及正数浮点数的取值范围,采用简单SIMD指令分段估算计算参数ky的取值建立ky分段估算值表,对于输入向量根据计算精度及元素的取值范围从ky分段估算值表中获取对应的计算参数ky,再采用简单SIMD指令计算各元素的整数部分二进制的整数值,最后基于计算参数ky、元素的整数部分二进制的整数值及元素的二进制表示根据构建的公式计算得到元素的倒数完成输入向量的倒数计算,有效提高了处理器对倒数运算的计算速度,降低了对处理器支持复杂指令的要求。
主权项:1.一种基于简单SIMD指令的浮点数倒数快速求解方法,其特征在于,具体包括以下步骤:步骤1、构建正数浮点数倒数近似值计算公式,如下所示: 其中,xI为正浮点数x的二进制表示,且,Ex及Mx分别为正浮点数x的指数部分二进制的整数值和整数部分二进制的整数值;yI为正浮点数y的二进制表示,ky为计算参数;步骤2、给定计算精度AP,根据Ex基于步骤1构建的正数浮点数倒数近似值计算公式对ky进行分段估算,形成由计算精度AP、ky估算值及与其对应的浮点数范围构成的ky分段估算值表;步骤3、对于能够被SIMD指令直接处理的、元素为浮点数的输入向量in,采用向量相减指令实现输入向量in与输入向量in的相减运算得到全零向量out;再采用向量比较指令对输入向量in与全零向量out进行比较,由比较结果形成符号向量sign;最后采用标量乘向量指令和标量加向量指令,修正符号向量sign中每个元素的符号使其与输入向量in对应元素的符号相同;步骤4、采用向量相乘指令对符号向量sign与输入向量in进行相乘运算,实现输入向量in的正数化;步骤5、对于输入向量in中的每个元素,根据确定的计算精度及元素所属的浮点数范围在ky分段估算值表中查找对应的ky估算值,由所有元素对应的ky估算值构成浮点数向量vky;步骤6、将输入向量in转换为无符号整数向量in_int,采用位与指令对in_int与标量0x1fffff进行位与计算得到向量Mx_int;采用求和指令对Mx_int与标量0x3f800000进行求和计算,并用求和计算的结果更新Mx_int;将Mx_int转换为浮点数向量Mx_float,再采用乘法指令对Mx_float与标量进行相乘计算得到浮点数向量Mx;步骤7、根据步骤5得到的浮点数向量vky及步骤6得到的浮点数向量Mx,采用加、减及乘运算指令完成公式的计算得到浮点数向量magic;采用向量强制转换指令将magic等值转换为无符号整数向量magic_int,采用向量减向量指令对in_int与magic_int进行相减计算得到无符号整数向量out_int,再将out_int转换为浮点数向量out_f;最后采用乘法指令对out_f与sign进行相乘计算得到输入向量in的倒数的近似值。
全文数据:
权利要求:
百度查询: 北京麟卓信息科技有限公司 一种基于简单SIMD指令的浮点数倒数快速求解方法
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。