买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
申请/专利权人:英特尔公司
申请日:2019-05-22
公开(公告)日:2024-12-20
公开(公告)号:CN119166216A
专利技术分类:..与执行机器指令相关的设计,例如指令译码(用于执行微指令的入G06F9/22;)[2018.01]
专利摘要:公开的实施例涉及可变格式、可变稀疏矩阵乘法指令。在一个示例中,处理器包括提取和解码电路,用于提取和解码可变格式、可变稀疏矩阵乘法VFVSMM指令,所述指令指定分别具有M×K、K×N和M×N个元素的A、B和C矩阵的位置;执行电路,该执行电路响应于经解码的VFVSMM指令用于:将指定的A矩阵的每一行与后续行错开路由到M×N处理阵列的相应行中,并将指定的B矩阵的每一列与后续列错开路由到处理阵列的相应列中,其中,处理单元中的每一个生成A矩阵元素和具有与A矩阵元素的列地址相同的行地址的匹配B矩阵元素的K个乘积,并且将每个所生成的乘积与相应的C矩阵元素累加。
专利权项:1.一种处理器,包括:提取和解码电路,用于提取和解码可变格式、可变稀疏矩阵乘法VFVSMM指令,所述指令具有的字段指定分别具有M×K、K×N和M×N个元素的A、B和C矩阵的位置;以及执行电路,该执行电路用于:在以密集-密集模式操作的情况下,响应于经解码的VFVSMM指令,将所述A矩阵的每一行与后续行错开路由到具有M×N个处理单元的处理阵列的相应行中,并将所述B矩阵的每一列与后续列错开路由到所述处理阵列的相应列中,并且其中,所述M×N个处理单元中的每一个处理单元用于生成分别从所述A矩阵和所述B矩阵接收的匹配的A矩阵元素和B矩阵元素的K个乘积,当所述B矩阵元素具有与所述A矩阵元素的列地址相同的行地址时,匹配存在;并且所述处理单元用于将每个所生成的乘积与所述C矩阵的相应元素累加,所述C矩阵的所述相应元素具有与所述处理单元在所述处理阵列中的相对位置相同的相对位置。
百度查询: 英特尔公司 可变格式、可变稀疏矩阵乘法指令
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。