北京科技大学胡长军获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉北京科技大学申请的专利一种自适应稀疏矩阵向量乘策略选择及优化方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN114491401B 。
龙图腾网通过国家知识产权局官网在2025-08-01发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202210066813.5,技术领域涉及:G06F17/16;该发明授权一种自适应稀疏矩阵向量乘策略选择及优化方法是由胡长军;卢旭;储根深;何远杰;董玲玉;邢龙岳设计研发完成,并于2022-01-20向国家知识产权局提交的专利申请。
本一种自适应稀疏矩阵向量乘策略选择及优化方法在说明书摘要公布了:本发明公开了一种自适应稀疏矩阵向量乘策略选择及优化方法,适用于GPU架构,该方法包括:对待处理矩阵按行进行分块,统计各矩阵子块的非零元素数,若各矩阵子块的非零元素数差别倍数高于第一预设阈值,则采用自适应的CSR‑Vector算法进行处理;统计待处理矩阵的行平均非零元素个数,若矩阵行平均非零元素个数低于第二预设阈值,则采用改进的CSR‑Stream算法进行求解;统计待处理矩阵的非零元素个数,若其非零元素个数大于第三预设阈值,则采用hola算法进行求解;若以上条件均不满足,则采用CSR‑Vector算法进行求解。本发明实现了针对不同应用问题的自适应高效SpMV求解。
本发明授权一种自适应稀疏矩阵向量乘策略选择及优化方法在权利要求书中公布了:1.一种自适应稀疏矩阵向量乘策略选择及优化方法,适用于GPU架构,其特征在于,所述自适应稀疏矩阵向量乘策略选择及优化方法包括: 对待处理矩阵按行进行分块,得到多个矩阵子块; 统计各矩阵子块的非零元素数,若各矩阵子块的非零元素数差别倍数高于第一预设阈值,则采用自适应的CSR-Vector算法对各矩阵子块进行处理; 统计待处理矩阵的行平均非零元素个数,若待处理矩阵的行平均非零元素个数低于第二预设阈值,则采用改进的CSR-Stream算法进行求解; 统计待处理矩阵的非零元素个数,若待处理矩阵的非零元素个数大于第三预设阈值,则采用hola算法进行求解; 若以上条件均不满足,则采用CSR-Vector算法进行求解; 所述采用改进的CSR-Stream算法进行求解,包括: 初始化,包括:给定正整数rows_per_block和block_lds_size,分别表示一个block处理的行数量和block拥有的共享内存大小;设置block数量和block内的线程数量,其中,block数量为m为待处理矩阵行数;block内线程数量为固定值;依据行平均非零元素数设置参数VECTOR_SIZE: 其中,nnz_blocki为第i个矩阵子块的非零元素数,rowi为第i个矩阵子块的行数量,表示向下取整,Powx表示大于或等于x的且最小的2的整数次幂; 在核函数内部:计算当前block处理的行的范围,确定起始行和结束行; 依据block的起始行和结束行,获取当前block所需要访问的非零元素数组和列索引数组的起始索引和结束索引; 依据block所需要访问的非零元素数组和列索引数组的起始索引和结束索引,计算当前block所需要处理的非零元素数量; 若block所需要处理的非零元素数量不大于block_lds_size,则调用CSR_Stream算法进行当前block中矩阵行的计算; 若block所需要处理的非零元素数量大于block_lds_size,则采用CSR-Vector思想进行计算,具体为:先根据当前block实际所需要计算的行数量n_block_rows、block中vector的数量及VECTOR_SIZE参数,将n_block_rows行划分给各vector,各vector内执行标准的CSR-Vector算法的计算流程。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人北京科技大学,其通讯地址为:100083 北京市海淀区学院路30号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。