一种基于重排指令融合的编译自动向量化方法

买专利卖专利找龙图腾，真高效！查专利查商标用IPTOP,全免费！专利年费监控用IP管家,真方便！

申请/专利权人：中国科学院上海高等研究院

摘要：本发明提供一种基于重排指令融合的编译自动向量化方法，包括：初始化一向量数据流；收集一个基本块中的Store指令，并按照访问的数据类型以及地址连续性来分组，形成若干个Store指令组；以所有Store指令组作为种子指令组加入同一个向量数据流，对Store指令组赋予索引；以构造的向量数据流为起点，构造所有可行的向量数据流，并从中选择最优的向量数据流；判断最优的向量数据流的代价如果大于0，则放弃向量化；否则，进行向量化变换。本发明的方法将基本块内所有种子指令组纳入同一向量数据流，可以一次向量化一个基本块并且可以发现不同种子指令组间的并性行，为程序生成具有更高向量化因子的程序，进一步提升程序的吞吐量。

主权项：1.一种基于重排指令融合的编译自动向量化方法，其特征在于，包括：步骤S1：初始化一向量数据流，所述向量数据流用于记录指令组、指令组的索引和指令组间的依赖关系；步骤S2：收集一个基本块中的Store指令，并按照访问的数据类型以及地址连续性来分组，最终形成若干个Store指令组，每一个Store指令组的所有Store指令访问一段连续地址空间且访问的数据宽度相同；以所有Store指令组作为种子指令组加入同一个向量数据流，同时，对每一个Store指令组赋予索引；步骤S3：以步骤S2构造的带有种子指令组的向量数据流为起点，构造所有可行的向量数据流，并从中选择最优的向量数据流；步骤S4：判断步骤S3得到的判断最优的向量数据流的代价是否大于0，如果大于0，则放弃向量化；否则，根据最优的向量数据流进行实质的程序的向量化变换；所述步骤S2包括：步骤S21：通过Store指令收集模块寻找基本块中的Store指令；步骤S22：检查这些Store指令各自访问的地址之间的依赖关系，将访问的地址之间没有依赖关系的多个Store指令作为能够并行执行的Store指令来分为一组，得到多组经过初次分组的Store指令；对于上述的每一组经过初次分组的Store指令，根据Store指令访问的地址的连续性进行进一步的排序分组，得到多个Store指令组；步骤S23：以所有的Store指令组均作为种子指令组加入同一个向量数据流，同时，对于每一个Store指令组，按照访问的地址从小到大排列的方式赋予索引，以使得其中的所有Store指令各自具有不同的索引值；其中，索引是指令组内指令的排布关系，是对指令组内每一指令赋予的唯一编号；在所述步骤S3中，进行向量数据流的构造，包括：步骤S31：将所有种子指令组加入向量数据流后得到的向量数据流作为初始的向量数据流，将初始的向量数据流作为本级递归的向量数据流并将当前的本级递归作为第0级递归；步骤S32：将本级递归的最优返回向量数据流和本级递归的候选指令组集合均设置为无效值；步骤S33：根据本级递归的向量数据流构造本级递归的候选指令组的集合；步骤S34：判断本级递归的候选指令组的集合是否为空；若本级递归的候选指令组的集合判断为空，以本级递归的向量数据流作为最下级递归时的本级递归的最优返回向量数据流，随后执行步骤S36；否则，备份本级递归的向量数据流、候选指令组的集合和最优返回向量数据流，随后，执行步骤S35；步骤S35：从本级递归的候选指令组的集合中选取一尚未被取过的候选指令组，将该候选指令组加入本级递归的向量数据流，以使得本级递归的向量数据流的递归等级加一；随后转入步骤S32；步骤S36：从备份还原出本级递归的向量数据流所在的上一级递归的所对应的向量数据流、候选指令组的集合和最优返回向量数据流，并将本级递归的最优返回向量数据流递归作为返回值返回给其上一级递归；步骤S37：将所述步骤S36中的上一级递归作为新的本级递归，计算步骤S36的返回值的索引和代价，将其与本级递归的最优返回向量数据流的代价相比较，根据比较结果更新本级递归的最优返回向量数据流；步骤S38：确定本级递归的向量数据流是否其所有候选指令组的选取分支均计算完毕，若尚未计算完毕，则回到所述步骤S35；否则，回到步骤S36以进一步返回至上一级递归，直到不存在上一级递归，输出此时的本级递归的最优返回向量数据流及其代价作为最优的向量数据流及其代价；在所述步骤S37中，本级递归的向量数据流的索引和代价是通过增量计算向量数据流的索引和代价的增量结果来计算的；先计算索引的增量结果，再计算代价的增量结果；所述增量计算是指计算步骤S35所选取的候选指令组的索引和代价，并将其与本级递归的向量数据流所在的选取分支尚未计算完毕的那一级递归的向量数据流之后所有后续加入的候选指令组和所有重排指令的索引和代价相加，作为本级递归的向量数据流的索引和代价的增量结果；且如果本级递归的最优返回向量数据流为无效值或者本级递归的最优返回向量数据流的代价高于返回值的代价，则将本级递归的最优返回向量数据流更新为返回值；否则，本级递归的最优返回向量数据流保持不变；步骤S35所选取的候选指令组的索引的计算步骤如下：步骤S371：将加入的候选指令组作为当前指令组，确定当前指令组是否是Load指令组，如果是，则对其赋予索引；步骤S372：确定当前指令组与本级递归的向量数据流的其他指令组之间的依赖关系，以确定当前指令组所依赖的各个指令组；如果当前指令组所依赖的某个指令组的大小与当前指令组的大小不符，则在这二者之间插入一条重排指令；如果当前指令组与存在依赖关系的某一指令组大小相同，且相关的指令组已经设置了索引，则将当前指令组的索引以相关的指令组的索引为基础来导出；步骤S373：判断此时当前指令组是否设置索引，如果此时当前指令组没有设置索引，则给当前指令组赋予任意索引；最优的向量数据流是指代价最小的向量数据流；向量数据流的代价是该向量数据流的所有指令组的相对代价和所有重排指令的代价的加和；向量数据流的一个指令组的相对代价是替代该指令组的一个SIMD指令的代价减去该指令组的每个指令的代价。

全文数据：

权利要求：

百度查询：中国科学院上海高等研究院一种基于重排指令融合的编译自动向量化方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：一种气动切管机的夹紧装置

下一篇：一种干法激光粒度仪进样装置

相关技术

一种气动切管机的夹紧装置

一种干法激光粒度仪进样装置

一种可控流量的自动倒袋装置

一种雾化装置

钢网清洗机气缸调节装置

一种氛围灯

一种电加热结构及带有该电加热结构的家用电器

一种降低转向节磕碰伤的模具

一种五金生产用清洗装置

一种倍捻机退绕机构

一种建筑工程用分筛机

一种畜牧用防疫架

编译相关技术

应用于交叉编译的数据处理方法、装置、设备及介质_浙江大华技术股份有限公司_202411312841.6

基于模板的统一编译方法、电子设备、存储介质_浙江极氪智能科技有限公司_202310447687.2

一种量子线路编译方法、系统、设备及存储介质_合肥幺正量子科技有限公司_202410830055.9

一种基于小程序编译和运行时的自动化曝光数据上报方法_杭州弧途科技有限公司_202410910622.1

一种大模型赋能历史缺陷用例掩蔽填充的编译器测试技术_南京大学_202410294620.4

文件编译方法以及装置_珠海金山数字网络科技有限公司_202410937921.4

一种编译方法、装置、设备及存储介质_华为技术有限公司_202310456424.8

编译优化方法、装置、电子设备及存储介质_龙芯中科技术股份有限公司_202410106154.2

基于多面体编译的深度学习模型优化方法、设备及介质_山东浪潮科学研究院有限公司_202411296124.9

一种闭源工程的编译方法、装置、电子设备和存储介质_中移物联网有限公司_202311597747.5

自动相关技术

自动喷码机_北京健源科兴机械加工有限公司_202420704539.4

自动测评学习工具_湖北桐铭科技有限公司_202420120842.X

自动堵孔底角_江西鼎城铝模科技有限公司_202420265863.0

磨床自动夹头_江麓机电集团有限公司_202411208983.8

自动浸油装置_安徽送变电工程有限公司_202410838334.X

自动重传方法、装置_北京小米移动软件有限公司_202380008227.8

自动冲切装置_江苏乾涌控股有限公司_202322901418.7

自动分析装置_株式会社日立高新技术_202080030329.6

自动配对的设备_谷歌有限责任公司_202411088791.8

全自动输液架_宁波市第二医院_202323048792.3

融合相关技术

虚实融合的场景系统和方法_上海工艺美术职业学院_202310450921.7

裸关节融合固定用螺钉_清协华和(苏州)科技有限公司_202420259219.2

激光视觉融合测量仪_重庆电子科技职业大学_202323334556.8

伞形可伸缩式椎间融合器_王国华_202322549319.7

图像多聚焦融合方法及相关设备_江苏艾玮得生物科技有限公司_202311498547.4

一种融合蛋白及其用途_杭州尚健生物技术有限公司_201980075046.0

扇形可伸缩式椎间融合器_王国华_202322564699.1

一种一二次融合智能环网柜_巨邦集团有限公司_202410714921.8

防水融合式高稳定性光伏板_深圳市鑫明光建筑科技有限公司_202420262230.4

基于微光+彩色可见光融合图像的方法_北京晶品特装科技股份有限公司_202410258993.6

龙图腾网&IPTOP

设置信息完成注册

手机号绑定多个账号

一种基于重排指令融合的编译自动向量化方法

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务