恭喜浪潮电子信息产业股份有限公司唐轶男获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网恭喜浪潮电子信息产业股份有限公司申请的专利基于异构计算系统的请求分配方法、系统、设备和介质获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN119690687B 。
龙图腾网通过国家知识产权局官网在2025-06-13发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202510221607.0,技术领域涉及:G06F9/50;该发明授权基于异构计算系统的请求分配方法、系统、设备和介质是由唐轶男;郭振华;高开;李晓川;杜国光;刘璐;贾麒;张洪伟设计研发完成,并于2025-02-27向国家知识产权局提交的专利申请。
本基于异构计算系统的请求分配方法、系统、设备和介质在说明书摘要公布了:本申请公开了一种基于异构计算系统的请求分配方法、系统、设备和介质,涉及计算机技术领域,优先考虑键值缓存机制的使用情况下,确定多个异构算力设备访问内存时使用键值缓存所需的读取时间。考虑异构算力设备的算力信息的性能差异、内存扩展对应的内存信息和推理任务信息的特性,合理分配请求。进一步根据预设分配请求数量与并发请求数量之间的比较关系,以及是否满足分配条件的不同策略,提高请求分配的合理性。因此,可以解决在调用分离式内存还是本地内存时对于推理请求的分配均衡性较差,导致算力资源浪费较多的技术问题,达到将推理任务信息合理分配至异构算力设备,以提高分配均衡性的同时,节约算力资源、降低成本的技术效果。
本发明授权基于异构计算系统的请求分配方法、系统、设备和介质在权利要求书中公布了:1.一种基于异构计算系统的请求分配方法,其特征在于,包括: 获取推理任务信息、多个异构算力设备和对应的性能参数; 基于推理任务信息、多个性能参数确定键值缓存所需的读取时间;并根据多个读取时间确定当前异构算力设备; 依据所述当前异构算力设备的目标读取时间和目标性能参数确定推理任务的预设分配请求数量; 根据所述预设分配请求数量、推理任务信息的并发请求数量和分配条件确定所述当前异构算力设备的请求分配结果。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人浪潮电子信息产业股份有限公司,其通讯地址为:250014 山东省济南市高新区草山岭南路801号9层东侧;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。