恭喜奕行智能科技(广州)有限公司杨宜获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网恭喜奕行智能科技(广州)有限公司申请的专利一种提高硬件吞吐率的AI模型优化部署的方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN118963778B 。
龙图腾网通过国家知识产权局官网在2025-04-08发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202411423835.8,技术领域涉及:G06F8/60;该发明授权一种提高硬件吞吐率的AI模型优化部署的方法是由杨宜;孟成设计研发完成,并于2024-10-12向国家知识产权局提交的专利申请。
本一种提高硬件吞吐率的AI模型优化部署的方法在说明书摘要公布了:本发明提供了一种提高硬件吞吐率的AI模型优化部署的方法,其中,该方法包括:根据预设的环境配置和分割要求,将当前场景对应的目标模型进行模型分割,得到对应的多个模型子图;根据环境配置对目标模型和模型子图进行不同优化等级的编译处理,得到对应的多种可执行指令;实时监控当前场景的资源使用情况;根据资源使用情况和当前场景对应的目标模型的运行情况,确定当前场景的目标任务以及目标任务对应的可执行指令;执行目标任务对应的可执行指令,并记录可执行指令的执行参数。本方法通过模型分割和动态任务分配,实现了计算资源的高效利用,同时保证了模型执行的灵活性和性能,适用资源受限或多任务环境等情况下各种深度学习模型的优化部署。
本发明授权一种提高硬件吞吐率的AI模型优化部署的方法在权利要求书中公布了:1.一种提高硬件吞吐率的AI模型优化部署的方法,其特征在于,所述提高硬件吞吐率的AI模型优化部署的方法包括:根据预设的环境配置和分割要求,将当前场景对应的目标模型进行模型分割,得到对应的多个模型子图;环境配置包括处理器类型、内存容量和存储空间,所述分割要求包括性能目标和资源利用率;所述根据预设的环境配置和分割要求,将当前场景对应的目标模型进行模型分割,得到对应的多个模型子图包括:根据所述环境配置和所述分割要求,确定当前场景对应的各目标模型的优先等级;根据所述优先等级确定当前场景对应的各目标模型的划分颗粒度;根据所述划分颗粒度对对应的模型进行模型分割,得到对应的多个模型子图;所述根据预设的环境配置和分割要求,将当前场景对应的目标模型进行模型分割,得到对应的多个模型子图还包括对所述环境配置和所述分割要求进行语义解析处理,得到分割约束条件集,根据所述分割约束条件集对所述目标模型进行拓扑结构分析处理,得到模型计算图,对所述模型计算图进行关键路径识别处理,得到模型关键子结构序列,根据所述模型关键子结构序列对所述目标模型进行分层聚类处理,得到初始分割方案,对所述初始分割方案进行计算复杂度评估处理,得到复杂度分布图,根据所述复杂度分布图对所述初始分割方案进行边界优化处理,得到对应的多个模型子图;根据所述环境配置对所述目标模型和所述模型子图进行不同优化等级的编译处理,得到对应的多种可执行指令;所述根据所述环境配置对所述目标模型和所述模型子图进行不同优化等级的编译处理,得到对应的多种可执行指令包括:对所述目标模型和所述模型子图进行中间代码生成处理,得到对应的中间表示;根据所述环境配置对所述中间表示进行优化处理,得到优化后的中间代码;对所述优化后的中间代码进行目标代码生成处理,得到汇编代码;对所述汇编代码进行机器码生成处理,得到对应的多种可执行指令;实时监控所述当前场景的资源使用情况;根据所述资源使用情况和所述当前场景对应的目标模型的运行情况,确定当前场景的目标任务以及所述目标任务对应的可执行指令;所述根据所述资源使用情况和所述当前场景对应的目标模型的运行情况,确定当前场景的目标任务以及所述目标任务对应的可执行指令包括:对所述资源使用情况和所述目标模型的运行情况进行动态时序分析处理,得到多维度时变特征序列,根据所述多维度时变特征序列对预设的深度强化学习模型进行状态更新处理,得到当前场景的状态表征,对所述状态表征进行任务策略推理处理,得到候选任务决策树,根据所述候选任务决策树进行蒙特卡洛树搜索处理,得到最优任务路径,对所述最优任务路径中的关键节点任务进行自适应指令生成处理,得到所述目标任务对应的可执行指令集合;执行所述目标任务对应的可执行指令,并记录所述目标任务对应的可执行指令的执行参数。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人奕行智能科技(广州)有限公司,其通讯地址为:511466 广东省广州市南沙区海滨路167号1901-1907、1911-1912房;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。