深圳市未来智联网络研究院;香港中文大学(深圳)王方鑫获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉深圳市未来智联网络研究院;香港中文大学(深圳)申请的专利基于令牌感知与李雅普诺夫优化的分布式大模型推理方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN121031801B 。
龙图腾网通过国家知识产权局官网在2026-03-17发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202511564148.2,技术领域涉及:G06F40/284;该发明授权基于令牌感知与李雅普诺夫优化的分布式大模型推理方法是由王方鑫;钟奕菲;吴攀龙;崔曙光设计研发完成,并于2025-10-30向国家知识产权局提交的专利申请。
本基于令牌感知与李雅普诺夫优化的分布式大模型推理方法在说明书摘要公布了:本发明涉及分布式大模型推理领域,具体涉及一种基于令牌感知与李雅普诺夫优化的分布式大模型推理方法。方案包括:接收用户输入提示后,通过长度感知语义模块预测对应任务的输出令牌长度,计算对应工作总量,基于令牌长度预测结果、设备实时状态与长期虚拟队列状态,通过李雅普诺夫引导卸载优化模块迭代卸载算法生成最终卸载决策;客户端根据最终卸载决策将任务卸载至对应的云边端设备,设备执行大模型推理;调度器根据实际任务执行时间与设备算力利用率,更新虚拟队列长度,为下一时隙决策提供输入。本发明适用于利用分布式大模型的推理系统。
本发明授权基于令牌感知与李雅普诺夫优化的分布式大模型推理方法在权利要求书中公布了:1.基于令牌感知与李雅普诺夫优化的分布式大模型推理方法,其特征在于,包括: S1、接收用户输入提示后,通过长度感知语义模块预测对应任务的输出令牌长度,计算对应工作总量,长度感知语义模块基于微调的预训练语言模型,通过特征重校准机制增强令牌长度相关语义的敏感度,实现输出令牌长度的精准预测; S2、基于令牌长度预测结果、设备实时状态与长期虚拟队列状态,通过李雅普诺夫引导卸载优化模块迭代卸载算法生成最终卸载决策; S3、客户端根据最终卸载决策将任务卸载至对应的云边端设备,设备执行大模型推理;调度器根据实际任务执行时间与设备算力利用率,更新虚拟队列长度,为下一时隙决策提供输入; 步骤S2具体包括: S201、在每个时隙t,收集状态信息; 任务状态:活跃任务集合、各任务的工作量、延迟敏感度、精度敏感度; 设备状态:云边端服务器的算力、当前网络速率、云边端速率、云边端速率; 虚拟队列状态:各设备对应的虚拟队列长; 长期算力阈值; S202、定义虚拟队列更新规则; 定义虚拟队列更新公式: ; 式中,,为二进制卸载决策变量; 当时,队列长度增加,提示设备j当前算力利用率超标,需减少后续任务分配; S203、迭代卸载算法; 将长期用户体验质量优化转化为逐时隙整数非线性规划问题,通过带阻尼与拥塞控制的迭代卸载算法高效求解; 构建成本矩阵: 在第k次迭代中,构建任务-设备成本矩阵,成本矩阵中每个元素由基础成本和拥塞惩罚组成; 基础成本包含通信延迟,为任务数据量,为网络协议延迟,计算延迟,表示同时隙先到达任务,以及李雅普诺夫项; 最优分配求解: 将成本矩阵代入整数线性规划问题,求解当前迭代的最优卸载决策,方式如下: ,每个任务仅分配给一个设备; 感知负载更新: 采用阻尼因子平滑更新设备感知负载,避免迭代振荡,方式如下: ; 收敛判断: 重复构建成本矩阵、最优分配求解以及感知负载更新步骤,直至两次迭代的卸载决策与差异小于阈值,或达到最大迭代次数,输出最终卸载决策。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人深圳市未来智联网络研究院;香港中文大学(深圳),其通讯地址为:518000 广东省深圳市福田区福保街道市花路长富金茂大厦1栋4603、4605;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励