深圳若愚科技有限公司孙腾获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉深圳若愚科技有限公司申请的专利基于多模态大模型的具身智能任务执行器训练方法及系统获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN118350435B 。
龙图腾网通过国家知识产权局官网在2025-12-02发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202410464607.9,技术领域涉及:G06N3/08;该发明授权基于多模态大模型的具身智能任务执行器训练方法及系统是由孙腾;邓翔;师乐天;崔伊然;吕奇设计研发完成,并于2024-04-17向国家知识产权局提交的专利申请。
本基于多模态大模型的具身智能任务执行器训练方法及系统在说明书摘要公布了:本申请涉及具身智能技术领域,具体公开了基于多模态大模型的具身智能任务执行器训练方法及系统,训练方法请主要包括:获取当前环境的视觉图像O和输入的文本指令I,生成基于视觉图像O和文本指令I的引导指令Prompt1;将视觉图像O、文本指令I和引导指令Prompt1输入到执行大模型,得到大模型输出的动作指令W1;执行动作指令W1从而识别当前环境中的待操作对象。本申请可以使语言模型更好地理解并适应真实物理世界的知识,从而给出合理的规划,能够获得及时、有效的反馈,并通过反馈调节执行过程,且可以更灵活地处理复杂指令,并且可以通过大模型输出的动作指令来实现更多样化、复杂的动作执行过程。
本发明授权基于多模态大模型的具身智能任务执行器训练方法及系统在权利要求书中公布了:1.基于多模态大模型的具身智能任务执行器训练方法,其特征在于,其包括以下步骤: 步骤一:获取当前环境的视觉图像O和输入的文本指令I,生成基于视觉图像O和文本指令I的引导指令; 将视觉图像O、文本指令I和引导指令输入到执行大模型,得到大模型输出的动作指令; 步骤二:执行动作指令从而识别当前环境中的待操作对象; 步骤三:从动作API库中调用基于文本指令I的API,基于调用的API、文本指令I、当前环境中的待操作对象而生成引导指令,将引导指令输入到执行大模型,得到大模型输出的动作指令;执行动作指令;在执行动作指令的过程中,同时获取执行动作指令的执行反馈,执行反馈包括成功和失败,若执行反馈为失败,则执行步骤一; 其中,API是以字符串格式呈现的Python函数;所述动作指令和动作指令均为字符串序列W,W为:W={,,...,};式中,代表第n个步骤字符串w;执行大模型生成步骤字符串,根据步骤字符串而得到字符串序列W; 根据步骤字符串而得到字符串序列W包括:计算字符串序列W的生成概率,为:;式中,代表在已知前j-1个步骤字符串w的情况下,生成第j个步骤字符串w的概率。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人深圳若愚科技有限公司,其通讯地址为:518125 广东省深圳市龙华区大浪街道浪口社区华昌路239号凯豪达工业园39栋306;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励