基于视觉语言大模型的机器人操纵方法

买专利卖专利找龙图腾，真高效！查专利查商标用IPTOP,全免费！专利年费监控用IP管家,真方便！

申请/专利权人：哈尔滨工业大学

摘要：基于视觉语言大模型的机器人操纵方法，本发明涉及人工智能和具身智能领域，具体涉及基于视觉语言大模型的机器人操纵方法。本发明的目的是为了解决现有机器人理解指令及视觉环境后执行的操纵任务完成准确率低的问题。过程为：将语言指令文本和深度相机捕获的RGBD图像输入视觉语言大模型；视觉语言大模型的PC机输出三维位置坐标、三维旋转位姿和机械爪的开闭状态；视觉语言大模型机械臂上JetsonNano端通过ROS接收三维位置坐标、三维旋转位姿和机械爪的开闭状态；对接收到的三维位置坐标、三维旋转位姿和机械爪的开闭状态信息进行逆运动学解算，将解算后的各关节角度输入舵机，对舵机进行PID控制完成机械臂的动作。

主权项：1.基于视觉语言大模型的机器人操纵方法，其特征在于：所述方法具体过程为：步骤一、将语言指令文本和深度相机捕获的RGBD图像输入视觉语言大模型；视觉语言大模型的PC机输出三维位置坐标、三维旋转位姿和机械爪的开闭状态；步骤二、视觉语言大模型机械臂上JetsonNano端通过ROS接收三维位置坐标、三维旋转位姿和机械爪的开闭状态；步骤三、视觉语言大模型机械臂上JetsonNano端利用KDL库对接收到的三维位置坐标、三维旋转位姿和机械爪的开闭状态信息进行逆运动学解算，将解算后所得的各关节角度输入舵机，对舵机进行PID控制完成机械臂的动作。

全文数据：

权利要求：

百度查询：哈尔滨工业大学基于视觉语言大模型的机器人操纵方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：圆柱形产品等离子表面处理机

下一篇：一种客运索道的托索轮安装结构

相关技术

圆柱形产品等离子表面处理机

一种客运索道的托索轮安装结构

一种大理石草酸抛光磨块

片烟运输线用电梯按键装置

一种可自动模块化管理的全方位监测装置

一种打印机生产用显影辊输送装置

一种连接快速的建筑给排水管

一种土木工程大型物料搬运装置

一种低温阀门在线检修工具

一种管状带式输送机防偏转装置

一种高集成度烘干焙烧系统

一种手持激光测高设备

龙图腾网&IPTOP

设置信息完成注册

手机号绑定多个账号

基于视觉语言大模型的机器人操纵方法

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务