Document
拖动滑块完成拼图
个人中心

预订订单
服务订单
发布专利 发布成果 人才入驻 发布商标 发布需求

请提出您的宝贵建议,有机会获取IP积分或其他奖励

投诉建议

在线咨询

联系我们

龙图腾公众号
首页 专利交易 IP管家助手 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索
当前位置 : 首页 > 专利喜报 > 哈尔滨工业大学胡睿晗获国家专利权

哈尔滨工业大学胡睿晗获国家专利权

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

龙图腾网获悉哈尔滨工业大学申请的专利一种用于铰接物体操纵的VLA大模型的构建方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN119785010B

龙图腾网通过国家知识产权局官网在2025-10-17发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202411969916.8,技术领域涉及:G06V10/25;该发明授权一种用于铰接物体操纵的VLA大模型的构建方法是由胡睿晗;贺向东;王忠杰;曹岂鸣;陈昊设计研发完成,并于2024-12-30向国家知识产权局提交的专利申请。

一种用于铰接物体操纵的VLA大模型的构建方法在说明书摘要公布了:一种用于铰接物体操纵的VLA大模型的构建方法,属于具身智能技术领域。方法如下:使用几何中心表示法描述铰接物体的ActionAffordance;构建跟随铰接物体特征集的指令;将一个指令分解为六个不同的子任务特征集;设计训练VLA模型架构;构建几何思维规划器。本发明首几何中心表示方法来描述铰接物体,开发了几何思维规划器,促进了VLA大模型对环境的理解,增强了其对复杂任务的适应能力,使其能够处理多样化的场景和需求,使得VLA模型能够充分理解物体在不同情况下的行为和反应,从而在规划运动路径时做出更为合理的决策,提高路径规划的精度和可靠性。

本发明授权一种用于铰接物体操纵的VLA大模型的构建方法在权利要求书中公布了:1.一种用于铰接物体操纵的VLA大模型的构建方法,其特征在于:所述方法包括如下步骤: S1:使用几何中心表示法描述铰接物体的ActionAffordance: A={B,D,F,M,X}1 式1中: B表示铰接物体的三维边界框; D表示机械抓手的末端执行器的方向; F表示最佳受力点位; M表示可移动的路径规划点位序列; X表示转轴位置; S2:构建跟随铰接物体特征集的指令,特征集与MLLM微调数据集的格式一致,输入为图像和文本指令,输出为格式化的文本,即铰接物体的ActionAffordance;将一个指令分解为六个不同的子任务特征集; S3:设计VLA模型架构; S4:训练VLA模型; 使用S2中生成的特征集对S3中的VLA模型进行训练; S5:构建几何思维规划器; 所述S5包括如下步骤: S501:构建包括Advisor和Strategist的几何思维规划器; S502:Advisor让VLA模型列出所有结果,然后Strategist根据制定的评分算法对每个结果进行评分,最终筛选出最优的结果用于后续的推理任务; S502所述Strategist对物体类别识别的答案进行评分和筛选包括如下步骤: S50201:对比语言-图像预训练模型通过两个独立的编码器,将输入的图像和文本候选项分别转化为高维向量表示: I=fimageximage,T=ftextxtext18 式18中: ximage表示输入图像; xtext表示输入的文本候选项; fimage表示CLIP模型的图像编码器; ftext表示CLIP模型的文本编码器; I表示共享嵌入空间中的图像特征向量; T表示共享嵌入空间中的文本特征向量; S50202:计算图像嵌入与文本嵌入之间的相似度,确保相似度值在[-1,1]范围内,为类别预测生成评分: 式19中: I表示物体类别识别计算的图像嵌入向量的点积; T表示物体类别识别计算的文本嵌入向量的点积; ||I||表示物体类别识别计算的图像嵌入向量的点积的欧几里得范数; ||T||表示物体类别识别计算的文本嵌入向量的点积的欧几里得范数; S50203:选择相似度最高的结果作为最佳的物体类别识别答案: BestPrediction=argmaxSimilarityI,T20。

如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人哈尔滨工业大学,其通讯地址为:150001 黑龙江省哈尔滨市南岗区西大直街92号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。

以上内容由龙图腾AI智能生成。

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。