沈阳工业大学刘健获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉沈阳工业大学申请的专利基于大模型的多规格目标物体抓取方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN120244978B 。
龙图腾网通过国家知识产权局官网在2026-01-13发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202510587079.0,技术领域涉及:B25J9/16;该发明授权基于大模型的多规格目标物体抓取方法是由刘健;刘澄桦;王双艺设计研发完成,并于2025-05-08向国家知识产权局提交的专利申请。
本基于大模型的多规格目标物体抓取方法在说明书摘要公布了:本发明提出一种基于大模型的多规格目标物体抓取方法,包括:构建面向多规格物体的抓取手势数据集,基于大模型进行物体规格语义指引即,融合提示词工程技术与语言大模型,获取物体形状、部件、尺寸、材质及抓取手势描述的文本信息,用于物体规格表征学习,以及构建物体规格感知的抓取生成模型三个步骤;本发明依托先进的大模型技术以及扩散模型独特的生成能力,致力于提出一种物体规格信息为指引的抓取机制,并构建起一个兼具泛化性与物体规格感知力的生成模型,专注于解决不同规格物体的抓取手势生成这一关键工作。
本发明授权基于大模型的多规格目标物体抓取方法在权利要求书中公布了:1.基于大模型的多规格目标物体抓取方法,其特征在于,包括以下步骤: 步骤一:构建面向多规格物体的抓取手势数据集,即构建由物体形状、部件、尺寸、材质、物体规格信息及机器手抓取手势组成的抓取数据集; 步骤二:基于大模型进行物体规格语义指引,即,融合提示词工程技术与语言大模型,获取物体形状、部件、尺寸、材质及抓取手势描述的文本信息,用于物体规格表征学习; 步骤三:构建物体规格感知的抓取生成模型,所述模型由语义指引模块和抓取手势生成模块组成,通过抓取生成模型生成机器手参数,抓取手势生成模块通过前向扩散将初始参数逐步扰动为高斯噪声并逆向去噪,利用噪声预测网络逐步修正含噪状态向真实抓取手势参数靠近,最后通过前向扩散得到的噪声真值项监督训练噪声预测网络; 步骤二中,基于大模型进行物体规格语义指引,即,融合提示词工程技术与语言大模型,获取物体形状、部件、尺寸、材质及抓取手势描述的文本信息,用于物体规格表征学习的过程包括: 步骤2-1:提示词工程设计,包括基础提示词构建、任务导向提示词优化和多轮交互提示词策略,所述基础提示词构建,即针对物体规格信息的不同维度,设计基础提示词模板;所述任务导向提示词优化,即结合抓取任务需求,设计任务导向型提示词,引导模型生成与抓取操作直接相关的语义信息,并添加约束条件提示词,提高生成内容的实用性;所述多轮交互提示词策略,即采用多轮提示词交互机制,第一轮输入基础物体规格信息获取初步描述,第二轮针对第一轮输出中的模糊或关键信息进行追问,通过迭代交互引导模型输出语义内容; 步骤2-2:与GPT-4v大模型交互,包括接口调用与参数配置、多模态信息输入和结果筛选与质量评估;所述接口调用与参数配置,即通过OpenAI提供的API接口与GPT-4v模型进行连接并设置参数;所述多模态信息输入,即利用GPT-4v的多模态处理能力,除了输入文本形式的物体规格信息外,还将物体的三维模型渲染图像、局部细节特写图片、材质纹理图像作为补充输入,通过图像标注工具为图像添加元数据;所述结果筛选与质量评估,即对模型输出的文本信息进行自动和人工双重筛选; 步骤2-3:文本信息处理与特征提取,包括文本清洗与规范化、文本嵌入与特征融合,所述文本清洗与规范化,即对筛选后的文本进行清洗,去除冗余字符、特殊符号和重复内容,统一文本格式,并使用自然语言处理工具进行分词、词性标注和命名实体识别,提取关键语义信息;所述文本嵌入与特征融合,即采用预训练的文本嵌入模型将清洗后的文本转换为向量表示,获取物体规格的文本特征,并将文本特征与步骤一中提取的物体几何特征、材质特征进行融合。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人沈阳工业大学,其通讯地址为:110870 辽宁省沈阳市铁西区经济技术开发区沈辽西路111号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励