Document
拖动滑块完成拼图
个人中心

预订订单
服务订单
发布专利 发布成果 人才入驻 发布商标 发布需求

在线咨询

联系我们

龙图腾公众号
首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索
当前位置 : 首页 > 专利喜报 > 恭喜湖南大学张辉获国家专利权

恭喜湖南大学张辉获国家专利权

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

龙图腾网恭喜湖南大学申请的专利一种用于机器人作业的大模型特征融合哈希自注意力方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN119357647B

龙图腾网通过国家知识产权局官网在2025-04-08发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202411945629.3,技术领域涉及:G06F18/213;该发明授权一种用于机器人作业的大模型特征融合哈希自注意力方法是由张辉;刘立柱;王耀南;江一鸣;谢核;彭伟星;毛建旭设计研发完成,并于2024-12-27向国家知识产权局提交的专利申请。

一种用于机器人作业的大模型特征融合哈希自注意力方法在说明书摘要公布了:本发明公开了一种用于机器人作业的大模型特征融合哈希自注意力方法,获取目标操作环境下多种复杂操作任务的示教数据;采集操作场景中的多模态信息;构建基于大模型的视觉‑文字精炼及对齐模块,将多模态信息中的声音信号和视觉信号输入,得到最终提取的视觉特征和最终预测的文字特征;采用特征提取器将最终得到的视觉特征和文字特征转换为特征相同的维度,利用设计的哈希交互机器人技能学习模块进行特征交互并进行特征提取,预测相应的机器人的动作;基于示教数据和预设的损失函数对哈希交互机器人技能学习模块进行训练,用于根据实时的视觉和文字输入预测机器人的动作。提高机器人在复杂处理操作环境下的自主学习、技能泛化和精准控制能力。

本发明授权一种用于机器人作业的大模型特征融合哈希自注意力方法在权利要求书中公布了:1.一种用于机器人作业的大模型特征融合哈希自注意力方法,其特征在于,所述方法包括以下步骤:S100:获取目标操作环境下多种复杂操作任务的示教数据;S200:采集并融合视觉、声学和文字多维信息,全面捕捉机器人操作场景中的多模态信息;S300:构建基于大模型的视觉-文字精炼及对齐模块,包括语音大模型网络、分割大模型网络、视觉特征精炼模块和场景理解模块,将多模态信息中的声音信号和视觉信号输入至基于大模型的视觉-文字精炼及对齐模块,得到最终提取的视觉特征和最终预测的文字特征,并基于预设的交叉熵损失对视觉特征精炼模块进行训练,利用预设的均方差损失对场景模块进行训练,实现场景特征和文字特征的初步对齐;S400:采用特征提取器将最终提取的视觉特征和最终预测的文字特征转换为特征相同的维度,利用设计的哈希交互机器人技能学习模块进行特征交互,实现不同模态特征的潜在对齐,并进行特征提取,进而预测相应的机器人的动作;S500:基于示教数据和预设的损失函数对哈希交互机器人技能学习模块进行训练,得到训练好的哈希交互机器人技能学习模块,用于根据实时的视觉和文字输入预测机器人的动作,完成实验任务;S300包括:S310:预设的语音大模型网络提取声音信号,并输出对应的文字信息作为文字特征;S320:并将文字特征作为提示词和当前场景的RGB图像输入到用于训练好的分割的视觉大模型中,得到分割的视觉特征,其中代表单位时间内提取的图像特征个数,分别表示拍摄数据的长和宽;S330:将初次分割得到的视觉特征输入到视觉特征精炼模块后输出最终提取的视觉特征,将最终提取的视觉特征与真实采集的操作场景的分割标签做交叉熵损失,进行视觉特征精炼模块的训练;S340:将最终提取的视觉特征输入至场景理解模块,对分割对象的名称预测得到最终预测的文字特征,其中代表单位时间内提取的文字特征个数,D代表最终预测文字特征的维度,基于预设的均方差损失对场景理解模块进行训练,以实现场景特征和文字特征的初步对齐。

如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人湖南大学,其通讯地址为:410082 湖南省长沙市岳麓区麓山南路1号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。