Document
拖动滑块完成拼图
个人中心

预订订单
商城订单
发布专利 发布成果 人才入驻 发布商标 发布需求

请提出您的宝贵建议,有机会获取IP积分或其他奖励

投诉建议

在线咨询

联系我们

龙图腾公众号
首页 专利交易 IP管家助手 科技果 科技人才 积分商城 国际服务 商标交易 会员权益 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索
当前位置 : 首页 > 专利喜报 > 中国计量大学;杭州海康威视数字技术股份有限公司章东平获国家专利权

中国计量大学;杭州海康威视数字技术股份有限公司章东平获国家专利权

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

龙图腾网获悉中国计量大学;杭州海康威视数字技术股份有限公司申请的专利一种基于多模态大模型的三维场景理解与指令分析方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN120849867B

龙图腾网通过国家知识产权局官网在2025-12-26发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202511343343.2,技术领域涉及:G06F18/20;该发明授权一种基于多模态大模型的三维场景理解与指令分析方法是由章东平;叶家伟;张世峰;任烨;于亮;陆展鸿;马道滨;肖丙刚设计研发完成,并于2025-09-19向国家知识产权局提交的专利申请。

一种基于多模态大模型的三维场景理解与指令分析方法在说明书摘要公布了:本发明属于深度学习技术领域,公开了一种基于多模态大模型的三维场景理解与指令分析方法。该方法首先围绕目标应用场景采集并预处理多模态数据,完成时空对齐与语义标注,构建标准化数据集。随后构建多模态场景理解大模型,通过专用编码器提取各模态特征,利用可变形注意力与时序建模实现多模态融合与动态特征增强,并引入稀疏混合专家架构提升模型表达能力与效率。训练阶段采用分阶段策略,先对齐多模态语义,再训练模态专家,最后集成至大模型中进行联合微调,并利用GOAT技术实现轻量参数微调。最终将模型部署于实际环境,实现复杂场景的自动感知与智能决策。本发明显著提升了三维场景理解的精度与效率,适用于智能制造、自动驾驶等领域。

本发明授权一种基于多模态大模型的三维场景理解与指令分析方法在权利要求书中公布了:1.一种基于多模态大模型的三维场景理解与指令分析方法,其特征在于,包括如下步骤: 步骤1:围绕应用场景采集多模态原始数据,完成预处理、时空对齐、语义标注与结构化组织,构建标准化可用的多模态场景理解数据集; 步骤2:构建多模态场景理解大模型,依次完成模态特征提取、语义空间对齐、时序关系建模与专家融合,并在关键层引入GOAT模块以实现高效参数微调; 步骤2.1:针对来自不同模态数据,分别采用专属策略进行特征编码; 步骤2.2:时序建模与动态特征增强:对于具有时间连续性的数据,引入位置编码机制将时间信息嵌入至模态表示中;随后将加入位置编码的特征输入至基于Transformer结构的时序建模模块,利用其自注意力机制捕捉模态内部的时间依赖关系,建模场景变化、动作连续性及动态行为模式; 步骤2.3:查询向量驱动的语义聚焦建模:通过与输入模态特征进行交叉注意力计算,提取结构化语义内容,生成与语言指令高度对齐的模态级高层语义表示; 步骤2.4:稀疏专家动态激活与特征融合:在获得对齐后的多模态语义表示基础上,引入稀疏混合专家架构以增强模型的适应性与表达能力; 步骤2.5:轻量参数微调机制:引入GOAT机制,模型采用GOAT技术进行轻量级参数微调; 步骤3:基于多模态场景理解数据集,对多模态场景理解大模型进行训练; 步骤4:完成训练与评估后,将多模态场景理解大模型部署于目标应用环境中,在真实或准实时场景中完成复杂任务的自动感知与智能决策。

如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人中国计量大学;杭州海康威视数字技术股份有限公司,其通讯地址为:310018 浙江省杭州市钱塘区学源街258号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。

以上内容由龙图腾AI智能生成。

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。