鹏城实验室刘凯获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉鹏城实验室申请的专利基于大语言模型的语义三维场景理解方法、装置、设备及存储介质获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN119941989B 。
龙图腾网通过国家知识产权局官网在2025-10-17发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202510009870.3,技术领域涉及:G06T17/00;该发明授权基于大语言模型的语义三维场景理解方法、装置、设备及存储介质是由刘凯;姜军;裴海龙;罗明成;胡凯;马健;李萌;邹龙昊;李伟超;陶小峰设计研发完成,并于2025-01-03向国家知识产权局提交的专利申请。
本基于大语言模型的语义三维场景理解方法、装置、设备及存储介质在说明书摘要公布了:本发明公开了一种基于大语言模型的语义三维场景理解方法、装置、设备及存储介质,该方法包括:采集室内场景的多角度图片,并对多角度图片进行处理,获得多角度图片对应的三维高斯椭球和图像语义文本;将图像语义文本输入至预设大语言模型进行常识性训练,并基于训练结果预测室内场景类型获得对应的高级语义;将图像语义文本和高级语义压缩后嵌入三维高斯椭球,获得目标三维高斯椭球;基于目标三维高斯椭球,通过可微分渲染端到端训练对室内场景对应的3D模型进行参数优化,形成嵌入语义信息的3D场景表示,以构建从局部物体到全局场景的深层次场景理解,相比于现有技术,本发明有效提升了机器人系统在复杂环境中的场景理解和交互能力。
本发明授权基于大语言模型的语义三维场景理解方法、装置、设备及存储介质在权利要求书中公布了:1.一种基于大语言模型的语义三维场景理解方法,其特征在于,所述方法包括: 采集室内场景的多角度图片,并对所述多角度图片进行处理,获得所述多角度图片对应的三维高斯椭球和图像语义文本; 将所述图像语义文本输入至预设大语言模型进行常识性训练,并基于训练结果预测室内场景类型获得对应的高级语义; 将所述图像语义文本和所述高级语义压缩后嵌入所述三维高斯椭球,获得目标三维高斯椭球; 基于所述目标三维高斯椭球,通过可微分渲染端到端训练对所述室内场景对应的3D模型进行参数优化,形成嵌入语义信息的3D场景表示,以构建从局部物体到全局场景的深层次场景理解; 所述将所述图像语义文本和所述高级语义压缩后嵌入所述三维高斯椭球,获得目标三维高斯椭球的步骤,包括: 将所述图像语义文本和所述高级语义进行拼接,得到嵌套特征聚合张量; 利用多层感知器的全连接层对所述嵌套特征聚合张量进行降维,得到第一编码和第二编码; 将所述第一编码和所述第二编码嵌入所述三维高斯椭球,得到目标三维高斯椭球。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人鹏城实验室,其通讯地址为:518000 广东省深圳市南山区兴科一街2号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。
请提出您的宝贵建议,有机会获取IP积分或其他奖励