北京数原数字化城市研究中心王晓燕获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉北京数原数字化城市研究中心申请的专利一种增强大语言模型三维空间理解的场景表征方法及装置获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN119942027B 。
龙图腾网通过国家知识产权局官网在2025-12-02发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202510017129.1,技术领域涉及:G06T17/20;该发明授权一种增强大语言模型三维空间理解的场景表征方法及装置是由王晓燕;张超;刘祥德设计研发完成,并于2025-01-06向国家知识产权局提交的专利申请。
本一种增强大语言模型三维空间理解的场景表征方法及装置在说明书摘要公布了:本申请提供了一种增强大语言模型三维空间理解的场景表征方法及装置,涉及数据处理技术领域。构建多个视觉参照物,学习视觉参照物对应的局部区域内点的空间信息,获得第一层级的三维空间表征。通过消息传递机制促进不同视觉参照物间的全局空间分布建模,使每个视觉参照物不仅捕捉其局部特征,还能理解与相邻参照物之间的全局空间关系,形成第二层级的三维空间表征。通过注意力机制实现视觉参照物与全局场景之间的信息交互,并增加位置精调网络细化视觉参照物的定位,得到第三层的三维空间表征。如此,采用从第一层级到第三层级的渐进式三维空间表征,捕获到增强了位置信息的空间表征,提高大语言模型在处理三维视觉语言任务的空间理解和推理能力。
本发明授权一种增强大语言模型三维空间理解的场景表征方法及装置在权利要求书中公布了:1.一种增强大语言模型三维空间理解的场景表征方法,其特征在于,包括: 将场景点云表征通过采样和位置偏移得到多个子集合点,基于所述多个子集合点对所述场景点云表征进行聚类构建多个视觉参照物,所述多个视觉参照物作为所述场景点云表征中对应的局部区域的第一层级三维表征; 将所述多个视觉参照物通过消息传播机制进行全局空间分布建模,得到各所述视觉参照物的第二层级三维表征; 将所述多个视觉参照物的第二层级三维表征与所述场景点云表征通过多层注意力机制和位置精调网络进行处理,得到第三层级三维表征,所述位置精调网络是基于真实坐标调整各所述视觉参照物的空间定位的神经网络; 所述将场景点云表征通过采样和位置偏移得到多个子集合点,基于所述多个子集合点对所述场景点云表征进行聚类构建多个视觉参照物,包括: 通过最远点采样算法对所述场景点云表征进行采样,得到空间分布均匀的第一数量的采样点;通过第一前馈神经网络将各采样点与最近物体中心对齐,得到所述采样点对应的子集合点;基于所述第一数量的子集合点对所述场景点云表征进行聚类和池化,形成第一数量的视觉参照物。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人北京数原数字化城市研究中心,其通讯地址为:100084 北京市海淀区成府路150号智源大厦6层西侧房屋;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励