Document
拖动滑块完成拼图
个人中心

预订订单
商城订单
发布专利 发布成果 人才入驻 发布商标 发布需求

请提出您的宝贵建议,有机会获取IP积分或其他奖励

投诉建议

在线咨询

联系我们

龙图腾公众号
专利交易 商标交易 积分商城 国际服务 IP管家助手 科技果 科技人才 会员权益 需求市场 关于龙图腾 更多
 /  免费注册
到顶部 到底部
清空 搜索
当前位置 : 首页 > 专利喜报 > 安徽理工大学夏晨星获国家专利权

安徽理工大学夏晨星获国家专利权

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

龙图腾网获悉安徽理工大学申请的专利一种基于多路径特征提取和多尺度特征融合的单目深度预测方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN116758130B

龙图腾网通过国家知识产权局官网在2026-04-17发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202310755900.6,技术领域涉及:G06T7/55;该发明授权一种基于多路径特征提取和多尺度特征融合的单目深度预测方法是由夏晨星;张梦格;高修菊;葛斌;刘舜;朱序;陈欣雨;陆一鸣设计研发完成,并于2023-06-21向国家知识产权局提交的专利申请。

一种基于多路径特征提取和多尺度特征融合的单目深度预测方法在说明书摘要公布了:本发明属于计算机视觉领域中的一个基础研究课题,提出了一种基于多路径特征提取和多尺度特征融合的单目深度预测方法,并构建了一种全新的编码器‑解码器框架。在编码器部分,本发明结合卷积神经网络与Transformer各自的优点,采用多路径结构在局部和全局区域同时进行推理,实现了精细和粗糙的多路径特征提取,获得了多样化的多尺度特征表示。特别地,空间金字塔池化模块PSP利用多尺度自适应池化操作来提取不同尺度下的语义信息,从而初始化解码器特征。在解码器部分,本发明引入了精心设计的编码器和解码器特征交互模块EDFI,通过跳跃连接和双路径交叉自我注意机制,充分自适应地增强和融合全局上下文语义信息和精细的局部边缘信息。本发明充分利用了卷积神经网络的强大空间归纳和由VisionTransformer模型实现的全局信息推理,同时,结合灵活的轻量级解码器,本发明能够以更细粒度和更高的准确度完成深度预测。

本发明授权一种基于多路径特征提取和多尺度特征融合的单目深度预测方法在权利要求书中公布了:1.一种基于多路径特征提取和多尺度特征融合的单目深度预测方法,其特征在于,该方法包含以下步骤: 1此单目深度预测方法利用在ImageNet上预先训练好的Multi-PathVisionTransformer,即MPViT模型构建多尺度patchembedding和多路径特征提取结构,初始化编码器网络的骨干网络; 2对MPViT主干网络得到的最后一层输出特征映射通过PyramidSceneParsingNetwork,即PSP空间金字塔池化模块,进行处理,获得不同尺度下的语义信息,有效地增强解码器初始输入特征的全局性和相关性; 3使用自下而上的方法,从最低分辨率的输出特征图开始,通过迭代上采样操作,使用注意力机制和跳跃连接方法融合对应尺度的编码器和解码器特征图,进行多尺度局部特征和全局上下文信息聚合,预测更加精确的深度图;具体步骤包括:3.1密集预测任务,一个像素必须知道它是否位于一个物体的边界上,或者它是否属于一个共同表面上的一组像素,才能进行准确的预测,因此构建了一个轻量级并且有效地进行编码器和解码器特征交互的模块EDFI,自适应地选择和融合全局上下文语义信息和精细的本地局部信息,该模块从最低的分辨率特征图开始,向高分辨率移动,首先对编码器和解码器特征图都通过卷积层将通道数改变为128,以方便匹配维度;然后使用双路径交叉注意机制和跳跃连接经过一系列卷积层,在不使用复杂的上采样方式和增加额外的注意力模块的情况下,增强学习丰富的全局上下文和局部边缘密集特征的能力,3.2在编码器和解码器特征交互模块EDFI中,首先构建双路径交叉注意机制模块,以自适应地关注重要位置: 1 2 3 4 5 其中,,,和是权重矩阵,是经过卷积操作后大小为的编码器特征映射,为128,是对应尺度的解码器特征映射,是两个特征沿着通道维度Concat拼接得到的特征,这里的大小为,经过一层卷积后维度降低到; 使用交叉协方差注意机制增强特征映射和, 6 7 8 其中,; 然后,增加特征的非线性度, 9 其中,LN表示层归一化操作,ReLU表示激活函数,conv1表示卷积,表示具有扩张率为r的扩张卷积; 3.3在解码器中,编码器和解码器特征交互模块EDFI的初始输入分别是由PSP模块的输出特征和MPViT骨干网络的最后一层输出特征,然后经过上采样得到, 10 然后,通过融合不同尺度下的编码器特征与解码器的输出特征,帮助初始特征映射逐渐增强全局的上下文信息以及局部连续性, 11 ; 最后,对得到的解码器输出特征经过卷积、ReLU激活函数、卷积降维和Sigmoid激活函数操作,将每个通道的权重归一化到0-1之间,进一步提取和融合特征,预测深度图,然后深度图乘以最大深度值进行缩放; 4使用尺度不变损失Scale-InvariantlossSILog训练和优化网络模型,计算预测深度值与真实深度值之间的差。

如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人安徽理工大学,其通讯地址为:232000 安徽省淮南市山南新区泰丰大街168号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。

以上内容由龙图腾AI智能生成。

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。