合肥工业大学张莉获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉合肥工业大学申请的专利基于改进深度分布补偿与频率域特征融合的单目深度估计方法和设备获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN120031934B 。
龙图腾网通过国家知识产权局官网在2025-07-18发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202510116744.8,技术领域涉及:G06T7/50;该发明授权基于改进深度分布补偿与频率域特征融合的单目深度估计方法和设备是由张莉;詹明霞;褚晓萌;檀结庆设计研发完成,并于2025-01-24向国家知识产权局提交的专利申请。
本基于改进深度分布补偿与频率域特征融合的单目深度估计方法和设备在说明书摘要公布了:本发明涉及一种基于改进深度分布补偿与频率域特征融合的单目深度估计方法,构建单目深度估计模型;设计单目深度估计模型的损失函数;训练单目深度估计模型,得到训练后的单目深度估计模型和噪声残差;将待估计的单目RGB图像、噪声输入训练后的单目深度估计模型,经过稳定扩散模型扩散模型的多步去噪生成高精度深度图。本发明设计了自适应深度偏置补偿机制,动态调整远近区域的权重分配,从根本上解决了远距离区域样本稀疏导致的预测误差问题;利用频率感知融合模块,通过快速傅里叶变换对深度特征进行高频与低频分解,并采用自适应融合策略增强特征表达能力,显著提升了边缘细节的捕捉效果和深度估计的一致性。
本发明授权基于改进深度分布补偿与频率域特征融合的单目深度估计方法和设备在权利要求书中公布了:1.一种基于改进深度分布补偿与频率域特征融合的单目深度估计方法,其特征在于:该方法包括下列顺序的步骤: 1构建单目深度估计模型:在U-Net网络模型的基础上引入频率感知融合模块,U-Net网络模型和频率感知融合模块组成单目深度估计模型,通过快速傅里叶变换将输入的深度特征图分解为高频分量和低频分量,通过自适应加权方法融合高频分量和低频分量; 2设计单目深度估计模型的损失函数:基于深度分布权重与边缘梯度权重构建自适应深度偏置补偿机制,根据自适应深度偏置补偿机制动态分配各深度区域的训练损失权重,计算总损失函数以平衡远近距离深度区域的估计精度; 3训练单目深度估计模型:采用稳定扩散模型作为生成网络,并结合单目深度估计模型进行深度特征提取与去噪训练,得到训练后的单目深度估计模型和噪声 4进行单目深度估计:将待估计的单目RGB图像、初始噪声输入训练后的单目深度估计模型,经过多步去噪生成高精度深度图; 步骤1具体是指:引入频率感知融合模块,频率感知融合模块利用快速傅里叶变换对深度特征图进行分解,以增强深度边缘细节的捕捉能力;首先对输入的潜在空间的深度特征图zd∈RH×W×C进行快速傅里叶变换,将空间域特征转换到频率域表示: 其中,Zfreq表示频率域下的深度特征,u和v分别为水平、垂直方向的频率分量,W表示潜在空间的深度特征图的宽度,H表示潜在空间的深度特征图的高度,C表示潜在空间的深度特征图的通道数;dx表示潜在空间的深度特征图在水平方向上的位置;dy表示潜在空间的深度特征图在垂直方向上的位置; 为进一步分离高频信息与低频信息,基于归一化频率半径ρk进行分解,其中,ρk定义为: 式中,kx是频率域中沿水平方向的频率分量,ky是频率域中沿垂直方向的频率分量; 根据归一化频率半径ρk,定义高频掩码Mhigh与低频掩码Mlow: Mlowk=1-Mhighk 其中,τ为设定的频率阈值;基于高频掩码Mhigh与低频掩码Mlow掩码,分别提取高频分量与低频分量: Zhigh=F-1Mhigh·Zfreq Zlow=F-1Mlow·Zfreq 其中,F-1表示逆傅里叶变换,用于将高、低频分量从频率域转换回空间域;高频分量Zhigh包含深度特征图中的边缘和细节信息,低频分量Zlow保留深度特征图的全局深度结构; 为优化高、低频分量的利用,采用自适应加权方法进行特征融合,融合后的特征ZFAF为: ZFAF=α1Zhigh+α2Zlow α1+α2=1 其中,α1为可学习参数,用于控制高频在深度特征图中的权重;α2为可学习参数,用于控制低频分量在深度特征图中的权重; 步骤2具体是指:设计一种自适应深度偏置补偿机制,自适应深度偏置补偿机制由深度分布权重图wdistance与边缘梯度权重图wedge组成,以解决深度分布长尾效应问题; 深度分布权重图wdistance通过计算像素深度的分布密度实现: 其中,d为原始深度图,β为平滑参数,zmean表示原始深度图d中各个像素点深度的均值,P为深度分布的百分位数;边缘梯度权重图wedge则通过Sobel算子计算原始深度图d的边缘梯度幅值: 其中,Gx和Gy分别为水平、垂直方向的梯度; 总损失函数Ltotal为: 其中,N表示训练样本的数量,λLvar为方差正则化项,用于增强潜在特征的多样性;∈θ,i第i个样本预测噪声,∈t,i第i个样本t时刻加入的噪声;wcombined=λbasewdistance+1-λbasewedge,其中,λbase为超参数,用于平衡深度分布权重与边缘梯度权重的贡献比例;wcombined的动态调整能够有效适应不同深度区域和边缘特性的变化,从而优化深度估计性能。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人合肥工业大学,其通讯地址为:230009 安徽省合肥市屯溪路193号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。