中国农业大学段青玲获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉中国农业大学申请的专利一种用于池塘单目图像的深度估计方法及系统获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN120431143B 。
龙图腾网通过国家知识产权局官网在2026-03-27发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202510478425.1,技术领域涉及:G06T7/50;该发明授权一种用于池塘单目图像的深度估计方法及系统是由段青玲;刘丁硕;李道亮设计研发完成,并于2025-04-16向国家知识产权局提交的专利申请。
本一种用于池塘单目图像的深度估计方法及系统在说明书摘要公布了:本发明公开了属于计算机视觉技术领域,特别涉及一种用于池塘单目图像的深度估计方法及系统,所述方法包括:构建池塘单目图像深度估计模型,将池塘图像输入池塘单目图像深度估计模型,得到池塘场景的深度映射,获得每个像素点到摄像机的距离信息,基于所述距离信息生成池塘图像深度图,实现池塘图像的深度估计。所述系统包括池塘单目图像深度估计模型包括:U‑MonoVIT编码器、局部平面引导层、跳跃多尺度扩展自注意力机制。能够有效解决池塘图像模糊、对比度低、过度曝光或昏暗等问题导致的深度估计准确率降低可准确高效地实现池塘场景的单目深度估计,为全面探索池塘环境和生物量估算提供关键支持。
本发明授权一种用于池塘单目图像的深度估计方法及系统在权利要求书中公布了:1.一种用于池塘单目图像的深度估计方法,其特征在于,构建池塘单目图像深度估计模型,将池塘图像输入池塘单目图像深度估计模型,得到池塘场景的深度映射,获得每个像素点到摄像机的距离信息,基于所述距离信息生成池塘图像深度图,实现池塘图像的深度估计; 所述构建池塘单目图像深度估计模型包括如下步骤: 在编码阶段,给定当前的输入图像,输入作为骨干网络的U-MonoVIT编码器提取多尺度的图像特征;所述U-MonoVIT编码器包括:局部感知单元和并行特征提取模块; 在解码阶段,采用局部平面引导层,通过4D平面系数对局部图像块的拟合,来获取该像素点周围的局部特征信息; 通过跳跃多尺度扩展自注意力机制,对不同的头部设置不同的扩张率,有效地聚合编码器与解码器参与感受野内不同尺度的语义信息; 所述U-MonoVIT编码器还包括: 在编码阶段,将给定当前的输入图像依次输入一个卷积层和四个Transformer块;所述一个卷积层依次包括:第一卷积、第二卷积以及第三卷积;三个卷积的卷积核大小为3*3,第一卷积和第二卷积的步长为1,第三卷积的步长为2;所述四个Transformer块对应阶段1、阶段2、阶段3以及阶段4,四个阶段对应四种维度[C1,C2,C3,C4],分别对应14、18、116、132的比例特征,并且每个阶段的depths为[3,4,6,3];所述Transformer块包括:补丁嵌入和VIT层;所述补丁嵌入将图片转换为序列;所述VIT层包括:并行的第一支路和第二支路;所述第一支路包括:局部感知单元、第一归一化层、多头自注意模块;所述第二支路包括:并行特征提取模块;第一支路和第二支路的输出相加后,输入第二归一化层和多层感知机制; 所述并行特征提取模块包括: 特征提取链路、批归一化层BN以及卷积层Conv;所述特征提取链路包括:卷积层Conv、批归一化层BN以及SILU激活函数; 所述并行特征提取模块的工作过程为:经过局部感知单元处理后的特征图输入并行特征提取模块,首先经过一个3×3卷积层Conv,所述3×3卷积层的卷积核尺寸能够有效捕捉局部细节与全局信息,增强特征表达能力;随后,特征图通过批归一化层BN,所述批归一化层BN能够加速网络收敛,提高训练稳定性,并减少内部协变量偏移;同时,采用SILUSigmoidLinearUnit激活函数,进一步提升模型对水下模糊区域的特征提取能力,增强对低对比度和不均匀光照区域的感知效果;以上过程执行两次后,再分别执行一个一个3×3卷积层Conv和归一化层BN; 所述局部感知单元包括:3X3深度卷积; 所述局部感知单元的工作过程为:首先将输入图像划分为小块Patch,并转换为序列表示;随后,这些Patch通过3×3深度卷积层提取局部特征,同时保留空间信息;为了增强特征表达能力,将经过深度卷积处理的特征图与未经过深度卷积的特征图进行相加,实现特征互补;融合后的特征图经过卷积层块进行进一步处理,以同时捕捉局部细节和全局依赖关系; 所述采用局部平面引导层,通过4D平面系数对局部图像块的拟合,来获取该像素点周围的局部特征信息具体包括: 给定具有空间分辨率Hk的特征映射,提出的层为每个空间单元估计一个4D平面系数;为用局部平面假设引导特征,使用射线-平面相交将每个估计的四维平面系数转换为k×k局部深度线索ci: 其中,n1n2n3n4表示估计的平面系数,ui、vi像素i的k×k逐块归一化坐标; 通过1×1个卷积的堆栈,重复减少2倍的通道数量,直至通道数量达到3;通过第一方法和第二方法传递特征映射得到局部平面系数估计;所述第一方法为:转换成单位法向量,所述第二方法为:定义平面与原点垂直距离的sigmoid型函数;在sigmoid函数之后,将输出与最大距离k相乘以得到实际深度值; 将给定特征映射的前两个通道视为角度,并使用以下公式将它们转换为单位法向量: 所述单位法向量包括两个自由度:极角θ和方位角 在特征映射降低到H8和H4阶段的上采样结果与采用局部平面引导层恢复到全分辨率的下采样结果同时通过3*3卷积和bn层后拼接在一起,得到局部特征给定全局特征和局部特征在和上执行3×3的卷积送入跳跃多尺度扩展自注意力机制;通过将全局特征和局部特征归一化,使输入的分布更为稳定: 式中,LayerNorm为层归一化,为全局特征归一化的特征,为局部特征归一化的特征。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人中国农业大学,其通讯地址为:100193 北京市海淀区圆明园西路2号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励