Document
拖动滑块完成拼图
首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

一种真实场景下野生动物姿态估计方法 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

申请/专利权人:北京林业大学

摘要:本发明公开了一种真实场景下野生动物姿态估计方法,属于野生动物监测保护技术领域。本发明旨在对复杂环境下的动物姿态进行估计,能够适用于大部分真实场景,有效避免了对数据集的重复训练,具体包括:S1、构建动物姿态估计图像的数据集,并基于风格迁移对所构建的数据集进行处理;S2、基于组白化操作,构建基于热图生成的自由简单基线姿态估计模型,利用所述模型生成热图,利用热图完成模型训练;S3、对模型进行修正,设计坐标表征方法和热图解码方法;S4、采用轻量化的姿态估计网络解码架构,完成真实场景下野生动物姿态的估计。本发明以深度学习的野生动物姿态估计方法为主体,最终可以实现对复杂环境下野生动物的监测、调查和保护工作。

主权项:1.一种真实场景下野生动物姿态估计方法,其特征在于,包括以下步骤:S1、构建动物姿态估计图像的数据集,并基于风格迁移对所构建的数据集进行处理;S2、基于组白化操作,构建基于热图生成的自由简单基线姿态估计模型,利用所述模型生成热图,利用热图完成模型训练;具体包括如下内容:利用非批次归一化和组白化方法,并加入挤压和提取模块,构建基于热图生成的自由简单基线野生动物姿态估计模型,以自适应学习特征权重;所述模型遵循单架构-编码器解码器设计,对于包含关键点的动物输入图像,通过骨干网络进行特征提取得到特征图,解码器中的反卷积模块通过对骨干网络特征提取到的特征图进行上采样获取预测热图,最后通过Argmax函数获得热图最大值作为最终的关键点坐标;再利用所述模型对关键点坐标进行标注,并通过公式生成目标热图,利用目标热图和预测热图之间应用均方误差损失进行训练;所述非批次归一化和组白化方法具体包括以下内容:引入非批次维度归一化方法—组归一化方法,将神经元分成组,对每个样本的每组神经元独立应用标准化操作,以避免估计偏移,缓解批量归一化层在小批次下误差迅速变大的缺陷;所述组归一化方法具体包括如下内容:将白化操作引入组归一化方法中,采用组白化将样本的神经元分,以便对每组中的神经元进行标准化,然后对所得的组进行相关;所述挤压和提取模块通过全局平均池化操作将特征图通道的特征值压缩为一个实数,压缩后的特征图按照公式e=Fexfc=σ·G给每个通道生成不同的权重,利用逐通道乘以权重系数,对特征图的通道维度进行缩放,以此实现对不同特征通道进行自适应地调整;S3、对S2中所构建的模型进行修正,设计坐标表征方法和热图解码方法;具体包括如下内容:S3.1、按照公式以量化后的坐标为中心生成最终的高斯热图;将高斯热图的高斯内核以亚像素位置为中心进行坐标编码,遵循泰勒定理,通过在预测热图的最大激活处评估的泰勒二阶展开公式来近似激活,以亚像素精度实现联合预测,具体指:使用公式表示待预测关键点坐标相对应的高斯中心的预测热图;其中协方差是一个对角矩阵;借助对数似然优化原则,利用公式对预测热图进行对数变换来促进推理,并保持最大激活的原始位置不变; 表明高斯热图最大响应值点μ是函数的极值,该处的一阶导数为0;公式遵循泰勒定理,通过在预测热图的最大激活处评估的泰勒二阶展开公式来近似激活:利用公式μ=m-S″m-1S′m选择m来近似μ,其代表一个接近最大激活数值的良好的粗略联合预测;S3.2、采用与训练数据具有相似结构的高斯核K按照公式进行卷积操作,平滑预测热图中的多个峰值,以得到一个峰值;通过取输入特征矩阵的最大值和最小值对平滑后的热图进行调整,以保证处理后的原始热图大小;S4、综合S1~S3所述操作,采用轻量化的姿态估计网络解码架构,完成真实场景下野生动物姿态的估计。

全文数据:

权利要求:

百度查询: 北京林业大学 一种真实场景下野生动物姿态估计方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。