买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
摘要:本发明公开了一种基于机器视觉的弱纹理物体位姿估计方法,使用该位姿估计方法在训练模型时,通过引入距离偏差损失函数对训练进行指导,关注像素到关键点的距离对生成假设关键点的影响,解决了不同像素在具有相同的预测方向向量偏差时,生成远离关键点的假设关键点的问题,使最终生成的假设关键点更加准确;同时,本发明通过融合ResNet‑18网络和尺度感知语义提取器的输出,提高模型对目标的识别和分类能力,从而提升了模型的精度;此外,本发明通过融合不同尺度的特征图进行特征提取,从而捕获到更全面、更丰富的特征,提高位姿估计的准确性。
主权项:1.一种基于机器视觉的弱纹理物体位姿估计方法,其特征在于:包括以下步骤:步骤一、获取带有关键点的向量场和掩码图标签的筒纱数据集;步骤二、构建位姿估计模型,位姿估计模型的输入为筒纱的RBG图像,输出为关键点的向量场和掩码图;步骤三、训练位姿估计模型使用筒纱数据集对步骤二构建的位姿估计模型进行训练;位姿估计模型的输入为筒纱数据集中的RGB图像,输出为关键点的向量场和语义标签的张量;以交叉熵损失函数Lseg作为语义分割任务的损失函数;以平滑损失函数Lreg和距离偏差损失函数Ldis作为向量场预测任务的损失函数;其中,距离偏差损失函数Ldis的表达式为: 其中,K为关键点的数量;p∈O为属于筒纱O的像素;sp,k为像素点到关键点的距离;和为向量vkp的横、纵坐标;vkp为像素点p对应的预测方向向量;ukp为像素点p对应的真实方向向量;和为向量ukp的横纵坐标;k=1,2,...,K;结合交叉熵损失函数Lseg、平滑损失函数Lreg和距离偏差损失函数Ldis获取训练位姿估计模型时的最终损失函数L+;步骤四、将被测筒纱图像输入训练完成的位姿估计模型中,获取语义标签的张量和不同关键点对应的向量场;利用关键点的向量场和语义标签的张量,获取不同关键点k对应的筒纱的预测向量场集合Vk={vkpi|pi∈O};在预测向量场集合Vk中,以不同筒纱像素对应预测方向向量所在直线的交点作为关键点k对应的假设关键点hk,j;其中,j=1,2,...,N;N为假设关键点的数量;对每个关键点k对应假设关键点hk,j进行评估,选取最优的假设关键点作为对应的关键点;步骤五、根据预测的2D关键点建立2D-3D关键点对应关系,并通过PnP算法获取筒纱的最终位姿。
全文数据:
权利要求:
百度查询: 浙江理工大学 杭州墨攻科技有限公司 一种基于机器视觉的弱纹理物体位姿估计方法
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。