Document
拖动滑块完成拼图
首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

利用1xH卷积的基于CNN的对象检测方法及装置 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

申请/专利权人:斯特拉德视觉公司

摘要:利用1xH卷积的基于CNN的对象检测方法及装置。本发明涉及学习满足KPI的使用于硬件最佳化的基于CNN的对象检测器的参数的学习方法,其特征在于,包括如下步骤:a使第1转置层或池化层将各个候选框的池化特征图上的像素按照各个候选框级联;b使1×H1及1×H2卷积层对将级联的池化特征图的所有通道中的各自对应的通道内的各个特征级联而生成的重塑特征图应用1×H1及1×H2卷积运算来生成调整特征图;及c使第2转置层或分类层按照各个像素将调整特征图分离并将参照对象检测信息及与此对应的GT来算出的对象检测损失反向传播来生成各个候选框的像素级特征图。

主权项:1.一种基于CNN的对象检测器的参数的学习方法,其特征在于,包括如下步骤:a当获得至少一个训练图像时,学习装置,i使至少一个卷积层对上述训练图像应用至少一次卷积运算来生成至少一个初始特征图,ii使RPN利用上述初始特征图而生成与位于上述训练图像内的至少一个对象分别对应的至少一个候选框,iiiiii-1使池化层对在上述初始特征图上与上述候选框分别对应的各个区域应用至少一次池化运算来生成各个上述候选框的池化特征图,并使第1转置层将各个上述候选框的上述池化特征图上的对应的相同的各个位置的各个像素按照各个上述候选框级联来生成综合特征图,或者iii-2使上述池化层对在上述初始特征图上与各个上述候选框对应的各个区域应用池化运算来生成各个上述候选框的上述池化特征图,并使上述池化层将各个上述候选框的上述池化特征图上的对应的相同的各个位置的各个上述像素按照各个上述候选框级联来生成上述综合特征图;b上述学习装置,b1i使第1重塑层将由上述综合特征图的所有通道中的各自对应的H1个通道构成的各个组内的各个特征级联来生成第1重塑特征图,ii使1xH1卷积层对上述第1重塑特征图应用1xH1卷积运算来生成调整了卷的第1调整特征图,b2i使第2重塑层将由上述第1调整特征图的所有通道中的各自对应的H2个通道构成的各个组内的各个特征级联而生成第2重塑特征图,ii使1xH2卷积层对上述第2重塑特征图应用1xH2卷积运算来生成调整了卷的第2调整特征图;及c上述学习装置,c1i使第2转置层按照各个上述像素将上述第2调整特征图分离而生成各个上述候选框的像素级特征图,并使分类层利用各个上述候选框的上述像素级特征图来生成关于各个上述候选框的对象类信息,ii使上述分类层按照各个上述像素将上述第2调整特征图分离来生成各个上述候选框的上述像素级特征图,使上述分类层利用各个上述候选框的上述像素级特征图而生成关于各个上述候选框的上述对象类信息,然后,c2使检测层参照上述对象类信息和各个上述候选框的上述像素级特征图来生成与位于上述训练图像内的上述对象对应的对象检测信息,c3使检测损失层参照上述对象检测信息和与此对应的GT来算出至少一个对象检测损失,从而将上述对象检测损失反向传播来学习上述1xH2卷积层、上述1xH1卷积层及上述卷积层中的至少一部分参数,在将上述候选框的数量设为N,将各个上述候选框的上述池化特征图的宽度设为M1、高度设为M2,将各个上述候选框的上述池化特征图的通道数量设为J的情况下,在上述a步骤中,上述学习装置,i使上述第1转置层将各个上述候选框的上述池化特征图变换成宽度为N、高度为1、通道为M1xM2xJ的上述综合特征图,或者ii使上述池化层将各个上述候选框的上述池化特征图变换成宽度为N、高度为1、通道为M1xM2xJ的上述综合特征图,在将上述1xH1卷积层的过滤器的数量设为K,将上述1xH2卷积层的过滤器的数量设为L的情况下,在上述b步骤中,上述学习装置使上述第1重塑层生成宽度为N、高度为H1、通道为CEIL的上述第1重塑特征图,使上述1xH1卷积层生成宽度为N、高度为1、通道为K的具备Nx1xK的卷的上述第1调整特征图,上述学习装置使上述第2重塑层生成宽度为H2、高度为N、通道为CEIL的上述第2重塑特征图,使上述1xH2卷积层生成宽度为N、高度为1、通道为L的具备Nx1xL的卷的上述第2调整特征图,在上述c步骤中,上述学习装置,i使上述第2转置层将上述第2调整特征图变换成与N个上述候选框分别对应的宽度为1、高度为1、通道为L的具备1x1xL的卷的、各个上述候选框的上述像素级特征图,或者ii使上述分类层将上述第2调整特征图变换成与N个上述候选框分别对应的宽度为1、高度为1、通道为L的具备1x1xL的卷的、各个上述候选框的上述像素级特征图。

全文数据:

权利要求:

百度查询: 斯特拉德视觉公司 利用1xH卷积的基于CNN的对象检测方法及装置

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。