首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

汽车可行驶区域识别方法和装置 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

申请/专利权人:上海保隆汽车科技(武汉)有限公司

摘要:本发明涉及汽车技术领域,提供了汽车可行驶区域识别方法、深度学习模型构建方法和装置。其中所述汽车可行驶区域识别方法包括:使用Segformer模型进行汽车可行驶区域的识别。本发明使用Segformer模型进行汽车可行驶区域的识别,由于Segformer模型具有体积小,准确率高的特点,从而能够减少汽车可行驶区域识别所占用的计算资源,从而能够在一些计算资源有限的设备上运行。

主权项:1.一种汽车可行驶区域识别方法,其特征在于,包括:使用Segformer模型进行汽车可行驶区域的识别,具体包括:对汽车行驶周边的多张环境样本图像进行拼接,得到以车身为中心的鸟瞰图;对鸟瞰图进行预处理后,输入至训练完成的Segformer模型进行汽车可行驶区域的识别,以识别出可行驶区域;所述对鸟瞰图进行预处理包括:使用均值漂移滤除环境样本图像中的噪点,并对环境样本图像进行图像增强;所述使用均值漂移滤除环境样本图像中的噪点具体为:使用对环境样本图像中的各像素点进行处理;其中,是第t次迭代的位置,表示数据集中的第个样本,是核函数,是带宽参数,用来控制估计的精度;在每次迭代中,均值漂移通过计算当前位置与其他样本的相似度,然后加权平均得到新的位置,重复这个过程直到收敛;所述训练完成的Segformer模型的构建方法包括:对多张鸟瞰图进行标记,生成训练数据集、验证数据集和测试数据集;构建初始Segformer模型;使用所述训练数据集、验证数据集和测试数据集对初始Segformer模型进行训练,得到用于汽车可行驶区域识别的训练完成的Segformer模型;所述初始Segformer模型为尺寸居中的MiT-B2模型;所述MiT-B2模型包括四个编码器、一个解码器和一个输出层;每个编码器包括多个编码层,各编码器中编码层的个数分别设置为3、4、6和3;在每两个编码层之间还设置有重叠压缩合并层;所述解码器包括多个解码层和一个上采样层,所述解码层用于使用自注意力机制和跨注意力机制整合不同层级的特征信息,所述上采样层用于将特征图的尺寸增加到与输入图像的尺寸相同;所述输出层包括一个分类头,所述分类头为由一个线性层函数实现的卷积层,用于将各像素分配至不同的类别;所述使用所述训练数据集、验证数据集和测试数据集对初始Segformer模型进行训练,包括:将所述训练数据集划分为多个批次的训练子集,将验证数据集划分为多个批次的验证子集,将测试数据集划分为多个测试子集;将每一批次的训练子集和每一批次的验证子集输入至相应批次的第一中间模型中进行训练,以得到相应批次的第二中间模型;其中,以初始Segformer模型作为第一批次的第一中间模型,以上一批次的第二中间模型作为下一批次的第一中间模型;使用相应批次的测试子集对相应批次的第二中间模型进行测试,得到相应批次的测试结果,根据所有批次的测试结果从所有批次的第二中间模型中选择一个第二中间模型作为训练完成的Segformer模型;在训练得到预设数量个第二中间模型后,基于扩散Poly学习率策略在后续各第一中间模型的各编码器中添加噪声;根据所添加噪声的水平,设定相应的学习率,以便于根据添加有噪声的第一中间模型和相应的学习率进行后续批次的训练;其中,依据如下方法设定相应的学习率:第n次训练迭代中的学习率,其中,为一个根据总迭代次数设定好的预设参数,该预设参数由本领域技术人员根据经验分析得到,表示上一次设定的学习率,即第n-1次训练迭代中的学习率,表示第n次添加的服从标准正态分布的噪声。

全文数据:

权利要求:

百度查询: 上海保隆汽车科技(武汉)有限公司 汽车可行驶区域识别方法和装置

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。