买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
摘要:本发明公开了一种基于多尺度预测CNN及龙芯芯片的多类别目标识别方法,包括:将目标图像输入到搭建好的多尺度背景预测卷积神经网络,输出分类结果;将分类结果为物体的候选框,去除重复的候选框;对多尺度背景预测卷积神经网络充分训练,得到训练好的多尺度背景预测卷积神经网络;视觉摄像头采集视频文件,并且统一尺寸大小;将训练好的多尺度背景预测卷积神经网络模型移植到基于龙芯芯片的嵌入式系统中完成对多类别目标的识别。本发明充分考虑了目标识别快速准确的特点,设计了多尺度背景预测卷积神经网络,利用多尺度网络模型来对多类别目标进行识别,提高了对于多类别目标的识别准确率和速度,并且具有很高的可移植性,应用前景广泛。
主权项:1.基于多尺度预测CNN及龙芯芯片的多类别目标识别方法,其特征在于:包括如下步骤:S1:将目标图像输入到搭建好的多尺度背景预测卷积神经网络,输出物体和背景的二分类结果以及多尺度目标的候选框大小、位置和类别;S2:将分类结果为物体的候选框通过高斯加权非极大值抑制算法,去除重复的候选框;S3:选择网络优化器,使用COCO数据集作为多尺度背景预测卷积神经网络的训练数据集,对多尺度背景预测卷积神经网络充分训练,得到训练好的多尺度背景预测卷积神经网络;S4:视觉摄像头采集视频文件,然后将采集的视频文件逐帧转换为彩色图像,并对彩色图像统一尺寸大小;S5:将训练好的多尺度背景预测卷积神经网络模型移植到基于龙芯芯片的嵌入式系统中完成对多类别目标的识别;步骤S1中多尺度背景预测卷积神经网络包括三个部分,其具体搭建方法如下:第一部分的搭建:第一部分包括一个输入层和三个卷积层,用于对数据进行卷积特征提取,第一部分的输入来自于COCO数据集,COCO数据集里的每一张图像送到输入层;输入层后面是第一部分的第一个卷积层;对于第一部分的第一个卷积层,由卷积层的输出尺寸计算公式计算得到第一部分的第一个卷积层的输出大小;在第一部分的第一个卷积层后使用线性整流函数作为激活函数,将经过激活函数的数据送入第一部分的第二个卷积层;第一部分的第二个卷积层后也使用线性整流函数作为激活函数,将经过激活函数的数据送入第一部分的第三个卷积层;第二部分的搭建:第二部分包括一个卷积层和一个全连接层;第一部分的第三个卷积层的输出用来输入到第二部分的第一个卷积层;第二部分的第一个卷积层后使用线性整流函数作为激活函数,将经过激活函数的数据送入第二部分的第一个全连接层,第二部分的第一个全连接层有2个神经元,对应物体和背景这2个目标类别,第二部分的第一个全连接层后面使用softmax函数,得到2个目标类别的置信度系数,置信度系数指目标类别的概率;设定一个阈值K1,如果物体的置信度系数大于K1或背景的置信度系数小于K1,则将第二部分的卷积层的输出送入第三部分的每一个卷积层中;第三部分的搭建:第三部分包括六个卷积层和两个全连接层,将由第二部分的卷积层的输出送入第三部分的第一个卷积层;第二部分的卷积层的输出使用线性整流函数作为激活函数,将经过激活函数的数据送入第三部分的第二个卷积层;第二部分的卷积层的输出也使用线性整流函数作为激活函数,将经过激活函数的数据送入第三部分的第三个卷积层;第二部分的卷积层的输出也使用线性整流函数作为激活函数,将经过激活函数的数据送入第三部分的第四个卷积层;第二部分的卷积层的输出也使用线性整流函数作为激活函数,将经过激活函数的数据送入第三部分的第五个卷积层;第二部分的卷积层的输出也使用线性整流函数作为激活函数,将经过激活函数的数据送入第三部分的第六个卷积层;第三部分的每一个卷积层后使用线性整流函数作为激活函数,将经过激活函数的数据送入第三部分的第一个全连接层,第三部分的第一个全连接层有N1个神经元,对应N1个目标类别,第三部分的第一个全连接层后面使用softmax函数,得到N1个目标类别的置信度系数,置信度系数指目标类别的概率;同时对经过激活函数的第三部分的第一个卷积层送入第三部分的第二个全连接层,第三部分的第二个全连接层有N2个神经元,对应N1个目标类别的候选框位置,每个候选框位置由坐标x,y,l,h确定,x代表候选框左上角顶点在多尺度背景预测卷积神经网络输入层的每一张图像中距离每一张图像左上角顶点的水平距离,y代表候选框左上角顶点在多尺度背景预测卷积神经网络输入层的每一张图像中距离每一张图像左上角顶点的竖直距离,l代表候选框的长度,h代表候选框的高度;步骤S5具体包括如下步骤:D1:将得到的统一尺寸大小的彩色图像输入多尺度背景预测卷积神经网络模型中进行识别目标;D2:多尺度背景预测卷积神经网络模型对每个目标都会生成1000个候选框,每个候选框都有对应的坐标位置x,y,l,h和目标类别的置信度系数;D3:调用OpenCV的Improcess及Caffemodel库文件,将训练完的多尺度背景预测卷积神经网络模型移植至基于龙芯芯片的嵌入式系统中,利用动态链接库,将程序运行所用到的库文件进行打包,执行编写好的脚本文件,完成对多类别目标的识别功能。
全文数据:
权利要求:
百度查询: 南京师范大学 基于多尺度预测CNN及龙芯芯片的多类别目标识别方法
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。