首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

一种基于改进RetinaNet的自然果园场景下的凤梨成熟度检测方法 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

申请/专利权人:华南农业大学

摘要:本发明公开了一种基于改进RetinaNet的自然果园场景下的凤梨成熟度检测方法,包括步骤:采集自然果园场景下凤梨图像数据,经过图像预处理后,建立凤梨图像库;构建基于RetinaNet的网络模型结构;改进RetinaNet,构建ECA‑RetinaNet凤梨检测网络;导入训练数据集对ECA‑RetinaNet,选择焦点损失函数来编译模型进行训练,获取检测凤梨成熟度的最优模型;利用测试集进行测试,通过ECA‑RetinaNet模型对凤梨图像进行成熟度检测。本发明可以快速且准确的定位凤梨位置并且分类凤梨的成熟度,能够提供成熟凤梨分布信息,有助于合理安排劳动力,从而降低收割成本,促进精准农业的发展。

主权项:1.一种基于改进RetinaNet的自然果园场景下的凤梨成熟度检测方法,其特征在于,包括步骤:S1、采集自然果园场景下凤梨图像数据,经过图像预处理后,建立凤梨图像库,所述凤梨图像库包括训练数据集、验证数据集和测试数据集;S2、构建基于RetinaNet的网络模型结构,包括步骤:S21、选择ResNet50作为主干特征网络,将600×600×3大小的凤梨图片传入ResNet50网络;ResNet50其包含ConvBlock和IdentityBlock两个基本块;ConvBlock的输入维度和输出维度不同,其有改变网络维度的功能,将输入图片长和宽进行压缩;IdentityBlock的输入和输出维度相同,其有加深ResNet50网络深度的功能;其中需要取出长宽压缩了3次、4次、5次的结果来进行步骤S22特征金字塔结构的构造;S22、通过步骤S21获得到的特征后经过特征金字塔FPN的处理,主干特征提取网络通过步骤S21后获得3个不同感受野的特征层C3、C4、C5,通过特征金字塔FPN,获得了5个有效特征层,包括有效特征层P3、P4、P5、P6、P7,其具体内容为以下:特征层C5通过了一次步长为2,通道数为256的卷积得到有效特征层P6,有效特征层P6会将图像划分为10×10的网格进行预测;在有效特征层P6的基础上进行一个ReLU激活函数的操作后,再进行一次步长为2,通道数为256的卷积得到有效特征层P7,有效特征层P7会将图像划分为5×5的网格进行预测;特征层C5经过一次通道数为256的卷积,卷积后的结果有2个应用方向;其中一个方向是进行了一次通道数为256的卷积得到有效特征层P5,有效特征层P5会将图像划分为19×19的网格进行预测;另一个应用方向是进行上采样,上采样的结果再与特征层C4进行了一次通道数为256的卷积后的结果相加;相加后的结果有2个应用方向,其中一个方向是进行一次卷积获得有效特征层P4,有效特征层P4会将图像划分为38×38的网格进行预测;另一个应用方向是再进行一次上采样,上采样的结果再与特征层C3进行了一次通道数为256的卷积后的结果相加,相加后的结果进行一次卷积获得有效特征层P3,有效特征层P3会将图像划分为75×75的网格进行预测;S23、通过步骤S22获得了5个有效特征层,包括有效特征层P3、P4、P5、P6、P7,利用这5个有效特征层传输入classsubnet分类子网层和boxsubnet边界框回归子网层获得预测结果;classsubnet采用4次256通道的卷积和1次num_anchors×num_classes的卷积,num_anchors指的是该特征层所拥有的先验框数量,num_classes指的是网络一共对多少类的目标进行检测;将输出结果经过一个Sigmoid函数,将预测概率固定到0-1之间;boxsubnet采用4次256通道的卷积和1次num_anchors×4的卷积,num_anchors指的是该特征层所拥有的先验框数量,4指的是先验框的调整情况;S3、在步骤S2得到的初步网络结构的基础上,改进RetinaNet,构建ECA-RetinaNet凤梨检测网络,包括步骤:S31、将ECA模块嵌入classsubnet中,将特征金字塔的每层特征在分类子网络中再次进行提炼,其中所述ECA模块构造包括步骤:S311、对从步骤S2中输入进来的有效特征层P3、P4、P5、P6、P7进行全局平均池化;S312、进行一个1D卷积,1D卷积的计算方法是:若输入数据维度为8,过滤器的维度为5,则卷积后输出的数据维度为4;S313、取一次Sigmoid函数将值固定到0-1之间,获得输入特征层每一个通道的权值,所述权值在0和1之间;S314、将所述权值乘上原输入特征层;S32、将精炼过得到的特征图通过4次256通道的卷积和1次num_anchors×num_classes的卷积,num_anchors指的是该特征层所拥有的先验框数量,num_classes指的是网络一共对多少类的目标进行检测,将输出结果经过一个Sigmoid函数,输出最终的凤梨成熟度分类结果;S4、导入S1得到的训练数据集对S3中得到的ECA-RetinaNet选择焦点损失函数来编译模型进行训练,获取检测凤梨成熟度的最优模型;S5、利用S1得到的测试数据集进行测试,通过ECA-RetinaNet模型对凤梨图像进行成熟度检测。

全文数据:

权利要求:

百度查询: 华南农业大学 一种基于改进RetinaNet的自然果园场景下的凤梨成熟度检测方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。