长春工业大学张秀梅获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉长春工业大学申请的专利一种基于轻量化多尺度注意力机制的果实目标检测方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN120259793B 。
龙图腾网通过国家知识产权局官网在2025-11-25发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202510742480.7,技术领域涉及:G06V10/764;该发明授权一种基于轻量化多尺度注意力机制的果实目标检测方法是由张秀梅;俞智航;李慧;姜志宇;黄春梅设计研发完成,并于2025-06-05向国家知识产权局提交的专利申请。
本一种基于轻量化多尺度注意力机制的果实目标检测方法在说明书摘要公布了:本发明公开一种基于轻量化多尺度注意力机制的果实目标检测方法,该方法涉及计算机视觉和深度学习以及智能农业融合领域。首先以RetinaNet为架构,采用轻量化主干网络ShuffleNetV2并结合改进的多尺度注意力机制,构建LMSA‑ReNet模型。通过引入知识蒸馏机制与结构稀疏正则策略,对构建的LMSA‑ReNet模型进行训练,最后使用训练好的模型在果园中进行果实目标检测。与其他方法相比,本方法能够降低模型计算成本,同时提升果实目标的检测精度,面对果园复杂的实际环境中实现快速目标检测。
本发明授权一种基于轻量化多尺度注意力机制的果实目标检测方法在权利要求书中公布了:1.一种基于轻量化多尺度注意力机制的果实目标检测方法,其特征在于,包括如下步骤: 步骤1:使用图像采集设备在晴天、阴天、雾霾天不同光照条件下,以多角度、多时段采集果实图像;采用Labelimg标注工具对图像中果实目标进行矩形边界框标注,标记果实位置、类别及遮挡情况,构建果园果实数据集; 步骤2:对数据集进行格式转换、分辨率调整和归一化;在清洗过程中剔除低质量与重复图像,修正标注文件;通过几何变换、颜色扰动和模糊处理进行增强,构建遮挡、低光和雾霾复杂环境样本;将数据划分为训练集、验证集和测试集,其中训练集包含清晰与复杂图像,分别用于教师网络与学生网络训练; 步骤3:构建一种基于RetinaNet架构的轻量化多尺度注意力模型LMSA-ReNet,主干网络采用ShuffleNetV2作为轻量级主干网络,替代传统RetinaNet中的ResNet50;并在主干网络与特征金字塔网络间引入改进的多尺度注意力机制,其由多尺度通道注意力和多尺度空间注意力两个模块组成; 轻量级主干网络ShuffleNetV2通过通道分割、逐点卷积、深度可分离卷积和通道洗牌组成,其计算流程如下: X1,X2=SplitXin,2, 其中X1,为分割后的通道特征图,Split为通道分割操作,为输入特征图,H、W、C分别为特征图的高度、宽度、通道数; Y=ShuffleConcatX1,Wp2*SiLUWd*SiLUWp1*X2, 其中为输出特征图,Wp1为1×1逐点卷积的权重矩阵,Wp2为第二次1×1逐点卷积的权重矩阵,Wd为3×3深度可分离卷积的权重矩阵,Shuffle为通道洗牌操作,Concat为通道拼接操作,SiLU为Swish激活函数,其表达式为: 多尺度通道注意力模块通过全局平均池化、全局最大池化、全局标准差池化提取多尺度通道特征,将三者拼接后经自适应门控机制,生成通道注意力权重;多尺度通道注意力模块表达式如下: 其中是第c通道的全局平均池化值,Yci,j为输入特征图Y第c通道空间位置i,j的值; 其中是第c通道的全局最大池化值; 其中是第c通道的全局标准差池化值; 其中为三种通道统计特征的拼接操作,为将三种通道特征拼接后的通道描述向量; Mc=σWc2·δWc1·αc, 其中为通道注意力权重,为通道注意力中第一、二层全连接层的参数矩阵,为压缩通道维度,r为通道压缩率,δ为ReLU激活函数,σ为Sigmoid函数; 多尺度空间注意力模块利用通道维度上的平均池化与最大池化生成初步空间响应图,结合多组空洞卷积提取不同感受野下的空间上下文信息,并引入全局上下文调制,生成空间注意力权重;多尺度空间注意力模块表达式如下: 其中为每个空间位置i,j在所有通道上的平均响应值,C为输入特征图的通道总数; 其中为每个空间位置i,j在所有通道上的最大响应值; αs=concattsavg,tsmax, 其中为沿通道维度拼接后的张量,为将两幅H×W的图在通道维度拼接形成H×W×2的张量; 其中为融合三种感受野后得到的局部空间上下文特征图,d=1,2,3为三种不同感受野,为对三种空洞率卷积结果逐像素相加,为使用空洞率为d的3×3空洞卷积操作; 其中为全局上下文信息,BN为归一化; Ms=σtshdc+tsgc, 其中空间注意力权重; 最终多尺度注意力机制的表达式为: 其中为经过改进的多尺度注意力机制增强后的特征图输出,为逐元素乘法操作; 步骤4:对构建好的LMSA-ReNet果实检测模型进行训练,引入知识蒸馏机制,构建“教师-学生”双网络结构;教师网络与学生网络分别在在清晰图像与复杂图像上训练,通过特征蒸馏、类别蒸馏与结构稀疏正则化,从教师网络中迁移多尺度语义特征与类别分布信息; 教师网络以RetinaNet为框架,ResNet50为主干网络,输出主干特征图C3t~C5t,经特征金字塔网络融合输出特征图P3t~P5t;其中C3t~C5t与P3t~P5t作为蒸馏目标指导学生网络特征学习,通过以下分类损失和回归损失两类损失函数优化模型: 其中pt为根据真实类别标签y调整后的预测概率,y∈{0,1}为真实类别标签,y=0为背景,y=1为目标,p∈[0,1]为网络输出的原始目标类别预测概率; 其中为分类损失,α∈0,1为类别平衡因子,γ≥0为调制因子; 其中为边界框回归损失,tpred为预测边界框的坐标,tgt为真实边界框的坐标,x=tpred-tgt为预测边界框与真实边界框的坐标差; 其中为最终教师网络的总损失函数; 学生网络采用改进的LMSA-ReNet模型,主干网络为ShuffleNetV2;主干输出多尺度特征图C3s~C5s,经多尺度注意力机制处理后得到增强特征图输入特征金字塔网络生成多尺度融合特征图P3s~P5s;训练时学生网络通过特征蒸馏对齐增强特征图与教师网络对应主干特征图C3t~C5t,同时对齐特征金字塔网络输出的P3s~P5s与教师网络的P3t~P5t,并结合类别蒸馏与结构稀疏正则化,实现多重知识迁移; 步骤5:将训练完成的模型导出为适用于边缘设备的推理格式,部署至配备摄像头的农业机器人、无人机或监控终端中,实现果园图像采集与实时推理,系统可输出果实的类别、位置与置信度,支持结果可视化及上传至农业管理平台,实现果实自动识别与计数,并辅助开展路径规划、成熟度评估与病虫害监测智能农业任务。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人长春工业大学,其通讯地址为:130012 吉林省长春市朝阳区湖西街道延安大街2055号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励