买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
申请/专利权人:浙江大学
摘要:本发明公开了一种基于有效感受野(EffectiveReceptiveField,以下简称ERF)调控的水下声学目标识别方法,提出的AEU‑Net模型具有多个分辨率支路,每个分辨率支路拥有单独的卷积核,各自会在训练过程中在与分辨率匹配的前提下自适应调整尺寸;AEU‑Net模型包含一个可调控前向传播过程中有效感受野的ERF‑Server,其具有提升或降低指定的任一模块的特征图有效感受野的两种操作。本发明可以在多个交互维度捕获水声目标样本的声学物理信息,并进行多个尺度有效感受野信息的特征融合,以适应不同尺寸的声呐图像目标,提高对水下声学目标进行识别时的准确度和识别速度。
主权项:1.一种基于有效感受野调控的水下声学目标识别方法,其特征在于,包括以下步骤:S1:组建逐像素具有标签的水下声呐分割图像数据集;S2:以U-Net为基础构建并训练AEU-Net模型,具体通过如下子步骤实现:S2.1:将高分辨率网络的信息交互模块嵌入U-Net的每个单一分辨率模块中,使每个模块扩充为第一和第二两个分辨率支路;原始图像经过一个预处理卷积层后进行下采样,在下采样阶段,上一模块的第一支路输出通过跳越连接输入上采样阶段对应模块的第一支路中,所述对应模块的判断依据为特征图的分辨率相同;上一模块的第二支路输出分为两路,一路通过步长为1的残差块卷积后,作为下一模块的第一支路输入,另一路同时通过步长为2的残差块下采样后,作为下一模块的第二支路输入;在上采样过程中,上一模块的第一支路输出经过上采样后输入至下一模块的第一支路,上一模块的第一支路输出经过步长为1的残差块卷积后,作为下一模块的第二支路输入;将上采样阶段每一模块的第二支路输出在通道维度上进行拼接后,依次经过一维卷积和全连接层,输出分类标签;S2.2:对每个支路的卷积核,使用逐通道卷积进行重构,所述逐通道卷积具有自适应尺寸卷积核,其尺寸与各支路特征图分辨率匹配;所述逐通道卷积的一个卷积核负责一个通道,一个通道只被一个卷积核卷积,且卷积完成后的特征图通道数量与输入的通道数相同;自适应尺寸卷积核通过各自的损失函数控制核尺寸的大小;训练时自适应尺寸卷积核损失函数的更新逻辑为:自适应尺寸卷积核的损失函数根据每次训练不同类别样本的预测像素点与真实标签中像素点的差异,指导自适应卷积核进行核尺寸的选择与更新;基于训练时自适应尺寸卷积核损失函数的更新逻辑,将水下声呐分割图像数据集的识别目标人为设定分为第一目标物和第二目标物两类,若第一目标物的预测像素与其真实标签相比有误定位或填充不充分的情况,则对应损失函数变大,此时,增大自适应卷积核的核尺寸来降低损失函数;反之,若第二目标物的预测像素与真实标签相比有漏检或误判的情况,则对应损失函数变大,此时,通过减小自适应卷积核的核尺寸来降低损失函数;所述损失函数的表达式如下: 式中,kp为当前模块自适应卷积核的尺寸与第一目标、第二目标的预测偏差在量纲上归一化后的值;S2.3:构建用于实现跳越连接的ERF-Server网络支路,完成AEU-Net模型的构建;ERF-Server网络支路包括U-Serve和D-Serve两种操作,对于下采样每个模块输出的特征图表征,经过U-Serve的大核卷积块后得到有效感受野ERF提升后的新语义信息;对于下采样每个模块输出的特征图表征,经过D-Serve的固定尺寸为3*3的残差卷积块后,得到ERF降低后的新语义信息;将上采样阶段的对应模块的前一模块第一支路的上采样输出,以及U-Serve的输出、D-Serve的输出,按通道分配系数拼接至上采样阶段的对应模块中;所述通道分配通过通道分配系数实现,通道分配系数Ck是一个预设的超参数,是一个1*3的向量,每个分量介于0到1之间且总和为1,代表D-Serve输出、U-Serve输出和上采样阶段的对应模块的前一模块第一支路的上采样输出这三组特征图的比例,在分配时对通道数取整;S2.4:将水下声呐分割图像数据集输入AEU-Net中进行训练,得到训练好的AEU-Net模型;训练时自适应尺寸卷积核的核尺寸,在当前模块的特征图预设的核尺寸区间内进行调整,训练目标是使自适应尺寸卷积核的损失函数最小;S3:将待测试的水下声呐分割图像输入训练好的AEU-Net模型,得到识别结果。
全文数据:
权利要求:
百度查询: 浙江大学 一种基于有效感受野调控的水下声学目标识别方法
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。