北京理工大学刘福祥获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉北京理工大学申请的专利一种基于深度孪生自注意力网络的复杂目标识别方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN119399545B 。
龙图腾网通过国家知识产权局官网在2025-07-18发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202411572324.2,技术领域涉及:G06V10/764;该发明授权一种基于深度孪生自注意力网络的复杂目标识别方法是由刘福祥;李函潞;李磊设计研发完成,并于2024-11-06向国家知识产权局提交的专利申请。
本一种基于深度孪生自注意力网络的复杂目标识别方法在说明书摘要公布了:本发明公开了一种基于深度孪生自注意力网络的复杂目标识别方法,涉及目标识别方法技术领域。本发明应用基于滑窗多头自注意力变换机制的孪生网络,增强了特征提取网络的全局建模能力以及长距离语义信息的获取效率,改善了底层特征提取能力和高级语义信息的抽象效果;孪生网络个性化建模,改善了特征分割效果;网络整体构成U型结构,局部对称的编码器解码器结构,补充全局上下文信息,强化了语义信息空间关联;加入了残差链接,以高效率训练深层网络,增强识别精度;并通过加入自适应图像特征尺度输入处理,对输入图像进行自适应尺度变换,实现了端到端语义分割精确结果,并实现了多尺度输入以增强网络模型的泛化能力及精确度。
本发明授权一种基于深度孪生自注意力网络的复杂目标识别方法在权利要求书中公布了:1.一种基于深度孪生自注意力网络的复杂目标识别方法,其特征在于,所述深度孪生自注意力网络包括: 孪生编码网络可解释高维图像信息,用以增强个体特征建模,改善分割性能,增强模型泛化性; 基于残差连接的滑窗自注意力变换模块,用以增强网络模型对不同尺寸物体的识别能力及增强全局长距离语义信息空间的关联性; 图像尺寸自适应模块,用以解决基于滑窗自注意力机制固定限制; 局部对称的基于层级深层滑窗自注意力机制变换编码解码器结构网络,其包括孪生编码网络与解码器,孪生编码网络包括不同层级的Down模块,解码器包括不同层级的Up模块; 多个跳跃连接,用于直接连接编码器和解码器的对应层,以保留并传递高分辨率的特征信息; 融合损失函数,用以同时改善识别精度及分类平衡性; 所述方法具体包括以下步骤: S1、将高维图像信息首先分离成两通道维度,每个通道分别输入孪生编码网络的两个子编码网络进行特征提取;首先各通道特征输入孪生编码网络其中的卷积模块,初步提取图像特征;再输入孪生编码网络中多个包含残差连接的残差模块结构Down模块,输入图片首先进行自适应scaleadaptive; S2、将经S1处理的图像输入一系列基于残差连接的滑窗自注意力变换模块中进一步提取和处理特征,再经图像尺寸自适应模块处理后将输出的特征图尺寸还原; S3、孪生编码网络每阶段同时通过下采样生成不同深度的特征图,并且针对蕴含更丰富信息输入通道的子编码网络,记录其每个编码阶段中特征以及原图像分辨率特征; S4、编码阶段结束,将两个子编码网络的分支通道融合,即将孪生编码网络中的孪生通道,各通道提取出的特征图进行融合拼接; S5、将S4所得融合图像输入解码器中多个包含残差连接的残差模块结构Up模块,图像经过上采样后,逐步还原至输入尺寸的特征图; S6、在每个解码阶段使用特征融合技术,结合S3中层级编码器的高分辨率特征和S5中解码器的上采样特征; S7、解码阶段,经S6特征融合后,重复S1-S2; S8、将S7中所得最后阶段的特征图输入分割头,对每个像素进行分类,将像素分为预先确定的类别,得到语义分割识别结果; S9、利用融合损失函数对S8中所得的语义分割识别结果进行计算,反向传播改进网络参数。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人北京理工大学,其通讯地址为:100081 北京市海淀区中关村南大街5号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。