恭喜西安理工大学赵明华获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网恭喜西安理工大学申请的专利基于注意力引导的多尺度上下文信息交互的语义分割方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN115115831B 。
龙图腾网通过国家知识产权局官网在2025-03-28发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202210600487.1,技术领域涉及:G06V10/26;该发明授权基于注意力引导的多尺度上下文信息交互的语义分割方法是由赵明华;郅宇星;李军怀;都双丽;胡静;石程;尤珍臻;王琳设计研发完成,并于2022-05-30向国家知识产权局提交的专利申请。
本基于注意力引导的多尺度上下文信息交互的语义分割方法在说明书摘要公布了:本发明公开了一种基于注意力引导的多尺度上下文信息交互的语义分割方法,首先将公共数据集CamVid中所有图像数据划分为训练集、验证集及测试集,然后对训练集的所有图像数据进行数据增强和预处理操作;使用残差结构构造ResNet50网络模型;使用注意力机制和深度可分离卷积构造注意力引导模块,使用全局平均池化构造池化单元;将城市场景图像上采样二倍和下采样二倍,然后使用ResNet50模型提取深度特征,最后提取图像的多尺度特征;最终输出语义分割的结果。本发明解决了现有技术中存在的街道场景语义分割中的多尺度分割受限和单一的串行连接导致的类内分割不一致问题。
本发明授权基于注意力引导的多尺度上下文信息交互的语义分割方法在权利要求书中公布了:1.基于注意力引导的多尺度上下文信息交互的语义分割方法,其特征在于,具体按照以下步骤实施:步骤1、将公共数据集CamVid中所有图像数据划分为训练集、验证集及测试集,然后对训练集的所有图像数据进行数据增强和预处理操作;步骤2、使用残差结构构造ResNet50网络模型;使用注意力机制和深度可分离卷积构造注意力引导模块,使用全局平均池化构造池化单元;所述步骤2具体按照以下步骤实施:步骤2.1、构造残差模块:首先使用64个1×1的卷积和ReLU函数降维,然后使用3×3的卷积和ReLU函数提取特征,最后使用256个1×1的卷积和ReLU函数恢复维度;步骤2.2、ResNet50的结构表,首先使用64个7×7、步长为2的卷积提取特征,然后使用16个残差模块,其中残差结构使特征矩阵隔层相加;步骤2.3、使用深度卷积单元和注意力头单元构造注意力引导模块,深度卷积单元首先使用全局平均池化层提取ResNet50输出特征图x的通道维的平均值x',然后使用两组深度可分离卷积单元提取x'的深度特征x”,深度可分离卷积单元的组成依次为3×3逐深度卷积层、批归一化层、ReLU激活层、3×3逐点卷积层、批归一化层、ReLU激活层,最后对x”使用二倍上采样得到特征x”';步骤2.4、注意力引导模块中的注意力头单元首先使用两组注意模块计算x'的通道注意力图y,注意模块组成为3×3卷积层、批归一化层、ReLU激活层,然后对通道注意力图y使用1×1卷积和Sigmoid激活得到特征y',最后将特征y'和步骤2.3中的特征x”逐元素相乘得到注意力引导模块的输出特征;步骤2.5、构造池化单元,对输入的特征图x依次使用全局平均池化、1×1卷积、批归一化、ReLU激活得到输出特征图xg;步骤3、首先将城市场景图像S1上采样二倍和下采样二倍,得到图像S2和S3,然后使用ResNet50模型提取S1,S2,S3的深度特征,记为S1',S2',S3',提取S1的第三层特征记为Sl,最后使用基于注意力引导的多尺度交互编码网络提取图像的多尺度特征FS;步骤4、将多尺度特征FS与S1的第三层特Sl依次进行拼接、卷积和四倍上采样积操作,逐渐恢复图像分辨率,最终输出语义分割的结果;步骤5、使用训练集和验证集对模型进行训练,在测试集上验证模型的分割效果。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人西安理工大学,其通讯地址为:710048 陕西省西安市碑林区金花南路5号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。