买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
申请/专利权人:重庆科技大学
摘要:本发明涉及人工智能技术领域,具体公开了一种城乡结合部违章建筑检测方法及系统,针对RetinaNet算法对数据集中图像边缘小目标待检物仍存在漏检现象的问题,本方法及系统在特征提取网络ResNet50的Stage1、Stage2模块阶段中加入注意力模块,同时在Stage3模块中加入并行空洞卷积模块进行多尺度特征融合获取全局特征信息,提升算法对城乡违章建筑的检测精度;为避免训练过程中出现梯度爆炸问题,将网络中的激活函数替换为Gelu。经试验验证了本方法及系统的可行性及有效性。
主权项:1.一种城乡结合部违章建筑检测方法,其特征在于,包括步骤:S1、改进RetinaNet模型以构建违章建筑检测模型;所述违章建筑检测模型包括主干网络和分类回归子网络,所述主干网络包括ResNet特征提取网络和特征融合网络;所述ResNet特征提取网络包括顺序连接的Stage0、Stage1、Stage2、Stage3、Stage4五个模块,Stage2、Stage3、Stage4模块的输出特征输入所述特征融合网络进行多尺度特征融合,得到融合特征图输入所述分类回归子网络进行类别判断与位置回归;Stage0模块对输入图像进行预处理再经过最大池化层后输入到Stage1模块中;Stage1模块包括1个第一BlockA模块、N1个BlockB模块和1个注意力模块,N1≥2;Stage2模块包括1个第二BlockA模块、N2个BlockB模块和1个注意力模块,N2≥2;Stage3模块包括1个第二BlockA模块、N3个BlockB模块和1个并行空洞卷积模块,N3≥2;Stage4模块包括1个第二BlockA模块和N4个BlockB模块,N4≥2;所述第一BlockA模块和所述第二BlockA模块采用不同卷积步长的BlockA模块的结构,所述BlockA模块根据卷积步长对输入的特征图进行下采样实现特征图尺度变换;所述BlockB模块的卷积步长为1,不改变输入特征图的宽度和高度只改变通道数;所述注意力模块分别沿水平方向和垂直方向进行编码保留特征的位置信息;所述注意力模块执行的操作为:首先,将C×H×W的输入特征Input经水平方向和垂直方向的平均池化后分别得到C×H×1和C×1×W的输出特征,C、H、W分别表示通道数、高度和宽度;然后,对水平方向C×H×1的输出特征进行维度变换后与垂直方向C×1×W的输出特征进行Concat操作,得到C×1×W+H的合并特征;然后,对C×1×W+H的合并特征进行卷积、BN层标准化和非线性激活函数获得Cr×1×W+H的输出特征,r为缩减率;然后,沿空间维度利用卷积重新将Cr×1×W+H的输出特征变为C×H×1和C×1×W,再使用sigmoid激活函数获得对应的注意力权重gh、gw;最后,将C×H×W的输入特征Input与注意力权重gh、gw相乘得到C×H×W的输出特征Output;所述并行空洞卷积模块使用多个并行的空洞卷积模块进行多尺度特征提取;所述并行空洞卷积模块执行的操作为:首先,将C×H×W的输入特征Input经1×1的卷积改变输入特征通道数后,经过BN层标准化得到特征I,同时经过BN层标准化加非线性激活函数得到第一尺度的特征A,同时经过BN层标准化加非线性激活函数得到第二尺度的特征B,同时经过BN层标准化加非线性激活函数得到第三尺度的特征C;然后,对特征A使用第一空洞卷积模块进行空洞卷积,再经过BN层标准化加非线性激活函数,获得特征D;对特征B使用第二空洞卷积模块进行空洞卷积,再经过BN层标准化加非线性激活函数,获得特征E;对特征C使用第三空洞卷积模块进行空洞卷积,再经过BN层标准化加非线性激活函数,获得特征F;然后,将多尺度的特征D、E、F在深度方向进行Concat操作获得多尺度融合特征G;最后,将多尺度融合特征G与特征I进行add相加操作,再经过非线性激活函数,得到C×H×W的输出特征Output;S2、构建数据集;S3、采用所述数据集对所述违章建筑检测模型进行训练及验证;S4、部署训练所得违章建筑检测模型。
全文数据:
权利要求:
百度查询: 重庆科技大学 一种城乡结合部违章建筑检测方法及系统
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。