Document
拖动滑块完成拼图
首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

一种基于通用注意力机制ESP-CA的人像抠图方法 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

申请/专利权人:浪潮智能终端有限公司

摘要:一种基于通用注意力机制ESP‑CA的人像抠图方法,涉及图像处理技术领域,构建的e‑ASPP‑a模块可以增强高级语义表示能力,提升人像分割效果,e‑ASPP‑a模块中的ESP‑CA模块可实现兼顾通道注意力和全局空间注意力的重要特征关注,提升神经网络特征提取的效率和质量,减少网络深度并显著提高人像抠图等任务的性能。ESP‑CA模块中精心设计的权重分配机制,有助于减少冗余的计算,提升模型的计算效率。

主权项:1.一种基于通用注意力机制ESP-CA的人像抠图方法,其特征在于,包括如下步骤:S1.获取O张包含全身人像和半身人像的图像作为前景图像,第i张前景图像为Fi,i∈{1,2,…,O},获取N张背景图像,第j张背景图像为Bj,j∈{1,2,…,N};S2.将O张前景图像中的人像进行抠图,得到O张Alpha遮罩图像,第i张遮罩图像为αi,i∈{1,2,...,O},将O张前景图像与N张背景图像随机合成,得到O×N张合成图像构成的图像集合P,P={P1,P2,...,Pi,...,PO×N},Pi为第i张合成图像,i∈{1,2,...,O×N};S3.将图像集P划分为训练集、验证集、测试集;S4.将训练集中第i张合成图像Pi进行随机数据增强和预处理,得到预处理后的图像Pi′,i∈{1,2,...,O×N},所有预处理后的图像构成图像集P′,P′={P1′,P2′,...,Pi′,...,PO×N′};S5.构建MODNet-A模型,将第i张预处理后的图像Pi′输入到MODNet-A模型中,输出得到人像遮罩FMf;步骤S5包括如下步骤:S5-1.构建由MODNet模型S分支的Encoder编码器、e-ASPP-a模块构成的MODNet-A模型;S5-2.将第i张预处理后的图像Pi′输入到MODNet模型S分支的Encoder编码器中,输出得到Shallow特征FMlatent,为实数空间,c为通道数,h为特征FMlatent的高,w为特征FMlatent的宽;S5-3.将特征FMlatent输入到e-ASPP-a模块的第一卷积层中,输出得到特征FM1,S5-4.将特征FM1按照通道数c拆分为c4个分支,第i个分支为FM2-i,i∈{1,2,...,c4},将第i个分支FM2-i分别输入到e-ASPP-a模块的M个空洞卷积层中,将M个空洞卷积层的输出结果进行拼接操作,得到特征FM3-n,S5-5.将特征FM3-n输入到e-ASPP-a模块的ESP-CA模块中,输出得到加权特征FM4-n,S5-6.将特征FM4-n输入到e-ASPP-a模块的第二卷积层中,输出得到深度可分离卷积的中间结果FM5-n,S5-7.将c4个分支的深度可分离卷积的中间结果进行拼接操作,得到特征FM6,S5-8.将特征FM6输入到e-ASPP-a模块的第三卷积层中,输出得到语义估计人像遮罩FMf;步骤S5-5包括如下步骤:S5-5-1.将FM3-n沿特征空间的x方向进行平均池化,得到特征FMx,将FM3-n沿特征空间的y方向进行平均池化,得到特征FMy,S5-5-2.将特征FMx进行宽高维度的倒置操作,得到倒置后的特征FMx′,将特征FMx′与特征FMy按照高纬度进行拼接操作后得到特征FMc1,S5-5-3.将特征FMc1的所有维度进行倒置操作,得到特征FMc2,S5-5-4.将特征FMc2输入到ESPBlock中,输出得到特征FMesp,S5-5-5.将特征FMesp的所有维度进行倒置操作后进行拆解,得到特征FMc3和特征FMc4,S5-5-6.通过公式FMmid=FMc4⊙FM3-n计算得到特征FMmid,式中⊙为Hadamard乘积;S5-5-7.将特征FMmid进行全局平均池化操作,得到特征FMs-a,将特征FMmid进行全局最大池化操作,得到特征FMs-m,S5-5-8.将特征FMs-a输入到2层感知机sharedMLP中进行挤压激发操作,将挤压激发操作的结果输入到SiLU激活函数中,得到特征FMs1,将特征FMs-m输入到2层感知机sharedMLP中进行挤压激发操作,将挤压激发操作的结果输入到SiLU激活函数中,得到特征FMs2,S5-5-9.将特征FMs1与特征FMs2进行Hadamard乘积操作,得到加权特征FM4-n。

全文数据:

权利要求:

百度查询: 浪潮智能终端有限公司 一种基于通用注意力机制ESP-CA的人像抠图方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。