基于姿态引导的人体图像生成方法

买专利卖专利找龙图腾，真高效！查专利查商标用IPTOP,全免费！专利年费监控用IP管家,真方便！

申请/专利权人：华南理工大学

摘要：本发明公开了一种基于姿态引导的人体图像生成方法，包括：1从条件人体图像中提取原人体姿态和原人体语义分割图；2将人体图像生成问题分解为两个阶段的问题；其中在第一阶段，输入条件人体图像和条件目标人体姿态，使用语义图生成网络预测得到目标人体语义分割图，并提取出条件人体图像的属性向量；3获得原人体图像中的外观信息；4将条件目标人体姿态和目标人体语义分割图融合输入人体图像渲染网络，输出最终生成的目标人体图像。本发明基于姿态信息进行人体图像的生成，生成符合目标姿态的人体图像，与现有方法相比提高了生成图像的姿态准确度，同时更好地保持了人体的外观属性，进一步可实现更灵活和精确的下游应用。

主权项：1.基于姿态引导的人体图像生成方法，其特征在于，包括以下步骤：1从单幅条件人体图像中提取原人体姿态和原人体语义分割图，包括以下步骤：从给定的条件人体图像Is中提取出原人体姿态Ps，原人体姿态是指与条件人体图像中人物相对应的人体姿态关键点；从给定的条件人体图像Is中提取出原人体语义分割图Ss，原人体语义分割图是指从条件人体图像上提取出来的对应的人体语义分割图；2将人体图像生成问题分解为两个阶段的问题，第一阶段先生成目标人体语义分割图，第二阶段再生成最终的目标人体图像；其中，在第一阶段，输入条件人体图像和条件目标人体姿态，根据前面提取的原人体姿态和原人体语义分割图，使用语义图生成网络预测得到目标人体语义分割图，并提取出条件人体图像的属性向量；语义图生成网络是在第一阶段根据原人体姿态、条件目标人体姿态、条件人体图像和原人体语义分割图这几个条件，预测得到目标人体语义分割图，其具体情况如下：将原人体姿态Ps和条件目标人体姿态Pt组合在一起，经过语义图生成网络的姿态特征编码器里的卷积神经网络提取出姿态特征Fp；将条件人体图像Is和原人体语义分割图Ss组合在一起，经过语义图生成网络的另一个图像特征编码器里的卷积神经网络提取出人体图像特征Fs；语义图生成网络提取出姿态特征Fp和人体图像特征Fs后，经过几层卷积层融合预测生成目标人体语义分割图在语义图生成网络训练过程中，使用了交叉熵损失来限制预测得到的目标人体语义分割图的像素级精度，其目标函数Lce表示为：式中，St表示训练过程中提供的真实目标人体语义分割图，表示由语义图生成网络预测生成的目标人体语义分割图，N表示目标人体语义分割图里一共划分了多少类别，c表示目标人体语义分割图里的第几个类别；为了增强语义图生成网络生成的目标人体语义分割图和条件人体图像之间的属性一致性，还让语义图生成网络同时预测一个属性向量对其应用了属性分类损失具体公式如下：式中，vi表示真实的条件人体图像对应的属性向量，M表示属性向量里一共包含了多少种类别，i表示属性向量里的第几个类别；第一阶段的语义图生成网络，训练时总的目标函数L1是交叉熵损失Lce和属性分类损失的加权和，具体公式如下：式中，λ1和λ2分别为平衡交叉熵损失和属性分类损失的权衡参数；3根据条件人体图像和原人体语义分割图获得原人体图像中的外观信息，包括以下步骤：3.1给定条件人体图像Is作为输入，通过一个由多个卷积层和一个平均池化层组成的纹理编码模块ET来提取人体每个部位的外观信息，得到外观编码，具体表示为：式中，是指输入的条件人体图像的第i个部位，是指从条件人体图像的第i个部位提取出来的外观编码；3.2将得到的不同部位的外观编码进行组合，形成一个统一的外观矩阵，通过外观矩阵能够在后续的人体图像渲染网络对最终生成的目标人体图像中的人体的不同部位进行渲染；4将条件目标人体姿态Pt和第一阶段预测得到的目标人体语义分割图融合送入人体图像渲染网络，依次经过人体图像渲染网络里面的卷积网络和多层残差网络，不断地注入前面提取的属性向量和外观矩阵，最终输出目标人体图像对于人体图像渲染网络，通过最小化生成的目标人体图像和真实人体图像It之间的L1距离以保持内容一致性，其定义的像素损失Lpixel表示为：为了提高生成图像的真实性，在人体图像渲染网络中还引入感知损失来计算生成的目标人体图像与真实人体图像It之间提取的特征的距离，其感知损失Lper表示为：式中，Φj·是指利用网上公开预先训练好的VGG-19模型的第j层网络提取出来的特征；在人体图像渲染网络里设置了两个不同的判别器Da和Dp应用于不同的目的，分别侧重于在外观和姿态方面的监督，促使生成的目标人体图像具有逼真的外观和与条件目标人体姿态一致的姿态，其对抗性损失Ladv表示为：式中，E*表示分布函数的期望值，Is代表条件人体图像；在人体图像渲染网络也有为了增强最终生成的目标人体图像和条件人体图像之间的属性一致性而应用的属性分类损失具体公式如下：式中，vi表示真实的条件人体图像对应的属性向量，表示生成的目标人体图像对应的属性向量，M表示属性向量里一共包含了多少种类别，i表示属性向量里的第几个类别；因此，人体图像渲染网络训练时总的目标函数L2为像素损失、感知损失、对抗性损失和属性分类损失的加权和，其表示为：式中，λ3、λ4、λ5和λ6分别为四个损失项的加权参数。

全文数据：

权利要求：

百度查询：华南理工大学基于姿态引导的人体图像生成方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：一种两系杂交谷子小面积制种快速隔离装置

下一篇：一种变电站的预制基础

相关技术

一种两系杂交谷子小面积制种快速隔离装置

一种变电站的预制基础

一种移动式可调节安全通道

复音口琴

幕墙边框型材

一种镜头组

一种无纺设备针刺机主轴

一种带轧制压力检测装置的三辊精密轧机

一种纺织用织布印花包装装置

一种两用吸氧装置

炮控系统性能验证装置

一种离子迁移谱仪的校准结构

人体相关技术

基于人体姿态的屏幕调节方法_武汉攀升鼎承科技有限公司_202410720513.3

人体阻抗检测电路、芯片、装置以及智能设备_芯海科技(深圳)股份有限公司_202010152453.1

一种人体运动健康监测系统及其方法_江苏中科优胜科技有限公司_202411019185.0

一种节能型人体感应吸顶灯_东莞市旭信电子科技有限公司_202323406598.8

人体跌倒的检测方法、系统、设备及介质_深圳市联影高端医疗装备创新研究院_202310217010.X

一种提升人体新陈代谢的组合物_北京华夏民医国际癌症医学研究院_202410558401.2

一种八电极人体阻抗心率监测装置_杭州晶华微电子股份有限公司_202323212401.7

一种人体感应控制器_杭州沃伦米智能科技有限公司_202420208249.0

一种人体模型充气包_广州博瑞恒科技有限公司_202420148396.3

用于识别人体组织内生物学变化的系统_珀加索斯医疗股份公司_201980071258.1

引导相关技术

一种机床的引导机构_西宁觅擎科技有限公司_202323119732.6

一种尿意引导盆_呷茸央青_202322879879.9

安装系统及部件补给引导方法_株式会社富士_202280089312.7

一种线缆加工引导装置_薛松波_202420388254.4

铜线材的校直引导设备_浙江永旺焊材制造有限公司_202420128548.3

用于传送带的引导系统_系统陶瓷股份公司_202380019966.7

协作式交通工具前灯引导_高通股份有限公司_202080092430.4

一种用于穿刺的激光引导穿刺装置_湖南朗润智慧医疗科技有限公司_202410669182.5

对风险交易进行引导举报的方法和装置_支付宝(杭州)信息技术有限公司_202210209088.2

基于CT引导的DSA激光辅助定位系统_赛诺威盛科技(北京)股份有限公司_202111391690.4

图像相关技术

图像处理装置和图像处理方法_株式会社御牧工程_202380017725.9

图像处理装置、图像处理方法及记录介质_富士胶片株式会社_202410212626.2

图像解码设备、图像编码设备和发送设备_LG电子株式会社_202410785384.6

图像显示装置、图像显示方法以及记录介质_富士胶片株式会社_202410212624.3

图像处理方法、图像处理装置、设备以及存储介质_深圳市商汤科技有限公司_202410490964.2

一种图像处理方法、图像处理芯片_上海为旌科技有限公司_202410132844.5

图像分割、图像分割模型训练的方法及设备_阿里巴巴达摩院(杭州)科技有限公司_202410453022.7

图像传感器_三星电子株式会社_202410191551.4

图像转换方法_香港科技大学_202410215988.7

图像读取装置_精工爱普生株式会社_202211180640.6

龙图腾网&IPTOP

设置信息完成注册

手机号绑定多个账号

基于姿态引导的人体图像生成方法

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务