浙江工业大学卢书芳获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉浙江工业大学申请的专利一种基于姿态引导、风格和形状特征约束的人体图像生成方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN113160035B 。
龙图腾网通过国家知识产权局官网在2025-07-08发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202110413125.7,技术领域涉及:G06T3/04;该发明授权一种基于姿态引导、风格和形状特征约束的人体图像生成方法是由卢书芳;卢富男;朱翔;寿旭峰;陶相艳;高飞设计研发完成,并于2021-04-16向国家知识产权局提交的专利申请。
本一种基于姿态引导、风格和形状特征约束的人体图像生成方法在说明书摘要公布了:本发明公开了一种基于姿态引导、风格和形状特征约束的人体图像生成方法,包括:1采集获取源人体图像Is和目标人体图像It,计算其姿态图像Ps、Pt和人体语义分割图像Ss、St;2构建生成器G和判别器DI、DP;3将Is和Ss输入风格编码器,Pt输入姿态编码器,St输入形状编码器;把得到的风格特征、姿态特征和形状特征输入解码器中,获得虚拟目标人体图像If;4把Is,It和Is,If作为判别器DI的输入,把Pt,It和Pt,If作为判别器DP的输入,分别计算对抗损失,并基于If和It计算图像重建损失、感知损失和语义损失,优化G;5迭代训练,得到生成器G,进行人体图像生成的应用。利用本发明,可以按语义区域提取风格特征,控制人体图像的姿态和形状。
本发明授权一种基于姿态引导、风格和形状特征约束的人体图像生成方法在权利要求书中公布了:1.一种基于姿态引导、风格和形状特征约束的人体图像生成方法,其特征在于,包括以下步骤: 1采集获取源人体图像Is和目标人体图像It,根据源人体图像和目标人体图像分别获得其姿态图像Ps、Pt和人体语义分割图像Ss、St;姿态图像的关键点个数N=18,人体语义分割图像的类别个数C=8; 2构建生成器G和判别器DI、DP,其中,生成器G包括风格编码器Encoderstyle、姿态编码器Encoderpose、形状编码器Encodershape和解码器Decoder;判别器DI用于判别生成的虚拟目标图像If与源人体图像Os之间的纹理相似性;判别器DP用于判别生成的虚拟目标图像If与目标姿态Pt的一致性;具体步骤为: 2-1构建风格编码器Encoderstyle Encoderstyle包含5个3×3卷积层和已经预训练的VGG网络,前4个卷积层提取出的特征图大小分别对应VGG中{1_1,2_1,3_1,4_1}层的特征图大小;依次组合卷积层提取的特征和VGG网络提取的特征,再输入下一个卷积层;最后一个卷积层,把特征从1024维映射到64维; 使用时,首先使用语义分割图像分割出8个独立的图像接着把8个独立的语义图像分别输入Encoderstyle中输出对应的风格特征,最后将它们依次级联,得到最终的512维的风格特征; 2-2构建姿态编码器Encoderpose和形状编码器Encodershape Encoderpose和Encodershape的网络结构相同,都包括4个3×3卷积层,激活层为ReLU层,提取512维的姿态特征和形状特征; 2-3构建解码器Decoder 以姿态特征作为输入,使用风格特征和形状特征计算归一化参数;先经过4个ResBlock,保持通道不变;接着经过3组上采样层和ResBlock层;除了最后一层激活层为tanh,其余激活层皆为ReLU层; 2-4构建判别器DI、DP 使用PatchGAN作为判别器,包括4个3×3卷积层和3个残差块,判别器的Dropout设置为0.5; 3将步骤1中得到的源人体图像Is和源人体语义分割图像Ss输入风格编码器Encoderstyle,目标姿态图像Pt输入姿态编码器Encoderpose,目标人体语义分割图像St输入形状编码器Encodershape; 把依次提取得到的风格特征、姿态特征和形状特征输入解码器Decoder中,获得虚拟目标人体图像If; 4把Is,It和Is,If分别作为判别器DI的输入,把Pt,It和Pt,If分别作为判别器DP的输入,分别计算对抗损失Ladv,并基于If和It计算图像重建损失Lreconstruction、感知损失Lperceptual和语义损失LCX,优化G;对抗损失函数的定义为: 式中,E表示期望; 图像重建损失Lreconstruction是虚拟目标图像和真实目标图像之间的L1损失,定义为: Lreconstruction=||GIs,Ss,Pt,St-It||1 图像感知损失定义为: 其中,表示格拉姆矩阵,表示用预训练的VGG19网络提取的It的第l层特征图,l=relu{3_2,4_2}; 语义损失LCX定义为: 式中,表示用预训练的VGG19网络提取的If的第l层特征图; 5循环步骤3和步骤4,达到预设的迭代次数后,获得训练好的生成器G,并用于现实场景中虚拟目标图像的生成。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人浙江工业大学,其通讯地址为:310014 浙江省杭州市下城区潮王路18号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。