Document
拖动滑块完成拼图
首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

一种对AIGC生成数字人姿态干预和纠正的方法 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

摘要:本发明涉及AIGC应用技术领域,并提供一种对AIGC生成数字人姿态干预和纠正的方法,包括以下步骤:S1:采用接收图像数据和进行亮度调整的图像数据获取模块;S2:采用惯性传感器针对惯性动捕,对人体主要骨骼部位的运动进行实时测量;从传感器数据获取加速度信息获取、陀螺仪数据,根据上面获取到的数据进行姿态估计,根据加速度计和陀螺仪测量值,可以计算出姿态角的增量,S3:通过Mediapipe人体分割模块进行自上向下和自下向上的检测。本发明通过多模块数据获取和多层特征提取编码技术,实现对人体姿态的精细捕捉和高效处理,确保生成的数字人具备高度的真实性和生动性。

主权项:1.一种对AIGC生成数字人姿态干预和纠正的方法,其特征在于,包括以下步骤:S1:采用接收图像数据和进行亮度调整的图像数据获取模块;S2:采用惯性传感器针对惯性动捕,对人体主要骨骼部位的运动进行实时测量;从传感器数据获取加速度信息获取、陀螺仪数据,根据上面获取到的数据进行姿态估计,根据加速度计和陀螺仪测量值,可以计算出姿态角的增量,计算方法如下:defcompute_poseax,ay,az,wx,wy,wz:#初始化姿态角theta=0phi=0psi=0#计算姿态角的增量g_x=axgg_y=aygphi_dot=-g_xcosthetapsi_dot=-g_ycosthetatheta_dot=wxphi_dot=wypsi_dot=wz#更新姿态角theta=theta+phi_dot*dtphi=phi+psi_dot*dtpsi=psi+theta_dot*dtreturntheta,phi,psi其中,g是重力加速度,dt是时间步长;获取到当前检测部位的姿态信息,为了提高姿态角估计的精度,可以采用卡尔曼滤波可以有效地消除传感器误差,提高姿态角估计的精度;S3:通过Mediapipe人体分割模块进行自上向下和自下向上的检测,自上向下包括目标检测、人体关键点检测、人体关键点组合、关键点信息映射到原图和输出,自下向上包括人体关键点检测、人体关键点组合、关键点信息映射到原图和输出,从而完成对被测人的人头骨骼关键点检测和语义分割,达到对人体姿态识别的基础部分,用于分割、对齐,构成更加拟人的基础模型信息;S4:采用分类器将分割好的单人图像数据进行静态帧特征提取和帧间特征提取,从而通过静态帧特征提取单帧图像特征的特征编码,通过帧间特征提取多帧图像光流轨迹信息;提取帧间的特征数据,提取公式如下:颜色特征RGB=R*255+G*256+B*256*255HSV=H*255+S*256+V*256*255YCbCr=Y*255+Cb*256+Cr*256*256纹理特征Gabor滤波:fx,y=exp-x^22*σ^2+y^22*σ^2*cos2*π*f*xwSIFT特征:x=x-meanxstdxy=y-meanystdy空间特征霍夫变换:M=|Hθ|*exp-i*θ光流特征Farneback光流:u=Ix+1,y-Ix-1,y2v=Ix,y+1-Ix,y-12并至少采用VQ和SOMP编码算法中的任意一项进行特征编码后采用分类器分类:VQ编码算法包括以下公式:码书构建D={d_1,d_2,...,d_N}其中,D是码书,包含了N个离散值;特征编码c=argmin_{d\inD}||x-d||_2^2其中,c是特征的编码值,x是原始特征,d是码书中的离散值;SOMP编码算法包括以下公式:初始化x_0=\sum_{k=1}^K\alpha_kd_k其中,x_0是初始稀疏系数向量,K是稀疏系数的个数;迭代\alpha_k=\frac{x-x_k^\topd_k}{\sum_{i=1}^Kx-x_k^\topd_i}x_k=x-\alpha_kd_k其中,k是迭代次数;S5:通过2D+人体骨骼关键点检测和3D人体骨骼关键点检测的配合应用,得到目标的热力图iVU信息;将3D人体骨骼关键点归一化到[0,1]范围,然后将其映射到2D图像中的像素点;基于归一化的方法:iVUx,y=\frac{x_k-min_x}{max_x-min_x}其中,iVUx,y是热力图iVU信息在x,y处的值,x_k是3D人体骨骼关键点在x方向上的值,min_x是3D人体骨骼关键点在x方向上的最小值,max_x是3D人体骨骼关键点在x方向上的最大值;S6:进行姿态识别调整模块算法的数据调整;通过收集更多的数据来增加数据集的规模;通过改变数据集的采集条件来增加数据集的多样性;通过人工标注或自动标注的方式对数据集进行标注;通过调整算法的超参数来调整算法的参数;S7:通过由深度学习模型和注意力机制复合搭建一个AIGC模型,将调整后的数据传输至AIGC模型;具体公式为:生成器=fz,x其中,z是噪声,x是调整后的数据;判别器=gx其中,x是输入数据;注意力权重=wx其中,x是输入数据;通过上述公式,可以搭建一个AIGC模型;S8:使用AIGC模型来训练数字人生成模型,采用深度学习模型中的对抗生成网络结构,使得模型的输入是随机生成的向量,输出是人脸图像,并在训练过程中,生成器和判别器会进行对抗性训练,生成更加真实的数字人;S9:在生成的数字人基础上,通过渲染技术实现数字人的动态化、场景化等效果,添加多边形简化、模型的细分等级、光源合并、场景裁剪,并对数字人的细节进行调整,如表情、姿态等,以使其更加自然、真实;S10:编写接口程序,将数字人生成模型集成到具体的业务场景中。

全文数据:

权利要求:

百度查询: 天翼视讯传媒有限公司 一种对AIGC生成数字人姿态干预和纠正的方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。