小哆智能科技(北京)有限公司刘晓玉获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉小哆智能科技(北京)有限公司申请的专利一种快速生成谈话数字人的方法、系统、设备及存储介质获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN118379407B 。
龙图腾网通过国家知识产权局官网在2025-05-30发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202410571446.3,技术领域涉及:G06T13/40;该发明授权一种快速生成谈话数字人的方法、系统、设备及存储介质是由刘晓玉设计研发完成,并于2024-05-09向国家知识产权局提交的专利申请。
本一种快速生成谈话数字人的方法、系统、设备及存储介质在说明书摘要公布了:本发明实施例公开了一种快速生成谈话数字人的方法、系统、设备及存储介质,利用基于八叉树的表示,将3D空间分解为多个正交平面,从而实现了动态头部的重,此外,还提出了、区域注意力模块,用于捕捉音频特征与空间区域之间的关联性,从而实现更精确的面部运动建模,通过引入自适应姿势编码,解决了头部和身体之间的分离问题,提高了生成结果的准确性和逼真度。解决现有技术在数字人合成领域的局限性,实现了高质量的渲染效果、快速的收敛速度和实时的推断过程,为数字人合成领域带来新的可能性,推动其在更多领域的应用和发展。
本发明授权一种快速生成谈话数字人的方法、系统、设备及存储介质在权利要求书中公布了:1.一种快速生成谈话数字人的方法,其特征在于,所述方法包括:S1、采集需要用于合成的音频数据与相关的人脸图像数据并进行预处理,生成适用于NeRF模型的NeRF格式音频数据与NeRF格式人脸图像数据;S2、利用八叉树将3D空间分解为多个正交平面并将每个空间立方体细分为空间中的实体;S3、利用多模态注意机制将音频特征与特定的空间区域相结合,实现面部运动建模;S4、利用自适应姿势编码将复杂的姿势信息映射至空间坐标,生成姿势空间坐标信息,为身体部分的NeRF学习隐式姿势提供清晰的位置关系数据;S5、利用NeRF格式音频数据与NeRF格式人脸图像数据训练预设NeRF模型并利用损失函数与优化算法进行参数调整,获取训练完成的NeRF模型;S6、获取一个NeRF格式音频数据与NeRF格式人脸图像数据,利用训练完成的NeRF模型和NeRF格式音频数据与NeRF格式人脸图像数据生成一个待渲染谈话数字人,对所述待渲染谈话数字人进行渲染,生成渲染完成的谈话数字人;利用八叉树将3D空间分解为多个正交平面并将每个空间立方体细分为空间中的实体,包括:通过递归结构和索引表达器来高效地存储、遍历体素数据;利用NeRF-basedtri-planedecomposition进行因子分解,降低哈希碰撞的数量。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人小哆智能科技(北京)有限公司,其通讯地址为:100089 北京市海淀区西北旺东路10号院东区23号楼三层346室;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。