首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

一种高保真度实时渲染的视频合成方法及系统 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

申请/专利权人:爱汇葆力(广州)数据科技有限公司

摘要:本发明公开了一种高保真度实时渲染的视频合成方法及系统,涉及视频合成技术领域,本发明的方法通过精确的音频处理和头部、躯干特征的精确提供,实现了音频与视频的高度同步,利用先进的NeRF技术,合成的人物动作逼真,包括唇部动作、面部表情和全身动作,通过音色提取、转换、嵌入和合成等步骤,本发明能够复制特定说话者的音色特征,提供个性化的语音输出,本发明的方法具备实时渲染能力,适合于需要快速响应的应用场景,如直播、视频会议等,同时支持高分辨率视频流的生成,提供了清晰的图像细节。

主权项:1.一种高保真度实时渲染的视频合成方法,其特征在于,包括如下步骤:D1:采集视频素材;D2:对采集的视频素材进行预处理;D3:将视频素材中的音频分离出来,并进行降噪和增强处理;D4:对视频素材的视频流进行关键帧的提取;D5:通过机器学习算法分析唇部动作与语音之间的关联,训练出模拟人物头部特征的模型;D6:获取训练出的头部特征以及关键帧,使用计算机视觉技术提取人物的躯干关键点,训练出感知并模拟人物躯干动作的模型;D7:采集待合成的音频信号;D8:对待合成的音频信号进行预处理;D9:获取训练得到的头部特征信息,并传输至推理渲染器S8;D10:获取训练得到的躯干感知特征信息,并传输至推理渲染器S8;D11:根据待合成的音频信号、头部特征信息和躯干感知特征信息,使用先进的神经辐射场技术进行实时渲染。

全文数据:

权利要求:

百度查询: 爱汇葆力(广州)数据科技有限公司 一种高保真度实时渲染的视频合成方法及系统

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。