买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
申请/专利权人:上海强仝智能科技有限公司
摘要:本申请公开了一种基于深度学习的口型生成方法、装置以及存储介质。其中,方法包括:获取目标对象的音频数据,并使用预先创建的音频特征提取器提取音频数据的音频特征;将音频特征输入预先创建的编码器,确定音频特征的隐层表征;其中,隐层表征用于反映音频特征中的语音特征;将隐层表征输入预先创建的音素解码器,确定隐层表征包含的各个音素的音素权重;将音素权重和预先创建的对照表输入训练好的口型生成模型,确定目标对象的口型信息,并将口型信息转换为口型图像;其中,对照表为通过将不同的音素与对应的口型进行匹配后得到的对照表。
主权项:1.一种基于深度学习的口型生成方法,其特征在于,包括:获取目标对象的音频数据,并使用预先创建的音频特征提取器提取所述音频数据的音频特征;将所述音频特征输入预先创建的编码器,确定所述音频特征的隐层表征;其中,所述隐层表征用于反映所述音频特征中的语音特征;将所述隐层表征输入预先创建的音素解码器,确定所述隐层表征包含的各个音素的音素权重;将所述音素权重和预先创建的对照表输入训练好的口型生成模型,确定所述目标对象的口型信息,并将所述口型信息转换为口型图像;其中,所述对照表为通过将不同的音素与对应的口型进行匹配后得到的对照表。
全文数据:
权利要求:
百度查询: 上海强仝智能科技有限公司 一种基于深度学习的口型生成方法、装置以及存储介质
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。