买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
申请/专利权人:平安科技(深圳)有限公司
摘要:本发明公开了一种歌声合成方法、装置、计算机设备及存储介质,应用于计算机技术领域。本发明提供的方法包括:获取目标歌曲的音乐数据,通过预设的编码器对所述音乐数据进行编码,生成音乐编码数据;将音乐数据编码输入到注意力机制网络进行编码,生成特征信息;将特征信息输入到歌声合成模型中,并生成第一声谱数据;对所述第一声谱数据进行解码,得到第一线性谱数据,并通过傅里叶变换方式,将所述第一线性谱数据转换成目标歌曲音频。本发明通过少量的训练数据训练得到歌声合成模型,提高了目标歌曲音频的合成效率,同时保证目标歌曲音频的合成效果。
主权项:1.一种歌声合成方法,其特征在于,包括:获取目标歌曲的音乐数据,通过预设的编码器对所述音乐数据进行编码,生成音乐编码数据,其中,所述音乐数据包括歌词数据、声谱数据、音调数据以及目标歌手的音频数据,所述音乐编码包括歌词编码、声谱编码、音调编码和音频编码;将所述歌词编码、音频编码输入到第一注意力机制模型进行编码,得到音色特征信息;将所述音频编码、声谱编码、音调编码输入到第二注意力机制模型进行编码,得到风格特征信息;将所述音色特征信息与所述风格特征信息输入到歌声合成模型中进行声谱合成,得到第一声谱数据;所述将所述音色特征信息与所述风格特征信息输入到歌声合成模型中进行声谱合成,得到第一声谱数据的步骤包括:采用时值编码器对时值特征进行编码,得到时值特征向量;将所述时值特征向量、所述音色特征信息以及所述风格特征信息输入至所述歌声合成模型,并生成所述第一声谱数据; 所述乐谱音符的理论长度包括:获取乐句的所有音符时长,以及歌词编码中每个因素的时长,使得乐句的音素序列发音时长之和等于该乐句所有音符时长之和;所述乐谱音符的理论长度的单位为毫秒;对所述第一声谱数据进行解码,得到第一线性谱数据,并通过傅里叶变换方式,将所述第一线性谱数据转换成目标歌曲音频。
全文数据:
权利要求:
百度查询: 平安科技(深圳)有限公司 歌声合成方法、装置、计算机设备及存储介质
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。