广州紫为云科技有限公司徐贤威获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉广州紫为云科技有限公司申请的专利一种自适应情感驱动的音色克隆文字转语音方法及装置获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN119580695B 。
龙图腾网通过国家知识产权局官网在2025-07-18发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202411781860.3,技术领域涉及:G10L13/02;该发明授权一种自适应情感驱动的音色克隆文字转语音方法及装置是由徐贤威;覃振波;王刚;李观喜设计研发完成,并于2024-12-05向国家知识产权局提交的专利申请。
本一种自适应情感驱动的音色克隆文字转语音方法及装置在说明书摘要公布了:本申请涉及一种自适应情感驱动的音色克隆文字转语音方法及装置。将目标文本按句切分并提取语义特征,将每个句子拆分为目标音素序列;将参考文本拆分为参考音素序列,参考音素序列分别与每个目标音素序列拼合得到组合音素序列,对参考音频进行处理,得到参考语音特征和频谱,基于句子对应的语义特征和组合音素序列、参考语音特征进行处理,得到对应的语音特征,从每个句子语义特征中提取对应的情感特征,基于每个句子对应的语音特征、情感特征和目标音素序列,以及频谱进行处理,得到目标文本对应的语音信号。从目标文本语义特征中提取情感特征,使语音信号情感色彩贴合文本,基于预设输出特征与情感特征的映射关系,自动调整语音信号的情感色彩。
本发明授权一种自适应情感驱动的音色克隆文字转语音方法及装置在权利要求书中公布了:1.一种自适应情感驱动的音色克隆文字转语音方法,其特征在于,包括, 将目标文本切分为至少一个句子,提取每一个句子的语义特征,将每一个句子拆分为一个目标音素序列; 将参考文本拆分为一个参考音素序列,将所述参考音素序列分别与每一个所述目标音素序列拼合,得到每一个句子的组合音素序列; 对所述参考文本对应的参考音频进行特征提取和频谱提取,得到参考语音特征和参考音频频谱; 基于每一个句子对应的语义特征和组合音素序列,以及所述参考语音特征进行处理和解码,得到每一个句子的语音特征; 调整所述每一个句子的语义特征的特征维度,从调整了特征维度的语义特征中提取对应的基础特征;对所述基础特征进行残差连接处理,将处理后的基础特征与处理前的基础特征相加,对相加的结果进行降维处理,得到中间输出特征;对所述中间输出特征进行残差连接处理,将处理后的中间输出特征与处理前的中间输出特征相加,对相加结果进行降维处理,得到每一个句子的输出特征;基于预设的输出特征和情感特征之间的映射关系,对所述每一个句子的输出特征进行情感分类,得到每一个句子的情感特征; 基于每一个句子对应的语音特征、情感特征和目标音素序列,以及所述参考音频频谱进行特征音频转换处理,得到目标文本对应的语音信号。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人广州紫为云科技有限公司,其通讯地址为:510000 广东省广州市黄埔区香雪八路98号F栋20层2001-1房(仅限办公);或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。