恭喜中国科学院声学研究所张鹏远获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网恭喜中国科学院声学研究所申请的专利一种可保留语音情感的说话人隐私保护方法及系统获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN119207441B 。
龙图腾网通过国家知识产权局官网在2025-04-08发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202411174387.2,技术领域涉及:G10L21/013;该发明授权一种可保留语音情感的说话人隐私保护方法及系统是由张鹏远;华桦;尚增强;王丽设计研发完成,并于2024-08-26向国家知识产权局提交的专利申请。
本一种可保留语音情感的说话人隐私保护方法及系统在说明书摘要公布了:本发明属于智能数字信号处理技术领域,公开了一种可保留语音情感的说话人隐私保护方法及系统,方法包括:获取说话人的原始音频并输入到端到端情感语音融合模型;利用融合模型对原始音频进行推理,改变原始音频中的声纹信息,得到保留情感状态的伪说话人音频;融合模型包括先验编码器和波形解码器,先验编码器接收原始音频和说话人身份标识号ID,计算并利用原始音频的基频编码、内容编码、情感编码和说话人ID编码生成先验分布均值和方差;波形解码器将先验分布均值和方差还原成伪说话人音频。使用模型融合手段,既生成了未见的伪说话人音频,又避免了推理过程的“分布外”问题,解决了情感留存和伪说话人信息之间不匹配的问题。
本发明授权一种可保留语音情感的说话人隐私保护方法及系统在权利要求书中公布了:1.一种可保留语音情感的说话人隐私保护方法,包括:获取说话人的原始语音音频并输入到端到端情感语音融合模型;利用端到端情感语音融合模型对原始语音音频进行推理,改变原始语音音频中的声纹信息,得到保留原始语音音频情感状态的伪说话人语音音频;其中,所述端到端情感语音融合模型包括:先验编码器和波形解码器,所述利用端到端情感语音融合模型对原始语音音频进行推理,包括:步骤1:先验编码器接收原始语音音频和说话人身份标识号ID,计算并利用原始语音音频的基频编码、内容编码、情感编码和说话人ID编码生成先验分布均值和方差,其中,说话人ID编码中包含了声纹信息;步骤2:波形解码器将先验分布均值和方差重参数化为隐变量,对隐变量进行解码运算,将解码后的隐变量上采样还原为时域的伪说话人语音音频。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人中国科学院声学研究所,其通讯地址为:100190 北京市海淀区北四环西路21号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。