买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
申请/专利权人:兰州大学
摘要:本发明涉及学习设备技术领域,尤其是一种嘈杂环境下听障人士汉语发音计算机辅助学习方法及装置。本发明采集用户口述的待学习语句作为输入语音,通过说话人声纹识别模型从输入语音提取目标用户语音,将目标用户语音转换为拼音表达式;结合目标用户语音的拼音表达式和标准语音的拼音表达式,获取将目标用户语音纠正到标准语音的发音纠正要点并输出。本发明通过模拟沟通场景为听障人士提供在真实生活中的对话场景模拟,使得学习者在学习过程中能够更好地适应实际语境,增加学习的实用性和可操作性。本发明能实现噪音背景环境下的目标用户语音信息精准提取,避免传统方法对发音学习环境安静的要求,极大方便了听障人士随时随地进行发音学习和训练。
主权项:1.一种嘈杂环境下听障人士汉语发音计算机辅助学习方法,其特征在于:设置模拟沟通场景以及待学习语句,获取待学习语句的标准语音以及拼音表达式;采集用户说出的待学习语句作为输入语音,通过说话人声纹识别模型从输入语音提取目标用户语音,将目标用户语音转换为拼音表达式;结合目标用户语音的拼音表达式和标准语音的拼音表达式,获取将目标用户语音纠正到标准语音的发音纠正要点并输出;说话人声纹识别模型包括顺序连接的声纹特征提取模块、注意力特征提取模块和分类器,声纹特征提取模块用于从输入语音中提取符合目标用户声纹特征的语音作为说话人语音;注意力特征提取模块用于提取说话人语音的注意力特征,分类器基于注意力特征对说话人语音进行分类;说话人声纹识别模型的训练过程为:采用无监督学习方式对声纹特征提取模块进行预训练,然后组合预训练后的声纹特征提取模块、注意力特征提取模块和分类器作为基础模型,最后采用有监督学习方式对基础模型进行训练,固定收敛后的基础模型作为说话人声纹识别模型,其输入为语音数据,输出为目标用户语音。
全文数据:
权利要求:
百度查询: 兰州大学 嘈杂环境下听障人士汉语发音计算机辅助学习方法及装置
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。