买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
申请/专利权人:北京语言大学
摘要:本发明涉及计算机辅助语音教学技术领域,特别是指一种大模型发音偏误检测及发音动作图像反馈方法及装置,包括:将二语学习者音频输入至发音偏误模型中,输出二语学习者的实际音素序列;对实际音素序列进行错误识别处理;通过知识图谱对错误发音进行对应正确发音的搜索,获得反馈信息;将反馈信息输入至大语言模型中,获得反馈文本;基于正确发音的口型图片通过图生图技术生成对应的发音口型图像;将反馈文本和发音口型图像综合反馈给二语学习者。本发明的广泛适用性使其成为一种更为灵活和全面的学习工具。传统方案往往受限于特定跟读文本的范围,而本发明不受文本类型和内容的限制,为二语学习者提供了更加个性化和广泛的学习支持。
主权项:1.一种大模型发音偏误检测及发音动作图像反馈方法,其特征在于,所述方法包括:S1、获取二语学习者音频,将所述二语学习者音频输入至发音偏误模型中,输出二语学习者的实际音素序列;对所述实际音素序列进行错误识别处理,获得错误发音;S2、构建知识图谱,通过所述知识图谱对所述错误发音进行对应正确发音的搜索,获得反馈信息;所述步骤S2中,构建知识图谱,通过所述知识图谱对所述错误发音进行对应正确发音的搜索,获得反馈信息,包括:识别并获取错误发音;构建知识图谱,所述知识图谱包括中文声母、中文韵母,以及每个中文声母、中文韵母的发音属性;通过所述知识图谱对所述错误发音进行对应正确发音的搜索,获得反馈信息;S3、将所述反馈信息输入至大语言模型中,获得反馈文本;所述步骤S3中,将所述反馈信息输入至大语言模型中,获得反馈文本,包括:将所述反馈信息输入至大语言模型中,通过大语言模型对所述反馈信息进行润色和总结,生成反馈文本;S4、预设正确发音的口型图片,基于所述正确发音的口型图片通过图生图技术生成对应的发音口型图像;所述S4中,预设正确发音的口型图片,基于所述正确发音的口型图片通过图生图技术生成对应的发音口型图像,包括:预设声韵母的口型图片,从所述口型图片中提取关键的图像轮廓信息;添加知识图谱中与所述口型图片的发音细节相关的文本描述,生成发音口型图片;S5、将所述反馈文本和发音口型图像综合反馈给所述二语学习者,完成大模型发音偏误检测及发音动作图像反馈。
全文数据:
权利要求:
百度查询: 北京语言大学 一种大模型发音偏误检测及发音动作图像反馈方法及装置
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。