买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
申请/专利权人:广东小天才科技有限公司
摘要:本发明实施例公开了一种基于口型的语音识别方法及终端设备,以及计算机可读存储介质,用于通过摄像头识别用户的口型变化特征,根据唇语识别模型,得到用户的发音信息,可以通过口型得到的发音信息在一定程度上能弥补那些因为音频缺失或者噪音干扰而丢失的音频信息,从而更准确的获取用户的目标音频信息。本发明实施例方法包括:通过摄像头获取用户的多个连续的图像,以及通过麦克风获取所述用户的音频信息;根据所述多个连续的图像,识别出所述用户的口型变化特征;将所述用户的口型变化特征,输入至预置的所述用户的唇语识别模型中,识别得到所述用户的发音信息;根据所述发音信息和所述音频信息,确定目标音频信息。
主权项:1.一种基于口型的语音识别方法,其特征在于,包括:在检测到用户心跳大于第一阈值、且并未检测到用户的音频信息或触控输入信息的情况下,通过摄像头获取关于用户的视频,对所述用户的视频进行分离,得到音频流和视频流,所述音频流为所述用户的音频信息;使用人脸识别算法跟踪所述视频流中的人脸,并提取所述人脸中的嘴部区域,获取帧唇部动作视频;对所述帧唇部动作视频进行处理,获取唇部图像序列;采用序列切分规则对所述唇部图像序列进行切分,获取切分图像序列;通过唇部图像识别模型对所述唇部图像序列对应的各切分图像序列进行识别,获取切分图像特征;采用分类函数对所述切分图像特征进行分类,获取切分图像识别结果;按照时间顺序对所述切分图像识别结果进行拼接,获取所述用户的口型变化特征;将所述用户的口型变化特征,输入至预置的所述用户的唇语识别模型中,识别得到所述用户的发音信息;根据所述发音信息和所述音频信息,确定目标音频信息;根据所述视频流,确定所述用户的头像图片;若所述目标音频信息为求助信息,则将所述目标音频信息和所述头像图片向12110发送。
全文数据:
权利要求:
百度查询: 广东小天才科技有限公司 一种基于口型的语音识别方法及终端设备
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。