首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

唇部音节识别方法、装置、设备及介质 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

申请/专利权人:湖南大学

摘要:本公开实施例中提供了一种唇部音节识别方法、装置、设备及介质,属于图像处理技术领域,具体包括:得到每个初始特征点的坐标信息;形成距离时间序列;根据距离时间序列转换目标曲线;从距离时间序列中分割对应的发音序列;得到最优特征序列;计算最优特征序列与样本特征序列之间距离的相似度;判断相似度是否小于第二阈值;若是,则判定音节相同;若否,则判定音节不同,并计算最优特征序列与其他样本特征序列的相似度,直至相似度小于第二阈值。通过本公开的方案,计算基于音节的细粒度特征,然后利用交叉验证递归特征消除模型进行训练,选取最优特征序列与样本特征序列进行比对,从而识别对应的音节,提高了音节检测的效率、精准度和适应性。

主权项:1.一种唇部音节识别方法,其特征在于,包括:采集目标人员的人脸动态视频,并利用Dlib人脸识别框架识别所述人脸动态视频中每帧人脸图像的多个初始特征点,并得到每个所述初始特征点的坐标信息;从全部所述初始特征点中选取与唇部相关的预设数量的特征点作为目标特征点,并根据所述目标特征点的坐标信息得到多组距离变化函数,形成距离时间序列;根据所述距离时间序列转换目标曲线;根据所述目标曲线计算嘴唇张合度,将所述嘴唇张合度与第一阈值比对,判定嘴唇运动开始时刻和结束说话时刻,并据此从所述距离时间序列中分割对应的发音序列;将所述发音序列进行降维后的全部特征输入交叉验证递归特征消除模型,为每个特征添加权重,每次递归剔除重要性最低的特征直到得到最优特征序列;计算所述最优特征序列与样本特征序列之间距离的相似度,其中,所述样本特征序列为样本音节对应的唇部特征序列;判断所述相似度是否小于第二阈值;若所述相似度小于所述第二阈值,则判定所述最优特征序列与所述样本特征序列对应的音节相同;若所述相似度大于或等于所述第二阈值,则判定所述最优特征序列与所述样本特征序列对应的音节不同,并计算所述最优特征序列与其他样本特征序列的相似度,直至所述相似度小于所述第二阈值。

全文数据:

权利要求:

百度查询: 湖南大学 唇部音节识别方法、装置、设备及介质

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。