说话人识别方法、装置、电子设备、介质及程序产品

导航：龙图腾网> 最新专利技术> 说话人识别方法、装置、电子设备、介质及程序产品

买专利卖专利找龙图腾，真高效！查专利查商标用IPTOP,全免费！专利年费监控用IP管家,真方便！

摘要：本申请提供一种说话人识别方法、装置、电子设备、介质及程序产品，该说话人识别方法，包括：对待识别视频进行场景检测，基于场景检测的结果将待识别视频分为多个视频分段；针对各视频分段，分离得到视频分段中的音频数据和视频帧；提取视频帧的人脸特征以及提取音频数据的音频特征；针对多个视频分段中场景切换的多个视频帧，提取多个视频帧的人脸深度特征，并计算多个视频帧中相邻视频帧的人脸深度特征的距离，得到跨场景距离特征；基于跨场景距离特征、人脸特征和音频特征，从视频分段包含的人脸中识别说话人。实现了逐场景进行说话人识别，同时结合跨场景特征实现人脸关联，克服了由于场景切换导致说话人识别准确度较差的问题。

主权项：1.一种说话人识别方法，其特征在于，包括：对待识别视频进行场景检测，并基于场景检测的结果将所述待识别视频分为多个视频分段；针对所述多个视频分段中各视频分段，分离得到所述视频分段中的音频数据和视频帧；提取所述视频帧的人脸特征以及提取所述音频数据的音频特征；针对所述多个视频分段中场景切换的多个视频帧，提取所述多个视频帧的人脸深度特征，并计算所述多个视频帧中相邻视频帧的人脸深度特征的距离，得到跨场景距离特征；基于所述跨场景距离特征、所述人脸特征和所述音频特征，从所述视频分段包含的人脸中识别说话人。

全文数据：

权利要求：

百度查询：万兴科技(湖南)有限公司说话人识别方法、装置、电子设备、介质及程序产品

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：摄像模组和电子设备

下一篇：一种直流充电桩低压注入绝缘检测电路及其检测方法

相关技术

摄像模组和电子设备

一种直流充电桩低压注入绝缘检测电路及其检测方法

一种感应器测试验证设备

一种轨道式可拓展智能线形灯

一种基于Agent的分布式HTTPS代理系统和方法

扇出型封装结构和扇出型封装结构的制备方法

一种电池涂层、电池、电池组、用电设备

一种充电器的外壳插口铣削用治具

一种高层建筑多模爬升模板及其施工方法

一种压力波动结合酶联提取制备龙胆提取物的方法

一种高温气冷堆的供电装置

货厢和车辆

龙图腾网&IPTOP

设置信息完成注册

手机号绑定多个账号

说话人识别方法、装置、电子设备、介质及程序产品

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务