买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
申请/专利权人:北京远鉴信息技术有限公司
摘要:本发明涉及说话人分割聚类技术领域,尤其涉及一种说话人分割聚类方法、装置、电子设备及存储介质,该方法包括:根据音频数据中在初始说话人转换点对应前一个初始音频数据段的声源方向与后一个初始音频数据段的声源方向的差值,从初始说话人转换点中筛选目标说话人转换点;基于所有目标说话人转换点分割音频数据,得到目标音频数据段;构建所有目标音频数据段的声纹向量、所有历史音频数据段对应的声纹向量之间的相似度矩阵;基于相似度矩阵对所有目标音频数据段、所有历史音频数据段进行谱聚类,得到说话人聚类结果。本申请能够对音频数据进行说话人分割聚类,提高了说话人分割聚类的准确率。
主权项:1.一种说话人分割聚类方法,其特征在于,所述方法包括:获取本次语音会话中当前时间段内音频数据对应的初始说话人转换点,以及本次语音会话中各历史音频数据段对应的声纹向量;根据所述音频数据中在所述初始说话人转换点对应前一个初始音频数据段的声源方向与后一个初始音频数据段的声源方向的差值,从所述初始说话人转换点中筛选目标说话人转换点;基于所有所述目标说话人转换点分割所述音频数据,得到目标音频数据段;构建所有所述目标音频数据段的声纹向量、所有所述历史音频数据段对应的声纹向量之间的相似度矩阵;基于所述相似度矩阵对所有所述目标音频数据段、所有所述历史音频数据段进行谱聚类,得到说话人聚类结果。
全文数据:
权利要求:
百度查询: 北京远鉴信息技术有限公司 一种说话人分割聚类方法、装置、电子设备及存储介质
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。