买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
申请/专利权人:云知声智能科技股份有限公司
摘要:本发明提供了一种说话人分割方法、系统、终端及存储介质,该方法包括:获取待分割语音数据,提取待分割语音数据中的特征向量;对特征向量进行标准差处理,得到标准差向量,并将标准差向量与初始零向量进行组合,得到说话人数目向量;将说话人数目向量输入预训练后的说话人分析模型进行说话人分析,得到说话人数目向量,并根据说话人数目向量,确定待分割语音数据中说话人数目。本发明通过对特征向量进行标准差处理,有效地消除了特征向量之间单位和尺度差异的影响,提高了特征向量的准确性,通过将标准差向量与初始零向量进行组合,得到说话人数目向量,有效地对标准差向量起到了特征增强效果,提高了说话人分割的准确性。
主权项:1.一种说话人分割方法,其特征在于,所述方法包括:获取待分割语音数据,并提取所述待分割语音数据中的特征向量;对所述特征向量进行标准差处理,得到标准差向量,并使用lstm网络作为decoder将所述标准差向量和初始零向量结合,输出说话人数目向量;将所述说话人数目向量输入预训练后的说话人分析模型进行说话人分析,得到说话人数目向量,并根据所述说话人数目向量,确定所述待分割语音数据中说话人数目。
全文数据:
权利要求:
百度查询: 云知声智能科技股份有限公司 说话人分割方法、系统、终端及存储介质
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。