恭喜上海大学武星获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网恭喜上海大学申请的专利一种基于深度学习的短时语音说话人识别系统和方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN114822559B 。
龙图腾网通过国家知识产权局官网在2025-05-27发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202210464168.2,技术领域涉及:G10L17/02;该发明授权一种基于深度学习的短时语音说话人识别系统和方法是由武星;李瑞轩设计研发完成,并于2022-04-29向国家知识产权局提交的专利申请。
本一种基于深度学习的短时语音说话人识别系统和方法在说明书摘要公布了:本发明揭示了一种基于深度学习的短时语音说话人识别系统和方法,包括说话人语音采集模块、样本数据库、频谱图分割模块、时空特征融合模块、判定打分模块和结果输出模块,说话人语音采集模块用于采集说话人语音;样本数据库用于得到标准的说话人语音频谱图;频谱图分割模块用于将一张待识别频谱图像进行切片处理得到时间特征和空间特征;时空特征融合模块用于将时间信息和空间信息进行特征融合,得到说话人的深度学习嵌入;判定打分模块用于对说话人嵌入识别结果进行打分判定。本发明提供的基于深度学习的短时语音说话人识别系统和方法,输出评价指标来评估输出结果,并极大提升短时语音说话人识别过程中的效率和准确性。
本发明授权一种基于深度学习的短时语音说话人识别系统和方法在权利要求书中公布了:1.一种基于深度学习的短时语音说话人识别系统,其特征在于,包括说话人语音采集模块、语音识别处理模块、样本数据库、基于时空Transformer的短时语音说话人识别模型、判定打分模块以及结果输出模块,其中:说话人语音采集模块:用于采集说话人语音,获得原始音频数据;语音识别处理模块:用于对原始音频数据采用声学特征提取方法进行识别处理,得到说话人语音频谱图,并进行归一化得到的标准的说话人语音频谱图;样本数据库:用于对基于时空Transformer的短时语音说话人识别模型进行训练,样本数据库中存储有标准的说话人样本语音频谱图以及对应的样本标签;基于时空Transformer的短时语音说话人识别模型,进一步包括频谱图分割模块以及时空特征融合模块,其中,频谱图分割模块:用于将一张待识别的标准的说话人语音频谱图进行切片处理,得到一系列时间特征小片和空间特征小片;时空特征融合模块:用于将时间特征小片和空间特征小片进行特征融合,得到说话人的验证语音的深度嵌入或者说话人的注册语音的深度嵌入;判定打分模块:用于将说话人的验证语音的深度嵌入与目标说话人的注册语音的深度嵌入进行相似度比较,并进行打分判断;结果输出模块:用于对利用说话人语音采集模块实时输入语音的说话人的身份进行结果输出,输出所对应的目标说话人以及打分结果。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人上海大学,其通讯地址为:200436 上海市宝山区上大路99号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。