北京大学深圳研究院;深圳先进技术研究院王昕获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉北京大学深圳研究院;深圳先进技术研究院申请的专利说话人验证模型训练方法、装置、介质及设备获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN119229877B 。
龙图腾网通过国家知识产权局官网在2025-12-02发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202411143183.2,技术领域涉及:G10L17/04;该发明授权说话人验证模型训练方法、装置、介质及设备是由王昕;王岚;许超设计研发完成,并于2024-08-20向国家知识产权局提交的专利申请。
本说话人验证模型训练方法、装置、介质及设备在说明书摘要公布了:本发明公开了一种说话人验证模型训练方法、装置、介质及设备,所述方法包括:对获取的语音音频数据进行波形提取,得到语音音频数据对应的音频波形数据;将所述音频波形数据输入至预设分类模型中,以通过所述预设分类模型输出所述语音音频数据对应的预测标签;根据语音音频数据对应的防伪标签和预测标签,确定所述预设分类模型的损失值;通过所述损失值对所述预设分类模型进行参数调整,得到说话人验证模型。本发明采取监督学习的方式利用真实的防伪标签对模型的预测标签进行辅助判定,利用最小化输出和真实标签之间的误差来训练整个模型,提高了训练效率降低了成本。
本发明授权说话人验证模型训练方法、装置、介质及设备在权利要求书中公布了:1.一种说话人验证模型训练方法,其特征在于,所述方法包括: 对获取的语音音频数据进行波形数据提取,得到语音音频数据对应的音频波形数据;所述语音原始音频数据是包含人声的音频数据,且所述语音原始音频数据所包含的人声应既包括有真实人声也包括有虚假人声; 将所述音频波形数据输入至预设分类模型中,以通过所述预设分类模型输出所述语音音频数据对应的预测标签,所述预设分类模型包括由多个特征模块组成残差网络的信号处理层,且所述残差网络内多个所述特征模块的步幅不相同; 根据预先获取的所述语音音频数据对应的防伪标签和所述预设分类模型输出的预测标签,确定所述预设分类模型的损失值; 通过所述损失值对所述预设分类模型进行参数调整,得到说话人验证模型; 所述对获取的语音音频数据进行波形数据提取之前,还包括: 提取所述语音原始音频数据对应的声学特征以及频谱特征; 对所述声学特征和频谱特征进行转换,得到所述声学特征对应的声学特征向量和所述频谱特征对应的频谱特征向量; 获取分类器,将所述声学特征向量和频谱特征向量输入至所述分类器,得到添加语音标签的声学特征向量和添加语音标签的频谱特征向量; 对所述添加语音标签的声学特征向量和添加语音标签的频谱特征向量进行解析,得到原始语音信号; 根据所述原始语音信号的时序确定所述原始语音信号对应的起始点和终止点,得到所述语音音频数据。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人北京大学深圳研究院;深圳先进技术研究院,其通讯地址为:518000 广东省深圳市高新技术产业园区南区深港产学研基地大楼东座五楼;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励