一种基于轻量化提示微调的目标说话人语音识别方法

导航：龙图腾网> 最新专利技术> 一种基于轻量化提示微调的目标说话人语音识别方法

买专利卖专利找龙图腾，真高效！查专利查商标用IPTOP,全免费！专利年费监控用IP管家,真方便！

申请/专利权人：山东大学

摘要：本发明公开了一种基于轻量化提示微调的目标说话人语音识别方法，可以将只能适用于单说话人非重叠语音的基座语音识别大模型简洁高效地适配到多说话人重叠语音中的目标说话人语音识别任务上。为解决传统方法监督训练或微调过程过于依赖人工标注数据的问题，本发明在监督微调数据集构建步骤中提供了一种基于模型自动标注的监督微调数据集构建方法。使用模型自动标注的文本数据进行轻量化提示微调，既节约了人工标注成本又能使微调后的模型不受人工标注的数据偏见影响，从而微调后的模型更具泛化性。

主权项：1.一种基于轻量化提示微调的目标说话人语音识别方法，可以高效地将只能适用于非重叠语音的语音识别模型，即基座模型简洁高效地适配到多说话人重叠语音目标说话人语音识别任务上，具体步骤包括：步骤1：基于模型自动标注的监督微调数据集构建，准备大量仅带有说话人标注的无重叠语音，使用声纹识别模型对所有不同说话人提取声纹特征并保存；使用基座模型对这些语音进行识别，生成标注文本并保存；选取N条来自不同说话人的无重叠语音，N≥2，以服从特定分布的信噪比构建重叠语音并保存，构建多条重叠语音—声纹特征—标注文本数据对作为监督微调数据集；步骤2：目标说话人语音识别模型的轻量化提示微调，使用步骤1构建的数据集，通过在基座模型输入的重叠语音特征向量组的前部附加上1个目标说话人声纹特征向量、随机初始化的N个软提示向量，对基座模型进行轻量化监督微调，其中声纹特征向量应经过矩阵投影变换以保证其在形状和语义方面与软提示向量一致，微调过程中仅更新声纹特征投影矩阵及附加的软提示向量的参数，在微调完成后存储投影矩阵和软提示向量；步骤3：目标说话人语音识别，当基座模型的输入语音为包含目标说话人的多说话人重叠语音时，在该语音特征向量组前部附加上1个目标说话人声纹向量和N个步骤2中训练并保存的提示向量，其中目标说话人声纹向量应使用步骤1中同样的声纹模型提取得到，并使用步骤2保存的投影矩阵进行投影变换，此时基座模型可以自动在多说话人重叠语音中转录出目标说话人的发言文本。

全文数据：

权利要求：

百度查询：山东大学一种基于轻量化提示微调的目标说话人语音识别方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：一种用于肺癌新辅助免疫治疗及化疗的预后标志物及其应用

下一篇：基于磷光体的时间饱和的颜色可调的pcLED

相关技术

一种用于肺癌新辅助免疫治疗及化疗的预后标志物及其应用

基于磷光体的时间饱和的颜色可调的pcLED

用于烯烃生产的配置

一种数据传输方法、装置、设备及计算机可读存储介质

一种缺陷检测方法和相关设备

一种数据加载方法、装置、电子设备及存储介质

一种避免结焦的草酸酯蒸发器及草酸酯气化方法

一种潮气量检测系统及装置

一种碳纤维纺丝前驱体及碳纤维的生产方法

带有非自驱动吸入阀的往复式压缩机

一种耳道清洗装置

可冲散无纺布制备新工艺及应用

龙图腾网&IPTOP

设置信息完成注册

手机号绑定多个账号

一种基于轻量化提示微调的目标说话人语音识别方法

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务