买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
申请/专利权人:昆明理工大学
摘要:本发明涉及基于多特征交互融合的老挝语无监督音素分割方法,属于自然语言处理技术领域。本发明包括步骤:收集和处理老挝语音数据集;提取自监督特征、频谱特征和音高特征;把自监督特征、频谱特征和音高特征进行融合,训练音素分割模型;基于概率对比损失原理区分相邻帧和随机干扰帧实现音素分割模型优化;在推理阶段,将音素分割模型输出向量输入到峰值检测算法中生成最终的音素边界。本发明能够更好地交互融合不同特征的优势,克服了直接相加方法的局限性,从而在整体性能上取得了更好的结果。
主权项:1.基于多特征交互融合的老挝语无监督音素分割方法,其特征在于:所述方法的具体步骤如下:Step1、收集和处理老挝语音数据集;Step2、提取自监督特征、频谱特征和音高特征;Step3、把自监督特征、频谱特征和音高特征进行融合,训练音素分割模型;Step4、基于概率对比损失原理区分相邻帧和随机干扰帧实现音素分割模型优化;在推理阶段,将音素分割模型输出向量输入到峰值检测算法中生成最终的音素边界。
全文数据:
权利要求:
百度查询: 昆明理工大学 基于多特征交互融合的老挝语无监督音素分割方法
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。