基于关键词的非标准语音识别方法、装置、设备及介质

导航：龙图腾网> 最新专利技术> 基于关键词的非标准语音识别方法、装置、设备及介质

买专利卖专利找龙图腾，真高效！查专利查商标用IPTOP,全免费！专利年费监控用IP管家,真方便！

申请/专利权人：宁波星巡智能科技有限公司

摘要：本发明涉及语音识别技术领域，解决了现有技术中文字发音不准如带有地方口音的老人语音识别准确率低的问题，提供了一种基于关键词的非标准语音识别方法、装置、设备及介质。该方法包括：获取目标老人的实时音频数据；对所述实时音频数据进行预处理，得到目标音频数据；根据目标音频数据和预先构建的音频特征提取模型，得到所述目标音频数据的第一音频特征向量；分别获取所述第一音频特征向量与语音模板库中各关键词的第二音频特征向量之间的相似度值；当任一所述相似度值大于相似度阈值时，则所述实时音频数据存在相应的所述关键词。本发明通过特征提取和识别能力使其能够适应不同老年人的特点，提高系统语音识别的可靠性。

主权项：1.一种基于关键词的非标准语音识别方法，其特征在于，所述方法包括：获取目标老人的实时音频数据；对所述实时音频数据进行预处理，得到目标音频数据，其中，所述预处理包括滤波处理、降噪处理和人声增强处理，所述对所述实时音频数据进行预处理，得到目标音频数据，包括：根据所述目标老人的性别信息，获取所述目标老人的音频基本频率范围；根据所述音频基本频率范围对所述实时音频数据进行滤波处理，得到滤波音频数据；根据谱减法和所述音频基本频率范围对所述滤波音频数据进行降噪处理，得到降噪音频数据，其具体包括：根据所述滤波音频数据，确定噪声抑制平滑参数；根据所述噪声抑制平滑参数和递归平均法，得到所述滤波音频数据的噪声估计数据；根据所述滤波音频数据和所述噪声估计数据，得到所述降噪音频数据，其具体包括：根据所述滤波音频数据，获取基频能量分布数据；根据所述基频能量分布数据，确定增益调整因子，其中，所述增益调整因子用于调整降噪处理中的人声和噪音之间的比率；根据滤波音频数据和所述噪声估计数据，获取初始降噪音频数据；通过所述增益调整因子对所述初始降噪音频数据进行增益，得到所述降噪音频数据，其中，所述降噪音频数据通过以下公式计算：式中，k为频率索引，l为时间索引，D（k,l）表示降噪音频数据在第l帧第k频点的音频功率，N（k,l）表示所述噪声估计数据在第l帧第k频点的噪声功率，G（k,l）为所述增益调整因子，X（k,l）为滤波音频数据的能量谱；对所述降噪音频数据进行人声增强处理，得到增强音频数据；对所述增强音频数据进行动态范围压缩处理，得到所述目标音频数据，其具体包括：根据所述目标老人的音频基本频率范围，确定最大输出幅度和最小输出幅度；根据所述增强音频数据的峰值，得到峰值数据；根据所述最大输出幅度、最小输出幅度和所述峰值数据，对所述增强音频数据进行动态范围压缩处理，得到所述目标音频数据，其中，所述目标音频数据通过以下公式计算：式中，k为频率索引，l为时间索引，C（k,l）为所述目标音频数据，Vk,l为所述增强音频数据，Vmin为所述最小输出幅度，Vmax为所述最大输出幅度，Vpeak（k,l）为所述峰值数据；根据所述目标音频数据和预先构建的音频特征提取模型，得到所述目标音频数据的第一音频特征向量，其中，所述音频特征提取模型基于长短时记忆网络构建；分别获取所述第一音频特征向量与语音模板库中各关键词的第二音频特征向量之间的相似度值，其中，所述语音模板库包括与若干关键词一一对应的第二音频特征向量，所述第二音频特征向量基于所述音频特征提取模型获得；当任一所述相似度值大于相似度阈值时，则所述实时音频数据存在相应的所述关键词。

全文数据：

权利要求：

百度查询：宁波星巡智能科技有限公司基于关键词的非标准语音识别方法、装置、设备及介质

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：一种增加LED激发光源利用率的封装结构及封装方法

下一篇：显示面板及显示面板的制作方法

相关技术

一种增加LED激发光源利用率的封装结构及封装方法

显示面板及显示面板的制作方法

一种用于鲜花售卖的分销管理方法及系统

一种垃圾焚烧飞灰的预处理设备及其方法

基于数字孪生的数据智能可视化方法

一种基于智能监管的资金管理方法及系统

晶体管、存储单元、存储结构及晶体管的制备方法

电流模式射频衰减器

一种培养皿装配及码垛一体化设备

VEGF结合分子及其医药用途

一种PCB制程清洗用高浓度臭氧水发生装置

用于光电器件的有机分子

识别相关技术

翻拍识别模型训练、图像识别方法、装置、设备及介质_中国平安人寿保险股份有限公司_202010142973.4

一种手势识别方法、手势识别装置及智能设备_深圳市优必选科技股份有限公司_202110194549.9

指纹识别装置、电子设备和指纹识别的方法_深圳市汇顶科技股份有限公司_202011563420.2

语音识别模型训练、语音识别方法、装置和电子设备_马上消费金融股份有限公司_202410034887.X

行人多目标跟踪识别方法及跟踪识别装置_青岛科技大学_202210581127.1

一种科技金融风险识别装置和识别方法_广东技术师范大学_202410688342.0

基于目标检测与人脸识别的考勤智能识别系统及方法_长春职业技术学院_202411017239.X

基于深度学习的电力设备故障识别方法及识别系统_中国长江电力股份有限公司_202410761437.0

识别模型训练、眼底特征的识别方法、装置、设备及介质_平安科技(深圳)有限公司_201910882247.3

内容风险识别方法和系统_支付宝(杭州)信息技术有限公司_202210767655.6

方法相关技术

显微方法_卡尔蔡司医疗技术股份公司_202010076715.0

发酵方法_德希尼布能源法国公司_202410736056.7

诊断方法_夸登特健康公司_202111601219.3

一种多维数据的抽样方法、电路仿真方法和电路分析方法_贝叶斯电子科技(绍兴)有限公司_202410807426.1

检漏方法_华虹半导体(无锡)有限公司_202111255430.4

数据生成方法、业务回复方法及设备_马上消费金融股份有限公司_202410333977.9

图像编码/解码方法和图像数据的发送方法_LX半导体科技有限公司_202410979218.X

模型训练方法、图像分类方法及相关装置_马上消费金融股份有限公司_202410347300.0

模型构建方法、文本处理方法及装置_马上消费金融股份有限公司_202410521943.2

显示面板及其补偿数据确定方法、驱动方法_合肥维信诺科技有限公司_202410383273.2

语音相关技术

车辆语音交互方法和系统、以及语音更新系统_斑马智行网络(香港)有限公司_201911357915.7

语音识别模型训练、语音识别方法、装置和电子设备_马上消费金融股份有限公司_202410034887.X

语音合成模型的训练方法、语音合成方法及相关装置_马上消费金融股份有限公司_202410217038.8

语音注释和呼叫的混合_斯纳普公司_202410775773.0

语音识别方法和设备_三星电子株式会社_201910953821.X

语音消息处理方法和装置_维沃软件技术有限公司_202011288563.7

语音和动作时间同步的方法_阿里巴巴(中国)有限公司_202211060769.3

语音处理方法及相关装置_马上消费金融股份有限公司_202410347199.9

语音合成方法及相关产品_马上消费金融股份有限公司_202410156764.3

语音控制方法、装置、设备及介质_深圳市北科瑞声科技股份有限公司_202111424058.5

龙图腾网&IPTOP

设置信息完成注册

手机号绑定多个账号

基于关键词的非标准语音识别方法、装置、设备及介质

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务