买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
申请/专利权人:浙江鑫淼通讯有限责任公司
摘要:本发明涉及语音提取技术领域,特别是指一种语音关键信息提取系统,该系统包括:语音采集模块、预处理模块、关键信息提取模块、关键信息匹配模块和缓冲确定模块;通过对采集的语音进行过滤和质量评估,以及对采集的音频进行分割和特征信息的提取以得到若干关键信息片段,对得到的各关键信息片段进行整合得到最终关键信息,并对所述最终关键信息进行语义校准以得到待匹配关键信息,对所述待匹配关键信息进行匹配和调整从而确定标准信息库内的目标关键信息。本发明实现了对语音关键信息的自动采集、处理、提取和匹配,能够快速准确地对语音进行处理、信息提取和匹配,提高了语音处理的速度和准确性。
主权项:1.一种语音关键信息提取系统,其特征在于,包括:语音采集模块,其用以采集第一音频,并确定所述第一音频的实际音频质量评估值;预处理模块,其用以对所述第一音频进行预处理以得到第二音频;并对所述第二音频进行分割以得到若干初始音频片段;关键信息提取模块,其用以对所述第二音频进行识别,并根据识别结果提取关键信息;其包括:第二音频分段处理单元、特征提取单元和信息整合单元;所述第二音频分段处理单元用以根据实际分割时长对所述第二音频进行分割以得到若干实际音频片段;所述特征提取单元用以对各实际音频片段中的特征信息进行提取以得到若干关键信息片段;所述信息整合单元用以将各关键信息片段进行整合以得到最终关键信息;其中,所述特征信息包括:执行主体、执行动词和执行对象;所述关键信息片段为[执行主体、执行动词、执行对象];关键信息匹配模块,其用以对所述最终关键信息进行匹配和修正以得到若干实际关键信息和待匹配关键信息;其包括:匹配判断单元和语义校准单元;所述匹配判断单元用以根据所述最终关键信息与标准信息库内若干标准关键信息进行匹配以确定符合标准匹配敏感度的若干实际关键信息,并确定所述最终关键信息的敏感度等级;所述语义校准单元用以根据所述敏感度等级的不同对所述最终关键信息进行语义校准以得到所述待匹配关键信息;缓冲确定模块,其用以根据所述待匹配关键信息确定各实际关键信息中的目标关键信息;所述语音采集模块包括:麦克风阵列采集单元、第一音频过滤单元和音频质量评估单元;所述麦克风阵列采集单元用以采集外部环境内的初始音频;所述第一音频过滤单元用以识别所述初始音频中的语音活动部分,过滤掉非人声音频以得到所述第一音频;所述音频质量评估单元用以对所述第一音频进行标记以得到不同类型的标记音频以及根据标记结果确定所述实际音频质量评估值;所述预处理模块包括:第二音频过滤单元、第一音频分段处理单元和音频分段修正单元;所述第二音频过滤单元用以根据所述实际音频质量评估值确定是否需进行音频重新采集,以及根据标准人声频谱图和所述第一音频内的各标记音频得到所述第二音频;所述第一音频分段处理单元用以根据预设的固定分割时长对所述第二音频进行分割以得到若干初始音频片段;所述音频分段修正单元用以根据各初始音频片段内的执行动词个数对所述固定分割时长进行修正以得到实际分割时长;对于任一标准关键信息,所述匹配判断单元根据所述最终关键信息和该标准关键信息确定初始匹配敏感度;所述匹配判断单元根据第一差值绝对值确定该标准关键信息是否为所述实际关键信息以及所述最终关键信息的所述敏感度等级;若第一差值绝对值小于等于敏感度等级评价值,则所述匹配判断单元判定该标准关键信息为所述实际关键信息并确定所述最终关键信息的所述敏感度等级为一级;若所述第一差值绝对值大于敏感度等级评价值且所述初始匹配敏感度大于所述标准匹配敏感度;则所述匹配判断单元判定该标准关键信息为所述实际关键信息并确定所述最终关键信息的所述敏感度等级为二级;其中,所述匹配判断单元内设置有所述敏感度等级评价值;所述第一差值绝对值为所述初始匹配敏感度和所述标准匹配敏感度间的差值绝对值。
全文数据:
权利要求:
百度查询: 浙江鑫淼通讯有限责任公司 一种语音关键信息提取系统
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。