Document
拖动滑块完成拼图
首页 专利交易 IP管家助手 科技果 科技人才 积分商城 国际服务 商标交易 会员权益 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索
最新专利技术
  • 本发明公开了一种口语考试低频词语音识别方法、存储介质及设备,通过使用高频词片段来表示低频词,并与声学特征融合,通过解码获得含低频词的语音识别结果,可以有效减少低频信息出现的概率,降低语言复杂度和模型学习难度,相比传统语音识别方法,能有效提升...
  • 本发明属于智能信息系统管理领域,具体公开了一种智能电话语音客户系统及相关方法。该系统涵盖语音采集与预处理、高精度语音识别、深度意图理解等多个模块。采用改进型深度卷积神经网络与注意力机制融合的语音识别算法等多种创新算法,提高语音识别准确率、精...
  • 本申请公开了一种基于跨模态注意力、全局记忆和动态卷积的语音翻译模型训练方法、语音翻译方法及装置,涉及语音处理与机器翻译技术领域,通过设计语音翻译模型包括语音编码器、文本嵌入层、跨模态注意力适配器、大语言模型解码器、全局记忆网络、动态卷积解码...
  • 本申请实施例提供语音识别翻译模型的训练方法、语音识别翻译方法及装置,涉及大语言模型技术领域。该方法设定三个阶段的训练过程,在第一个阶段用样本量较大的语音识别集合训练语音识别翻译模型的语音识别能力,在第二个阶段,用少量的有监督语音翻译样本进行...
  • 本发明公开了基于语音短信的实时处理方法,涉及通信技术领域,该方法的具体步骤为:语音预处理、语音转写与文本规范、语义分析与处理、信息处理和结果反馈;本发明通过语音预处理中的自适应滤波公式和基于语音停顿间隔与语调变化的分割机制,实现了对语音信号...
  • 本申请公开一种语音识别方法、装置、存储介质、程序产品及计算机设备,该方法包括:获取待识别语音;确定所述待识别语音的第一语音特征及第二语音特征,其中,所述第一语音特征及所述第二语音特征各自对应的特征提取方式不同;基于所述第一语音特征及所述第二...
  • 本发明涉及语音识别技术领域,具体涉及一种用于卡片学习机的语音识别方法及系统,方法包括:采集儿童在多种语速、语调和口音下的读演讲和自发言语的语音数据,对语音数据进行预处理,并进行分帧处理,采用Hamming窗函数进行加窗,通过语速扰动进行数据...
  • 本发明实施例公开了一种自动语音识别方法和装置,本发明实施例提供的自动语音识别方法和装置,在针对长语音识别的自动语音识别过程中,提供了针对不同阶段异常情况的处理策略,特别是针对单句识别流程中流式识别和非流式识别的处理策略,在流式识别和非流式识...
  • 本申请公开了一种语音设备测试方法、装置、设备及介质,涉及智能家居/智慧家庭技术领域,包括:接收用户端的测试请求,所述测试请求用于指示对目标设备进行语音交互测试;在所述测试请求内不包含测试参数的情况下,基于所述目标设备的设备信息,确定对应的测...
  • 本发明提供一种车辆的座舱语音交互测试系统及方法,其中,系统包括设置于座舱内的可动语音测试装置,可动语音测试装置与车辆的车机交互;可动语音测试装置可在座舱内调节位置、并在不同位置播放测试语料;车机接收可动语音测试装置播放的测试语料信息,发出反...
  • 本发明提供了一种基于边缘算力的多语种语音识别方法及系统,通过获取待识别语音信号,提取声学特征;随后通过语言注意力模块计算语音信号的语言向量,根据语言向量动态激活若干专家模块,并计算各专家模块的融合权重;将声学特征输入激活的专家模块中,生成混...
  • 本发明提供基于声调轨迹神经场的苏州方言语音识别系统及方法,包括声调轨迹神经场模块,用于将苏州方言的声调变化建模为连续的时空神经场;双向语义记忆网络模块,包含前向预测记忆库和后向修正记忆库;音素‑字形耦合纠错器,通过建立音素序列与字形序列之间...
  • 本发明公开一种融合年龄特征的跨生命周期端到端人声生成方法及系统,属于人工智能与语音技术交叉领域。本发明通过预处理构建含年龄标签的多维度语音数据集,提取MFCC、说话人嵌入(ECAPA‑TDNN)等特征,在FastSpeech 2等端到端语音...
  • 本申请提供了一种康巴藏语语音合成前端建模方法,可以应用于人工智能技术领域。该康巴藏语语音合成前端建模方法包括:获取康巴藏语文本及其对应的真实藏语韵律标签;基于预设康巴国际音标转写规则对所述康巴藏语文本进行转写,以确定康巴藏文音素向量;基于所...
  • 本公开关于一种语音合成方法、装置、电子设备及存储介质,该方法包括:获取待合成文本和提示语音;基于所述待合成文本的音素序列和所述提示语音进行时长预测,得到目标合成语音的播放时长信息;基于所述播放时长信息调整所述音素序列的序列长度,得到目标音素...
  • 本发明公开了一种可控制时长的端到端语音翻译方法及翻译系统, 通过引入语音端到端的方案,有效减少翻译的延时;通过构建全新的tokenizer和引入token对齐方案,有效的控制翻译结果长度;通过对token时长的控制,加入长度控制变量,来引导...
  • 本发明公开了一种用于人机交互的语音合成方法及系统,具体涉及语音合成技术领域,用于解决现有语音合成系统在高可靠性场景下对高风险内容缺乏自适应调整能力的问题;是通过多级分析处理机制实现:首先计算声学特征预测值的差分序列并分析异常峰值来确定语音单...
  • 本发明提供了一种面向电力安全一区的语音全流程部署方法、控制方法,属于电力系统技术领域。其方法包括:根据预设提示词生成电力行业文本语料;将电力行业文本语料进行语音合成,生成与电力行业文本语料对应的电力行业语音数据;根据电力行业文本语料及其对应...
  • 本发明公开了一种对话人偶的个性化语音合成方法,涉及语音合成技术领域,包括,接收用户输入的角色设定文本与场景环境坐标数据;将时代特征标签输入历史发音规则库,重构出历史语音特征集;通过声学特征转换器将性格特征标签映射为共振峰频段调节因子;从社会...
  • 本发明公开了一种基于音频处理模型的音频生成方法和装置,该方法包括:确定历史音频序列或历史音频序列和当前音频帧文本向量,对历史音频序列进行自回归处理,得到上下文向量序列;其中,历史音频序列由至少两个历史音频帧组成;音频处理模型基于上下文向量序...
技术分类