Document
拖动滑块完成拼图
专利交易 商标交易 积分商城 国际服务 IP管家助手 科技果 科技人才 会员权益 需求市场 关于龙图腾 更多
 /  免费注册
到顶部 到底部
清空 搜索
最新专利技术
  • 本申请公开了一种语音识别方法及电子设备,基于第一采样率获得第一音频数据;基于第一音频数据确定目标采样参数,目标采样参数对应的采样率与第一采样率不同,基于目标采样参数对应的采样率获得的音频数据进行语音识别的第二准确度高于第一准确度,第一准确度...
  • 本申请公开了一种模型迭代方法、装置、设备及存储介质,本申请涉及车辆语音交互技术领域,该方法包括:获取来自至少两个不同云平台的待处理语音交互数据;通过自动标注模型对待处理语音交互数据进行识别错误类型判定,生成初步标注结果;对初步标注结果进行预...
  • 本申请提供一种短语音识别中的音频截取方法、装置、设备、介质及产品,涉及大数据技术领域。该方法,通过获取实时音频数据流并进行分帧,先确定各个音频帧的声音能量并发送至语音活性检测模块获取语音活性检测属性,再根据各个音频帧的声音能量和语音活性检测...
  • 本发明涉及一种基于多模态深度特征融合的水声目标识别系统及方法,属于水声目标识别领域。首先对获取的水声目标原始音频及关联元数据执行预处理,构建多模态数据集;随后将构建的多模态样本输入识别模型,模型通过多分支特征编码网络分别提取各模态深层表征,...
  • 本发明提供一种闭环学习的说话人日志方法、装置、设备及存储介质,通过说话人日志模型生成带置信度的初始识别结果;采用复合不确定性采样策略,智能筛选出最需人工核查的音频片段获取高质量反馈;利用该反馈实时更新说话人原型记忆库,实现新说话人的低延迟注...
  • 本发明涉及一种获取唤醒关键词的方法、装置和嵌入式设备,方法包括:对音频数据进行分帧并提取音频特征,获取音频特征序列;输入CNN编码器获取编码特征序列;对编码特征序列进行紧凑注意力处理,其中:针对特征序列进行局部因果注意力计算以获得局部注意力...
  • 本发明公开了一种基于注意力机制的阿尔兹海默症早期识别系统,包括:数据预处理模块,用于对长音频片段进行预处理;特征提取模块,用于从所述音频片段中提取声学特征A,从所述文本数据提取传统语言特征T和深层语言特征L;第一拼接模块,用于对所述A、T和...
  • 本申请公开一种语音测试方法、系统、设备和介质,涉及人工智能技术领域,所述方法包括:获取语音测试指令,将语音测试指令输入至车机语音交互模型,以使车机语音交互模型输出语音响应数据;获取语音测试指令对应的预期回复文本以及语音响应数据对应的语音识别...
  • 本发明涉及AI数据大模型分析技术领域,具体公开了基于AI数据大模型的车机语音交互评定系统,包括仿真机器人头颅,仿真机器人头颅上设有拾音器和播放器,车内设有多条移动轨道,仿真机器人头颅下侧设有移动轨道的对应滑槽,所述评定系统还包括车机语音交互...
  • 本申请提供一种红队测试方法、程序产品、存储介质及设备,该方法中,基于强化学习算法,以优化对抗提示的有效性、可读性和多样性为训练目标训练红队模型,训练完成后,利用红队模型生成对抗提示集合,基于该对抗提示集合检测待检测的大语言模型是否存在安全风...
  • 本发明公开了一种基于语音结构特征的藏语书面语字音转换方法,属于数据处理技术领域,包括以下步骤:S1、得到藏语文本;S2、将藏语文本以音节为单位进行文本分割处理,并基于藏语的字形结构提取各音节的字形结构要素,得到音节字形结构要素集;S3、基于...
  • 本发明涉及语音翻译技术领域,具体涉及一种基于人工智能的语音翻译方法及系统,包括:获取规范化语音波形和唇部图像序列,依次输入前端网络和后端网络;提取第一音频特征序列,并通过一维卷积降维和时序建模得到第二音频特征序列;对唇部图像序列处理,得到的...
  • 本发明公开了一种供服电话语音解析方法:S1采集具有地区特色和电力业务场景的方言语音样本,进行精细化文本和音素级标注,构建高质量标注语音库;S2选用Whisper作为基础模型,对输入语音进行预处理;S3利用标注好的方言语音数据,对基座模型进行...
  • 本发明涉及语音合成技术领域,揭露了一种语音识别与合成辅助教学方法及系统,所述方法包括:获取目标学习者的纯净语音数据,并根据标准化课程大纲,解析出当前教学内容的关键语言知识点;对纯净语音数据进行异构特征融合,得到个性化特征集;对关键语言知识点...
  • 本申请公开了一种陪跑语音生成方法、装置、非易失性存储介质及电子设备。其中,该方法包括:获取目标对象在当前运动下的运动生理数据,运动状态数据,定位数据,环境数据,以及静态生理特征数据;基于运动生理数据,运动状态数据,定位数据,环境数据,以及静...
  • 本申请属于人工智能技术领域,涉及一种语音合成方法、装置、设备及存储介质,通过获取预测出的所有副语言标签以及每个副语言标签的初始插入信息;将待合成语音文本数据和所有副语言标签输入到改进型语音合成模型中;提取语义特征、情感特征和动态韵律特征作为...
  • 本申请实施例属于音频处理技术领域,涉及一种语音合成方法、装置、计算机设备及存储介质,该方法包括:获取语音提示文本;将所述音色提示文本输入至音色编码器进行音色编码,得到音色特征向量;将所述情感提示文本输入至情感编码器进行情感编码,得到情感特征...
  • 本申请公开一种语音合成方法、装置、计算机设备及存储介质,涉及人工智能技术领域,可以应用于医疗类语音生成场景或金融类语音生成场景。通过语义token路径增强了语音对深层语义结构的建模能力,保证了语义表达的连贯性和清晰度;通过文本条件与语音提示...
  • 本申请实施例属于音频处理技术领域,涉及一种语音合成方法、装置、计算机设备及存储介质,该方法包括:获取模型训练数据;调用原始多用户语音合成模型,并将用户标识以及训练文本输入至原始多用户语音合成模型,得到合成语音;根据合成语音以及训练语音构建联...
  • 本公开提供了一种语音生成方法、装置、设备、程序产品及机器人,涉及语音交互技术领域。该语音生成方法包括从目标语音信号中获取目标情绪特征数据,目标情绪特征数据由目标语音信号的声学特征参数构建;利用情绪语素模型生成与目标情绪特征数据对应的目标语素...
技术分类