Document
拖动滑块完成拼图
专利交易 商标交易 积分商城 国际服务 IP管家助手 科技果 科技人才 会员权益 需求市场 关于龙图腾 更多
 /  免费注册
到顶部 到底部
清空 搜索
最新专利技术
  • 本发明涉及AI数据大模型分析技术领域,具体公开了基于AI数据大模型的车机语音交互评定系统,包括仿真机器人头颅,仿真机器人头颅上设有拾音器和播放器,车内设有多条移动轨道,仿真机器人头颅下侧设有移动轨道的对应滑槽,所述评定系统还包括车机语音交互...
  • 本申请公开一种语音测试方法、系统、设备和介质,涉及人工智能技术领域,所述方法包括:获取语音测试指令,将语音测试指令输入至车机语音交互模型,以使车机语音交互模型输出语音响应数据;获取语音测试指令对应的预期回复文本以及语音响应数据对应的语音识别...
  • 本发明公开了一种基于注意力机制的阿尔兹海默症早期识别系统,包括:数据预处理模块,用于对长音频片段进行预处理;特征提取模块,用于从所述音频片段中提取声学特征A,从所述文本数据提取传统语言特征T和深层语言特征L;第一拼接模块,用于对所述A、T和...
  • 本发明涉及一种获取唤醒关键词的方法、装置和嵌入式设备,方法包括:对音频数据进行分帧并提取音频特征,获取音频特征序列;输入CNN编码器获取编码特征序列;对编码特征序列进行紧凑注意力处理,其中:针对特征序列进行局部因果注意力计算以获得局部注意力...
  • 本发明提供一种闭环学习的说话人日志方法、装置、设备及存储介质,通过说话人日志模型生成带置信度的初始识别结果;采用复合不确定性采样策略,智能筛选出最需人工核查的音频片段获取高质量反馈;利用该反馈实时更新说话人原型记忆库,实现新说话人的低延迟注...
  • 本发明涉及一种基于多模态深度特征融合的水声目标识别系统及方法,属于水声目标识别领域。首先对获取的水声目标原始音频及关联元数据执行预处理,构建多模态数据集;随后将构建的多模态样本输入识别模型,模型通过多分支特征编码网络分别提取各模态深层表征,...
  • 本申请提供一种短语音识别中的音频截取方法、装置、设备、介质及产品,涉及大数据技术领域。该方法,通过获取实时音频数据流并进行分帧,先确定各个音频帧的声音能量并发送至语音活性检测模块获取语音活性检测属性,再根据各个音频帧的声音能量和语音活性检测...
  • 本申请公开了一种模型迭代方法、装置、设备及存储介质,本申请涉及车辆语音交互技术领域,该方法包括:获取来自至少两个不同云平台的待处理语音交互数据;通过自动标注模型对待处理语音交互数据进行识别错误类型判定,生成初步标注结果;对初步标注结果进行预...
  • 本申请公开了一种语音识别方法及电子设备,基于第一采样率获得第一音频数据;基于第一音频数据确定目标采样参数,目标采样参数对应的采样率与第一采样率不同,基于目标采样参数对应的采样率获得的音频数据进行语音识别的第二准确度高于第一准确度,第一准确度...
  • 本发明公开了一种规则引擎和LLM结合的语音质检方法及系统,解决了现有技术中语音质检规则引擎语义理解能力薄弱,对复杂、非结构化质检项的识别覆盖率低、漏检率高的问题,方法包括步骤:从待质检音频中提取对话语音流,将对话语音流转换为文本信息;建立语...
  • 本发明公开了一种语音处理方法、装置、电子设备和存储介质,其中,该方法应用计算机应用技术领域,该方法包括:获取语音输入信号和参考信号的音频信息;根据语音输入信号的信号特征获得卷积参数,按照卷积参数调整神经网络的卷积核,其中,信号特征包括频域特...
  • 本发明属于语音识别技术领域,具体涉及用于线上会议的语音识别方法,其方法包括:实时采集音频流数据,计算短时峭度、多尺度排列熵及均方根能量;基于上述多维统计特征动态计算最佳带宽限制因子,对当前帧音频信号进行变分模态分解,得到若干本征模态函数分量...
  • 本发明属于数据传输与处理技术领域,具体涉及AI眼镜的低功耗语音识别与本地任务缓冲方法,包括以下步骤:第一级模拟检测电路监测麦克风输出的模拟信号,模拟信号幅度连续超过声压门限的持续时长达到激活时长时输出第一级唤醒脉冲以唤醒第二级数字信号处理器...
  • 本申请实施例提供了一种语音交互方法、装置、计算机设备及可读存储介质。方法包括:获取目标对象输入的第一交互音频,并对第一交互音频进行音素分析,得到音素序列;获取目标对象关联历史交互文本,并将音素序列和历史交互文本输入至大语言模型中进行语义分析...
  • 本申请提供了一种口语理解方法、装置、电子设备及存储介质,该方法包括:将语音特征图输入口语理解模型中的特征提取模块,得到共享表征矩阵;将共享表征矩阵输入口语理解模型中的模态转换模块,得到初始文本表征;将初始文本表征输入口语理解模型中的文本增强...
  • 本申请涉及语音处理技术领域,公开了语义响应方法、装置、车辆及存储介质,该方法包括:获取用户的流式目标音频段的声学特征和语义特征;根据声学特征和语义特征得到融合特征;根据融合特征确定流式目标音频段对应的语义状态标签;语义状态标签包括语义不完整...
  • 本申请公开了一种语音交互方法和语音交互装置。语音交互方法包括:在存在历史轮请求和/或历史轮对话的情况下,采用大语言模型结合历史轮请求和/或历史轮对话处理当前轮请求,以拼接历史轮请求和当前轮请求为补全当前轮请求;采用大语言模型处理补全当前轮请...
  • 本申请公开了一种语音交互方法、语音交互装置和计算机可读存储介质。语音交互方法包括:采用大语言模型结合用户记忆数据库处理当前轮请求,以从至少一个备选应用程序接口中确定目标应用程序接口;其中,备选应用程序接口包括:应用程序接口的接口信息与当前轮...
  • 本申请提供一种语音交互方法,方法包括:获取定制目标车载系统功能定制方案的当前语音请求,若根据当前语音请求的自然语言处理结果确定的车载系统功能定制方案中触发条件和/或执行动作存在缺失,则通过大语言模型,自当前语音请求确定目标触发条件和目标执行...
  • 本申请涉及一种语音控制方法、装置和声控耳机。该方法包括:获取气导传感器采集到的气导语音信号,以及骨导传感器采集到的骨导振动信号,根据骨导振动信号确定气导语音信号的有效性,以在气导语音信号有效的情况下,执行气导语音信号指示的操作任务。上述方法...
技术分类