Document
拖动滑块完成拼图
首页 专利交易 IP管家助手 科技果 科技人才 积分商城 国际服务 商标交易 会员权益 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索
最新专利技术
  • 本申请涉及人工智能技术领域,其公开设备控制方法及相关装置,应用于AI人宠交互机器人,该方法包括:通过多模态数据采集器采集第一多模态数据;通过嵌入式AI模型根据第一多模态数据进行身份识别,得到第一身份标签;在第一身份标签为预设身份标签关联的身...
  • 本发明公开一种支持实时语音流、离线录音文件及ASR报文三种输入形态的大模型‑知识图谱协同智能语音质检方法及系统。方法包括:输入源归一化;LoRA微调大模型提取语义特征;动态合规知识图谱三类上位节点违规匹配;敏感词触发权重提升20%;输出可视...
  • 本申请提供了一种车辆功能控制方法、车机及存储介质,涉及车辆语音控制技术领域。该车辆功能控制方法在监听到用户发出的语音指令的情况下,确定语音指令是否为对车辆功能进行控制的第一控制指令。在确定语音指令为第一控制指令的情况下,确定是否存在与第一控...
  • 本公开提供一种车辆的语音交互方法、装置、车辆和计算设备,涉及自然语言处理技术领域,上述方法包括:接收用户输入的第一语音数据;根据第一语音数据对应的目标意图类别确定目标意图类别对应的目标内容生成模型。在目标意图类别为对话意图,且第一语音数据对...
  • 本发明涉及一种语音交互式电厂设备状态查询系统及方法。系统包括语音交互模块、数据处理模块、数据通信模块和反馈模块;语音交互模块与数据处理模块电连接,语音交互模块用于接收用户语音,并将用户语音转换为语音指令;数据处理模块用于解析语音指令,并基于...
  • 本申请公开一种语音操作游戏方法及相关装置,应用于人工智能等场景。方法包括:识别目标游戏中待操作语音得到待操作文本;识别待操作文本的意图得到待操作意图,并提取待操作文本的实体得到待操作实体集合;基于目标游戏中多个游戏意图、多个游戏函数和多个函...
  • 本申请公开了一种智能语音采集方法、装置、设备、存储介质及程序产品,涉及物联网技术领域。该方法包括:在多个语音采集设备中的第一语音采集设备被唤醒并对声源的语音数据进行采集的情况下,获取所述第一语音采集设备的设备运动信息;根据所述第一语音采集设...
  • 本申请公开了一种信息交互方法、终端、云端服务器、设备、介质及产品,终端从云端服务器中获取备选推荐话题,通过向用户输出备选推荐话题引导用户选取目标推荐话题,从而通过语音助手中的大语言模型,基于目标推荐话题与用户进行交互。根据本申请实施例,可以...
  • 本发明公开了一种基于多阶段大模型的语音交互方法及系统,属于语音识别技术领域。本发明通过意图识别大模型、联网应答大模型和本地指令大模型构建了多阶段大模型框架,通过意图识别大模型识别交互文本的文本类别,再基于文本类别的不同,选择联网应答大模型或...
  • 本申请提供了一种基于语音的用户意图识别方法及装置、设备、介质,属于意图识别技术领域,该方法包括:响应于接收到启动性语音,获取环境信息;基于第一语音确定第一文本;其中,第一语音为该语音设备对应的用户在发出启动性语音之后发出的指令性语音,第一文...
  • 本发明提供一种语音交互补偿方法及装置,涉及数据处理技术领域,包括:获取待处理语音音频和所述待处理语音音频对应的对话历史信息;其中,所述待处理语音音频中包含多个语音音频片段,各个相邻所述语音音频片段之间的时间间隔小于预设时间间隔;将所述待处理...
  • 本发明涉及语音处理技术领域,具体为一种基于流式增量推理的实时意图识别方法及系统,包括以下步骤:通过语音采集模块接收用户语音输入,并将语音切片成多个音频帧,借助增量大语言模型模块,采用Early‑Exit推理机制,在模型的多个层次设置侧出口,...
  • 本发明属于核电站运行规程技术领域,具体涉及一种应用于数字化规程的新型防人因工具。在数字规程系统防人因模块中增加语音监护选项,与监护、自检功能并列;在数字规程系统中增加语音朗读功能;在数字规程系统中增加智慧语音识别功能;确认数字规程系统规程数...
  • 本申请提供了一种对象识别方法、对象识别模型的训练方法、装置、电子设备、存储介质及程序产品;方法包括:在目标时段内向待识别对象发送声音信号,目标时段包括第一时段和第二时段;其中,第一时段内待识别对象保持静止,第二时段内待识别对象执行规定动作;...
  • 本公开提供了一种基于批次的动态语音识别方法、装置、设备、介质和产品,基于批次的动态语音识别方法将语音分割为多条音频并将音频打包成音频批次;按照预设的线程数量为音频批次分别分配线程,以并行方式对多个音频批次进行语音识别;每个线程处理完当前音频...
  • 本申请涉及语音识别技术领域,具体涉及用于声乐发音训练的声音模型生成方法及系统,该方法包括:采集训练者对于预设数量条不同内容的声音信号,每条内容采集预设数目个声音信号;针对任一内容及其任一声音信号的任一模态分量,获取所述任一模态分量的各对照分...
  • 本申请公开了一种伪造语音检测方法及系统,涉及语音识别技术领域,该方法包括提取待检测语音的时序一致性特征,所述时序一致性特征包括音高波动特征、能量变化特征;提取待检测语音的声学特征,所述声学特征包括线性频率倒谱系数频谱特征;将时序一致性特征和...
  • 本发明涉及语音合成技术领域,具体是一种语料训练库跨平台调用方法及系统,包括获取待合成音频的文本内容并拆解得到停顿位置序列,根据预设语言标识选择对应语料训练库,提取字符音素发音时长计算基础音素时长。通过情感分类模型识别文本情感特征,构建包含情...
  • 本发明涉及数据处理技术领域,公开一种文本转语音的合成方法、装置、设备及介质,可应用于金融、医疗领域,该方法包括利用文本数据生成对应的文本语义向量并生成起始样本点;基于起始样本点进行一致性流匹配建模处理,得到速度场;基于速度场迭代更新起始样本...
  • 本发明涉及人工智能领域,揭露了基于AI大模型的白噪声生成方法,包括:收集用户在交互式用户界面中的用户操作事件,对用户操作事件进行多源整合,得到用户交互行为,分析出用户对应的白噪声配置参数;生成用户所需的原始音频片段,对原始音频片段进行振幅调...
技术分类