Document
拖动滑块完成拼图
首页 专利交易 IP管家助手 科技果 科技人才 积分商城 国际服务 商标交易 会员权益 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索
最新专利技术
  • 本发明公开了一种基于唇语识别的多模态抗干扰通信方法及系统,属于通信设备技术领域。该方法包括:获取人脸唇部视频流和音频信号;响应于常规模式触发信号,对唇部视频流和音频信号分别进行特征提取并将提取结果融合,生成融合特征向量;结合唇部运动信息对融...
  • 本发明属于语音交互技术领域,本发明公开了一种基于智能AI的部标终端语音交互方法;包括:对部标终端所处车载环境进行多通道数据采集,并通过多阶段感知增强和信号重构,得到清晰语音信号;基于清晰语音信号进行上下文动态感知和用户身份建模,构建个性化交...
  • 本发明涉及语音识别技术领域,具体涉及一种基于AI的多线益智互动方法及玩具,方法包括:建立语音互动识别会话并在接收开始指令后初始化;连续接收音频片段写入语音特征缓冲区;对片段提取帧级特征入缓冲,当累计超过第一数值长度,提取该长度的序列为批次,...
  • 本申请涉及人工智能技术领域,其公开设备控制方法及相关装置,应用于AI人宠交互机器人,该方法包括:通过多模态数据采集器采集第一多模态数据;通过嵌入式AI模型根据第一多模态数据进行身份识别,得到第一身份标签;在第一身份标签为预设身份标签关联的身...
  • 本发明公开一种支持实时语音流、离线录音文件及ASR报文三种输入形态的大模型‑知识图谱协同智能语音质检方法及系统。方法包括:输入源归一化;LoRA微调大模型提取语义特征;动态合规知识图谱三类上位节点违规匹配;敏感词触发权重提升20%;输出可视...
  • 本申请提供了一种车辆功能控制方法、车机及存储介质,涉及车辆语音控制技术领域。该车辆功能控制方法在监听到用户发出的语音指令的情况下,确定语音指令是否为对车辆功能进行控制的第一控制指令。在确定语音指令为第一控制指令的情况下,确定是否存在与第一控...
  • 本公开提供一种车辆的语音交互方法、装置、车辆和计算设备,涉及自然语言处理技术领域,上述方法包括:接收用户输入的第一语音数据;根据第一语音数据对应的目标意图类别确定目标意图类别对应的目标内容生成模型。在目标意图类别为对话意图,且第一语音数据对...
  • 本发明涉及一种语音交互式电厂设备状态查询系统及方法。系统包括语音交互模块、数据处理模块、数据通信模块和反馈模块;语音交互模块与数据处理模块电连接,语音交互模块用于接收用户语音,并将用户语音转换为语音指令;数据处理模块用于解析语音指令,并基于...
  • 本申请公开一种语音操作游戏方法及相关装置,应用于人工智能等场景。方法包括:识别目标游戏中待操作语音得到待操作文本;识别待操作文本的意图得到待操作意图,并提取待操作文本的实体得到待操作实体集合;基于目标游戏中多个游戏意图、多个游戏函数和多个函...
  • 本申请公开了一种智能语音采集方法、装置、设备、存储介质及程序产品,涉及物联网技术领域。该方法包括:在多个语音采集设备中的第一语音采集设备被唤醒并对声源的语音数据进行采集的情况下,获取所述第一语音采集设备的设备运动信息;根据所述第一语音采集设...
  • 本申请公开了一种信息交互方法、终端、云端服务器、设备、介质及产品,终端从云端服务器中获取备选推荐话题,通过向用户输出备选推荐话题引导用户选取目标推荐话题,从而通过语音助手中的大语言模型,基于目标推荐话题与用户进行交互。根据本申请实施例,可以...
  • 本发明公开了一种基于多阶段大模型的语音交互方法及系统,属于语音识别技术领域。本发明通过意图识别大模型、联网应答大模型和本地指令大模型构建了多阶段大模型框架,通过意图识别大模型识别交互文本的文本类别,再基于文本类别的不同,选择联网应答大模型或...
  • 本申请提供了一种基于语音的用户意图识别方法及装置、设备、介质,属于意图识别技术领域,该方法包括:响应于接收到启动性语音,获取环境信息;基于第一语音确定第一文本;其中,第一语音为该语音设备对应的用户在发出启动性语音之后发出的指令性语音,第一文...
  • 本发明提供一种语音交互补偿方法及装置,涉及数据处理技术领域,包括:获取待处理语音音频和所述待处理语音音频对应的对话历史信息;其中,所述待处理语音音频中包含多个语音音频片段,各个相邻所述语音音频片段之间的时间间隔小于预设时间间隔;将所述待处理...
  • 本发明涉及语音处理技术领域,具体为一种基于流式增量推理的实时意图识别方法及系统,包括以下步骤:通过语音采集模块接收用户语音输入,并将语音切片成多个音频帧,借助增量大语言模型模块,采用Early‑Exit推理机制,在模型的多个层次设置侧出口,...
  • 本发明属于核电站运行规程技术领域,具体涉及一种应用于数字化规程的新型防人因工具。在数字规程系统防人因模块中增加语音监护选项,与监护、自检功能并列;在数字规程系统中增加语音朗读功能;在数字规程系统中增加智慧语音识别功能;确认数字规程系统规程数...
  • 本申请提供了一种对象识别方法、对象识别模型的训练方法、装置、电子设备、存储介质及程序产品;方法包括:在目标时段内向待识别对象发送声音信号,目标时段包括第一时段和第二时段;其中,第一时段内待识别对象保持静止,第二时段内待识别对象执行规定动作;...
  • 本公开提供了一种基于批次的动态语音识别方法、装置、设备、介质和产品,基于批次的动态语音识别方法将语音分割为多条音频并将音频打包成音频批次;按照预设的线程数量为音频批次分别分配线程,以并行方式对多个音频批次进行语音识别;每个线程处理完当前音频...
  • 本申请涉及语音识别技术领域,具体涉及用于声乐发音训练的声音模型生成方法及系统,该方法包括:采集训练者对于预设数量条不同内容的声音信号,每条内容采集预设数目个声音信号;针对任一内容及其任一声音信号的任一模态分量,获取所述任一模态分量的各对照分...
  • 本申请公开了一种伪造语音检测方法及系统,涉及语音识别技术领域,该方法包括提取待检测语音的时序一致性特征,所述时序一致性特征包括音高波动特征、能量变化特征;提取待检测语音的声学特征,所述声学特征包括线性频率倒谱系数频谱特征;将时序一致性特征和...
技术分类