Document
拖动滑块完成拼图
首页 专利交易 IP管家助手 科技果 科技人才 积分商城 国际服务 商标交易 会员权益 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索
最新专利技术
  • 本申请公开了一种音频渲染方法及相关装置,涉及音频渲染技术领域,包括:针对目标声流中每个声音对象的各个音频采样点中每相邻的两个采样点,根据两个采样点各自的球形坐标,构造两个采样点分别对应的球体,根据两个采样点各自的音频PCM数据、笛卡尔坐标和...
  • 本发明涉及语音处理技术领域,具体涉及一种语音信号增强方法及系统,包括:获取目标区域的实时语音信号和历史语音信号,利用改进的最小均方算法对目标区域的实时语音信号进行滤波处理,以增强语音质量;通过引入了自适应初始步长的概念,根据实时信号的自相关...
  • 本申请提供一种风噪抑制方法、装置、电子设备、介质及程序产品,涉及主动降噪与嵌入式音频处理技术领域。该方法包括:获取主副麦克风采集的两路时域信号,并对两路时域信号进行差分处理,得到差分信号;对差分信号进行分帧和时频变换,得到频域帧序列;针对每...
  • 本申请提供一种音频处理方法、电子设备及车辆,音频处理方法包括如下步骤:响应于接收到针对待播放音频的播放指令,确定当前的环境信息以及车辆运行信息;根据所述环境信息以及车辆运行信息对所述待播放音频进行处理,得到目标音频,并控制所述目标音频播放。...
  • 本申请公开了一种语音信息处理方法、装置、设备、存储介质及车辆,包括:获取多个语音通道中每个语音通道的通道语音信号的通道语音时频谱;对多个通道语音时频谱进行融合,得到通道融合时频谱;通过回声消除与降噪模型对通道融合时频谱和每个通道语音时频谱进...
  • 本申请公开了一种语音识别方法、相关设备及计算机程序产品,本申请在语音降噪模型和语音识别模型之间增加了自适应模型,自适应模型和语音识别模型在训练阶段联合训练,从而使得自适应模型能够基于原始增强语音和带噪语音,重估计与语音识别任务更加适配的增强...
  • 本发明公开了基于多模态大模型的WebRTC语音增强系统及方法,属于人工智能与实时通信交叉技术领域,该系统包括:音视频采集模块,用于通过WebRTC协议栈同步采集用户端的原始语音信号和对应的视频图像数据,并通过时间戳标记与缓存机制实现高精度对...
  • 本申请实施例公开了一种语音通话方法、装置、电子设备及计算机可读存储介质,涉及语音通话技术领域;该方法包括:获取周围信息和音频信息;音频信息包括通话音频和/或周围音频;根据周围信息和音频信息,识别通话模式;通话模式包括增强通话模式和隐私通话模...
  • 本公开提出了一种音频增强方法、音频增强装置和设备、计算机可读存储介质以及计算机程序产品。音频增强方法包括:接收输入音频;使用多种音频增强模式中的至少一种音频增强模式对输入音频的至少一部分进行处理以生成至少一个经处理音频;至少部分地基于该至少...
  • 本申请提供一种语音交互方法及电子设备,涉及电子设备技术领域,通过在用户抬起电子设备并靠近电子设备的麦克风发出声音的情况下,获取用户输出的语音信息并对获取到的语音信息进行语音唤醒校验。在语音信息通过语音唤醒校验的情况下,由电子设备响应语音信息...
  • 根据本公开的实施例,提供了音频处理的方法、装置、设备、存储介质和程序产品。该方法包括:构建与音频数据流相关联的结构化数据;基于结构化数据,生成多种声纹聚类结果,多种声纹聚类结果对应于不同数目的声纹标签;以及基于多种声纹聚类结果对应的评价信息...
  • 本发明公开了一种基于唇语识别的多模态抗干扰通信方法及系统,属于通信设备技术领域。该方法包括:获取人脸唇部视频流和音频信号;响应于常规模式触发信号,对唇部视频流和音频信号分别进行特征提取并将提取结果融合,生成融合特征向量;结合唇部运动信息对融...
  • 本发明属于语音交互技术领域,本发明公开了一种基于智能AI的部标终端语音交互方法;包括:对部标终端所处车载环境进行多通道数据采集,并通过多阶段感知增强和信号重构,得到清晰语音信号;基于清晰语音信号进行上下文动态感知和用户身份建模,构建个性化交...
  • 本发明涉及语音识别技术领域,具体涉及一种基于AI的多线益智互动方法及玩具,方法包括:建立语音互动识别会话并在接收开始指令后初始化;连续接收音频片段写入语音特征缓冲区;对片段提取帧级特征入缓冲,当累计超过第一数值长度,提取该长度的序列为批次,...
  • 本申请涉及人工智能技术领域,其公开设备控制方法及相关装置,应用于AI人宠交互机器人,该方法包括:通过多模态数据采集器采集第一多模态数据;通过嵌入式AI模型根据第一多模态数据进行身份识别,得到第一身份标签;在第一身份标签为预设身份标签关联的身...
  • 本发明公开一种支持实时语音流、离线录音文件及ASR报文三种输入形态的大模型‑知识图谱协同智能语音质检方法及系统。方法包括:输入源归一化;LoRA微调大模型提取语义特征;动态合规知识图谱三类上位节点违规匹配;敏感词触发权重提升20%;输出可视...
  • 本申请提供了一种车辆功能控制方法、车机及存储介质,涉及车辆语音控制技术领域。该车辆功能控制方法在监听到用户发出的语音指令的情况下,确定语音指令是否为对车辆功能进行控制的第一控制指令。在确定语音指令为第一控制指令的情况下,确定是否存在与第一控...
  • 本公开提供一种车辆的语音交互方法、装置、车辆和计算设备,涉及自然语言处理技术领域,上述方法包括:接收用户输入的第一语音数据;根据第一语音数据对应的目标意图类别确定目标意图类别对应的目标内容生成模型。在目标意图类别为对话意图,且第一语音数据对...
  • 本发明涉及一种语音交互式电厂设备状态查询系统及方法。系统包括语音交互模块、数据处理模块、数据通信模块和反馈模块;语音交互模块与数据处理模块电连接,语音交互模块用于接收用户语音,并将用户语音转换为语音指令;数据处理模块用于解析语音指令,并基于...
  • 本申请公开一种语音操作游戏方法及相关装置,应用于人工智能等场景。方法包括:识别目标游戏中待操作语音得到待操作文本;识别待操作文本的意图得到待操作意图,并提取待操作文本的实体得到待操作实体集合;基于目标游戏中多个游戏意图、多个游戏函数和多个函...
技术分类