Document
拖动滑块完成拼图
首页 专利交易 IP管家助手 科技果 科技人才 积分商城 国际服务 商标交易 会员权益 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索
最新专利技术
  • 根据本公开的实施例,提供了音频处理的方法、装置、设备、存储介质和程序产品。该方法包括:构建与音频数据流相关联的结构化数据;基于结构化数据,生成多种声纹聚类结果,多种声纹聚类结果对应于不同数目的声纹标签;以及基于多种声纹聚类结果对应的评价信息...
  • 本申请提供一种语音交互方法及电子设备,涉及电子设备技术领域,通过在用户抬起电子设备并靠近电子设备的麦克风发出声音的情况下,获取用户输出的语音信息并对获取到的语音信息进行语音唤醒校验。在语音信息通过语音唤醒校验的情况下,由电子设备响应语音信息...
  • 本公开提出了一种音频增强方法、音频增强装置和设备、计算机可读存储介质以及计算机程序产品。音频增强方法包括:接收输入音频;使用多种音频增强模式中的至少一种音频增强模式对输入音频的至少一部分进行处理以生成至少一个经处理音频;至少部分地基于该至少...
  • 本申请实施例公开了一种语音通话方法、装置、电子设备及计算机可读存储介质,涉及语音通话技术领域;该方法包括:获取周围信息和音频信息;音频信息包括通话音频和/或周围音频;根据周围信息和音频信息,识别通话模式;通话模式包括增强通话模式和隐私通话模...
  • 本发明公开了基于多模态大模型的WebRTC语音增强系统及方法,属于人工智能与实时通信交叉技术领域,该系统包括:音视频采集模块,用于通过WebRTC协议栈同步采集用户端的原始语音信号和对应的视频图像数据,并通过时间戳标记与缓存机制实现高精度对...
  • 本申请公开了一种语音识别方法、相关设备及计算机程序产品,本申请在语音降噪模型和语音识别模型之间增加了自适应模型,自适应模型和语音识别模型在训练阶段联合训练,从而使得自适应模型能够基于原始增强语音和带噪语音,重估计与语音识别任务更加适配的增强...
  • 本申请公开了一种语音信息处理方法、装置、设备、存储介质及车辆,包括:获取多个语音通道中每个语音通道的通道语音信号的通道语音时频谱;对多个通道语音时频谱进行融合,得到通道融合时频谱;通过回声消除与降噪模型对通道融合时频谱和每个通道语音时频谱进...
  • 本申请提供一种音频处理方法、电子设备及车辆,音频处理方法包括如下步骤:响应于接收到针对待播放音频的播放指令,确定当前的环境信息以及车辆运行信息;根据所述环境信息以及车辆运行信息对所述待播放音频进行处理,得到目标音频,并控制所述目标音频播放。...
  • 本申请提供一种风噪抑制方法、装置、电子设备、介质及程序产品,涉及主动降噪与嵌入式音频处理技术领域。该方法包括:获取主副麦克风采集的两路时域信号,并对两路时域信号进行差分处理,得到差分信号;对差分信号进行分帧和时频变换,得到频域帧序列;针对每...
  • 本发明涉及语音处理技术领域,具体涉及一种语音信号增强方法及系统,包括:获取目标区域的实时语音信号和历史语音信号,利用改进的最小均方算法对目标区域的实时语音信号进行滤波处理,以增强语音质量;通过引入了自适应初始步长的概念,根据实时信号的自相关...
  • 本申请公开了一种音频渲染方法及相关装置,涉及音频渲染技术领域,包括:针对目标声流中每个声音对象的各个音频采样点中每相邻的两个采样点,根据两个采样点各自的球形坐标,构造两个采样点分别对应的球体,根据两个采样点各自的音频PCM数据、笛卡尔坐标和...
  • 提供了语音驱动模型训练方法、语音驱动方法和装置,涉及人工智能、计算机视觉领域。该模型训练方法包括:获取训练样本,包括至少一个音频信号和与所述至少一个音频信号同步的至少一个面部动画帧;将至少一个面部动画帧输入情绪提取器,获取该至少一个面部动画...
  • 本发明公开了一种音频深度伪造检测方法、装置、终端及存储介质,涉及多媒体信息安全与人工智能技术领域,所述方法通过构建音频深度伪造检测网络模型;根据所述训练集对音频深度伪造检测网络模型进行解耦阶段训练,确定初始训练网络模型;根据训练集对初始训练...
  • 本发明公开了一种电机非稳态工况噪声的声品质客观数据集建立及评价方法和系统,方法包括:采集噪声信号,通过计算变异系数与频谱平坦度变化率,并利用四分位法剔除异常值,确定稳态条件。在非稳态工况下,若相邻噪声段满足稳态条件,则合并,否则分割。基于心...
  • 本申请提供一种声纹检测方法、装置及电子设备,涉及声纹检测技术领域。该方法包括:获取目标声纹数据;所述目标声纹数据为预设检测时间段内待检测变压器的声纹数据;对所述目标声纹数据进行梅尔频谱倒谱系数MFCC特征提取和伽马频率倒谱系数GFCC特征提...
  • 本发明公开了一种基于对比学习的儿童语音表达错误识别与纠正方法,包括:对输入的儿童语音信号进行预处理,得到对数梅尔频谱特征序列,通过改进的Transformer编码器转换为语音语义编码特征;基于年龄自适应正负样本选择机制,利用对比学习方法优化...
  • 本申请涉及人工智能技术领域、智慧医疗领域及金融科技领域,尤其涉及一种基于情感识别的客服优化方法、装置、设备及介质。本申请中实时采集用户的声音信号,得到当前声音段对应的当前情感分类结果,确定情感分类的变化信息,若检测到变化信息和当前情感分类结...
  • 本发明涉及一种语音情绪识别方法及系统,属于智能交互技术领域。包括:获取原始语音信号;计算原始语音信号的帧级分数,并根据帧级分数,将原始语音信号划分为高可靠帧信号和低可靠帧信号;对高可靠帧信号进行特征提取,确定梅尔频率倒谱特征;对低可靠帧信号...
  • 本发明公开了一种抑郁检测模型的训练方法、装置、设备、介质及程序产品,涉及抑郁检测技术领域,包括:获取样本用户的音频数据以及音频数据关联的文本数据;通过初始模型,针对每一样本用户,提取该样本用户的音频数据的声学特征,并对声学特征进行特征提取,...
  • 本公开描述了一种提供从磁记录介质进行数据的热辅助读取的磁记录装置。还描述了一种被配置为促进该热辅助读取的磁记录介质。该磁记录介质包括在磁记录层上方的亚铁磁封盖层,其中该封盖层被配置为在读取操作或过程期间增强从该磁记录层发出的磁场。该亚铁磁封...
技术分类