Document
拖动滑块完成拼图
专利交易 商标交易 积分商城 国际服务 IP管家助手 科技果 科技人才 会员权益 需求市场 关于龙图腾 更多
 /  免费注册
到顶部 到底部
清空 搜索
最新专利技术
  • 本申请涉及一种多语言语音内容识别方法及系统,属于语音信号处理技术领域,识别方法包括:采集原始音频流数据并执行降噪滤波处理,分割为多个音频片段;提取音频片段的声学特征向量;将音频片段输入语音识别模型组,获取文本片段及置信度评分;融合所有文本片...
  • 本申请公开了一种信息显示方法、装置、电子设备及可读存储介质,属于人工智能技术领域,该方法包括:从麦克风采集的音频数据中,获取人声音频数据;在人声音频数据包括唤醒关键词的情况下,显示第一信息;其中,第一信息包括以下至少一项:说话内容描述信息;...
  • 本申请涉及语音处理技术领域,公开了语音处理系统、方法、车辆及存储介质,该系统包括:识别模块用于对音频段序列中第一音频段进行特征识别,得到第一特征信息;基于第一特征信息进行文字识别,得到第一文字识别结果;判断模块用于将第一特征信息与音频段序列...
  • 本发明公开了一种说话主体识别方法、装置、设备及可读存储介质,应用于智能识别技术领域,包括:利用预训练模型从待识别音频中提取第一特征;从待识别音频中提取频谱特征,利用高层声学特征提取模型从频谱特征中提取第二特征;对第一特征和第二特征进行融合得...
  • 本发明公开了一种基于深度语音嵌入的声纹注册方法及装置,属于语音生物识别技术领域。该方法包括采集自然场景下的语音数据,将语音数据存储至本地环形缓冲区,以统一采样率对语音数据进行重采样,采用滑动窗口技术对重采样后的语音数据进行分段,基于滤波器组...
  • 本发明提供了一种声纹合成方法、装置、电子设备和存储介质,包括:基于原始说话人语音片段确定标准化语音特征并构建战场噪声物理参数库;基于标准化语音特征、情感标签和噪声参数,通过身份保留生成网络确定合成语音和语音质量感知评估指标;基于合成语音和真...
  • 本申请公开了一种说话人识别方法、装置、设备及存储介质,涉及人工智能技术领域,包括:将初始说话人语音数据集中的数据输入至初始语音预训练模型中;从初始语音预训练模型中确定满足预设性能最优条件的目标Transformer层,并对初始语音预训练模型...
  • 本申请公开了一种会议语音数据处理方法、装置、电子设备和存储介质,属于计算机技术领域,所述方法包括:对会议语音数据进行检测、声学特征提取与聚类处理,生成带说话人标签的语音序列;经语音识别后,基于文本序列的上下文分析和身份指示信息,修正说话人标...
  • 本发明涉及一种佩戴在猫狗身上的声音采集设备,该设备通过Wi‑Fi将采集到的声音数据传输至用户终端,并结合手机摄像头采集的视频数据,利用优化的数据采集流程与改进的分类算法,提高猫狗意图识别的准确率。本发明通过多语言预训练模型、转向量模块和预训...
  • 本发明涉及智能传感器监测与智能研磨控制技术领域,公开了一种基于声纹分析的水性油墨研磨终点判断方法及系统。其中,方法包括:在水性油墨研磨设备的不同方位布设n个声学传感器;提取频域包络特征与时域扰动特征;对复合特征序列进行状态序列推理;采用状态...
  • 本公开提供了一种音频处理方法、装置、设备、存储介质及程序产品,涉及数据处理技术领域。该方法包括:获取待处理音频;并利用编码器对待处理音频进行编码,得到编码特征图,编码特征图中包括第一音频特征和第二音频特征;利用注意力机制基于编码特征图生成注...
  • 本发明公开一种多模态特征自适应融合与压缩的语义通信、分类方法及装置,多模态特征自适应融合与压缩的语义通信方法包括:对采集的多模态信号进行多模态特征提取,得到多模态特征;对所述多模态特征进行自适应融合,得到融合后的特征;对融合后的特征进行熵编...
  • 本发明涉及零样本歌声音色转换方法及系统,属于数字音频处理及人工智能技术领域,具体为:提取数据集音频的内容特征、基频特征以及音色嵌入;先后构建前端编码器和后端扩散模型后初步训练,采用联合训练的策略,利用数据集音频数据进行端到端的同步优化,完成...
  • 本申请提供一种数字人的肢体动作驱动方法、设备及存储介质,涉及人工智能技术领域。该方法包括:获取待播放语音和待播放语音对应的文本;将文本根据标点划分成多段目标文本,并将待播放语音分割为每段目标文本对应的目标语音;针对多段目标文本中的目标文本,...
  • 本申请涉及音频处理技术领域,公开了一种音频处理方法、装置、设备及存储介质,方法包括:在接收到当前待处理音频数据的情况下,通过第一音频处理算法对当前待处理音频数据进行第一音频处理,获得第一音频处理结果,第一音频处理结果内的数据量为第一处理数据...
  • 本发明公开了一种基于场景识别的智能噪声过滤方法、设备及介质,涉及多媒体信息处理技术领域,包括根据场景与噪声特征匹配结果在不同场景类型下确定噪声过滤策略,对图像数据和音频数据应用噪声过滤策略,获得噪声过滤后的图像数据和音频数据;将噪声过滤后的...
  • 本申请实施例提供一种语音增强方法、装置、设备和语音交互系统。该方法包括:获取多通道语音信号;基于机器学习模型,确定所述多通道语音信号的子带掩码;基于所述子带掩码,利用自适应波束成形算法计算波束权重;基于所述波束权重对所述多通道语音信号进行增...
  • 本发明属于车辆噪声测试技术领域,具体涉及一种匀速噪声主客观评价关联的方法,包括以下步骤:以历史的匀速高速工况下稳态的噪声样本数据为基础,得出基于幂指数及声压级的主观评价评分模型;在测试过程中,对标准音源进行主观评价后,得出选定的标准音源样板...
  • 本发明涉及语音处理技术领域,本发明公开了穿戴式助听设备的降噪与音频增强系统;包括区域识别模块,用于从子区域中识别出目标区域;切分筛选模块,用于从音频样本中筛选出目标样本;降噪调整模块,用于通过降噪模型将目标样本转换为降噪样本;增强拼接模块,...
  • 本申请实施例提供了一种说话人分离方法和相关设备,属于语音识别技术领域。该方法包括:获取当前音频数据;将当前音频数据输入语音活性检测模型,得到语音片段集合;对每个当前语音片段进行语音文本识别和语音文本分割处理,得到当前语音片段的转换文本与文本...
技术分类