Document
拖动滑块完成拼图
专利交易 商标交易 积分商城 国际服务 IP管家助手 科技果 科技人才 会员权益 需求市场 关于龙图腾 更多
 /  免费注册
到顶部 到底部
清空 搜索
最新专利技术
  • 本申请公开了一种伪造语音检测方法、装置、电子设备及存储介质,涉及语音识别技术领域,包括:采集用户的语音样本,提取生理声学特征,根据生理学特征构建初始可信语音特征模型;获取待检测语音,对待检测语音进行预处理操作以生成待检测语音的语音数据;基于...
  • 本申请提供了一种异常音量检测方法、电子设备、可读存储介质及程序产品;方法包括:获取第一音频数据的左声道数据和右声道数据;对左声道数据和右声道数据进行声道对齐处理,得到声道对齐的左右声道数据;对声道对齐的左右声道数据进行中置混合处理,得到中置...
  • 本公开实施例公开一种音频检测方法、装置、设备及存储介质,包括将原始混合音频信号转换为频域下的音频频谱;经过构建在目标音频检测模型中的频率感知联合模块,对音频频谱的频谱特征进行特征强化处理,获得音频频谱对应的频率感知频谱特征;经过构建在目标音...
  • 本发明公开了一种结合音频转换、误听纠错和误说转译的智能听说辅助系统及其实现方法。该系统基于机器学习技术,深入分析用户的误听模式,构建个性化音频转换模型,能够实时优化语音输出,帮助听障人士更精准地理解语音信息。该系统可广泛应用于智能耳机、手机...
  • 本发明涉及助听器音频分类领域,具体的说是一种助听器音频分类方法,包括分类系统,所述分类系统包括数采集与预处理模块、构建神经网络模型模块、训练模型模块、实时音频输入模块、场景识别阶段模块、个性化调整模块和反馈优化模块;所述数据采集与预处理模块...
  • 本发明涉及一种图像音频生成数字人方法,包括以下步骤:S1:采用Whisper模型对输入的音频信号进行特征编码,从而提取语音中的时序特征,时序特征包括节奏特征、语调变化特征和情感波动特征,基于时序特征获得发音的时序变化,时序特征被输入到基于T...
  • 本发明公开了一种集成鸟类识别与噪音溯源的声纹监测方法及系统,包括以下步骤:位置优化部署阶段:采集目标地的环境参数,基于所述环境参数通过评分模型对多个候选位置进行评估,选定评分最高的候选位置作为麦克风阵列的最终部署位置;声纹数据采集阶段:在所...
  • 本申请公开了一种语音信号输出方法、装置、电子设备及存储介质,通过获取原始语音信号;对所述原始语音信号执行基于字典学习的稀疏化处理,生成第一增强语音功率谱;对所述原始语音信号执行基于主成分分析的稀疏化处理,生成由行分量和列分量组成的第二增强语...
  • 本申请实施例提供了一种发言人识别方法、装置、计算机设备、计算机可读存储介质、计算机程序产品,属于语音识别技术领域。该方法包括:获取语音识别系统生成的原始音频切片序列,原始音频切片序列中的每个原始音频切片包含初始发言人的标识信息及初始发言人的...
  • 本申请实施例提供了一种说话人分离方法和相关设备,属于语音识别技术领域。该方法包括:获取当前音频数据;将当前音频数据输入语音活性检测模型,得到语音片段集合;对每个当前语音片段进行语音文本识别和语音文本分割处理,得到当前语音片段的转换文本与文本...
  • 本发明涉及语音处理技术领域,本发明公开了穿戴式助听设备的降噪与音频增强系统;包括区域识别模块,用于从子区域中识别出目标区域;切分筛选模块,用于从音频样本中筛选出目标样本;降噪调整模块,用于通过降噪模型将目标样本转换为降噪样本;增强拼接模块,...
  • 本发明属于车辆噪声测试技术领域,具体涉及一种匀速噪声主客观评价关联的方法,包括以下步骤:以历史的匀速高速工况下稳态的噪声样本数据为基础,得出基于幂指数及声压级的主观评价评分模型;在测试过程中,对标准音源进行主观评价后,得出选定的标准音源样板...
  • 本申请实施例提供一种语音增强方法、装置、设备和语音交互系统。该方法包括:获取多通道语音信号;基于机器学习模型,确定所述多通道语音信号的子带掩码;基于所述子带掩码,利用自适应波束成形算法计算波束权重;基于所述波束权重对所述多通道语音信号进行增...
  • 本发明公开了一种基于场景识别的智能噪声过滤方法、设备及介质,涉及多媒体信息处理技术领域,包括根据场景与噪声特征匹配结果在不同场景类型下确定噪声过滤策略,对图像数据和音频数据应用噪声过滤策略,获得噪声过滤后的图像数据和音频数据;将噪声过滤后的...
  • 本申请涉及音频处理技术领域,公开了一种音频处理方法、装置、设备及存储介质,方法包括:在接收到当前待处理音频数据的情况下,通过第一音频处理算法对当前待处理音频数据进行第一音频处理,获得第一音频处理结果,第一音频处理结果内的数据量为第一处理数据...
  • 本申请提供一种数字人的肢体动作驱动方法、设备及存储介质,涉及人工智能技术领域。该方法包括:获取待播放语音和待播放语音对应的文本;将文本根据标点划分成多段目标文本,并将待播放语音分割为每段目标文本对应的目标语音;针对多段目标文本中的目标文本,...
  • 本发明涉及零样本歌声音色转换方法及系统,属于数字音频处理及人工智能技术领域,具体为:提取数据集音频的内容特征、基频特征以及音色嵌入;先后构建前端编码器和后端扩散模型后初步训练,采用联合训练的策略,利用数据集音频数据进行端到端的同步优化,完成...
  • 本发明公开一种多模态特征自适应融合与压缩的语义通信、分类方法及装置,多模态特征自适应融合与压缩的语义通信方法包括:对采集的多模态信号进行多模态特征提取,得到多模态特征;对所述多模态特征进行自适应融合,得到融合后的特征;对融合后的特征进行熵编...
  • 本公开提供了一种音频处理方法、装置、设备、存储介质及程序产品,涉及数据处理技术领域。该方法包括:获取待处理音频;并利用编码器对待处理音频进行编码,得到编码特征图,编码特征图中包括第一音频特征和第二音频特征;利用注意力机制基于编码特征图生成注...
  • 本发明涉及智能传感器监测与智能研磨控制技术领域,公开了一种基于声纹分析的水性油墨研磨终点判断方法及系统。其中,方法包括:在水性油墨研磨设备的不同方位布设n个声学传感器;提取频域包络特征与时域扰动特征;对复合特征序列进行状态序列推理;采用状态...
技术分类