Document
拖动滑块完成拼图
首页 专利交易 IP管家助手 科技果 科技人才 积分商城 国际服务 商标交易 会员权益 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索
最新专利技术
  • 本申请提供了一种口型同步方法、装置、计算设备集群及存储介质。该方法包括:将音频数据和媒体数据中对应于同一对象的音频片段和目标图像进行关联,并按照该关联关系,对与该音频片段存在关联关系的媒体数据中的目标图像分别作口型同步,得到目标媒体数据,这...
  • 本申请涉及智能人机交互技术领域,公开了一种基于多模态感知与融合的智能会议交互方法及系统该方法包括:获取与会者的多模态数据流;对多模态数据流进行并行分析,并行分析包括:执行第一分析路径,从而获得第一分析结果;并行地,执行第二分析路径,从而获得...
  • 一种基于广义解调核的进化式优化单水听器多源信号分离方法,对单水听器采集到的多个中低频非平稳声源混合信号进行预处理并生成复信号后,通过广义解调得到复调制信号;在高维参数空间内,利用自适应进化优化策略迭代搜索解调参数,并结合时频滤波提取对应信号...
  • 本申请一种面向大语言模型训练的FP8量化噪声补偿方法及系统,涉及计算机大语言模型数据噪声补偿技术领域。所述方法包括:处理器根据设计的FP8格式量化存储器中输入的原始数据,得到量化数据表征。根据存储器中存储的原始数据与量化数据表征获取量化噪声...
  • 本申请公开了一种音频去噪方法及装置,属于音频技术领域,该方法能够有效分离纯净语音,在复杂噪声环境下有效去除噪声、保留语音特征,提高了音频去噪的效果,以及,提升了去噪后的音频质量。
  • 本申请公开了一种风噪抑制方法、装置、设备及存储介质,涉及智能设备技术领域,包括:根据拾音数据生成频谱能量序列;通过模板匹配算法分别计算各个噪声数据与频谱竖条状噪声模板之间的目标相似度;根据目标相似度确定目标竖条噪声,并将目标竖条噪声从频谱能...
  • 本发明涉及会议现场语音交互的回音消除方法领域,具体涉及一种基于机器学习的实时回音消除方法,包括提取多通道空间‑时频特征,将空间特征和时频特征拼接为融合向量,映射至预设区间作为模型输入;根据路径模型追踪动态回音路径,实时监测特征漂移,触发模型...
  • 本发明公开了一种基于MoE的通用语音增强方法及系统,该方法包括:准备训练数据集;实现网络模型设计;设置相关参数及配置文件,利用对抗网络训练模型;加载训练完的模型检查点,利用模型实现对复合失真音频的增强。该模型在时频域建模,并在Transfo...
  • 本发明公开了一种基于梅尔能量特征降维提取的语音降噪方法、装置及存储介质。该方法利用预构建梅尔滤波器组对当前帧语音信号的语音功率谱进行降维处理,得到当前帧语音信号的降维后梅尔功率谱;当前帧语音信号由待降噪语音信号加窗分帧后获得,为非首帧信号;...
  • 本申请提供了一种设备降噪方法、装置、冰箱及计算机可读存储介质,该方法包括:获取待处理噪音信息;对待处理噪音信息进行噪音分离处理,得到多个分离噪音信息;根据各分离噪音信息,控制目标食品保鲜设备降噪。本申请提供的设备降噪方法,能够先获取待处理噪...
  • 本发明公开了一种车外语音变声方法及系统,该方法包括:建立变声场景与变声参数的映射关系,其中,所述变声场景用于表征车辆所处的外部环境;响应于用户操作,确定目标变声场景;基于所述变声场景与变声参数的映射关系,获取与所述目标变声场景对应的目标变声...
  • 本申请实施例提供一种音频处理方法、装置、电子设备、可读存储介质及车辆,获取待处理音频,根据待处理音频,以及与预设音效类型对应的目标音频参数预测模型,获取与预设音效类型对应的预测音频参数;根据待处理音频,以及与预设音效类型对应的目标音频参数误...
  • 一种基于状态空间模型和融合策略的语音转换算法属于语音信号处理领域,针对现有语音转换方法中存在的特征融合策略简化(如简单特征相加)以及模型计算复杂度高、长距离依赖建模能力不足等问题,本发明提出两项核心创新:1、基于交叉注意力与门控机制的新型特...
  • 本公开提供了一种声音处理方法、相关装置和介质。该方法包括:获取第一音频与目标音色对应的第二音频;对第一音频进行特征提取得到源音频特征,以及对第二音频进行声纹特征提取得到目标声纹特征;获取初始隐特征,并将源音频特征、目标声纹特征和初始隐特征输...
  • 本申请公开了一种音频编码方法、装置、设备以及存储介质,涉及音频处理领域,包括:在目标环境下,获取初始音频信号,并对初始音频信号进行分帧处理,得到相应的各音频帧;基于各音频帧的时域特征和频域特征确定各音频帧的类型;若音频帧为第一类帧,则基于预...
  • 本申请实施例公开了一种音频生成方法、装置、设备及存储介质,属于音频处理技术领域。该方法包括:基于音频生成控制条件,通过隐层扩散模型生成目标音频的隐层频谱特征,音频生成控制条件表征对目标音频的生成期望,隐层扩散模型为建模在隐层空间的扩散模型,...
  • 一种基于联邦学习的双分类头声纹识别训练方法。所述训练方法流程包括:客户端提供本地说话人类别信息,服务器整合全局说话人类别,服务器初始化全局分类器和全局编码器,服务器分发全局分类器和全局编码器,客户端接收全局分类器和全局编码器后,同本地分类器...
  • 本发明属于音频处理技术领域,提供一种基于空间声学特征提取的空间声纹识别方法及系统,空间声纹识别方法包括采集目标空间的环境声音;对采集的声音进行重采样和滤除人声;将预处理后的音频分割为多个片段;从音频片段中提取空间声学特征;移除异常音频片段;...
  • 本发明涉及语音分析或语音识别技术领域,具体涉及一种基于FunASR的生僻字转译识别的方法,包括:获取用户输入的待识别音频数据;依据频率波动特性对待识别音频数据进行词汇频段拆分;对有效语音频段中单个文字之间发音变化时产生的频率变动进行分析,并...
  • 一种分段聚类‑特征映射联合的语音摘要方法。所述方法流程包括:首先对长语音按时间戳分段,利用音频编码器提取片段级语义向量,通过无监督聚类算法(K‑means)聚类为N类,并从每类选取最接近簇心的代表性片段,按时序拼接成压缩语音段。随后,通过音...
技术分类