Document
拖动滑块完成拼图
首页 专利交易 IP管家助手 科技果 科技人才 积分商城 国际服务 商标交易 会员权益 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索
最新专利技术
  • 本发明公开了一种基于梅尔能量特征降维提取的语音降噪方法、装置及存储介质。该方法利用预构建梅尔滤波器组对当前帧语音信号的语音功率谱进行降维处理,得到当前帧语音信号的降维后梅尔功率谱;当前帧语音信号由待降噪语音信号加窗分帧后获得,为非首帧信号;...
  • 本申请提供了一种设备降噪方法、装置、冰箱及计算机可读存储介质,该方法包括:获取待处理噪音信息;对待处理噪音信息进行噪音分离处理,得到多个分离噪音信息;根据各分离噪音信息,控制目标食品保鲜设备降噪。本申请提供的设备降噪方法,能够先获取待处理噪...
  • 本发明公开了一种车外语音变声方法及系统,该方法包括:建立变声场景与变声参数的映射关系,其中,所述变声场景用于表征车辆所处的外部环境;响应于用户操作,确定目标变声场景;基于所述变声场景与变声参数的映射关系,获取与所述目标变声场景对应的目标变声...
  • 本申请实施例提供一种音频处理方法、装置、电子设备、可读存储介质及车辆,获取待处理音频,根据待处理音频,以及与预设音效类型对应的目标音频参数预测模型,获取与预设音效类型对应的预测音频参数;根据待处理音频,以及与预设音效类型对应的目标音频参数误...
  • 一种基于状态空间模型和融合策略的语音转换算法属于语音信号处理领域,针对现有语音转换方法中存在的特征融合策略简化(如简单特征相加)以及模型计算复杂度高、长距离依赖建模能力不足等问题,本发明提出两项核心创新:1、基于交叉注意力与门控机制的新型特...
  • 本公开提供了一种声音处理方法、相关装置和介质。该方法包括:获取第一音频与目标音色对应的第二音频;对第一音频进行特征提取得到源音频特征,以及对第二音频进行声纹特征提取得到目标声纹特征;获取初始隐特征,并将源音频特征、目标声纹特征和初始隐特征输...
  • 本申请公开了一种音频编码方法、装置、设备以及存储介质,涉及音频处理领域,包括:在目标环境下,获取初始音频信号,并对初始音频信号进行分帧处理,得到相应的各音频帧;基于各音频帧的时域特征和频域特征确定各音频帧的类型;若音频帧为第一类帧,则基于预...
  • 本申请实施例公开了一种音频生成方法、装置、设备及存储介质,属于音频处理技术领域。该方法包括:基于音频生成控制条件,通过隐层扩散模型生成目标音频的隐层频谱特征,音频生成控制条件表征对目标音频的生成期望,隐层扩散模型为建模在隐层空间的扩散模型,...
  • 一种基于联邦学习的双分类头声纹识别训练方法。所述训练方法流程包括:客户端提供本地说话人类别信息,服务器整合全局说话人类别,服务器初始化全局分类器和全局编码器,服务器分发全局分类器和全局编码器,客户端接收全局分类器和全局编码器后,同本地分类器...
  • 本发明属于音频处理技术领域,提供一种基于空间声学特征提取的空间声纹识别方法及系统,空间声纹识别方法包括采集目标空间的环境声音;对采集的声音进行重采样和滤除人声;将预处理后的音频分割为多个片段;从音频片段中提取空间声学特征;移除异常音频片段;...
  • 本发明涉及语音分析或语音识别技术领域,具体涉及一种基于FunASR的生僻字转译识别的方法,包括:获取用户输入的待识别音频数据;依据频率波动特性对待识别音频数据进行词汇频段拆分;对有效语音频段中单个文字之间发音变化时产生的频率变动进行分析,并...
  • 一种分段聚类‑特征映射联合的语音摘要方法。所述方法流程包括:首先对长语音按时间戳分段,利用音频编码器提取片段级语义向量,通过无监督聚类算法(K‑means)聚类为N类,并从每类选取最接近簇心的代表性片段,按时序拼接成压缩语音段。随后,通过音...
  • 本发明提供一种自动标注语音数据中语气的方法及装置、设备、介质,该方法包括:获取待处理的语音数据;提取语音数据中的非音素内容,得到多个语音片段及其对应的时段;利用预训练的神经网络模型提取每个语音片段的隐藏信息,得到每个语音片段对应的语音特征;...
  • 本发明公开了一种同声传译方法、装置、设备、介质及产品。该方法包括:对源语言音频流进行文本识别得到源语言文本;对所述源语言文本进行断句和术语纠正,得到待翻译语句;通过大模型对所述待翻译语句进行语义分段并翻译,得到目标语言文本。本发明实施例可以...
  • 本发明实施例提供了一种车辆便签实现方法、终端、座舱、系统、电子设备及存储介质。该方法包括:通过语音助手识别车内用户的用户语音,判断识别到的用户语音中是否包含与便签对应的第一车载关键词;若包含所述第一车载关键词,则进入车载便签模式,将所述语音...
  • 本发明提供的基于车载智能终端的AI多模态语音交互方法、电子设备,包括:通过车载智能终端上的麦克风阵列、车内摄像头及方向盘触控传感器,同步采集用户的语音信息、面部微表情及手部触控动作,形成多模态交互数据;对所述多模态交互数据进行融合,并通过预...
  • 本申请提供了一种语音控制方法及语音控制系统,其中,该方法包括:在感知到物理空间中的用户发出的语音控制指令后,将语音控制指令中的语音内容转换为第一文本;应用编排系统基于第一文本中的内容,对用户的语音控制指令进行分类确定指令类型;根据空间标识,...
  • 本申请提供了一种实现离在线混合识别翻译结果的处理方法、系统及介质,该方法包括:获取输入音频,将输入音频进行预处理,得到优化音频;对优化音频进行同步识别,得到离线识别结果与在线识别结果,记录离线识别结果的返回时间与在线识别结果的返回时间;比较...
  • 本发明属于车辆领域,公开了一种座舱主动对话的方法及系统,所述方法包括:通过获取用户信息及车辆信息,并确定用户画像;基于用户画像在预设数据库中匹配对应的主动对话类型;基于用户画像确定主动对话类型的触发分数,并在触发分数满足预设条件时触发对应的...
  • 本发明涉及人机交流技术领域,尤其为一种计算机科学与技术用人机交流装置,包括底盘;底盘的内部安装有用于清理地面阻挡物的底部杂物驱离模块;底盘的上方安装有人机交流设备机身, 人机交流设备机身的外侧还固定连接有操作屏;人机交流设备机身的顶部固定连...
技术分类