Document
拖动滑块完成拼图
首页 专利交易 IP管家助手 科技果 科技人才 积分商城 国际服务 商标交易 会员权益 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索
最新专利技术
  • 本公开提供一种数据的增强处理方法, 根据至少一个目标专家网络, 确定待处理音频特征对应的第一输出序列, 根据共享专家网络, 确定待处理音频特征对应的第二输出序列, 基于所述第一输出序列及所述第二输出序列, 通过所述共享专家网络对应的第一处理...
  • 本申请提供的音频信号优化方法、装置、存储介质及计算机设备, 在音频信号优化过程中, 通过读取音频配置文件并对其进行语法解析, 生成语法树以进行结构验证, 这样能够快速构建出音频配置文件的模块依赖关系图。确保配置文件的准确性和有效性。接着基于...
  • 本发明涉及医保咨询技术领域, 具体公开了一种基于互联网的医保咨询管理服务平台及方法, 所述方法包括以下步骤:基于互联网构建语料库, 基于语料库构建样本, 基于样本获取判定函数;获取实时片段, 基于判定函数确定实时片段是否为异常片段;当实时片...
  • 本申请实施例公开了一种音频编解码模型的训练方法及装置, 主要的技术方案包括:获取包括多个音频样本的训练数据;利用训练数据训练音频编解码模型;其中, 训练包括:提取音频样本的频谱表示, 利用第一音频编码器提取音频样本的声学特征表示;利用第二音...
  • 本申请提出一种音频处理方法、装置、电子设备及产品, 应用于音频处理技术领域。该方法包括:在第一音频通过音频播放设备进行播放的情况下, 获取所述音频播放设备播放的第二音频;从所述第二音频中目标频段的音频片段中, 提取加密的第一认证音频, 所述...
  • 本发明涉及音频编解码技术领域, 尤其涉及一种用于实时音频的快速编解码方法及系统。该方法包括以下步骤:获取输入音频流的实时采样数据, 进行多时点滑动窗口划分及编码预处理, 生成编码预处理增强音频;对编码预处理增强音频进行自适应量化策略分析, ...
  • 本说明书实施例公开了一种用于供水管网漏损噪声的多模态大模型识别方法、装置。该方法包括基于识别请求, 由语言模型确定识别意图。该方法包括根据识别意图, 通过自适应线谱增强算法从识别请求中的音频数据中提取供水管网的目标噪声数据, 目标噪声数据包...
  • 本申请实施例提供了一种智能陪伴交互方法、系统、电子设备及存储介质, 属于智能决策技术领域, 可应用于医疗领域。该方法包括:获取第一对象的多模态信息, 对模态信息中的语音信息进行声纹识别, 得到声学特征;若基于所述声学特征确定所述第一对象为目...
  • 本发明涉及数据处理技术领域, 尤其涉及一种用于人机交互的用户标签获取方法, 包括:响应于唤醒语音, 提取唤醒语音的音纹特征以识别交互用户的身份信息状态并确定机器语音识别模型的模型精度;接收交互用户的语音交互信息, 并根据语音识别模型将语音交...
  • 本发明公开了双支路注意力机制的匿名说话人识别方法, 首先, 提取音频的80维梅尔特征向量;然后, 经过数据预处理后, 引入双注意力机制模块对梅尔特征向量进行注意力增强, 突出其中对说话人身份识别关键的频带或特征维度。将SE和ECA两个支路得...
  • 本发明提供了一种机器声纹特征建模方法、系统、设备、介质和程序产品, 涉及声纹分析技术领域。本发明针对音频特征提取与表征建模方法仍存的问题, 提出一种机器声纹特征建模方法, 将时频声谱图在时间维度上划分为多个子块, 并对每个子块依次进行加权处...
  • 本发明公开了一种基于SASFV聚合模型的说话人确认方法, 涉及语音识别领域, 该方法通过短时傅里叶变换和梅尔滤波提取对数梅尔谱图, 利用ERes2Net网络生成帧级特征, 并引入SASFV聚合模型结合Fisher Vector变量、自注意力...
  • 本申请公开一种语音分离方法、电子设备、芯片系统及计算机可读存储介质, 涉及语音识别技术领域。语音分离方法包括:获取待处理语音, 将待处理语音均匀切分成N段子语音。提取每段子语音的声纹特征, 计算与N段子语音对应的N‑1个声纹特征相似度S1~...
  • 本申请提供了一种声纹特征的准确性判断方法、装置和电子设备, 涉及声纹识别技术领域, 该方法应用于电子设备, 该方法包括:获取目标对象所对应的第一长语音;将第一长语音分割成多段短语音;提取每段短语音的声纹特征, 得到第一声纹特征组;基于第一声...
  • 本发明涉及语音识别技术领域, 具体为一种基于语音意图识别的LED多维度信息发布方法, 包括以下步骤:对输入的语音信号进行解码生成解码词图, 于解码词图内定位预设的LED多维度信息语义槽位并提取同类竞争路径, 计算得到高置信度歧义候选集。本发...
  • 本申请涉及语音转换领域, 具体涉及一种浏览器环境语音转文字的方法、系统、终端及介质, 方法包括在非高精度要求且浏览器是否支持语音识别和语音合成功能时, 使用浏览器原生STT服务将用户输入的语音转换为文字, 在浏览器处于离线状态或隐私标识表征...
  • 本申请涉及一种智能设备控制方法、装置、计算机设备、介质和产品。所述方法包括:获取语音唤醒信息;确定语音唤醒信息的接收时间、以及语音唤醒信息对应的第一共振峰;在预设时间内, 获取智能设备接收到的语音控制信息;确定语音控制信息对应的第二共振峰;...
  • 本公开实施例提供了一种智能体的语音交互处理方法、装置、电子设备以及存储介质。所述方法包括:在启动语音对话模型执行第一语音对话任务输出第一信息的情况下, 接收针对所述语音对话模型输入的第二信息, 所述第二信息包括在执行第一语音对话任务过程中输...
  • 本公开提供了浏览器的语音交互控制方法、装置、电子设备及存储介质, 获取用户输入的语音控制指令, 并基于语音控制指令确定目标控制意图;获取浏览器当前的网页页面对应的目标文档对象模型树;将目标控制意图以及目标文档对象模型树发送至服务器, 并接收...
  • 本发明涉及基于多任务方言识别的智能设备语音交互方法及系统, 该方法包括:获取来自用户的语音数据, 对语音数据进行预处理, 以提取语音数据中的声学特征。通过深度学习框架对用户的地理位置信息和声学特征进行耦合, 以构建地理位置与方言分布的概率关...
技术分类