Document
拖动滑块完成拼图
专利交易 商标交易 积分商城 国际服务 IP管家助手 科技果 科技人才 会员权益 需求市场 关于龙图腾 更多
 /  免费注册
到顶部 到底部
清空 搜索
最新专利技术
  • 本申请公开了一种会议语音数据处理方法、装置、电子设备和存储介质,属于计算机技术领域,所述方法包括:对会议语音数据进行检测、声学特征提取与聚类处理,生成带说话人标签的语音序列;经语音识别后,基于文本序列的上下文分析和身份指示信息,修正说话人标...
  • 本申请公开了一种说话人识别方法、装置、设备及存储介质,涉及人工智能技术领域,包括:将初始说话人语音数据集中的数据输入至初始语音预训练模型中;从初始语音预训练模型中确定满足预设性能最优条件的目标Transformer层,并对初始语音预训练模型...
  • 本发明提供了一种声纹合成方法、装置、电子设备和存储介质,包括:基于原始说话人语音片段确定标准化语音特征并构建战场噪声物理参数库;基于标准化语音特征、情感标签和噪声参数,通过身份保留生成网络确定合成语音和语音质量感知评估指标;基于合成语音和真...
  • 本发明公开了一种基于深度语音嵌入的声纹注册方法及装置,属于语音生物识别技术领域。该方法包括采集自然场景下的语音数据,将语音数据存储至本地环形缓冲区,以统一采样率对语音数据进行重采样,采用滑动窗口技术对重采样后的语音数据进行分段,基于滤波器组...
  • 本发明公开了一种说话主体识别方法、装置、设备及可读存储介质,应用于智能识别技术领域,包括:利用预训练模型从待识别音频中提取第一特征;从待识别音频中提取频谱特征,利用高层声学特征提取模型从频谱特征中提取第二特征;对第一特征和第二特征进行融合得...
  • 本申请涉及语音处理技术领域,公开了语音处理系统、方法、车辆及存储介质,该系统包括:识别模块用于对音频段序列中第一音频段进行特征识别,得到第一特征信息;基于第一特征信息进行文字识别,得到第一文字识别结果;判断模块用于将第一特征信息与音频段序列...
  • 本申请公开了一种信息显示方法、装置、电子设备及可读存储介质,属于人工智能技术领域,该方法包括:从麦克风采集的音频数据中,获取人声音频数据;在人声音频数据包括唤醒关键词的情况下,显示第一信息;其中,第一信息包括以下至少一项:说话内容描述信息;...
  • 本申请涉及一种多语言语音内容识别方法及系统,属于语音信号处理技术领域,识别方法包括:采集原始音频流数据并执行降噪滤波处理,分割为多个音频片段;提取音频片段的声学特征向量;将音频片段输入语音识别模型组,获取文本片段及置信度评分;融合所有文本片...
  • 本发明实施例提供一种跨模态上下文语音识别方法、系统及存储介质,属于语音识别技术领域。所述方法包括:采集跨模态交互信息,并对所述跨模态交互信息执行预处理以生成跨模态上下文数据;基于预设多场景训练数据对预训练大模型执行增量训练以获得跨模态处理模...
  • 本发明公开一种跨学科术语库自适应语音识别方法、装置、设备。其中,该方法包括:获取学科热词库;获取当前时间点前n秒的识别文本,获取当前时间点PPT内容的标题、加粗文本以及全页文字,基于识别文本,通过文本内容处理模块提取文本特征,生成前文语音文...
  • 本发明公开了一种联邦式唇语识别方法及系统,该方法包括:中央服务器初始化全局唇语识别模型,并将全局模型分发至多个本地客户端;各本地客户端基于本地唇动数据对全局模型进行本地训练,生成本地模型参数,并通过差分隐私机制和同态加密技术对参数进行加密后...
  • 本发明公开了基于多尺度特征融合的电网调度语音识别方法及系统,涉及语音识别技术领域,其技术要点为:通过全流程技术方案保障调度适配性,在数据采集环节同步获取电网运行状态参数提供场景上下文,特征融合环节按调度场景动态调整权重,模型识别环节通过逻辑...
  • 本发明公开了一种基于孪生网络的自定义语音指令识别方法、装置及电子设备。对收集到的语音指令数据进行预处理,得到语音训练数据集;构建孪生网络架构;对识别模型和判别模型进行端到端联合训练;将训练好的识别模型和判别模型部署至电子设备;对语音数据进行...
  • 本申请公开了一种语音识别方法及相关装置、电子设备和存储介质,其中,语音识别方法包括:基于待识别音频进行编码,得到目标编码特征;基于目标编码特征进行解码,得到解码过程中的目标隐层特征,并基于目标编码特征,在语义实体库中选择与待识别音频相关的至...
  • 本发明涉及一种涂料实验室智能检测仪器语音操控的方法,包括首先对语音采集与预处理:通过音频输入设备采集语音信号;接着进行语音转文字:使用语音识别模型将语音信号转换为文字信息,随后唤醒词检测:检测语音中是否包含预设的唤醒词,触发系统响应,然后进...
  • 本发明公开了一种面向复杂环境混合语音的机器人声控系统和声控方法,属于机器人控制技术领域,系统包括语音输入模块、语音分离模型、语音识别控制系统以及语音管理系统;语音输入模块,用于接收混合人声;语音分离模型,利用卷积神经网络、自注意力机制和门控...
  • 本申请公开了一种语音播报方法,包括:对用户的语音输入进行意图识别,得到多个控制意图;基于预设的分类维度,对所述多个控制意图中的每一个控制意图进行分类,得到每一个控制意图的意图类别;基于多个控制意图的意图类别确定执行策略和播报策略;根据所述执...
  • 本发明提出一种基于融合声纹与环境上下文的智能家居指令理解方法。首先,借助情景心智图谱动态构建与图神经网络推理,对家庭多源异构信息建模并生成高层次情景嵌入,突破单一维度限制,提高隐式或模糊意图识别精度。其次,引入意图 ‑ 行为概率势场并结合生...
  • 本申请涉及智能语音交互技术领域,尤其是涉及一种智能扬声器语音交互方法,其包括多模态音频信号采集、动态场景建模、分层特征提取、噪声抑制、低秩张量分解及注意力机制模型的自适应权重分配等步骤。通过多源异构特征融合生成语音交互响应热图,并定量评估交...
  • 本发明公开了一种基于眨眼序列的听觉注意解码方法及系统,属于脑机接口技术领域。本发明为解决听觉注意解码中准确率低、延迟大及计算量高的问题,通过预处理脑电与眼电信号、提取语音包络、构建眨眼序列并输入多模态深度卷积神经网络,实现听者注意语音流的识...
技术分类