Document
拖动滑块完成拼图
专利交易 商标交易 积分商城 国际服务 IP管家助手 科技果 科技人才 会员权益 需求市场 关于龙图腾 更多
 /  免费注册
到顶部 到底部
清空 搜索
最新专利技术
  • 本发明提供一种语音识别方法、装置、电子设备、存储介质和程序产品,涉及语音处理技术领域。其中方法包括:将待识别语音的声学特征向量与基于热词列表提取的多个字特征向量进行交叉注意力计算,得到包含热词信息的热词偏置特征;所述热词列表包括多个热词;对...
  • 本申请公开了一种文本纠错方法、装置及设备,用于提高对文本的纠错准确性,该方法包括:基于待纠错文本中各字符位置的字符与多个纠错字符,确定各字符位置的候选字符;将初始字符位置的各候选字符作为第一字符序列,重复执行:针对各第一字符序列,基于第一字...
  • 本发明公开了一种基于双重相似度匹配技术的雷达专业术语语音识别方法及系统,具体为:首先对语音识别得到的中文长文本去除标点后,采用滑动窗口生成候选子串集合;然后对候选子串及领域词库词条获取拼音,并施加模糊规则以得到归一化拼音;接着计算序列相似度...
  • 本申请提供一种实时视频流中分离音频并进行文字转换的方法及系统,属于音视频处理技术领域,所述方法:获取实时视频流,并进行解封装,分离出音频流;所述音频流为AAC或PCM格式;对音频流进行实时预处理,得到标准化PCM音频帧,所述实时预处理包括降...
  • 本申请属于人工智能技术领域,涉及一种语音生成方法、装置、设备及存储介质,通过获取待进行语音生成的词级语音文本;将词级语音文本输入到学习训练完成的辅助性语音插入规划器中;获取辅助性语音插入规划器所输出的语音生成编码序列;采用预设的语音解码器对...
  • 本发明属于人工智能技术领域,是一种面向大宗商品市场调研语音的信息抽取方法,包括:将原始MP3音频文件采用VAD模型提取为有效语音段集合;构建语音识别模型,对有效语音段集合进行识别,并生成原始文本集合;基于PUNC模型将原始文本集合进行句子划...
  • 本申请提供了一种流式语音的实时结构化提取方法及装置,其中,该方法包括:接收用户的语音流并进行语音识别,输出连续的识别文本;同步采用语音活动检测技术对所述语音流进行分析,以实时检测并确定目标句子边界;当检测到一个句子边界时,触发信息提取流程,...
  • 本发明涉及多模态模型数据处理领域,具体涉及一种基于多模态深度学习的实时语音转写方法及系统,首先通过硬件时钟实现音频与唇部视频帧的时序对齐;其次,分别提取音频谱熵作为声学混叠指标,并利用深度神经网络提取唇动位移速率作为唇动显著性指标;接着,基...
  • 本发明公开了一种换流阀局放声纹信号提取及系统,采集换流阀的混合声纹信号,对混合声纹信号进行降噪处理,得到降噪声纹信号,从降噪声纹信号中提取初始局放声纹信号,对初始局放声纹信号进行稀疏表示,得到稀疏表示结果,并根据稀疏表示结果识别单源点,基于...
  • 本发明公开了一种基于发动机声纹特征分析的边缘侧实时故障诊断方法与系统。方法包括:采集声音信号并自适应降噪;利用轻量化深度网络提取声纹特征;通过多任务分类器诊断故障类型与严重程度,融合时序结果;基于增量学习进行模型自适应更新;边缘侧完成结果输...
  • 本申请涉及人工智能领域,特别是涉及一种说话人识别方法、装置、设备和介质,方法包括:对未标注的多个语音样本进行聚类,得到多个簇标签;确定目标语音样本的综合样本权重;根据目标语音样本利用待训练模型进行说话人识别,得到目标语音样本对应的输出向量的...
  • 本发明涉及管道异常检测技术领域,公开了一种基于声纹识别的火电厂管道异常振动诊断方法及相关设备,该方法包括:在火电厂管道的监测位置布置拾音传感器采集声学信号,对所述声学信号进行预处理,得到预处理信号;根据所述预处理信号进行多维度声学特征提取与...
  • 本发明公开了基于声纹识别的蝙蝠声音检测系统,涉及生物声学与模式识别技术领域,包括通过采集不同发育阶段蝙蝠的原始音频,利用多通道滤波基于预设频率阈值从环境噪声中分离出纯净超声信号。将信号按发育阶段进行时间标记与分类存储,构建分阶段样本库。从库...
  • 本发明涉及一种基于混合长程与局部建模和融合通道‑空间注意力的深度语义通信方法,属于通信与人工智能技术领域,包括以下步骤:S1:接收语音波形信号;S2:通过结合了深度可分离卷积和状态空间建模的特征提取网络对所述语音波形信号进行多层次语义特征提...
  • 本公开提供了一种语音丢包隐藏方法、装置、电子设备及存储介质,其中,该方法包括:对接收到的语音信号进行分帧处理,获得当前帧信号及历史参考帧信号;基于当前帧信号,通过线性预测编码LPC分析计算LPC系数;将当前帧信号与历史参考帧信号进行回声检测...
  • 本发明公开的基于特征加权残差矢量量化的语音压缩方法及系统,属于语音压缩技术领域,所述方法包括:对语音信号进行编码,获得编码特征;计算编码特征的特征权重;对编码特征进行多级量化,并在每级量化过程中,引入编码特征的特征权重,计算每级输入矢量与候...
  • 本申请提供一种编码器训练方法、音频生成方法及音频检索方法,涉及音频处理技术领域。编码器训练方法包括:对音频量化编码器进行调整,得到分层编码器;其中,分层编码器中设置有关联的语义码本和音频码本;基于联合损失对分层编码器和文本编码器进行联合训练...
  • 本申请公开了一种仪表日志数据传输方法及系统,该方法包括:车机设备在当前车辆的网络状态满足预设触发条件时,在日志文件区域中判断是否存在历史断点指针,历史断点指针根据历史已传输日志数据块所确定;车机设备在存在历史断点指针时,读取历史断点指针处的...
  • 本发明涉及数字信号处理技术领域,揭露了基于音频内容的高频补偿与声场扩宽方法及系统,包括:对输入音频信号进行时频分析,以提取输入音频信号的高频能量分布特征、频谱稀疏性特征及声场空间线索特征,根据高频能量分布特征与频谱稀疏性特征,动态生成与输入...
  • 本发明涉及音频处理技术领域,公开了基于扩散变换的音频转换方法、系统、终端及存储介质,所述方法包括:对初始音频进行重采样后,执行标准化处理得到筛选后的目标音频;对目标音频进行特征提取并进行多维度特征融合处理,得到融合特征;根据参考音频对融合特...
技术分类