Document
拖动滑块完成拼图
首页 专利交易 IP管家助手 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索
乐器;声学设备的制造及制作,分析技术
  • 本发明公开了基于物联网的物流智能预警系统,涉及航空物流运输技术领域,通过三个算法单元的相互配合,构成了基于物联网的物流智能预警系统的核心架构,不仅考虑了运输舱内温度、震动、压力等环境因素对运输风险的影响,还涵盖了运输成本和效率方面的考量,能...
  • 本发明涉及语音识别控制技术领域,具体为基于多模态特征动态融合的数字人语音口型同步控制系统,包括获取用户的历史讲话数据;对历史讲话数据进行特征识别,得到历史语音特征和历史口型特征,构建得到个性化语音档案;并基于历史语音特征和历史口型特征构建得...
  • 本申请涉及一种歌曲识别方法、计算机设备和存储介质。所述方法包括:将待识别歌曲输入至训练完成的音频分离模型中,得到待识别歌曲对应的人声音频和伴奏音频;训练完成的音频分离模型通过人声样本、伴奏样本和混合音乐样本训练得到;混合音乐样本中包含有人声...
  • 提供一种识别语音声调的方法、装置、介质,方法包括:检测待识别语音的韵母的持续时间段位置;根据待识别语音的韵母的持续时间段位置来检测待识别语音的声调核部分;根据待识别语音的声调核部分来识别待识别语音的声调类别。如此,根据本公开的至少一个实施例...
  • 本发明公开了一种基于语音识别模型的物流管理系统及方法,属于物流管理技术领域,其方法具体包括:采集物流操作人员的语音数据,并进行预处理,结合预构建的物流场景特征库进行语音识别,构建松散的指令候选集,生成初始操作指令,所述松散的指令候选集由操作...
  • 提供语音评测方法、语音评测设备、非暂时存储介质、计算机程序产品。语音评测方法,包括:基于待评测的语音提取出具有第一音色的第一人语音;将第一人语音转换为具有第二音色的语音;基于转换的具有第二音色的语音和一个或多个口音的标准语音获得第一人语音的...
  • 本申请涉及一种喷麦检测方法、音频录制方法、计算机设备和计算机程序产品。通过基于待检测音频帧的相对阈值,对待检测音频帧进行音频周期划分得到人声基频信息,根据人声基频信息中的人声音频信号中相邻人声信号点之间的幅度变化,确定人声音频信号中的待检测...
  • 本发明涉及体育视频分析技术领域,尤其涉及一种基于排球轨迹的击球行为类型识别方法,包括:S10、基于运动员的击球视频,检测击球视频中的一个或多个候选球体,从所述候选球体中筛选得到目标球体;S20、获取目标球体在击球视频中的多个轨迹片段并进行融...
  • 本发明公开了一种基于无人机的选矿车间巡检方法,涉及选矿车间巡检技术领域,具体包括以下步骤:当无人机采集的图像会受到斜光照射影响时,识别出图像中具有阴影干扰特征的区域,并将其均匀划分为若干个子区域;从无人机采集的图像中提取各个子区域的图像扰动...
  • 本发明公开了基于图像增强的头颈部放疗患者张口困难程度评估系统,包括图像采集模块、张口图像增强模块、张口图像分割模块和张口困难程度评估模块。本发明属于图像处理领域,具体是指基于图像增强的头颈部放疗患者张口困难程度评估系统,本方案采用基于敏感性...
  • 本申请提供了一种方形动力电池外壳视觉缺陷快速检测方法及系统,涉及图像处理技术领域,包括:获得高分辨率多视角图像序列,输出标准化图像数据,进行前视觉划痕检测,输出划痕缺陷位置及特征,输出包含置信度得分的缺陷候选区域,识别出气泡类缺陷,汇总缺陷...
  • 本发明提出了一种基于遥感影像进行植被覆盖异常分析的技术方法,主要包括以下步骤:首先对多时相SAR影像进行配准与预处理,并在相邻时相之间进行自适应阈值相干性检测,快速识别可疑的砍伐或严重稀疏区域;然后仅针对这些可疑区域进行双通道极化InSAR...
  • 本申请提供一种面向AI GC大模型应用的古典音乐可视化内容生成方法,包括:通过时频分析从古典音乐音频中获取节奏、旋律与和声的时域与频域特征,采用短时傅里叶变换生成包含频率分布与时间变化的特征矩阵,得到音乐特征序列;通过预训练的情感分析模型,...
  • 本发明公开了一种空调器、目标跟踪方法和设备,所述空调器上设有图像采集模块,通过实时获取所述图像采集模块所采集的当前图像信息;识别所述当前图像信息上的所有目标;当为首次识别到目标时,将所述当前图像信息上的所述目标的位置信息按照预设顺序进行排列...
  • 本发明公开了一种基于不确定性分数伪标签的持续学习实例分割检测方法,包括三部分,其一是不确定性分数伪标签生成方法,通过对每个伪标签添加不确定性分数,在网络训练过程中根据不确定分数和训练值动态的调整伪标签的可信度,提高学生模型学习的准确度。其二...
  • 本申请涉及音频处理技术领域,提供一种合成音频的鉴别方法、设备和计算机程序产品,可以自动鉴别目标音频是否为合成音频。本申请中,利用不同采样率对目标音频进行采样,得到多个对应不同采样率的音频;提取各音频的常数Q变换倒谱系数、线性频率倒谱系数、梅...
  • 本发明涉及爆破块度识别设备技术领域,尤其涉及基于机器视觉的爆破块度识别装置及评价方法;本申请包括有识别装置主体、数据分析计算模块、图像采集模块、红外矫正器和安装支架;本发明相较于传统爆破块度识别评价方法,通常依赖于简单的图像处理技术和特征提...
  • 本申请涉及一种采用人工智能的语音数据提取方法及系统,涉及语音智能提取技术领域,包括:监测采集视频通信产生的视频和音频数据,获得对应数据序列;对音频序列进行语速和音量识别,获取特征参数并分别配置口型和音频权重,得到第一、第二组权重;对视频序列...
  • 本发明涉及一种基于多尺度上下文信息与注意力机制的肠壁血管分割方法,构建融合多尺度上下文信息与注意力机制的神经网络,包括特征编码器,特征编码器的多级输出分别通过结合通道注意力模块的跳跃连接、结合改进的轴向注意力模块的多尺度上下文融合模块,得到...
  • 本发明实施例公开了目标检测模型的训练及目标检测方法、装置、设备及介质,目标检测模型的训练方法包括:基于回归头部网络,对训练图像的候选特征框的位置进行校准,确定目标特征框;基于图像优化网络,根据目标特征框中特征的位置坐标及位置坐标的关联坐标,...
技术分类