Document
拖动滑块完成拼图
首页 专利交易 IP管家助手 科技果 科技人才 积分商城 国际服务 商标交易 会员权益 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索
最新专利技术
  • 本公开提供了一种语音识别模型的训练方法、语音数据的处理方法及装置,该方法包括:通过初始语音识别模型对语音样本数据进行预测,得到所述语音样本数据对应的字符预测类型;将所述字符预测类型与所述语音样本数据对应的字符标注类型进行比对,根据比对结果确...
  • 本申请公开了一种结合语音信息的手写内容补全方法、显示设备及存储介质,该方法包括:显示书写界面,接收在书写界面上的书写操作,在书写界面上显示书写操作对应的书写轨迹;在显示书写界面的过程中采集语音信息;检测到针对目标书写轨迹的内容补全机制被触发...
  • 本发明提出一种过滤语音识别数据集中噪声标签的深度学习方法,以提升模型在噪声干扰下的鲁棒性。所述方法流程包括:热身训练阶段,在全量数据上进行Warm‑up,构建稳定特征表示并获取初步损失分布;噪声感知训练阶段,利用双高斯混合模型对样本CTC损...
  • 本申请公开了一种语音控制方法、装置、设备、介质及产品,所述方法包括:获取第一语音信息;基于所述第一语音信息进行意图识别,得到所述目标意图;根据所述目标意图,从预设的多个音频播放方式中确定目标音频播放方式,多个所述音频播放方式包括通过车辆舱内...
  • 本发明涉及语音识别技术领域,具体为一种基于人工智能的客服服务的语音交互系统及方法,系统包括语音输入处理模块、意图分类与路由模块、上下文动态调整模块、用户行为学习模块、多层次意图融合模块、最终结果模块。本发明中,通过提取音调强度、语速频率、情...
  • 本发明公开了一种骨传导麦克风的语音处理方法及系统,包括如下步骤:步骤一:采集骨传导麦克风原始语音信号并进行帧切片,生成谱质能图谱;步骤二:识别多频带斜率同步突变的时间区间,作为伪音候选段;步骤三:标记确认伪音段;步骤四:构建帧状态序列;步骤...
  • 本公开涉及用于大规模语言模型的方法、装置以及计算机程序产品。云辅助型车载大规模语言模型的使用通过以下来执行:向安装于车辆的第一LLM(大规模语言模型)输入编辑前提示词,编辑前提示词包括与车辆的乘坐者关联的个人信息,向安装于云的第二LLM发送...
  • 本发明公开了一种基于Pjsip和大模型技术的客服消息生成方法及系统,涉及人工智能领域,所述系统包括:应用层智能客服端和大模型层服务端;其中,应用层智能客服端包括:VDA检测模块,ASR识别模块,生成回复文本模块,生成回复语音模块;大模型层服...
  • 本申请涉及一种显示设备及其语音识别方法。显示设备包括:音频采集器,用于采集音频输出装置输出的原始音频;回采麦克风,用于采集目标环境内的环境音频;控制器,用于响应于远场语音服务的启动操作,控制音频采集器和回采麦克风使能;获取硬件时间戳信息,并...
  • 本发明涉及人机交流技术领域,尤其为一种计算机科学与技术用人机交流装置,包括底盘;底盘的内部安装有用于清理地面阻挡物的底部杂物驱离模块;底盘的上方安装有人机交流设备机身, 人机交流设备机身的外侧还固定连接有操作屏;人机交流设备机身的顶部固定连...
  • 本发明属于车辆领域,公开了一种座舱主动对话的方法及系统,所述方法包括:通过获取用户信息及车辆信息,并确定用户画像;基于用户画像在预设数据库中匹配对应的主动对话类型;基于用户画像确定主动对话类型的触发分数,并在触发分数满足预设条件时触发对应的...
  • 本申请提供了一种实现离在线混合识别翻译结果的处理方法、系统及介质,该方法包括:获取输入音频,将输入音频进行预处理,得到优化音频;对优化音频进行同步识别,得到离线识别结果与在线识别结果,记录离线识别结果的返回时间与在线识别结果的返回时间;比较...
  • 本申请提供了一种语音控制方法及语音控制系统,其中,该方法包括:在感知到物理空间中的用户发出的语音控制指令后,将语音控制指令中的语音内容转换为第一文本;应用编排系统基于第一文本中的内容,对用户的语音控制指令进行分类确定指令类型;根据空间标识,...
  • 本发明提供的基于车载智能终端的AI多模态语音交互方法、电子设备,包括:通过车载智能终端上的麦克风阵列、车内摄像头及方向盘触控传感器,同步采集用户的语音信息、面部微表情及手部触控动作,形成多模态交互数据;对所述多模态交互数据进行融合,并通过预...
  • 本发明实施例提供了一种车辆便签实现方法、终端、座舱、系统、电子设备及存储介质。该方法包括:通过语音助手识别车内用户的用户语音,判断识别到的用户语音中是否包含与便签对应的第一车载关键词;若包含所述第一车载关键词,则进入车载便签模式,将所述语音...
  • 本发明公开了一种同声传译方法、装置、设备、介质及产品。该方法包括:对源语言音频流进行文本识别得到源语言文本;对所述源语言文本进行断句和术语纠正,得到待翻译语句;通过大模型对所述待翻译语句进行语义分段并翻译,得到目标语言文本。本发明实施例可以...
  • 本发明提供一种自动标注语音数据中语气的方法及装置、设备、介质,该方法包括:获取待处理的语音数据;提取语音数据中的非音素内容,得到多个语音片段及其对应的时段;利用预训练的神经网络模型提取每个语音片段的隐藏信息,得到每个语音片段对应的语音特征;...
  • 一种分段聚类‑特征映射联合的语音摘要方法。所述方法流程包括:首先对长语音按时间戳分段,利用音频编码器提取片段级语义向量,通过无监督聚类算法(K‑means)聚类为N类,并从每类选取最接近簇心的代表性片段,按时序拼接成压缩语音段。随后,通过音...
  • 本发明涉及语音分析或语音识别技术领域,具体涉及一种基于FunASR的生僻字转译识别的方法,包括:获取用户输入的待识别音频数据;依据频率波动特性对待识别音频数据进行词汇频段拆分;对有效语音频段中单个文字之间发音变化时产生的频率变动进行分析,并...
  • 本发明属于音频处理技术领域,提供一种基于空间声学特征提取的空间声纹识别方法及系统,空间声纹识别方法包括采集目标空间的环境声音;对采集的声音进行重采样和滤除人声;将预处理后的音频分割为多个片段;从音频片段中提取空间声学特征;移除异常音频片段;...
技术分类