Document
拖动滑块完成拼图
首页 专利交易 IP管家助手 科技果 科技人才 积分商城 国际服务 商标交易 会员权益 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索
最新专利技术
  • 本发明公开了一种基于Pjsip和大模型技术的客服消息生成方法及系统,涉及人工智能领域,所述系统包括:应用层智能客服端和大模型层服务端;其中,应用层智能客服端包括:VDA检测模块,ASR识别模块,生成回复文本模块,生成回复语音模块;大模型层服...
  • 本公开涉及用于大规模语言模型的方法、装置以及计算机程序产品。云辅助型车载大规模语言模型的使用通过以下来执行:向安装于车辆的第一LLM(大规模语言模型)输入编辑前提示词,编辑前提示词包括与车辆的乘坐者关联的个人信息,向安装于云的第二LLM发送...
  • 本发明公开了一种骨传导麦克风的语音处理方法及系统,包括如下步骤:步骤一:采集骨传导麦克风原始语音信号并进行帧切片,生成谱质能图谱;步骤二:识别多频带斜率同步突变的时间区间,作为伪音候选段;步骤三:标记确认伪音段;步骤四:构建帧状态序列;步骤...
  • 本发明涉及语音识别技术领域,具体为一种基于人工智能的客服服务的语音交互系统及方法,系统包括语音输入处理模块、意图分类与路由模块、上下文动态调整模块、用户行为学习模块、多层次意图融合模块、最终结果模块。本发明中,通过提取音调强度、语速频率、情...
  • 本申请公开了一种语音控制方法、装置、设备、介质及产品,所述方法包括:获取第一语音信息;基于所述第一语音信息进行意图识别,得到所述目标意图;根据所述目标意图,从预设的多个音频播放方式中确定目标音频播放方式,多个所述音频播放方式包括通过车辆舱内...
  • 本发明提出一种过滤语音识别数据集中噪声标签的深度学习方法,以提升模型在噪声干扰下的鲁棒性。所述方法流程包括:热身训练阶段,在全量数据上进行Warm‑up,构建稳定特征表示并获取初步损失分布;噪声感知训练阶段,利用双高斯混合模型对样本CTC损...
  • 本申请公开了一种结合语音信息的手写内容补全方法、显示设备及存储介质,该方法包括:显示书写界面,接收在书写界面上的书写操作,在书写界面上显示书写操作对应的书写轨迹;在显示书写界面的过程中采集语音信息;检测到针对目标书写轨迹的内容补全机制被触发...
  • 本公开提供了一种语音识别模型的训练方法、语音数据的处理方法及装置,该方法包括:通过初始语音识别模型对语音样本数据进行预测,得到所述语音样本数据对应的字符预测类型;将所述字符预测类型与所述语音样本数据对应的字符标注类型进行比对,根据比对结果确...
  • 本公开提供了语音数据集的确定方法、装置及电子设备,涉及人工智能技术领域,尤其涉及深度学习、自然语言处理、语音技术、大模型等技术领域。具体实现方案为:获取语音片段集,以及语音片段集中的语音片段对应的文本内容;确定语音片段的第一情绪类型、第一情...
  • 本发明涉及音频识别与定位技术领域,尤其涉及一种基于音频分析的人员呼出行为识别与定位系统,包括:获取模块,获取开源数据集中的若干条咳嗽、打喷嚏、说话音频数据集;预处理模块,对音频数据集进行分帧与加窗等一系列预处理后得到Log‑Mel频谱图和M...
  • 本发明公开了一种基于改进的StutterNet口吃检测算法,其涉及口吃检测技术领域,旨在解决基本StutterNet框架中的固定长度上下文可能不是检测所有类型口吃的最佳选择,更大的上下文会提高延长和重复类型不流畅的性能,但会降低流畅语音段的...
  • 本发明属于音频质量分析技术领域,且公开了一种基于算法的音频质量分析方法与系统,通过多问题联合检测模块与自适应特征融合提取模块协同,采用轻量化CRNN模型融合音频‑视频双模态特征,结合多任务学习框架同步检测音量异常、噪声等五类问题,共享底层特...
  • 本公开提供了语音测试方法、装置和电子设备,涉及计算机技术领域,具体为语音技术领域,具体实现方案为:从云服务器处获取至少一个客户端的第一信息,所述第一信息至少包括所述客户端的属性信息和状态信息;从所述云服务器处获取不同音频集的统一标识符URL...
  • 本申请实施例提供了一种语音识别结果的纠错方法及装置,涉及语音识别技术领域。包括:显示第一文本,所述第一文本为对至少一个语音输入进行语音识别得到的语音识别结果;接收第二语音输入;对所述第二语音输入进行语音识别,以获取第二文本;根据所述第一文本...
  • 本发明涉及一种基于离线语音转文字的计算机联控操作录屏写实系统及方法,其中方法包括以下步骤:采集4路高清/超高清视频输入,同时集成2路拾音器和2路程控电话音频输入,获得视频信号和音频信号;对视频信号和音频信号进行混合、降噪和同步处理,并进行存...
  • 本申请属于对话翻译技术领域,涉及一种蓝牙翻译交互方法及其相关设备,包括接收采集终端采集的语音内容,识别采集的语音内容类别;若为TWS耳机佩戴者发出的实时语音内容,则发送给预设翻译终端中的翻译APP进行实时翻译,若为翻译APP推送的翻译语音内...
  • 本申请公开了一种模型训练方法、装置及电子设备,属于人工智能领域。该方法包括:获取通过声音克隆模型使用原始语料生成的克隆音频样本;识别克隆音频样本对应的克隆文本,并将克隆文本与原始语料进行比对,筛选得到合格样本和不合格样本;通过集成学习的多个...
  • 本发明公开一种多模态融合的车辆动态语音提示方法及系统,涉及车载信息系统技术领域,包括:获取包括驾驶员状态数据、车辆工况数据、环境数据和任务数据的多源数据,并以此识别当前驾驶场景,以及判断是否触发语音关怀;触发语音关怀后,根据当前驾驶场景生成...
  • 本申请公开一种基于声音克隆的TTS生成音频系统和方法,其系统包括文本拆分单元、语义生成单元、语音生成单元、质量校验单元,其中:文本拆分单元用以将输入的文本进行拆分成若干段的文本;语义生成单元用以将拆分得到的文本转化成不同风格的语义内容;语音...
  • 本发明公开了一种基于多频带拓扑边界态的模式宽度可调弹性波导,包括Ι型晶胞UC1和Ⅱ型晶胞UC2,所述Ι型晶胞UC1和Ⅱ型晶胞UC2均为谷霍尔晶胞,且内含微孔隙结构;Ι型晶胞UC1周期性排列构成Ι型声子晶体PnC1,Ⅱ型晶胞UC2周期性排列构...
技术分类