Document
拖动滑块完成拼图
个人中心

预订订单
商城订单
发布专利 发布成果 人才入驻 发布商标 发布需求

请提出您的宝贵建议,有机会获取IP积分或其他奖励

投诉建议

在线咨询

联系我们

龙图腾公众号
首页 专利交易 IP管家助手 科技果 科技人才 积分商城 国际服务 商标交易 会员权益 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索
当前位置 : 首页 > 专利喜报 > 罗普特科技集团股份有限公司江文涛获国家专利权

罗普特科技集团股份有限公司江文涛获国家专利权

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

龙图腾网获悉罗普特科技集团股份有限公司申请的专利基于语音控制的多模态智能终端AI语音唤醒方法和装置获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN120853549B

龙图腾网通过国家知识产权局官网在2026-01-13发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202511376125.9,技术领域涉及:G10L15/02;该发明授权基于语音控制的多模态智能终端AI语音唤醒方法和装置是由江文涛;曾纪康;林超群;杨建枝;黄茹滢设计研发完成,并于2025-09-25向国家知识产权局提交的专利申请。

基于语音控制的多模态智能终端AI语音唤醒方法和装置在说明书摘要公布了:本发明涉及语音分析技术领域,具体涉及基于语音控制的多模态智能终端AI语音唤醒方法和装置,包括:利用语音模型提取每个语音样本的特征,利用视频模型提取每个面部动作样本的特征;包含唤醒语音的语音样本的记为正样本,不包含唤醒语音的语音样本记为负样本,利用正、负样本对应的面部动作样本的特征更新语音模型的参数以及更新正、负样本对应的面部动作样本,然后利用更新后的面部动作样本更新视频模型的参数;并重复上述参数更新过程。本发明在不显著增加模型参数的前提下,实现复杂且多变的语音环境下高效、准确的语音唤醒功能。

本发明授权基于语音控制的多模态智能终端AI语音唤醒方法和装置在权利要求书中公布了:1.基于语音控制的多模态智能终端AI语音唤醒方法,其特征在于,该方法包括以下步骤: D1:每个语音样本对应一个面部动作样本,利用语音模型提取每个语音样本的特征,利用视频模型提取每个面部动作样本的特征;将预先录入的唤醒语音以及面部动作样本的特征分别记为F1、F2; D2:包含唤醒语音的语音样本的记为正样本,不包含唤醒语音的语音样本记为负样本,正、负样本对应的面部动作样本的特征记为第一特征和第二特征,正样本的特征与第一特征求均值后再与F1求欧式距离,得到第一差异;负样本的特征与第二特征求均值后再与F1求欧式距离,得到第二差异;更新语音模型的参数以及更新正、负样本对应的面部动作样本,使得第一差异小于第二差异; D3:将负样本对应的更新后的面部动作样本的特征与F2的欧式距离记为第三差异,将正样本对应的更新后的面部动作样本的特征与F2的欧式距离记为第四差异,利用更新后的面部动作样本更新视频模型的参数,使得第三差异大于第四差异; D4:重复D2~D3,直至第一差异、第二差异的分布与第三差异、第四差异的分布具有最小差异时停止,并进行唤醒识别; 所述每个语音样本对应一个面部动作样本,包括的具体步骤如下: 将录入唤醒语音时采集的面部动作样本记为基准动作样本; 为任意一个语音样本初始化一个动作生成向量,以动作生成向量为标准差向基准动作样本中添加噪声,得到任意一个语音样本面部动作样本; 每当执行D2时,将所有语音样本对应的动作生成向量进行归一化,得到每个语音样本的归一化向量;当正样本和负样本对应的归一化向量的欧式距离小于第一预设阈值时,将正样本和负样本对应的归一化向量的欧式距离记为识别距离; 所述更新语音模型的参数以及更新正、负样本对应的面部动作样本,使得第一差异小于第二差异的同时,使得第一差异和第二差异的差异与所述识别距离呈负相关。

如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人罗普特科技集团股份有限公司,其通讯地址为:361001 福建省厦门市火炬高新区软件园三期凤岐路188号-101室;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。

以上内容由龙图腾AI智能生成。

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。