博洛尼智能科技(青岛)有限公司蔡明获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉博洛尼智能科技(青岛)有限公司申请的专利适用于智能镜的语音指令精确识别方法及系统获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN120279913B 。
龙图腾网通过国家知识产权局官网在2025-09-19发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202510764378.7,技术领域涉及:G10L15/22;该发明授权适用于智能镜的语音指令精确识别方法及系统是由蔡明;蔡兴国;王庆彦;查鸣;贯凯设计研发完成,并于2025-06-10向国家知识产权局提交的专利申请。
本适用于智能镜的语音指令精确识别方法及系统在说明书摘要公布了:本发明涉及语音识别技术领域,具体涉及适用于智能镜的语音指令精确识别方法及系统,包括:语音识别模型的第二编码器输出精简指令识别结果,第三编码器输出完整指令识别结果;第三编码器的参数量小于第一编码器;当每个语音样本输入语音识别模型后,获得完整指令识别结果与着装打扮标签的第一差异,获取完整指令识别结果与精简指令识别结果的第二差异;将第二差异与第一差异加权融合得到损失函数,利用所述数据集和损失函数训练语音识别模型并进行语音识别。本发明在减少语音识别时间的同时保证识别的准确性。
本发明授权适用于智能镜的语音指令精确识别方法及系统在权利要求书中公布了:1.适用于智能镜的语音指令精确识别方法,其特征在于,该方法包括以下步骤: 构建的语音识别模型包括:将采集的语音输入第一编码器,第一编码器的输出分别作为第二编码器和第三编码器的输入,第二编码器输出的词向量序列记为精简指令识别结果;精简指令识别结果表示的是不依赖天气指令和身体部位指令时所获得的着装打扮方案,其获取方法为:采集用户的语音,该语音输入第一编码器,第一编码器对语音进行特征抽取,第一编码器输出的特征图记为第一特征图;第一特征图输入第二编码器,第二编码器对语音进行进一步的特征抽取,输出一个着装打扮方案,记为精简指令识别结果; 利用第四编码器,将语音中包含的时间指令、身体部位指令下采集的天气预报和图像进行编码后,也作为第三编码器的输入;第三编码器输出的词向量序列记为完整指令识别结果;第三编码器的参数量小于第一编码器; 构建的数据集包含若干语音样本以及标注出语音样本对应的着装打扮标签;当每个语音样本输入语音识别模型后,获得完整指令识别结果与着装打扮标签的第一差异,获取完整指令识别结果与精简指令识别结果的第二差异;将第二差异与第一差异加权融合得到损失函数,利用所述数据集和损失函数训练语音识别模型并进行语音识别; 其中,加权融合时第二差异的权重与第一差异呈正相关; 同一个语音样本相邻两次输入语音识别模型后获得的所述权重增大时,完整指令识别结果中的词向量产生的变化记为词向量的关注系数,所述第一差异由所述关注系数获得; 语音识别模型训练完成后,删除第二编码器,用户站在智能镜前,智能镜采集用户的语音,将语音输入训练后的语音识别模型中,第一编码器输出语音中的时间和身体部位,以及第一特征图;然后获取所述时间下的天气语音指令,同时采集用户的全身图像,将天气语音指令和全身图像中的身体部位输入第四编码器,并得到语音辅助识别特征,然后第一特征图和语音辅助识别特征堆叠在一起后一同输入第三编码器,得到完整指令识别结果,完整指令识别结果中所有词向量对应的词汇作为用户所需的着装打扮方案。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人博洛尼智能科技(青岛)有限公司,其通讯地址为:266000 山东省青岛市胶州市经济技术开发区汾河路6号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。
请提出您的宝贵建议,有机会获取IP积分或其他奖励