苏州奇梦者科技有限公司王飞获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉苏州奇梦者科技有限公司申请的专利一种语音唤醒方法及设备获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN115966199B 。
龙图腾网通过国家知识产权局官网在2025-12-02发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202211519496.4,技术领域涉及:G10L15/02;该发明授权一种语音唤醒方法及设备是由王飞;王欢良;肖佳林;吴天昕设计研发完成,并于2022-11-30向国家知识产权局提交的专利申请。
本一种语音唤醒方法及设备在说明书摘要公布了:本申请提供了一种语音唤醒方法及设备,其中方法包括:接收音频序列;对音频序列进行音频事件检测;将带有语音的音频片段输入第一级唤醒模型;当第一级唤醒模型检测到唤醒词时,将音频片段输入第二级唤醒模型;当第二级唤醒模型检测到唤醒词时,将音频片段输入声纹模型;当声纹模型判断说话人为注册人时,系统被唤醒;其中,第一级唤醒模型为流式模型并以字为单元建模;第二级唤醒模型为非流式模型,第二级唤醒模型的卷积输出通道分配有注意力权重。本申请通过构建两级唤醒模型来降低功耗,由于第一级唤醒模型采用字建模,使得二级唤醒模型能够获取准确的唤醒词边界,从而可以使用注意力机制提升卷积通道的特征提取能力,最终提升唤醒性能。
本发明授权一种语音唤醒方法及设备在权利要求书中公布了:1.一种语音唤醒方法,其特征在于,包括: 接收音频序列; 对音频序列进行音频事件检测,切除音频序列中不含语音的片段,只保留带有语音的音频片段; 将带有语音的音频片段输入第一级唤醒模型; 当第一级唤醒模型检测到唤醒词时,将音频片段输入第二级唤醒模型;当第二级唤醒模型检测到唤醒词时,将音频片段输入声纹模型;当声纹模型判断说话人为注册人时,系统被唤醒; 其中,所述第一级唤醒模型为流式模型并以字为单元建模;所述第二级唤醒模型为非流式模型,所述第二级唤醒模型的卷积输出通道分配有注意力权重;所述第一级唤醒模型对唤醒词逐字建模,并使用滑动窗来统计唤醒词的置信度hx 其中为滑动窗内的输入序列,Tconf为滑动窗长,1≤t1≤t2...≤Tconf表示整个解码网络的路径只能是单调的,表示时刻ti模型输出唤醒词为ωi的概率,唤醒词共有M个字,即: ω={ω1,ω2,....,ωM}, hx表示在满足解码网络的前提下,滑动窗内的后验概率能够取得的最大值;当置信度hx大于第一阈值时,认为滑动窗内检测到了唤醒词;其中,所述第一级唤醒模型采用字建模能够获取唤醒词的时间边界,所述第二级唤醒模型还用于根据时间边界以对完整的唤醒词进行预测。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人苏州奇梦者科技有限公司,其通讯地址为:215024 江苏省苏州市工业园区若水路388号E1905;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励