北京小米移动软件有限公司王伟获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉北京小米移动软件有限公司申请的专利数据清洗方法、装置及存储介质获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN114613363B 。
龙图腾网通过国家知识产权局官网在2025-11-28发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202210287983.6,技术领域涉及:G10L15/22;该发明授权数据清洗方法、装置及存储介质是由王伟设计研发完成,并于2022-03-22向国家知识产权局提交的专利申请。
本数据清洗方法、装置及存储介质在说明书摘要公布了:本公开涉及一种数据清洗方法、装置及存储介质,该方法包括:获取用于唤醒目标设备的语音样本数据,以及当前语音唤醒模型输出的语音样本数据对应的唤醒结果信息,唤醒结果信息用于表征目标设备是否被唤醒;确定语音样本数据与用于唤醒目标设备的标准语音唤醒数据之间的差异信息;根据唤醒结果信息和差异信息,对语音样本数据进行清洗,以确定语音样本数据的分类标签。通过上述技术方案,根据唤醒结果信息和差异信息对语音样本数据进行清洗,这样确定的语音样本数据的分类标签,相比于当前语音唤醒模型输出的唤醒结果更加准确,提高语音样本数据的标签的准确性,且无需人工对语音样本数据的标签进行标注,避免人工处理费时费力和准确度不高的问题。
本发明授权数据清洗方法、装置及存储介质在权利要求书中公布了:1.一种数据清洗方法,其特征在于,包括: 获取用于唤醒目标设备的语音样本数据,以及当前语音唤醒模型输出的所述语音样本数据对应的唤醒结果信息,其中,所述唤醒结果信息用于表征所述目标设备是否被唤醒; 确定所述语音样本数据与用于唤醒所述目标设备的标准语音唤醒数据之间的差异信息; 根据所述唤醒结果信息和所述差异信息,对所述语音样本数据进行清洗,以确定所述语音样本数据的分类标签; 所述确定所述语音样本数据与用于唤醒所述目标设备的标准语音唤醒数据之间的差异信息,包括: 对所述语音样本数据进行音素解码处理,得到所述语音样本数据的样本音素序列; 对所述样本音素序列进行音调融合处理,得到第一融合信息,其中,同样的字或词的音素序列进行音调融合处理后的音调相同; 对所述标准语音唤醒数据的标注音素序列进行音调融合处理,得到第二融合信息; 根据所述第一融合信息与所述第二融合信息之间的距离信息、以及所述标注音素序列的序列长度,确定音错率,并将所述音错率作为所述差异信息。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人北京小米移动软件有限公司,其通讯地址为:100085 北京市海淀区西二旗中路33号院6号楼8层018号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励