恭喜腾讯音乐娱乐科技(深圳)有限公司王武城获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网恭喜腾讯音乐娱乐科技(深圳)有限公司申请的专利确定歌词时间方法、设备和存储介质获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN115312039B 。
龙图腾网通过国家知识产权局官网在2025-03-28发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202210912066.2,技术领域涉及:G10L15/06;该发明授权确定歌词时间方法、设备和存储介质是由王武城设计研发完成,并于2022-07-29向国家知识产权局提交的专利申请。
本确定歌词时间方法、设备和存储介质在说明书摘要公布了:本申请公开了一种确定歌词时间戳的方法、设备和存储介质,属于语音识别技术领域。所述方法包括:对于预先训练的多个语音识别模型中的每个语音识别模型,将所述目标歌曲的音频特征输入所述语音识别模型中,得到每帧音频特征在语音识别模型所属语言下对应参考音素状态的置信度;对于每帧音频特征,将音频特征对应的最大置信度的参考音素状态作为音频特征对应的对齐音素状态;对于每帧音频特征,根据音频特征对应的对齐音素状态,确定音频特征对应的音素;根据每帧音频特征对应的音素,确定每帧音频特征在所述歌词文本中对应的字,根据每帧音频特征对应的演唱时间,确定所述歌词文本的歌词时间戳。本申请可以提高确定歌词时间戳的效率。
本发明授权确定歌词时间方法、设备和存储介质在权利要求书中公布了:1.一种确定歌词时间戳的方法,其特征在于,所述方法包括:获取目标歌曲的歌词文本,提取所述目标歌曲中每个音频帧的音频特征;获取预先训练的多个语音识别模型,所述多个语音识别模型分别为不同语言的歌曲数据样本训练的语音识别模型;对于每个所述语音识别模型,将所述目标歌曲中每个音频帧的音频特征输入所述语音识别模型,得到每帧音频特征在所述语音识别模型的语言下对应的参考音素状态以及参考音素状态的置信度;对于每帧所述音频特征,将所述音频特征的多个置信度中的最大置信度对应的参考音素状态作为所述音频特征的对齐音素状态,并根据所述音频特征的对齐音素状态,确定所述音频特征对应的音素;根据每帧所述音频特征对应的音素及演唱时间,确定所述歌词文本的歌词时间戳。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人腾讯音乐娱乐科技(深圳)有限公司,其通讯地址为:518000 广东省深圳市前海深港合作区前湾一路1号A栋201室;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。