Document
拖动滑块完成拼图
首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

用于音频处理的自监督学习 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

申请/专利权人:谷歌有限责任公司

摘要:用于训练音频处理神经网络的方法、计算机系统和设备包括被编码在计算机存储介质上的计算机程序,所述音频处理神经网络至少包括1具有第一编码器网络参数集的第一编码器网络和2具有解码器网络参数集的解码器网络。所述系统获得未标记的音频数据片段集,并从未标记的音频数据片段集中生成编码器训练样例集。所述系统在所生成的编码器训练样例集上执行对至少包括第一编码器神经网络的第二编码器神经网络的训练。所述系统还获得一个或多个经标记的训练样例,并在经标记的训练样例上执行对音频处理神经网络的训练。

主权项:1.一种用于训练音频处理神经网络的计算机实现的方法,所述音频处理神经网络被配置为执行音频处理任务,其中所述音频处理神经网络至少包括1具有第一编码器网络参数集的第一编码器网络和2具有解码器网络参数集的解码器网络,所述方法包括:获得未标记的音频数据片段集,每个未标记的音频数据片段包括与多个时间点相对应的相应的多个音频数据帧;从所述未标记的音频数据片段集中生成编码器训练样例集,其中每个编码器训练样例包括相应的编码器训练输入和相应的编码器目标标记,所述生成包括针对每个编码器训练样例:通过处理所述未标记的音频数据片段集中的相应的未标记的音频数据片段来生成所述相应的编码器训练输入,通过将投影矩阵应用于所述相应的未标记的音频数据片段中的音频数据帧集中的每个音频数据帧来生成相应的经投影的向量集,其中所述投影矩阵的元素是根据第一分布随机选择的值,以及处理所述相应的经投影的向量集以生成所述编码器训练样例的相应的编码器目标标记;在所生成的编码器训练样例集上执行对至少包括所述第一编码器神经网络的第二编码器神经网络的训练,以至少将所述第一编码器神经网络的所述第一编码器网络参数集更新为经预训练的值集;获得一个或多个经标记的训练样例,每个经标记的训练样例包括音频数据训练输入和对应的音频处理标记;以及在所述经标记的训练样例上执行对所述音频处理神经网络的训练,以至少更新1所述编码器网络的所述第一网络参数集和2所述解码器网络的所述第二网络参数集,其中所述第一网络参数集用所述经预训练的值集进行初始化。

全文数据:

权利要求:

百度查询: 谷歌有限责任公司 用于音频处理的自监督学习

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。