恭喜深圳市腾讯计算机系统有限公司;华中科技大学王巍获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网恭喜深圳市腾讯计算机系统有限公司;华中科技大学申请的专利视频码率自适应网络的训练方法、应用方法、装置及设备获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN115499657B 。
龙图腾网通过国家知识产权局官网在2025-05-06发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202210762758.3,技术领域涉及:H04N19/146;该发明授权视频码率自适应网络的训练方法、应用方法、装置及设备是由王巍;肖雪豆;刘铂熙;曹洋;阮亚平;陈华成设计研发完成,并于2022-06-30向国家知识产权局提交的专利申请。
本视频码率自适应网络的训练方法、应用方法、装置及设备在说明书摘要公布了:本申请实施例公开了一种视频码率自适应网络的训练方法、应用方法、装置及设备,相关实施例可应用于云技术、人工智能等各种场景,用于提高网络适应力。该方法包括:采样第一网络状态组,获取决策码率对应的第一奖励值,以对第一网络的初始化参数进行内循环更新;重新采样第二网络状态组,获取决策码率对应的第二奖励值,以对初始化视频码率自适应网络的初始化网络参数进行外循环更新,重复执行上述操作,直至内循环更新后的奖励值满足收敛条件,得到待调整视频码率自适应网络,获取当前类别的网络状态组,获取决策码率对应的奖励值,以对待调整视频码率自适应网络的网络参数进行内循环更新,直至奖励值满足收敛条件,得到目标视频码率自适应网络。
本发明授权视频码率自适应网络的训练方法、应用方法、装置及设备在权利要求书中公布了:1.一种视频码率自适应网络的训练方法,其特征在于,包括:基于N个元学习任务,采样N个不同类的第一网络状态组,并将N个不同类的所述第一网络状态组分配至N个初始化视频码率自适应网络,得到N个第一网络,其中,每个所述第一网络状态组用于模拟每个所述第一网络的第一网络环境,所述初始化视频码率自适应网络设置有初始化网络参数,所述N为大于1的整数;基于每个所述第一网络输出的决策码率与所述第一网络环境,获取所述每个决策码率对应的第一奖励值,以对所述第一网络的初始化网络参数进行内循环更新,其中包括:基于所述第一网络状态组模拟所述第一网络环境,其中,每个所述第一网络环境包括K个不同时间长度的第一带宽轨迹,所述K为大于1的整数;针对于每个所述第一网络,将上一时刻的K个观测量以及K个决策码率输入至所述第一网络的第一决策网络,通过所述第一决策网络输出当前时刻的K个决策码率;将所述当前时刻的K个决策码率分别与所述第一网络环境中的当前时刻的K个第一带宽轨迹进行交互,得到当前时刻的K个观测量;将所述当前时刻的K个观测量和K个决策码率输入至所述第一网络的第一评价网络,通过所述第一评价网络输出下一时刻的评价值;基于所述当前时刻的K个观测量计算得到所述当前时刻的K个决策码率对应的K个第一奖励值;基于所述当前时刻的K个决策码率对应的K个第一奖励值对所述第一决策网络以及所述第一评价网络的初始化网络参数进行更新,以对所述第一网络的初始化网络参数进行内循环更新;重新采样所述N个元学习任务对应的N个不同类的第二网络状态组,并将N个不同类的所述第二网络状态组分配至经过所述内循环更新的N个第一网络,其中,每个所述第二网络状态组用于模拟每个经过所述内循环更新的第一网络的第二网络环境;基于每个经过所述内循环更新的第一网络输出的决策码率与所述第二网络环境,获取所述每个决策码率对应的第二奖励值,以对所述初始化视频码率自适应网络的初始化网络参数进行外循环更新,其中包括:基于所述第二网络状态组模拟所述第二网络环境,其中,每个所述第二网络环境包括K个不同时间长度的第二带宽轨迹;针对于每个经过所述内循环更新的第一网络,将所述上一时刻的K个观测量以及K个决策码率输入至经过所述内循环更新的第一网络的第一决策网络,输出当前时刻的K个新决策码率;将所述当前时刻的K个新决策码率分别与所述第二网络环境中的当前时刻的K个第二带宽轨迹进行交互,得到当前时刻的K个新观测量;基于所述当前时刻的K个新观测量计算得到所述当前时刻的K个新决策码率对应的K个第二奖励值;基于N个元学习任务的所述当前时刻的K个新决策码率对应的K个第二奖励值进行加和取平均,得到当前时刻的奖励平均值;基于所述当前时刻的奖励平均值对所述初始化视频码率自适应网络的初始化网络参数进行更新,以对所述初始化视频码率自适应网络的初始化网络参数进行外循环更新;重复执行所述采样第一网络状态组、所述获取第一奖励值、所述内循环更新、所述采样第二网络状态组、所述获取第二奖励值、所述外循环更新的操作,直至所述内循环更新后的所述N个元学习任务的奖励值满足收敛条件,所述初始化视频码率自适应网络更新得到待调整视频码率自适应网络;获取目标视频传输过程中对应的当前类别的网络状态组,其中,所述当前类别的网络状态组用于模拟所述待调整视频码率自适应网络的当前类别网络环境;基于所述待调整视频码率自适应网络输出的决策码率与所述当前类别网络环境,获取所述每个决策码率对应的奖励值,以对所述待调整视频码率自适应网络的网络参数进行内循环更新,直至所述奖励值满足收敛条件,得到当前类别对应的目标视频码率自适应网络。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人深圳市腾讯计算机系统有限公司;华中科技大学,其通讯地址为:518057 广东省深圳市南山区高新区科技中一路腾讯大厦35层;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。