百度在线网络技术(北京)有限公司何家乐获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉百度在线网络技术(北京)有限公司申请的专利多智能体模型的训练方法和排序方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN114896291B 。
龙图腾网通过国家知识产权局官网在2025-08-29发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202210470395.6,技术领域涉及:G06F16/2457;该发明授权多智能体模型的训练方法和排序方法是由何家乐;熊健设计研发完成,并于2022-04-28向国家知识产权局提交的专利申请。
本多智能体模型的训练方法和排序方法在说明书摘要公布了:本公开提供了一种多智能体模型的训练方法、排序方法、装置、设备、存储介质以及计算机程序产品,涉及人工智能技术领域,具体为深度学习和智能推荐技术领域,可应用于数据排序等场景。具体实现方案为:获取训练样本集;执行以下训练步骤:从训练样本集中选取多个训练样本输入到多智能体模型中进行打分,得到多个智能体各自对应的打分结果;将打分结果进行拼接,得到联合得分;将联合得分输入到分数评估环境中,得到多个智能体各自对应的奖励值;基于打分结果和奖励值对多智能体模型进行训练;响应于训练次数等于预设次数阈值,输出训练完成的多智能体模型。提高了排序的准确性。
本发明授权多智能体模型的训练方法和排序方法在权利要求书中公布了:1.一种多智能体模型的训练方法,包括: 获取训练样本集; 执行以下训练步骤: 从所述训练样本集中选取多个训练样本输入到多智能体模型中各个智能体的打分网络进行打分,得到多个智能体各自对应的打分结果; 将所述打分结果进行拼接,得到联合得分; 将所述联合得分输入到分数评估环境中,得到所述多个智能体各自对应的奖励值; 基于所述打分结果和所述奖励值对所述多智能体模型进行训练,是基于每一个智能体对应的打分结果和奖励值对各个智能体单独进行训练,包括:基于每一个智能体的所述打分结果和所述奖励值对对应的智能体的评估网络进行训练;基于所述多个训练样本和训练后的所述评估网络对对应的智能体的所述打分网络进行训练; 响应于训练次数等于预设次数阈值,输出训练完成的多智能体模型; 其中,所述训练样本集中的一个训练样本包括一条待推荐数据及对应的用户数据,所述待推荐数据包括标识数据及文本数据; 在对所述多智能体模型进行训练之前,所述方法还包括: 对所述训练样本集中的训练样本进行特征提取,得到标识特征、文本特征和用户特征; 将每一个训练样本对应的标识特征、文本特征和用户特征拼接为一个特征矩阵,并将得到的多个特征矩阵确定为样本特征集。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人百度在线网络技术(北京)有限公司,其通讯地址为:100085 北京市海淀区上地十街10号百度大厦三层;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。