首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

基于机器学习的架构无关神经网络参数生成方法及系统 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

申请/专利权人:浙江大学

摘要:本发明公开了一种基于机器学习的架构无关神经网络参数生成方法及系统,本发明的方法由文本编码器通过编码生成对应的基底参数和参数掩码,利用参数掩码对基底参数进行裁剪,从而生成不同形状的人工智能模型参数,达到架构无关的效果。本发明的方法不同于一般的神经网络参数生成方法,可以快速生成任意架构的神经网络的参数。

主权项:1.一种基于机器学习的架构无关神经网络参数生成方法,其特征在于,包括以下步骤:S1.获取包含多个任务的机器学习数据集,为每个机器学习数据集构建任务描述,并根据每个机器学习数据集的任务类型构建损失函数,获取与每个机器学习数据集各自适配的人工智能模型,获取每个人工智能模型中各个子模块的命名与各个子模块的参数量大小,每个子模块的命名与参数量大小均为文本格式,将每个子模块的命名与参数量大小进行文本拼接,得到每个子模块的描述信息,将每个机器学习数据集的任务描述与每个机器学习数据集各自对应的子模块的描述信息拼接后,构成每个机器学习数据集的描述信息,将每个机器学习数据集以及每个机器学习数据集各自对应的损失函数、描述信息以及人工智能模型组合在一起构成一个四元组并作为预训练数据库的一个样本,直到所有机器学习数据集均组合完毕,得到完整的预训练数据库;其中,机器学习数据集为文本数据集、图像数据集或者表格数据集,人工智能模型为用于对文本数据集进行分类的文本分类模型、用于对图像数据集进行分类的图像分类模型或者用于对表格数据集进行分类的表格分类模型;S2.从预训练数据库中采样得到一个用于预训练的四元组,获取包含文本编码器和多头解码器的超模型,在用于预训练的四元组上对超模型进行预训练操作,得到预训练好的超模型;其中,用于预训练的四元组由采样得到的机器学习数据集、与采样得到的机器学习数据集对应的损失函数、描述信息以及人工智能模型组成;S3.获取目标任务的描述信息以及用于执行目标任务的目标人工智能模型,将目标任务的描述信息输入到预训练好的超模型中,将预训练好的超模型输出的参数作为目标人工智能模型的参数,将目标人工智能模型的参数添加到目标人工智能模型中,输出参数生成好的目标人工智能模型,用于对文本数据、图像数据或者表格数据进行分类。

全文数据:

权利要求:

百度查询: 浙江大学 基于机器学习的架构无关神经网络参数生成方法及系统

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。