浪潮电子信息产业股份有限公司晁银银获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉浪潮电子信息产业股份有限公司申请的专利一种神经网络模型量化方法、系统、设备及计算机介质获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN114970822B 。
龙图腾网通过国家知识产权局官网在2025-07-15发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202210609520.7,技术领域涉及:G06N3/0495;该发明授权一种神经网络模型量化方法、系统、设备及计算机介质是由晁银银;董刚;赵雅倩;李仁刚;王斌强;梁玲燕设计研发完成,并于2022-05-31向国家知识产权局提交的专利申请。
本一种神经网络模型量化方法、系统、设备及计算机介质在说明书摘要公布了:本申请公开了一种神经网络模型量化方法、系统、设备及计算机介质,用于对神经网络模型进行量化,包括获取待量化的目标神经网络模型中各网络层的权重值、超参数及位置序号;对权重值、超参数及位置序号进行线性嵌入,生成目标嵌入矩阵;基于预先训练好的Transformer模型对目标嵌入矩阵进行处理,得到目标神经网络模型中各网络层的量化bit数;基于量化bit数对目标神经网络模型进行量化,得到目标量化神经网络模型。本申请中,借助Transformer模型对目标嵌入矩阵进行处理,得到目标神经网络模型中各层的量化bit数,可以降低模型大小和内存占用,同时保留原网络的精度损失较小,此外可以大大减少运算量,局限性低。
本发明授权一种神经网络模型量化方法、系统、设备及计算机介质在权利要求书中公布了:1.一种神经网络模型量化方法,其特征在于,包括: 获取待量化的目标神经网络模型中各网络层的权重值、超参数及位置序号; 对所述权重值、所述超参数及所述位置序号进行线性嵌入,生成目标嵌入矩阵; 基于预先训练好的Transformer模型对所述目标嵌入矩阵进行处理,得到所述目标神经网络模型中各所述网络层的量化bit数; 基于所述量化bit数对所述目标神经网络模型进行量化,得到目标量化神经网络模型,以降低模型大小和内存占用; 将所述目标量化神经网络模型部署至设备; 其中,所述目标神经网络模型可用于对图片进行处理;且所述Transformer模型包括由测试集图片训练得到的模型; 其中,所述量化bit数的运算公式包括: ; ; 其中,表示第个所述网络层的所述量化bit数,,表示所述网络层的总层数;表示四舍五入算法;表示量化的最小值;表示量化的最大值;表示顺次连接的encoder层的总个数;表示第个所述encoder层的处理结果;、表示预设值。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人浪潮电子信息产业股份有限公司,其通讯地址为:250101 山东省济南市高新区浪潮路1036号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。