上海燧原科技有限公司朱姗获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉上海燧原科技有限公司申请的专利量化神经网络模型的片内执行方法、装置、设备及介质获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN115409161B 。
龙图腾网通过国家知识产权局官网在2025-08-01发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202211216879.4,技术领域涉及:G06N3/0495;该发明授权量化神经网络模型的片内执行方法、装置、设备及介质是由朱姗;孙诚程设计研发完成,并于2022-09-30向国家知识产权局提交的专利申请。
本量化神经网络模型的片内执行方法、装置、设备及介质在说明书摘要公布了:本发明公开了量化神经网络模型的片内执行方法、装置、设备及介质。该方法包括:获取与待加载至目标AI加速芯片中的量化神经网络模型匹配的原始算子图;根据目标AI加速芯片的计算单元特征和或指令集特征重构原始算子图得到第一算子图;在第一算子图的第二量化敏感节点集合中确定目标节点并替换为分支网络;将第一算子图中第一量化敏感节点集合的计算节点替换为非量化节点;根据目标AI加速芯片的存储层级特征重构第一算子图得到第二算子图;再训练与第二算子图对应的原始量化重构模型,并加载至目标AI加速芯片内执行。通过本发明的技术方案,能够在提高量化神经网络模型精度的基础上,将AI加速芯片的计算性能发挥到最优。
本发明授权量化神经网络模型的片内执行方法、装置、设备及介质在权利要求书中公布了:1.一种量化神经网络模型的片内执行方法,其特征在于,包括: 获取与待加载至目标人工智能AI加速芯片中的量化神经网络模型匹配的原始算子图,其中,量化神经网络模型通过对目标神经网络模型进行后训练量化得到; 根据目标AI加速芯片中的计算单元特征和或指令集特征,对原始算子图进行一次重构,得到第一算子图; 在第一算子图中的各计算节点中,识别第一量化敏感节点集合和第二量化敏感节点集合,并在第二量化敏感节点集合中确定设定数量的目标节点;其中,第一量化敏感节点的量化敏感度高于第二量化敏感节点; 在第一算子图中,将第一量化敏感节点集合中的各计算节点替换为非量化节点,并将各目标节点使用分支网络进行替换,其中,分支网络中包括与所替换节点结构相同的多个分支节点,用于加权拟合所替换节点的计算结果; 根据目标AI加速芯片的存储层级特征,对第一算子图进行二次重构,得到第二算子图; 对与第二算子图对应的原始量化重构模型进行再训练,得到目标量化重构模型,并将目标量化重构模型加载至目标AI加速芯片内进行执行。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人上海燧原科技有限公司,其通讯地址为:201306 上海市浦东新区中国(上海)自由贸易试验区临港新片区业盛路188号A-522室;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。