恭喜阿里云飞天(杭州)云计算技术有限公司杨倩文获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网恭喜阿里云飞天(杭州)云计算技术有限公司申请的专利模型训练方法及文本处理方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN119272817B 。
龙图腾网通过国家知识产权局官网在2025-03-28发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202411804544.3,技术领域涉及:G06N3/0464;该发明授权模型训练方法及文本处理方法是由杨倩文;李屾设计研发完成,并于2024-12-09向国家知识产权局提交的专利申请。
本模型训练方法及文本处理方法在说明书摘要公布了:本说明书实施例提供模型训练方法及文本处理方法,其中模型训练方法包括:获取至少两个参考模型,并基于各参考模型获取至少两个目标数据处理网络,其中,目标数据处理网络包括至少一个全量数据处理网络和至少一个压缩数据处理网络;根据各目标数据处理网络生成数据处理模型,其中,数据处理模型包括至少一个数据编码层,数据编码层包括至少一个全量数据处理网络和至少一个压缩数据处理网络;获取目标样本数据,并基于目标样本数据训练数据处理模型,直至数据处理模型达到模型训练停止条件。通过全量与压缩数据处理网络构建目标数据处理网络,能够有效降低大模型训练的资源消耗,进而在保证了数据处理准确率的前提下提高了数据处理的效率。
本发明授权模型训练方法及文本处理方法在权利要求书中公布了:1.一种模型训练方法,包括:获取至少两个参考模型,并基于各参考模型获取至少两个目标数据处理网络,其中,目标数据处理网络包括至少一个全量数据处理网络和至少一个压缩数据处理网络;在各目标数据处理网络中确定目标全量数据处理网络和至少一个目标压缩数据处理网络;获取路径选择网络,并根据所述路径选择网络、所述目标全量数据处理网络和各目标压缩数据处理网络获取目标数据编码层;根据至少一个目标数据编码层生成数据处理模型,其中,所述目标全量数据处理网络为各全量数据处理网络中的任意一个,目标压缩数据处理网络为各压缩数据处理网络中的任意一个,所述路径选择网络用于在所述目标全量数据处理网络和各目标压缩数据处理网络中选择本轮进行数据处理的至少一个数据处理网络,所述数据处理模型用于进行文本处理;获取目标样本数据和针对目标项目的项目样本数据,并基于所述目标样本数据获取基于所述数据处理模型处理所述目标样本数据获取第一模型损失值;确定第一参考数据编码层,其中,所述第一参考数据编码层为各参考数据编码层中的任意一个,所述第一参考数据编码层包括路径选择网络和至少两个目标数据处理网络;将所述项目样本数据输入至所述路径选择网络,获取所述路径选择网络生成的路径选择信息;基于所述路径选择信息在各目标数据处理网络中确定至少一个第一目标数据处理网络,和至少一个第二目标数据处理网络,其中,第一目标数据处理网络为经所述路径选择网络判断确定用于处理所述项目样本数据的数据处理网络,第二目标数据处理网络为各目标数据处理网络中除第一目标数据处理网络之外的目标数据处理网络;根据各第一目标数据处理网络处理所述项目样本数据获取第一数据特征信息,并根据各第二目标数据处理网络处理所述项目样本数据获取第二数据特征信息;基于所述第一数据特征信息和所述第二数据特征信息获取第二模型损失值;根据所述第一模型损失值和所述第二模型损失值调整所述数据处理模型对应的目标参数和各数据编码层中路径选择网络对应的路径选择参数,直至所述数据处理模型达到模型训练停止条件,其中,所述目标样本数据为用于训练所述数据处理模型的数据。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人阿里云飞天(杭州)云计算技术有限公司,其通讯地址为:311199 浙江省杭州市临平区星桥街道星桥北路173号2幢121室;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。