恭喜科大讯飞股份有限公司王士进获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网恭喜科大讯飞股份有限公司申请的专利步骤批改大模型训练方法、作业批改方法、装置及系统获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN119416858B 。
龙图腾网通过国家知识产权局官网在2025-05-09发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202510032098.7,技术领域涉及:G06N3/092;该发明授权步骤批改大模型训练方法、作业批改方法、装置及系统是由王士进;朱焯铭;王永康;沙晶;钟志成;杜倩云;盛志超;刘聪;胡国平设计研发完成,并于2025-01-09向国家知识产权局提交的专利申请。
本步骤批改大模型训练方法、作业批改方法、装置及系统在说明书摘要公布了:本申请公开了一种步骤批改大模型训练方法、作业批改方法、装置及系统,本申请获取第一训练数据,第一训练数据至少包括题目作答数据、标注的用户作答的整题评分标签,以采用领域训练数据训练后的大模型作为初始的步骤批改大模型,针对第一训练数据中的用户作答,逐个步骤采样步骤批改大模型的输出,并至少基于采样结果和用户作答的整题评分标签,估计每个步骤批改结果准确的概率标签,如此可以无需大批量人工标注步骤级批改结果,降低了标注数据的获取成本。在此基础上可以对步骤批改大模型进行训练,得到训练后的步骤批改大模型。本申请允许在训练数据不均衡的情况下高效利用所有训练数据进行模型训练,达到兼顾步骤批改能力和评分能力的效果。
本发明授权步骤批改大模型训练方法、作业批改方法、装置及系统在权利要求书中公布了:1.一种步骤批改大模型训练方法,其特征在于,包括:获取采用领域训练数据训练后的大模型,所述领域训练数据至少包括题目作答数据,所述题目作答数据包括题目、标准答案和用户作答;获取第一训练数据,所述第一训练数据至少包括所述题目作答数据、标注的所述用户作答的整题评分标签;以所述大模型作为初始的步骤批改大模型,针对所述第一训练数据中的所述用户作答,遍历所述用户作答中的每个步骤,针对遍历到的当前第t个步骤:按照配置的采样次数进行采样,每次采样时固定住前t个步骤的批改结果,并利用所述步骤批改大模型继续预测后续各个步骤的批改结果及整题评分,得到采样结果;至少基于所述采样结果和所述用户作答的整题评分标签,计算每个步骤批改结果对应的蒙特卡洛分数,并以所述蒙特卡洛分数作为每个步骤批改结果准确的概率标签;利用所述第一训练数据及估计得到的所述每个步骤批改结果准确的概率标签,对所述步骤批改大模型进行训练,得到训练后的步骤批改大模型。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人科大讯飞股份有限公司,其通讯地址为:230088 安徽省合肥市高新区望江西路666号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。