成都大学高朝邦获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉成都大学申请的专利一种中小学教育辅导大模型的构建方法、系统、设备及介质获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN120372300B 。
龙图腾网通过国家知识产权局官网在2025-09-12发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202510872963.9,技术领域涉及:G06Q50/20;该发明授权一种中小学教育辅导大模型的构建方法、系统、设备及介质是由高朝邦;何昊;梁华;吉祥设计研发完成,并于2025-06-27向国家知识产权局提交的专利申请。
本一种中小学教育辅导大模型的构建方法、系统、设备及介质在说明书摘要公布了:本发明涉及人工智能技术领域,具体地说,涉及一种中小学教育辅导大模型的构建方法、系统、设备及介质;该方法首先将Qwen2.5‑3B‑Instruct作为基础模型,并根据获取的教学数据集构建训练数据集;然后根据训练数据集,构建奖励函数得到奖励值,并调用强化学习方法调整模型参数,得到强化后的基础模型;最后根据构建的教师风格数据集、设置的个性化提示词,以监督指令微调的方式微调强化后的基础模型,得到中小学教育辅导大模型,通过双阶段微调,提升了模型的推理能力,在保持较低计算资源需求的同时,提高老人模型面对复杂问题的处理能力并赋予其明确的教师风格。
本发明授权一种中小学教育辅导大模型的构建方法、系统、设备及介质在权利要求书中公布了:1.一种中小学教育辅导大模型的构建方法,其特征在于,具体包括以下步骤: 步骤S1:将Qwen2.5-3B-Instruct作为基础模型,并根据获取教学数据集构建训练数据集; 步骤S2:根据训练数据集,构建奖励函数得到奖励值,并调用强化学习方法调整模型参数,得到强化后的基础模型; 步骤S3:根据构建的教师风格数据集、设置的个性化提示词,以监督指令微调的方式微调强化后的基础模型,得到中小学教育辅导大模型; 所述步骤S2具体包括以下步骤: 步骤S21:根据基础模型生成的答案、标准答案、相似度函数、设置的奖励参数,构建奖励函数,计算奖励值; 步骤S22:根据设定的正则系数、设定的裁剪阈值、模型参数,计算概率分布; 步骤S23:根据奖励值、概率分布,计算KL散度; 步骤S24:根据KL散度上限值和下限值调整正则系数,得到强化后的基础模型; 所述步骤S22具体包括以下步骤: 步骤S221:根据从训练数据集获取的题目、模型采样答案、大模型策略,计算策略比率; 步骤S222:根据奖励值、当前缓冲区所有题目的平均奖励,计算优势估计; 步骤S223:根据设定的正则系数、设定的裁剪阈值、优势估计、策略比率,计算基础模型以模型参数θ生成答案的概率,得到概率分布; 所述步骤S3具体包括以下步骤: 步骤S31:根据获取的典型试题和对应的教师风格讲解的问答对数据集,构建教师风格增强数据集; 步骤S32:将教师风格增强数据集转换为Alpaca指令形式的数据对,并调用Role-Play构建个性化提示词; 步骤S33:以监督指令微调的方式微调强化后的基础模型,得到中小学教育辅导大模型; 所述步骤S33具体包括以下步骤: 步骤S331:在基础模型的若干线性变换矩阵中插入LoRA适配器; 步骤S332:保持原线性变换矩阵冻结,训练新增的LoRA适配器矩阵; 步骤S333:根据Alpaca指令形式的数据对,调用Adam优化器将LoRA适配器矩阵进行梯度更新,得到监督式指令微调后的基础模型,即中小学教育辅导大模型。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人成都大学,其通讯地址为:610000 四川省成都市龙泉驿区外东十陵镇成洛大道2025号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。