Document
拖动滑块完成拼图
个人中心

预订订单
服务订单
发布专利 发布成果 人才入驻 发布商标 发布需求

在线咨询

联系我们

龙图腾公众号
首页 专利交易 IP管家助手 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索
当前位置 : 首页 > 专利喜报 > 湖南工商大学彭晗获国家专利权

湖南工商大学彭晗获国家专利权

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

龙图腾网获悉湖南工商大学申请的专利基于三段式GRPO强化学习的裁判文书摘要生成方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN120278126B

龙图腾网通过国家知识产权局官网在2025-09-09发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202510758056.1,技术领域涉及:G06F40/166;该发明授权基于三段式GRPO强化学习的裁判文书摘要生成方法是由彭晗;阮日青;张技权;李紫慕;张金传;刘星宝;吴博;任剑设计研发完成,并于2025-06-09向国家知识产权局提交的专利申请。

基于三段式GRPO强化学习的裁判文书摘要生成方法在说明书摘要公布了:本发明实施例中提供了一种基于三段式GRPO强化学习的裁判文书摘要生成方法,属于数据处理技术领域,具体包括:步骤1,建模三段式思维链;步骤2,根据三段式思维链对原始裁判文书数据集进行数据蒸馏与分层,得到不同类型的数据集,其中,所述类型包括高相关性、中相关性和低相关性;步骤3,使用高相关性数据集对大语言模型进行SFT监督微调训练;步骤4,利用全部数据集对训练后的大语言模型进行多阶段GRPO强化学习训练,得到目标模型;步骤5,将目标裁判文书输入目标模型,生成目标摘要。通过本发明的方案,提高了摘要生成效率、精准度和适应性。

本发明授权基于三段式GRPO强化学习的裁判文书摘要生成方法在权利要求书中公布了:1.一种基于三段式GRPO强化学习的裁判文书摘要生成方法,其特征在于,包括: 步骤1,建模三段式思维链; 所述步骤1具体包括: 步骤1.1,定义三段式摘要格式,其中,所述三段式摘要格式包括对案件的实体提取、分析推理和摘要生成; 步骤1.2,设定通过预定义的Prompt模板引导模型按照三段式摘要格式生成输出内容的过程,形成三段式思维链; 步骤2,根据三段式思维链对原始裁判文书数据集进行数据蒸馏与分层,得到不同类型的数据集,其中,所述类型包括高相关性、中相关性和低相关性; 步骤3,使用高相关性数据集对大语言模型进行SFT监督微调训练; 步骤4,利用全部数据集对训练后的大语言模型进行多阶段GRPO强化学习训练,得到目标模型; 所述步骤4具体包括: 步骤4.1,设定多阶段GRPO强化学习训练的数据引入策略; 步骤4.2,从高相关性数据集中随机挑选一个三段式推理链摘要作为上下文学习模板; 步骤4.3,设定格式奖励、语言流畅性奖励、内容准确性奖励和上下文相似性奖励,据此形成总奖励; 步骤4.4,利用上下文学习模板生成原始裁判文书数据集中的每个裁判文书对应的多个候选摘要; 步骤4.5,根据总奖励计算每个候选摘要的相对奖励; 步骤4.6,基于相对奖励和数据引入策略,通过策略梯度优化大语言模型,得到目标模型; 步骤5,将目标裁判文书输入目标模型,生成目标摘要。

如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人湖南工商大学,其通讯地址为:410205 湖南省长沙市岳麓区岳麓大道569号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。