Document
拖动滑块完成拼图
个人中心

预订订单
商城订单
发布专利 发布成果 人才入驻 发布商标 发布需求

请提出您的宝贵建议,有机会获取IP积分或其他奖励

投诉建议

在线咨询

联系我们

龙图腾公众号
首页 专利交易 IP管家助手 科技果 科技人才 积分商城 国际服务 商标交易 会员权益 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索
当前位置 : 首页 > 专利喜报 > 北京师范大学黄华获国家专利权

北京师范大学黄华获国家专利权

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

龙图腾网获悉北京师范大学申请的专利一种基于过程监督强化学习的代码生成方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN120386514B

龙图腾网通过国家知识产权局官网在2025-11-25发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202510468676.1,技术领域涉及:G06F8/30;该发明授权一种基于过程监督强化学习的代码生成方法是由黄华;张婷;姜文斌;叶宇凡设计研发完成,并于2025-04-15向国家知识产权局提交的专利申请。

一种基于过程监督强化学习的代码生成方法在说明书摘要公布了:本发明公开了一种基于过程监督强化学习的代码生成方法,包括:获取原始代码数据集并进行预处理,基于预处理后的原始代码数据集生成若干个修改后的代码片段并自动标注,获得过程监督数据集;其中,预处理包括格式标准化;基于过程监督数据集对过程监督奖励模型进行训练;通过策略模型生成代码片段,基于训练后的过程监督奖励模型获得代码片段的整体奖励信号;基于整体奖励信号对策略模型进行更新。本发明实现了过程监督数据集的自动构建,大幅降低人工标注成本;通过引入过程监督强化学习方法,显著提升了代码生成模型的质量和效率。

本发明授权一种基于过程监督强化学习的代码生成方法在权利要求书中公布了:1.一种基于过程监督强化学习的代码生成方法,其特征在于,包括以下步骤: 获取原始代码数据集并进行预处理,基于预处理后的原始代码数据集生成若干个修改后的代码片段并自动标注,获得过程监督数据集;其中,预处理包括格式标准化; 获得过程监督数据集的过程包括: 通过教师模型对预处理后的原始代码数据集中的代码进行逐行变异和重构,获得若干个修改后的代码片段;对预处理后的原始代码数据集中的代码和若干个修改后的代码片段进行标注,获得过程监督奖励数据集; 标注的过程包括: 对预处理后的原始代码数据集中的代码逐行分割后进行掩码处理,并通过编译器进行标签标记,获得正样本;通过编译器和执行验证对若干个修改后的代码片段进行自动标注,通过全部测试用例则标注为正样本,未通过全部测试用例则标注为负样本;正样本和负样本组成过程监督奖励数据集; 基于过程监督数据集对过程监督奖励模型进行训练; 通过策略模型生成代码片段,基于训练后的过程监督奖励模型获得代码片段的整体奖励信号;基于所述整体奖励信号对策略模型进行更新; 获得代码片段的整体奖励信号的过程包括: 将代码片段划分为多个子片段,对每个子片段独立分配奖励值;基于每个子片段分配的奖励值进行加权聚合,获得代码片段的整体奖励信号; 过程监督奖励模型为: 其中,表示代码序列的前行,同步执行在时间结束,为输入片段,表示过 程监督奖励模型的参数。

如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人北京师范大学,其通讯地址为:100875 北京市海淀区新街口外大街19号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。

以上内容由龙图腾AI智能生成。

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。