重庆大学鄢萌获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉重庆大学申请的专利一种基于大模型的代码智能任务性能提升方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN119621122B 。
龙图腾网通过国家知识产权局官网在2025-08-22发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202411709424.5,技术领域涉及:G06F8/70;该发明授权一种基于大模型的代码智能任务性能提升方法是由鄢萌;黄乃琪;张小洪;孙伟峰;雷晏;刘超;徐玲设计研发完成,并于2024-11-27向国家知识产权局提交的专利申请。
本一种基于大模型的代码智能任务性能提升方法在说明书摘要公布了:本发明公开了一种基于大模型的代码智能任务性能提升方法,完成对低质量输入的动态修复。包括:输入数据x正常传递给目标深度代码模型,得到输出与概率信息,计算PPL、STOS、SMOS、AUC四种评估指标分数;利用梯度提升树,通过四种评估指标识别出需要修复的低质量输入xlow;使用Jaccard相似度进行检索,寻找k个与低质量输入xlow相似的代码示例按照生成范式与选择范式构建提示输入LLM进行低质量输入的修复;通过LLM返回的概率信息PLLMx计算困惑度,自适应选择Repairgen和Repairsel中置信度最高的输出作为修复的结果。
本发明授权一种基于大模型的代码智能任务性能提升方法在权利要求书中公布了:1.一种基于大模型的代码智能任务性能提升方法,其特征在于:包括如下步骤: S101:获取若干段具有真实结果yture的代码,将每段代码作为原始输入x传递给深度代码模型,以获取对应的初始输出结果y和概率信息Px,原始输入,对应的初始输出结果和概率信息构成一个样本,若干样本构成数据集; S102:计算每个样本中初始输出结果的困惑度PPL得分scoreppl; S103:计算每个样本基于语法的输出相似度STOS得分scorestos; S104:计算每个样本基于语义的输出相似度SMOS得分scoresmos; S105:计算每个样本中原始输入的语义理解一致性SUC得分scoresuc; S106:将数据集划分为训练集和验证集,使用验证集中的样本和样本对应的scoreppl、scorestos、scoresmos和scoresuc采用有监督的方式训练训练梯度提升树GBDT,最小化预测误差,得到最优分类器; 将训练集中的训练样本对应的scoreppl、scorestos、scoresmos和scoresuc输入最优分类器,将训练样本划分为高质量输入xhigh与低质量输入xlow; S107:通过Jaccard相似度检索训练集中与xlow最相似的前k个训练样本作为代码示例; S108:根据生成和选择两种范式分别为LLM构建提示,将两种范式构建的提示与xlow首位拼接生成两个完整的思维链,将思维链输入LLM进行交互以产生两个修复结果Repairgen和Repairsel并输出; S109:基于困惑度对Repairgen和Repairsel进行评估,自适应选择最高置信度的修复结果作为最终修复结果; S110:对于一段新代码x′,将x′传递给深度代码模型,以获取对应的初始输出结果y′和概率信息Px′,采用S102-S106的方法分别计算x′对应的困惑度PPL得分scoreppl′,相似度STOS得分scorestos′,相似度SMOS得分scoresmos′和语义理解一致性SUC得分scoresuc′,再将scoreppl′、scorestos′、scoresmos′和scoresuc′输入最优分类器,如果被划分为高质量输入,则表示x′质量高,无需修复,如果输出为低质量输入xlow′,则采用S108-S109的方法对x′进行修复并输出最终修复结果。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人重庆大学,其通讯地址为:400044 重庆市沙坪坝区沙正街174号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。