一种基于复述质量优化的大语言模型数学推理方法

买专利卖专利找龙图腾，真高效！查专利查商标用IPTOP,全免费！专利年费监控用IP管家,真方便！

摘要：本发明涉及一种基于复述质量优化的大语言模型数学推理方法，通过高质量的问题复述提升大语言模型的数学推理能力，本方案融合了多指标评分与成对比较两个模块：前者从六个角度出发，通过实验确定最佳的提示方式，利用大语言模型对复述质量进行单指标打分；后者则依据复述的综合质量，使用大语言模型进行复述间的相对排名，最终训练一个梯度提升决策树分类模型，将多指标评分模块的得分以及成对比较模块的相对关系作为特征输入，决策并挑选最佳复述。本发明提供了一种使用大语言模型进行复述质量评估通用的评价框架，有效地提升了模型在数学问题上的表现。

主权项：1.一种基于复述质量优化的大语言模型数学推理方法，其特征在于：包括以下步骤：步骤一：从数据集中选取一个数学问题，构建提示，并利用LLM生成多条复述；步骤二：设定连贯性、一致性、流畅性、相关性、匹配性和逻辑性共六个评估指标，用于复述质量评估；通过实验为各指标设置不同的提示方式，发挥各指标的评估性能；步骤三：结合步骤二中的六个指标及其对应的提示方式，使用LLM分别对各复述进行多指标评分，并将输出token的概率均值作为得分；步骤四：使用LLM对所有复述进行成对比较，通过多次对比累计积分的方式，得到复述之间的相对关系；所述步骤四具体包括：使用LLM对所有复述进行成对比较，采用循环比较的方式，即每条复述都需要与其他备选复述比较一次，则n条复述共会形成个对比组，复述ri与复述rj的比较可表示为LLMpromptCMP,q,ri,rj，其中promptCMP表示成对比较的具体提示；在进行各对比组的比较时，会顺序对比5次，交换两者的顺序再对比5次，对于每次比较，LLM都会选择综合表现更佳的复述，该复述获得2积分；如果两者不分伯仲，则各获得1积分，记ri与rj比较后获得的积分分别为与一轮有效的成对比较后，各复述间应该形成了明朗的偏序关系，即满足如下约束条件，复述间的优劣关系可构成一个有向无环的哈斯图；若复述间不满足上述约束条件，则应当认为此次比较是自相矛盾的，针对矛盾部分进行重新比较，将复述之间的优劣关系转化为一个有向图，不满足上述约束的部分会在图中形成环路，使用拓扑排序去除所有入度为0的点以及出度为0的点，剩余无法去除的部分即为需要重新比较的所有复述；步骤五：训练一个分类器作为决策模型，包含如下过程：对训练集进行数据预处理，筛选存在最佳复述的样本；使用上述样本执行步骤一到步骤四，获取模型的输入特征和标签；选用梯度提升树算法实现分类任务，并使用XGBoost训练得到分类器，实现最终决策；步骤六：将步骤三多指标评分后的得分与步骤四成对比较后的积分输入训练完的决策模块，得到决策结果，将其选定为最佳复述；步骤七：使用筛选出的最佳复述结合原问题作为Prompt，以零样本思维链结合自一致性检查的方式输入给GPT-3.5以获得问题答案。

全文数据：

权利要求：

百度查询：杭州电子科技大学一种基于复述质量优化的大语言模型数学推理方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：一种可收集废料的雕塑加工底座

下一篇：一种多旋翼无人机的便捷拆卸式机臂

相关技术

一种可收集废料的雕塑加工底座

一种多旋翼无人机的便捷拆卸式机臂

北美型猪繁殖与呼吸综合征病毒囊膜主要糖蛋白GP5的保守中和表位QT7、核酸分子、表达载体、中和抗体及其应用

一种清洁剂内置的清洁海绵

一种磁保持继电器的安装限定结构

一种建筑造价测绘装置

一种酸碱液回收利用装置

一种蓄电池安装架

一种耐老化物流集装箱密封条

一种儿童心血管数据集成及智能归档系统

一种智能眼镜

一种可靠性高的多芯高储能薄膜电容器

语言相关技术

训练语言模型的方法及装置_支付宝(杭州)信息技术有限公司_202411123942.9

基于互动语言的素材推送方法及装置_成都帆点创想科技有限公司_202411002172.2

针对PHP语言的Webshell文件检测方法及系统_北京信息科技大学_202411027271.6

一种自然语言需求至可工作软件的转化方法及系统_北京跨赴科技有限公司_202411220931.2

一种基于大型语言模型的会议纪要生成方法_航天物联网技术有限公司_202411159823.9

一种基于语言大模型的语句生成方法及设备_海信集团控股股份有限公司_202411099543.3

一种面向大语言模型的文本切分方法、设备和介质_知学云(北京)科技股份有限公司_202410571033.5

基于知识图谱的语言模型查询请求处理方法与服务设备_上海玄图智能科技有限公司_202411009747.3

结合双模态理解与大语言模型的伪造信息检测方法_深圳市金大智能创新科技有限公司_202410996900.X

自适应噪声抑制的多语言长录音转写方法、系统以及设备_深圳市贝铂智能科技有限公司_202411452249.6

模型相关技术

基于预训练模型参数融合的模型微调方法_浙江大学_202410989398.X

模型训练方法、模型推理方法和装置_上海壁仞科技股份有限公司_202411175297.5

美发教习模型_青岛金达发制品有限公司_202420253532.5

动漫人物模型尺_刘毅_202411000219.1

模型部署方法及其装置_维沃移动通信有限公司_202411101863.8

模型评测方法及设备_北京达佳互联信息技术有限公司_202210770160.9

钢结构框架教学模型_山东祥云数据科技有限公司_202323392239.1

波浪谱模型选取方法_中国电建集团成都勘测设计研究院有限公司_202411039936.5

一种火箭模型_徐州市前沿智能科技有限公司_202420368359.3

基于高斯混合模型和隐马尔可夫模型的眼动行为分类方法_中国科学技术大学_202411023991.5

优化相关技术

优化的弹簧笼_赫斯曼汽车有限公司_202380034185.5

梯级水库群优化调度并行变参数模拟退火优化方法_长江勘测规划设计研究有限责任公司_202411019942.4

一种电机运行数据的无线传输优化方法及优化系统_常州全一智能科技有限公司_202411498542.6

一种多目标优化的5G基站布局优化方法_陕西智引科技有限公司_202410944738.7

一种优化单晶铸件晶粒生长方向的装置及优化方法_苏州高晶新材料科技有限公司_202411106175.0

空气优化设备的无极调压调速电路及空气优化设备_青岛普兴正道空气消毒有限公司_202010382835.3

一种基于改进季节优化算法的无人机速度控制优化方法_欧冶链金再生资源有限公司_202411106739.0

基于持续优化迭代的电网控制优化系统和方法_国网新疆电力有限公司巴州供电公司_202411159690.5

一种基于优化算法的配电网自愈策略优化方法及系统_贵州电网有限责任公司_202410885378.8

跟踪目标的定位优化方法_重庆工商大学_202210354094.7

龙图腾网&IPTOP

设置信息完成注册

手机号绑定多个账号

一种基于复述质量优化的大语言模型数学推理方法

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务