中国石油大学(华东)李莉获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉中国石油大学(华东)申请的专利一种基于大语言模型的教材知识图谱分层次自动生成方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN120069044B 。
龙图腾网通过国家知识产权局官网在2025-09-19发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202510552042.4,技术领域涉及:G06N5/022;该发明授权一种基于大语言模型的教材知识图谱分层次自动生成方法是由李莉设计研发完成,并于2025-04-29向国家知识产权局提交的专利申请。
本一种基于大语言模型的教材知识图谱分层次自动生成方法在说明书摘要公布了:本发明提供了一种基于大语言模型的教材知识图谱分层次自动生成方法,属于知识图谱技术领域,通过对Qwen2.5模型进行定制化微调,更好地对教材进行自然语言理解,准确抽取知识点之间的逻辑关系并总结每个知识点的属性描述,使得生成的知识图谱能够清晰呈现教材涉及的知识点、知识点之间的关系以及知识点属性;通过设计分层次抽取流程实现粗细粒度控制,利用目录结构和分段策略逐步抽取目录、实体、关系和属性,确保能够直接抽取教师教学中直接能用的知识点,规避知识点抽取时将与教学无关的命名实体抽取出来的问题;通过设计详细且严格的抽取指令,约束抽取范围保证属性与实体的强语义绑定,使得模型更好地理解任务要求从而在抽取过程中减少偏差。
本发明授权一种基于大语言模型的教材知识图谱分层次自动生成方法在权利要求书中公布了:1.一种基于大语言模型的教材知识图谱分层次自动生成方法,其特征在于,包括: 步骤一:利用通用大模型抽取样本教材文本中的知识点并进行人工审核,以抽取的知识点为样本教材文本的标注信息得到训练数据; 步骤二:选择Qwen2.5模型作为教材知识图谱抽取模型,采用LLaMA-Factory工具结合所述训练数据对Qwen2.5模型进行定制化微调; 步骤三:设计分层次抽取流程和抽取指令,并基于分层次抽取流程和抽取指令以及Qwen2.5模型抽取待处理教材文本的教材知识图谱,其中,所述分层次抽取流程依次包括目录结构抽取、目录层级关系抽取、文本切分与目录对应、目录内知识点实体抽取、知识点实体间关系抽取、知识点实体属性抽取,文本知识点实体抽取指令规定文本知识点实体抽取的知识点类型、约束和输出格式,知识点实体间关系抽取指令规定关系类型、约束和输出格式,知识点实体属性抽取指令规定属性类型、约束和输出格式; 采用LLaMA-Factory工具结合所述训练数据对Qwen2.5模型进行定制化微调,包括: 采用LoRA微调方法,通过在预训练模型中添加低秩矩阵来适应特定任务,而非直接微调所有参数,采用LoRA微调方法,设置lora_target为all,采用SFT进行监督式微调,采用模板为glm4,设置教材文本的最大截断长度为4000,数据预处理部分设置16个工作进程进行并行处理,训练部分设置学习率为1.0e-4、设置每个设备的训练批量大小为1、设置累积8个批次的梯度后再进行更新、采用余弦学习率调度器调整学习率、学习率热身比例为0.1,评估部分从训练数据集中划分出10%的数据作为验证集、设置每个设备在评估时的批量大小为1、设置每500个训练步骤进行一次评估,使用验证集计算评估指标,设置输出目录、日志记录间隔和检查点保存步数,以便实时监控训练状态并保存关键训练成果。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人中国石油大学(华东),其通讯地址为:266500 山东省青岛市黄岛区长江西路66号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励