中山大学于新慧获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉中山大学申请的专利一种基于大语言模型和检索增强生成的地质文本翻译方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN120409502B 。
龙图腾网通过国家知识产权局官网在2025-10-31发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202510867309.9,技术领域涉及:G06F40/58;该发明授权一种基于大语言模型和检索增强生成的地质文本翻译方法是由于新慧;周永章;朱彪彪;牛露佳;王郑哲;马建华;张灿;帕拉特·肯节伯;刘蕾;张玙情设计研发完成,并于2025-06-26向国家知识产权局提交的专利申请。
本一种基于大语言模型和检索增强生成的地质文本翻译方法在说明书摘要公布了:本发明公开一种基于大语言模型和检索增强生成的地质文本翻译方法,实现了识别地质文本命名实体作为关键词,检索查询专业词典数据库进行增强翻译。在微调大语言模型进行实体识别时,提出了一种句法感知的实体剪枝Syntax‑AwareEntityPruning,SAEP方法进行数据增强引入可控噪声,提高了大语言模型的命名实体识别效果。在构建和检索向量数据库时,基于数据层面给数据信息加上地质分类标签,设置数据相似度查询阈值,提高检索信息的准确性,有效降低通用大语言模型因训练数据缺乏专业领域知识而产生的幻觉问题。
本发明授权一种基于大语言模型和检索增强生成的地质文本翻译方法在权利要求书中公布了:1.一种基于大语言模型和检索增强生成的地质文本翻译方法,其特征在于,包括: 创建中英文地质文本命名实体标注语料,所述中英文地质文本命名实体标注语料包括对中英文地质文本的命名实体、实体的位置边界和实体类型的标注; 根据基于句法感知的实体剪枝数据增强方法对所述中英文地质文本命名实体标注语料进行数据增强,得到数据增强后的中英文地质文本命名实体标注语料; 基于所述中英文地质文本命名实体标注语料和所述数据增强后的中英文地质文本命名实体标注语料一起使用指令微调的方式对第一预设大语言模型进行微调,得到地质命名实体识别模型; 根据所述地质命名实体识别模型构建带有类别标签信息的中英文对照地质词典数据库; 利用所述地质命名实体识别模型对待处理的地质文本进行识别,得到待处理的地质文本的地质实体信息及分类; 根据所述待处理的地质文本的地质实体信息及分类,从所述中英文对照地质词典数据库进行查询得到译文参考; 根据所述译文参考和待处理的地质文本,调用第二预设大语言模型进行增强翻译,得到翻译后的地质文本; 根据所述基于句法感知的实体剪枝数据增强方法对所述中英文地质文本命名实体标注语料进行数据增强,包括: 输入所述中英文地质文本命名实体标注语料,利用分词工具搭配预设的地质词汇表对中英文地质文本进行分词; 对分词后的中英文地质文本进行句法依存分析,生成依存树并提取所述依存树的根节点; 根据所述中英文地质文本命名实体标注语料的标注信息定位所述依存树中对应的token,保留所有目标实体、目标实体的直接子节点、根节点及直接子节点,得到token集合; 从所述token集合中提取完整实体词,拼接非实体部分的保留token,生成剪枝文本,得到数据增强后的中英文地质文本命名实体标注语料。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人中山大学,其通讯地址为:510275 广东省广州市海珠区新港西路135号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励