同方知网数字出版技术股份有限公司朱紫薇获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉同方知网数字出版技术股份有限公司申请的专利用于微调大语言模型的预处理文本的获取方法及装置获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN119558290B 。
龙图腾网通过国家知识产权局官网在2026-01-16发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202411549961.8,技术领域涉及:G06F40/186;该发明授权用于微调大语言模型的预处理文本的获取方法及装置是由朱紫薇;刘丹丹;刘嘉设计研发完成,并于2024-11-01向国家知识产权局提交的专利申请。
本用于微调大语言模型的预处理文本的获取方法及装置在说明书摘要公布了:本发明公开了一种用于微调大语言模型的预处理文本的获取方法及装置,涉及文本处理技术领域,主要目的在于解决现有用于微调大语言模型的预处理文本的获取的问题。包括:确定待处理大语言模型的预处理任务,并对所述预处理任务进行量化统计,得到量化要素,所述预处理任务用于表征所述大语言模型适用于特定语言处理场景的内容;调取与所述预处理任务匹配的会话模板,并基于所述量化要素、所述会话模板确定目标检索领域的检索约束条件;响应于文本对象检索指令,按照所述检索约束条件在所述目标检索领域搜索文本对象,并将搜索到的所述文本对象与所述会话模板进行整合,得到预处理文本,以基于所述预处理文本对所述大语言模型进行微调。
本发明授权用于微调大语言模型的预处理文本的获取方法及装置在权利要求书中公布了:1.一种用于微调大语言模型的预处理文本的获取方法,其特征在于,包括: 确定待处理大语言模型的预处理任务,并对所述预处理任务进行量化统计,得到量化要素,所述预处理任务用于表征所述大语言模型适用于特定语言处理场景的内容; 调取与所述预处理任务匹配的会话模板,并基于所述量化要素、所述会话模板确定目标检索领域的检索约束条件; 响应于文本对象检索指令,按照所述检索约束条件在所述目标检索领域搜索文本对象,并将搜索到的所述文本对象与所述会话模板进行整合,得到预处理文本,以基于所述预处理文本对所述大语言模型进行微调; 所述对所述预处理任务进行量化统计,得到量化要素包括: 获取所述预处理任务的历史会话文本,并对所述历史会话文本进行模板拆分,得到答案文本; 确定所述答案文本中与所述预处理任务匹配的要素对象,并统计所述答案文本中所述要素对象的数量; 基于所述要素对象、所述数量以及与所述要素对象匹配的预设要素条件生成量化要素。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人同方知网数字出版技术股份有限公司,其通讯地址为:100192 北京市海淀区中关村东升科技园B-2号楼二层;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励