北京中铁科客货运输技术有限公司;中国铁道科学研究院集团有限公司运输及经济研究所;中国铁道科学研究院集团有限公司刘启钢获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉北京中铁科客货运输技术有限公司;中国铁道科学研究院集团有限公司运输及经济研究所;中国铁道科学研究院集团有限公司申请的专利一种文档问答方法、装置、电子设备及计算机存储介质获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN120821819B 。
龙图腾网通过国家知识产权局官网在2025-12-02发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202511340391.6,技术领域涉及:G06F16/3329;该发明授权一种文档问答方法、装置、电子设备及计算机存储介质是由刘启钢;孙文桥;杨天行;叶飞;王志敬;张明;杨阳;李东旭;郭文静;葛悦;陈存折;苑明昊;丁小东;张濯;陈浩;李啸;李聪;梁博设计研发完成,并于2025-09-19向国家知识产权局提交的专利申请。
本一种文档问答方法、装置、电子设备及计算机存储介质在说明书摘要公布了:本发明涉及一种文档问答方法、装置、电子设备及计算机存储介质,该方法包括:基于预设片段长度,对每个样本文档进行对齐处理,得到多个样本片段;对任意两个样本片段进行语义相关度标注得到第一标注数据,根据第一标注数据对文档检索模型进行微调得到目标文档检索模型;基于多个样本片段和语义相关度确定第二标注数据,根据第二标注数据对语义排序模型进行微调得到目标语义排序模型,基于多个问题和每个问题对应的至少一个样本片段,构成第四标注数据,基于第四标注数据对基础大模型进行微调得到生成式大模型,基于微调后的三个模型确定待处理问题对应的目标答案。本发明的方法在根本上解决通用大模型问答在铁路领域数据集上经常出现的问题。
本发明授权一种文档问答方法、装置、电子设备及计算机存储介质在权利要求书中公布了:1.一种文档问答方法,其特征在于,包括: 获取不同文档格式的铁路领域的样本文档,并基于预设片段长度,对每个所述样本文档进行对齐处理,得到多个样本片段; 对任意两个所述样本片段进行语义相关度标注,得到第一标注数据,并根据所述第一标注数据对文档检索模型进行微调,得到目标文档检索模型; 基于多个样本片段和各个所述样本片段之间的语义相关度,确定第二标注数据,并根据所述第二标注数据对语义排序模型进行微调,得到目标语义排序模型,所述第二标注数据中包括多个问题以及每个问题对应的至少一个样本片段; 基于多个所述问题和每个问题对应的至少一个样本片段,通过基础大模型生成问答对; 基于所述问答对和第三标注数据,构成第四标注数据,以基于所述第四标注数据对所述基础大模型进行微调,得到生成式大模型,其中,所述第三标注数据中包括针对铁路领域生成的指令、问题和答案; 基于所述目标文档检索模型、所述目标语义排序模型和所述生成式大模型对待处理问题进行处理,得到所述待处理问题对应的目标答案; 其中,所述基于预设片段长度,对每个所述样本文档进行对齐处理,得到多个样本片段,包括: 对所有样本文档中大于所述预设片段长度的每个文档进行切分,得到多个第一片段; 对所有样本文档中小于所述预设片段长度的每个文档,通过上下文段落链指关系和增加前后重复系数的方式进行文档长度扩展,得到多个第二片段; 基于多个所述第一片段和多个所述第二片段,得到多个样本片段。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人北京中铁科客货运输技术有限公司;中国铁道科学研究院集团有限公司运输及经济研究所;中国铁道科学研究院集团有限公司,其通讯地址为:100081 北京市海淀区大柳树路2号院一区9号楼;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励