深圳市明心数智科技有限公司张亚曦获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉深圳市明心数智科技有限公司申请的专利基于内容分层加权的检索增强生成方法、装置及存储介质获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN121071060B 。
龙图腾网通过国家知识产权局官网在2026-03-17发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202511613710.6,技术领域涉及:G06F16/31;该发明授权基于内容分层加权的检索增强生成方法、装置及存储介质是由张亚曦;梁顺设计研发完成,并于2025-11-06向国家知识产权局提交的专利申请。
本基于内容分层加权的检索增强生成方法、装置及存储介质在说明书摘要公布了:本申请涉及基于内容分层加权的检索增强生成技术领域,揭示了一种基于内容分层加权的检索增强生成方法、装置及存储介质,其中,方法包括:通过构建文档层级树,充分利用文档内的标题、章节和段落之间的父子语义关系,结合了路径加权和节点初始相关分值,计算各段落节点的综合分值,从而保证所选目标段落节点的相关性和重要性,细粒度重排技术确保了信息的逻辑连贯性,避免了证据碎片化的问题,最终,通过大模型对召回数据的解析生成的答复文本。本发明的有益技术效果:生成的答复文本更具准确性和有效性,还能够满足用户的实际需求,提升了检索结果质量以及增强了用户体验。
本发明授权基于内容分层加权的检索增强生成方法、装置及存储介质在权利要求书中公布了:1.一种基于内容分层加权的检索增强生成方法,其特征在于,所述方法包括: 获取原始文档数据,并利用文档解析技术分析所述原始文档数据的文档结构; 基于所述文档结构构建所述原始文档数据的文档层级树,并将所述文档层级树存储在预设文档数据库中;其中,所述文档层级树包括三类节点,三类节点分别为根节点、章节节点以及段落节点,所述章节节点为所述根节点的子节点,所述段落节点为所述章节节点的子节点,每个所述章节节点至少有一个子节点; 基于用户输入的检索信息从所述预设文档数据库中进行检索,以得到多个文档的目标文档层级树,以及所述目标文档层级树各个节点的初始相关分值; 根据各个节点的初始相关分值对所述目标文档层级树中各个段落节点进行路径加权,以计算各个段落节点的综合分值; 根据所述综合分值的大小从大至小选取预设数量的目标段落节点,并对所述目标段落节点中的内容进行细粒度重排,得到召回数据; 通过大模型对所述召回数据进行解析得到针对所述检索信息的答复文本; 所述基于用户输入的检索信息从所述预设文档数据库中进行检索,以得到多个文档的目标文档层级树,以及所述目标文档层级树各个节点的初始相关分值的步骤,包括: 基于所述检索信息,通过预设的检索方式从预设文档数据库中进行检索,以得到多个目标文档; 判断所述目标文档的数量是否小于预设文档数量; 若小于所述预设文档数量,则提取初始相关分值大于预设分值的暂时段落节点; 提取所述暂时段落节点的关键词,并进行向量转换,以得到每个暂时段落节点对应的相关向量; 根据多个所述暂时段落节点采用预设的线性分类器设置多条线性函数;其中,,且,表示第t个相关向量对应的相关常数,表示偏置量,t为正整数,表示预设权重向量,表示预设权重向量的模,表示第t条线性函数,表示相关向量,为预设的参数; 计算每条线性函数与所述预设文档数据库各个文档的欧式距离,并提取每条线性函数最大欧式距离和最小欧式距离,并将二者之差作为对应线性函数的分类信息; 根据公式计算任意两条线性函数分类信息的信息参数;其中,表示第n个线性函数的分类信息,表示基于的归一化函数,表示第l个线性函数偏置量,表示第k线性函数的偏置量; 选取信息参数最大的两条线性函数作为目标线性函数; 基于两条目标线性函数从所述预设文档数据库选取文档以作为目标文档; 提取每个所述目标文档对应的目标文档层级树; 计算所述检索信息与所述目标文档层级树中各个节点的初始相关分值。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人深圳市明心数智科技有限公司,其通讯地址为:518000 广东省深圳市南山区粤海街道高新区社区科技南路18号深圳湾科技生态园12栋B5001;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励