讯兔科技(上海)有限公司阮云帆获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉讯兔科技(上海)有限公司申请的专利基于混合向量模型的检索方法、装置及可读存储介质获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN120508573B 。
龙图腾网通过国家知识产权局官网在2025-09-19发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202511000971.0,技术领域涉及:G06F16/2452;该发明授权基于混合向量模型的检索方法、装置及可读存储介质是由阮云帆;刘广文;陆雯;方煜东;李应健;石少丽设计研发完成,并于2025-07-21向国家知识产权局提交的专利申请。
本基于混合向量模型的检索方法、装置及可读存储介质在说明书摘要公布了:本发明公开了一种基于混合向量模型的检索方法、装置及可读存储介质,涉及人工智能领域,包括:首先响应自然语言查询,处理生成查询向量;基于查询向量从指标库召回候选结果并筛选得到精炼相关信息集;基于精炼信息集生成SQL并执行,得到结果数据并生成自然语言回答;输出回答及结果依据说明。本发明通过混合向量召回提高检索准确性,多阶段处理降低模型推理复杂度,结合反思机制保障鲁棒性,可解释输出满足合规要求,有效解决检索不准、生成不可靠、结果不可解释的问题,实现复杂Text2SQL查询的高效自动化。
本发明授权基于混合向量模型的检索方法、装置及可读存储介质在权利要求书中公布了:1.一种基于混合向量模型的检索方法,其特征在于,包括: 响应于用户输入的自然语言查询,对所述自然语言查询进行处理,生成查询向量; 基于所述查询向量从指标库中召回候选结果,对所述候选结果进行筛选,得到精炼相关信息集; 基于所述精炼相关信息集生成SQL查询语句并执行,得到查询结果数据并生成自然语言回答; 输出所述自然语言回答及结果依据说明; 所述对所述自然语言查询进行处理,生成查询向量,包括: 对所述自然语言查询进行分词和意图识别,抽取出关键指标名称、过滤条件及统称词; 基于金融领域知识对所述关键指标名称和统称词进行别名替换和语义扩写,得到扩写后的查询要素; 采用预训练的金融领域词向量模型和大型语言模型进行向量化处理,将所述扩写后的查询要素转换为所述查询向量; 所述基于所述查询向量从指标库中召回候选结果,包括: 通过原始查询召回通道,使用所述查询向量在向量索引中执行前N个相似度检索,得到第一候选子集; 通过查询扩写召回通道,对所述自然语言查询进行语义扩写生成衍生查询向量,使用所述衍生查询向量在所述向量索引中执行前N个相似度检索,得到第二候选子集; 通过关键指标强化通道,从预定义的重要指标集中使用所述查询向量执行前M个精确召回,得到第三候选子集;所述M小于所述N; 对复杂查询,将所述自然语言查询拆分为多个特征维度,分别生成特征向量并执行向量检索,得到第四候选子集; 融合所述第一候选子集、第二候选子集、第三候选子集及第四候选子集,得到所述候选结果; 所述对所述候选结果进行筛选,包括: 向大型语言模型输入专家提示词,指导所述大型语言模型从所述候选结果中选择与所述自然语言查询最相关的指标名称和表名;所述专家提示词包含金融领域知识、项目上下文及筛选规则,所述大型语言模型结合语义理解和金融常识对所述候选结果进行相关性评分,剔除不相关条目,输出所述精炼相关信息集。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人讯兔科技(上海)有限公司,其通讯地址为:200120 上海市浦东新区中国(上海)自由贸易试验区商城路618号3楼C区;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。