Document
拖动滑块完成拼图
个人中心

预订订单
商城订单
发布专利 发布成果 人才入驻 发布商标 发布需求

请提出您的宝贵建议,有机会获取IP积分或其他奖励

投诉建议

在线咨询

联系我们

龙图腾公众号
专利交易 积分商城 国际服务 IP管家助手 科技果 科技人才 商标交易 会员权益 需求市场 关于龙图腾 更多
 /  免费注册
到顶部 到底部
清空 搜索
当前位置 : 首页 > 专利喜报 > 华东师范大学钟萧遥获国家专利权

华东师范大学钟萧遥获国家专利权

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

龙图腾网获悉华东师范大学申请的专利一种在高维近似最近邻搜索中持续优化图结构的框架获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN118885629B

龙图腾网通过国家知识产权局官网在2026-03-17发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202410906279.3,技术领域涉及:G06F16/51;该发明授权一种在高维近似最近邻搜索中持续优化图结构的框架是由钟萧遥;金加宝;程鹏;杨鸣宇;陈雷;倪王泽;沈智韬;林学民设计研发完成,并于2024-07-08向国家知识产权局提交的专利申请。

一种在高维近似最近邻搜索中持续优化图结构的框架在说明书摘要公布了:本发明公开了一种在高维近似最近邻搜索中持续优化图结构的框架,涉及近似最近邻搜索技术领域,步骤1:收集目标数据;步骤2:搭建在高维近似最近邻搜索中持续优化图结构的框架的环境;步骤3:在近邻图模块构建近邻图索引,在共轭图模块中构建共轭图索引;步骤4:基于底库数据,使用启发式的方法生成数据;步骤5:记录搜索日志并作为需要在共轭图中加边的对象;步骤6:利用搜索日志,更新共轭图模块中的共轭图索引;步骤7:测试优化前后的性能和效果对比。本发明采用上述结构的一种在高维近似最近邻搜索中持续优化图结构的框架,利用搜索日志和构建日志来动态增强图和补充搜索结果,从而在可接受的空间成本增加的情况下显著提高查询准确性。

本发明授权一种在高维近似最近邻搜索中持续优化图结构的框架在权利要求书中公布了:1.一种在高维近似最近邻搜索中持续优化图结构的框架,其特征在于:包括以下步骤: 步骤1:收集目标数据,目标数据的数据信息包括数据量、数据类型、维度、向量和距离度量,向量在目标数据中的顺序作为每个向量的id,将目标数据根据用户指定的分割比例分割成底库数据、历史数据和测试数据三个部分; 步骤2:搭建在高维近似最近邻搜索中持续优化图结构的框架的环境,该环境包括近邻图模块、共轭图模块、图搜索模块; 构建近邻图模块的具体步骤为: 211近邻图索引构建:接受参数为底库数据和距离度量,构建近邻图索引并存储底库数据,近邻图索引是一个由邻接表构成的图索引,每个底库数据作为近邻图中的一个节点,每条从节点u指向节点v的有向边代表v是底库数据中离u在指定的距离度量较近的另一条数据,对应在数据结构上,每条底库数据都在邻接表中拥有一个列表,列表存有其在近邻图中的邻居,底库数据的存储采用列表的方式,列表的每一行为一条底库向量,行数为底库向量数,列数为底库向量维度; 212近邻图索引更新:接受参数为起点id和终点id,向邻接表中起点id的列表中插入终点id; 213邻居检索:接受参数为一个id,若该id在邻接表中存在,则返回其对应的列表,否则返回空; 214距离计算:接受参数为两个向量,计算两个向量在索引构建时指定的距离度量下的距离并返回; 构建共轭图模块的具体步骤为: 221共轭图索引构建:对共轭图初始化,初始化为一个空的稀疏图,使用哈希表和集合来实现,其中哈希表的键为底库数据的id,哈希表的值为一个集合; 222共轭图索引更新:接受参数为起点id和终点id,其向哈希表中值为起点id的集合中插入终点id; 223邻居检索:接受参数为一个id,若该id在哈希表中作为键存在,则返回其值对应的集合,否则返回空集; 图搜索模块的具体内容为: 231暴力搜索:接受两个参数分别为:查询向量和一个整数k,用于在已经建好的近邻图索引上搜索查询向量的k个精确最近邻;暴力搜索过程中,维护一个最大大小为k的最大堆,遍历近邻图中存储的所有底库向量,并计算查询向量和底库向量的距离,将其加入到最大堆中,具体来说,如果最大堆的大小小于k,则将该底库向量和距离插入其中,如果等于k,则判断该次计算距离是否比最大堆顶的距离小,如果是的话,则将最大堆顶的数据弹出,并插入该次计算的底库数据和距离,直至历遍完所有底库向量后,最大堆中的数据即为k个精确最近邻; 232近似最近邻搜索:接受四个参数分别为:查询向量、一个整数k、搜索列表长度L和是否使用共轭图,上述四个参数用于在已经建好的近邻图索引上搜索查询向量的k个近似最近邻,具体方法为: 2321不使用共轭图的搜索:搜索过程使用贪心搜索,贪心搜索过程中,维护一个最大大小为L的搜索列表,初始化使用一个固定的底库数据插入进入搜索列表中,然后进入迭代过程,每次选取搜索列表中离查询向量最近的没有被访问的底库数据,将该数据在近邻图中的邻居加入到搜索列表中,注意,在加入搜索列表的时候需要计算邻居到查询向量的距离,如果搜索列表已满并且该距离大于搜索列表中的数据离查询向量的最大距离,则不能被加入搜索列表中,否则,在搜索列表已满时,须将最大距离对应的数据弹出,并将新的邻居数据加入到搜索列表中,在完成邻居的加入后,将该底库数据标记为被访问过,在若干次迭代后,搜索列表中的所有数据都被访问过,循环终止,返回搜索列表内的前k小距离对应的底库数据作为k个近似最近邻查询结果; 2322使用共轭图的搜索过程:首先重复上述贪心搜索的搜索过程,在贪心搜索结束后,计算搜索结果中的top1最近邻即局部最优解,然后在共轭图中取出该局部最优解所连的所有底库数据,加入到搜索列表中,并根据数据到查询数据的距离进行重排序,重排后计算新的局部最优解,如果新的局部最优解和旧的不同,则继续将其在共轭图中所连的底库数据加入到搜索列表中,并将搜索列表中的数据进行重排序,返回搜索列表的前k小距离对应的底库数据作为k个近似最近邻查询结果; 步骤3:基于底库数据,在近邻图模块构建近邻图索引,在构建过程中,记录并整合被裁剪的边作为构建日志,构建日志用于在共轭图模块中构建共轭图索引;具体步骤为: 31接受三个参数分别为最大出度R、构建搜索列表长度L和构建搜索参数k,其中,参数R限制了每个底库数据在近邻图中最多有R个邻居,参数L限制了在构建时使用近似最近邻搜索的搜索列表长度为L,参数k限制了在构建时搜索k个近似最近邻; 32遍历每个底库数据,使用步骤232的近似最近邻搜索程序,在近邻图上使用长度为L的搜索列表查询k个近似最近邻; 33在遍历的过程中,基于查询结果,进行裁边;裁边的方法应用RNG裁边策略或MRNG裁边策略,RNG裁边策略即将所有三个数据构成的三角形中的最长边消去,MRNG裁边策略用于保证裁剪后的所有出边的夹角都小于60度; 34将裁边后剩下的边,如果数量小于等于R,则将所有边作为有向边插入到近邻图中,如果数量大于R,则选取距离最短的前R条边作为有向边插入到近邻图中; 35将裁边时被裁剪掉的边,如果数量小于等于R,则将所有边作为有向边插入到共轭图中,如果数量大于R,则选取距离最短的前R条边作为有向边插入到共轭图中; 36重复步骤32至步骤35的遍历程序,直至所有底库数据被处理完成; 37返回构建完成的近邻图索引和共轭图索引; 步骤4:基于底库数据,使用启发式的方法生成数据;具体步骤如下: 41:接受三个参数分别为搜索参数k、搜索列表长度L、一个浮点数w,初始化数据集合; 42:遍历每个底库数据,使用步骤2中的图搜索模块,在近邻图上使用长度为L的搜索列表查询k个近似最近邻; 43:在遍历的过程中,表示底库数据为,对k个近似最近邻分别表示成,使用公式生成数据,并将其加入生成的数据集合中; 44:重复步骤42至步骤43的遍历程序,直至所有底库数据被处理完成; 45:返回生成的数据集合; 步骤5:基于历史和生成的数据,在图搜索模块中搜索其在底库数据中的全局最优解和局部最优解,对于其中找到的全局最优解和局部最优解不一致的数据,记录成搜索日志并作为需要在共轭图中加边的对象;具体步骤为: 51、将历史和生成的数据整合成一个数据集合; 52、遍历数据集合的每个点,使用图搜索模块中构建的暴力搜索程序搜索出k个精确最近邻结果,使用图搜索模块中构建的近似最近邻搜索程序搜索出k个近似最近邻结果; 53、将精确最近邻结果中的top1最近邻记为全局最优解,将近似最近邻结果中的top1最近邻记为局部最优解,如果全局最优解和局部最优解不同的话,将这一局部最优解和全局最优解对记录作为搜索日志; 步骤6:利用步骤5中的搜索日志,更新共轭图模块中的共轭图索引:遍历搜索日志中的每对局部最优解和全局最优解,在共轭图中添加一条从局部最优解到全局最优解的边; 步骤7:基于测试数据,结合近邻图模块和共轭图模块,测试优化前后的性能和效果对比,具体步骤为: 71:遍历测试数据的每条数据,使用步骤231中构建的暴力搜索程序搜索出k个精确最近邻结果R1,使用步骤232中构建的不使用共轭图的近似最近邻搜索程序搜索出k个近似最近邻结果R2,使用步骤232中构建的使用共轭图的近似最近邻搜索程序搜索出k个近似最近邻结果R3; 72:计算R1和R2的召回率为使用共轭图优化前的召回率,计算R1和R3的召回率为使用共轭图优化后的召回率,两者之差即为优化效果。

如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人华东师范大学,其通讯地址为:200241 上海市闵行区东川路500号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。

以上内容由龙图腾AI智能生成。

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。