软安科技有限公司朱辉获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉软安科技有限公司申请的专利一种基于改进MinHash算法的检索方法、装置、存储介质及终端获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN115982426B 。
龙图腾网通过国家知识产权局官网在2025-08-01发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202211623531.7,技术领域涉及:G06F16/9035;该发明授权一种基于改进MinHash算法的检索方法、装置、存储介质及终端是由朱辉;张晗设计研发完成,并于2022-12-16向国家知识产权局提交的专利申请。
本一种基于改进MinHash算法的检索方法、装置、存储介质及终端在说明书摘要公布了:本发明涉及一种基于改进MinHash算法的检索方法、装置、存储介质及终端,所述检索方法包括:S1、下载m个不同类型和不同版本的二进制组件库,得到组件集合S;S2、对组件集合S中的每个组件分别进行特征提取;S3、通过特征赋权重模块计算特征值的权重值,通过MinHash算法计算组件哈希值,如果最小哈希值选到了特征fi,则记录下其哈希值的同时,关联其特征权重值wfi;S4、再通过相似度计算公式计算两个组件之间的相似度。本发明能够更精准识别不同组件的相似度,适应度更广泛。
本发明授权一种基于改进MinHash算法的检索方法、装置、存储介质及终端在权利要求书中公布了:1.一种基于改进MinHash算法的检索方法,其特征在于:所述检索方法包括: S1、下载m个不同类型和不同版本的二进制组件库,得到组件集合S; S2、对组件集合S中的每个组件分别进行特征提取; S3、通过特征赋权重模块计算特征值的权重值,通过MinHash算法计算组件哈希值,如果最小哈希值选到了特征fi,则记录下其哈希值的同时,关联其特征权重值wfi; S4、再通过相似度计算公式计算两个组件之间的相似度; 所述通过特征赋权重模块计算特征值的权重值具体包括: 设某一组件中某个特征fi出现了k次,n个特征值一共出现t次,则tffi=kt,tf表示词频,如果特征fi在x个组件中出现,则idffi=logmx,idf表示倒文档频率,特征fi对应的权重值w1fi=kt*logmx; 设特征fi在所有组件中出现的次数分别为C={c1,c2,c3,…,cm},采用随机变量Y表示特征fi在组件中出现的次数,则引入随机变量Y的信息熵表示为HY=∑jPcj*logPcj,其中Pcj表示cj的概率,即值cj在C中出现次数除以C的总数,设特征fi的覆盖率acdfi=xm,得到特征的权重值w2=acdfi*HY; 得到最终的特征权重值wfi=alpha*w1+beta*w2;其中alpha和beta都为人为设定的经验值; 所述通过相似度计算公式计算两个组件之间的相似度具体包括: 设组件A的指纹为集合{a1,a2,···,am},组件B对应的指纹为集合{b1,b2,···,bm},通过特征赋权重模块计算可以得到每个特征的权重值,在生成MinHash指纹时,保留对应特征的权重,则两个组件对应的特征向量分别{wa,1,wa,2,···,wa,m},{wb,1,wb,2,···,wb,m},则通过相似度计算公式计算得到两个组件之间的相似度P,其中T为组件A和B相同的指纹的下标集合。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人软安科技有限公司,其通讯地址为:610000 四川省成都市高新区交子大道233号19层1904;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。