恭喜中国人民解放军国防科技大学汤奋获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网恭喜中国人民解放军国防科技大学申请的专利基于相似性度量的字符串匹配方法、设备及存储介质获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN116911253B 。
龙图腾网通过国家知识产权局官网在2025-04-04发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202310797100.0,技术领域涉及:G06F40/126;该发明授权基于相似性度量的字符串匹配方法、设备及存储介质是由汤奋;李坤伟;曾广军;赵彦庆;蒋序平;程芳;陈克斌;谢文佳;许子熙设计研发完成,并于2023-06-30向国家知识产权局提交的专利申请。
本基于相似性度量的字符串匹配方法、设备及存储介质在说明书摘要公布了:本申请公开了一种基于相似性度量的字符串匹配方法,该方法包括:基于机构的全称生成多个简化后的字符串;在字符串中选择一个字符串,生成其与机构全称的最长公共子序列,计算字符串的编辑距离与最长公共子序列的长度;基于最长公共子序列在字符串中的分布特征、最长公共子序列在机构全称中的分布特征,以及最长公共子序列的长度计算最长公共子序列的稀疏度;根据字符串的编辑距离、最长公共子序列的稀疏度与最长公共子序列的长度对字符串与机构全称进行相似性度量,重复上述步骤,将相似性度量结果最大的字符串作为机构全称的简称。本申请公开的方法基于最终相似性度量的结果能够找到匹配度更高的机构简称,更符合实际情况,且适应性更强。
本发明授权基于相似性度量的字符串匹配方法、设备及存储介质在权利要求书中公布了:1.一种基于相似性度量的字符串匹配方法,其特征在于,包括:基于机构的全称生成多个简化后的字符串;在多个简化后的字符串中任意选择一个字符串,生成该字符串与机构全称的最长公共子序列,计算所述字符串相对于机构全称的编辑距离,以及所述最长公共子序列的长度;基于所述最长公共子序列在该字符串中的分布特征、所述最长公共子序列在机构全称中的分布特征,以及最长公共子序列的长度计算最长公共子序列的稀疏度;根据所述字符串相对于机构全称的编辑距离、所述最长公共子序列的稀疏度与所述最长公共子序列的长度对该字符串与机构全称进行相似性度量,并重复上述步骤,对所有字符串与机构全称之间进行相似性度量,将相似性度量结果最大的字符串作为机构全称的简称;其中,所述最长公共子序列中的字符在所述字符串中相同字符的位置分布特征,以及所述最长公共子序列中的字符在所述机构全称中相同字符的位置分布特征具体包括:分别获取所述最长公共子序列LCS在字符串S与机构的全称T的位置,具体包括:S1构建二维数组B,在构建矩阵Cn+1,m+1时,如果Ci,j=Ci-1,j-1+1,则Bi,j=a;如果Ci,j=Ci-1,j,则Bi,j=b;如果Ci,j=Ci,j-1,则Bi,j=c;构造矩阵Cn+1,m+1,通过下式获取该矩阵的矩阵元素Ci,j: 计算字符串S与机构全称T的最长公共子序列LCS的长度l,即为矩阵元素Cn,m;S2当Bi,j=a时,则Si与Tj是最长公共子序列LCS中的一员,重复上述步骤S1判断Bi-1,j-1的值;S3当Bi,j=b时,则Si与Tj不是最长公共子序列LCS中的一员,重复上述步骤S1判断Bi,j-1的值;S4当Bi,j=c时,则Si与Tj不是最长公共子序列LCS中的一员,重复上述步骤S1判断Bi-1,j的值;S5当i=0或者j=0时,停止遍历,最终得到LCS中字符li在S中的位置为mi,在T中的位置为nj;所述最长公共子序列的稀疏度α的计算为:α=|∑mi+1-mil-1-∑nj+1-njl-1|根据稀疏度α与最长公共子序列LCS的长度l定义相似性度量公式: 其中,相似性度量结果Sim越大,该字符串与机构全称的匹配度就越高。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人中国人民解放军国防科技大学,其通讯地址为:410003 湖南省长沙市开福区德雅路109号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。